]> git.saurik.com Git - apple/icu.git/blob - icuSources/data/translit/Latin_Katakana.txt
ICU-461.18.tar.gz
[apple/icu.git] / icuSources / data / translit / Latin_Katakana.txt
1 # ***************************************************************************
2 # *
3 # * Copyright (C) 2004-2010, International Business Machines
4 # * Corporation; Unicode, Inc.; and others. All Rights Reserved.
5 # *
6 # ***************************************************************************
7 # File: Latin_Katakana.txt
8 # Generated from CLDR
9 #
10 :: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ←-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ;
11 :: [:Latin:] fullwidth-halfwidth ();
12 :: NFD (NFC);
13 :: Lower (); # whenever transliterating from cased to uncased script, include this
14 $vowel = [aeiou] ;
15 $consonant = [bcdfghjklmnpqrstvwxyz] ;
16 $macron = \u0304 ;
17 $kana = [ぁ-ゔ] ;
18 $voice = [\u3099゛];
19 $semivoice = [\u309A゜];
20 $k_start = [カキクケコかきくけこ] ;
21 $s_start = [サシスセソさしすせそ] ;
22 $j_start = [シし] $voice ;
23 $t_start = [タチツテトたちつてと] ;
24 $n_start = [ナニヌネノンなにぬねの] ;
25 $h_start = [ハヒヘホはひへほ] ;
26 $f_start = [フふ] ;
27 $m_start = [マミムメモまみむめも] ;
28 $y_start = [ヤユヨやゆよ] ;
29 $r_start = [ラリルレロらりるれろ] ;
30 $w_start = [ワヰヱヲわゐゑを] ;
31 $v_start = [ワヰヱヲ]\u3099 ;
32 $voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ;
33 $n_quoter = [ア イ ウ エ オ ナ ニ ヌ ネ ノ ヤ ユ ヨ ン] ;
34 $small_y = [ャィュェョ] ;
35 $iteration = ゝ ;
36 '.' ↔ 。;
37 ',' ↔ 、;
38 va ↔ ワ\u3099 ;
39 vi ↔ ヰ\u3099 ;
40 ve ↔ ヱ\u3099 ;
41 vo ↔ ヲ\u3099 ;
42 '~ka' ↔ ヵ ;
43 '~ke' ↔ ヶ ;
44 ya ← '~'ャ;
45 yi ← '~'ィ ;
46 yu ← '~'ュ;
47 ye ← '~'ェ;
48 yo ← '~'ョ;
49 a ↔ ア ;
50 b | '~' ← ヒ \u3099} $small_y ;
51 by } $vowel → ヒ\u3099 | '~y' ;
52 ba ↔ ハ\u3099 ;
53 bi ↔ ヒ\u3099 ;
54 bu ↔ フ\u3099 ;
55 be ↔ ヘ\u3099 ;
56 bo ↔ ホ\u3099 ;
57 c } i → | s ;
58 c } e → | s ;
59 da ↔ タ\u3099 ;
60 di ↔ テ\u3099ィ ;
61 du ↔ テ\u3099ゥ ;
62 de ↔ テ\u3099 ;
63 do ↔ ト\u3099 ;
64 dzu ↔ ツ\u3099 ;
65 dja ← チ\u3099ャ ;
66 dji'~i' ← チ\u3099ィ ; # liu
67 dju ← チ\u3099ュ ;
68 dje ← チ\u3099ェ ;
69 djo ← チ\u3099ョ ;
70 dji ↔ チ\u3099 ;
71 dj } $vowel → チ\u3099 | '~y' ;
72 cha ← チャ ;
73 chi'~i' ← チィ ; # liu
74 chu ← チュ ;
75 che ← チェ ;
76 cho ← チョ ;
77 chi ↔ チ ;
78 ch } $vowel → チ | '~y' ;
79 e ↔ エ ;
80 g | '~' ← キ\u3099} $small_y ;
81 gy } $vowel → キ\u3099 | '~y' ;
82 ga ↔ カ\u3099 ;
83 gi ↔ キ\u3099 ;
84 gu ↔ ク\u3099 ;
85 ge ↔ ケ\u3099 ;
86 go ↔ コ\u3099 ;
87 i ↔ イ ;
88 ja ↔ シ\u3099ャ ;
89 ji'~i' ← シ\u3099ィ ; # liu
90 ju ↔ シ\u3099ュ ;
91 je ↔ シ\u3099ェ ;
92 jo ↔ シ\u3099ョ ;
93 ji ↔ シ\u3099 ;
94 k | '~' ← キ} $small_y ;
95 ky } $vowel → キ | '~y' ;
96 ka ↔ カ ;
97 ki ↔ キ ;
98 ku ↔ ク ;
99 ke ↔ ケ ;
100 ko ↔ コ ;
101 m | '~' ← ミ} $small_y ;
102 my } $vowel → ミ | '~y' ;
103 ma ↔ マ ;
104 mi ↔ ミ ;
105 mu ↔ ム ;
106 me ↔ メ ;
107 mo ↔ モ ;
108 m } [pbfv] → ン ;
109 n | '~' ← ニ } $small_y ;
110 ny } $vowel → ニ | '~y' ;
111 na ↔ ナ ;
112 ni ↔ ニ ;
113 nu ↔ ヌ ;
114 ne ↔ ネ ;
115 no ↔ ノ ;
116 o ↔ オ ;
117 p | '~' ← ヒ\u309A } $small_y ;
118 py } $vowel → ヒ\u309A | '~y' ;
119 pa ↔ ハ\u309A ;
120 pi ↔ ヒ\u309A ;
121 pu ↔ フ\u309A ;
122 pe ↔ ヘ\u309A ;
123 po ↔ ホ\u309A ;
124 h | '~' ← ヒ } $small_y ;
125 hy } $vowel → ヒ | '~y' ;
126 ha ↔ ハ ;
127 hi ↔ ヒ ;
128 hu ↔ ヘゥ ;
129 he ↔ ヘ ;
130 ho ↔ ホ ;
131 fa ↔ ファ ;
132 fi ↔ フィ ;
133 fe ↔ フェ ;
134 fo ↔ フォ ;
135 fu ↔ フ ;
136 r | '~' ← リ } $small_y ;
137 ry } $vowel → リ | '~y' ;
138 ra ↔ ラ ;
139 ri ↔ リ ;
140 ru ↔ ル ;
141 re ↔ レ ;
142 ro ↔ ロ ;
143 za ↔ サ\u3099 ;
144 zi ↔ セ\u3099ィ ;
145 zu ↔ ス\u3099 ;
146 ze ↔ セ\u3099 ;
147 zo ↔ ソ\u3099 ;
148 sa ↔ サ ;
149 si ↔ セィ ;
150 su ↔ ス ;
151 se ↔ セ ;
152 so ↔ ソ ;
153 sha ← シャ ;
154 shi'~i' ← シィ ; # liu
155 shu ← シュ ;
156 she ← シェ ;
157 sho ← ショ ;
158 shi ↔ シ ;
159 sh } $vowel → シ | '~y' ;
160 ta ↔ タ ;
161 ti ↔ ティ ;
162 tu ↔ テゥ ;
163 te ↔ テ ;
164 to ↔ ト ;
165 tsu ↔ ツ ;
166 vu ↔ ウ\u3099 ;
167 u ↔ ウ ;
168 wa ↔ ワ ;
169 wi ↔ ヰ ;
170 wu → ウ ;
171 we ↔ ヱ ;
172 wo ↔ ヲ ;
173 ya ↔ ヤ ;
174 yi → イ ;
175 yu ↔ ユ ;
176 ye → エ ;
177 yo ↔ ヨ ;
178 s } sh → ッ ;
179 t } ch → ッ ;
180 j } j ↔ ッ } $j_start ;
181 b } b ↔ ッ } [$h_start$f_start] $voice;
182 d } d ↔ ッ } $t_start $voice;
183 g } g ↔ ッ } $k_start $voice;
184 p } p ↔ ッ } [$h_start$f_start] $semivoice;
185 z } z ↔ ッ } $s_start $voice;
186 v } v ↔ ッ } $v_start;
187 k } k ↔ ッ } $k_start ;
188 m } m ↔ ッ } $m_start ;
189 n } n ↔ ッ } $n_start ;
190 h } h ↔ ッ } $h_start ;
191 f } f ↔ ッ } $f_start ;
192 r } r ↔ ッ } $r_start ;
193 t } t ↔ ッ } $t_start ;
194 s } s ↔ ッ } $s_start ;
195 w } w ↔ ッ } $w_start;
196 y } y ↔ ッ } $y_start;
197 x } x → ッ ;
198 c } k → ッ ;
199 c } c → ッ ;
200 c } q → ッ ;
201 l } l → ッ ;
202 q } q → ッ ;
203 $macron ↔ ー ;
204 '~a' ↔ ァ ;
205 '~i' ↔ ィ ;
206 '~u' ↔ ゥ ;
207 '~e' ↔ ェ ;
208 '~o' ↔ ォ ;
209 '~tsu' ↔ ッ ;
210 '~wa' ↔ ヮ ;
211 '~ya' ↔ ャ ;
212 '~yi' → ィ ;
213 '~yu' ↔ ュ ;
214 '~ye' → ェ ;
215 '~yo' ↔ ョ ;
216 j $1 ← sh (y* $vowel) {ヽ$voice ;
217 dj $1 ← ch (y* $vowel) {ヽ$voice ;
218 dz $1 ← ts (y* $vowel) {ヽ$voice ;
219 g $1 ← k (y* $vowel) {ヽ$voice ;
220 z $1 ← s (y* $vowel) {ヽ$voice ;
221 d $1 ← t (y* $vowel) {ヽ$voice ;
222 h $1 ← b (y* $vowel) {ヽ$voice ;
223 v $1 ← w (y* $vowel) {ヽ$voice ;
224 sh $1 ← sh (y* $vowel) {ヽ$voice ;
225 j $1 ← j (y* $vowel) {ヽ$voice ;
226 ch $1 ← ch (y* $vowel) {ヽ$voice ;
227 dj $1 ← dj(y* $vowel) {ヽ$voice ;
228 ts $1 ← ts (y* $vowel) {ヽ$voice ;
229 dz $1 ← dz (y* $vowel) {ヽ$voice ;
230 $1 ← ($consonant y* $vowel) {ヽ$voice? ;
231 $1 ← (.) {ヽ $voice? ; # otherwise repeat last character
232 ← ヽ $voice? ; # delete if no characters found
233 $voweled_basekana [\u3099 \u309A]? { h → ー ;
234 cy → セィ ;
235 dy → テ\u3099ィ ;
236 hy → ヒ ;
237 sy → セィ ;
238 ty → ティ ;
239 zy → セ\u3099ィ ;
240 h → ヘ ;
241 ch → チ;
242 sh → シ ;
243 dz → ツ\u3099 ;
244 dj → チ\u3099;
245 b → フ\u3099 ;
246 d → テ\u3099 ;
247 g → ク\u3099 ;
248 k → ク ;
249 m → ム ;
250 n'' ← ン } $n_quoter ;
251 n ↔ ン ;
252 p → フ\u309A ;
253 r → ル ;
254 s → ス ;
255 t → テ ;
256 y → イ ;
257 z → ス\u3099 ;
258 v → ウ\u3099 ;
259 f → フ;
260 j → シ\u3099;
261 w → ウ;
262 ß → | ss ;
263 æ → | e ;
264 ð → | d ;
265 ø → | u ;
266 þ → | th ;
267 c → | k ;
268 l → | r ;
269 q → | k ;
270 x → | ks ;
271 '~' → ; # delete stray tildes between letters
272 [:Katakana:] { '' } [:Latin:] → ; # delete stray quotes between letters
273 :: NFC (NFD) ;
274 :: ([[:Katakana:][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] halfwidth-fullwidth);
275 :: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] ) ;