]> git.saurik.com Git - apple/icu.git/blob - icuSources/data/translit/Latin_Katakana.txt
ICU-400.42.tar.gz
[apple/icu.git] / icuSources / data / translit / Latin_Katakana.txt
1 # ***************************************************************************
2 # *
3 # * Copyright (C) 2004-2008, International Business Machines
4 # * Corporation; Unicode, Inc.; and others. All Rights Reserved.
5 # *
6 # ***************************************************************************
7 # File: Latin_Katakana.txt
8 # Generated from CLDR
9 #
10 :: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ<-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ;
11 :: [:Latin:] fullwidth-halfwidth ();
12 :: NFD (NFC);
13 :: Lower (); # whenever transliterating from cased to uncased script, include this
14 $vowel = [aeiou] ;
15 $consonant = [bcdfghjklmnpqrstvwxyz] ;
16 $macron = \u0304 ;
17 $kana = [ぁ-ゔ] ;
18 $voice = [\u3099゛];
19 $semivoice = [\u309A゜];
20 $k_start = [カキクケコかきくけこ] ;
21 $s_start = [サシスセソさしすせそ] ;
22 $j_start = [シし] $voice ;
23 $t_start = [タチツテトたちつてと] ;
24 $n_start = [ナニヌネノンなにぬねの] ;
25 $h_start = [ハヒヘホはひへほ] ;
26 $f_start = [フふ] ;
27 $m_start = [マミムメモまみむめも] ;
28 $y_start = [ヤユヨやゆよ] ;
29 $r_start = [ラリルレロらりるれろ] ;
30 $w_start = [ワヰヱヲわゐゑを] ;
31 $v_start = [ワヰヱヲ]\u3099 ;
32 $n_quoter = [ア イ ウ エ オ ナ ニ ヌ ネ ノ ヤ ユ ヨ ン] ;
33 $small_y = [ャィュェョ] ;
34 $iteration = ゝ ;
35 $voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ;
36 '.' <> 。;
37 ',' <> 、;
38 va <> ワ\u3099 ;
39 vi <> ヰ\u3099 ;
40 ve <> ヱ\u3099 ;
41 vo <> ヲ\u3099 ;
42 '~ka' <> ヵ ;
43 '~ke' <> ヶ ;
44 ya < '~'ャ;
45 yi < '~'ィ ;
46 yu < '~'ュ;
47 ye < '~'ェ;
48 yo < '~'ョ;
49 a <> ア ;
50 b | '~' < ヒ \u3099} $small_y ;
51 by } $vowel > ヒ\u3099 | '~y' ;
52 ba <> ハ\u3099 ;
53 bi <> ヒ\u3099 ;
54 bu <> フ\u3099 ;
55 be <> ヘ\u3099 ;
56 bo <> ホ\u3099 ;
57 c } i > | s ;
58 c } e > | s ;
59 da <> タ\u3099 ;
60 di <> テ\u3099ィ ;
61 du <> テ\u3099ゥ ;
62 de <> テ\u3099 ;
63 do <> ト\u3099 ;
64 dzu <> ツ\u3099 ;
65 dja < チ\u3099ャ ;
66 dji'~i' < チ\u3099ィ ; # liu
67 dju < チ\u3099ュ ;
68 dje < チ\u3099ェ ;
69 djo < チ\u3099ョ ;
70 dji <> チ\u3099 ;
71 dj } $vowel > チ\u3099 | '~y' ;
72 cha < チャ ;
73 chi'~i' < チィ ; # liu
74 chu < チュ ;
75 che < チェ ;
76 cho < チョ ;
77 chi <> チ ;
78 ch } $vowel > チ | '~y' ;
79 e <> エ ;
80 g | '~' < キ\u3099} $small_y ;
81 gy } $vowel > キ\u3099 | '~y' ;
82 ga <> カ\u3099 ;
83 gi <> キ\u3099 ;
84 gu <> ク\u3099 ;
85 ge <> ケ\u3099 ;
86 go <> コ\u3099 ;
87 i <> イ ;
88 ja <> シ\u3099ャ ;
89 ji'~i' < シ\u3099ィ ; # liu
90 ju <> シ\u3099ュ ;
91 je <> シ\u3099ェ ;
92 jo <> シ\u3099ョ ;
93 ji <> シ\u3099 ;
94 k | '~' < キ} $small_y ;
95 ky } $vowel > キ | '~y' ;
96 ka <> カ ;
97 ki <> キ ;
98 ku <> ク ;
99 ke <> ケ ;
100 ko <> コ ;
101 m | '~' < ミ} $small_y ;
102 my } $vowel > ミ | '~y' ;
103 ma <> マ ;
104 mi <> ミ ;
105 mu <> ム ;
106 me <> メ ;
107 mo <> モ ;
108 m } [pbfv] > ン ;
109 n | '~' < ニ } $small_y ;
110 ny } $vowel > ニ | '~y' ;
111 na <> ナ ;
112 ni <> ニ ;
113 nu <> ヌ ;
114 ne <> ネ ;
115 no <> ノ ;
116 o <> オ ;
117 p | '~' < ヒ\u309A } $small_y ;
118 py } $vowel > ヒ\u309A | '~y' ;
119 pa <> ハ\u309A ;
120 pi <> ヒ\u309A ;
121 pu <> フ\u309A ;
122 pe <> ヘ\u309A ;
123 po <> ホ\u309A ;
124 h | '~' < ヒ } $small_y ;
125 hy } $vowel > ヒ | '~y' ;
126 ha <> ハ ;
127 hi <> ヒ ;
128 hu <> ヘゥ ;
129 he <> ヘ ;
130 ho <> ホ ;
131 fa <> ファ ;
132 fi <> フィ ;
133 fe <> フェ ;
134 fo <> フォ ;
135 fu <> フ ;
136 r | '~' < リ } $small_y ;
137 ry } $vowel > リ | '~y' ;
138 ra <> ラ ;
139 ri <> リ ;
140 ru <> ル ;
141 re <> レ ;
142 ro <> ロ ;
143 za <> サ\u3099 ;
144 zi <> セ\u3099ィ ;
145 zu <> ス\u3099 ;
146 ze <> セ\u3099 ;
147 zo <> ソ\u3099 ;
148 sa <> サ ;
149 si <> セィ ;
150 su <> ス ;
151 se <> セ ;
152 so <> ソ ;
153 sha < シャ ;
154 shi'~i' < シィ ; # liu
155 shu < シュ ;
156 she < シェ ;
157 sho < ショ ;
158 shi <> シ ;
159 sh } $vowel > シ | '~y' ;
160 ta <> タ ;
161 ti <> ティ ;
162 tu <> テゥ ;
163 te <> テ ;
164 to <> ト ;
165 tsu <> ツ ;
166 vu <> ウ\u3099 ;
167 u <> ウ ;
168 wa <> ワ ;
169 wi <> ヰ ;
170 wu > ウ ;
171 we <> ヱ ;
172 wo <> ヲ ;
173 ya <> ヤ ;
174 yi > イ ;
175 yu <> ユ ;
176 ye > エ ;
177 yo <> ヨ ;
178 s } sh > ッ ;
179 t } ch > ッ ;
180 j } j <> ッ } $j_start ;
181 b } b <> ッ } [$h_start$f_start] $voice;
182 d } d <> ッ } $t_start $voice;
183 g } g <> ッ } $k_start $voice;
184 p } p <> ッ } [$h_start$f_start] $semivoice;
185 z } z <> ッ } $s_start $voice;
186 v } v <> ッ } $v_start;
187 k } k <> ッ } $k_start ;
188 m } m <> ッ } $m_start ;
189 n } n <> ッ } $n_start ;
190 h } h <> ッ } $h_start ;
191 f } f <> ッ } $f_start ;
192 r } r <> ッ } $r_start ;
193 t } t <> ッ } $t_start ;
194 s } s <> ッ } $s_start ;
195 w } w <> ッ } $w_start;
196 y } y <> ッ } $y_start;
197 x } x > ッ ;
198 c } k > ッ ;
199 c } c > ッ ;
200 c } q > ッ ;
201 l } l > ッ ;
202 q } q > ッ ;
203 $macron <> ー ;
204 '~a' <> ァ ;
205 '~i' <> ィ ;
206 '~u' <> ゥ ;
207 '~e' <> ェ ;
208 '~o' <> ォ ;
209 '~tsu' <> ッ ;
210 '~wa' <> ヮ ;
211 '~ya' <> ャ ;
212 '~yi' > ィ ;
213 '~yu' <> ュ ;
214 '~ye' > ェ ;
215 '~yo' <> ョ ;
216 j $1 < sh (y* $vowel) {ヽ$voice ;
217 dj $1 < ch (y* $vowel) {ヽ$voice ;
218 dz $1 < ts (y* $vowel) {ヽ$voice ;
219 g $1 < k (y* $vowel) {ヽ$voice ;
220 z $1 < s (y* $vowel) {ヽ$voice ;
221 d $1 < t (y* $vowel) {ヽ$voice ;
222 h $1 < b (y* $vowel) {ヽ$voice ;
223 v $1 < w (y* $vowel) {ヽ$voice ;
224 sh $1 < sh (y* $vowel) {ヽ$voice ;
225 j $1 < j (y* $vowel) {ヽ$voice ;
226 ch $1 < ch (y* $vowel) {ヽ$voice ;
227 dj $1 < dj(y* $vowel) {ヽ$voice ;
228 ts $1 < ts (y* $vowel) {ヽ$voice ;
229 dz $1 < dz (y* $vowel) {ヽ$voice ;
230 $1 < ($consonant y* $vowel) {ヽ$voice? ;
231 $1 < (.) {ヽ $voice? ; # otherwise repeat last character
232 < ヽ $voice? ; # delete if no characters found
233 $voweled_basekana [\u3099 \u309A]? { h > ー ;
234 cy > セィ ;
235 dy > テ\u3099ィ ;
236 hy > ヒ ;
237 sy > セィ ;
238 ty > ティ ;
239 zy > セ\u3099ィ ;
240 h > ヘ ;
241 ch > チ;
242 sh > シ ;
243 dz > ツ\u3099 ;
244 dj > チ\u3099;
245 b > フ\u3099 ;
246 d > テ\u3099 ;
247 g > ク\u3099 ;
248 k > ク ;
249 m > ム ;
250 n'' < ン } $n_quoter ;
251 n <> ン ;
252 p > フ\u309A ;
253 r > ル ;
254 s > ス ;
255 t > テ ;
256 y > イ ;
257 z > ス\u3099 ;
258 v > ウ\u3099 ;
259 f > フ;
260 j > シ\u3099;
261 w > ウ;
262 ß > | ss ;
263 æ > | e ;
264 ð > | d ;
265 ø > | u ;
266 þ > | th ;
267 c > | k ;
268 l > | r ;
269 q > | k ;
270 x > | ks ;
271 '~' > ; # delete stray tildes between letters
272 [:Katakana:] { '' } [:Latin:] > ; # delete stray quotes between letters
273 :: NFC (NFD) ;
274 :: ([[:Katakana:][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] halfwidth-fullwidth);
275 :: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] ) ;