]>
Commit | Line | Data |
---|---|---|
73c04bcf A |
1 | # *************************************************************************** |
2 | # * | |
b331163b | 3 | # * Copyright (C) 2004-2015, International Business Machines |
73c04bcf A |
4 | # * Corporation; Unicode, Inc.; and others. All Rights Reserved. |
5 | # * | |
6 | # *************************************************************************** | |
7 | # File: Latin_Katakana.txt | |
46f4442e | 8 | # Generated from CLDR |
73c04bcf | 9 | # |
729e4ab9 | 10 | :: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ←-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ; |
374ca955 A |
11 | :: [:Latin:] fullwidth-halfwidth (); |
12 | :: NFD (NFC); | |
51004dcb | 13 | :: Lower (); # whenever transliterating from cased to uncased script, include this |
374ca955 A |
14 | $vowel = [aeiou] ; |
15 | $consonant = [bcdfghjklmnpqrstvwxyz] ; | |
16 | $macron = \u0304 ; | |
73c04bcf A |
17 | $kana = [ぁ-ゔ] ; |
18 | $voice = [\u3099゛]; | |
19 | $semivoice = [\u309A゜]; | |
374ca955 | 20 | $k_start = [カキクケコかきくけこ] ; |
374ca955 | 21 | $s_start = [サシスセソさしすせそ] ; |
374ca955 | 22 | $j_start = [シし] $voice ; |
374ca955 | 23 | $t_start = [タチツテトたちつてと] ; |
374ca955 | 24 | $n_start = [ナニヌネノンなにぬねの] ; |
374ca955 A |
25 | $h_start = [ハヒヘホはひへほ] ; |
26 | $f_start = [フふ] ; | |
374ca955 | 27 | $m_start = [マミムメモまみむめも] ; |
374ca955 | 28 | $y_start = [ヤユヨやゆよ] ; |
374ca955 | 29 | $r_start = [ラリルレロらりるれろ] ; |
374ca955 | 30 | $w_start = [ワヰヱヲわゐゑを] ; |
73c04bcf | 31 | $v_start = [ワヰヱヲ]\u3099 ; |
729e4ab9 | 32 | $voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ; |
51004dcb | 33 | $n_quoter = [ア イ ウ エ オ ナ ニ ヌ ネ ノ ヤ ユ ヨ ン] ; |
374ca955 | 34 | $small_y = [ャィュェョ] ; |
73c04bcf | 35 | $iteration = ゝ ; |
729e4ab9 A |
36 | '.' ↔ 。; |
37 | ',' ↔ 、; | |
38 | va ↔ ワ\u3099 ; | |
39 | vi ↔ ヰ\u3099 ; | |
40 | ve ↔ ヱ\u3099 ; | |
41 | vo ↔ ヲ\u3099 ; | |
42 | '~ka' ↔ ヵ ; | |
43 | '~ke' ↔ ヶ ; | |
44 | ya ← '~'ャ; | |
45 | yi ← '~'ィ ; | |
46 | yu ← '~'ュ; | |
47 | ye ← '~'ェ; | |
48 | yo ← '~'ョ; | |
49 | a ↔ ア ; | |
50 | b | '~' ← ヒ \u3099} $small_y ; | |
51 | by } $vowel → ヒ\u3099 | '~y' ; | |
52 | ba ↔ ハ\u3099 ; | |
53 | bi ↔ ヒ\u3099 ; | |
54 | bu ↔ フ\u3099 ; | |
55 | be ↔ ヘ\u3099 ; | |
56 | bo ↔ ホ\u3099 ; | |
57 | c } i → | s ; | |
58 | c } e → | s ; | |
59 | da ↔ タ\u3099 ; | |
60 | di ↔ テ\u3099ィ ; | |
61 | du ↔ テ\u3099ゥ ; | |
62 | de ↔ テ\u3099 ; | |
63 | do ↔ ト\u3099 ; | |
64 | dzu ↔ ツ\u3099 ; | |
65 | dja ← チ\u3099ャ ; | |
66 | dji'~i' ← チ\u3099ィ ; # liu | |
67 | dju ← チ\u3099ュ ; | |
68 | dje ← チ\u3099ェ ; | |
69 | djo ← チ\u3099ョ ; | |
70 | dji ↔ チ\u3099 ; | |
51004dcb | 71 | dj } $vowel → チ\u3099 | '~y' ; |
729e4ab9 A |
72 | cha ← チャ ; |
73 | chi'~i' ← チィ ; # liu | |
74 | chu ← チュ ; | |
75 | che ← チェ ; | |
76 | cho ← チョ ; | |
77 | chi ↔ チ ; | |
78 | ch } $vowel → チ | '~y' ; | |
79 | e ↔ エ ; | |
80 | g | '~' ← キ\u3099} $small_y ; | |
51004dcb | 81 | gy } $vowel → キ\u3099 | '~y' ; |
729e4ab9 A |
82 | ga ↔ カ\u3099 ; |
83 | gi ↔ キ\u3099 ; | |
84 | gu ↔ ク\u3099 ; | |
85 | ge ↔ ケ\u3099 ; | |
86 | go ↔ コ\u3099 ; | |
87 | i ↔ イ ; | |
88 | ja ↔ シ\u3099ャ ; | |
89 | ji'~i' ← シ\u3099ィ ; # liu | |
90 | ju ↔ シ\u3099ュ ; | |
91 | je ↔ シ\u3099ェ ; | |
92 | jo ↔ シ\u3099ョ ; | |
93 | ji ↔ シ\u3099 ; | |
94 | k | '~' ← キ} $small_y ; | |
51004dcb | 95 | ky } $vowel → キ | '~y' ; |
729e4ab9 A |
96 | ka ↔ カ ; |
97 | ki ↔ キ ; | |
98 | ku ↔ ク ; | |
99 | ke ↔ ケ ; | |
100 | ko ↔ コ ; | |
101 | m | '~' ← ミ} $small_y ; | |
51004dcb | 102 | my } $vowel → ミ | '~y' ; |
729e4ab9 A |
103 | ma ↔ マ ; |
104 | mi ↔ ミ ; | |
105 | mu ↔ ム ; | |
106 | me ↔ メ ; | |
107 | mo ↔ モ ; | |
108 | m } [pbfv] → ン ; | |
109 | n | '~' ← ニ } $small_y ; | |
51004dcb | 110 | ny } $vowel → ニ | '~y' ; |
729e4ab9 A |
111 | na ↔ ナ ; |
112 | ni ↔ ニ ; | |
113 | nu ↔ ヌ ; | |
114 | ne ↔ ネ ; | |
115 | no ↔ ノ ; | |
116 | o ↔ オ ; | |
117 | p | '~' ← ヒ\u309A } $small_y ; | |
51004dcb | 118 | py } $vowel → ヒ\u309A | '~y' ; |
729e4ab9 A |
119 | pa ↔ ハ\u309A ; |
120 | pi ↔ ヒ\u309A ; | |
121 | pu ↔ フ\u309A ; | |
122 | pe ↔ ヘ\u309A ; | |
123 | po ↔ ホ\u309A ; | |
124 | h | '~' ← ヒ } $small_y ; | |
51004dcb | 125 | hy } $vowel → ヒ | '~y' ; |
729e4ab9 A |
126 | ha ↔ ハ ; |
127 | hi ↔ ヒ ; | |
128 | hu ↔ ヘゥ ; | |
129 | he ↔ ヘ ; | |
130 | ho ↔ ホ ; | |
131 | fa ↔ ファ ; | |
132 | fi ↔ フィ ; | |
133 | fe ↔ フェ ; | |
134 | fo ↔ フォ ; | |
135 | fu ↔ フ ; | |
136 | r | '~' ← リ } $small_y ; | |
51004dcb | 137 | ry } $vowel → リ | '~y' ; |
729e4ab9 A |
138 | ra ↔ ラ ; |
139 | ri ↔ リ ; | |
140 | ru ↔ ル ; | |
141 | re ↔ レ ; | |
142 | ro ↔ ロ ; | |
143 | za ↔ サ\u3099 ; | |
144 | zi ↔ セ\u3099ィ ; | |
145 | zu ↔ ス\u3099 ; | |
146 | ze ↔ セ\u3099 ; | |
147 | zo ↔ ソ\u3099 ; | |
148 | sa ↔ サ ; | |
149 | si ↔ セィ ; | |
150 | su ↔ ス ; | |
151 | se ↔ セ ; | |
152 | so ↔ ソ ; | |
153 | sha ← シャ ; | |
154 | shi'~i' ← シィ ; # liu | |
155 | shu ← シュ ; | |
156 | she ← シェ ; | |
157 | sho ← ショ ; | |
158 | shi ↔ シ ; | |
159 | sh } $vowel → シ | '~y' ; | |
160 | ta ↔ タ ; | |
161 | ti ↔ ティ ; | |
162 | tu ↔ テゥ ; | |
163 | te ↔ テ ; | |
164 | to ↔ ト ; | |
165 | tsu ↔ ツ ; | |
166 | vu ↔ ウ\u3099 ; | |
167 | u ↔ ウ ; | |
168 | wa ↔ ワ ; | |
169 | wi ↔ ヰ ; | |
170 | wu → ウ ; | |
171 | we ↔ ヱ ; | |
172 | wo ↔ ヲ ; | |
173 | ya ↔ ヤ ; | |
174 | yi → イ ; | |
175 | yu ↔ ユ ; | |
176 | ye → エ ; | |
177 | yo ↔ ヨ ; | |
178 | s } sh → ッ ; | |
179 | t } ch → ッ ; | |
180 | j } j ↔ ッ } $j_start ; | |
181 | b } b ↔ ッ } [$h_start$f_start] $voice; | |
182 | d } d ↔ ッ } $t_start $voice; | |
183 | g } g ↔ ッ } $k_start $voice; | |
184 | p } p ↔ ッ } [$h_start$f_start] $semivoice; | |
185 | z } z ↔ ッ } $s_start $voice; | |
186 | v } v ↔ ッ } $v_start; | |
187 | k } k ↔ ッ } $k_start ; | |
188 | m } m ↔ ッ } $m_start ; | |
189 | n } n ↔ ッ } $n_start ; | |
190 | h } h ↔ ッ } $h_start ; | |
191 | f } f ↔ ッ } $f_start ; | |
192 | r } r ↔ ッ } $r_start ; | |
193 | t } t ↔ ッ } $t_start ; | |
194 | s } s ↔ ッ } $s_start ; | |
51004dcb | 195 | w } w ↔ ッ } $w_start; |
729e4ab9 A |
196 | y } y ↔ ッ } $y_start; |
197 | x } x → ッ ; | |
198 | c } k → ッ ; | |
199 | c } c → ッ ; | |
200 | c } q → ッ ; | |
201 | l } l → ッ ; | |
202 | q } q → ッ ; | |
203 | $macron ↔ ー ; | |
204 | '~a' ↔ ァ ; | |
205 | '~i' ↔ ィ ; | |
206 | '~u' ↔ ゥ ; | |
207 | '~e' ↔ ェ ; | |
208 | '~o' ↔ ォ ; | |
209 | '~tsu' ↔ ッ ; | |
210 | '~wa' ↔ ヮ ; | |
211 | '~ya' ↔ ャ ; | |
212 | '~yi' → ィ ; | |
213 | '~yu' ↔ ュ ; | |
214 | '~ye' → ェ ; | |
215 | '~yo' ↔ ョ ; | |
216 | j $1 ← sh (y* $vowel) {ヽ$voice ; | |
217 | dj $1 ← ch (y* $vowel) {ヽ$voice ; | |
218 | dz $1 ← ts (y* $vowel) {ヽ$voice ; | |
219 | g $1 ← k (y* $vowel) {ヽ$voice ; | |
220 | z $1 ← s (y* $vowel) {ヽ$voice ; | |
221 | d $1 ← t (y* $vowel) {ヽ$voice ; | |
222 | h $1 ← b (y* $vowel) {ヽ$voice ; | |
223 | v $1 ← w (y* $vowel) {ヽ$voice ; | |
224 | sh $1 ← sh (y* $vowel) {ヽ$voice ; | |
225 | j $1 ← j (y* $vowel) {ヽ$voice ; | |
226 | ch $1 ← ch (y* $vowel) {ヽ$voice ; | |
227 | dj $1 ← dj(y* $vowel) {ヽ$voice ; | |
228 | ts $1 ← ts (y* $vowel) {ヽ$voice ; | |
229 | dz $1 ← dz (y* $vowel) {ヽ$voice ; | |
230 | $1 ← ($consonant y* $vowel) {ヽ$voice? ; | |
231 | $1 ← (.) {ヽ $voice? ; # otherwise repeat last character | |
232 | ← ヽ $voice? ; # delete if no characters found | |
233 | $voweled_basekana [\u3099 \u309A]? { h → ー ; | |
234 | cy → セィ ; | |
235 | dy → テ\u3099ィ ; | |
236 | hy → ヒ ; | |
237 | sy → セィ ; | |
238 | ty → ティ ; | |
239 | zy → セ\u3099ィ ; | |
240 | h → ヘ ; | |
241 | ch → チ; | |
242 | sh → シ ; | |
243 | dz → ツ\u3099 ; | |
244 | dj → チ\u3099; | |
245 | b → フ\u3099 ; | |
246 | d → テ\u3099 ; | |
247 | g → ク\u3099 ; | |
248 | k → ク ; | |
249 | m → ム ; | |
250 | n'' ← ン } $n_quoter ; | |
251 | n ↔ ン ; | |
252 | p → フ\u309A ; | |
253 | r → ル ; | |
254 | s → ス ; | |
255 | t → テ ; | |
256 | y → イ ; | |
257 | z → ス\u3099 ; | |
258 | v → ウ\u3099 ; | |
259 | f → フ; | |
51004dcb | 260 | j → シ\u3099; |
729e4ab9 A |
261 | w → ウ; |
262 | ß → | ss ; | |
263 | æ → | e ; | |
264 | ð → | d ; | |
265 | ø → | u ; | |
266 | þ → | th ; | |
267 | c → | k ; | |
268 | l → | r ; | |
269 | q → | k ; | |
270 | x → | ks ; | |
271 | '~' → ; # delete stray tildes between letters | |
272 | [:Katakana:] { '' } [:Latin:] → ; # delete stray quotes between letters | |
73c04bcf | 273 | :: NFC (NFD) ; |
46f4442e A |
274 | :: ([[:Katakana:][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] halfwidth-fullwidth); |
275 | :: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] ) ; |