]> git.saurik.com Git - apple/icu.git/blobdiff - icuSources/data/translit/Latin_Katakana.txt
ICU-461.18.tar.gz
[apple/icu.git] / icuSources / data / translit / Latin_Katakana.txt
index 41570712f17023ce4ce2d6db6c3600d42eff172f..432099d95d87aa06573de5324f94734a75f1c3e6 100644 (file)
@@ -1,13 +1,13 @@
 # ***************************************************************************
 # *
-# *  Copyright (C) 2004-2008, International Business Machines
+# *  Copyright (C) 2004-2010, International Business Machines
 # *  Corporation; Unicode, Inc.; and others.  All Rights Reserved.
 # *
 # ***************************************************************************
 # File: Latin_Katakana.txt
 # Generated from CLDR 
 #
-:: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ<-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ;
+:: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ;
 :: [:Latin:] fullwidth-halfwidth ();
 :: NFD (NFC);
 :: Lower ();    # whenever transliterating from cased to uncased script, include this
@@ -29,247 +29,247 @@ $y_start = [ヤユヨやゆよ] ;
 $r_start = [ラリルレロらりるれろ] ;
 $w_start = [ワヰヱヲわゐゑを] ;
 $v_start = [ワヰヱヲ]\u3099 ;
+$voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ;
 $n_quoter  =  [ア イ ウ エ オ ナ ニ ヌ ネ ノ ヤ ユ ヨ ン] ;
 $small_y = [ャィュェョ] ;
 $iteration = ゝ ;
-$voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ;
-'.' <> 。;
-',' <> 、;
-va <> ワ\u3099 ;
-vi <> ヰ\u3099 ;
-ve <> ヱ\u3099 ;
-vo <> ヲ\u3099 ;
-'~ka' <> ヵ ;
-'~ke' <> ヶ ;
-ya < '~'ャ;
-yi < '~'ィ ;
-yu < '~'ュ;
-ye < '~'ェ;
-yo < '~'ョ;
-a <> ア ;
-b | '~' < ヒ \u3099} $small_y ;
-by } $vowel > ヒ\u3099 | '~y' ;
-ba <> ハ\u3099 ;
-bi <> ヒ\u3099 ;
-bu <> フ\u3099 ;
-be <> ヘ\u3099 ;
-bo <> ホ\u3099 ;
-c } i > | s ;
-c } e > | s ;
-da <> タ\u3099 ;
-di <> テ\u3099ィ ;
-du <> テ\u3099ゥ ;
-de <> テ\u3099 ;
-do <> ト\u3099 ;
-dzu <> ツ\u3099 ;
-dja < チ\u3099ャ ;
-dji'~i' < チ\u3099ィ ; # liu
-dju < チ\u3099ュ ;
-dje < チ\u3099ェ ;
-djo < チ\u3099ョ ;
-dji <> チ\u3099 ;
-dj  } $vowel > チ\u3099 | '~y' ;
-cha < チャ ;
-chi'~i' < チィ ; # liu
-chu < チュ ;
-che < チェ ;
-cho < チョ ;
-chi <> チ ;
-ch } $vowel > チ | '~y' ;
-e <> エ ;
-g | '~' < キ\u3099} $small_y ;
-gy  } $vowel > キ\u3099 | '~y' ;
-ga <> カ\u3099 ;
-gi <> キ\u3099 ;
-gu <> ク\u3099 ;
-ge <> ケ\u3099 ;
-go <> コ\u3099 ;
-i <> イ ;
-ja <> シ\u3099ャ ;
-ji'~i' < シ\u3099ィ ; # liu
-ju <> シ\u3099ュ ;
-je <> シ\u3099ェ ;
-jo <> シ\u3099ョ ;
-ji <> シ\u3099 ;
-k | '~' < キ} $small_y ;
-ky  } $vowel > キ | '~y' ;
-ka <> カ ;
-ki <> キ ;
-ku <> ク ;
-ke <> ケ ;
-ko <> コ ;
-m | '~' < ミ} $small_y ;
-my  } $vowel > ミ | '~y' ;
-ma <> マ ;
-mi <> ミ ;
-mu <> ム ;
-me <> メ ;
-mo <> モ ;
-m } [pbfv] > ン ;
-n | '~' < ニ } $small_y ;
-ny  } $vowel > ニ | '~y' ;
-na <> ナ ;
-ni <> ニ ;
-nu <> ヌ ;
-ne <> ネ ;
-no <> ノ ;
-o <> オ ;
-p | '~' < ヒ\u309A } $small_y ;
-py  } $vowel > ヒ\u309A | '~y' ;
-pa <> ハ\u309A ;
-pi <> ヒ\u309A ;
-pu <> フ\u309A ;
-pe <> ヘ\u309A ;
-po <> ホ\u309A ;
-h | '~' < ヒ } $small_y ;
-hy  } $vowel > ヒ | '~y' ;
-ha <> ハ ;
-hi <> ヒ ;
-hu <> ヘゥ ;
-he <> ヘ ;
-ho <> ホ ;
-fa <> ファ ;
-fi <> フィ ;
-fe <> フェ ;
-fo <> フォ ;
-fu <> フ ;
-r | '~' < リ } $small_y ;
-ry  } $vowel > リ | '~y' ;
-ra <> ラ ;
-ri <> リ ;
-ru <> ル ;
-re <> レ ;
-ro <> ロ ;
-za <> サ\u3099 ;
-zi <> セ\u3099ィ ;
-zu <> ス\u3099 ;
-ze <> セ\u3099 ;
-zo <> ソ\u3099 ;
-sa <> サ ;
-si <> セィ ;
-su <> ス ;
-se <> セ ;
-so <> ソ ;
-sha < シャ ;
-shi'~i' < シィ ; # liu
-shu < シュ ;
-she < シェ ;
-sho < ショ ;
-shi <> シ ;
-sh } $vowel > シ | '~y' ;
-ta <> タ ;
-ti <> ティ ;
-tu <> テゥ ;
-te <> テ ;
-to <> ト ;
-tsu <> ツ ;
-vu <> ウ\u3099 ;
-u <> ウ ;
-wa <> ワ ;
-wi <> ヰ ;
-wu > ウ ;
-we <> ヱ ;
-wo <> ヲ ;
-ya <> ヤ ;
-yi > イ ;
-yu <> ユ ;
-ye > エ ;
-yo <> ヨ ;
-s } sh > ッ ;
-t } ch > ッ ;
-j } j <> ッ } $j_start ;
-b } b <> ッ } [$h_start$f_start] $voice;
-d } d <> ッ } $t_start $voice;
-g } g <> ッ } $k_start $voice;
-p } p <> ッ } [$h_start$f_start] $semivoice;
-z } z <> ッ } $s_start $voice;
-v } v <> ッ } $v_start;
-k } k <> ッ } $k_start ;
-m } m <> ッ } $m_start ;
-n } n <> ッ } $n_start ;
-h } h <> ッ } $h_start ;
-f } f <> ッ } $f_start ;
-r } r <> ッ } $r_start ;
-t } t <> ッ } $t_start ;
-s } s <> ッ } $s_start ;
-w } w  <> ッ } $w_start;
-y } y <> ッ } $y_start;
-x } x > ッ ;
-c } k > ッ ;
-c } c > ッ ;
-c } q > ッ ;
-l } l > ッ ;
-q } q > ッ ;
-$macron <> ー ;
-'~a' <> ァ ;
-'~i' <> ィ ;
-'~u' <> ゥ ;
-'~e' <> ェ ;
-'~o' <> ォ ;
-'~tsu' <> ッ ;
-'~wa' <> ヮ ;
-'~ya' <> ャ ;
-'~yi' > ィ ;
-'~yu' <> ュ ;
-'~ye' > ェ ;
-'~yo' <> ョ ;
-j $1 < sh (y* $vowel) {ヽ$voice ;
-dj $1 < ch (y* $vowel) {ヽ$voice ;
-dz $1 < ts (y* $vowel) {ヽ$voice ;
-g $1 < k (y* $vowel) {ヽ$voice ;
-z $1 < s (y* $vowel) {ヽ$voice ;
-d $1 < t (y* $vowel) {ヽ$voice ;
-h $1 < b (y* $vowel) {ヽ$voice ;
-v $1 < w (y* $vowel) {ヽ$voice ;
-sh $1 < sh (y* $vowel) {ヽ$voice ;
-j $1 < j (y* $vowel) {ヽ$voice ;
-ch $1 < ch (y* $vowel) {ヽ$voice ;
-dj $1 < dj(y* $vowel) {ヽ$voice ;
-ts $1 < ts (y* $vowel) {ヽ$voice ;
-dz $1 < dz (y* $vowel) {ヽ$voice ;
-$1 < ($consonant y* $vowel) {ヽ$voice? ;
-$1 < (.) {ヽ $voice? ; # otherwise repeat last character
-< ヽ $voice? ; # delete if no characters found
-$voweled_basekana [\u3099 \u309A]? { h > ー ;
-cy > セィ ;
-dy > テ\u3099ィ ;
-hy > ヒ ;
-sy > セィ ;
-ty > ティ ;
-zy > セ\u3099ィ ;
-h > ヘ ;
-ch > チ;
-sh > シ ;
-dz > ツ\u3099 ;
-dj > チ\u3099;
-b > フ\u3099 ;
-d > テ\u3099 ;
-g > ク\u3099 ;
-k > ク ;
-m > ム ;
-n'' < ン } $n_quoter ;
-n <> ン ;
-p > フ\u309A ;
-r > ル ;
-s > ス ;
-t > テ ;
-y > イ ;
-z > ス\u3099 ;
-v > ウ\u3099 ;
-f > フ;
-j  > シ\u3099;
-w > ウ;
-ß > | ss ;
-æ > | e ;
-ð > | d ;
-ø > | u ;
-þ > | th ;
-c > | k ;
-l > | r ;
-q > | k ;
-x > | ks ;
-'~' > ; # delete stray tildes between letters
-[:Katakana:] { '' } [:Latin:] > ; # delete stray quotes between letters
+'.' ↔ 。;
+',' ↔ 、;
+va ↔ ワ\u3099 ;
+vi ↔ ヰ\u3099 ;
+ve ↔ ヱ\u3099 ;
+vo ↔ ヲ\u3099 ;
+'~ka' ↔ ヵ ;
+'~ke' ↔ ヶ ;
+ya ← '~'ャ;
+yi ← '~'ィ ;
+yu ← '~'ュ;
+ye ← '~'ェ;
+yo ← '~'ョ;
+a ↔ ア ;
+b | '~' ← ヒ \u3099} $small_y ;
+by } $vowel → ヒ\u3099 | '~y' ;
+ba ↔ ハ\u3099 ;
+bi ↔ ヒ\u3099 ;
+bu ↔ フ\u3099 ;
+be ↔ ヘ\u3099 ;
+bo ↔ ホ\u3099 ;
+c } i → | s ;
+c } e → | s ;
+da ↔ タ\u3099 ;
+di ↔ テ\u3099ィ ;
+du ↔ テ\u3099ゥ ;
+de ↔ テ\u3099 ;
+do ↔ ト\u3099 ;
+dzu ↔ ツ\u3099 ;
+dja ← チ\u3099ャ ;
+dji'~i' ← チ\u3099ィ ; # liu
+dju ← チ\u3099ュ ;
+dje ← チ\u3099ェ ;
+djo ← チ\u3099ョ ;
+dji ↔ チ\u3099 ;
+dj  } $vowel → チ\u3099 | '~y' ;
+cha ← チャ ;
+chi'~i' ← チィ ; # liu
+chu ← チュ ;
+che ← チェ ;
+cho ← チョ ;
+chi ↔ チ ;
+ch } $vowel → チ | '~y' ;
+e ↔ エ ;
+g | '~' ← キ\u3099} $small_y ;
+gy  } $vowel → キ\u3099 | '~y' ;
+ga ↔ カ\u3099 ;
+gi ↔ キ\u3099 ;
+gu ↔ ク\u3099 ;
+ge ↔ ケ\u3099 ;
+go ↔ コ\u3099 ;
+i ↔ イ ;
+ja ↔ シ\u3099ャ ;
+ji'~i' ← シ\u3099ィ ; # liu
+ju ↔ シ\u3099ュ ;
+je ↔ シ\u3099ェ ;
+jo ↔ シ\u3099ョ ;
+ji ↔ シ\u3099 ;
+k | '~' ← キ} $small_y ;
+ky  } $vowel → キ | '~y' ;
+ka ↔ カ ;
+ki ↔ キ ;
+ku ↔ ク ;
+ke ↔ ケ ;
+ko ↔ コ ;
+m | '~' ← ミ} $small_y ;
+my  } $vowel → ミ | '~y' ;
+ma ↔ マ ;
+mi ↔ ミ ;
+mu ↔ ム ;
+me ↔ メ ;
+mo ↔ モ ;
+m } [pbfv] → ン ;
+n | '~' ← ニ } $small_y ;
+ny  } $vowel → ニ | '~y' ;
+na ↔ ナ ;
+ni ↔ ニ ;
+nu ↔ ヌ ;
+ne ↔ ネ ;
+no ↔ ノ ;
+o ↔ オ ;
+p | '~' ← ヒ\u309A } $small_y ;
+py  } $vowel → ヒ\u309A | '~y' ;
+pa ↔ ハ\u309A ;
+pi ↔ ヒ\u309A ;
+pu ↔ フ\u309A ;
+pe ↔ ヘ\u309A ;
+po ↔ ホ\u309A ;
+h | '~' ← ヒ } $small_y ;
+hy  } $vowel → ヒ | '~y' ;
+ha ↔ ハ ;
+hi ↔ ヒ ;
+hu ↔ ヘゥ ;
+he ↔ ヘ ;
+ho ↔ ホ ;
+fa ↔ ファ ;
+fi ↔ フィ ;
+fe ↔ フェ ;
+fo ↔ フォ ;
+fu ↔ フ ;
+r | '~' ← リ } $small_y ;
+ry  } $vowel → リ | '~y' ;
+ra ↔ ラ ;
+ri ↔ リ ;
+ru ↔ ル ;
+re ↔ レ ;
+ro ↔ ロ ;
+za ↔ サ\u3099 ;
+zi ↔ セ\u3099ィ ;
+zu ↔ ス\u3099 ;
+ze ↔ セ\u3099 ;
+zo ↔ ソ\u3099 ;
+sa ↔ サ ;
+si ↔ セィ ;
+su ↔ ス ;
+se ↔ セ ;
+so ↔ ソ ;
+sha ← シャ ;
+shi'~i' ← シィ ; # liu
+shu ← シュ ;
+she ← シェ ;
+sho ← ショ ;
+shi ↔ シ ;
+sh } $vowel → シ | '~y' ;
+ta ↔ タ ;
+ti ↔ ティ ;
+tu ↔ テゥ ;
+te ↔ テ ;
+to ↔ ト ;
+tsu ↔ ツ ;
+vu ↔ ウ\u3099 ;
+u ↔ ウ ;
+wa ↔ ワ ;
+wi ↔ ヰ ;
+wu → ウ ;
+we ↔ ヱ ;
+wo ↔ ヲ ;
+ya ↔ ヤ ;
+yi → イ ;
+yu ↔ ユ ;
+ye → エ ;
+yo ↔ ヨ ;
+s } sh → ッ ;
+t } ch → ッ ;
+j } j ↔ ッ } $j_start ;
+b } b ↔ ッ } [$h_start$f_start] $voice;
+d } d ↔ ッ } $t_start $voice;
+g } g ↔ ッ } $k_start $voice;
+p } p ↔ ッ } [$h_start$f_start] $semivoice;
+z } z ↔ ッ } $s_start $voice;
+v } v ↔ ッ } $v_start;
+k } k ↔ ッ } $k_start ;
+m } m ↔ ッ } $m_start ;
+n } n ↔ ッ } $n_start ;
+h } h ↔ ッ } $h_start ;
+f } f ↔ ッ } $f_start ;
+r } r ↔ ッ } $r_start ;
+t } t ↔ ッ } $t_start ;
+s } s ↔ ッ } $s_start ;
+w } w  ↔ ッ } $w_start;
+y } y ↔ ッ } $y_start;
+x } x → ッ ;
+c } k → ッ ;
+c } c → ッ ;
+c } q → ッ ;
+l } l → ッ ;
+q } q → ッ ;
+$macron ↔ ー ;
+'~a' ↔ ァ ;
+'~i' ↔ ィ ;
+'~u' ↔ ゥ ;
+'~e' ↔ ェ ;
+'~o' ↔ ォ ;
+'~tsu' ↔ ッ ;
+'~wa' ↔ ヮ ;
+'~ya' ↔ ャ ;
+'~yi' → ィ ;
+'~yu' ↔ ュ ;
+'~ye' → ェ ;
+'~yo' ↔ ョ ;
+j $1 ← sh (y* $vowel) {ヽ$voice ;
+dj $1 ← ch (y* $vowel) {ヽ$voice ;
+dz $1 ← ts (y* $vowel) {ヽ$voice ;
+g $1 ← k (y* $vowel) {ヽ$voice ;
+z $1 ← s (y* $vowel) {ヽ$voice ;
+d $1 ← t (y* $vowel) {ヽ$voice ;
+h $1 ← b (y* $vowel) {ヽ$voice ;
+v $1 ← w (y* $vowel) {ヽ$voice ;
+sh $1 ← sh (y* $vowel) {ヽ$voice ;
+j $1 ← j (y* $vowel) {ヽ$voice ;
+ch $1 ← ch (y* $vowel) {ヽ$voice ;
+dj $1 ← dj(y* $vowel) {ヽ$voice ;
+ts $1 ← ts (y* $vowel) {ヽ$voice ;
+dz $1 ← dz (y* $vowel) {ヽ$voice ;
+$1 ← ($consonant y* $vowel) {ヽ$voice? ;
+$1 ← (.) {ヽ $voice? ; # otherwise repeat last character
+← ヽ $voice? ; # delete if no characters found
+$voweled_basekana [\u3099 \u309A]? { h → ー ;
+cy → セィ ;
+dy → テ\u3099ィ ;
+hy → ヒ ;
+sy → セィ ;
+ty → ティ ;
+zy → セ\u3099ィ ;
+h → ヘ ;
+ch → チ;
+sh → シ ;
+dz → ツ\u3099 ;
+dj → チ\u3099;
+b → フ\u3099 ;
+d → テ\u3099 ;
+g → ク\u3099 ;
+k → ク ;
+m → ム ;
+n'' ← ン } $n_quoter ;
+n ↔ ン ;
+p → フ\u309A ;
+r → ル ;
+s → ス ;
+t → テ ;
+y → イ ;
+z → ス\u3099 ;
+v → ウ\u3099 ;
+f → フ;
+j  → シ\u3099;
+w → ウ;
+ß → | ss ;
+æ → | e ;
+ð → | d ;
+ø → | u ;
+þ → | th ;
+c → | k ;
+l → | r ;
+q → | k ;
+x → | ks ;
+'~' → ; # delete stray tildes between letters
+[:Katakana:] { '' } [:Latin:] → ; # delete stray quotes between letters
 :: NFC (NFD) ;
 :: ([[:Katakana:][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] halfwidth-fullwidth);
 :: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] ) ;