]> git.saurik.com Git - apple/icu.git/blobdiff - icuSources/data/translit/Latin_Katakana.txt
ICU-461.18.tar.gz
[apple/icu.git] / icuSources / data / translit / Latin_Katakana.txt
index 0bc2d0b7a21fb8401fcb14717ecd1ecb78b8fec8..432099d95d87aa06573de5324f94734a75f1c3e6 100644 (file)
@@ -1,13 +1,13 @@
 # ***************************************************************************
 # *
-# *  Copyright (C) 2004-2006, International Business Machines
+# *  Copyright (C) 2004-2010, International Business Machines
 # *  Corporation; Unicode, Inc.; and others.  All Rights Reserved.
 # *
 # ***************************************************************************
 # File: Latin_Katakana.txt
-# Generated from CLDR: Thu Jul 20 16:27:17 PDT 2006
+# Generated from CLDR 
 #
-:: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ<-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ;
+:: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ;
 :: [:Latin:] fullwidth-halfwidth ();
 :: NFD (NFC);
 :: Lower ();    # whenever transliterating from cased to uncased script, include this
@@ -29,246 +29,247 @@ $y_start = [ヤユヨやゆよ] ;
 $r_start = [ラリルレロらりるれろ] ;
 $w_start = [ワヰヱヲわゐゑを] ;
 $v_start = [ワヰヱヲ]\u3099 ;
+$voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ;
 $n_quoter  =  [ア イ ウ エ オ ナ ニ ヌ ネ ノ ヤ ユ ヨ ン] ;
 $small_y = [ャィュェョ] ;
 $iteration = ゝ ;
-'.' <> 。;
-',' <> 、;
-va <> ワ\u3099 ;
-vi <> ヰ\u3099 ;
-ve <> ヱ\u3099 ;
-vo <> ヲ\u3099 ;
-'~ka' <> ヵ ;
-'~ke' <> ヶ ;
-ya < '~'ャ;
-yi < '~'ィ ;
-yu < '~'ュ;
-ye < '~'ェ;
-yo < '~'ョ;
-a <> ア ;
-b | '~' < ヒ \u3099} $small_y ;
-by } $vowel > ヒ\u3099 | '~y' ;
-ba <> ハ\u3099 ;
-bi <> ヒ\u3099 ;
-bu <> フ\u3099 ;
-be <> ヘ\u3099 ;
-bo <> ホ\u3099 ;
-c } i > | s ;
-c } e > | s ;
-da <> タ\u3099 ;
-di <> テ\u3099ィ ;
-du <> テ\u3099ゥ ;
-de <> テ\u3099 ;
-do <> ト\u3099 ;
-dzu <> ツ\u3099 ;
-dja < チ\u3099ャ ;
-dji'~i' < チ\u3099ィ ; # liu
-dju < チ\u3099ュ ;
-dje < チ\u3099ェ ;
-djo < チ\u3099ョ ;
-dji <> チ\u3099 ;
-dj  } $vowel > チ\u3099 | '~y' ;
-cha < チャ ;
-chi'~i' < チィ ; # liu
-chu < チュ ;
-che < チェ ;
-cho < チョ ;
-chi <> チ ;
-ch } $vowel > チ | '~y' ;
-e <> エ ;
-g | '~' < キ\u3099} $small_y ;
-gy  } $vowel > キ\u3099 | '~y' ;
-ga <> カ\u3099 ;
-gi <> キ\u3099 ;
-gu <> ク\u3099 ;
-ge <> ケ\u3099 ;
-go <> コ\u3099 ;
-i <> イ ;
-ja <> シ\u3099ャ ;
-ji'~i' < シ\u3099ィ ; # liu
-ju <> シ\u3099ュ ;
-je <> シ\u3099ェ ;
-jo <> シ\u3099ョ ;
-ji <> シ\u3099 ;
-k | '~' < キ} $small_y ;
-ky  } $vowel > キ | '~y' ;
-ka <> カ ;
-ki <> キ ;
-ku <> ク ;
-ke <> ケ ;
-ko <> コ ;
-m | '~' < ミ} $small_y ;
-my  } $vowel > ミ | '~y' ;
-ma <> マ ;
-mi <> ミ ;
-mu <> ム ;
-me <> メ ;
-mo <> モ ;
-m } [pbfv] > ン ;
-n | '~' < ニ } $small_y ;
-ny  } $vowel > ニ | '~y' ;
-na <> ナ ;
-ni <> ニ ;
-nu <> ヌ ;
-ne <> ネ ;
-no <> ノ ;
-o <> オ ;
-p | '~' < ヒ\u309A } $small_y ;
-py  } $vowel > ヒ\u309A | '~y' ;
-pa <> ハ\u309A ;
-pi <> ヒ\u309A ;
-pu <> フ\u309A ;
-pe <> ヘ\u309A ;
-po <> ホ\u309A ;
-h | '~' < ヒ } $small_y ;
-hy  } $vowel > ヒ | '~y' ;
-ha <> ハ ;
-hi <> ヒ ;
-hu <> ヘゥ ;
-he <> ヘ ;
-ho <> ホ ;
-fa <> ファ ;
-fi <> フィ ;
-fe <> フェ ;
-fo <> フォ ;
-fu <> フ ;
-r | '~' < リ } $small_y ;
-ry  } $vowel > リ | '~y' ;
-ra <> ラ ;
-ri <> リ ;
-ru <> ル ;
-re <> レ ;
-ro <> ロ ;
-za <> サ\u3099 ;
-zi <> セ\u3099ィ ;
-zu <> ス\u3099 ;
-ze <> セ\u3099 ;
-zo <> ソ\u3099 ;
-sa <> サ ;
-si <> セィ ;
-su <> ス ;
-se <> セ ;
-so <> ソ ;
-sha < シャ ;
-shi'~i' < シィ ; # liu
-shu < シュ ;
-she < シェ ;
-sho < ショ ;
-shi <> シ ;
-sh } $vowel > シ | '~y' ;
-ta <> タ ;
-ti <> ティ ;
-tu <> テゥ ;
-te <> テ ;
-to <> ト ;
-tsu <> ツ ;
-vu <> ウ\u3099 ;
-u <> ウ ;
-wa <> ワ ;
-wi <> ヰ ;
-wu > ウ ;
-we <> ヱ ;
-wo <> ヲ ;
-ya <> ヤ ;
-yi > イ ;
-yu <> ユ ;
-ye > エ ;
-yo <> ヨ ;
-s } sh > ッ ;
-t } ch > ッ ;
-j } j <> ッ } $j_start ;
-b } b <> ッ } [$h_start$f_start] $voice;
-d } d <> ッ } $t_start $voice;
-g } g <> ッ } $k_start $voice;
-p } p <> ッ } [$h_start$f_start] $semivoice;
-z } z <> ッ } $s_start $voice;
-v } v <> ッ } $v_start;
-k } k <> ッ } $k_start ;
-m } m <> ッ } $m_start ;
-n } n <> ッ } $n_start ;
-h } h <> ッ } $h_start ;
-f } f <> ッ } $f_start ;
-r } r <> ッ } $r_start ;
-t } t <> ッ } $t_start ;
-s } s <> ッ } $s_start ;
-w } w  <> ッ } $w_start;
-y } y <> ッ } $y_start;
-x } x > ッ ;
-c } k > ッ ;
-c } c > ッ ;
-c } q > ッ ;
-l } l > ッ ;
-q } q > ッ ;
-$macron <> ー ;
-'~a' <> ァ ;
-'~i' <> ィ ;
-'~u' <> ゥ ;
-'~e' <> ェ ;
-'~o' <> ォ ;
-'~tsu' <> ッ ;
-'~wa' <> ヮ ;
-'~ya' <> ャ ;
-'~yi' > ィ ;
-'~yu' <> ュ ;
-'~ye' > ェ ;
-'~yo' <> ョ ;
-j $1 < sh (y* $vowel) {ヽ$voice ;
-dj $1 < ch (y* $vowel) {ヽ$voice ;
-dz $1 < ts (y* $vowel) {ヽ$voice ;
-g $1 < k (y* $vowel) {ヽ$voice ;
-z $1 < s (y* $vowel) {ヽ$voice ;
-d $1 < t (y* $vowel) {ヽ$voice ;
-h $1 < b (y* $vowel) {ヽ$voice ;
-v $1 < w (y* $vowel) {ヽ$voice ;
-sh $1 < sh (y* $vowel) {ヽ$voice ;
-j $1 < j (y* $vowel) {ヽ$voice ;
-ch $1 < ch (y* $vowel) {ヽ$voice ;
-dj $1 < dj(y* $vowel) {ヽ$voice ;
-ts $1 < ts (y* $vowel) {ヽ$voice ;
-dz $1 < dz (y* $vowel) {ヽ$voice ;
-$1 < ($consonant y* $vowel) {ヽ$voice? ;
-$1 < (.) {ヽ $voice? ; # otherwise repeat last character
-< ヽ $voice? ; # delete if no characters found
-[aeiou] } h > ー ;
-cy > セィ ;
-dy > テ\u3099ィ ;
-hy > ヒ ;
-sy > セィ ;
-ty > ティ ;
-zy > セ\u3099ィ ;
-h > ヘ ;
-ch > チ;
-sh > シ ;
-dz > ツ\u3099 ;
-dj > チ\u3099;
-b > フ\u3099 ;
-d > テ\u3099 ;
-g > ク\u3099 ;
-k > ク ;
-m > ム ;
-n'' < ン } $n_quoter ;
-n <> ン ;
-p > フ\u309A ;
-r > ル ;
-s > ス ;
-t > テ ;
-y > イ ;
-z > ス\u3099 ;
-v > ウ\u3099 ;
-f > フ;
-j  > シ\u3099;
-w > ウ;
-ß > | ss ;
-æ > | e ;
-ð > | d ;
-ø > | u ;
-þ > | th ;
-c > | k ;
-l > | r ;
-q > | k ;
-x > | ks ;
-'~' > ; # delete stray tildes between letters
-[:Katakana:] { '' } [:Latin:] > ; # delete stray quotes between letters
+'.'  。;
+','  、;
+va  ワ\u3099 ;
+vi  ヰ\u3099 ;
+ve  ヱ\u3099 ;
+vo  ヲ\u3099 ;
+'~ka'  ヵ ;
+'~ke'  ヶ ;
+ya  '~'ャ;
+yi  '~'ィ ;
+yu  '~'ュ;
+ye  '~'ェ;
+yo  '~'ョ;
+a  ア ;
+b | '~'  ヒ \u3099} $small_y ;
+by } $vowel  ヒ\u3099 | '~y' ;
+ba  ハ\u3099 ;
+bi  ヒ\u3099 ;
+bu  フ\u3099 ;
+be  ヘ\u3099 ;
+bo  ホ\u3099 ;
+c } i  | s ;
+c } e  | s ;
+da  タ\u3099 ;
+di  テ\u3099ィ ;
+du  テ\u3099ゥ ;
+de  テ\u3099 ;
+do  ト\u3099 ;
+dzu  ツ\u3099 ;
+dja  チ\u3099ャ ;
+dji'~i'  チ\u3099ィ ; # liu
+dju  チ\u3099ュ ;
+dje  チ\u3099ェ ;
+djo  チ\u3099ョ ;
+dji  チ\u3099 ;
+dj  } $vowel  チ\u3099 | '~y' ;
+cha  チャ ;
+chi'~i'  チィ ; # liu
+chu  チュ ;
+che  チェ ;
+cho  チョ ;
+chi  チ ;
+ch } $vowel  チ | '~y' ;
+e  エ ;
+g | '~'  キ\u3099} $small_y ;
+gy  } $vowel  キ\u3099 | '~y' ;
+ga  カ\u3099 ;
+gi  キ\u3099 ;
+gu  ク\u3099 ;
+ge  ケ\u3099 ;
+go  コ\u3099 ;
+i  イ ;
+ja  シ\u3099ャ ;
+ji'~i'  シ\u3099ィ ; # liu
+ju  シ\u3099ュ ;
+je  シ\u3099ェ ;
+jo  シ\u3099ョ ;
+ji  シ\u3099 ;
+k | '~'  キ} $small_y ;
+ky  } $vowel  キ | '~y' ;
+ka  カ ;
+ki  キ ;
+ku  ク ;
+ke  ケ ;
+ko  コ ;
+m | '~'  ミ} $small_y ;
+my  } $vowel  ミ | '~y' ;
+ma  マ ;
+mi  ミ ;
+mu  ム ;
+me  メ ;
+mo  モ ;
+m } [pbfv]  ン ;
+n | '~'  ニ } $small_y ;
+ny  } $vowel  ニ | '~y' ;
+na  ナ ;
+ni  ニ ;
+nu  ヌ ;
+ne  ネ ;
+no  ノ ;
+o  オ ;
+p | '~'  ヒ\u309A } $small_y ;
+py  } $vowel  ヒ\u309A | '~y' ;
+pa  ハ\u309A ;
+pi  ヒ\u309A ;
+pu  フ\u309A ;
+pe  ヘ\u309A ;
+po  ホ\u309A ;
+h | '~'  ヒ } $small_y ;
+hy  } $vowel  ヒ | '~y' ;
+ha  ハ ;
+hi  ヒ ;
+hu  ヘゥ ;
+he  ヘ ;
+ho  ホ ;
+fa  ファ ;
+fi  フィ ;
+fe  フェ ;
+fo  フォ ;
+fu  フ ;
+r | '~'  リ } $small_y ;
+ry  } $vowel  リ | '~y' ;
+ra  ラ ;
+ri  リ ;
+ru  ル ;
+re  レ ;
+ro  ロ ;
+za  サ\u3099 ;
+zi  セ\u3099ィ ;
+zu  ス\u3099 ;
+ze  セ\u3099 ;
+zo  ソ\u3099 ;
+sa  サ ;
+si  セィ ;
+su  ス ;
+se  セ ;
+so  ソ ;
+sha  シャ ;
+shi'~i'  シィ ; # liu
+shu  シュ ;
+she  シェ ;
+sho  ショ ;
+shi  シ ;
+sh } $vowel  シ | '~y' ;
+ta  タ ;
+ti  ティ ;
+tu  テゥ ;
+te  テ ;
+to  ト ;
+tsu  ツ ;
+vu  ウ\u3099 ;
+u  ウ ;
+wa  ワ ;
+wi  ヰ ;
+wu  ウ ;
+we  ヱ ;
+wo  ヲ ;
+ya  ヤ ;
+yi  イ ;
+yu  ユ ;
+ye  エ ;
+yo  ヨ ;
+s } sh  ッ ;
+t } ch  ッ ;
+j } j  ッ } $j_start ;
+b } b  ッ } [$h_start$f_start] $voice;
+d } d  ッ } $t_start $voice;
+g } g  ッ } $k_start $voice;
+p } p  ッ } [$h_start$f_start] $semivoice;
+z } z  ッ } $s_start $voice;
+v } v  ッ } $v_start;
+k } k  ッ } $k_start ;
+m } m  ッ } $m_start ;
+n } n  ッ } $n_start ;
+h } h  ッ } $h_start ;
+f } f  ッ } $f_start ;
+r } r  ッ } $r_start ;
+t } t  ッ } $t_start ;
+s } s  ッ } $s_start ;
+w } w   ッ } $w_start;
+y } y  ッ } $y_start;
+x } x  ッ ;
+c } k  ッ ;
+c } c  ッ ;
+c } q  ッ ;
+l } l  ッ ;
+q } q  ッ ;
+$macron  ー ;
+'~a'  ァ ;
+'~i'  ィ ;
+'~u'  ゥ ;
+'~e'  ェ ;
+'~o'  ォ ;
+'~tsu'  ッ ;
+'~wa'  ヮ ;
+'~ya'  ャ ;
+'~yi'  ィ ;
+'~yu'  ュ ;
+'~ye'  ェ ;
+'~yo'  ョ ;
+j $1  sh (y* $vowel) {ヽ$voice ;
+dj $1  ch (y* $vowel) {ヽ$voice ;
+dz $1  ts (y* $vowel) {ヽ$voice ;
+g $1  k (y* $vowel) {ヽ$voice ;
+z $1  s (y* $vowel) {ヽ$voice ;
+d $1  t (y* $vowel) {ヽ$voice ;
+h $1  b (y* $vowel) {ヽ$voice ;
+v $1  w (y* $vowel) {ヽ$voice ;
+sh $1  sh (y* $vowel) {ヽ$voice ;
+j $1  j (y* $vowel) {ヽ$voice ;
+ch $1  ch (y* $vowel) {ヽ$voice ;
+dj $1  dj(y* $vowel) {ヽ$voice ;
+ts $1  ts (y* $vowel) {ヽ$voice ;
+dz $1  dz (y* $vowel) {ヽ$voice ;
+$1  ($consonant y* $vowel) {ヽ$voice? ;
+$1  (.) {ヽ $voice? ; # otherwise repeat last character
+ ヽ $voice? ; # delete if no characters found
+$voweled_basekana [\u3099 \u309A]? { h → ー ;
+cy  セィ ;
+dy  テ\u3099ィ ;
+hy  ヒ ;
+sy  セィ ;
+ty  ティ ;
+zy  セ\u3099ィ ;
+h  ヘ ;
+ch  チ;
+sh  シ ;
+dz  ツ\u3099 ;
+dj  チ\u3099;
+b  フ\u3099 ;
+d  テ\u3099 ;
+g  ク\u3099 ;
+k  ク ;
+m  ム ;
+n''  ン } $n_quoter ;
+n  ン ;
+p  フ\u309A ;
+r  ル ;
+s  ス ;
+t  テ ;
+y  イ ;
+z  ス\u3099 ;
+v  ウ\u3099 ;
+f  フ;
+j   シ\u3099;
+w  ウ;
+ß  | ss ;
+æ  | e ;
+ð  | d ;
+ø  | u ;
+þ  | th ;
+c  | k ;
+l  | r ;
+q  | k ;
+x  | ks ;
+'~'  ; # delete stray tildes between letters
+[:Katakana:] { '' } [:Latin:]  ; # delete stray quotes between letters
 :: NFC (NFD) ;
-:: ([:Katakana:] halfwidth-fullwidth);
-:: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ]] ) ;
+:: ([[:Katakana:][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] halfwidth-fullwidth);
+:: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] ) ;