]> git.saurik.com Git - apple/icu.git/blobdiff - icuSources/data/translit/Greek_Latin_UNGEGN.txt
ICU-461.12.tar.gz
[apple/icu.git] / icuSources / data / translit / Greek_Latin_UNGEGN.txt
index a7ea71753be9a5e9f13df1f913ea1c46a414fa5b..575d685ce84a960b12e2e35e784147e6059aa371 100644 (file)
-#--------------------------------------------------------------------\r
-# Copyright (c) 1999-2004, International Business Machines\r
-# Corporation and others. All Rights Reserved.\r
-#--------------------------------------------------------------------\r
-# For modern Greek, based on UNGEGN rules.\r
-\r
-# Rules are predicated on running NFD first, and NFC afterwards\r
-# MINIMAL FILTER GENERATED FOR: Greek-Latin/UNGEGN\r
-# WARNING: need to add accents to both filters ###\r
-# :: [́̄̆̈;µ·ÀÂÈÊÌÎÒÔÙÛàâèêìîòôùûĈ-ĉĜ-ĝĤ-ĥĴ-ĵŜ-ŝŴ-ŷǛ-ǜǸ-ǹ̀̂̓-̔̀͂-̓ͅͺ;Ά-ΊΌΎ-ΡΣ-ώϐ-ϖϰ-ϵЀЍѐѝḔ-ḕṐ-ṑẀ-ẁẐ-ẑẤ-ậẰ-ằẾ-ệỐ-ộỜ-ờỪ-ừỲ-ỳἀ-ἕἘ-Ἕἠ-ὅὈ-Ὅὐ-ὗὙὛὝὟ-ώᾀ-ᾴᾶ-ᾼι῁-ῄῆ-῍῏-ΐῖ-Ί῝῟-῭ῲ-ῴῶ-ῼΩ\u03F7-\u07FB\u03F9] ;\r
-\r
-:: [[[:Greek:][:Mn:][:Me:]] [\:-;?\u00B7\u037E\u0387]] ;\r
-::NFD (NFC) ;\r
-\r
-# Useful variables\r
-\r
-$lower = [[:latin:][:greek:] & [:Ll:]] ;\r
-$upper = [[:latin:][:greek:] & [:Lu:]] ;\r
-$accent = [[:Mn:][:Me:]] ;\r
-\r
-$macron = ̄ ;\r
-$ddot = ̈ ;\r
-\r
-$lcgvowel = [αεηιουω] ;\r
-$ucgvowel = [ΑΕΗΙΟΥΩ] ;\r
-$gvowel = [$lcgvowel $ucgvowel] ;\r
-$lcgvowelC = [$lcgvowel $accent] ;\r
-\r
-$evowel = [aeiouyAEIOUY];\r
-$vowel = [ $evowel $gvowel] ;\r
-\r
-$beforeLower = $accent * $lower ;\r
-\r
-$gammaLike = [ΓΚΞΧγκξχϰ] ;\r
-$egammaLike = [GKXCgkxc] ;\r
-$smooth = ̓ ;\r
-$rough = ̔ ;\r
-$iotasub = ͅ ;\r
-\r
-$softener = [βΒγΓδΔζΖλΛμΜνΝρΡ$gvowel] ;\r
-\r
-$under = ̱;\r
-\r
-$caron = ̌;\r
-\r
-$afterLetter = [:L:] [\'$accent]* ;\r
-$beforeLetter = [\'$accent]* [:L:] ;\r
-\r
-# Fix punctuation\r
-\r
-# preserve orginal\r
-\: <> \: $under ;\r
-\? <> \? $under ;\r
-\r
-\; <> \? ;\r
-· <> \: ;\r
-\r
-# Fix any ancient characters that creep in\r
-\r
-͂ > ́ ;\r
-̂ > ́ ;\r
-̀ > ́ ;\r
-$smooth > ;\r
-$rough > ;\r
-$iotasub > ;\r
-ͺ > ;\r
-\r
-# need to have these up here so the rules don't mask\r
-\r
-η <> i $under ;\r
-Η <> I $under ;\r
-\r
-Ψ } $beforeLower <> Ps ;\r
-Ψ <> PS ;\r
-ψ <> ps ;\r
-\r
-ω <> o $under ;\r
-Ω <>  O $under;\r
-\r
-# at begining or end of word, convert mp to b\r
-\r
-[^[:L:]$accent] { μπ > b ;\r
-μπ } [^[:L:]$accent] > b ;\r
-[^[:L:]$accent] { [Μμ][Ππ] > B ;\r
-[Μμ][Ππ] } [^[:L:]$accent] > B ;\r
-\r
-μπ < b ;\r
-Μπ < B } $beforeLower ;\r
-ΜΠ < B ;\r
-\r
-# handle diphthongs ending with upsilon\r
-\r
-ου <> ou ;\r
-ΟΥ <> OU ;\r
-Ου <> Ou ;\r
-οΥ <> oU ;\r
-\r
-$fmaker = [aeiAEI] $under ? ;\r
-$shiftForwardVowels = [[:Mn:]-[\u0308]]; # note: a diaeresis keeps the items separate\r
-\r
-$fmaker { υ ( $shiftForwardVowels )* } $softener > $1 v $under ;\r
-υ $1 < ( $shiftForwardVowels )* v $under ;\r
-\r
-$fmaker { υ ( $shiftForwardVowels )* } > $1 f $under;\r
-υ $1 < ( $shiftForwardVowels )* f $under ;\r
-\r
-$fmaker { Υ } $softener <> V $under ;\r
-$fmaker { Υ <> U $under ;\r
-\r
-υ <> y ;\r
-Υ <> Y ;\r
-\r
-# NORMAL\r
-\r
-α <> a ;\r
-Α <> A ;\r
-\r
-β <> v ;\r
-Β <> V ;\r
-\r
-γ } $gammaLike <> n } $egammaLike ;\r
-γ <> g ;\r
-Γ } $gammaLike <> N } $egammaLike ;\r
-Γ <> G ;\r
-\r
-δ <> d ;\r
-Δ <> D ;\r
-\r
-ε <> e ;\r
-Ε <> E ;\r
-\r
-ζ <> z ;\r
-Ζ <> Z ;\r
-\r
-θ <> th ;\r
-Θ } $beforeLower <> Th ;\r
-Θ <> TH ;\r
-\r
-ι <> i ;\r
-Ι <> I ;\r
-\r
-κ <> k ;\r
-Κ <> K ;\r
-\r
-λ <> l ;\r
-Λ <> L ;\r
-\r
-μ <> m ;\r
-Μ <> M ;\r
-\r
-ν } $gammaLike > n\' ;\r
-ν <> n ;\r
-Ν } $gammaLike <> N\' ;\r
-Ν <> N ;\r
-\r
-ξ <> x ;\r
-Ξ <> X ;\r
-\r
-ο <> o ;\r
-Ο <> O ;\r
-\r
-π <> p ;\r
-Π <> P ;\r
-\r
-ρ <> r ;\r
-Ρ <> R ;\r
-\r
-# insert separator before things that turn into s\r
-[Pp] { } [ςσΣϷϸϺϻ] > \' ; \r
-\r
-# special S variants\r
-\r
-Ϸ <> Š ; # Ϸ GREEK CAPITAL LETTER SHO Uppercase_Letter Grek - L \r
-ϸ <> š ; #ϸ GREEK SMALL LETTER SHO Lowercase_Letter Grek - L \r
-Ϻ <> Ŝ ; # Ϻ GREEK CAPITAL LETTER SAN Uppercase_Letter Grek - L \r
-ϻ <> ŝ ; # ϻ GREEK SMALL LETTER SAN Lowercase_Letter Grek - L \r
-\r
-# Caron means exception\r
-\r
-# before a letter, initial\r
-ς } $beforeLetter <> s $under } $beforeLetter;\r
-σ } $beforeLetter <> s } $beforeLetter;\r
-\r
-# otherwise, after a letter = final\r
-$afterLetter { σ <> $afterLetter { s $under;\r
-$afterLetter { ς <> $afterLetter { s ;\r
-\r
-# otherwise (isolated) = initial\r
-ς <> s $under;\r
-σ <> s ;\r
-\r
-# [Pp] { Σ <> \'S ;\r
-Σ <> S ;\r
-\r
-τ <> t ;\r
-Τ <> T ;\r
-\r
-φ <> f ;\r
-Φ <> F ;\r
-\r
-χ <> ch ;\r
-Χ } $beforeLower <> Ch ;\r
-Χ <> CH ;\r
-\r
-# Completeness for ASCII\r
-\r
-# $ignore = [[:Mark:]''] * ;\r
-\r
-| ch < h ;\r
-| k  < c ;\r
-| i  < j ;\r
-| k < q ;\r
-| b < u } $vowel ;\r
-| b < w } $vowel ;\r
-| y < u ;\r
-| y < w ;\r
-\r
-| Ch < H ;\r
-| K < C ;\r
-| I < J ;\r
-| K < Q ;\r
-| B < W } $vowel ;\r
-| B < U } $vowel ;\r
-| Y < W ;\r
-| Y < U ;\r
-\r
-# Completeness for Greek\r
-\r
-ϐ > | β ;\r
-ϑ > | θ ;\r
-ϒ > | Υ ;\r
-ϕ > | φ ;\r
-ϖ > | π ;\r
-\r
-ϰ > | κ ;\r
-ϱ > | ρ ;\r
-ϲ > | σ ;\r
-Ϲ > | Σ; #U+03F9 GREEK CAPITAL LUNATE SIGMA SYMBOL\r
-ϳ > j ;\r
-ϴ > | Θ ;\r
-ϵ > | ε ;\r
-µ > | μ ;\r
-\r
-# delete any trailing ' marks used for roundtripping\r
-\r
- < [Ππ] { \' } [Ss] ;\r
- < [Νν] { \' } $egammaLike ;\r
-\r
-::NFC (NFD) ;\r
-\r
-# MINIMAL FILTER GENERATED FOR: Latin-Greek/UNGEGN BACKWARD\r
-:: ([[[:Latin:][:Mn:][:Me:]] ['\:?]]) ;\r
+# ***************************************************************************
+# *
+# *  Copyright (C) 2004-2010, International Business Machines
+# *  Corporation; Unicode, Inc.; and others.  All Rights Reserved.
+# *
+# ***************************************************************************
+# File: Greek_Latin_UNGEGN.txt
+# Generated from CLDR 
+#
+:: [[[:Greek:][:Mn:][:Me:]] [\:-;?·;·]] ;
+::NFD (NFC) ;
+$lower = [[:latin:][:greek:] & [:Ll:]] ;
+$upper = [[:latin:][:greek:] & [:Lu:]] ;
+$accent = [[:Mn:][:Me:]] ;
+$macron = \u0304 ;
+$ddot = \u0308 ;
+$lcgvowel = [αεηιουω] ;
+$ucgvowel = [ΑΕΗΙΟΥΩ] ;
+$gvowel = [$lcgvowel $ucgvowel] ;
+$lcgvowelC = [$lcgvowel $accent] ;
+$evowel = [aeiouyAEIOUY];
+$vowel = [ $evowel $gvowel] ;
+$beforeLower = $accent * $lower ;
+$gammaLike = [ΓΚΞΧγκξχϰ] ;
+$egammaLike = [GKXCgkxc] ;
+$smooth = \u0313 ;
+$rough = \u0314 ;
+$iotasub = \u0345 ;
+$softener = [βΒγΓδΔζΖλΛμΜνΝρΡ$gvowel] ;
+$under = \u0331;
+$caron = \u030C;
+$afterLetter = [:L:] [\'$accent]* ;
+$beforeLetter = [\'$accent]* [:L:] ;
+\: ↔ \: $under ;
+\? ↔ \? $under ;
+\; ↔ \? ;
+· ↔ \: ;
+\u0342 → \u0301 ;
+\u0302 → \u0301 ;
+\u0300 → \u0301 ;
+$smooth → ;
+$rough → ;
+$iotasub → ;
+ͺ → ;
+η ↔ i $under ;
+Η ↔ I $under ;
+Ψ } $beforeLower ↔ Ps ;
+Ψ ↔ PS ;
+ψ ↔ ps ;
+ω ↔ o $under ;
+Ω ↔  O $under;
+[^[:L:]$accent] { μπ → b ;
+μπ } [^[:L:]$accent] → b ;
+[^[:L:]$accent] { [Μμ][Ππ] → B ;
+[Μμ][Ππ] } [^[:L:]$accent] → B ;
+μπ ← b ;
+Μπ ← B } $beforeLower ;
+ΜΠ ← B ;
+ου ↔ ou ;
+ΟΥ ↔ OU ;
+Ου ↔ Ou ;
+οΥ ↔ oU ;
+$fmaker = [aeiAEI] $under ? ;
+$shiftForwardVowels = [[:Mn:]-[\u0308]]; # note: a diaeresis keeps the items separate
+$fmaker { υ ( $shiftForwardVowels )* } $softener → $1 v $under ;
+υ $1 ← ( $shiftForwardVowels )* v $under ;
+$fmaker { υ ( $shiftForwardVowels )* } → $1 f $under;
+υ $1 ← ( $shiftForwardVowels )* f $under ;
+$fmaker { Υ } $softener ↔ V $under ;
+$fmaker { Υ ↔ U $under ;
+υ ↔ y ;
+Υ ↔ Y ;
+α ↔ a ;
+Α ↔ A ;
+β ↔ v ;
+Β ↔ V ;
+γ } $gammaLike ↔ n } $egammaLike ;
+γ ↔ g ;
+Γ } $gammaLike ↔ N } $egammaLike ;
+Γ ↔ G ;
+δ ↔ d ;
+Δ ↔ D ;
+ε ↔ e ;
+Ε ↔ E ;
+ζ ↔ z ;
+Ζ ↔ Z ;
+θ ↔ th ;
+Θ } $beforeLower ↔ Th ;
+Θ ↔ TH ;
+ι ↔ i ;
+Ι ↔ I ;
+κ ↔ k ;
+Κ ↔ K ;
+λ ↔ l ;
+Λ ↔ L ;
+μ ↔ m ;
+Μ ↔ M ;
+ν } $gammaLike → n\' ;
+ν ↔ n ;
+Ν } $gammaLike ↔ N\' ;
+Ν ↔ N ;
+ξ ↔ x ;
+Ξ ↔ X ;
+ο ↔ o ;
+Ο ↔ O ;
+π ↔ p ;
+Π ↔ P ;
+ρ ↔ r ;
+Ρ ↔ R ;
+[Pp] { } [ςσΣϷϸϺϻ] → \' ;
+Ϸ ↔ S\u030C ; # Ϸ GREEK CAPITAL LETTER SHO Uppercase_Letter Grek - L
+ϸ ↔ s\u030C ; #ϸ GREEK SMALL LETTER SHO Lowercase_Letter Grek - L
+Ϻ ↔ S\u0302 ; # Ϻ GREEK CAPITAL LETTER SAN Uppercase_Letter Grek - L
+ϻ ↔ s\u0302 ; # ϻ GREEK SMALL LETTER SAN Lowercase_Letter Grek - L
+ς } $beforeLetter ↔ s $under } $beforeLetter;
+σ } $beforeLetter ↔ s } $beforeLetter;
+$afterLetter { σ ↔ $afterLetter { s $under;
+$afterLetter { ς ↔ $afterLetter { s ;
+ς ↔ s $under;
+σ ↔ s ;
+Σ ↔ S ;
+τ ↔ t ;
+Τ ↔ T ;
+φ ↔ f ;
+Φ ↔ F ;
+χ ↔ ch ;
+Χ } $beforeLower ↔ Ch ;
+Χ ↔ CH ;
+| ch ← h ;
+| k  ← c ;
+| i  ← j ;
+| k ← q ;
+| b ← u } $vowel ;
+| b ← w } $vowel ;
+| y ← u ;
+| y ← w ;
+| Ch ← H ;
+| K ← C ;
+| I ← J ;
+| K ← Q ;
+| B ← W } $vowel ;
+| B ← U } $vowel ;
+| Y ← W ;
+| Y ← U ;
+ϐ → | β ;
+ϑ → | θ ;
+ϒ → | Υ ;
+ϕ → | φ ;
+ϖ → | π ;
+ϰ → | κ ;
+ϱ → | ρ ;
+ϲ → | σ ;
+Ϲ → | Σ; #U+03F9 GREEK CAPITAL LUNATE SIGMA SYMBOL
+ϳ → j ;
+ϴ → | Θ ;
+ϵ → | ε ;
+µ → | μ ;
+← [Ππ] { \' } [Ss] ;
+← [Νν] { \' } $egammaLike ;
+::NFC (NFD) ;
+:: ([[[:Latin:][:Mn:][:Me:]] ['\:?]]) ;