X-Git-Url: https://git.saurik.com/apple/icu.git/blobdiff_plain/57a6839dcb3bba09e8228b822b290604668416fe..ef6cf650f4a75c3f97de06b51fa104f2069b9ea2:/icuSources/common/uloc.cpp?ds=sidebyside diff --git a/icuSources/common/uloc.cpp b/icuSources/common/uloc.cpp index dc17e718..bf1a5ff6 100644 --- a/icuSources/common/uloc.cpp +++ b/icuSources/common/uloc.cpp @@ -1,6 +1,6 @@ /* ********************************************************************** -* Copyright (C) 1997-2013, International Business Machines +* Copyright (C) 1997-2016, International Business Machines * Corporation and others. All Rights Reserved. ********************************************************************** * @@ -38,7 +38,6 @@ #include "umutex.h" #include "cstring.h" #include "cmemory.h" -#include "ucln_cmn.h" #include "locmap.h" #include "uarrsort.h" #include "uenumimp.h" @@ -93,87 +92,91 @@ locale_getKeywords(const char *localeID, * The range qaa-qtz is reserved for local use */ /* Generated using org.unicode.cldr.icu.GenerateISO639LanguageTables */ -/* ISO639 table version is 20130531 */ +/* ISO639 table version is 20150505 */ static const char * const LANGUAGES[] = { - "aa", "ab", "ace", "ach", "ada", "ady", "ae", "af", - "afa", "afh", "agq", "ain", "ak", "akk", "ale", "alg", - "alt", "am", "an", "ang", "anp", "apa", "ar", "arc", - "arn", "arp", "art", "arw", "as", "asa", "ast", "ath", - "aus", "av", "awa", "ay", "az", - "ba", "bad", "bai", "bal", "ban", "bas", "bat", "bax", - "bbj", "be", "bej", "bem", "ber", "bez", "bfd", "bg", - "bh", "bho", "bi", "bik", "bin", "bkm", "bla", "bm", - "bn", "bnt", "bo", "br", "bra", "brx", "bs", "bss", - "btk", "bua", "bug", "bum", "byn", "byv", - "ca", "cad", "cai", "car", "cau", "cay", "cch", "ce", - "ceb", "cel", "cgg", "ch", "chb", "chg", "chk", "chm", - "chn", "cho", "chp", "chr", "chy", "ckb", "cmc", "co", - "cop", "cpe", "cpf", "cpp", "cr", "crh", "crp", "cs", - "csb", "cu", "cus", "cv", "cy", - "da", "dak", "dar", "dav", "day", "de", "del", "den", - "dgr", "din", "dje", "doi", "dra", "dsb", "dua", "dum", - "dv", "dyo", "dyu", "dz", "dzg", - "ebu", "ee", "efi", "egy", "eka", "el", "elx", "en", - "enm", "eo", "es", "et", "eu", "ewo", - "fa", "fan", "fat", "ff", "fi", "fil", "fiu", "fj", - "fo", "fon", "fr", "frm", "fro", "frr", "frs", "fur", - "fy", - "ga", "gaa", "gay", "gba", "gd", "gem", "gez", "gil", - "gl", "gmh", "gn", "goh", "gon", "gor", "got", "grb", - "grc", "gsw", "gu", "guz", "gv", "gwi", - "ha", "hai", "haw", "he", "hi", "hil", "him", "hit", - "hmn", "ho", "hr", "hsb", "ht", "hu", "hup", "hy", - "hz", - "ia", "iba", "ibb", "id", "ie", "ig", "ii", "ijo", - "ik", "ilo", "inc", "ine", "inh", "io", "ira", "iro", - "is", "it", "iu", - "ja", "jbo", "jgo", "jmc", "jpr", "jrb", "jv", - "ka", "kaa", "kab", "kac", "kaj", "kam", "kar", "kaw", - "kbd", "kbl", "kcg", "kde", "kea", "kfo", "kg", "kha", - "khi", "kho", "khq", "ki", "kj", "kk", "kkj", "kl", - "kln", "km", "kmb", "kn", "ko", "kok", "kos", "kpe", - "kr", "krc", "krl", "kro", "kru", "ks", "ksb", "ksf", - "ksh", "ku", "kum", "kut", "kv", "kw", "ky", - "la", "lad", "lag", "lah", "lam", "lb", "lez", "lg", - "li", "lkt", "ln", "lo", "lol", "loz", "lt", "lu", - "lua", "lui", "lun", "luo", "lus", "luy", "lv", - "mad", "maf", "mag", "mai", "mak", "man", "map", "mas", - "mde", "mdf", "mdr", "men", "mer", "mfe", "mg", "mga", + "aa", "ab", "ace", "ach", "ada", "ady", "ae", "aeb", + "af", "afh", "agq", "ain", "ak", "akk", "akz", "ale", + "aln", "alt", "am", "an", "ang", "anp", "ar", "arc", + "arn", "aro", "arp", "arq", "ars", "arw", "ary", "arz", "as", + "asa", "ase", "ast", "av", "avk", "awa", "ay", "az", + "ba", "bal", "ban", "bar", "bas", "bax", "bbc", "bbj", + "be", "bej", "bem", "bew", "bez", "bfd", "bfq", "bg", + "bgn", "bho", "bi", "bik", "bin", "bjn", "bkm", "bla", + "bm", "bn", "bo", "bpy", "bqi", "br", "bra", "brh", + "brx", "bs", "bss", "bua", "bug", "bum", "byn", "byv", + "ca", "cad", "car", "cay", "cch", "ce", "ceb", "cgg", + "ch", "chb", "chg", "chk", "chm", "chn", "cho", "chp", + "chr", "chy", "ckb", "co", "cop", "cps", "cr", "crh", + "cs", "csb", "cu", "cv", "cy", + "da", "dak", "dar", "dav", "de", "del", "den", "dgr", + "din", "dje", "doi", "dsb", "dtp", "dua", "dum", "dv", + "dyo", "dyu", "dz", "dzg", + "ebu", "ee", "efi", "egl", "egy", "eka", "el", "elx", + "en", "enm", "eo", "es", "esu", "et", "eu", "ewo", + "ext", + "fa", "fan", "fat", "ff", "fi", "fil", "fit", "fj", + "fo", "fon", "fr", "frc", "frm", "fro", "frp", "frr", + "frs", "fur", "fy", + "ga", "gaa", "gag", "gan", "gay", "gba", "gbz", "gd", + "gez", "gil", "gl", "glk", "gmh", "gn", "goh", "gom", + "gon", "gor", "got", "grb", "grc", "gsw", "gu", "guc", + "gur", "guz", "gv", "gwi", + "ha", "hai", "hak", "haw", "he", "hi", "hif", "hil", + "hit", "hmn", "ho", "hr", "hsb", "hsn", "ht", "hu", + "hup", "hy", "hz", + "ia", "iba", "ibb", "id", "ie", "ig", "ii", "ik", + "ilo", "inh", "io", "is", "it", "iu", "izh", + "ja", "jam", "jbo", "jgo", "jmc", "jpr", "jrb", "jut", + "jv", + "ka", "kaa", "kab", "kac", "kaj", "kam", "kaw", "kbd", + "kbl", "kcg", "kde", "kea", "ken", "kfo", "kg", "kgp", + "kha", "kho", "khq", "khw", "ki", "kiu", "kj", "kk", + "kkj", "kl", "kln", "km", "kmb", "kn", "ko", "koi", + "kok", "kos", "kpe", "kr", "krc", "kri", "krj", "krl", + "kru", "ks", "ksb", "ksf", "ksh", "ku", "kum", "kut", + "kv", "kw", "ky", + "la", "lad", "lag", "lah", "lam", "lb", "lez", "lfn", + "lg", "li", "lij", "liv", "lkt", "lmo", "ln", "lo", + "lol", "loz", "lrc", "lt", "ltg", "lu", "lua", "lui", + "lun", "luo", "lus", "luy", "lv", "lzh", "lzz", + "mad", "maf", "mag", "mai", "mak", "man", "mas", "mde", + "mdf", "mdh", "mdr", "men", "mer", "mfe", "mg", "mga", "mgh", "mgo", "mh", "mi", "mic", "min", "mis", "mk", - "mkh", "ml", "mn", "mnc", "mni", "mno", "mo", "moh", - "mos", "mr", "ms", "mt", "mua", "mul", "mun", "mus", - "mwl", "mwr", "my", "mye", "myn", "myv", - "na", "nah", "nai", "nap", "naq", "nb", "nd", "nds", - "ne", "new", "ng", "nia", "nic", "niu", "nl", "nmg", - "nn", "nnh", "no", "nog", "non", "nqo", "nr", "nso", - "nub", "nus", "nv", "nwc", "ny", "nym", "nyn", "nyo", - "nzi", - "oc", "oj", "om", "or", "os", "osa", "ota", "oto", - "pa", "paa", "pag", "pal", "pam", "pap", "pau", "peo", - "phi", "phn", "pi", "pl", "pon", "pra", "pro", "ps", - "pt", - "qu", - "raj", "rap", "rar", "rm", "rn", "ro", "roa", "rof", - "rom", "ru", "rup", "rw", "rwk", - "sa", "sad", "sah", "sai", "sal", "sam", "saq", "sas", - "sat", "sba", "sbp", "sc", "scn", "sco", "sd", "se", - "see", "seh", "sel", "sem", "ses", "sg", "sga", "sgn", - "shi", "shn", "shu", "si", "sid", "sio", "sit", - "sk", "sl", "sla", "sm", "sma", "smi", "smj", "smn", - "sms", "sn", "snk", "so", "sog", "son", "sq", "sr", - "srn", "srr", "ss", "ssa", "ssy", "st", "su", "suk", - "sus", "sux", "sv", "sw", "swb", "swc", "syc", "syr", - "ta", "tai", "te", "tem", "teo", "ter", "tet", "tg", - "th", "ti", "tig", "tiv", "tk", "tkl", "tl", "tlh", - "tli", "tmh", "tn", "to", "tog", "tpi", "tr", "trv", - "ts", "tsi", "tt", "tum", "tup", "tut", "tvl", "tw", - "twq", "ty", "tyv", "tzm", + "ml", "mn", "mnc", "mni", "moh", "mos", "mr", "mrj", + "ms", "mt", "mua", "mul", "mus", "mwl", "mwr", "mwv", + "my", "mye", "myv", "mzn", + "na", "nan", "nap", "naq", "nb", "nd", "nds", "ne", + "new", "ng", "nia", "niu", "njo", "nl", "nmg", "nn", + "nnh", "no", "nog", "non", "nov", "nqo", "nr", "nso", + "nus", "nv", "nwc", "ny", "nym", "nyn", "nyo", "nzi", + "oc", "oj", "om", "or", "os", "osa", "ota", + "pa", "pag", "pal", "pam", "pap", "pau", "pcd", "pdc", + "pdt", "peo", "pfl", "phn", "pi", "pl", "pms", "pnt", + "pon", "prg", "pro", "ps", "pt", + "qu", "quc", "qug", + "raj", "rap", "rar", "rgn", "rif", "rm", "rn", "ro", + "rof", "rom", "rtm", "ru", "rue", "rug", "rup", + "rw", "rwk", + "sa", "sad", "sah", "sam", "saq", "sas", "sat", "saz", + "sba", "sbp", "sc", "scn", "sco", "sd", "sdc", "sdh", + "se", "see", "seh", "sei", "sel", "ses", "sg", "sga", + "sgs", "shi", "shn", "shu", "si", "sid", "sk", + "sl", "sli", "sly", "sm", "sma", "smj", "smn", "sms", + "sn", "snk", "so", "sog", "sq", "sr", "srn", "srr", + "ss", "ssy", "st", "stq", "su", "suk", "sus", "sux", + "sv", "sw", "swb", "swc", "syc", "syr", "szl", + "ta", "tcy", "te", "tem", "teo", "ter", "tet", "tg", + "th", "ti", "tig", "tiv", "tk", "tkl", "tkr", "tl", + "tlh", "tli", "tly", "tmh", "tn", "to", "tog", "tpi", + "tr", "tru", "trv", "ts", "tsd", "tsi", "tt", "ttt", + "tum", "tvl", "tw", "twq", "ty", "tyv", "tzm", "udm", "ug", "uga", "uk", "umb", "und", "ur", "uz", - "vai", "ve", "vi", "vo", "vot", "vun", - "wa", "wae", "wak", "wal", "war", "was", "wen", "wo", - "xal", "xh", "xog", - "yao", "yap", "yav", "ybb", "yi", "yo", "ypk", "yue", - "za", "zap", "zbl", "zen", "zgh", "zh", "znd", "zu", + "vai", "ve", "vec", "vep", "vi", "vls", "vmf", "vo", + "vot", "vro", "vun", + "wa", "wae", "wal", "war", "was", "wbp", "wo", "wuu", + "xal", "xh", "xmf", "xog", + "yao", "yap", "yav", "ybb", "yi", "yo", "yrl", "yue", + "za", "zap", "zbl", "zea", "zen", "zgh", "zh", "zu", "zun", "zxx", "zza", NULL, "in", "iw", "ji", "jw", "sh", /* obsolete language codes */ @@ -204,87 +207,91 @@ static const char* const REPLACEMENT_LANGUAGES[]={ * the two lists in LANGUAGES. */ /* Generated using org.unicode.cldr.icu.GenerateISO639LanguageTables */ -/* ISO639 table version is 20130531 */ +/* ISO639 table version is 20150505 */ static const char * const LANGUAGES_3[] = { - "aar", "abk", "ace", "ach", "ada", "ady", "ave", "afr", - "afa", "afh", "agq", "ain", "aka", "akk", "ale", "alg", - "alt", "amh", "arg", "ang", "anp", "apa", "ara", "arc", - "arn", "arp", "art", "arw", "asm", "asa", "ast", "ath", - "aus", "ava", "awa", "aym", "aze", - "bak", "bad", "bai", "bal", "ban", "bas", "bat", "bax", - "bbj", "bel", "bej", "bem", "ber", "bez", "bfd", "bul", - "bih", "bho", "bis", "bik", "bin", "bkm", "bla", "bam", - "ben", "bnt", "bod", "bre", "bra", "brx", "bos", "bss", - "btk", "bua", "bug", "bum", "byn", "byv", - "cat", "cad", "cai", "car", "cau", "cay", "cch", "che", - "ceb", "cel", "cgg", "cha", "chb", "chg", "chk", "chm", - "chn", "cho", "chp", "chr", "chy", "ckb", "cmc", "cos", - "cop", "cpe", "cpf", "cpp", "cre", "crh", "crp", "ces", - "csb", "chu", "cus", "chv", "cym", - "dan", "dak", "dar", "dav", "day", "deu", "del", "den", - "dgr", "din", "dje", "doi", "dra", "dsb", "dua", "dum", - "div", "dyo", "dyu", "dzo", "dzg", - "ebu", "ewe", "efi", "egy", "eka", "ell", "elx", "eng", - "enm", "epo", "spa", "est", "eus", "ewo", - "fas", "fan", "fat", "ful", "fin", "fil", "fiu", "fij", - "fao", "fon", "fra", "frm", "fro", "frr", "frs", "fur", - "fry", - "gle", "gaa", "gay", "gba", "gla", "gem", "gez", "gil", - "glg", "gmh", "grn", "goh", "gon", "gor", "got", "grb", - "grc", "gsw", "guj", "guz", "glv", "gwi", - "hau", "hai", "haw", "heb", "hin", "hil", "him", "hit", - "hmn", "hmo", "hrv", "hsb", "hat", "hun", "hup", "hye", - "her", - "ina", "iba", "ibb", "ind", "ile", "ibo", "iii", "ijo", - "ipk", "ilo", "inc", "ine", "inh", "ido", "ira", "iro", - "isl", "ita", "iku", - "jpn", "jbo", "jgo", "jmc", "jpr", "jrb", "jav", - "kat", "kaa", "kab", "kac", "kaj", "kam", "kar", "kaw", - "kbd", "kbl", "kcg", "kde", "kea", "kfo", "kon", "kha", - "khi", "kho", "khq", "kik", "kua", "kaz", "kkj", "kal", - "kln", "khm", "kmb", "kan", "kor", "kok", "kos", "kpe", - "kau", "krc", "krl", "kro", "kru", "kas", "ksb", "ksf", - "ksh", "kur", "kum", "kut", "kom", "cor", "kir", - "lat", "lad", "lag", "lah", "lam", "ltz", "lez", "lug", - "lim", "lkt", "lin", "lao", "lol", "loz", "lit", "lub", - "lua", "lui", "lun", "luo", "lus", "luy", "lav", - "mad", "maf", "mag", "mai", "mak", "man", "map", "mas", - "mde", "mdf", "mdr", "men", "mer", "mfe", "mlg", "mga", + "aar", "abk", "ace", "ach", "ada", "ady", "ave", "aeb", + "afr", "afh", "agq", "ain", "aka", "akk", "akz", "ale", + "aln", "alt", "amh", "arg", "ang", "anp", "ara", "arc", + "arn", "aro", "arp", "arq", "ars", "arw", "ary", "arz", "asm", + "asa", "ase", "ast", "ava", "avk", "awa", "aym", "aze", + "bak", "bal", "ban", "bar", "bas", "bax", "bbc", "bbj", + "bel", "bej", "bem", "bew", "bez", "bfd", "bfq", "bul", + "bgn", "bho", "bis", "bik", "bin", "bjn", "bkm", "bla", + "bam", "ben", "bod", "bpy", "bqi", "bre", "bra", "brh", + "brx", "bos", "bss", "bua", "bug", "bum", "byn", "byv", + "cat", "cad", "car", "cay", "cch", "che", "ceb", "cgg", + "cha", "chb", "chg", "chk", "chm", "chn", "cho", "chp", + "chr", "chy", "ckb", "cos", "cop", "cps", "cre", "crh", + "ces", "csb", "chu", "chv", "cym", + "dan", "dak", "dar", "dav", "deu", "del", "den", "dgr", + "din", "dje", "doi", "dsb", "dtp", "dua", "dum", "div", + "dyo", "dyu", "dzo", "dzg", + "ebu", "ewe", "efi", "egl", "egy", "eka", "ell", "elx", + "eng", "enm", "epo", "spa", "esu", "est", "eus", "ewo", + "ext", + "fas", "fan", "fat", "ful", "fin", "fil", "fit", "fij", + "fao", "fon", "fra", "frc", "frm", "fro", "frp", "frr", + "frs", "fur", "fry", + "gle", "gaa", "gag", "gan", "gay", "gba", "gbz", "gla", + "gez", "gil", "glg", "glk", "gmh", "grn", "goh", "gom", + "gon", "gor", "got", "grb", "grc", "gsw", "guj", "guc", + "gur", "guz", "glv", "gwi", + "hau", "hai", "hak", "haw", "heb", "hin", "hif", "hil", + "hit", "hmn", "hmo", "hrv", "hsb", "hsn", "hat", "hun", + "hup", "hye", "her", + "ina", "iba", "ibb", "ind", "ile", "ibo", "iii", "ipk", + "ilo", "inh", "ido", "isl", "ita", "iku", "izh", + "jpn", "jam", "jbo", "jgo", "jmc", "jpr", "jrb", "jut", + "jav", + "kat", "kaa", "kab", "kac", "kaj", "kam", "kaw", "kbd", + "kbl", "kcg", "kde", "kea", "ken", "kfo", "kon", "kgp", + "kha", "kho", "khq", "khw", "kik", "kiu", "kua", "kaz", + "kkj", "kal", "kln", "khm", "kmb", "kan", "kor", "koi", + "kok", "kos", "kpe", "kau", "krc", "kri", "krj", "krl", + "kru", "kas", "ksb", "ksf", "ksh", "kur", "kum", "kut", + "kom", "cor", "kir", + "lat", "lad", "lag", "lah", "lam", "ltz", "lez", "lfn", + "lug", "lim", "lij", "liv", "lkt", "lmo", "lin", "lao", + "lol", "loz", "lrc", "lit", "ltg", "lub", "lua", "lui", + "lun", "luo", "lus", "luy", "lav", "lzh", "lzz", + "mad", "maf", "mag", "mai", "mak", "man", "mas", "mde", + "mdf", "mdh", "mdr", "men", "mer", "mfe", "mlg", "mga", "mgh", "mgo", "mah", "mri", "mic", "min", "mis", "mkd", - "mkh", "mal", "mon", "mnc", "mni", "mno", "mol", "moh", - "mos", "mar", "msa", "mlt", "mua", "mul", "mun", "mus", - "mwl", "mwr", "mya", "mye", "myn", "myv", - "nau", "nah", "nai", "nap", "naq", "nob", "nde", "nds", - "nep", "new", "ndo", "nia", "nic", "niu", "nld", "nmg", - "nno", "nnh", "nor", "nog", "non", "nqo", "nbl", "nso", - "nub", "nus", "nav", "nwc", "nya", "nym", "nyn", "nyo", - "nzi", - "oci", "oji", "orm", "ori", "oss", "osa", "ota", "oto", - "pan", "paa", "pag", "pal", "pam", "pap", "pau", "peo", - "phi", "phn", "pli", "pol", "pon", "pra", "pro", "pus", - "por", - "que", - "raj", "rap", "rar", "roh", "run", "ron", "roa", "rof", - "rom", "rus", "rup", "kin", "rwk", - "san", "sad", "sah", "sai", "sal", "sam", "saq", "sas", - "sat", "sba", "sbp", "srd", "scn", "sco", "snd", "sme", - "see", "seh", "sel", "sem", "ses", "sag", "sga", "sgn", - "shi", "shn", "shu", "sin", "sid", "sio", "sit", - "slk", "slv", "sla", "smo", "sma", "smi", "smj", "smn", - "sms", "sna", "snk", "som", "sog", "son", "sqi", "srp", - "srn", "srr", "ssw", "ssa", "ssy", "sot", "sun", "suk", - "sus", "sux", "swe", "swa", "swb", "swc", "syc", "syr", - "tam", "tai", "tel", "tem", "teo", "ter", "tet", "tgk", - "tha", "tir", "tig", "tiv", "tuk", "tkl", "tgl", "tlh", - "tli", "tmh", "tsn", "ton", "tog", "tpi", "tur", "trv", - "tso", "tsi", "tat", "tum", "tup", "tut", "tvl", "twi", - "twq", "tah", "tyv", "tzm", + "mal", "mon", "mnc", "mni", "moh", "mos", "mar", "mrj", + "msa", "mlt", "mua", "mul", "mus", "mwl", "mwr", "mwv", + "mya", "mye", "myv", "mzn", + "nau", "nan", "nap", "naq", "nob", "nde", "nds", "nep", + "new", "ndo", "nia", "niu", "njo", "nld", "nmg", "nno", + "nnh", "nor", "nog", "non", "nov", "nqo", "nbl", "nso", + "nus", "nav", "nwc", "nya", "nym", "nyn", "nyo", "nzi", + "oci", "oji", "orm", "ori", "oss", "osa", "ota", + "pan", "pag", "pal", "pam", "pap", "pau", "pcd", "pdc", + "pdt", "peo", "pfl", "phn", "pli", "pol", "pms", "pnt", + "pon", "prg", "pro", "pus", "por", + "que", "quc", "qug", + "raj", "rap", "rar", "rgn", "rif", "roh", "run", "ron", + "rof", "rom", "rtm", "rus", "rue", "rug", "rup", + "kin", "rwk", + "san", "sad", "sah", "sam", "saq", "sas", "sat", "saz", + "sba", "sbp", "srd", "scn", "sco", "snd", "sdc", "sdh", + "sme", "see", "seh", "sei", "sel", "ses", "sag", "sga", + "sgs", "shi", "shn", "shu", "sin", "sid", "slk", + "slv", "sli", "sly", "smo", "sma", "smj", "smn", "sms", + "sna", "snk", "som", "sog", "sqi", "srp", "srn", "srr", + "ssw", "ssy", "sot", "stq", "sun", "suk", "sus", "sux", + "swe", "swa", "swb", "swc", "syc", "syr", "szl", + "tam", "tcy", "tel", "tem", "teo", "ter", "tet", "tgk", + "tha", "tir", "tig", "tiv", "tuk", "tkl", "tkr", "tgl", + "tlh", "tli", "tly", "tmh", "tsn", "ton", "tog", "tpi", + "tur", "tru", "trv", "tso", "tsd", "tsi", "tat", "ttt", + "tum", "tvl", "twi", "twq", "tah", "tyv", "tzm", "udm", "uig", "uga", "ukr", "umb", "und", "urd", "uzb", - "vai", "ven", "vie", "vol", "vot", "vun", - "wln", "wae", "wak", "wal", "war", "was", "wen", "wol", - "xal", "xho", "xog", - "yao", "yap", "yav", "ybb", "yid", "yor", "ypk", "yue", - "zha", "zap", "zbl", "zen", "zgh", "zho", "znd", "zul", + "vai", "ven", "vec", "vep", "vie", "vls", "vmf", "vol", + "vot", "vro", "vun", + "wln", "wae", "wal", "war", "was", "wbp", "wol", "wuu", + "xal", "xho", "xmf", "xog", + "yao", "yap", "yav", "ybb", "yid", "yor", "yrl", "yue", + "zha", "zap", "zbl", "zea", "zen", "zgh", "zho", "zul", "zun", "zxx", "zza", NULL, /* "in", "iw", "ji", "jw", "sh", */ @@ -317,19 +324,19 @@ NULL * http://www.iso.org/iso/en/prods-services/iso3166ma/03updates-on-iso-3166/nlv3e-rou.html */ static const char * const COUNTRIES[] = { - "AD", "AE", "AF", "AG", "AI", "AL", "AM", + "AC", "AD", "AE", "AF", "AG", "AI", "AL", "AM", "AO", "AQ", "AR", "AS", "AT", "AU", "AW", "AX", "AZ", "BA", "BB", "BD", "BE", "BF", "BG", "BH", "BI", "BJ", "BL", "BM", "BN", "BO", "BQ", "BR", "BS", "BT", "BV", "BW", "BY", "BZ", "CA", "CC", "CD", "CF", "CG", - "CH", "CI", "CK", "CL", "CM", "CN", "CO", "CR", - "CU", "CV", "CW", "CX", "CY", "CZ", "DE", "DJ", "DK", - "DM", "DO", "DZ", "EC", "EE", "EG", "EH", "ER", + "CH", "CI", "CK", "CL", "CM", "CN", "CO", "CP", "CR", + "CU", "CV", "CW", "CX", "CY", "CZ", "DE", "DG", "DJ", "DK", + "DM", "DO", "DZ", "EA", "EC", "EE", "EG", "EH", "ER", "ES", "ET", "FI", "FJ", "FK", "FM", "FO", "FR", "GA", "GB", "GD", "GE", "GF", "GG", "GH", "GI", "GL", "GM", "GN", "GP", "GQ", "GR", "GS", "GT", "GU", "GW", "GY", "HK", "HM", "HN", "HR", "HT", "HU", - "ID", "IE", "IL", "IM", "IN", "IO", "IQ", "IR", "IS", + "IC", "ID", "IE", "IL", "IM", "IN", "IO", "IQ", "IR", "IS", "IT", "JE", "JM", "JO", "JP", "KE", "KG", "KH", "KI", "KM", "KN", "KP", "KR", "KW", "KY", "KZ", "LA", "LB", "LC", "LI", "LK", "LR", "LS", "LT", "LU", @@ -342,11 +349,11 @@ static const char * const COUNTRIES[] = { "PW", "PY", "QA", "RE", "RO", "RS", "RU", "RW", "SA", "SB", "SC", "SD", "SE", "SG", "SH", "SI", "SJ", "SK", "SL", "SM", "SN", "SO", "SR", "SS", "ST", "SV", - "SX", "SY", "SZ", "TC", "TD", "TF", "TG", "TH", "TJ", + "SX", "SY", "SZ", "TA", "TC", "TD", "TF", "TG", "TH", "TJ", "TK", "TL", "TM", "TN", "TO", "TR", "TT", "TV", "TW", "TZ", "UA", "UG", "UM", "US", "UY", "UZ", "VA", "VC", "VE", "VG", "VI", "VN", "VU", "WF", - "WS", "YE", "YT", "ZA", "ZM", "ZW", + "WS", "XK", "YE", "YT", "ZA", "ZM", "ZW", NULL, "AN", "BU", "CS", "FX", "RO", "SU", "TP", "YD", "YU", "ZR", /* obsolete country codes */ NULL @@ -374,8 +381,8 @@ static const char* const REPLACEMENT_COUNTRIES[] = { * the two lists in COUNTRIES. */ static const char * const COUNTRIES_3[] = { -/* "AD", "AE", "AF", "AG", "AI", "AL", "AM", */ - "AND", "ARE", "AFG", "ATG", "AIA", "ALB", "ARM", +/* "AC", "AD", "AE", "AF", "AG", "AI", "AL", "AM", */ + "ASC", "AND", "ARE", "AFG", "ATG", "AIA", "ALB", "ARM", /* "AO", "AQ", "AR", "AS", "AT", "AU", "AW", "AX", "AZ", */ "AGO", "ATA", "ARG", "ASM", "AUT", "AUS", "ABW", "ALA", "AZE", /* "BA", "BB", "BD", "BE", "BF", "BG", "BH", "BI", */ @@ -384,12 +391,12 @@ static const char * const COUNTRIES_3[] = { "BEN", "BLM", "BMU", "BRN", "BOL", "BES", "BRA", "BHS", "BTN", "BVT", /* "BW", "BY", "BZ", "CA", "CC", "CD", "CF", "CG", */ "BWA", "BLR", "BLZ", "CAN", "CCK", "COD", "CAF", "COG", -/* "CH", "CI", "CK", "CL", "CM", "CN", "CO", "CR", */ - "CHE", "CIV", "COK", "CHL", "CMR", "CHN", "COL", "CRI", -/* "CU", "CV", "CW", "CX", "CY", "CZ", "DE", "DJ", "DK", */ - "CUB", "CPV", "CUW", "CXR", "CYP", "CZE", "DEU", "DJI", "DNK", -/* "DM", "DO", "DZ", "EC", "EE", "EG", "EH", "ER", */ - "DMA", "DOM", "DZA", "ECU", "EST", "EGY", "ESH", "ERI", +/* "CH", "CI", "CK", "CL", "CM", "CN", "CO", "CP", "CR", */ + "CHE", "CIV", "COK", "CHL", "CMR", "CHN", "COL", "CPT", "CRI", +/* "CU", "CV", "CW", "CX", "CY", "CZ", "DE", "DG", "DJ", "DK", */ + "CUB", "CPV", "CUW", "CXR", "CYP", "CZE", "DEU", "DGA", "DJI", "DNK", +/* "DM", "DO", "DZ", "EA", "EC", "EE", "EG", "EH", "ER", */ + "DMA", "DOM", "DZA", "EA ", "ECU", "EST", "EGY", "ESH", "ERI", /* no valid 3-letter code for EA */ /* "ES", "ET", "FI", "FJ", "FK", "FM", "FO", "FR", */ "ESP", "ETH", "FIN", "FJI", "FLK", "FSM", "FRO", "FRA", /* "GA", "GB", "GD", "GE", "GF", "GG", "GH", "GI", "GL", */ @@ -398,8 +405,8 @@ static const char * const COUNTRIES_3[] = { "GMB", "GIN", "GLP", "GNQ", "GRC", "SGS", "GTM", "GUM", /* "GW", "GY", "HK", "HM", "HN", "HR", "HT", "HU", */ "GNB", "GUY", "HKG", "HMD", "HND", "HRV", "HTI", "HUN", -/* "ID", "IE", "IL", "IM", "IN", "IO", "IQ", "IR", "IS" */ - "IDN", "IRL", "ISR", "IMN", "IND", "IOT", "IRQ", "IRN", "ISL", +/* "IC", "ID", "IE", "IL", "IM", "IN", "IO", "IQ", "IR", "IS" */ + "IC ", "IDN", "IRL", "ISR", "IMN", "IND", "IOT", "IRQ", "IRN", "ISL", /* no valid 3-letter code for IC */ /* "IT", "JE", "JM", "JO", "JP", "KE", "KG", "KH", "KI", */ "ITA", "JEY", "JAM", "JOR", "JPN", "KEN", "KGZ", "KHM", "KIR", /* "KM", "KN", "KP", "KR", "KW", "KY", "KZ", "LA", */ @@ -424,16 +431,16 @@ static const char * const COUNTRIES_3[] = { "SLB", "SYC", "SDN", "SWE", "SGP", "SHN", "SVN", "SJM", /* "SK", "SL", "SM", "SN", "SO", "SR", "SS", "ST", "SV", */ "SVK", "SLE", "SMR", "SEN", "SOM", "SUR", "SSD", "STP", "SLV", -/* "SX", "SY", "SZ", "TC", "TD", "TF", "TG", "TH", "TJ", */ - "SXM", "SYR", "SWZ", "TCA", "TCD", "ATF", "TGO", "THA", "TJK", +/* "SX", "SY", "SZ", "TA", "TC", "TD", "TF", "TG", "TH", "TJ", */ + "SXM", "SYR", "SWZ", "TAA", "TCA", "TCD", "ATF", "TGO", "THA", "TJK", /* "TK", "TL", "TM", "TN", "TO", "TR", "TT", "TV", */ "TKL", "TLS", "TKM", "TUN", "TON", "TUR", "TTO", "TUV", /* "TW", "TZ", "UA", "UG", "UM", "US", "UY", "UZ", */ "TWN", "TZA", "UKR", "UGA", "UMI", "USA", "URY", "UZB", /* "VA", "VC", "VE", "VG", "VI", "VN", "VU", "WF", */ "VAT", "VCT", "VEN", "VGB", "VIR", "VNM", "VUT", "WLF", -/* "WS", "YE", "YT", "ZA", "ZM", "ZW", */ - "WSM", "YEM", "MYT", "ZAF", "ZMB", "ZWE", +/* "WS", "XK", "YE", "YT", "ZA", "ZM", "ZW", */ + "WSM", "XKK", "YEM", "MYT", "ZAF", "ZMB", "ZWE", NULL, /* "AN", "BU", "CS", "FX", "RO", "SU", "TP", "YD", "YU", "ZR" */ "ANT", "BUR", "SCG", "FXX", "ROM", "SUN", "TMP", "YMD", "YUG", "ZAR", @@ -695,7 +702,7 @@ _getKeywords(const char *localeID, } /* Premature end or zero-length value */ - if (!equalSign || equalSign == semicolon) { + if (!*equalSign || equalSign == semicolon) { *status = U_INVALID_FORMAT_ERROR; return 0; } @@ -1607,7 +1614,7 @@ uloc_openKeywords(const char* localeID, #define OPTION_SET(options, mask) ((options & mask) != 0) static const char i_default[] = {'i', '-', 'd', 'e', 'f', 'a', 'u', 'l', 't'}; -#define I_DEFAULT_LENGTH (sizeof i_default / sizeof i_default[0]) +#define I_DEFAULT_LENGTH UPRV_LENGTHOF(i_default) /** * Canonicalize the given localeID, to level 1 or to level 2, @@ -1797,7 +1804,7 @@ _canonicalize(const char* localeID, /* Handle generic variants first */ if (variant) { - for (j=0; j<(int32_t)(sizeof(VARIANT_MAP)/sizeof(VARIANT_MAP[0])); j++) { + for (j=0; j 0) { collVal[len] = 0; len = uloc_getBaseName(localeID, tmpLocaleID, - sizeof(tmpLocaleID)/sizeof(tmpLocaleID[0]) - 1, &status); + UPRV_LENGTHOF(tmpLocaleID) - 1, &status); - if (U_SUCCESS(status)) { + if (U_SUCCESS(status) && len > 0) { tmpLocaleID[len] = 0; len = uloc_setKeywordValue("collation", collVal, tmpLocaleID, - sizeof(tmpLocaleID)/sizeof(tmpLocaleID[0]) - len - 1, &status); + UPRV_LENGTHOF(tmpLocaleID) - len - 1, &status); - if (U_SUCCESS(status)) { + if (U_SUCCESS(status) && len > 0) { tmpLocaleID[len] = 0; return uprv_convertToLCID(langID, tmpLocaleID, &status); } @@ -2297,7 +2304,7 @@ uloc_acceptLanguageFromHTTP(char *result, int32_t resultAvailable, UAcceptResult char *tempstr; /* Use for null pointer check */ j = smallBuffer; - jSize = sizeof(smallBuffer)/sizeof(smallBuffer[0]); + jSize = UPRV_LENGTHOF(smallBuffer); if(U_FAILURE(*status)) { return -1; } @@ -2342,7 +2349,7 @@ uloc_acceptLanguageFromHTTP(char *result, int32_t resultAvailable, UAcceptResult return -1; } j[n].locale = tempstr; - uloc_canonicalize(j[n].locale,tmp,sizeof(tmp)/sizeof(tmp[0]),status); + uloc_canonicalize(j[n].locale,tmp,UPRV_LENGTHOF(tmp),status); if(strcmp(j[n].locale,tmp)) { uprv_free(j[n].locale); j[n].locale=uprv_strdup(tmp); @@ -2468,7 +2475,7 @@ uloc_acceptLanguage(char *result, int32_t resultAvailable, } uenum_reset(availableLocales, status); /* save off parent info */ - if(uloc_getParent(acceptList[i], tmp, sizeof(tmp)/sizeof(tmp[0]), status)!=0) { + if(uloc_getParent(acceptList[i], tmp, UPRV_LENGTHOF(tmp), status)!=0) { fallbackList[i] = uprv_strdup(tmp); } else { fallbackList[i]=0; @@ -2505,7 +2512,7 @@ uloc_acceptLanguage(char *result, int32_t resultAvailable, } uenum_reset(availableLocales, status); - if(uloc_getParent(fallbackList[i], tmp, sizeof(tmp)/sizeof(tmp[0]), status)!=0) { + if(uloc_getParent(fallbackList[i], tmp, UPRV_LENGTHOF(tmp), status)!=0) { uprv_free(fallbackList[i]); fallbackList[i] = uprv_strdup(tmp); } else { @@ -2525,4 +2532,104 @@ uloc_acceptLanguage(char *result, int32_t resultAvailable, return -1; } +U_CAPI const char* U_EXPORT2 +uloc_toUnicodeLocaleKey(const char* keyword) +{ + const char* bcpKey = ulocimp_toBcpKey(keyword); + if (bcpKey == NULL && ultag_isUnicodeLocaleKey(keyword, -1)) { + // unknown keyword, but syntax is fine.. + return keyword; + } + return bcpKey; +} + +U_CAPI const char* U_EXPORT2 +uloc_toUnicodeLocaleType(const char* keyword, const char* value) +{ + const char* bcpType = ulocimp_toBcpType(keyword, value, NULL, NULL); + if (bcpType == NULL && ultag_isUnicodeLocaleType(value, -1)) { + // unknown keyword, but syntax is fine.. + return value; + } + return bcpType; +} + +#define UPRV_ISDIGIT(c) (((c) >= '0') && ((c) <= '9')) +#define UPRV_ISALPHANUM(c) (uprv_isASCIILetter(c) || UPRV_ISDIGIT(c) ) + +static UBool +isWellFormedLegacyKey(const char* legacyKey) +{ + const char* p = legacyKey; + while (*p) { + if (!UPRV_ISALPHANUM(*p)) { + return FALSE; + } + p++; + } + return TRUE; +} + +static UBool +isWellFormedLegacyType(const char* legacyType) +{ + const char* p = legacyType; + int32_t alphaNumLen = 0; + while (*p) { + if (*p == '_' || *p == '/' || *p == '-') { + if (alphaNumLen == 0) { + return FALSE; + } + alphaNumLen = 0; + } else if (UPRV_ISALPHANUM(*p)) { + alphaNumLen++; + } else { + return FALSE; + } + p++; + } + return (alphaNumLen != 0); +} + +U_CAPI const char* U_EXPORT2 +uloc_toLegacyKey(const char* keyword) +{ + const char* legacyKey = ulocimp_toLegacyKey(keyword); + if (legacyKey == NULL) { + // Checks if the specified locale key is well-formed with the legacy locale syntax. + // + // Note: + // Neither ICU nor LDML/CLDR provides the definition of keyword syntax. + // However, a key should not contain '=' obviously. For now, all existing + // keys are using ASCII alphabetic letters only. We won't add any new key + // that is not compatible with the BCP 47 syntax. Therefore, we assume + // a valid key consist from [0-9a-zA-Z], no symbols. + if (isWellFormedLegacyKey(keyword)) { + return keyword; + } + } + return legacyKey; +} + +U_CAPI const char* U_EXPORT2 +uloc_toLegacyType(const char* keyword, const char* value) +{ + const char* legacyType = ulocimp_toLegacyType(keyword, value, NULL, NULL); + if (legacyType == NULL) { + // Checks if the specified locale type is well-formed with the legacy locale syntax. + // + // Note: + // Neither ICU nor LDML/CLDR provides the definition of keyword syntax. + // However, a type should not contain '=' obviously. For now, all existing + // types are using ASCII alphabetic letters with a few symbol letters. We won't + // add any new type that is not compatible with the BCP 47 syntax except timezone + // IDs. For now, we assume a valid type start with [0-9a-zA-Z], but may contain + // '-' '_' '/' in the middle. + if (isWellFormedLegacyType(value)) { + return value; + } + } + return legacyType; +} + /*eof*/