]>
Commit | Line | Data |
---|---|---|
f3c0d7a5 A |
1 | # © 2016 and later: Unicode, Inc. and others. |
2 | # License & terms of use: http://www.unicode.org/copyright.html#License | |
3 | # | |
729e4ab9 | 4 | # File: es_FONIPA_zh.txt |
f3c0d7a5 | 5 | # Generated from CLDR |
729e4ab9 | 6 | # |
2ca993e8 A |
7 | |
8 | # Tranforms Spanish to Mandarin Chinese. The input Spanish string must be in | |
9 | # phonemic IPA transcription (es_FONIPA); the output is in Simplified Chinese. | |
729e4ab9 | 10 | $word_boundary = [-\ $]; |
51004dcb | 11 | $vowel = [aeijouw]; # Vowels and glides |
729e4ab9 | 12 | $not_vowel = [^$vowel]; |
2ca993e8 | 13 | # First pass: Collapse phonetic distinctions not preserved in Mandarin. |
729e4ab9 A |
14 | ð → | d; |
15 | ɣ → | g; | |
16 | ŋ → | n; | |
17 | θ → | s; | |
18 | ɾ → | r; | |
19 | ff → f ; | |
20 | kk → k ; | |
21 | mm → m ; | |
22 | nn → n ; | |
23 | pp → p ; | |
24 | tt → t ; | |
25 | tʧ → ʧ ; | |
26 | aa → a ; | |
27 | oi\u032F → oi ; | |
28 | oo → o ; | |
29 | uu → u ; | |
30 | [^dgktx] { ei\u032F → e ; | |
31 | [^-\ .$] { eu\u032F → eu ; | |
32 | [^-\ .$] { ou\u032F → o; | |
51004dcb A |
33 | [^j] { ui → wi ; |
34 | [^$word_boundary] { m } [bp] → n; # GB/T 17693.5-2009, 5.3.2 | |
35 | s[θs] → s; # GB/T 17693.5-2009, 5.3.4 | |
36 | [^ʧ] { jo → io; # GB/T 17693.5-2009 表 1, 注 7 | |
729e4ab9 | 37 | ::Null; |
51004dcb | 38 | j } an $not_vowel → i ; # GB/T 17693.5-2009 表 1, 注 8 |
2ca993e8 A |
39 | # GB/T 17693.5-2009 表 1, 注 8 also says that <uai> should be treated as if |
40 | # it was <u> plus <ai>. This is not borne out by the observed data, which | |
41 | # suggests that <ua> plus <i> is the more appropriate choice in some | |
42 | # situations. | |
729e4ab9 A |
43 | [g.$] { wai\u032F → wai ; |
44 | wai\u032F → uai\u032F ; | |
45 | [g.$] { wau\u032F → wau ; | |
46 | wau\u032F → uau\u032F ; | |
47 | jau\u032F → iau\u032F ; | |
2ca993e8 | 48 | # Even though "ao" is not a diphthong in Spanish, Mandarin treats it as one. |
51004dcb | 49 | [^jw] { ao } [^n] → au\u032F ; |
729e4ab9 | 50 | [^jw] { ao } n $vowel → au\u032F ; |
2ca993e8 A |
51 | # Main pass: Phoneme to Hanzi conversion. |
52 | # This generally follows GB/T 17693.5-2009 表 1, unless otherwise noted. | |
729e4ab9 A |
53 | ::Null; |
54 | '.' → ; | |
55 | ai\u032F → 艾 ; | |
56 | an } $not_vowel → 安 ; | |
57 | au\u032F → 奥 ; | |
58 | a → 阿 ; | |
59 | bai\u032F → 拜 ; | |
60 | ban } $not_vowel → 班 ; | |
61 | bau\u032F → 包 ; | |
62 | ba → 巴 ; | |
63 | ben } $not_vowel → 本 ; | |
64 | be → 贝 ; | |
65 | bin } $not_vowel → 宾 ; | |
66 | bi → 比 ; | |
67 | bja → 比亚 ; | |
68 | bjen } $not_vowel → 比恩 ; | |
69 | bje → 别 ; | |
70 | bju → 比乌 ; | |
71 | bon } $not_vowel → 邦 ; | |
72 | bo → 博 ; | |
73 | bun } $not_vowel → 本 ; | |
74 | bu → 布 ; | |
75 | bwan } $not_vowel → 布安 ; | |
76 | bwa → 布阿 ; | |
51004dcb | 77 | bwen } $not_vowel → 布恩 ; # Should be be 本, per GB/T 17693.5-2009 表 1. |
729e4ab9 | 78 | bwe → 布埃 ; |
51004dcb | 79 | bwin } $not_vowel → 布因 ; # Nonstandard, but fits observed data. |
729e4ab9 A |
80 | bwi → 布伊 ; |
81 | bwo → 博 ; | |
82 | b → 布 ; | |
83 | βai\u032F → 瓦伊 ; | |
84 | βan } $not_vowel → 万 ; | |
85 | βau\u032F → 沃 ; | |
86 | βa → 瓦 ; | |
87 | βen } $not_vowel → 文 ; | |
88 | βe → 韦 ; | |
89 | βin } $not_vowel → 温 ; | |
90 | βi → 维 ; | |
91 | βja → 维亚 ; | |
92 | βjen } $not_vowel → 维恩 ; | |
93 | βje → 维耶 ; | |
94 | βju → 维乌 ; | |
95 | βon } $not_vowel → 翁 ; | |
96 | βo → 沃 ; | |
97 | βun } $not_vowel → 文 ; | |
98 | βu → 武 ; | |
99 | βwan } $not_vowel → 万 ; | |
100 | βwa → 瓦 ; | |
101 | βwen } $not_vowel → 文 ; | |
102 | βwe → 武埃 ; | |
103 | βwi → 维 ; | |
104 | βwo → 沃 ; | |
105 | β → 夫 ; | |
106 | dai\u032F → 代 ; | |
107 | dan } $not_vowel → 丹 ; | |
108 | dau\u032F → 道 ; | |
109 | da → 达 ; | |
110 | dei\u032F → 代 ; | |
111 | den } $not_vowel → 登 ; | |
112 | de → 德 ; | |
113 | din } $not_vowel → 丁 ; | |
114 | di → 迪 ; | |
115 | dja → 迪亚 ; | |
116 | djen } $not_vowel → 迪恩 ; | |
117 | dje → 迭 ; | |
118 | dju → 迪乌 ; | |
119 | don } $not_vowel → 东 ; | |
120 | do → 多 ; | |
121 | dun } $not_vowel → 敦 ; | |
122 | du → 杜 ; | |
123 | dwan } $not_vowel → 端 ; | |
124 | dwa → 杜阿 ; | |
125 | dwen } $not_vowel → 敦 ; | |
126 | dwe → 杜埃 ; | |
127 | dwi → 杜伊 ; | |
128 | dwo → 多 ; | |
129 | d } $word_boundary → ; | |
130 | d → 德 ; | |
131 | ei\u032F → 埃 ; | |
132 | en } $not_vowel → 恩 ; | |
133 | eu\u032F → 欧 ; | |
134 | e → 埃 ; | |
135 | fai\u032F → 法伊 ; | |
136 | fan } $not_vowel → 凡 ; | |
137 | fau\u032F → 福 ; | |
138 | fa → 法 ; | |
139 | fe → 费 ; | |
140 | fin } $not_vowel → 芬 ; | |
141 | fi → 菲 ; | |
142 | fja → 菲亚 ; | |
143 | fjen } $not_vowel → 菲恩 ; | |
144 | fje → 菲耶 ; | |
145 | fju → 菲乌 ; | |
146 | fon } $not_vowel → 丰 ; | |
147 | fo → 福 ; | |
148 | fun } $not_vowel → 丰 ; | |
149 | fu → 富 ; | |
150 | fwan } $not_vowel → 富安 ; | |
151 | fwa → 富阿 ; | |
152 | fwen } $not_vowel → 丰 ; | |
153 | fwe → 富埃 ; | |
154 | fwi → 富伊 ; | |
155 | fwo → 福 ; | |
2ca993e8 A |
156 | # The choice of 弗 vs. 夫 sounds simple according to the GB/T standard, but the |
157 | # data suggest otherwise. Ideally, 弗 should occur at the beginning of a | |
158 | # morpheme (e.g. in "villafranca" 比利亚弗兰卡) and 夫 everywhere else. Since | |
159 | # we don't have morpheme boundaries, we'll fudge it by writing 夫 at the end of | |
160 | # a word and 弗 everywhere else. | |
729e4ab9 A |
161 | f } $word_boundary → 夫 ; |
162 | f → 弗 ; | |
163 | gai\u032F → 盖 ; | |
164 | gan } $not_vowel → 甘 ; | |
165 | gau\u032F → 高 ; | |
166 | ga → 加 ; | |
167 | gei\u032F → 盖 ; | |
168 | gen } $not_vowel → 根 ; | |
169 | ge → 格 ; | |
170 | gin } $not_vowel → 金 ; | |
171 | gi → 吉 ; | |
172 | gja → 吉亚 ; | |
173 | gjen } $not_vowel → 吉恩 ; | |
174 | gje → 吉耶 ; | |
175 | gju → 吉乌 ; | |
176 | gon } $not_vowel → 贡 ; | |
177 | go → 戈 ; | |
178 | gun } $not_vowel → 贡 ; | |
179 | gu → 古 ; | |
51004dcb | 180 | gwan } [$] → 古安 ; # Nonstandard, but fits observed data. |
729e4ab9 A |
181 | gwan } $not_vowel → 关 ; |
182 | gwa → 瓜 ; | |
183 | gwen } $not_vowel → 古恩 ; | |
184 | gwe → 圭 ; | |
185 | gwi → 圭 ; | |
186 | gwo → 果 ; | |
187 | g → 格 ; | |
188 | in } $not_vowel → 因 ; | |
189 | i → 伊 ; | |
190 | ʝai\u032F → 亚伊 ; | |
191 | ʝan } $not_vowel → 扬 ; | |
192 | ʝau\u032F → 尧 ; | |
193 | ʝa → 亚 ; | |
194 | ʝen } $not_vowel → 延 ; | |
195 | ʝe → 耶 ; | |
196 | ʝin } $not_vowel → 因 ; | |
197 | ʝi → 伊 ; | |
198 | ʝon } $not_vowel → 永 ; | |
199 | ʝo → 约 ; | |
200 | ʝun } $not_vowel → 云 ; | |
201 | ʝu → 尤 ; | |
202 | ʝwan } $not_vowel → 元 ; | |
203 | ʝwa → 尤阿 ; | |
204 | ʝwen } $not_vowel → 云 ; | |
205 | ʝwe → 尤埃 ; | |
206 | ʝwi → 尤伊 ; | |
207 | ʝwo → 约 ; | |
208 | ʝ → 伊 ; | |
209 | kai\u032F → 凯 ; | |
210 | kan } $not_vowel → 坎 ; | |
211 | kau\u032F → 考 ; | |
212 | ka → 卡 ; | |
213 | kei\u032F → 凯 ; | |
214 | ken } $not_vowel → 肯 ; | |
215 | ke → 克 ; | |
216 | kin } $not_vowel → 金 ; | |
217 | ki → 基 ; | |
218 | kja → 基亚 ; | |
219 | kjen } $not_vowel → 基恩 ; | |
220 | kje → 基耶 ; | |
221 | kju → 基乌 ; | |
222 | kon } $not_vowel → 孔 ; | |
223 | ko → 科 ; | |
224 | kun } $not_vowel → 昆 ; | |
225 | ku → 库 ; | |
226 | kwan } $not_vowel → 宽 ; | |
227 | kwa → 夸 ; | |
228 | kwen } $not_vowel → 昆 ; | |
229 | kwe → 库埃 ; | |
230 | kwin } $not_vowel → 昆 ; | |
231 | kwi → 奎 ; | |
232 | kwo → 阔 ; | |
233 | k → 克 ; | |
234 | lae } [^n] → 莱 ; | |
235 | lai\u032F → 莱 ; | |
236 | lan } $not_vowel → 兰 ; | |
237 | lau\u032F → 劳 ; | |
238 | la → 拉 ; | |
239 | len } $not_vowel → 伦 ; | |
240 | le → 莱 ; | |
241 | lin } $not_vowel → 林 ; | |
242 | li → 利 ; | |
243 | lja → 利亚 ; | |
244 | ljen } $not_vowel → 连 ; | |
245 | lje → 列 ; | |
246 | lju → 柳 ; | |
247 | lon } $not_vowel → 隆 ; | |
248 | lo → 洛 ; | |
249 | lun } $not_vowel → 伦 ; | |
250 | lu → 卢 ; | |
251 | lwan } $not_vowel → 卢安 ; | |
252 | lwa → 卢阿 ; | |
253 | lwen } $not_vowel → 伦 ; | |
254 | lwe → 卢埃 ; | |
255 | lwi → 卢伊 ; | |
256 | lwo → 洛 ; | |
257 | l → 尔 ; | |
258 | ʎan } $not_vowel → 良 ; | |
259 | ʎau\u032F → 廖 ; | |
260 | ʎa → 利亚 ; | |
261 | ʎen } $not_vowel → 连 ; | |
262 | ʎe → 列 ; | |
263 | ʎin } $not_vowel → 林 ; | |
264 | ʎi → 利 ; | |
265 | ʎon } $not_vowel → 利翁 ; | |
266 | ʎo → 略 ; | |
267 | ʎu → 柳 ; | |
268 | ʎwan } $not_vowel → 柳安 ; | |
269 | ʎwa → 柳阿 ; | |
270 | ʎwen } $not_vowel → 柳恩 ; | |
271 | ʎwe → 柳埃 ; | |
272 | ʎwi → 柳伊 ; | |
273 | ʎwo → 略 ; | |
274 | ʎ → 尔 ; | |
275 | mai\u032F → 迈 ; | |
276 | man } $not_vowel → 曼 ; | |
277 | martin → 马丁 ; | |
278 | mau\u032F → 毛 ; | |
279 | ma → 马 ; | |
280 | men } $not_vowel → 门 ; | |
281 | me → 梅 ; | |
282 | min } $not_vowel → 明 ; | |
283 | mi → 米 ; | |
284 | mja → 米亚 ; | |
285 | mjen } $not_vowel → 缅 ; | |
286 | mje → 米耶 ; | |
287 | mju → 缪 ; | |
288 | mon } $not_vowel → 蒙 ; | |
289 | mo → 莫 ; | |
290 | mun } $not_vowel → 蒙 ; | |
291 | mu → 穆 ; | |
292 | mwan } $not_vowel → 穆安 ; | |
293 | mwa → 穆阿 ; | |
294 | mwen } $not_vowel → 门 ; | |
295 | mwe → 穆埃 ; | |
51004dcb | 296 | mwin } $not_vowel → 穆因 ; # Nonstandard, but fits observed data. |
729e4ab9 A |
297 | mwi → 穆伊 ; |
298 | mwo → 莫 ; | |
299 | m → 姆 ; | |
300 | nai\u032F → 奈 ; | |
301 | nan } $not_vowel → 南 ; | |
302 | nau\u032F → 瑙 ; | |
303 | na → 纳 ; | |
304 | nen } $not_vowel → 嫩 ; | |
305 | ne → 内 ; | |
306 | nin } $not_vowel → 宁 ; | |
307 | ni → 尼 ; | |
308 | nja → 尼亚 ; | |
309 | njen } $not_vowel → 年 ; | |
310 | nje → 涅 ; | |
311 | nju → 纽 ; | |
312 | non } $not_vowel → 农 ; | |
313 | no → 诺 ; | |
314 | nun } $not_vowel → 嫩 ; | |
315 | nu → 努 ; | |
316 | nwan } $not_vowel → 努安 ; | |
317 | nwa → 努阿 ; | |
318 | nwen } $not_vowel → 农 ; | |
319 | nwe → 努埃 ; | |
320 | nwi → 努伊 ; | |
321 | nwo → 诺 ; | |
322 | n → 恩 ; | |
323 | ɲan } $not_vowel → 尼扬 ; | |
324 | ɲau\u032F → 尼奥 ; | |
325 | ɲa → 尼亚 ; | |
326 | ɲen } $not_vowel → 年 ; | |
327 | ɲe → 涅 ; | |
328 | ɲin } $not_vowel → 宁 ; | |
329 | ɲi → 尼 ; | |
330 | ɲon } $not_vowel → 尼翁 ; | |
331 | ɲo → 尼奥 ; | |
332 | ɲu → 纽 ; | |
333 | ɲwan } $not_vowel → 纽安 ; | |
334 | ɲwa → 纽阿 ; | |
335 | ɲwen } $not_vowel → 纽恩 ; | |
336 | ɲwe → 纽埃 ; | |
337 | ɲwi → 纽伊 ; | |
338 | ɲwo → 尼奥 ; | |
339 | on } $not_vowel → 翁 ; | |
340 | ou\u032F → 欧 ; | |
341 | o → 奥 ; | |
342 | pai\u032F → 派 ; | |
343 | pan } $not_vowel → 潘 ; | |
344 | pau\u032F → 保 ; | |
345 | pa → 帕 ; | |
346 | pen } $not_vowel → 彭 ; | |
347 | pe → 佩 ; | |
348 | pin } $not_vowel → 平 ; | |
349 | pi → 皮 ; | |
350 | pja → 皮亚 ; | |
351 | pjen } $not_vowel → 皮恩 ; | |
352 | pje → 彼 ; | |
353 | pju → 皮乌 ; | |
354 | pon } $not_vowel → 蓬 ; | |
355 | po → 波 ; | |
356 | pun } $not_vowel → 蓬 ; | |
357 | pu → 普 ; | |
358 | pwan } $not_vowel → 普安 ; | |
359 | pwa → 普阿 ; | |
360 | pwen } $not_vowel → 蓬 ; | |
361 | pwe → 普埃 ; | |
362 | pwi → 普伊 ; | |
363 | pwo → 波 ; | |
364 | p → 普 ; | |
365 | rai\u032F → 赖 ; | |
366 | ran } $not_vowel → 兰 ; | |
367 | rau\u032F → 劳 ; | |
368 | ra → 拉 ; | |
369 | ren } $not_vowel → 伦 ; | |
370 | re → 雷 ; | |
371 | rin } $not_vowel → 林 ; | |
372 | ri → 里 ; | |
373 | rja → 里亚 ; | |
374 | rjen } $not_vowel → 连 ; | |
375 | rje → 列 ; | |
376 | rju → 留 ; | |
377 | ron } $not_vowel → 龙 ; | |
378 | ro → 罗 ; | |
379 | run } $not_vowel → 伦 ; | |
380 | ru → 鲁 ; | |
381 | rwan } $not_vowel → 鲁安 ; | |
382 | rwa → 鲁阿 ; | |
383 | rwen } $not_vowel → 伦 ; | |
384 | rwe → 鲁埃 ; | |
385 | rwi → 鲁伊 ; | |
386 | rwo → 罗 ; | |
387 | r → R ; | |
388 | sai\u032F → 赛 ; | |
389 | san } $not_vowel → 桑 ; | |
390 | sau\u032F → 绍 ; | |
391 | sa → 萨 ; | |
392 | sen } $not_vowel → 森 ; | |
393 | se → 塞 ; | |
394 | sin } $not_vowel → 辛 ; | |
395 | si → 西 ; | |
396 | sja → 西亚 ; | |
397 | sjen } $not_vowel → 先 ; | |
398 | sje → 谢 ; | |
399 | sju → 休 ; | |
400 | son } $not_vowel → 松 ; | |
401 | so → 索 ; | |
402 | sun } $not_vowel → 孙 ; | |
403 | su → 苏 ; | |
404 | swan } $not_vowel → 苏安 ; | |
405 | swa → 苏阿 ; | |
406 | swen } $not_vowel → 孙 ; | |
407 | swe → 苏埃 ; | |
408 | swi → 绥 ; | |
409 | swo → 索 ; | |
410 | s → 斯 ; | |
411 | tai\u032F → 泰 ; | |
412 | tan } $not_vowel → 坦 ; | |
413 | tau\u032F → 陶 ; | |
414 | ta → 塔 ; | |
415 | tei\u032F → 泰 ; | |
416 | ten } $not_vowel → 滕 ; | |
417 | te → 特 ; | |
418 | tin } $not_vowel → 廷 ; | |
419 | ti → 蒂 ; | |
420 | tja → 蒂亚 ; | |
421 | tjen } $not_vowel → 蒂恩 ; | |
422 | tje → 铁 ; | |
423 | tju → 蒂乌 ; | |
424 | ton } $not_vowel → 通 ; | |
425 | to → 托 ; | |
2ca993e8 A |
426 | # The rules for /ts/ (tz in the orthography) are nonstandard and derived |
427 | # entirely from the observed data. They apply mostly to native toponyms | |
428 | # in Mexico. | |
729e4ab9 A |
429 | tsa → 察 ; |
430 | tsen } $not_vowel → 岑 ; | |
431 | tse → 采 ; | |
432 | tsin } $not_vowel → 钦 ; | |
433 | tsi → 齐 ; | |
434 | tso → 措 ; | |
435 | tsun } $not_vowel → 聪 ; | |
436 | tsu → 楚 ; | |
437 | ts → 茨 ; | |
438 | tun } $not_vowel → 通 ; | |
439 | tu → 图 ; | |
51004dcb | 440 | twan } $not_vowel → 图安 ; |
729e4ab9 A |
441 | twa → 图阿 ; |
442 | twen } $not_vowel → 通 ; | |
443 | twe → 图埃 ; | |
444 | twi → 图伊 ; | |
445 | two → 托 ; | |
446 | t → 特 ; | |
447 | ʧai\u032F → 柴 ; | |
448 | ʧan } $not_vowel → 钱 ; | |
449 | ʧau\u032F → 乔 ; | |
450 | ʧa → 查 ; | |
451 | ʧen } $not_vowel → 琴 ; | |
452 | ʧe → 切 ; | |
453 | ʧin } $not_vowel → 钦 ; | |
454 | ʧi → 奇 ; | |
455 | ʧjan } $not_vowel → 钱 ; | |
456 | ʧja → 恰 ; | |
457 | ʧjen } $not_vowel → 钱 ; | |
458 | ʧje → 切 ; | |
459 | ʧjon } $not_vowel → 琼 ; | |
460 | ʧju → 丘 ; | |
461 | ʧon } $not_vowel → 琼 ; | |
462 | ʧo → 乔 ; | |
51004dcb | 463 | ʧun } $not_vowel → 琼 ; # Should be 春, per GB/T 17693.5-2009 表 1. |
729e4ab9 A |
464 | ʧu → 丘 ; |
465 | ʧwan } $not_vowel → 丘安 ; | |
466 | ʧwa → 丘阿 ; | |
467 | ʧwen } $not_vowel → 琼 ; | |
468 | ʧwe → 丘埃 ; | |
469 | ʧwi → 崔 ; | |
470 | ʧwo → 乔 ; | |
471 | ʧ → 奇 ; | |
472 | un } $not_vowel → 温 ; | |
473 | u → 乌 ; | |
474 | wan } $not_vowel → 万 ; | |
475 | wa → 瓦 ; | |
476 | wen } $not_vowel → 温 ; | |
477 | we → 韦 ; | |
478 | win } $not_vowel → 温 ; | |
479 | wi → 维 ; | |
51004dcb | 480 | won } $not_vowel → 翁 ; # Unseen. |
729e4ab9 A |
481 | wo → 沃 ; |
482 | xai\u032F → 海 ; | |
483 | xan } $not_vowel → 汉 ; | |
484 | xau\u032F → 豪 ; | |
485 | xa → 哈 ; | |
486 | xei\u032F → 黑 ; | |
487 | xen } $not_vowel → 亨 ; | |
488 | xe → 赫 ; | |
489 | xin } $not_vowel → 欣 ; | |
490 | xi → 希 ; | |
491 | xja → 希亚 ; | |
492 | xjen } $not_vowel → 希恩 ; | |
493 | xje → 希耶 ; | |
494 | xju → 休 ; | |
495 | xon } $not_vowel → 洪 ; | |
496 | xo → 霍 ; | |
497 | xun } $not_vowel → 洪 ; | |
498 | xu → 胡 ; | |
499 | xwan } $not_vowel → 胡安 ; | |
500 | xwa → 华 ; | |
501 | xwen } $not_vowel → 洪 ; | |
502 | xwe → 胡埃 ; | |
503 | xwi → 惠 ; | |
504 | xwo → 霍 ; | |
505 | x → 赫 ; | |
2ca993e8 A |
506 | # 尔 simplification pass. The idea is to drop most occurences of 尔 |
507 | # corresponding to <r> (not to <l> or <ll>) from a word if there is another /l/ | |
508 | # sound nearby. There is a vague pattern like this in the data, but the details | |
509 | # remain to be determined. At the moment, this does nothing, it just puts 尔 in | |
510 | # for every <r> in a syllable coda. | |
729e4ab9 A |
511 | ::Null; |
512 | $r = [R利拉]; | |
2ca993e8 A |
513 | # |
514 | # | |
515 | # R } . $r → ; | |
516 | # R } .. $r → ; | |
517 | # R } ... $r → ; | |
518 | # R } .... $r → ; | |
729e4ab9 | 519 | R → 尔 ; |
2ca993e8 A |
520 | # Dong-nan-xi-hai pass. Per GB/T 17693.5-2009 表 1, 注 4, replace confusing |
521 | # characters at the beginning and end of a word. | |
729e4ab9 A |
522 | ::Null; |
523 | $word_boundary { 东 → 栋 ; | |
524 | $word_boundary { 南 → 楠 ; | |
525 | $word_boundary { 西 → 锡 ; | |
526 | 海 } $word_boundary → 亥 ; | |
527 | ::NFC; | |
2ca993e8 | 528 |