1 # © 2016 and later: Unicode, Inc. and others.
2 # License & terms of use: http://www.unicode.org/copyright.html#License
8 # Transliteration of Russian into Mandarin written in simplified Chinese.
10 # TODO(mjansche): Implement exception rules from GB/T 17693.4-2009 section 5.3.
11 # TODO(anyone): Simplify.
12 $bow = [-\ $]; # Word boundary.
13 $vowel = [аеийоуыьэюяё];
14 $not_vowel = [^$vowel];
47 ## иа → я; ## TODO: Figure out if/when this applies.
52 # Special exceptions, per GB/T 17693.4-2009 表 1, 注 8:
67 бан } $not_vowel → 班 ;
71 бен } $not_vowel → 边 ;
74 бин } $not_vowel → 宾 ;
77 бон } $not_vowel → 邦 ;
80 бун } $not_vowel → 本 ;
83 бын } $not_vowel → 本 ;
89 бэн } $not_vowel → 本 ;
92 бян } $not_vowel → 比扬 ;
98 ван } $not_vowel → 万 ;
102 вен } $not_vowel → 文 ;
105 вин } $not_vowel → 温 ;
108 вон } $not_vowel → 翁 ;
111 вун } $not_vowel → 文 ;
114 вын } $not_vowel → 文 ;
120 вэн } $not_vowel → 文 ;
123 вян } $not_vowel → 维扬 ;
129 ган } $not_vowel → 甘 ;
133 ген } $not_vowel → 根 ;
136 гин } $not_vowel → 金 ;
139 гон } $not_vowel → 贡 ;
142 гун } $not_vowel → 贡 ;
145 гын } $not_vowel → 根 ;
151 гэн } $not_vowel → 根 ;
154 гян } $not_vowel → 吉扬 ;
160 дан } $not_vowel → 丹 ;
164 ден } $not_vowel → 坚 ;
168 джан } $not_vowel → 占 ;
172 джен } $not_vowel → 真 ;
175 джин } $not_vowel → 金 ;
178 джон } $not_vowel → 忠 ;
181 джун } $not_vowel → 准 ;
184 джын } $not_vowel → 真 ;
190 джэн } $not_vowel → 真 ;
193 джян } $not_vowel → 江 ;
199 дзан } $not_vowel → 赞 ;
203 дзен } $not_vowel → 津 ;
206 дзин } $not_vowel → 津 ;
209 дзон } $not_vowel → 宗 ;
212 дзун } $not_vowel → 尊 ;
215 дзын } $not_vowel → 曾 ;
221 дзэн } $not_vowel → 曾 ;
224 дзян } $not_vowel → 江 ;
229 дин } $not_vowel → 金 ;
232 дон } $not_vowel → 东 ;
236 дсан } $not_vowel → 灿 ;
240 дсен } $not_vowel → 岑 ;
243 дсин } $not_vowel → 钦 ;
245 дсон } $not_vowel → 聪 ;
248 дсун } $not_vowel → 聪 ;
251 дсын } $not_vowel → 岑 ;
257 дсэн } $not_vowel → 岑 ;
263 дун } $not_vowel → 敦 ;
267 дцан } $not_vowel → 灿 ;
271 дцен } $not_vowel → 岑 ;
274 дцин } $not_vowel → 钦 ;
276 дцон } $not_vowel → 聪 ;
279 дцун } $not_vowel → 聪 ;
282 дцын } $not_vowel → 岑 ;
288 дцэн } $not_vowel → 岑 ;
295 дчан } $not_vowel → 昌 ;
299 дчен } $not_vowel → 琴 ;
302 дчин } $not_vowel → 钦 ;
305 дчон } $not_vowel → 琼 ;
308 дчун } $not_vowel → 春 ;
311 дчын } $not_vowel → 琴 ;
316 дчэн } $not_vowel → 琴 ;
318 дчян } $not_vowel → 强 ;
322 дын } $not_vowel → 登 ;
328 дэн } $not_vowel → 登 ;
330 дюн } $not_vowel → 久恩 ;
332 дян } $not_vowel → 江 ;
336 ен } $not_vowel → 延 ;
340 жан } $not_vowel → 然 ;
344 жен } $not_vowel → 任 ;
347 жин } $not_vowel → 任 ;
350 жон } $not_vowel → 容 ;
353 жун } $not_vowel → 容 ;
356 жын } $not_vowel → 任 ;
362 жэн } $not_vowel → 任 ;
365 жян } $not_vowel → 让 ;
371 зан } $not_vowel → 赞 ;
375 зен } $not_vowel → 津 ;
378 зин } $not_vowel → 津 ;
381 зон } $not_vowel → 宗 ;
384 зун } $not_vowel → 尊 ;
387 зын } $not_vowel → 曾 ;
393 зэн } $not_vowel → 曾 ;
396 зян } $not_vowel → 江 ;
401 ин } $not_vowel → 因 ;
407 кан } $not_vowel → 坎 ;
411 кен } $not_vowel → 肯 ;
414 кин } $not_vowel → 金 ;
417 кон } $not_vowel → 孔 ;
420 кун } $not_vowel → 昆 ;
423 кын } $not_vowel → 肯 ;
429 кэн } $not_vowel → 肯 ;
432 кян } $not_vowel → 基扬 ;
438 лан } $not_vowel → 兰 ;
442 лен } $not_vowel → 连 ;
445 лин } $not_vowel → 林 ;
448 лон } $not_vowel → 隆 ;
451 лун } $not_vowel → 伦 ;
454 лын } $not_vowel → 伦 ;
460 лэн } $not_vowel → 伦 ;
463 лян } $not_vowel → 良 ;
467 ## $not_vowel { л → 勒 ; ## FIXME: Figure out if/when this applies.
471 ман } $not_vowel → 曼 ;
475 мен } $not_vowel → 缅 ;
478 мин } $not_vowel → 明 ;
481 мон } $not_vowel → 蒙 ;
484 мун } $not_vowel → 蒙 ;
487 мын } $not_vowel → 门 ;
493 мэн } $not_vowel → 门 ;
495 мюн } $not_vowel → 敏 ;
497 мян } $not_vowel → 米扬 ;
503 нан } $not_vowel → 南 ;
507 нен } $not_vowel → 年 ;
510 нин } $not_vowel → 宁 ;
513 нон } $not_vowel → 农 ;
516 нун } $not_vowel → 农 ;
519 нын } $not_vowel → 嫩 ;
521 нь } $not_vowel → 尼 ;
523 нэн } $not_vowel → 嫩 ;
525 нюн } $not_vowel → 纽恩 ;
527 нян } $not_vowel → 尼扬 ;
531 он } $not_vowel → 翁 ;
535 пан } $not_vowel → 潘 ;
539 пен } $not_vowel → 片 ;
542 пин } $not_vowel → 平 ;
545 пон } $not_vowel → 蓬 ;
548 пун } $not_vowel → 蓬 ;
551 пын } $not_vowel → 彭 ;
557 пэн } $not_vowel → 彭 ;
560 пян } $not_vowel → 皮扬 ;
566 ран } $not_vowel → 兰 ;
570 рен } $not_vowel → 连 ;
573 рин } $not_vowel → 林 ;
576 рон } $not_vowel → 龙 ;
579 рун } $not_vowel → 伦 ;
582 рын } $not_vowel → 伦 ;
588 рэн } $not_vowel → 伦 ;
591 рян } $not_vowel → 良 ;
595 ## $not_vowel { р → 勒 ; ## FIXME: Figure out if/when this applies.
599 сан } $not_vowel → 桑 ;
603 сен } $not_vowel → 先 ;
606 син } $not_vowel → 辛 ;
609 сон } $not_vowel → 松 ;
612 сун } $not_vowel → 孙 ;
616 счан } $not_vowel → 先 ;
620 счен } $not_vowel → 先 ;
623 счин } $not_vowel → 辛 ;
626 счон } $not_vowel → 雄 ;
629 счун } $not_vowel → 逊 ;
631 счын } $not_vowel → 欣 ;
635 счэн } $not_vowel → 欣 ;
640 сын } $not_vowel → 森 ;
646 сэн } $not_vowel → 森 ;
648 сюн } $not_vowel → 雄 ;
650 сян } $not_vowel → 相 ;
656 тан } $not_vowel → 坦 ;
660 тен } $not_vowel → 坚 ;
663 тин } $not_vowel → 京 ;
666 тон } $not_vowel → 通 ;
670 тсан } $not_vowel → 灿 ;
674 тсен } $not_vowel → 岑 ;
677 тсин } $not_vowel → 钦 ;
679 тсон } $not_vowel → 聪 ;
682 тсун } $not_vowel → 聪 ;
685 тсын } $not_vowel → 岑 ;
691 тсэн } $not_vowel → 岑 ;
697 тун } $not_vowel → 通 ;
701 тцан } $not_vowel → 灿 ;
705 тцен } $not_vowel → 岑 ;
708 тцин } $not_vowel → 钦 ;
710 тцон } $not_vowel → 聪 ;
713 тцун } $not_vowel → 聪 ;
716 тцын } $not_vowel → 岑 ;
722 тцэн } $not_vowel → 岑 ;
729 тчан } $not_vowel → 昌 ;
733 тчен } $not_vowel → 琴 ;
736 тчин } $not_vowel → 钦 ;
739 тчон } $not_vowel → 琼 ;
742 тчун } $not_vowel → 春 ;
745 тчын } $not_vowel → 琴 ;
750 тчэн } $not_vowel → 琴 ;
752 тчян } $not_vowel → 强 ;
756 тын } $not_vowel → 滕 ;
762 тэн } $not_vowel → 滕 ;
764 тюн } $not_vowel → 琼 ;
766 тян } $not_vowel → 强 ;
771 ун } $not_vowel → 温 ;
775 фан } $not_vowel → 凡 ;
779 фен } $not_vowel → 芬 ;
782 фин } $not_vowel → 芬 ;
785 фон } $not_vowel → 丰 ;
788 фун } $not_vowel → 丰 ;
791 фын } $not_vowel → 芬 ;
797 фэн } $not_vowel → 芬 ;
805 хан } $not_vowel → 汉 ;
809 хен } $not_vowel → 亨 ;
812 хин } $not_vowel → 欣 ;
814 хон } $not_vowel → 洪 ;
817 хун } $not_vowel → 洪 ;
820 хын } $not_vowel → 亨 ;
826 хэн } $not_vowel → 亨 ;
829 хян } $not_vowel → 希扬 ;
834 цан } $not_vowel → 灿 ;
838 цен } $not_vowel → 岑 ;
841 цин } $not_vowel → 钦 ;
843 цон } $not_vowel → 聪 ;
847 цсан } $not_vowel → 灿 ;
851 цсен } $not_vowel → 岑 ;
854 цсин } $not_vowel → 钦 ;
856 цсон } $not_vowel → 聪 ;
859 цсун } $not_vowel → 聪 ;
862 цсын } $not_vowel → 岑 ;
868 цсэн } $not_vowel → 岑 ;
874 цун } $not_vowel → 聪 ;
877 цын } $not_vowel → 岑 ;
883 цэн } $not_vowel → 岑 ;
890 чан } $not_vowel → 昌 ;
894 чен } $not_vowel → 琴 ;
897 чин } $not_vowel → 钦 ;
900 чон } $not_vowel → 琼 ;
903 чун } $not_vowel → 春 ;
906 чын } $not_vowel → 琴 ;
911 чэн } $not_vowel → 琴 ;
913 чян } $not_vowel → 强 ;
918 шан } $not_vowel → 尚 ;
922 шен } $not_vowel → 申 ;
925 шин } $not_vowel → 申 ;
928 шон } $not_vowel → 雄 ;
931 шун } $not_vowel → 顺 ;
934 шын } $not_vowel → 申 ;
940 шэн } $not_vowel → 申 ;
943 шян } $not_vowel → 尚 ;
949 щан } $not_vowel → 先 ;
953 щен } $not_vowel → 先 ;
956 щин } $not_vowel → 辛 ;
959 щон } $not_vowel → 雄 ;
962 щун } $not_vowel → 逊 ;
964 щын } $not_vowel → 欣 ;
968 щэн } $not_vowel → 欣 ;
974 ын } $not_vowel → 恩 ;
980 эн } $not_vowel → 恩 ;
982 юн } $not_vowel → 云 ;
984 ян } $not_vowel → 扬 ;
989 # Dong-nan-xi-hai pass. Per GB/T 17693.4-2009 表 1, 注 4, replace confusing
990 # characters at the beginning and end of a word.