以前このブログでUnicodeモンゴル文字の問題点についてまとめたが、それに関しての更新となる文書が出たのでそれについて書く。
L2/25-140
2025-04-23に、Unicode技術委員会文書レジストリ(UTC Document Registry)に、Unicodeモンゴル文字に関しての経過報告が登録された。
- L2/25-140 Progress report on UTN #57: Encoding and Shaping of the Mongolian Script https://www.unicode.org/L2/L2025/25140-report-utn57.pdf
この文書を読んだ。
発表用スライドのようなので真意が分かりづらいところはあるが、次のような変更点や進捗報告が書かれている。
MVS
モンゴル文字の接尾辞を接続するために、Unicode 15.1以前ではNNBSP (U+202F Narrow No-Break Space)が使われていたが、2024年9月にリリースされたUnicode 16.0からは代わりにMVS (U+180E Mongolian Vowel Separator)が利用されるようになった。
MVSは母音a/eを分離して書く時に使われてきていたものだ。
Prior to Unicode Version 16.0, U+202F NARROW NO-BREAK SPACE (NNBSP) was used to represent this small whitespace; (…). However, its role has been taken over by U+180E MONGOLIAN VOWEL SEPARATOR (MVS), which not only prevents word breaking and line breaking, but also triggers special shaping for the following separated suffix.
https://unicode.org/versions/Unicode16.0.0/core-spec/chapter-13/#G45731
これにより、NNBSPがモンゴル文字専用でなかったことにより引き起こされていた問題が解決し得る。
例えば、属格を示す接尾辞の-yinは単語本体から空白で区切って語中形で書き始めるのだが(
)、NNBSPの存在により、単語本体と接尾辞が分離されてしまって、語頭形から始まる形で表示されることがあった(
)。
特に、モンゴル文字以外の文字に接尾辞が接続することもあるので(次図)、そのような場合に正しい形で表示することは困難だった。

この問題が、MVSというモンゴル文字専用の符号を使うことによって改善できる見込みである。
UTN #57進捗報告
さて当該文書のメインとなるUTN #57の進捗状況について。
ここでいうUTN (Unicode Technical Note) #57は、モンゴル文字の符号化とシェイピングルール(ある符号に対してどの様な形状を出力するかを決定する仕組み)の曖昧性のない定義を目指しているものである。
中国が2023年に国家標準の推奨規格としてGB/T 25914-2023を発表し、現代モンゴル語表記のためのモンゴル文字(Hudum; ホダム)の明確なシェイピングルールを規定したとのこと。
この規格により、モンゴル文字をどう表示すべきかがはっきり規定されたため、モンゴル文字フォントが基準に適合しているか判断できるようになったそうだ。
この規格を元にフォント実装用のデータを生成する仕組みが制作されており、それを利用することでモンゴル文字フォントがルールに適合していることを保証し、相互運用性が担保されるようになることが期待される。
文献一覧
- Kushim Jiang. L2/25-140: Progress report on UTN #57: Encoding and Shaping of the Mongolian Script. https://www.unicode.org/L2/L2025/25140-report-utn57.pdf
- The Unicode Consortium. The Unicode® Standard Version 16.0 – Core Specification. 13.5 Mongolian. https://unicode.org/versions/Unicode16.0.0/core-spec/chapter-13/