https://ujimushisradjp.hatenablog.jp/entry/2025/12/15/000000

※この記事は漢直アドベントカレンダー 2025 の15日目の記事になります。

はじめに

今回は，Mozc(Google日本語入力)のユーザー辞書を利用した交ぜ書き変換をする方法についてご紹介します。

といっても既に岡さんのgithubのmazegaki-dicレポジトリで公開されているものを利用するだけなので，特に新しいところはないのですが，利用する時の注意点等をご紹介できればと思います。

Ubuntuで利用する場合の注意点

残念ながら，Ubuntuの22.04，24.04の場合，Mozcのバージョンが2.28.4715.102と古いため，漢字を見出し語にした変換が利用できません。

これは，より新しいMozcをDebianでも使いたいに詳しいのですが，最新のMozcではビルドシステムをGYPからBazelに変更したことが主に原因です。

DebianやUbuntuではこのBazelのバージョンが古く，また最新のMozcが依存するパッケージもDebianのものは古いとか， Bazelの動的なビルドが今のDebianやUbuntuのパッケージ管理方法と相性が悪い等，色々問題が生じているためです。

そのため，Mozcを自分自身でビルドする必要があります。自分の場合は素のUbuntuのGnomeを使っているので，そのままMozcの公式サイトのビルド手順で最新版をインストールする方法が利用できます。

問題は，fcitx5-mozcを利用している場合で，この場合はどうやってビルドしていいかどうか分かりません。

従って，以前の日記の内容のような感じで自分でビルドしてインストールして下さい。

今のところ，Ubuntu 24.04上でGnomeを素で利用する(つまりibus-mozcのまま利用している)限りにおいては不都合は生じていません。

岡さんのmazegaki-dicレポジトリの利用

MozcやGoogle日本語入力では，私のようにオンメモリで辞書を展開している場合，ユーザー辞書をコメントも含めた形でメモリ上に展開して参照しながら変換しているようです。そのため，ipadic.maze.txtそのまま利用すると，変換に不要なコメント部分もメモリ上に展開されるため，自分が社用で使っているプアな事務用PCだとかなりメモリを圧迫します。

また，私の場合他に変な変換をするためのユーザー辞書を作成して別に登録しているのですが，辞書ツールを利用する時，わりとコメント入りの辞書と別の辞書との整合性をとる処理が入ってうざいです。

そのため，コメントを削除してから登録する方がいいでしょう。 julia言語だと次のようなプログラムでコメントを削除したファイルが作成できる感じです。

str_lines = split.(readlines("ipadic.maze.txt"), "\t")
open("ipadic.maze.nocomment.txt", "w") do io
    for s in str_lines
        println(io, "$(s[1])\t$(s[2])\t$(s[3])")
    end
end