※この記事は漢直アドベントカレンダー 2025 の24日目の記事になります。
はじめに
誰も参加してくれそうになかったのでとりあえずタイトルを登録してみた, という感じなのですが,今回色々調べてみて「もし自分が今から漢直の仕組みを作るなら」 ということで,少し話をしてみたいと思います。
T-Codeは理想の漢直か?
今回色々調べてみて,T-Codeの弱点というのが分かってきました。 大雑把な最適化のために,頻度の高い文字でも右手の小指連続とかあったり, 最適化が進んでないところです。
過去の文献とか見ても,T-Codeの記載があるのは150字/分しかないので, ライプットの平均 220字/分とかと比較してもかなり遅い結果となっています。
改善するところはまずその点かな,と思います。
ただ,同時打鍵等が全くない点は気に入っていて,特にEmacs等のエディタの編集作業に 邪魔になるようなものが必要なものはそもそも論外だったりします。
同時打鍵が必要ないというのはGoogle日本語入力やMozcでも環境構築可能 という利点もあり(設定はかなり必要,といっても今は設定ファイル読み込むだけなので楽チンです) こういうところは嬉しいところだったりします。
自分がもし漢直を作るなら
基本的には「怠惰な漢直ユーザー」。面倒臭がりなので,基本はT-Codeと同じ感じにすると思います。 実装もまるまま使えるでしょうし。
- 平仮名,片仮名も含めてランダム
- 一字二打鍵
- 直接入力可能1350字程度
はおそらく踏襲するかと。
ただ,もう年寄りなのでもう少しスムーズに打鍵ができる運指がいいので, 文字の連続も考慮したスムーズな打鍵になるような最適化をしたいです。
まぁどっかに落ちている論文かなんかのデータを引っ張ってきて, 勝手に設計してくれる何かが欲しいです。
また,頻度データも昭和41年の新聞ではなく最新の頻度に更新したいところではあります。
19日目の日記でも利用した 2010年のウェブコーパスとか,国語研の現代日本語書き言葉均衡コーパス とかを利用したいところですが,国語研のは有料なので少しハードルが高いところです。
ただ,これを考慮しても今度は補助入力とのバランスを取る必要があるので, 部首合成等に有用な漢字を100ぐらい見繕う必要がある…なかなか難しそうです。
その辺り,何かバランス取れるようなプログラムを書いてあとはよしなにやってくれる何かが欲しいところです。
自分の場合ちょこっとずつ追加していくと「つぎはぎ式」みたいな感じになって, 訳分からんようになってしまうので,基本のルールはシンプルに, 後は機械的にやってもらって私は使うだけ,が性に合っている気がします。
さいごに
とはいうものの,もう50代も中ばなので,たとえ作っても自分が利用することはないような気がします。
ただ,漢直って10年後の自分の日本語入力をどうするかを考えて使うものなので, うっかり作ってしまって,もしキーの入力がスムーズになるのだったら,ひょっとしたら こっそり使い始めるかもしれません。
まぁ,どちらかというとズル入力をどんどん工夫して追加していく方が楽しいかもしれないなぁと, 今のところは思っています。
この点はかな漢字変換ユーザーにはない楽しみかと思います。
それでは24日目はこれで終わりにしたいと思います。
ではまた。