※ この記事は漢直アドベントカレンダー 2025 8日目の記事になります。
はじめに
T-Codeは「知る人ぞ知る」無連想式漢字直接入力の代表的というか「元祖漢直」の入力方法ですが, 現在では利用している人も限られ,また利用者も開発当時の情報はほとんど知らない人がほとんどではないかと思います。 (ただし前田さんは除きます)
最近国が各学会にオープンアクセスを促した事により, T-Codeに関する論文もかなりのものが無料で閲覧可能となるなど, 金を払ってまでして調べたくない自分でも確認できるようになってきました。
そこで,数回にわたりT-Code関連の論文を読み込んで理解できたことを この記事を見ている方と一緒に確認していきたいと思います。
なお,実はT-Codeのに関してネットから無登録で見られる設計に関する論文は1, 2件だけです。 (ただし補助入力方法や生理学的な分析,練習方法についての論文が多いです) 国立国会図書館に登録にすることによって,開発の途中の状況を発表しているものを確認することによって, どのように開発が進んだのかを確認することができました。
その自分が調べた内容について簡単に説明したいと思います。
T-Codeの概要
私の場合は、tc.elで設定されているT-Codeの打鍵表をそのまま利用しているので、 自分の入力環境=標準のT-Code環境です。ザ・リファレンスですね。
一般的にT-Codeは次のような特徴があります。
- 40キー(縦4段,横10列(左手5列,右手5列))を用いる
- 1文字に必要な打鍵数 2固定
- 直接入力可能な文字数 1353(tcode-MLで追加されたと記憶している
帳を含みます) - 人差指のホームポジションの組み合わせ(2打鍵)で補助入力(部首合成・交ぜ書き変換)
- カナ文字の割り当ては平仮名・片仮名も含めて頻度順で法則性なし
- 直接入力(英字入力)以外のモード切換がない
特筆すべきところは平仮名・片仮名入力の規則性がないところでしょうか。 また、濁音・半濁音も規則性が無く別の運指なのも驚かれるところです。 実はT-Code使いにとっては、あまり気にしていないというかむしろ自然です。
これらの特徴はどうやって設計されたのかを論文を参照しながら説明していきます。
文字の頻度の元となるデータは何か?
ほとんどのT-Codeの論文には、参考文献に文字の頻度の元となるデータの記載があります。
国立国語研究所が行った 電子計算機による新聞の語彙調査 の元の電子データ(漢字テレタイプ)がT-Codeの文字の頻度情報の根拠となります。 リンク先は1970年となっていますが,実際はかなり前から調査の準備をしているようです。データとしては,朝日・読売・毎日新聞の昭和41年(度?)の紙面の文字で, T-Code及びTUT-Codeの開発にはこの生の電子データを借り受けて開発しているようです。
この新聞の語彙調査は紙面を電子符号化するために、人力で入力するための漢テレタイプをメーカーに発注するところから始めて, かなり大がかりだったようです。このデータを利用して国語研究所でも様々な研究が実施されており, 最後の報告は1975年頃だったようです。(電子計算機による新聞の語彙調査, 国立国語研究所 研究資料室収蔵資料)
T-Codeを開発に着手しようとした1978年当時では,国内で初めての大規模な新聞の語彙調査であり, この当時はこれ以外のデータは国内に無かったものと推測されます。
今では入力文字自体が既に電子データであることが多いので,もし現在頻度を求めるには,この当時より格段に調査しやすい環境といえるでしょう。
頻度を使ってどのように文字を割り当てているか?
これについては,qwertyのキーボードの一部(ただし,格子状配置)を参照しながら説明します。

文献1, 文献2にあるように,最初は30キーの2打鍵,およそ900文字で設計したことが書かれています。 また文献3で紹介されている内容も 900文字での設計になっています。
まず,上中下三段を,右手五列,左手五列のそれぞれ15キーずつを2グループに分けます。左手をL(水色),右手をR(赤色)とします。
そして,L→R,R→R,L→L,L→Rのそれぞれ225パターン×4で合計900文字になります。
右手と左手の人差指のホームポジションの組み合わせを外字入力用としているので,実際には898文字が入力できることになります。
右手→左手に一番頻度の高い字をそれぞれ割り合て,次に右手→右手,左手→左手,左手→右手と割り合てていっています。
なぜこうなっているのかというのは論文4内に根拠があります. 昭和41年の新聞の語彙調査の語彙データを利用し, 連続2字の連続文字出現率をxy軸それぞれ1文字目,2文字目の頻度順としてヒートマップを描くと, 対角線上に色が濃くなったという結果を利用しています。
つまり極端に描くと,次の図のようになる場合,連続している文字はよく似た頻度順といえます。

連続している文字で頻度順が極端に変化する場合,次のようにバラバラの結果となります。

論文の方には,任意の漢字連続2文字では対角線上にならないケースがあったということでしたが, これは「頻度の高い二字熟語」+「頻度の低い二字熟語」の組み合わせのフレーズが多いことを示していて, 二字熟語だけのフレーズだけを抽出すると,対角線上が濃いヒートマップになるのだそうです。
ヒートマップなので,「なんとなく」という結果ですし,また原論文は手書きというか スクリーンシートのはっつけというか,荒い結果で「こんなんでホンマにええんかいな」という感じの結果です。
なので,同じような頻度グループで,よく使う漢字による熟語は「右→左」→「右→左」, あまり使わない漢字による熟語は「左→右」→「左→右」という 打順が多いだろうと想定しています。ただ,それぞれのグループの間のあいまいなところがあるので, 入力しやすい「右→左」の次が「左→右」の順ではなくて,「右→左」,「右→右」の順にしているのだろうという感じです。
例えば頻度順を「右→左」の次が「左→右」にしてしまうと,頻度グループの切れ目のところで 「右→左」→「左→右」と同じ手(特に左手)が続くのが頻発してしまうだろうということだと思います。
以上の内容から結果的に,T-Codeは右利き優先の入力方式といえます。 左利きで右書きに矯正された自分としてはやや入力に辛いところがあるのですが, 矯正させられるのはいつものことなので,しょうがないかな?と受けて入れている感じです。
まぁそんな感じではないと漢直なんて使えんよね。
で,文字グループとその頻度については大体分かるのですが,グループ内での割当てはどうなっているのかが気になるところです。
- 打鍵間隔は一定のリズムにそろう傾向があり,それを維持できる打鍵列が望ましい。
- 両手の交互打ちをできる限り続ける。
- 手の移動は少なく,できるだけHome Row(=(下から2段目)上にあるようにする)。
- 打ちにくいキー組(段越え打ち,同じ指の続け打ち)を少なくする
- 指の負担は応分に,特に,弱い指に余分な負担をかけない
とあります。
また,どうやら英語のqwertyのキーボードの 入力しやすさ(入力スピード)を研究した論文があったようです。
自分は全然内容が理解できなかったのですが, TUT-Codeの論文内で示されている打鍵スピードの計算式を 別の計算式で比較している論文5を見つけ,その計算式の元の論文がT-Code開発グループの著したものだった, ということではじめて気付きました。
まぁ文献5では東大の計算式には納得のいかないところがある,みたいな書かれ方をしていましたが。
とまぁとにかく,約225字のグループ内での入力のしやすさは,おそらくT-Code開発グループが自分等で求めた計算式を参考に 機械的に決めていったのが主ではないかと思います。
また,T-Codeでは熟語のような,漢字のつながりについては直接は考慮されていません。 例えば,TUT-Codeの場合,2打で入力できる文字については, ある打鍵の計算式に従って計算機で最適化処理を行っていますが,T-Codeはそこまできっちりとした最適化をしていません。
その点がTUT-Codeの違いとなります。
T-Codeは左右の交互打ちを(何となく)増やすことに注力した入力方式と言えるでしょう。
そして,最上段(右手がR',左手がL')を含めた2打鍵の組合せ,
R→L', R'→L, L→R', L'→Rの75×4パターン合計300文字を追加して,
基本の文字が約1200字となります。
これは文献6の最後に載せられているコード表からも分かります。
さらに,この時点ではR'→Rの漢字は割り合てられず,L'→Lも入力頻度の低いかな系の文字しか
定義されていません。(文献6では現在利用されている木を見て森を見るコード表ではなく,森を見て木を見るコード表であることに注意)
この後,1350文字程度まで増えますが,これはちっちゃい平仮名ぁぃぅぇぉ等のほとんど入力しない文字であるとか
部首合成変換の都合上,とかいった大人の事情的な感じで入力文字が増えていきます。
なので,これらのR'→R,L'→L等はこの後の方に紹介するかもしれない,
T-Codeの練習テキストには掲載されていません。
部首合成変換,交ぜ書き変換の論文7が1990年に出されていて,T-Codeの練習テキストはそれより前に作っている という関係もあるかもしれません。
ということで打鍵表を次に示しますが,最上段を除いたRL→RR→LL→LLが大まかに頻度順であり,最上段がらみで右左,左右である「R'L」「L'R」「RL'」「LR'」がその次で,大人の事情漢字が「R'R」,「RR'」「L'L」「LL’」ということになります。


T-Codeは誰に向けた入力方法か?
これは明確に「専任タイピスト」です。英文タイプライタに相当する和文入力方法を指向して T-Codeは開発されたので,原稿の清書用,つまりコピー打鍵を想定しています。
今回,参照した参考文献に手書きのものがあって,読みづらいため自分が読む用に 一度手打ちでコピーをしてそれを読んだりしていたのですが, 入力間違いはそこまで気にせず入力したところ,1万5千字 / 2.5時間,1分間に直すと,100字/分ぐらい のスピードで入力をしましたが,原稿が面白いということもあり, 楽しく入力していました。
そこで思ったのは,漢直を利用している他の方もおっしゃっていましたが,入力中の精神的な楽さが利点として挙げられます。 入力時には目と指で原稿をコピー入力して,脳ミソの方は論文の内容の方を理解しようとしている感じで, うまく分業ができている感じで作業していました。
なので,入力スピードもさることながら,長時間入力しても疲れにくい, 等の効果も想定されているようです。
まぁかな漢字変換を利用している人は自分から進んでそれを利用しているので, 疲れるのもしょうがないかな?と思います。
なぜ平仮名も含めて無連想なのか?
平仮名も含めて規則性がない配列というのは,ほとんどありません。
これは,1978年の連想式漢字直接入力の利用者に対する聞き取り調査を元にしているものと思われますが, T-Code開発の経緯等が書かれている文献8が参考になるでしょう。
ここには,T-Codeより前に山田氏の研究グループが試作していた連想式漢字直接入力Superwriterの開発において
連想の強いコードは連想のないいわゆる中性コードよりもコード間の混同が多く,また忘れやすい
ということが分かった,といった記述があります。
T-Codeは専任タイピストというプロフェッショナル用を想定しているので,
無連想にすることで,連想式漢字直接入力の初期にみられる忘れやすさを排除しようとしたものと思われます。
ただ,このことで習得が難しいだろうと敬遠され新規でT-Codeを利用しようとする人はほとんどいなくなりました。プロフェッショナル以外の人が利用するのを排除しましたが,プロフェッショナルになろうと思う人も排除した感じになりました。
しかし,習得した人には非常には無くてはならない入力方法になっています。 カナ入力と違って一文字二打鍵が必要でありながら,慣れると非常にスムーズに入力できます。 なお,私の場合T-Codeは「指」で覚えている入力方法なので,昔使っていたqwertyのローマ字によるかな漢字変換は 今でも人より少し遅いぐらいなら現在でも入力は可能です。
何というか全然重ならず,それこそ「qwertyのローマ字入力とは次元が違う」という感じです。
自分にとって現在のT-Codeは自分専用の筆記具的な感覚ですね。スピードの速い手書きに近い感覚になっています。
ただ,自分の場合思考に利用するのは90%は図の方なので,それを代替するには至っていないというのが現状です。ただ,思考パターンは限られているのでちまたで書籍が売られている「図解思考のパターン」的なもののplantumlテンプレートでも用意して,それをちょっと変更して図にしたら頭の中が整理できる,的なことを考えていたりしていますが,本題とは全然違う話ですね。
なぜ平仮名が2打鍵か?
これは,1978年当時のカナタイプライタ,ローマ字タイプライタ,連想式漢字直接入力方式とも, 一打鍵で入力可能なカナより,二打鍵が多いローマ字の方が入力速度が速かったという事実が関係しているかと思います。 すなわち,カナを一打鍵にするメリットがあまり無いと考えられたのです。
現在,ローマ字入力がカナ入力に対して実際に速そうという事実も,この辺りが関係していそうな気がします。
ただ,これらの結果は,「職業タイピスト」を前提にしていて,そうなると「指が速く動く人にとってモードの切替等が少ないローマ字入力が優利」 という結果を示しただけであって,それほど指の動きが速くない人にはカナ入力の方がいい,という結果が 隠れているのかもしれません。
また,参考にした連想式漢字直接入力方式について,その時点で一番高速に入力できたのは 「ラインプット」(230字/分)で,これについては,平仮名等も含めて全て2打鍵であったので, それに習ったというのが本命の理由かもしれません。
「ラインプット」は,片仮名・平仮名の両方違う運指ですし(ただし,非常に覚えやすい) 明らかにT-Codeが影響を受けているのではと思います。
平仮名と片仮名が別の打鍵方法である理由は?
これは,やはり1978年当時最速と言われた「ラインプット」を意識したものであろうと思います。 平仮名と片仮名を同じ運指としようとすると,どうしてもモード切替が必要ですが,これが入力速度の低下につながると いう発言をいくつかの資料でしています。
また,T-Codeは直接入力との切替以外にモード切替がありません。ラインプットは直接入力モードがなく, 英字も含めて全て2打鍵です。この「モード切替がない」ということに関して高速入力に関しては重要であると山田氏は 考えていたようです。
また,平仮名と片仮名ではその頻度が大きく違うというところも影響していたと考えられます。 片仮名の「ブ」と平仮名の「ぷ」とかは特に頻度が違います。
現在のかな漢字変換のカナ入力の設計で元となるngram情報の半濁音をどう扱うか苦労されることもあるかと思いますが, 漢直の場合はわりと簡単で,そのまま利用しています。
ただ,「ぱ」とか「ぁ」行はランク外でただ「入力可能な文字」という非常に悪い扱いの文字となっています。
ランク外の文字は「左手小指最上段」が一文字目となっている文字が多く,私にとってもまさに悪夢の文字達という感じです。 そのため逆に覚えが早いといく不思議な文字達です。「嫌なことは記憶に残る」を地で行っている運指といえるでしょう。
さいごに
やや尻切れとんぼですが,自分が調べたT-Codeの設計内容については以上となります。
実はこの設計部分についてはかなり情報処理学会の全国大会の論文集からなのでなかなか入手しづらく, また,割とあっさり設計が終わっているので,通常見られる論文はあまりありませんでした。
記事の内容の通り,この後あまり調べられずにやっつけで紹介することとなるTUT-Codeでは,きっちり「指の速度式」を使って 文字のつながりまで計算して設計したのとは違い,ややアバウトなところがT-Codeにはあります。
現在ならTUT-Codeでやっていたような設計法を平仮名・片仮名・漢字合わせてコンピューターをぶんまわして 最適化してもいいのではないかと思います。
ただ,自分の場合は設計してもそれを覚えるられるかどうか… 気が向いたら子供のためと思って一度考えてみようか。とか妄想する今日この頃です。
と,内容が無いような記事となってしまいましたが,今回はこれで終わりにします。
それではまた。
- 平賀 譲, 小野 芳彦, 川合 慧, 茂垣 真人, 山田 尚勇: 日本語入力キーボードの打鍵コードの決定について, 情報処理学会講演論文集 第21回全国大会(昭和55年度) p987-988 ↩
- 小野 芳彦, 平賀 譲, 茂垣 真人, 川合 慧, 山田 尚勇: タッチタイプ向き日本語タイプライタの基本文字セットの選択法, 情報処理学会講演論文集 第21回全国大会(昭和55年度) p989-990 ↩
- 平賀 譲, 小野 芳彦, 山田 尚勇: An assignment of key-codes for a japanese character keyboard, COLING 1980 Volume 1, 1980 ↩
- 茂垣 真人: 日本語の二字組の頻度分布, 情報処理学会講演論文集 第21回全国大会(昭和55年度) p1037-1038↩
- 雨宮 俊彦: タイピング作業の特徴とその効率を規定する要因について, : 関西大学社会学部紀要, 15-1, p. 233-256, 1983 ↩
- 平賀 譲, 小野 芳彦, 山田 尚勇: タッチタイプによる日本語入力方式, 情報処理学会研究報告ヒューマンコンピュータインタラクション, 1981-39, p. 1-8, 1981↩
- 小野 芳彦: Tコードの補助入力: 字形組み合わせ法と交ぜ書き変換法, 情報処理学会論文誌 31-3, p. 404-414, 1990 ↩
- 山田 尚勇: 専任タイピスト向きタイプ入力法の研究経過,コンピュータ ソフトウェア 2-1, p.344-354, 1985 ↩