読み方:じすえっくすぜろにいちさん
平成12年(2000)にJIS(日本産業規格)で定めた符号化文字集合の規格。規格番号はJIS X 0213:2000(通称JIS2000)。前身となるJIS X 0208を拡張し、JIS第3水準1259字、第4水準2436字を含む4344字を追加。上位互換性をもつ。
[補説] 平成16年(2004)に第2次規格JIS X 0213:2004(通称JIS2004)に改正。168字の字形変更とJIS第3水準への10字の追加が行われ、非漢字1183字も含め、合計1万1233字の字形が規定された。平成24年(2012)に第3次規格JIS X 0213:2012に改正。→JIS漢字
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/07/17 17:00 UTC 版)
JIS X 0213は、JIS X 0208:1997を拡張した日本語用の符号化文字集合を規定する日本産業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である[1]。
2000年1月20日に制定、2004年2月20日、2012年2月20日に改正された[1]。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。
JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。
JIS X 0212(補助漢字)が頻度調査を中心に追加文字を選定し、典拠用例などは諸橋大漢和への参照情報を付加した程度だったのに対し、JIS X 0213ではJIS X 0208:1997 (JIS97) においてJIS X 0208の収載字体の用例・典拠を徹底して調べ上げ、同定したのと同様の手法で一般に使われる字(狭義の字体。以後「字」は狭義の「字体」を指す)でJIS X 0208に収録されていないものを追加した。そのため、JIS X 0212と同じ字が含まれていることもあるが、JIS X 0212では収録されていてもJIS X 0213では包摂規準を使って特に増やさなかった字がある。
拡張にあたっては、JIS X 0208の1997年改正で保留領域とされた部分に字を増やす方針で行われ、非漢字659字、第三水準として1249字、第四水準として2436字を追加した。実装では、JIS X 0208:1997で保留領域とされた部分に非漢字及び第三水準の文字を入れて第一面とし、その後ろに第四水準の文字を第二面として加えた。さらに2004年の改正で、第三水準に10字が追加され、168字の例示字形が変更された。
第二面は第一面と同じく94区94点で構成されているが、そのうち文字の存在する符号領域は1, 3–5, 8, 12–15, 78–94区に限られる。この奇妙な配置はJIS X 0212補助漢字の存在する場所を避けた結果である。これによりEUCエンコードされた文章でJIS X 0212補助漢字を用いたものとJIS X 0213第二面を用いたものの判別が可能である。さらに両方を用いることも原理的には可能である(ただし、その規格は存在しない)。
しかし、JIS X 0208:1997で保留領域とされた部分は、過去のJIS X 0208で自由領域とされ、実装各社によって外字領域として使用されていた部分であり、実態としては既に使われている領域であった。ここに新たに文字を配置した規格案に対し実装各社側より意見があり、最終審査において各種符号化方式が「参考」(規格本体ではない)とされることになった。その一方で、JIS X 0208の空き領域を規定通り未使用としていたUNIX系ソフトウェアでは対応が比較的容易であり、複数の実装が存在する。
JIS X 0213ではJIS X 0208まで用いられていた「区点」に「面」を加え「面区点」となり、「面-区-点」でコード表記を行う。例えば1面3区33点の「A」は「1-3-33」とあらわす。
符号化方式は、ISO/IEC 2022にそった形のみ「規定」としてあり、ISO-2022-JP-2004、Shift_JIS-2004、EUC-JIS-2004は「参考」として記述がある。これらのコード名は今のところIANAが登録していないので、MIME等では "X-" で始まる私用の名称として用いる必要があることになる。 Shift_JIS-2004は、macOSやJava 7などでは既に実装しているが、Windowsでは従来のシフトJIS(コードページ932)と互換性がないことを理由に実装していないため、広く利用することができない。
JIS X 0213制定当時はいくつかの文字に対応するUnicode符号が存在しなかったが、Unicode 3.1およびUnicode 3.2で追加された。ただし、符号化にあたり注意点がある。
なお、Windows Vista以降やmacOSではこれらに対応している。Windows XPではサロゲートペア(代用対)に対応しており、Service Pack 2以上を適用することによってグリフ置換にも対応する。Windows 2000はサロゲートペアに対応しているものの初期設定では無効化されておりレジストリの設定が必要である(Help:特殊文字#古代文字と人工文字参照)。またグリフ置換には未対応である。
アプリケーション側の対応も必要である。Microsoft OfficeのXP以降のバージョンやWindows Vistaに付属するInternet Explorer 7.0、Windows XP以降に付属するメモ帳やワードパッドなどでは対応済みである。
JIS X 0213の第1面13区にはNEC特殊文字が、一部を除き同じ面区点番号で登録されている。NEC特殊文字はPC-9801やWindowsで幅広く使われていたにもかかわらず、機種依存文字であった。
| 変更のあった文字(黄色は違いの分かりにくいもの) |
|---|
| 逢芦飴溢茨鰯淫迂厩噂餌襖迦牙廻恢晦蟹葛鞄釜翰翫徽 祇汲灸笈卿饗僅喰櫛屑粂祁隙倦捲牽鍵諺巷梗膏鵠甑叉 榊薩鯖錆鮫餐杓灼酋楯薯藷哨鞘杖蝕訊逗摺撰煎煽穿箭 詮噌遡揃遜腿蛸辿樽歎註瀦捗槌鎚辻挺鄭擢溺兎堵屠賭 瀞遁謎灘楢禰牌這秤駁箸叛挽誹樋稗逼謬豹廟瀕斧蔽瞥 蔑篇娩鞭庖蓬鱒迄儲餅籾爺鑓愈猷漣煉簾榔屢 冤叟咬嘲 囀徘扁棘橙狡甕甦疼祟竈筵篝腱艘芒虔蜃蠅訝靄靱騙鴉 |
| 字体の変更前後の比較(GIFアニメ) |
JIS X 0213:2004は、JIS X 0213:2000の例示字形を変更している。変更があったのは表1の通りである。
全部で168字あり、おおむね、拡張新字体から、いわゆる康熙字典体型へ変更されている。「叉」や「釜」などは筆押さえを取っている。また、「蟹」(「解」と「虫」を離した)や「祟」(出を小さくした)など、違いの分かりにくいものもある。
この変更は、国語審議会の答申「表外漢字字体表」に示されている字体に合わせるものである。ただし、文字コード規格とは文字の符号化表現を定めるものであり、例示字形は何ら規範的な役割を持たないことを謳っていながら、こうした変更を行うことに対して批判的な意見が公開レビューなどで寄せられた。
| 追加された10文字 |
|---|
| 俱剝𠮟吞噓姸屛幷瘦繫 |
| 従来の文字 |
| 倶剥叱呑嘘妍屏并痩繋 |
第3水準に追加された10字は表2の通りである。Unicodeで別の符号が与えられていたために追加されたものである。これらは表の下に示した従来の文字に対する異体字である。
上記対応によりほぼ全てのOSにおいてJIS X 0213:2004の字形が標準で使用可能となった。
JIS X 0213:2004では、JIS X 0213:2004で規定されている全ての文字種が含まれていて、各文字がJIS X 0213:2004での包摂基準に従っており、JIS X 0213:2004で規定されているそれぞれの文字の区別がつけることができる(たとえばJIS X 0213:2004での異体字関係となる「神(片仮名の「ネ」の字形に似た示偏)」と「 神(漢字の「示」の字形の示偏)」が違う字形となっている)ことが求められているだけであり、例示字形と完全に同一の字形であることが求められているわけではないので、JIS X 0213:2004の包摂基準範囲内で自由に字形を選択してもJIS X 0213:2004に従った字形(たとえば「辻」が二点之繞でなくてもJIS X 0213に従った字形)ということができる。ただし、一般的にJIS X 0213:2004に従った字形のフォントとして発売されているフォントは、二点之繞や食偏なども含めてJIS X 0213:2004の例示字形に沿った字形を選択しているフォントがほとんどである。
2010年(平成22年)11月30日の常用漢字表改定に対応して、引用例の変更、附属書12の追加がなされた[1]。
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/13 14:42 UTC 版)
「JIS X 0208」の記事における「JIS X 0213」の解説
JIS X 0213(拡張漢字)は、JIS X 0208の漢字集合を拡張した漢字集合を規定する。規格票解説によれば、この文字集合は「JIS X 0208が当初符号化を意図していた現代日本語を符号化するために十分な文字集合を提供することを目的として設計された」ものである。 JIS X 0208とJIS X 0213は併用されない。JIS X 0213の漢字集合は、JIS X 0208の漢字集合で表現できるすべての文字を含む、非漢字1,183文字および漢字10,050文字の合計11,233文字からなり、JIS X 0213に規定された符号で運用される。 JIS X 0213は一見するとJIS X 0208に規定された符号化文字集合の上位互換な符号化文字集合を規定または参考として提供しているように見える。しかし厳密にはJIS X 0213はJIS X 0208の上位互換ではない。これはJIS X 0213の原案作成委員会も認めるところである(JIS X 0213:2000規格票解説5.3.2、JIS X 0213:2000/追補1:2004規格票解説3.2.2)。 JIS X 0213がJIS X 0208の上位互換でないというのは、JIS X 0213ではJIS X 0208の一部の区点位置について包摂分離がおこなわれたというところによる。すなわちJIS X 0208において明示的に包摂されて一つの区点位置で表現されていた相異なる字体に対し、JIS X 0213ではそれぞれ独立の面区点位置が与えられている場合がある。このため、JIS X 0208の符号によって符号化されたデータがJIS X 0213の符号に変換できないことがある。 例えばJIS X 0208の33区46点(僧)には、「人偏に曽」の字体、「人偏に曾(第1画および第2画は「八」)」の字体および「人偏に曾(第1画および第2画は「ソ」)」の字体が包摂されている。JIS X 0213ではこれについて包摂分離をおこない、1面33区46点に「人偏に曽」および「人偏に曾(第1画および第2画は「ソ」)」を包摂して、1面14区41点を「人偏に曾(第1画および第2画は「八」)」とした。したがってJIS X 0208の33区46点をJIS X 0213に移す際に、1面33区46点と1面14区41点のいずれに移すべきかが機械的には定められない。 もっとも、現実にはJIS X 0208のm区n点とJIS X 0213の1面m区n点を一対一に対応させることがおこなわれていて、それによって大きな混乱は生じていない。大きな混乱がない理由としては、多くの書体がJIS X 0208の例示字体にならった字体を採用してきたこと、利用者の多くが包摂規準の存在を意識していないことなどが考えられる。
※この「JIS X 0213」の解説は、「JIS X 0208」の解説の一部です。
「JIS X 0213」を含む「JIS X 0208」の記事については、「JIS X 0208」の概要を参照ください。