2000年1月20日に制定、2004年2月20日、2012年2月20日に改正された[1]。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。
JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。
特徴
JIS X 0212(補助漢字)が頻度調査を中心に追加文字を選定し、典拠用例などは諸橋大漢和への参照情報を付加した程度だったのに対し、JIS X 0213ではJIS X 0208:1997 (JIS97) においてJIS X 0208の収載字体の用例・典拠を徹底して調べ上げ、同定したのと同様の手法で一般に使われる字(狭義の字体。以後「字」は狭義の「字体」を指す)でJIS X 0208に収録されていないものを追加した。そのため、JIS X 0212と同じ字が含まれていることもあるが、JIS X 0212では収録されていてもJIS X 0213では包摂規準を使って特に増やさなかった字がある。
拡張にあたっては、JIS X 0208の1997年改正で保留領域とされた部分に字を増やす方針で行われ、非漢字659字、第三水準として1249字、第四水準として2436字を追加した。実装では、JIS X 0208:1997で保留領域とされた部分に非漢字及び第三水準の文字を入れて第一面とし、その後ろに第四水準の文字を第二面として加えた。さらに2004年の改正で、第三水準に10字が追加され、168字の例示字形が変更された。
第二面は第一面と同じく94区94点で構成されているが、そのうち文字の存在する符号領域は1, 3–5, 8, 12–15, 78–94区に限られる。この奇妙な配置はJIS X 0212補助漢字の存在する場所を避けた結果である。これによりEUCエンコードされた文章でJIS X 0212補助漢字を用いたものとJIS X 0213第二面を用いたものの判別が可能である。さらに両方を用いることも原理的には可能である(ただし、その規格は存在しない)。
しかし、JIS X 0208:1997で保留領域とされた部分は、過去のJIS X 0208で自由領域とされ、実装各社によって外字領域として使用されていた部分であり、実態としては既に使われている領域であった。ここに新たに文字を配置した規格案に対し実装各社側より意見があり、最終審査において各種符号化方式が「参考」(規格本体ではない)とされることになった。その一方で、JIS X 0208の空き領域を規定通り未使用としていたUNIX系ソフトウェアでは対応が比較的容易であり、複数の実装が存在する。
JIS X 0213とUnicodeでは包摂規準が異なる。そこで JIS X 0213 での人名用漢字の字形(字体)を区別するために、一部の文字をUnicodeではCJK互換漢字として収録している。CJK互換漢字は、Unicode正規化によりCJK統合漢字に分解(変換)される。この対応として互換漢字用の異体字セレクタ(SVS)を使用して変換前の情報を維持する必要がある。また、CJK統合漢字と字形選択子の組み合わせを1文字として処理する必要もある。SVS対応フォントとしてはIPAexフォント、モリサワのAP版書体などがある。
例えば、KS X 1001由来のCJK互換漢字が誤って入力された場合に、入力エラーとせずUnicode正規化処理で対処する方式(CJK統合漢字のみに変換)を採用すると、CJK互換漢字に収録されている人名用漢字が入力された場合に意図せず変換されてしまう。[3][4]
CJK互換漢字やCJK統合漢字+SVSを使用せず、CJK統合漢字と字形選択子補助(英語版)の組み合わせ(IVS/IVD対応)により異体字(Unicodeでは包摂されるが、JIS X 0213として別の字体)を表現する場合、JIS X 0213の文字をこの組み合わせに変換する方法(複数あるため1つの方法を選んで変換)と、組み合わせを処理および表現(IVS対応フォントの導入)する必要がある。異体字セレクタ#実装も参照。
JIS X 0213が制定されてすぐのころは、UnicodeにはJIS X 0213が実装されていなかったため、外字領域に文字を定義して使用することが多く行われていた。いくつかの自由なフォントではそのような実装が行われている[※ 1]。
日本のデータ放送などで使用されるARIB STD-B24では、ARIBの文字符号化方法の文字セットとしてJIS X 0213が使用可能となっている。「JIS互換漢字1面集合」でJIS X 0213:2004の1面、「JIS互換漢字2面集合」でJIS X 0213:2004の2面が使用される。この符号化方式の中には「国際符号化文字集合」を使用する方法があり、通常のUnicodeのマッピングのほか、「BMPセット」としてUnicodeでの「基本多言語面」で全てを表現できるようにJIS X 0213での「追加漢字面」の文字を「基本多言語面」の外字領域にマッピングしなおした文字セットが別に使用可能とされている。
JIS X 0213:2004では、JIS X 0213:2004で規定されている全ての文字種が含まれていて、各文字がJIS X 0213:2004での包摂基準に従っており、JIS X 0213:2004で規定されているそれぞれの文字の区別がつけることができる(たとえばJIS X 0213:2004での異体字関係となる「神(片仮名の「ネ」の字形に似た示偏)」と「
神(漢字の「示」の字形の示偏)」が違う字形となっている)ことが求められているだけであり、例示字形と完全に同一の字形であることが求められているわけではないので、JIS X 0213:2004の包摂基準範囲内で自由に字形を選択してもJIS X 0213:2004に従った字形(たとえば「辻」が二点之繞でなくてもJIS X 0213に従った字形)ということができる。ただし、一般的にJIS X 0213:2004に従った字形のフォントとして発売されているフォントは、二点之繞や食偏なども含めてJIS X 0213:2004の例示字形に沿った字形を選択しているフォントがほとんどである。