U-PRESS (ゆーぷれす) とは共同通信社が独自に策定した文字コード(文字符号化方式および文字セット)。Unicode2.1をベースに基本多言語面 (BMP) の私用領域に新聞独特の外字を配置したもので、総収録文字数は15,269文字である[1]。
概要
1990年代、ワープロ、パソコンなどの情報機器用に「K-JIS」など新聞社用の独自文字コードが案出されたが、運用の不統一、啓蒙・周知が不十分であったことなどから広く普及はしなかった。そこで共同通信社ではUnicodeを16ビット固定長として(→UTF-16)その外字領域に新聞独自の外字を配置したものを規格化し、2002年より社内運用、2003年からは新聞各社への配信も同文字コードを運用して行っている。
各種文字コードとの対応
- JIS X 0201[2]…全文字を収録している。
- JIS X 0208[2]…全文字を収録している。ただし字体は印刷標準字体に準じる。
- JIS X 0212[2]…全文字を収録している。
- JIS X 0213[2]…BMPに収録されているものはそのまま収録。それ以外のものは私用領域に収録。
- ラテ欄記号や縦書き専用文字、連数字などの独自文字を私用領域に収録している。符号化方式にはUTF-16が使われているため、BMPの範囲内においてはUnicodeと互換性がある。
- 上記にないUCSの一部非漢字[2]
U-PRESSは一般的に使われているIBM拡張文字、古い新聞社用文字コードのK-JIS、ラテ欄(特にBSデジタル)に使われているARIB外字などの一部の文字が含まれておらず[3]、イワタはU-PRESSにそれらとの互換性を持たせるめの独自の拡張文字セット(848文字)を規定している[3]。
またAdobe-Japan1-6ではU-PRESSの独自文字が追加されているが、例えばモリサワのフォントではU-PRESSとAdobe-Japan1-6との間に字体の違いが存在する[4]。
対応システム・フォント
入力用のIMEとしてジャストシステムよりATOKの「for U-PRESS」バージョンが開発・販売されている。
U-PRESS対応フォントには例えば以下が存在する:
- イワタの各種新聞書体 (イワタ U-PRESS 拡張文字セット対応)[5]
- モリサワの各種OTF Uprフォント[6]
- SCREENのヒラギノフォントのUpr版[7]
問題点
JIS X 0213:2004制定前に策定されたあくまで私的な規格であり、サロゲートペア(代用対)に対応していないなどUnicodeとの互換性も不完全であるため、今後、既存コードとの衝突を起こす可能性も危惧される。
関連項目
脚注
- ^ 株式会社イワタ 製品情報 - イワタU-PRESS
- ^ a b c d e 今さら聞けない文字コードのはなし p.45 イワタ 2019年11月19日
- ^ a b 拡張文字セット イワタ U-PRESS Ver.2.1 イワタ
- ^ U-PRESS に関して モリサワ
- ^ イワタ新聞書体について イワタ
- ^ OpenTypeにも種類があるのですか? - よくあるご質問 - サポート モリサワ
- ^ ユニバーサルデザインに対応したヒラギノフォントの新書体が販売開始 マイナビ 2012年11月6日
|
|
| カテゴリ |
日本語用の 文字コード |
|
日本語を含む 多言語文字集合 |
|
日本語以外用の 文字集合 |
| 初期の文字コード |
|
| ISO/IEC 8859 |
|
| 書誌用 |
- ISO 5426
- ISO 5426-2
- ISO 5427
- ISO 5428
- ISO 6438
- ISO 6861
- ISO 6862
- ISO 9036
- ISO 10585
- ISO 10586
- ISO 10754
- ISO 11822
- ANSEL
- MARC-8
|
| 国家標準 |
|
| EUC |
|
| ISO/IEC 2022 |
- ISO/IEC 2022 CN
- ISO/IEC 2022 KR
- CCCII
|
MacOS コードページ |
- Macintosh Standard Roman Character Set
- アラビア語
- CentralEurRoman
- EUC-CN
- Big5
- クロアチア語
- キリル
- デーヴァナーガリー
- Dingbats
- ペルシャ語
- ギリシア語
- グジャラート語
- グルムキー
- ヘブライ語
- アイスランド語
- EUC-KR
- ルーマニア語
- MacSymbol
- TIS-620
- トルコ語
- ウクライナ語
|
DOS コードページ |
- 437
- 720
- 737
- 775
- 850
- 852
- 855
- 857
- 858
- 860
- 861
- 862
- 863
- 864
- 865
- 866
- 869
- KOI8
- Kamenicky
- Mazovia
- MIK
- Iran System
|
Windows コードページ |
|
EBCDIC コードページ |
|
| その他標準 |
|
| 記号用 |
|
プラットフォーム 固有 |
- ATASCII
- CDC display code
- DEC Radix-50
- Fieldata
- GSM 03.38
- HP roman8
- PETSCII
- TI calculator character sets
- ZX Spectrum character set
|
|
| ソフトウェア |
|
| 区分け |
|
| 概念 |
|
| 関連トピック |
|