以下の内容はhttps://www.weblio.jp/content/Extended_Unix_Codeより取得しました。


デジタル大辞泉デジタル大辞泉

イー‐ユー‐シー【EUC】

読み方:いーゆーしー

《extended UNIX code》UNIX(ユニックス)上で日本語朝鮮語中国語などを扱うために、米国AT&T社が1985年定めた文字コード日本語のためには、EUC-JP策定されている。拡張UNIXコード。→JISコードシフトJISUTF-8UTF-16


かくちょう‐ユニックスコード〔クワクチヤウ‐〕【拡張ユニックスコード】

読み方:かくちょうゆにっくすこーど

《extended UNIX code》⇒イー‐ユー‐シーEUC


IT用語辞典バイナリIT用語辞典バイナリ

EUC

フルスペル:Extended Unix Code
別名:拡張UNIXコード

EUCとは、文字コード一種で、UNIX上で様々な文字を扱うための拡張仕様として策定されマルチバイト文字規格のことである。

EUCはISO 2022として定義されている文字エンコーディング標準規格ベースとしており、複数バイト幅を用いて漢字のような膨大な数の文字でも扱うことができるようになっている

EUCの日本語版としては、JIS X 0208ベースとして策定されEUC-JP日本語EUC)がある。日本語の他にも、韓国語EUC-KR)、簡体字中国語EUC-CN)、繁体字中国語EUC-TW)などの種類策定され利用されている。


参照リンク
JIS X 0201 片仮名 - (森山 将之のホームページ
企業活動のほかの用語一覧
業務システム:  EDP  ERP  ETL  EUC  ESB  ERPパッケージ  Excelレガシー

ウィキペディアウィキペディア

Extended Unix Code

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/02/05 06:10 UTC 版)

Extended Unix Code(EUC)は、UNIX上で使われてきた文字コード符号化方式である。

などがある。

概要

1980年代、UNIXを開発していたAT&Tはアメリカ合衆国以外の国へUNIXを展開するにあたって各国固有の要求に対応するため、UNIXシステムを世界共通の機能となる国際機能と、各国固有の処理に必要な機能となる各国語機能に分けて定義した。この国際機能において、1つの基本コードと3つの拡張コードから構成される4つのコードセットを使用できる文字コードをExtended UNIX Code (EUC; 拡張UNIXコード) として定義した。

厳密にはEUCのコード体系にはバイト単位の可変長コードである「パックフォーマット」と、2バイト固定長の「完全2バイトフォーマット」がある。前者は情報交換用、後者は内部処理用で、一般にEUCという場合前者を指す。ここでも前者について解説する。

EUCのパックフォーマットはISO/IEC 2022を基に、以下のようなサブセット化を行った体系である。

  • G0にASCII(主コードセット)を、G1-G3に各言語の文字集合(補助コードセット1-3)を暗黙に指示する。指示のエスケープシーケンスは用いない。
  • GLにG0を、GRにG1を暗黙に呼び出す。G2/G3はシングルシフト2/3によりGRに呼び出す。ロッキングシフトは用いない。

補助コードセットが0x80-0xFFの範囲で表されるため、主コードセットと衝突することがない。すなわちShift_JISにおける2バイト目が5C等になりうることによる問題が起きないというメリットがある。

各国向けに局所化した各国語機能のそれぞれの版について、日本語では「 - 語EUC」や「 - 語版EUC」のように呼ばれることが多い。

日本語EUC

日本語EUCはG1-G3に日本産業規格 (JIS) の文字集合を割り当てている。

JIS X 0208ベース

一般に日本語EUCという場合こちらを指す。EUC-JPともいう。ここで、JPは日本国を表す国・地域コードであって、日本語を表す言語コード (ja) でない。

1986年にAT&Tによって定義されて以来、UNIXの標準的な日本語コードとして広く使われてきた。1990年にJIS X 0212(補助漢字)が新たに策定されたが、1992年にUNIX Internationalが発行した『UNIX System V リリース 4 (SVR4) 日本語環境共通規約』において、JIS X 0201 カタカナとJIS X 0212 補助漢字は実装が必須ではないとされていた。このため、特にJIS X 0212は実装されていないことも多い。通信などで用いる場合はこの点に注意が必要である。

なお、G2とG3を使わない場合はJIS X 0208:1997の「国際基準版・漢字用8ビット符号」と同一となる。

JIS X 0213ベース

JIS X 0213:2004ベースのものをEUC-JIS-2004という(2000年版はEUC-JISX0213)。JIS X 0213の附属書3に記載がある。フリー/オープンソースソフトウェアなどで使われていることがある。

韓国語EUC

1987年にAT&Tユニックス・パシフィックよりリリースされた Korean Application Environment Release 1.0 (KAE 1.0) で規定され、1992年に韓国標準協会によってKS X 2901(旧KS C 5861)『ハングルUNIXエンバイロメント』として標準化された。EUC-KRともいう。ここで、KR韓国の国・地域コードであって、朝鮮語の言語コード (ko) ではない。単にKS C 5601といった場合でも、文字集合としてのKS C 5601でなく、EUC-KRのことを指している場合が多い。

  • G0 - ASCII
  • G1 - KS X 1001 (KS C 5601)
  • G2 - なし
  • G3 - なし

EUC-KRを拡張したUHC (Unified Hangul Code) という体系も存在する。

簡体字中国語EUC

中国で広く使われていた。EUC-CNともいう。ここで、CNは中国の国・地域コードであって、簡体字の用字系コード (Hans) でも中国語の言語コード (zh) でもない。単にGB 2312といった場合でも、文字集合としてのGB 2312でなく、EUC-CNのことを指している場合が多い。

  • G0 - ASCII
  • G1 - GB 2312
  • G2 - なし
  • G3 - なし

EUC-CNを拡張したGBKという体系も存在する。

繁体字中国語EUC

EUC-TWともいう。ここで、TW台湾の国・地域コードであって、繁体字の用字系コード (Hant) でも中国語の言語コード (zh) でもない。台湾の規格であるが、あまり使われておらず、一般にはBig5が使われる。

  • G0 - ASCII
  • G1 - CNS 11643 第一字面
  • G2 - CNS 11643 第二-第十六字面
  • G3 - なし

G2の文字は以下の4バイトで構成される。

  • シングルシフト2 (0x8E)
  • 字面を選択するコード(0xA2-0xB0)
  • 文字の第1バイト(0xA1-0xFE)
  • 文字の第2バイト(0xA1-0xFE)

課題

EUCの利用は、すべての文字コードを包含したり、複数の文字コードを切り替えて表示する機能の必要性を否定する場合があり、多くの文字を表示する流れに対して後ろ向きであった点が課題である。これは、文字コード自体の課題ではなく、EUCを利用しているプログラマ、利用者の課題である。

関連項目



ウィキペディアウィキペディア

Extended Unix Code (EUC)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/03/30 06:03 UTC 版)

ISO/IEC 2022」の記事における「Extended Unix Code (EUC)」の解説

Extended Unix Code (EUC) は、ISO/IEC 2022機構準じた8ビット符号文字コードである。これには以下のものが含まれる次のような特徴を持つ。 アナウンス機能エスケープシーケンス省略する8ビット符号なので、GR領域も使う。エスケープシーケンス使わない。 G0にASCIIを、G1にマルチバイト文字集合を、G2G3補助的な文字集合を (あれば) 指示し、G0をGL領域に、G1をGR領域呼び出した状態で始まる (このため制御機能省略する)。つまり、最初は7ビット符号ASCII8ビット符号マルチバイト文字集合で始まる。 指示の状態は固定的決まっており、変更行わない呼び出しはシングルシフトのみで、G2G3 (あれば) からGR領域へのみ。 この結果ASCII文字は常に7ビットそれ以外文字集合文字は常に8ビット符号化され、しかも、同じ文字集合文字は常に同じバイト数で表現されることになる。 #表4に、これらの文字コード用い符号化文字集合と、その選択のための制御機能を示す。 EUC-JPでの「日本語版Wikipedia」という文字列符号化を例に説明する (#表4参照)。 図3 EUC-JPによる「日本語版Wikipedia」の符号化文字日 本 語 版 W i k i p e d i a 区点行列38-92 43-60 24-76 40-39 05/07 06/09 06/11 06/09 07/00 06/05 06/04 06/09 06/01 符号12/06 15/12 12/11 13/12 11/08 14/12 12/08 12/07 05/07 06/09 06/11 06/09 07/00 06/05 06/04 06/09 06/01 C6 FC CB DC B8 EC C8 C7 57 69 6B 69 70 65 64 69 61 上図で、上段符号化したい文字列である。「日本語版」は JIS X 0208含まれる文字の列、「Wikipedia」はASCII含まれる文字の列である。ASCIIGL領域に、JIS X 0208GR領域呼び出されている。したがって、「日本語版」を8ビットで、「Wikipedia」を7ビット符号化すればよい。マルチバイト文字区点で、シングルバイト文字行列で表すと、中段のようになる区点2バイトずつで表し全体8ビット符号か7ビット符号で表すと、下段のように符号化される。 表4 EUCでの文字集合の選択文字コード対象言語文字集合文字集合選択のための制御機能指示呼び出し EUC-CN(GB2312) 中国語簡体字 ASCII G0 指示したまま GLのまま GB 2312-80 G1 GRのまま EUC-JP(AJEC) 日本語 ASCII G0 指示したまま GLのまま JIS X 0208いずれかの版 G1 GRのまま JIS X 0201-1976の仮名文字集合 (実装しなくてもよい) G2 08/14SS2(シングルシフトGR) JIS X 0212-1990 (実装しなくてもよい) G3 08/15SS3(シングルシフトGR) EUC-JISX0213 日本語 ASCII G0 指示したまま GLのまま JIS X 0213:20001面 G1 GRのまま JIS X 0201-1976の仮名文字集合 (原則として用いない) G2 08/14SS2(シングルシフトGR) JIS X 0213:20002面 G3 08/15SS3(シングルシフトGR) EUC-JIS-2004 日本語 EUC-JISX0213 のG1とG3に、それぞれJIS X 0213:20041面2面指示したもの EUC-KR 韓国語 ASCII G0 指示したまま GLのまま KS X 1001 G1 GRのまま EUC-TW 中国語伝統字 ASCII G0 指示したまま GLのまま CNS 116431面 G1 GRのまま CNS 116432面以降(面1バイト区点2バイト) G2 08/14SS2(シングルシフトGR)

※この「Extended Unix Code (EUC)」の解説は、「ISO/IEC 2022」の解説の一部です。
「Extended Unix Code (EUC)」を含む「ISO/IEC 2022」の記事については、「ISO/IEC 2022」の概要を参照ください。

ウィキペディア小見出し辞書の「Extended_Unix_Code」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ

辞典・百科事典の検索サービス - Weblio辞書辞典・百科事典の検索サービス - Weblio辞書

「Extended UNIX Code」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。




以上の内容はhttps://www.weblio.jp/content/Extended_Unix_Codeより取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14