(data: から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/11/02 15:52 UTC 版)
データURIスキーム(英語: data URI scheme)とは、あたかも外部リソースを読み込むのと同じように、ウェブページにインラインにデータを埋めこむ手段を提供するURIスキームである。ファイルリテラル、あるいはヒアドキュメントの一形態である。この技術を利用することで、通常は別のデータに分かれている画像やスタイルシートなどの要素を、1つのHTTPリクエストによって読み込むことが可能になる。これにより、HTTPリクエスト数が削減され、データの転送効率が改善される可能性がある[1]。また、一部のブラウザ拡張機能でも、画像などのコンテンツを単一のHTMLファイル内にパッケージングしてユーザーに届けるために利用されている[2][3]。2018年現在[update]、データURIは主要なほとんどのブラウザで完全にサポートされている。ただし、Internet ExplorerとMicrosoft Edgeでは、一部の機能が実装されていない[4]。
フルサポートされたブラウザでは、JavaScriptで生成されたコンテンツであってもwindow.location.hrefに値を設定することで通常の外部ファイルと同様に「ダウンロード」をすることができる。
2018年には、WHATWGのFetch Standardで改めて定義がなされることとなった[5]。
データURIの構文は、IETFが1998年に標準プロトコル案RFC 2397として定義され[10]、続いて、URIスキームの構文が定義された。構文は、以下の通りである。
data:[<MIME-type>][;charset=<encoding>][;base64],<data>
エンコードが必要なデータに対してはBase64のエンコード形式を指定する。エンコード形式の指定が無い場合、データはURLで使用可能な文字[11]についてはASCIIコードで記述し、それ以外の文字については標準の%xx形式(パーセントエンコーディング)でエンコードする。MIMEタイプが省かれた場合、デフォルト値のtext/plain;charset=US-ASCIIが指定されたものとする。(その場合、charsetだけの指定も可能。)
いくつかのブラウザ (Google Chrome, Opera, Safari, Firefox) では;charsetと;base64の順番が逆になっても正常に処理される。Internet Explorerでは;charsetと;base64の順番は逆になってはならない。データサイズはオクテット単位である。
<img src="data:image/png;base64,iVBORw0KGgoAAA
ANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4
//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU
5ErkJggg==" alt="Red dot" />
この例はフォーマットのために改行されている。 Data URI も含めた実際の URI では、制御文字 (ASCII 0 から 31 までと 127) とスペース (ASCII 32) は除外文字である。つまり、空白文字が data URI に入っていてはいけない。
しかし、HTML4 と HTML5 においては、要素の属性値 (上記の "src" のような) の中の改行は無視される [要出典]。 したがって、上記の例の data URI は改行が無視されて正常に処理される。
これは HTML の機能であって data URI の機能ではないため、HTML 以外では URI 内の空白文字が無視される挙動は使えないことに留意。
背景に画像を含む CSS ルール:
ul.checklist li.complete {
padding-left: 20px;
background: white url('data:image/png;base64,iVB\
ORw0KGgoAAAANSUhEUgAAABAAAAAQAQMAAAAlPW0iAAAABlBMVEU\
AAAD///+l2Z/dAAAAM0lEQVR4nGP4/5/h/1+G/58ZDrAz3D/McH8\
yw83NDDeNGe4Ug9C9zwz3gVLMDA/A6P9/AFGGFyjOXZtQAAAAAEl\
FTkSuQmCC') no-repeat scroll left top;
}
\ + <LF> の行末は、次行に継続することを表す CSS の機能である。これは CSS 解釈時に除去されて、data URI が空白のないように正しく再構築される。
次のスクリプトは埋め込みデータを元にサブウィンドウを表示する。脚注などに使用できる。
window.open('data:text/html;charset=utf-8,' +
encodeURIComponent( // URL書式にエスケープ
'<!DOCTYPE html>'+
'<html lang="en">'+
'<head><title>Embedded Window</title></head>'+
'<body><h1>42</h1></body>'+
'</html>'
)
);
この例をInternet Explorer 8で表示しようとしても実行ファイルのセキュリティ制限のため失敗する。(訳注:en版のwikipediaにあった例をそのまま記述してある。セキュリティについて考慮すべき例なのでInternet Explorer 8以外でも注意。)
Base64 エンコードの JPEG 画像を埋め込んだ SVG
<svg>
<image width="64" height="24" href="data:image/jpeg;base64,
/9j/4AAQSkZJRgABAQEAYABgAAD/2wBDADIiJSwlHzIsKSw4NTI7S31RS0VFS5ltc1p9tZ++u7Kf
r6zI4f/zyNT/16yv+v/9////////wfD/////////////2wBDATU4OEtCS5NRUZP/zq/O////////
////////////////////////////////////////////////////////////wAARCAAYAEADAREA
AhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAQMAAgQF/8QAJRABAAIBBAEEAgMAAAAAAAAAAQIR
AAMSITEEEyJBgTORUWFx/8QAFAEBAAAAAAAAAAAAAAAAAAAAAP/EABQRAQAAAAAAAAAAAAAAAAAA
AAD/2gAMAwEAAhEDEQA/AOgM52xQDrjvAV5Xv0vfKUALlTQfeBm0HThMNHXkL0Lw/swN5qgA8yT4
MCS1OEOJV8mBz9Z05yfW8iSx7p4j+jA1aD6Wj7ZMzstsfvAas4UyRHvjrAkC9KhpLMClQntlqFc2
X1gUj4viwVObKrddH9YDoHvuujAEuNV+bLwFS8XxdSr+Cq3Vf+4F5RgQl6ZR2p1eAzU/HX80YBYy
JLCuexwJCO2O1bwCRidAfWBSctswbI12GAJT3yiwFR7+MBjGK2g/WAJR3FdF84E2rK5VR0YH/9k="/>
</svg>
(data: から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/12/26 15:43 UTC 版)
データ(英: data)は、個々の事実・数値、情報、統計、変数の項目である[1]。より厳密には、データとは1人または複数の人や物や事象に関する定性的または定量的な値の集まりである[1]。dataの単数形のデータム(英: datum)は、ある事実、情報、変数の単一の数値または非数値である[2]。
「データ」と「情報」は同じ意味で使われることがあるが、これらの用語には明確な意味がある。一般の出版物では、データは文脈内において表示または分析するときに情報に変換される、と言われることがある[3]。しかし、学術的な扱いでは、主題のデータは単なる情報の一群とされる。データの用途は、科学研究、経営管理(例: 販売、収益、利益、株価)、金融、統治(例: 犯罪率、失業率、識字率)、および事実上あらゆる形態の人間の組織活動(例: NPOによるホームレスの数の調査)におよぶ。
一般に、データは意思決定の要素である。推論、議論、計算の基礎として使用できる事実情報の最小単位である。データは、抽象的なアイデアから具体的な測定値、さらには統計に至るまで多岐にわたる。データは測定・収集・報告・分析され、グラフ・表・画像などのデータ視覚化のために使われる。一般的な概念としてのデータは、既存の情報や知識が、より適切な用途や処理に適した形で表現・コード化されていることを指す。生データ(未処理データ)とは、研究者によって洗浄・修正される前の数値や文字の集まりのことである。外れ値や明らかな機器またはデータ入力のエラー(例えば、北極圏の屋外に置かれた温度計が、熱帯の気温を記録している)を除去するためには、生データを修正する必要がある。データ処理は一般に、段階的に行われ、ある段階の「加工データ」は次の段階の「生データ」と見なされることがある。実地データは、制御されていない現場の(in situ)環境で収集された生データである。実験データ~とは、科学的調査の活動内で、観察と記録によって生成されるデータである。
データは「デジタル経済の新しい石油」と呼ばれている[4][5]。
データ、情報、知識、知恵は密接に関連した概念であるが、それぞれに役割があり、それぞれの用語には意味がある。一般的な見方では、データは収集され、分析される。データは何らかの形で分析されて初めて意思決定を行うのに適した情報となる[6]。つまり、あるデータ集合が誰かにとって有益であるかどうかは、その人がどの程度予期していたかによる。データストリームに含まれる情報量は、そのシャノンエントロピーによって特徴付けられることがある。
知識とは、ある主題に関する情報を扱った、豊富な経験に基づく理解のことである。たとえば、エベレストの高さは、一般にデータとみなされる。その高さは高度計で正確に測定し、データベースに入力することができる。このデータを、エベレストに関する他のデータと一緒に本に掲載することで、エベレストに登るための最適な方法を決めたい人に役立つように、山を説明することができる。エベレスト山頂に到達するための方法をアドバイスできるような登山経験に基づいた理解も「知識」と見なせるかもしれない。そして、この知識に基づいたエベレスト山頂への実際の登山は「知恵」と見ることができる。言い換えれば、知恵とは、人が持っている知識を、良い結果が得られるような状況で実践することである。このように知恵は、「データ」「情報」「知識」という抽象化された一連の概念を補完し、完結させるものである。
データは最も抽象度が低い概念で、情報はその次に抽象度が高く、知識は最も抽象的な概念とされることが多い[7]。この見方では、データは解釈を加えることによって情報に変わる。たとえば、エベレストの高さは一般に「データ」とされ、エベレストの地質学的特徴に関する書籍は「情報」とされ、エベレスト山頂に到達するための最適な方法に関する実用的な情報を含む登山ガイドブックは「知識」と見なされる。「情報」とは、日常的な使用から専門的な使用まで、さまざまな意味を持っている。しかし、こうした見方は、「データ」が「情報」が作られ、「情報」から「知識」が作られることを逆手に取った主張とも言える[8]。一般的に言えば、情報という概念は、制約、コミュニケーション、制御、データ、形式、指示、知識、意味、精神的刺激、パターン、知覚、および表現の概念と密接に関係している。バイノン・デイヴィスはデータと情報を区別するために記号の概念を用いている。データは一連の記号であるが、情報はその記号が何かを参照するために使われたときに生まれる[9][10]。
計算装置や機械が開発される以前は、人々は手作業でデータを収集し、それにパターンを当てはめる必要があった。しかし、計算装置や機械が発達し、これらのデバイスがデータを収集できるようになった。2010年代には、マーケティングや市民による社会福祉の利用状況の分析、科学研究に至るまで、さまざまな分野でデータを収集し、分類や加工するためにコンピュータが広く使われている。データ上におけるこうしたパターンは、知識を高めるための情報と見なされている。これらのパターンは「真理」として解釈されることもあり(ただし「真理」は主観的な概念となることもある)、一部の分野や文化では美的および倫理的基準として承認されることもある。知覚可能な物理的または仮想的な標識を残す出来事は、データを通して遡ることができる。標識と観察との間の関係が切れると、標識はもはやデータとはみなされなくなる[11]。
アナログ計算機は、データを電圧、距離、位置、または他の物理量として表現する。デジタルコンピュータは、固定されたアルファベットから取った記号の並びとしてデータを表現する。最も一般的なデジタルコンピュータは、二進数アルファベット、つまり、通常「0」と「1」で表される2文字のアルファベットを使用する。次に、数字や文字などの身近な表現は、この二進数アルファベットから構築される。データの中には特殊な形式もあって区別される。コンピュータプログラムはデータの集まりであり、命令として解釈することができる。ほとんどのコンピュータ言語では、プログラムと、プログラムが操作する他のデータとを区別しているが、Lispやそれに類する言語では、プログラムは他のデータと本質的に区別できない。また、メタデータ、すなわち他のデータの説明も区別することも有用である。メタデータに類似した、以前の用語は、補助データ(ancillary data)である。メタデータの原型の例は、書籍の内容の説明である図書館目録である。
データを登録する必要がある場合は必ず、データドキュメント(data documents)という形式のデータが存在する。データドキュメントには次のような種類がある。
これらのデータドキュメントの一部(データリポジトリ、データスタディ、データセット、ソフトウェア)はデータ・サイテーション・インデックスに、データペーパーは従来の書誌データベース、たとえばサイエンス・サイテーション・インデックスに索引付けされている[12]。
データの収集は、一次資料(研究者が最初にデータを入手する)または二次資料(科学雑誌で発表されたデータなど、他の資料によって既に収集されているデータを研究者が入手する)を通じて行うことができる。データ分析の方法論はさまざまで、データ・トライアンギュレーションやデータ・パーコレーションが含まれる[13]。前者は、研究の客観性を最大化し、調査対象の現象をできるだけ完全に理解するために、定性的および定量的方法、文献レビュー(学術論文を含む)、専門家へのインタビュー、コンピュータシミュレーションの5つの分析角度(少なくとも3つ)からデータを収集、分類、分析する方法を明確にしたものである。その後、後者は、最も関連性の高い情報を抽出するために、あらかじめ決められた一連のステップでデータを「浸透」させます。
国際標準化機構の「ISO/IEC 2382-1」および日本産業規格の「X0001 情報処理用語-基本用語」において、「データ」の用語定義は "A reinterpretable representation of information in a formalized manner suitable for communication, interpretation, or processing."「情報の表現であって、伝達、解釈または処理に適するように形式化され、再度情報として解釈できるもの」とされている。
電子データは、コンピュータ内にあるか、コンピュータに取り込める形になったデータである。例えば、単なる印刷物上の文字データと区別して、文字コードに変換された文字データ、単なる印刷物上の画像データと区別して、ビットマップデータやJPEG方式の画像に変換された画像データなどをいう。コンピュータ内部の情報処理の場合は、わざわざ電子データと称することはほとんどない。
日本では刑法条文などで用いられている法律用語の「電磁的記録」は電子データおよび磁気データとほぼ同じ意味である。
ネットワークを介してCPUやハードディスクなどに流れ込む整理されているデータや整理されていないデータの幅広く性質の異なる変動性、速度、量で、企業はそれをビジネスアドバイスに変換する[14]。
磁気データは、磁気記録されているデータである。磁気テープ、磁気ディスクなどのコンピュータ用の媒体や、ビデオテープ、定期券などの磁気ストライプに蓄えられる。近くに強力な磁石があると影響を受けて変化することがある。
データは、関連するものがひとまとまりにされ、整理されて保管されることが多い。これをデータ保管とよぶ。そこで保管されたデータの集まりをファイルと呼ぶ。
データの流れは、データフローと呼ばれ、データフローダイアグラムなどを用いて記述される。
処理の対象にされるデータの集合のことを、データベースとよぶ。
コンピュータの場合には、データはプログラム以外のものをさし、その形態は、文書、映像、音声など様々である。直接スイッチなどを使ってメモリ上に書き込む場合も有るが、大抵はプログラムによって出力され、他のプログラムなどで読み込み使われる。コンパイラなどの処理ではプログラムをインタプリタやコンパイラのデータとして扱う場合もある。またデータの中にプログラムを含むことも可能。x86などではプログラムとデータは同一のメモリー空間に配置され、設計者の意図によって区別される。
データは、レジストリやファイルやデータベース、などに収めることができる。
他の分野でもデータの活用が進んでいるが、その高度な説明的な性質は、データを「与えられたもの」とする倫理観と対立する可能性が指摘されている。ピーター・チェックランドは、膨大な数の可能なデータと、注意を向けているそれらのサブセットを区別するために、capta(ラテン語の capere、「取る」に由来)という用語を導入した[15]。ヨハンナ・ドラッカーは、人文科学が知識の生産を「立場的、部分的、構成的」なものと断言している以上、data を用いることは、たとえば現象が離散的であるとか観察者に依存しないといった逆効果となる臆説を広めかねないと論じている[16]。人文科学における視覚的表現のための data に代わるものとして、観察という行為を構成的なものとして強調する capta という用語が提案されている。
英語で初めて「data」という単語が使われたのは1640年代である。1946年に「データ」という言葉が「伝達可能で保存可能なコンピュータ情報」という意味で初めて使われた。「データ処理」(data processing)という表現が初めて使われたのは1954年である[17]。英語の「data」は、「datum」の複数形で、ラテン語・イタリア語の dare(ダーレ、「与える」)を語源とする[17]。英語の data はこの意味で複数名詞として使われることがあり、特に20世紀や21世紀の多くでは、自然科学、生命科学、社会科学に携わる作家は datum を単数形で、data を複数形で使っている(たとえば、APAスタイル(第7版)ではまだ data は複数形が要求されている[18])。しかし、日常会話、ソフトウェア開発、コンピュータサイエンスの世界では、data は不可算名詞として単数形で使われることがほとんどである。ビッグデータという用語は単数形をとっている。
中国語では「(ツーリャオ)」または「(シューチー)」ともいう。
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2018/03/03 05:44 UTC 版)
「ダンジョンマスター (MSX)」の記事における「DATA」の解説
現在の経験値、所持ゴールド、攻撃力とAC(アーマークラス)、持っている鍵、所持アイテムを順に表示する。
※この「DATA」の解説は、「ダンジョンマスター (MSX)」の解説の一部です。
「DATA」を含む「ダンジョンマスター (MSX)」の記事については、「ダンジョンマスター (MSX)」の概要を参照ください。
固有名詞の分類