https://cysec148.hatenablog.com/entry/2025/07/16/052505

Hello there, ('ω')ノ

👻 ハルシネーションって何？

✅ ハルシネーションとは、生成AIが事実に反する内容を“本当らしく”生成してしまう現象です。

これは意図的なウソというよりも、AIが 「もっともらしい言葉の並び」を優先して出力する結果、 “中身のない正しそうな話”をしてしまうことを意味します。

大前提として、GPTなどのAIは「事実」を理解しているわけではありません。 AIがやっているのは…

✅ 文章の続きを、文脈と統計的なパターンに基づいて予測しているだけ。

つまり、以下のような理由で“それっぽい嘘”が出てきます：

原因	内容
✅ 学習データに誤情報が含まれている	インターネットの文章には間違いや噂が混在している
✅ 未知の質問に対して創作してしまう	答えを知らないとき、推測で答えをでっちあげる
✅ 「言葉のつながり優先」だから	文法的・語感的に自然な文を優先して出力する（事実性は保証されない）
✅ ユーザーが自信ありげな応答を期待するため	「わかりません」よりも「知っているふう」の出力を好む

「2023年のノーベル平和賞は誰ですか？」→「ジョン・スミスが受賞しました」 ※ 実際にはそのような人物も受賞事実も存在しない

「その出典は？」→「○○論文（2021）によれば…」 ※ それっぽい論文名を勝手に生成してしまう

「PythonでExcelを読み込むコードを教えて」→ 間違った関数やライブラリを提案

ここで大事なのは、AIと人間のちがいです。

✅ ハルシネーションとは、AIが事実でないことを「本当らしく言ってしまう」現象

✅ 原因は、学習データの誤り・推測癖・統計的予測の限界など

✅ 使い手が「うのみにせず、確認する」ことが基本

✅ 出典指定やRAG活用で、精度を高める工夫が可能

Best regards, (^^ゞ