https://cysec148.hatenablog.com/entry/2025/07/09/160350

Hello there, ('ω')ノ

～AIが「知らないこと」に答えられるようにする仕組み～

ChatGPTなどのLLMは非常に賢く見えますが、弱点もあります。それは──

最新情報や社内独自の知識には対応できない ということ。

たとえば：

こうした質問には、LLMが訓練されたデータに含まれていなければ、正しく答えることができません。そんなときに役立つのが、「RAG（Retrieval-Augmented Generation）」という仕組みです。

外部ドキュメントを検索して、それを元にAIが回答を生成するしくみ

RAGは、「検索（Retrieval）」と「生成（Generation）」を組み合わせたアーキテクチャです。

ステップ	説明
① 検索（Retrieve）	ユーザーの質問に対して、関連する情報を社内文書などから探す
② 生成（Generate）	検索した情報を元に、LLMが自然な文章で回答を作成する

➡ つまり、AIが**「その場で調べて、答える」**ような動きを実現する技術です。

RAGの仕組みをシンプルに図解するとこうなります：

[ユーザーの質問]
　　　↓
[検索エンジン] ← 社内PDF、FAQ、Word、HTMLなど
　　　↓
[関連情報（数件）]
　　　↓
[LLMで要約・回答生成]
　　　↓
[自然な文章で返答]

このとき、検索に使う技術は全文検索やベクトル検索（semantic search）などがあります。

業務	RAGの活用例
社内ヘルプデスク	社内ナレッジやFAQから該当情報を引き、自然文で回答
法務チェック	過去の契約書やガイドラインを検索して根拠を提示
製品サポート	製品マニュアルから抜粋し、わかりやすい説明を提供
顧客対応	顧客別マニュアルや契約履歴を参照してパーソナライズ回答

技術	説明
ベクトルデータベース	文章の意味をベクトルに変換して検索（例：Pinecone, Weaviate, Chroma）
LangChain	RAGを組み立てるためのフレームワーク（LLM×検索の配線役）
ファイルインジェクション	PDF, Word, HTMLなどの社内資料を検索対象に追加
Chunking	文書を適切な長さに分割して意味を保ったまま検索できるように整形

項目	注意点・アドバイス
検索精度	関係のない情報が引っかかると、回答がぼやける
文書の構造化	PDFやWordは「見た目」ではなく「構造」で扱う必要あり
更新性	検索対象の情報を定期的にアップデートする仕組みが重要
出典の提示	ユーザーが「どの情報からの回答か？」を確認できると信頼性が上がる

Best reagards, (^^ゞ