以下の内容はhttps://cysec148.hatenablog.com/entry/2025/07/09/160350より取得しました。


第66回:RAGとは?外部知識でLLMを強化する技術

Hello there, ('ω')ノ

~AIが「知らないこと」に答えられるようにする仕組み~

ChatGPTなどのLLMは非常に賢く見えますが、弱点もあります。 それは──

最新情報や社内独自の知識には対応できない ということ。

たとえば:

  • 「新しい経費申請ルールはどうなった?」
  • 「このプロジェクトの背景は何?」
  • 「社内FAQの最新更新内容を教えて」

こうした質問には、LLMが訓練されたデータに含まれていなければ、正しく答えることができません。 そんなときに役立つのが、「RAG(Retrieval-Augmented Generation)」という仕組みです。


🔍 RAGとは?

✅ 一言で言うと:

外部ドキュメントを検索して、それを元にAIが回答を生成するしくみ

RAGは、「検索(Retrieval)」と「生成(Generation)」を組み合わせたアーキテクチャです。

ステップ 説明
① 検索(Retrieve) ユーザーの質問に対して、関連する情報を社内文書などから探す
② 生成(Generate) 検索した情報を元に、LLMが自然な文章で回答を作成する

➡ つまり、AIが**「その場で調べて、答える」**ような動きを実現する技術です。


🧠 なぜRAGが必要なのか?

課題 RAGでの解決
LLMが社内ルールを知らない 社内文書やマニュアルを検索して補完
モデルを毎回学習し直すのは非現実的 モデル本体は固定、知識は外から取り込む
法務・医療など頻繁に変わる分野に弱い 最新の資料から情報を都度参照できる
回答の裏付けがない 出典ドキュメントを一緒に提示できる

📦 RAGの構成イメージ(非エンジニア向け)

RAGの仕組みをシンプルに図解するとこうなります:

[ユーザーの質問]
   ↓
[検索エンジン] ← 社内PDF、FAQ、Word、HTMLなど
   ↓
[関連情報(数件)]
   ↓
[LLMで要約・回答生成]
   ↓
[自然な文章で返答]

このとき、検索に使う技術は全文検索やベクトル検索(semantic search)などがあります。


💼 RAGの活用事例

業務 RAGの活用例
社内ヘルプデスク 社内ナレッジやFAQから該当情報を引き、自然文で回答
法務チェック 過去の契約書やガイドラインを検索して根拠を提示
製品サポート 製品マニュアルから抜粋し、わかりやすい説明を提供
顧客対応 顧客別マニュアルや契約履歴を参照してパーソナライズ回答

🛠 RAG構築に使われる主な技術

技術 説明
ベクトルデータベース 文章の意味をベクトルに変換して検索(例:Pinecone, Weaviate, Chroma)
LangChain RAGを組み立てるためのフレームワーク(LLM×検索の配線役)
ファイルインジェクション PDF, Word, HTMLなどの社内資料を検索対象に追加
Chunking 文書を適切な長さに分割して意味を保ったまま検索できるように整形

🔑 実装時のポイント(初心者向け)

項目 注意点・アドバイス
検索精度 関係のない情報が引っかかると、回答がぼやける
文書の構造化 PDFやWordは「見た目」ではなく「構造」で扱う必要あり
更新性 検索対象の情報を定期的にアップデートする仕組みが重要
出典の提示 ユーザーが「どの情報からの回答か?」を確認できると信頼性が上がる

✅ まとめ:RAGで「AIが調べて答える」時代へ

  • RAGは、LLMを社内知識で“賢く”する方法
  • モデル自体を変えずに、業務に即した情報で補強できる
  • 特に法務・FAQ・規程・マニュアルなどの分野で大きな効果
  • 「検索+生成」が融合した設計は、今後の業務AIの基本スタイルになる

Best reagards, (^^ゞ




以上の内容はhttps://cysec148.hatenablog.com/entry/2025/07/09/160350より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14