皆さんこんにちは。バックエンドエンジニアの前田です。
最近は、いよいよ暑さが本気を出してきたので、熱中症対策をしなくては、と考えています。
さて、今回はDifyのv1.0.0で追加されたReActを用いてナレッジ/記事要約エージェントを作成しました。
ナレッジに登録したドキュメントなどをもとに、Web検索もして情報を補足し、文章を要約するエージェントが欲しいと思い、作ってみました。
Difyの環境構築と基本的な使い方については以下の記事を参考にしてみてください。
今回はDifyのv1.6.0を用いて作成しました。
acro-engineer.hatenablog.com
1. DifyにおけるReActとは
Difyには「エージェントノード」という自律的にツールを呼び出すコンポーネントがあります。
ReActとは、エージェントノードにおけるツール使用の戦略のうちの一つで、思考(Reason)と行動(Act)を交互に繰り返す戦略です。
LLMが現状分析をし、ツール選択/実行と結果の評価のサイクルを問題解決まで繰り返します。
情報検索や、複雑なタスクの分割・実行など様々な場面で活用できます。
詳しくは以下の公式ページを参照してみてください。
docs.dify.ai
2. 今回作成するアプリについて
ナレッジに登録した情報をメインに、Web検索をして補足を行い、それを要約するナレッジ/記事要約をするエージェントを作成します。
ナレッジに登録された情報をもとに推論(Reasoning)を行い、不足する情報はWeb検索(Acting)で補完、その結果を要約してナレッジ化する、
という「ReAct(Reason + Act)」のプロセスを実現するエージェントを構築します。

2.1. 構成
構成は以下のようにしました。
- ナレッジ検索
- エージェントノード(ナレッジ/記事要約)
ナレッジ検索はツール化して、ReAct内でツールとして呼び出す構成にしました。
2.2. ナレッジ検索
ここでは、ユーザーの入力からナレッジ検索をするまでの流れを作成します。
まずナレッジを作成します。
今まで公開してきた技術ブログの本文をURLから読み込ませています。
これらのドキュメントから、まとめ記事を作成してもらおうと思います。

次に、ナレッジから検索する処理を作成します。
ワークフローにて、「知識検索」を選択し、検索変数にユーザーからの質問を、ナレッジベースに先ほど作成したナレッジを指定します。

その後、右上の「公開する」から公開し、「ワークフローをツールとして公開する」の設定を押します。

ツールコール名とユーザー入力の部分は「LLM入力」を選択し、「保存」ボタンを押し保存します。
これで、ユーザー入力からナレッジ検索をする処理までの作成が完了しました。

2.3. エージェントノード
ここでは、エージェントノードを作成します。
まずは、ブロックの「エージェント」を選択します。

「エージェンティック戦略」にて、「ReAct」を選択します。
※事前に「Dify Agent Strategies」のプラグインをインストールしておく必要があります。

その後は、モデル、ツール、プロンプトを指定します。
今回は、モデルはgpt-4.1、ツールには先ほど作成したナレッジ検索ツールとPerplexityを指定しました。
これで、LLMが判断してナレッジ検索を複数回行い、Web検索をして情報を補足することができます。

また、1回はユーザーからの要望に対して不明瞭な部分を聞き返し、
3回までは情報が不足する場合は聞き直してほしかったので、以下のようなプロンプトにしました。
dialogue_countというものが会話の回数をカウントしているようです。

以上で作成が完了したので、実際に動かしてみます。
3. 実際に動かしてみる
以下の入力をしてみます。
ユーザー:
まとめ記事を作成してください。
これに対して、以下のような質問が返ってきました。
どのようなまとめ記事を作成したいか、具体的な情報を聞いてきていますね。
LLMからの回答:
まとめ記事の作成内容について、もう少し詳しくお伺いさせてください。
- まとめたいトピックやテーマは何ですか?
- 対象となる読者層(例:社内向け、一般向け、専門家向けなど)を教えてください。
- 取り上げたい具体的なキーワードや注目点、記事の長さの希望などがあればご指定ください。
これらを教えていただけると、より適切なまとめ記事の作成が可能です。
これに対しては、以下のようにそれぞれ返答しました。
ユーザー:
1. Difyとbolt.new
2. 最新技術に触れたことがあるが、チュートリアルが必要な人
3. 複数モデル、画面レイアウトについてまとめてほしい。4記事を要約すること。各記事にリンクをはり、200文字程度の要約をすること。
以下のまとめ記事が作成できました。
今回はあまり長い文章にしたくなかったので、各記事200文字程度に指定しましたが、要望次第ではもっと長くしたり、逆に文章を削ったりすることもできました。
【ナレッジ情報まとめ】
■ Dify関連記事より
Difyは複数の大規模言語モデル(LLM)を活用できるオープンソースのアプリ開発プラットフォーム。
ノーコードで複数モデルの切り替えや複雑なワークフロー(チャットフロー)が作成可能。
最近のアップデート(v0.8.0)で「パラレル処理(並列処理)」機能が追加され、より複雑かつ効率的なAIアプリの構築ができるようになった。
複数のモデル(GPT-4o、Claude3.5-sonnet、Gemini1.5Proなど)や分岐処理、変数集約器などを組み合わせたボット作成例が紹介されている。
参考記事:https://acro-engineer.hatenablog.com/entry/2024/08/21/110000
https://acro-engineer.hatenablog.com/entry/2024/09/13/123702
■ bolt.new関連記事よりbolt.newはシーケンス図や画面イメージから自動的にUIやアプリの生成ができるAI支援型開発プラットフォーム。
画像アップロードによる画面レイアウト自動生成や、シーケンス図画像からのアプリ自動構築など、高度な自動化を実現。
複雑な機能も自然言語や画像指示で少ない手間で実現でき、素早く動くプロトタイプを作成できる。
実際の記事では具体的な画面生成手順やシーケンス図をもとにした生成例が詳しく解説されている。
参考記事:https://acro-engineer.hatenablog.com/entry/2025/01/07/120000
https://acro-engineer.hatenablog.com/entry/2025/01/08/120000
【Web検索(最新外部情報)の補足】Difyは2025年7月に1.4.0が公開、モダンなUI/UXデザインへの刷新や「黒モード」「マルチモーダル出力(テキスト/画像等)」「編集・可変ワークフロー」「多モデル・多機能ノードの拡張」等、さらなる高機能化が図られている。
Bolt.new(Bolt.diy)は、ブラウザ内でマルチLLM(複数AIモデル)を使い分けてコーディングやWeb開発ができる“オールインワン”のプラットフォームとして2024年以降も高速で進化中。自然言語操作による低コード開発、ワークフローの一元化・短縮が注目される。
【まとめ】Difyは「モジュール化されたAIワークフロー実装」や「複数LLM連携」を強みとし、チャットなど業務自動化/カスタムAIボット構築を得意とする。
bolt.newは「画像や図による直観的なUI・アプリ生成」「ブラウザ内で完結する低・ノーコードAI開発」「フロントエンドまで一気通貫」が魅力。
両者とも最新LLM・生成AI技術を駆使し、開発の民主化・生産性向上・迅速なアプリ実現に寄与していることが2024年の共通的トレンド。
出典:https://cloud.tencent.com/developer/article/2521071
https://blog.csdn.net/beautifulmemory/article/details/148875828
https://acro-engineer.hatenablog.com/entry/2024/08/21/110000
https://acro-engineer.hatenablog.com/entry/2025/01/07/120000
ご要望の「Difyとbolt.new」の最新記事要約は以上です。
ナレッジの内容を検索し、それぞれポイントを要約してくれました。
また、Perplexityを用いたWeb検索をして、最新の情報を含めた補足をしてくれました。
4. まとめ
今回は、ReActを用いて、ブログ記事をWeb検索で補足をしつつ要約させてみました。
今回はツールとして、ナレッジ検索とPerplexityを用いてReActを使ってみましたが、DALL-Eを用いて画像生成してみたり、自分で作成したワークフローを用いてみたりすることもできます。
色々なツールが使えて、アイディア次第で何でもできるのではないか、と思えてきますね。
思いついたことがあれば、ReActで実現できないか、考えてみるのも面白そうです。
Acroquest Technologyでは、キャリア採用を行っています。
- Azure OpenAI/Amazon Bedrock等を使った生成AIソリューションの開発
- ディープラーニング等を使った自然言語/画像/音声/動画解析の研究開発
- マイクロサービス、DevOps、最新のOSSやクラウドサービスを利用する開発プロジェクト
- 書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。