ChatGPT Agent公開
OpenAIは、「Operator」(ブラウザ操作が可能なモード)と「Deep Research」を統合した「ChatGPT Agent」を公開しました。
Agentは仮想コンピューター上でタスクを自律的に遂行し、スライドやスプレッドシートなどのファイルを成果物として生成することが可能です。
まずはPro/Plus/Teamユーザーに提供され、今後はEnterprise/Educationへ拡大予定となっています。
ChatGPT Agentのすごさ
1.3つの機能を1つに
OperatorのWebサイトを操作する機能、Deep Researchの集めた情報を深く分析する力、そして従来のChatGPTの人間のように自然な文章で受け答えする力が統合されています。
つまり、Web検索し、内容を理解した上で、分かりやすくレポートとして報告するまでを全部自動でできるのです。
2.様々なツールを使いこなして作業
作業内容に合わせて、Web画面やターミナル、API呼び出しなど使い分けます。もし途中で気になったら、AIの作業を止めて自分で操作を引き継ぐことも可能です。
3.自動で何でも実行する訳ではない
購入やメール送信といった大事な操作の前には必ず確認します。また、金融サイトなどリスクが高いサイトでは、タスクが実行されないようになっています。
使ってみた
DeepResearchが統合されているため、研究に使えるということでした。
そこで、日本の学校教育の課題に関するレポートを作成させて、追加でスライドを生成させてみました。
動作の様子は以下の動画でご確認ください。
4倍速をかけています。実際はスライド生成まで16分ほどかかりました。
フォローアップといって、プロンプトを追加で入力することにより、途中で作業を修正することができます。
思っていた回答と違って、再度指示することが減りますね。DeepResearchは時間が掛かるため、これは嬉しい機能です。
完成したレポートの一部は以下の通りです。




このレポートを元にスライドを生成させました。
生成されたスライド(一部)は以下の通りです。


グラフが生成されていることには驚きました。
スライドの内容に合わせてイラストも生成されています。
内容としては簡潔すぎるため、そのまま使用できるレベルではありませんが、たたき台としては十分かと思います。
スライドの全貌は以下のリンクから
現段階でここまで資料作成ができるのであれば、あと1年程すれば自分で資料を作成しなくてもよいレベルまで上がるような気がしますね。
他の作業をしている間にAgentにレポートを生成させることができ、我々がタスクを処理する量が大幅に増えそうです。
Operatorと同じくお店の予約などもできるようなので、また使ってみたいと思います。