以下の内容はhttps://gigazine.net/news/20230217-meta-toolformer-use-external-tools/より取得しました。



ChatGTPは自然言語処理において大きな変革をもたらしたといっていい存在ですが、一方で、ファクトチェックや数学といった基本的なタスクで問題が出ることがあります。Metaの大規模言語モデル「Toolformer」は、言語モデル部分を犠牲にすることなく、外部ツールをAPI経由で利用する方法を学習しており、検索エンジンや電卓、カレンダーなどを使用することができます。

[2302.04761] Toolformer: Language Models Can Teach Themselves to Use Tools
https://doi.org/10.48550/arXiv.2302.04761


Meta develops an AI language bot that can use external software tools | Ars Technica
https://arstechnica.com/information-technology/2023/02/meta-develops-an-ai-language-bot-that-can-use-external-software-tools/

ToolformerはどのAPIを呼び出すか、いつ呼び出すか、どの引数を渡すか、そして結果を将来のトークン予測に最適に組み込む方法を決定するようにトレーニングされたモデルだとのこと。


トレーニングにおいて、研究者は各APIがどのように使用されるのかを示す、人間が作成した小規模なサンプルセットを提供し、潜在的なAPI呼び出しで大規模言語モデルのデータセットに注釈をつけることを許可。人間の明示的な指導がなくても学習できるようにした結果、Toolformerは、テキストベースのAPI呼び出しを、他の形式のテキストであるかのように予測することを学習したとのこと。

これまで、大規模言語モデルは数学があまり得意ではありませんでしたが、ToolformerはAPIで電卓を呼び出すことでこの問題を回避できます。

なお、ニュースサイトのArs Technicaは、大規模言語モデルがAPIを呼び出せるようになったことで、アプリ内のユーザーデータに損害を与えたり、ブラウザなどを介して外部で問題を引き起こしたりする可能性があると指摘しています。




以上の内容はhttps://gigazine.net/news/20230217-meta-toolformer-use-external-tools/より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14