以下の内容はhttps://tamakino.hatenablog.com/entry/2024/10/27/080000より取得しました。


中国でも生成AIの幻滅期に。AIはエージェントに進化をする。アリペイ、タオバオの取り組み

まぐまぐ!」でメルマガ「知らなかった!中国ITを深く理解するためのキーワード」を発行しています。

明日、vol. 252が発行になります。

登録はこちらから。

https://www.mag2.com/m/0001690218.html

 

今回は、中国の対話型生成AIの状況とAIエージェントについてご紹介します。

 

ガートナーの「生成AIのハイプ・サイクル」レポート(https://www.gartner.co.jp/ja/newsroom/press-releases/pr-20240910-genai-hc)が話題になっています。生成AIはすでに幻滅期に入ったという内容だからです。

もちろん、生成AIすべてが幻滅期に入ったのではなく、「生成AI対応仮想アシスタント」が幻滅期に入ったとされました。いわゆる「ChatGPT」アプリやウェブから利用する対話型生成AIのことです。

ガートナーの生成AIのハイプ・サイクル。「生成AI対応仮想アシスタント」が幻滅に入ったとされた。「Gartner、「生成AIのハイプ・サイクル:2024年」を発表 」より引用。

 

確かに当初はプロンプトの書き方次第でなんでもできるように思えましたが、現実はそうは甘くなく、結局落ち着いてみると、単純知的作業を代行させる使い方が多くなっています。例えば、会議の議事録作成などです。音声を録音しておいて、テキスト化し、議事録をつくってもらう。うまくプロンプトをつくっておく必要はありますが、一度つくってしまえばあとは自動化ができます。

議事録は後で活用するということはほぼありません。しかし、まれに必要なことがあり、つくらないわけにもいきません。こういう業務としての重要度は低いものの、やらないわけにはいかない業務を代行してもらうには生成AIはぴったりです。

あるいは、定例の報告書の文面や定型に近いメールの文面を書いてもらって、コピペして送っているという方もいるのではないでしょうか。定型の報告書やメールというのは、あればいいだけで、相手も本気で読んだりしたりはしません。そのようなものに、内容を考え、メールの場合は敬語の使い方を考え、時間をかけるのは意味がありません。対話型生成AIはこういう単純知的作業を代行してくれます。

 

では、AIはこういった人間の下働きをする存在なのでしょうか。そうでないことはみなさんも感じていらっしゃると思います。個人を超えた知能を持つこともほぼ確実で、感情をシミュレーションすることもさほど難しくなく、将来は人間と同等かそれ以上の存在になるという予感を持たれているかと思います。リモートワークを基本にしたスタートアップを起業したら、2、3人AIが混ざっていてもわからないという時代はそう遠くなくやってくるかもしれません。

ガートナーのレポートでも、「生成AI対応仮想アシスタント」は幻滅期に入ったものの、4つの技術が期待のピーク前にあり、今後有望になるとしています。

1)マルチモーダル生成AI

テキストだけでなく、視覚、聴覚さらには触覚、嗅覚なども理解できるAI。グーグルのGemini(ジェミニ)がマルチモーダル化を進めています。

2)オープンソースLLM

大規模言語モデル(LLM)のオープンソース版です。広く利用されるだけでなく、改造をすることも可能であるため、さまざまな分野で使われる可能性があります。メタのLlama(ラマ)がオープンソース戦略をとっています。

3)ドメイン固有の生成AIモデル

オープンなネット環境ではなく、組織内だけで利用できる専用の生成AIモデルです。オープンソースのLlamaなどを個別の企業向けにファインチューニングして開発するのが一般的です。今、企業での生成AI活用が、現場従業員の個人利用レベルに留まっているのは、セキュリティ面が評価できないからです。組織専用のクローズドなAIモデルが登場することで、あらゆる業務が一気にAI化されていくことになります。

4)自律エージェント

人間と対話をするだけでなく、与えられたタスクを理解し、実行してくれるAIです。例えば、「明日から3日間、大阪出張です。手配をお願い」と対話型生成AIに頼んでも「それはできません。大阪の美味しいものをご紹介しましょうか?」になってしまいますが、自律エージェントは、新幹線とホテルの予約が必要であることを推論し、実際にチケット購入や予約をしてくれるというものです。

 

中国ではこの4つのうちの自律エージェントの方向への進化が進んでいます。ひとつにはマネタイズがしやすいということがあります。例えば、スマートフォンの設定やスケジュール管理などをしてくれるエージェントを開発すれば、AIスマホを開発するメーカーが喜んで買ってくれます。

もうひとつの理由は、エージェントとの相性がいい環境が揃っていることです。その環境とは「支付宝」(アリペイ)、「微信」(WeChat)などのスーパーアプリの存在です。スーパーアプリでは、大量のミニプログラムを呼び出すことで、ファストフードのモバイルオーダーをしたり、公共交通のチケットを購入することができます。このようなスーパーアプリに自律エージェントを実装することで、「明日から3日間、大阪出張です。手配をお願い」が可能になるのです。まだいろいろ課題はありますが、すでにアリペイでは「支小宝」というAIエージェントが搭載され、初歩的なタスクは実現できています。

そこで、今回は、まず中国の主要テック企業の大規模言語モデルがどのような状況になっているのかを整理します。そして、AIエージェントとはどのようなものであるかをご紹介します。最後に、AIエージェントの実装例として、アリババの「アリペイ」「淘宝網」(タオバオ)の例をご紹介します。

 

続きはメルマガでお読みいただけます。

毎週月曜日発行で、月額は税込み550円となりますが、最初の月は無料です。月の途中で購読登録をしても、その月のメルマガすべてが届きます。無料期間だけでもお試しください。

 

今月、発行したのは、以下のメルマガです。

vol.249:スターバックスがカフェ競争から離脱。外資系飲食チェーンに圧倒的に足りていない製品イノベーション

vol.250:アップル税をめぐってテンセントとアップルが深刻な対立。最悪の場合はWeChatの配信停止も。アップストアの問題とは

vol.251:人類が体験したことがない速度で進む中国の高齢化。シルバービジネスに有用な考え方とは

 




以上の内容はhttps://tamakino.hatenablog.com/entry/2024/10/27/080000より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14