「まぐまぐ!」でメルマガ「知らなかった!中国ITを深く理解するためのキーワード」を発行しています。
明日、vol. 313が発行になります。
登録はこちらから。
https://www.mag2.com/m/0001690218.html
今回は、AIスマホの登場とその課題についてご紹介します。
今年2025年12月1日、中国では革命的なことが起こりました。バイトダンスが自社のAIアシスタント「豆包」(ドウバオ)を搭載したスマートフォンをモニター販売したのです。これまでAIを搭載したことをウリにしたスマホは各社から販売されていましたが、自社のAIアプリがプリインストールされているとか、スマホのメーカー純正アプリでAI機能が使えるというレベルにとどまっていました。
しかし、豆包スマホは、他社アプリも操作をすることができ、スマホのあり方を一変させてしまうインパクトを持っています。予定していた3万台は数時間で売り切れました。本体は、ZTEのNubia M153ですが、左側面にAI専用の物理キーがあります。これを押すと、豆包が立ち上がり、音声またはテキストでスマホのアプリを操作できるようになります。
中国では以前から音声でスマホを操作するのは、スタンダードスタイルのひとつになっており、ワイヤレスイヤホンを使えば、スマホをポケットに入れたまま、「豆包、豆包」のウェイクワードで、スマホに手を触れずに操作できるようになります。
具体的にどのようなことができるかは、後ほどご紹介しますが、この熱狂は72時間ほどしか持ちませんでした。さまざまな問題が一気に浮上したからです。
翌日になると、豆包がWeChatを操作できないという問題が発生しました。AIがWeChatを操作しようとすると、アラートダイアログが現れて「手動でログインをしてください」と表示されるようになりました。WeChatの運営元であるテンセントが、AIによる自動ログインをさせないように対策をしたのです。
さらに、これにタオバオ、アリペイ、高徳地図、京東、王者栄耀、建設銀行、招商銀行などのアプリが続き、豆包がアクセスできないアプリが増えていきました。というより、主要なアプリはほとんどすべてです。
結局、72時間の間に豆包の革新的な機能はほとんど骨抜きにされ、熱狂は消えてしまいました。
しかし、バイトダンスは豆包AIアシスタントの開発はやめませんし、正式版の発売に向けて開発を続けています。モニター版で大きな問題が起き、それを解決することに奔走しています。
そして、ここが重要ですが、開発元でアルバイトダンスも、アプリを遮断した各社も、使う消費者も、この豆包スマホが次世代デバイスのひとつのスタンダードになるという点では一致しています。
噴出した問題は4つのカテゴリーに分類することができます。
1)技術的課題
2)エコシステムの壁
3)人間の拒否感
4)収益化の壁
です。
今回は、豆包スマホでどんなことができるのかをご紹介し、それから4つの課題をご紹介します。そして、最後に、どのような解決先が考えられるかについてもご紹介します。
まず、豆包スマホでどんなことができるのかをご紹介します。
1:ウェブ内容について尋ねる
これは多くの方が想像がつく使い方です。写真やウェブを見ていて、AIキーを押して「これはどこの風景?」と尋ねると答えてくれます。これは、今ではほとんどのAIでできることですが、写真をわざわざ入力しなくても、表示しているだけで認識してくれることに注意してください。

2:目の前のものについて尋ねる
同じことは写真ではなく、カメラを使って、目の前のものについて尋ねることもできます。この場合は、文字が書いてあるので、文字を読み上げ、それを中国語に翻訳もしてくれます。また、画像の中の人物が何をしようとしている情景なのかを推論して答えてくれます。
これも一般的なAIでもだいたいできると思います。

3:写真のレタッチ
写真を表示して、「写真の中の人物を消してください」と頼むと、その処理を行ってくれます。これも、一般的なAIでもできることですが、写真を入力したり、人物の位置を指定する必要はありません。

4:いちばん安い商品を探して購入する
この辺りから、AIスマホの本領が発揮されます。ウェブやSNSで見かけた商品を表示したまま、「この商品を各ECで最安値のものを探して、購入して」と頼むと、AIはタオバオや京東などのアプリを起動して、商品の検索を行い、価格を比較して、最終的に「ピンドードーで最安値の商品を見つけました。購入しますか」と尋ねます。OKにすると、実際に決済が行われ、商品が購入できます。

AIは各ECアプリを起動し、写真から商品名を特定し、検索をして価格を記憶していきます。当然、容量別に価格を整理します。これを主要なECアプリで行い、最終的に最安値のものを提案してくれます。
このため、タスクが終わるまでには数分が必要です。その間、実際にアプリが起動され、操作がされていきますから、見ていてもかまいませんが、スマホを閉じてしまってもかまいません。終わるとプッシュ通知をしてくれます。

また、このようなタスクは複数を同時並行でも行うことができ、まさにアシスタントとして利用できます。ここで、タオバオなどのアプリがAIによるログインを拒否したため、この使い方はログインを拒否していないECでしか使えなくなっています。
5:自動車を操作する
中国ではすでに電気自動車(EV)が主流になっていて、EVは電気で駆動するというだけでなく、車両すべてがデバイス化をしているのが特徴です。そのため、専用アプリがあるのが普通で、アプリから施錠状況などを調べたり、操作したり、自動運転機能のある車では、自分のいるところまで車が走ってきてくれる召喚機能を使うことができます。
ワイヤレスイヤホンをつけていると、音声でスマホが操作できますから、音声でAIを起動すると、自動車アプリを操作することができます。この例では、手に荷物を持っているために、音声で「トランクを開けて」と伝えています。

さらに、AIはさまざまな情報を自動的に記憶してくれます。ショッピングモールなどの駐車場に向かう時に、「私の車はどこにある?」と尋ねると、「A棟C12番です」と答えてくれます。新幹線に乗る時に「私の席はどこ?」と尋ねると、「8号車16Cです」と答えてくれます。このようなことが、わざわざ自分でメモをつくっておかなくても、駐車場や鉄道のチケット、自動車の位置情報など関連のあるものを調べて答えてくれます。
6:プランニングをする
さらに、素晴らしいのは豆包は推論機能を持っており、自分で計画を立てることができます。「来週の8日から3日間、上海に観光に行く。ベストプランを立てて」というと、旅行プランを立ててくれます。
これは一般的なAIでもやってくれることです。しかし、豆包が異なるのは、パーソナライズと執行です。スマホの中に保存されている履歴などから、その人の嗜好を割り出して、それに沿ったプランを立ててくれます。過去、美術館に行くことが多い人には美術館をプランに組み込みます。麺類が好きな人だとわかれば、麺類の名店をプランに組み込みます。
さらに、「飛行機の予約」「ホテルの予約」「美術館などのチケット」「飲食店の予約」が必要だと判断して、各アプリを使い、購入の承認を待ちます。提案されたプランを見て問題がなければ、実際にチケットを購入して決済し、デジタルチケットをスマホの中に格納してくれます。
まさに未来であり、将来のデバイスがスマホの形をしているかどうかはわかりませんが、スマホという形状の中では最も理想に近い感覚になります。
おそらく、近い未来では、片側イヤホンまたは外部音を通過させるイヤホンを装着して、ポケットかバッグにスマホを入れ、歩きながら音声でさまざまなタスクをAIに伝えるということになりそうです。そして、座れる場所があったら、そこでスマホを開き、承認待ちタスクを処理したり、視覚コンテンツを楽しむということになります。
こうなると、スマホが手に持ちやすい形である必要はなく、折りたたみタブレットのような形状になっていくのかもしれません。
こんな素晴らしい豆包スマホですが、なぜ72時間で落胆することになったのでしょうか。先ほど触れた4つの障壁について考え、それの解決策を探っていきます。
続きはメルマガでお読みいただけます。
毎週月曜日発行で、月額は税込み550円となりますが、最初の月は無料です。月の途中で購読登録をしても、その月のメルマガすべてが届きます。無料期間だけでもお試しください。
今月、発行したのは、以下のメルマガです。
vol.309:クイックコマースは黒字化ができるのか。イオン、ディンドン、サムズクラブ、フーマの挑戦
vol.310:フィルターバブルを乗り越えることはできるのか。中国SNSが採用し始めた次世代リコメンドアルゴリズム
vol.311:2025年に起きたAIの7つの重要トピック。2026年に起きる10の予測
vol.312:急速に普及するAIエージェント。4つのコンポーネントと5つの課題
バックナンバーポッドキャスト放送中!
ビデオ版バックナンバーも放送中!
