楽天がRakutenAI-3.0を出しましたが、DeepSeek V3アーキテクチャモデルの追加学習モデルのようで、ちょっとそこが話題になってましたね。見せ方の問題もあって、フルスクラッチではないのかと。
https://huggingface.co/Rakuten/RakutenAI-3.0
一応、非公開ではあるけどベースモデルがあることは否定してない模様。
楽天の最新AI、ベースは“中国DeepSeek製”? 担当者に聞いた(1/2 ページ) - ITmedia AI+
で、気になったので、フルスクラッチで独自LLMを作れる企業の規模はどんなものか調べてみました。
日本でフルスクラッチで作ったLLMはこの1年でなんらかのモデルのプレスリリースが出たのだと、次の7モデルです。プレスリリースが新しい順。
| 組織 | モデル | サイト | 時価総額等 |
|---|---|---|---|
| SB Intuitions | Sarashina | 2025年11月 | 10兆円 |
| AI Inside | PolySphere | 2025年10月 | 90億円 |
| NTT | tsuzumi | 2025年10月 | 14兆円 |
| PFN | PLaMo | 2025年10月 | 1500億円 |
| NEC | cotomi | 2025年7月 | 5.6兆円 |
| Stockmark | Stockmark LLM | 2025年6月 | -- |
| NII LLMC | LLM-jp | 2025年5月 | -- |
ここで、SB Intuitionsは親会社ソフトバンクの時価総額、PFNはバフェットコードでの2025年12月の評価額。
NIIは国立情報学研究所です。
※ 追記 当初NTTデータとしてましたが、NTTグループでした。
独自モデルを作る会社の規模
NTTやソフトバンクのようにサービスを提供する事業会社だと10兆円以上、NECのようにシステム構築会社だと5兆円、AI構築専業だと1000億円という規模感が見える。
AI Insideは一時期株価が高騰して1000億を超えたときもあったけど、いまは落ち着いている。PolyShereは単独提供していなくて、DX Suiteに組み込まれて使う。プレスリリースを見る感じだとOCR専用に近い印象。こうして特化したものであれば100億円企業で作れる、ということだろうか。
謎なのはStockmarkで、調達額を見ても200億円いってなさそう。それで100Bのモデルを作っている。入ったお金、ぜんぶ燃やしてGPUを動かすことになりそうだけど。
気になるのはStockmark-2-100B-Instructで、betaが取れたものを2025年7月に公開しているのにプレスリリースがなく、サイトのリリースモデルでも触れられていない。2025年6月には画像対応版が出ていて、名称にはbetaがついていないんだけど、HuggingFaceのモデル名にはbetaがついているので、そのあとでbetaが取れたということになる。
ぜひStockmark 3を出して、この規模の会社でも100Bクラスが開発できるというのを見せ続けてほしいところ。
追加学習モデルを作る会社の規模
CyberAgentは2024年のCyberAgentLM3までは独自だったけど、2025年にはDeepSeek-R1のQwen2.5ベース蒸留モデルに追加学習したものを出しています。
ここで内容に触れていた。
rinnaのDeepSeek R1蒸留モデルがすごい - きしだのHatena
CyberAgentは時価総額7200億円。楽天グループの時価総額が1.6兆円。
この規模の事業会社で独自LLMというのは厳しく、けれども追加学習して独自モデルとして出すにはこの規模が必要、ということだろうか。
初期に独自モデルを出していたrinnaはHugging Faceは残ってるものの、Xのアカウントは消えて、GitHubのリポジトリは非公開になってしまっています。
ところで1月にLiquid AIというところからLFM2.5-1.2B-JPという日本語対応モデルが出ていた。
LFM2.5 のご紹介:オンデバイス AI の次世代 | Liquid AI
このLiquid AIには伊藤忠テクノソリューションズが出資して日本語対応を共同で行っている。
AIビジネスの拡大を目指しLiquid AIに出資 | 伊藤忠テクノソリューションズ株式会社のプレスリリース
ちなみに伊藤忠テクノソリューションズは2024年12月の上場廃止時の時価総額は1兆円。
10兆円企業ってどこ?
10兆円企業、25社あって、トヨタ、三菱UFJ、日立、三菱商事、ソフトバンクグループ、ファーストリテイリング、ソニー、三井住友FG、東京エレクトロン、三井物産、アドテスト、三菱重工、伊藤忠商事、みずほFG、中外薬品、キーエンス、NTT、信越化学、任天堂、キオクシア、JT、東京海上、三菱電機、KDDI、ソフトバンクです。リクルートはギリ足りないけどタイミングによっては入りそう。
この中で、トヨタはPFNに出資、KDDIはELYZAと共同でLlama-3.1-ELYZA-JP-70Bを作っています。子会社がLLM開発に関わってるのは伊藤忠商事、NTT、ソフトバンクということで、25社中5社。
顔ぶれを見ると、いずれにせよ、AI開発子会社を作って開発ということになると思う。雇用体系も変わるだろうし。
日立は基本になるモデルを作るのではなく、顧客にあわせて学習させていく方針みたいですね。
日立、顧客の業務ごとに最適化したLLMを提供 “LLMの工場”目指す - ITmedia AI+
ソニーや任天堂含め他の会社は、独自学習させたLLMを作っても外に出す動機はなさそう。プレステやSwitchに組み込む必要性も薄いし。