by Prachatai
2025年1月に推論モデル「DeepSeek-R1」を発表して大きな注目を集めた中国のスタートアップであるDeepSeekは、次世代モデルとなる「DeepSeek-R2」のリリースを当初の予定から前倒しする可能性があるとロイターが報じました。また、DeepSeekはオフピークの時間帯にAPIプラットフォーム利用料を最大75%割り引きすることも発表しています。
DeepSeek rushes to launch new AI model as China goes all in | Reuters
https://www.reuters.com/technology/artificial-intelligence/deepseek-rushes-launch-new-ai-model-china-goes-all-2025-02-25/
DeepSeek Offers 75% Discount on its Reasoning Model; New R2 Model to Release Before May
https://analyticsindiamag.com/ai-news-updates/deepseek-offers-75-discount-on-its-reasoning-model-new-r2-model-to-release-before-may/
DeepSeek-R1は「Mixture-of-Experts(MoE)」と「Multihead Latent Attention(MLA)」という技術を活用し、少ない計算リソースで高性能を実現していることで話題となりました。
DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか - GIGAZINE

中国政府はDeepSeekを支持し、少なくとも13の地方政府と10の国営エネルギー企業がDeepSeekのモデルを採用しています。同じく中国企業であるAlibabaも推論モデルのQwQ-32B-PreviewやQwQ-Max-Previewを開発し、DeepSeekとしのぎを削っています。
ロイターによれば、DeepSeekやAlibabaがし烈な競争を繰り広げる中で、DeepSeekは当初2025年5月上旬に発表予定だったDeepSeek-R2を前倒しにして発表するとのこと。DeepSeek-R2は前モデルのDeepSeek-R1と比較して、コーディング能力が改善されているほか、英語以外の言語での推論能力が向上しているといわれています。
また、DeepSeekは毎日16時30分から0時30分までのオフピークとなる時間帯に、APIプラットフォームの利用料を割り引きすると発表。入力(キャッシュヒット)は100万トークンあたり0.035ドル(約5円)、入力(キャッシュミス)は100万トークンあたり0.135ドル(約20円)、出力は100万トークン当たり0.550ドル(約82円)になり、DeepSeek-V3だと50%、DeepSeek-R1だと75%の割引きになります。
さらに、DeepSeekは5つのリポジトリを2025年3月初頭から順次オープンソース化すると発表しました。こうした動きは中国AI業界の競争が激しくなったことで、各企業が標準となるべくこぞってオープンソース化を検討している現れといえます。
DeepSeek-R1の開発企業が独自技術を次々にオープンソース化、AIの学習や推論を高速化可能 - GIGAZINE

ロイターは「DeepSeek-R2のリリースは、AIによるリーダーシップを国家の優先事項と位置づけているアメリカ政府にとっては懸念材料となる可能性があり、中国当局や企業のAI開発への取り組みをさらに活性化させるかもしれない」と述べています。