以下の内容はhttps://vengineer.hatenablog.com/entry/2025/09/01/080000より取得しました。


富岳NEXTの2024版と2025年版を比較してみた

はじめに

このブログでも、富岳NEXTで採用されるとされている Fujitsu MONAKA について、何度か取り上げました。

今回は、2024年と2025年の富岳NEXTについて、記録に残します。

2024年の富岳NEXT

の資料では、下記のような感じにシステムアーキテクチャになっていました。

資料では、MONAKA (CPU) は、Scale-up Network に接続する感じです。つまり、NVLINK Switch に CPU が接続する想定です。

2025年の富岳NEXT

の資料では、下記のような感じにシステムアーキテクチャがちょっと変わっていました。

違いは、MONAKA-X(CPU) が NVIDIA GPU に直接接続するというもの。

何故? 2024年 => 2025年で変わったのか?

が多いんじゃないのでは?と思っています。

富岳NEXTの目標は、「AI for Science」であり、加速器として、NVIDIAGPUを使う。となると、NVIDIAGPUのエコシステムを取り込みたい。できれば、変更無しで。ということになります。

CPUがGPUと、NVLINK Fusion IPにて接続できるようになれば、NVIDIAのGrace-Hopper/Blackwellと同じ構成になり、基本的にはソフトウェアの変更はないです。。。

そして、もう一つ。NVIDIAGPUに関しては、市場の80%以上、もしかしたら、90%のシェアを取っているので、独禁法に引っ掛かる可能性が高くなっているのでは?と思っています。 特に、Grace+Hopper => Grace+Blackwell になり、GPU(Blackwell)の性能を使うために、NVLINK-C2C での接続でGraceで接続。次に出てくる Vera+Rubin ではそれがより強化されます。 そこがちょっとと。

NVLINK Fusion IP を提供することにより、誰でも(契約すれば)、NVIDIAGPUと NVLink で接続できるようになるので、この問題は無くなるという感じです。

追記)、2025.09.04

に下記のような記載がありました。

But an antitrust lawsuit against Nvidia – which is not outside the realm of possibility and would parallel those that compelled changes in IBM’s behavior in the mainframe era – could make that third option available by consent decree if such a suit, should it materialize, be settled.

Google翻訳によると、

しかし、Nvidiaに対する独占禁止法訴訟(これはあり得ないことではなく、メインフレーム時代にIBMの行動規範を改めさせた訴訟に匹敵するでしょう)が起これば、もし訴訟が実現し、和解が成立すれば、同意判決によってこの3番目の選択肢が利用可能になる可能性があります。

「AI for Science」開発用スーパーコンピュータ

MONAKA => MONAKA-X になり、NVIDIA GPU と NVLINK Fusion IP で接続するようになったことで、NVIDIAGPUのエコシステムもそのまま使える。

そして、MONAKA-Xを開発中でも、NVIDIAのGrace-Blackwell (GB200) を使えば、「AI fo Science」の開発は進められる。

によると、

  • NVIDIA GB200
    • Super Micro社製の温水冷却サーバ

おわりに

下記は、「富岳NEXT]テストベッドの整備計画 (案)です。

  • FY2025 - FY2026 : Phase 1: 小規模クラスタ : 合計200 GPUs。200 GPU だと、GB200 なら、100セットで構築可能
  • FY2026 - FY2029 : Phase 2 : 中規模クラスタ : 合計20000 GPUs。2000 GPU だと、GB200 なら、1000セットで構築可能

ここまでは、NVIDIAのシステムを使って、ソフトウェアの開発をする。

後半では、MONAKA-X と NVIDIA GPU (Rubin or Rubin Ultra) をベースとしたシステムを構築する

  • FY2028 - FY2030 :
    • Phase 3 :「富岳NEXT」の構成と近い中規模クラスタ
    • Phase 4 :「富岳NEXT」15K+ GPUs

分かりやすいし、何らかの理由で富岳NEXTの開発が遅れても、本来の目的である「AI fo Sceince」は、NVIDIAのシステム上で動きますので、リスクヘッジができると。

というところが、

  • Made in Japan から Made with Japan

に変わった理由でもあるんでしょうかね。。。。




以上の内容はhttps://vengineer.hatenablog.com/entry/2025/09/01/080000より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14