はじめに
NVIDIAの open-gpu の github を散歩していたら見つけたのが
- GH200 120G
- GH200 480G

ちょっと気になったので、調べました。
https://lore.kernel.org/lkml/20230716174333.8221-1-ankita@nvidia.com/raw では、LinuxのVFIOのデバイスドライバ(まだマージされていません)に、
+static const struct pci_device_id nvgrace_gpu_vfio_pci_table[] = {
+ /* GH200 120GB */
+ { PCI_DRIVER_OVERRIDE_DEVICE_VFIO(PCI_VENDOR_ID_NVIDIA, 0x2342) },
+ /* GH200 480GB */
+ { PCI_DRIVER_OVERRIDE_DEVICE_VFIO(PCI_VENDOR_ID_NVIDIA, 0x2345) },
+ {}
+}
のように、
- GH200 120G
- GH200 480G
がありました。
GH200 のスライド
GH200 には、
- GH200 120G
- GH200 320G
- GH200 480G
の3つがあるようです。
ATPESC-2023のスライド「Nvidia Grace-Hopper Architecture」にちょっと書いてありました。下記のスライドを説明のために引用します。
一番下に、120G 320G 480G LPDDR5 とありますね。つまり、Grace側のLPDDR5のメモリ容量を意味するんですね。。

おわりに
- GH200 120G
- GH200 480G
というのは分かりました。実際は 120Gって128GB、480Gって512GB なんでしょうね。