はじめに
SemiAnalysisの下記の記事に、GPUの輸出制限について、書かれていました。
2022.10.07 では、H100 と A100 が対象に。
2025.01.13 には、H100 と A100 に加えて、H800/A800 も対象になったようです。
H20は、対象ではないようです。
DeepSeek AI では、A100、H800 で学習をしているようです。追加でH800(A800も)、調達することはできないので、H20になるのでしょうか?
ふと、思い出したのですが、Hauwei Ascend 910 って、A100よりは性能が劣るけど、A800よりは性能いいのでは?と思いました。
それを投稿したのが下記のもの
Huawei Ascend 910シリーズは、NVIDIA A100よりは性能低いがA800より性能が良いと。
— Vengineerの妄想 (@Vengineer) 2025年2月1日
となると、SemiAnalysisの下記の記事https://t.co/fsKiMjTEUp
の中にある、輸出制限のところの図。
H100/A100 から
H100/A100 に加えて、H800/A800/H20も
とあります。…
ちょっと調べてみたら、こんな感じに。
と思って、投稿しましたが、
— Vengineerの妄想 (@Vengineer) 2025年2月1日
既に、tom's hardware にて、DeepSeek AI の推論用として、Huawei Ascend 910Cが利用されているのでは?とありました。https://t.co/REOvAS3vnh
この記事によると、
910Cは、H100の60%の性能があるようですね。 https://t.co/UBdqsCgdLe
ということで、
について、振り返ってみました。
H800/A800
最近、このブログでのアクセス数が多いのが、下記のH800 と A800 に関するエントリです。DeepSeek AIがらみでしょうね。
NVIDIAのこの資料によると、
- NVIDIA A800 PCIe 80GB
- NVIDIA A800 PCIe 80GB liquid cooled
- NVIDIA A800 HGX 80GB
NVIDIA A800 40GB PCIe active cooled
NVIDIA H800 PCIe 94GB (H800 NVL)
- NVIDIA H800 PCIe 94GB
- NVIDIA H800 PCIe 80GB => ここでは、$16,613.34
H800 には、DGX H800 もあるようです。ここによると、$369,000 です。
H20
対象外のH20 についても、このブログで何度も取り上げています。
H20 には、HBM3 と HBM3e の2種類があるようです。H20 HBM3(94GB) は H100、H20 HBM3e(141GB) は H200 ベースなんですかね。なお、570.86.15 にて、H20 3e が削除されていますね。
H20 のお値段は、下記の記事によると、
- NVIDIA H20 : 10 万元 (ざっくり、216万円)、H100は $30,000 と言われているので、ざっくり465万円なので、半値ぐらい
- Huawei Ascend 910B : 12 万元(ざっくり、259.2万円)
とあります。
H20より、ちょっと出せば、Ascend 910B が調達できるのなら、こちらを使うというのもありですね。
Huawei Ascend 910シリーズ
Ascend 910B を含めた Huawei Ascend 910シリーズについては、下記のエントリーにまとめています。
DeepSeek AI の推論用に Ascend 910 が使える
下記の tom's HARDWARE によると、Huawei は、DeepSeek AI のモデルを Ascend 910 で動くようにしたようです。
下記の記事によると、
“Inference performance on Huawei 910C achieves 60% of the H100's performance from developers [sic] experience,” Jin said on X. “With hand-written CUNN kernels and optimizations, the performance is higher.” Jin also noted that the 910C could also be used for training, but the R1 was officially trained using H800 chips, though that doesn't mean DeepSeek will continue to use those H800s forever.
とあります。
Ascend 910C は、H100の 60% の性能ができようですね。
おわりに
モデルの学習には、NVIDIAのGPUで行う。推論は、色々なものでできる。なので、Hauwei Ascend 910 が使える。使えるのであれば、どんどん生産する。というロジックになり、
- Ascend 910 : TSMC N7
- Ascend 910B : SMIC N7
- Ascend 910C : SMIC N5
と開発を進めているようです。
ちなみに、Ascend 910 は、NVIDIA A100の発表(2020年5月)よりも9か月前の Hotchips にて詳細が公開されています。詳細は下記のブログエントリを見てみてください。