はじめに
NVIDIA Blackwell の SM番号について、まとめたいと思います。
SM は、Streaming Multiprocessor の略ですかね。
Hopper までのSMは?
| アーキテクチャ世代 | 代表GPU例 | 仮想アーキテクチャ(sm_XX) | Compute Capability | 主な用途・備考 |
|---|---|---|---|---|
| Fermi | GTX 500シリーズ | sm_20, sm_21 | 2.0 / 2.1 | 初のCUDA専用アーキテクチャ |
| Kepler | GTX 600/700シリーズ | sm_30, sm_35, sm_37 | 3.0 / 3.5 / 3.7 | Dynamic Parallelism導入 |
| Maxwell | GTX 900シリーズ | sm_50, sm_52, sm_53 | 5.0 / 5.2 / 5.3 | 省電力重視 |
| Pascal | GTX 10シリーズ, Tesla P100 | sm_60, sm_61, sm_62 | 6.0 / 6.1 / 6.2 | FP16サポート強化 |
| Volta | Tesla V100, Titan V | sm_70 | 7.0 | Tensor Core初搭載 |
| Turing | RTX 20シリーズ, T4 | sm_75 | 7.5 | RT Core + Tensor Core(INT8) |
| Ampere | RTX 30シリーズ, A100 | sm_80, sm_86 | 8.0 / 8.6 | sm_80=A100等データセンター, sm_86=RTX 30 |
| Ada Lovelace | RTX 40シリーズ, L40/L4 | sm_89, sm_90 | 8.9 / 9.0 | sm_89=RTX40, sm_90=L40等データセンター |
| Hopper | H100, H200 | sm_90 | 9.0 | 同じ番号だが内部でHopper専用最適化パスあり |
Blackwell のSM番号
| アーキテクチャ世代 | 代表GPU例 | 仮想アーキテクチャ(sm_XX) | Compute Capability | 主な用途・備考 |
|---|---|---|---|---|
| Blackwell | B100/B200, RTX 50シリーズ | sm_100 | 10.0 | データセンター標準版 |
| RTX 5090/5080 等 | sm_120 | 12.0 | コンシューマー/ゲーミング版 | |
| B20, RTX 5090D(中国規制版) | sm_103 | 10.3 | 輸出規制対応・性能制限版 | |
| Jetson Thor / Drive Thor | sm_110 | 11.0 | エッジ・自動車向け | |
| Grace-Blackwell Superchip | sm_121 | 12.1 | Grace CPU統合型 | |
| Blackwell Ultra | B300 / GB300(2026予定) | sm_130 | 13.0 | 次世代データセンター上位版 |
| Grace-Blackwell Ultra Superchip | sm_131 | 13.1 | Grace統合型Ultra |
Blackwellでは、
- DataCenter 用の Blackwell (B200)
- RTX の Blackwell
- 中国用 RTX の Blackwell
- Jetson Thor / Drive Thor の Blackwell
- Grace-Blackwell の Blackwell
と5種類もあります。
Blackwell Ultra は、
- DataCenter 用の Blackwell Ultra (B300)
- Grace-Blackwell Ultra の Blackwell Ultra
の2種類があります。
DataCenter用と Grace-XXX でも、SMが違うんですね。
おわりに
Blackwellは、5種類もSMがあるんですね。。。とは言え、
- GB200
- GB202, GB203, GB204, GB205
と大きくは、2種類なんですけどね。。。