はじめに
昨日の続きです。
昨日は上記のように、DIGITS GB10 の GPU chiplet であろう GB10B についてでした。
今日は、Blackwell RTX シリーズの GB202/203/205/206/207 についてです。
GB202/203/205/206/207
の、ここ に、GB202の情報があります。GB203/205/206/207 についても、GB202 の下にあります。
結構長いですが、下記の機能をサポートしています。
const CLASSDESCRIPTOR *
gpuGetClassDescriptorList_GB202(POBJGPU pGpu, NvU32 *pNumClassDescriptors)
{
static const CLASSDESCRIPTOR halGB202ClassDescriptorList[] = {
{ ACCESS_COUNTER_NOTIFY_BUFFER, ENG_GR(0) },
{ ACCESS_COUNTER_NOTIFY_BUFFER, ENG_GR(1) },
{ ACCESS_COUNTER_NOTIFY_BUFFER, ENG_GR(2) },
{ ACCESS_COUNTER_NOTIFY_BUFFER, ENG_GR(3) },
{ AMPERE_CHANNEL_GPFIFO_A, ENG_KERNEL_FIFO },
{ AMPERE_USERMODE_A, ENG_GPU },
{ BLACKWELL_B, ENG_GR(0) },
{ BLACKWELL_B, ENG_GR(1) },
{ BLACKWELL_B, ENG_GR(2) },
{ BLACKWELL_B, ENG_GR(3) },
{ BLACKWELL_CHANNEL_GPFIFO_A, ENG_KERNEL_FIFO },
{ BLACKWELL_CHANNEL_GPFIFO_B, ENG_KERNEL_FIFO },
{ BLACKWELL_COMPUTE_B, ENG_GR(0) },
{ BLACKWELL_COMPUTE_B, ENG_GR(1) },
{ BLACKWELL_COMPUTE_B, ENG_GR(2) },
{ BLACKWELL_COMPUTE_B, ENG_GR(3) },
{ BLACKWELL_COMPUTE_B, ENG_GR(4) },
{ BLACKWELL_COMPUTE_B, ENG_GR(5) },
{ BLACKWELL_COMPUTE_B, ENG_GR(6) },
{ BLACKWELL_COMPUTE_B, ENG_GR(7) },
{ BLACKWELL_DMA_COPY_B, ENG_CE(0) },
{ BLACKWELL_DMA_COPY_B, ENG_CE(1) },
{ BLACKWELL_DMA_COPY_B, ENG_CE(2) },
{ BLACKWELL_DMA_COPY_B, ENG_CE(3) },
{ BLACKWELL_DMA_COPY_B, ENG_CE(4) },
{ BLACKWELL_DMA_COPY_B, ENG_CE(5) },
{ BLACKWELL_DMA_COPY_B, ENG_CE(6) },
{ BLACKWELL_DMA_COPY_B, ENG_CE(7) },
{ BLACKWELL_INLINE_TO_MEMORY_A, ENG_GR(0) },
{ BLACKWELL_INLINE_TO_MEMORY_A, ENG_GR(1) },
{ BLACKWELL_INLINE_TO_MEMORY_A, ENG_GR(2) },
{ BLACKWELL_INLINE_TO_MEMORY_A, ENG_GR(3) },
{ BLACKWELL_USERMODE_A, ENG_GPU },
{ FERMI_CONTEXT_SHARE_A, ENG_KERNEL_FIFO },
{ FERMI_TWOD_A, ENG_GR(0) },
{ FERMI_TWOD_A, ENG_GR(1) },
{ FERMI_TWOD_A, ENG_GR(2) },
{ FERMI_TWOD_A, ENG_GR(3) },
{ FERMI_VASPACE_A, ENG_DMA },
{ G84_PERFBUFFER, ENG_BUS },
{ GF100_DISP_SW, ENG_SW },
{ GF100_HDACODEC, ENG_HDACODEC },
{ GF100_SUBDEVICE_INFOROM, ENG_GPU },
{ GF100_SUBDEVICE_MASTER, ENG_GPU },
{ GF100_TIMED_SEMAPHORE_SW, ENG_SW },
{ GF100_ZBC_CLEAR, ENG_KERNEL_MEMORY_SYSTEM },
{ GP100_UVM_SW, ENG_SW },
{ HOPPER_CHANNEL_GPFIFO_A, ENG_KERNEL_FIFO },
{ HOPPER_SEC2_WORK_LAUNCH_A, ENG_SEC2 },
{ HOPPER_USERMODE_A, ENG_GPU },
{ KEPLER_CHANNEL_GROUP_A, ENG_KERNEL_FIFO },
{ KEPLER_DEVICE_VGPU, ENG_GPU },
{ MMU_FAULT_BUFFER, ENG_GR(0) },
{ MMU_FAULT_BUFFER, ENG_GR(1) },
{ MMU_FAULT_BUFFER, ENG_GR(2) },
{ MMU_FAULT_BUFFER, ENG_GR(3) },
{ NV0060_SYNC_GPU_BOOST, ENG_GPU },
{ NV01_MEMORY_LOCAL_USER, ENG_SW },
{ NV01_MEMORY_VIRTUAL, ENG_DMA },
{ NV04_DISPLAY_COMMON, ENG_KERNEL_DISPLAY },
{ NV04_SOFTWARE_TEST, ENG_SW },
{ NV50_DEFERRED_API_CLASS, ENG_SW },
{ NV50_MEMORY_VIRTUAL, ENG_DMA },
{ NV50_P2P, ENG_BUS },
{ NV50_THIRD_PARTY_P2P, ENG_BUS },
{ NVA081_VGPU_CONFIG, ENG_GPU },
{ NVA084_KERNEL_HOST_VGPU_DEVICE, ENG_GPU },
{ NVC372_DISPLAY_SW, ENG_KERNEL_DISPLAY },
{ NVC77F_ANY_CHANNEL_DMA, ENG_KERNEL_DISPLAY },
{ NVCA70_DISPLAY, ENG_KERNEL_DISPLAY },
{ NVCA71_DISP_SF_USER, ENG_KERNEL_DISPLAY },
{ NVCA73_DISP_CAPABILITIES, ENG_KERNEL_DISPLAY },
{ NVCA7A_CURSOR_IMM_CHANNEL_PIO, ENG_KERNEL_DISPLAY },
{ NVCA7B_WINDOW_IMM_CHANNEL_DMA, ENG_KERNEL_DISPLAY },
{ NVCA7D_CORE_CHANNEL_DMA, ENG_KERNEL_DISPLAY },
{ NVCA7E_WINDOW_CHANNEL_DMA, ENG_KERNEL_DISPLAY },
{ NVCFB0_VIDEO_DECODER, ENG_NVDEC(0) },
{ NVCFB0_VIDEO_DECODER, ENG_NVDEC(1) },
{ NVCFB0_VIDEO_DECODER, ENG_NVDEC(2) },
{ NVCFB0_VIDEO_DECODER, ENG_NVDEC(3) },
{ NVCFB7_VIDEO_ENCODER, ENG_NVENC(0) },
{ NVCFB7_VIDEO_ENCODER, ENG_NVENC(1) },
{ NVCFB7_VIDEO_ENCODER, ENG_NVENC(2) },
{ NVCFB7_VIDEO_ENCODER, ENG_NVENC(3) },
{ NVCFD1_VIDEO_NVJPG, ENG_NVJPEG(0) },
{ NVCFD1_VIDEO_NVJPG, ENG_NVJPEG(1) },
{ NVCFD1_VIDEO_NVJPG, ENG_NVJPEG(2) },
{ NVCFD1_VIDEO_NVJPG, ENG_NVJPEG(3) },
{ NVCFFA_VIDEO_OFA, ENG_OFA(0) },
{ NV_CONFIDENTIAL_COMPUTE, ENG_CONF_COMPUTE },
{ RM_USER_SHARED_DATA, ENG_GPU },
{ TURING_CHANNEL_GPFIFO_A, ENG_KERNEL_FIFO },
{ TURING_USERMODE_A, ENG_GPU },
{ VOLTA_CHANNEL_GPFIFO_A, ENG_KERNEL_FIFO },
{ VOLTA_USERMODE_A, ENG_GPU },
};
#define HALGB202_NUM_CLASS_DESCS (sizeof(halGB202ClassDescriptorList) / sizeof(CLASSDESCRIPTOR))
#define HALGB202_NUM_CLASSES 68
ct_assert(NV0080_CTRL_GPU_CLASSLIST_MAX_SIZE >= HALGB202_NUM_CLASSES);
*pNumClassDescriptors = HALGB202_NUM_CLASS_DESCS;
return halGB202ClassDescriptorList;
}
BLACKWELL_COMPUTE_B
下記のように、BLACKWELL_COMPUTE_B が8個あります。ちなみに、GB100/GB102/GB10B は、これが BLACKWELL_COMPUTE_A になります。
メモリやCOMPUTEを
- FULL
- HALF
- QUARTER
- EIGHTH
に分割できます。GB100 と同じ用に分割できるようです。
{ BLACKWELL_COMPUTE_B, ENG_GR(0) },
{ BLACKWELL_COMPUTE_B, ENG_GR(1) },
{ BLACKWELL_COMPUTE_B, ENG_GR(2) },
{ BLACKWELL_COMPUTE_B, ENG_GR(3) },
{ BLACKWELL_COMPUTE_B, ENG_GR(4) },
{ BLACKWELL_COMPUTE_B, ENG_GR(5) },
{ BLACKWELL_COMPUTE_B, ENG_GR(6) },
{ BLACKWELL_COMPUTE_B, ENG_GR(7) },
8個あるということは、MIG対応になるということです。MIG対応は、ここにあります。
kmigmgrIsGPUInstanceFlagValid_GB202
(
OBJGPU *pGpu,
KernelMIGManager *pKernelMIGManager,
NvU32 gpuInstanceFlag
)
{
NvU32 memSizeFlag = DRF_VAL(2080_CTRL_GPU, _PARTITION_FLAG,
_MEMORY_SIZE, gpuInstanceFlag);
NvU32 computeSizeFlag = DRF_VAL(2080_CTRL_GPU, _PARTITION_FLAG,
_COMPUTE_SIZE, gpuInstanceFlag);
NvU32 gfxSizeFlag = DRF_VAL(2080_CTRL_GPU, _PARTITION_FLAG,
_GFX_SIZE, gpuInstanceFlag);
switch (memSizeFlag)
{
case NV2080_CTRL_GPU_PARTITION_FLAG_MEMORY_SIZE_FULL:
case NV2080_CTRL_GPU_PARTITION_FLAG_MEMORY_SIZE_HALF:
case NV2080_CTRL_GPU_PARTITION_FLAG_MEMORY_SIZE_QUARTER:
break;
case NV2080_CTRL_GPU_PARTITION_FLAG_MEMORY_SIZE_EIGHTH:
return NV_FALSE;
default:
NV_PRINTF(LEVEL_ERROR, "Unrecognized GPU mem partitioning flag 0x%x\n",
memSizeFlag);
return NV_FALSE;
}
switch (computeSizeFlag)
{
case NV2080_CTRL_GPU_PARTITION_FLAG_COMPUTE_SIZE_FULL:
case NV2080_CTRL_GPU_PARTITION_FLAG_COMPUTE_SIZE_HALF:
case NV2080_CTRL_GPU_PARTITION_FLAG_COMPUTE_SIZE_MINI_HALF:
case NV2080_CTRL_GPU_PARTITION_FLAG_COMPUTE_SIZE_QUARTER:
break;
case NV2080_CTRL_GPU_PARTITION_FLAG_COMPUTE_SIZE_MINI_QUARTER:
case NV2080_CTRL_GPU_PARTITION_FLAG_COMPUTE_SIZE_EIGHTH:
case NV2080_CTRL_GPU_PARTITION_FLAG_COMPUTE_SIZE_RESERVED_INTERNAL_06:
case NV2080_CTRL_GPU_PARTITION_FLAG_COMPUTE_SIZE_RESERVED_INTERNAL_07:
return NV_FALSE;
default:
NV_PRINTF(LEVEL_ERROR, "Unrecognized GPU compute partitioning flag 0x%x\n",
computeSizeFlag);
return NV_FALSE;
}
おわりに
RTX5090 は現状、32GBのメモリです。これを 1/8 とかにしてもあまりおいしくないですが、RTX 6000 シリーズとして、GB202 を使うと、メモリは倍の64GBを実装してくると思います。これなら 1/8 にしても 8GB になるので、使えそうですね。GDDR7だと、1個3GBというものも出てくるようなので、そうなると、96GB となり、H100と同じ容量になっちゃいますね。
Ada Lovelace までは、RTXシリーズで MIG 対応していなかったのに、Blackwell で MIG 対応したのは何か理由があるのですかね。。。
と言っても、NVIDIAの公式からは、MIG対応できるという発表はされていませんね。