以下の内容はhttps://vengineer.hatenablog.com/entry/2025/09/04/000000より取得しました。


AMD RDNA 3 (Navi 31/32)と RDNA 4 (Navi 48)を比べてみた

はじめに

AMD RDNA 3 (Navi 31) については、下記のようにこのブログでも取り上げました。

vengineer.hatenablog.com

下記のように (説明のために引用します)RDNA 3 の Navi 31 は、chiplet 構成で、L3 Cache (Infinity Cache + GDDR6 Memory I/F) を別 die にしていました。

Navi 31 (RX 7900 XTX and 7900 XT)

  • Shader Engine : 6個
  • メモリ : GDDR6 / 24GB (2GB x 12個)、1つのchiplet に2個のGDDR6
  • L2 : 6MB (256KB x 4 x 6)
  • L3 : 96MB : GDDR6、1(CHで8MB) x 2 x 6

でした

RDNA 4 (RX 9070X)

下図は、STHの「AMD RDNA 4 GPU Architecture at Hot Chips 2025」の中から、説明のために引用しています。

RX 9070 XT

  • Shader Engine : 5個
  • メモリ : GDDR6 / 16GB (2GB x 8個)、1つのchiplet に2個のGDDR6
  • L2 : 8MBB (256KB x 4 x 8) <= RDNA3 は、6MB
  • L3 : 64MB : GDDR6、1(CHで8MB) x 2 x 4

大きな違いは、L2 Cache の 6MB => 8MB になったことですね。

RDNA 3では、6個の Shader Engine で 6MB なので、Shader Engine 1個あたりで、1MB

RDNA 4では、4個の Shader Engine で 8MB なので、Shader Engine 1個あたりで、2MB

この差がどの程度のせい動作になるんでしょうかね。

おわりに

と、

を比べると、

論理性能は、

  • Pixel Rate : 233.3 G <=> 322.6 G
  • Texture Rate : 583.2 G <=> 564.5 G]
  • FP8 追加
  • FP16 (half) : 74.65 TFLOPS <=> 72.25 TFLOPS
  • FP32 (float) : 37.32 TFLOPS <=> 36.13 TFLOPS
  • FP64 (double) : 1,166.4 GFLOPS <=> 1,129.0 GFLOPS
  • スパース性の強化

なので、性能面ではあんまり変わりなさそうです。FP8とスパース性強化でAI対応ですかね。

Pixel Rate は、1.4倍ぐらいになっているので、ゲーム性能が上がっている感じですかね。




以上の内容はhttps://vengineer.hatenablog.com/entry/2025/09/04/000000より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14