はじめに
Google TPUv7 は、TPU7X ということは、下記のブログで書きました。
今回は、TPU7x の公式に、色々な情報がアップされたので、記録に残します。
TPU7x
v5p v6e TPU7x の比較です。

v6e => TPU7x での性能
- BF16 : 918 => 2,307、2倍ちょっと
- BF8 : 918 => 4,614、4倍ちょっと
v6e では、BF16とBF8は同じ性能だが、TPU7x では2倍
ブロック図です。

下記のものと同じのようです。
チップレット構成
各チップレットは、1 つの TensorCore、2 つの SparseCore、96 GB の高帯域幅メモリ(HBM)を備えた自己完結型のユニットです。
2 つのチップレットは、1D チップ間相互接続(ICI)リンクの 6 倍の速度のダイ間(D2D)インターフェースで接続されています。チップレット間の通信は、集合演算を使用して管理されます。
チップレットの扱い
おわりに
Google の公式に TPU7x が登場しました。次は、pricing です。
- v5p : $4.2
v6e : $2.7
TPU7x は、どのぐらいのお値段になるんでしょうかね。