出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/02/10 13:03 UTC 版)
| |
|
| 生産時期 | 2012年11月から |
|---|---|
| 生産者 | インテル |
| プロセスルール | 22nm から 14nm |
| アーキテクチャ | x86 |
| 命令セット | Intel 64 |
| コア数 | 57から72 (スレッド数:228から288) |
| ソケット | LGA3647 |
| コードネーム | Knights Corner Knights Landing Knights Mill |
| 前世代プロセッサ | Larrabee |
Xeon Phi(ジーオン ファイ[1])は、インテルが販売しているLarrabee(社内コード)より派生したMICアーキテクチャ (Many Integrated Core)[2]ベースのHPC向けコプロセッサ(後にプロセッサバージョンも追加)のブランド名である。
Xeon Phiファミリーはx86互換のメニーコア・コプロセッサを搭載した、並列コンピューティング用の演算ボードである。第一製品群のターゲットはHPC分野であるが、将来的には企業のデータセンター、ワークステーションなどにも対応する。Xeon Phiコプロセッサは従来のIA-32/Intel 64アーキテクチャ向けアプリケーションをそのまま使うことができることが最大の売りである。そのほかにもホストOSから独立したLinuxベースのOSを動作させることができる。製品はPCI Expressで接続される[1]。
第1世代 Xeon Phi。2012年11月13日発表[3]。製造プロセスは22nm Tri-Gateトランジスタを採用している(Ivy Bridgeと同一の製造プロセス)。インテルXeonプロセッサーE5ファミリーと組み合わせることで、カードあたり倍精度浮動小数点演算で1TFLOPS以上の理論性能がある。本製品はPCI Express形式の拡張カードで供給され、純粋に演算用であって、ラスタライザやビデオ再生エンジン、ディスプレイ出力は存在しない。
本製品の競合相手はNVIDIAのHPC向けGPUであるNVIDIA Tesla、およびAMDのHPC向けGPUであるAMD FirePro (FirePro Sシリーズ[4]、旧称AMD FireStream) となる。Xeon Phiの強みはコアがx86であるために、x86 CPU向けに記述されたプログラムをほぼそのまま利用できる点である。またPCI Expressで接続されているが、本製品の内部にはスタンドアロン型のLinuxが常駐しており、SSHを使ってホストからログインすることができる。これは独立したOSを動作させられないGPGPUでは不可能である。勿論GPGPUと同様、オフロード計算をさせる動作も可能である。
SIMD命令は512ビットであり、倍精度浮動小数点数を8つ同時に扱うことができ、また FMA をサポートしているため、16 FLOPS/cycle である[5]。なお同時期に発売されたHaswellのIntel AVX2は256ビットであり、同時に扱うことができる倍精度浮動小数点数は4つだが、FMAを2つ同時に計算できるため、同じく 16 FLOPS/cycle である[6]。
PCI Express は Gen2.0 x16(片方向あたり8GB/s)。
2012年6月当時、44社のメーカーがロードマップへの組み込みを表明していた[1]。
2017年1月にEnd of Lifeとなった。Intel Math Kernel Library のサポートも 2017 Update 4[7]で終了した。
| 型番 | CPU | TDP (W) |
内蔵メモリ | ||||
|---|---|---|---|---|---|---|---|
| コア数 (スレッド数) |
クロック (GHz) | L2キャッシュ (MB) |
規格 | 容量 (GB) |
|||
| 定格 | ターボ | ||||||
| 7120A | 61 (244) | 1.24 | 1.33 | 30.5 | 300 | GDDR5 | 16 |
| 7120P | |||||||
| 7120X | |||||||
| 7120D | 270 | ||||||
| SE10P | 1.1 | N/A | 300 | 8 | |||
| SE10X | |||||||
| 5120D | 60 (240) | 1.05 | 30 | 245 | |||
| 5110P | 225 | ||||||
| 31S1P | 57 (228) | 1.1 | 28.5 | 270 | |||
| 3120A | 300 | 6 | |||||
| 3120P | |||||||
第2世代 Xeon Phi。2016年6月20日発表[8][9][10]。単精度で 6 TFLOPS 以上、倍精度で 3 TFLOPS 以上になった。プロセスルールは14nm。Atom の Silvermont ベースになった[11]。
型番の末尾にFがつくものはインターコネクトの Intel Omni-Path Fabric を搭載。
ソケットは LGA3647 だが、通常の Xeon との互換性はなく、Xeon Phi 専用のマザーボードでなければ動作しない(物理的にソケットにはまらない)。
オンチップメモリは L3 キャッシュとしても利用できるし、アドレスを割り振り通常のメモリとしても利用可能。7.2 GT/s のもので実測で 490 GB/s になる[12]。
1コアあたり、4スレッド実行可能で、2つのベクターALU(512ビット)、2つのスカラーALU、1つのレガシーx87 ALUを搭載している[9]。よって72コア、1.5 GHzで、単精度は 512 bit / 32 bit * 2 ALU * 2 op * 72 core * 1.5 GHz = 6912 GFLOPS になる。
Knights Landing で採用される512ビット SIMD命令はAVX-512として定義されたものになるが、これはそれまでのKnights Cornerが用いていた「512ビットSIMD演算」とは機械語命令形式が異なり互換では無い[13]。
PCI Express は Gen3.0 x16 (片方向あたり16GB/s)。
| 型番 | CPU | TDP (W) |
内蔵メモリ | 対応メモリ | ||||
|---|---|---|---|---|---|---|---|---|
| コア数 (スレッド数) |
クロック (GHz) | L2キャッシュ (MB) |
規格 | 容量 (GB) |
||||
| 定格 | ターボ | |||||||
| 7290F | 72 (288) | 1.5 | 1.7 | 36 | 260 | MCDRAM | 16 | DDR4-2400 |
| 7290 | 245 | |||||||
| 7250F | 68 (272) | 1.4 | 1.6 | 34 | 230 | |||
| 7250 | 215 | |||||||
| 7230F | 64 (256) | 1.3 | 1.5 | 32 | 230 | |||
| 7230 | 215 | |||||||
| 7210F | 230 | DDR4-2133 | ||||||
| 7210 | 215 | |||||||
2017年12月18日[14][15]発表[16]。Knights Landing をディープラーニング向けに改良。Intel AVX-512のサポートを拡張し、AVX512_4FMAPS、AVX512_4VNNI、AVX512_VPOPCNTDQをサポートした[16]。FP32やINT16の演算を高速化している[17]。x200 よりも FP32 の行列積での演算が2倍[18]高速になった。
なお、Knights Millの後継としてKnights Hillが予定されていた[11][19][20]が、キャンセルされた[21]。
| 型番 | CPU | TDP (W) |
内蔵メモリ | 対応メモリ | ||||
|---|---|---|---|---|---|---|---|---|
| コア数 (スレッド数) |
クロック (GHz) | L2キャッシュ (MB) |
規格 | 容量 (GB) |
||||
| 定格 | ターボ | |||||||
| 7295 | 72 (288) | 1.5 | 1.6 | 36 | 320 | MCDRAM | 16 | DDR4-2400 |
| 7285 | 68 (272) | 1.3 | 1.4 | 34 | 250 | |||
| 7255 | 1.1 | 1.2 | 215 | |||||
| 7235 | 64 (256) | 1.3 | 1.4 | 32 | 250 | DDR4-2133 | ||