はじめに
下記のXの投稿に、AMD Ryzen AI を Fortran で使うという論文が流れてきました。
In this paper, researchers have demonstrated that Fortran intrinsics can be offloaded to the NPU in the AMD Ryzen AI CPU by the compiler, enabling programmers to trivially leverage the AMD AI engines specialised compute without expert knowledge or effort.https://t.co/SYnstsfPkA pic.twitter.com/y5sSLTkKjh
— Underfox (@Underfox3) 2025年2月17日
Fortran ?
によると、下記の図に Fortran のフローがありました。

Fortran source code は、Flang にて、HLFIR & FIR に変換し、Lowering 後、MLIR dialects になり、Lowering pass して、LLVM dialect => LLVM IR になるようです。
これに対して、Ryzen AI (AIE) 用と CPU code 用に分割するようなフローにしているようです。AIE code になれば、既存の環境を使えるということ。

性能比較
CPUとNPUでの性能比較です。単体では、CPUの方がかなり速いですね。

処理するArray sizeを大きくすると、NPUの方が速いようです。

おわりに
これ、Fortran じゃなくて、C++とかSYCLとかでは、できないでしょうか?
あー、過去のブログで紹介していましたね。