以下の内容はhttps://vengineer.hatenablog.com/entry/2026/02/09/000000より取得しました。


Qualcomm Hexagon‑MLIR

はじめに

Qualcomm の AI200 について、調べていたら、

というものを見つけたので記録に残します。

Qualcomm Hexagon-MLIR

下記のブログによると、

にて、Hexagon NPU を使えるようにするためのものっぽい。

www.qualcomm.com

下図は、上記のブログから

ソースコード

ソースコードは、下記の github にあります。

github.com

動画

www.youtube.com

スライド

おわりに

  • Single Hexagon NPU (tested on v73, v75, v79)

とありますね。

  • v73 → Snapdragon 8 Gen 2(2022-2023世代)
    • 多くのフラッグシップAndroid端末(例: OnePlus Ace3など)で採用
    • INT8/FP16などの基本的なAIアクセラレーションが強力
  • v75 → Snapdragon 8 Gen 3(2023-2024世代)
    • Snapdragon X Elite(PC向け)でも近い世代の派生が使われている
    • さらに高いTOPS(例: 45 TOPS INT8クラス)、効率向上
  • v79 → Snapdragon 8 Elite(2024-2025世代)
    • 最新のフラッグシップ(例: OnePlus Ace5 Proなど)
    • 特に低ビット量子化(4-bitなど)の効率が大幅向上
    • 浮動小数点演算の内部フォーマット(qfloat)の変換オーバーヘッドをLUT(ルックアップテーブル)で削減するなど、LLM推論で顕著に速くなる設計変更あり

v79 って、4ビットをサポートしているんですね。

  • v81 → Snapdragon 8 Gen 5 / 8 Elite Gen 5(2025-2026世代、例: OnePlus 15Rなど)
    • メモリ最適化強化:VTCM(Vector Tensor Cache Memory)のbyte-granularity予約対応(v81から)。グラフ単位でより細かくメモリを割り当て可能になり、LLMのような大規模モデルで効率アップ。
    • 低精度/混合精度推論の改善:INT4/INT8/FP16/BFloat16のサポートがさらに洗練。FP16演算のバグ修正(例: sub演算で+∞が出る問題がQNN 2.41.0以降で議論)や、overlapスケジューリングの最適化。



以上の内容はhttps://vengineer.hatenablog.com/entry/2026/02/09/000000より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14