
「macOS Tahoe 26.2」が2025年12月12日(金)にリリースされました。このバージョンではThunderbolt 5ポートを介してMac同士を低遅延接続する機能が追加されており、AIクラスターの構築に役立つことがアピールされています。
macOS Tahoe 26.2 Release Notes | Apple Developer Documentation
https://developer.apple.com/documentation/macos-release-notes/macos-26_2-release-notes#RDMA-over-Thunderbolt
MacはUnified Memoryと呼ばれるメモリ技術を採用しており、SoCに内蔵されたメモリをCPUとGPUで共有しています。これにより、GPUに大量のメモリを割り当てて大型のAIモデルを高速実行することが可能。例えば、M3 Ultraを搭載したMac Studioは最大512GBのメモリを搭載可能で、メモリの大部分をGPUに割り当てることで大規模なAIモデルを実行可能なことからローカルAIユーザーの注目を集めています。

新たに、macOS Tahoe 26.2ではThunderbolt 5ポートを介して低遅延接続を可能とする「RDMA over Thunderbolt」と呼ばれる機能がサポートされました。アップルはRDMA over Thunderboltを使って複数台のMacを接続することでMLXを用いたAI推論性能が向上すると説明しています。

RDMA over Thunderboltによって、AI研究者などが比較的安価にAIクラスターを構築できるようになることが期待されています。
なお、AppleのAI研究部門に所属しているAwni Hannun氏は2025年11月7日にM3 Ultra搭載Macを2台接続してパラメーター数1兆のKimi K2 Thinkingを毎秒15トークンという速度で実行できたことを報告していました。
The new 1 Trillion parameter Kimi K2 Thinking model runs well on 2 M3 Ultras in its native format - no loss in quality!
— Awni Hannun (@awnihannun) November 7, 2025
The model was quantization aware trained (qat) at int4.
Here it generated ~3500 tokens at 15 toks/sec using pipeline-parallelism in mlx-lm: pic.twitter.com/oH5DPi7kAg