以下の内容はhttps://touch-sp.hatenablog.com/entry/2024/07/07/143521より取得しました。


oneAPI Base Toolkit (version 2024.2.0)が公開されたのでOllama実行速度に変化があるかどうか試してみました

前回同様、SYCL backendでOllamaを実行した時のベンチマークを取ってみました。
touch-sp.hatenablog.com

結果

phi3:3.8b (model size: 2.4GB)

version 2024.1.0

tokens per second: 37.73 tokens/second

version 2024.2.0

tokens per second: 37.31 tokens/second

codellama:13b-python-q6_K (model size: 10GB)

version 2024.1.0

tokens per second: 15.80 tokens/second

version 2024.2.0

tokens per second: 14.19 tokens/second

aya:35b-23-q4_0 (model size: 20GB)

version 2024.1.0

tokens per second: 2.84 tokens/second

version 2024.2.0

tokens per second: 3.12 tokens/second

結論

あまり変化を感じられませんでした。




以上の内容はhttps://touch-sp.hatenablog.com/entry/2024/07/07/143521より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14