以下の内容はhttps://touch-sp.hateblo.jp/entry/2026/02/22/160942より取得しました。


【llama.cpp】A770 と B580 で速度を比較 SYCLとVulkanでそれぞれ比較(2026年2月最新)

はじめに

Intel Arc B580を手に入れたので、A770と速度比較してみました。

VRAMが16GBから12GBに減っているので不利な点もあります。

今回は東京科学大学が公開している日本語特化のオープンLLM「Swallow」シリーズから「Qwen3-Swallow-8B-RL-v0.2」と「GPT-OSS-Swallow-20B-RL-v0.1」を使いました。

Qwen3-Swallow-8B-RL-v0.2

GGUFを こちら からダウンロードして使っています。

コマンド

build/bin/llama-bench -m /home/hoge/models/Qwen3-Swallow-8B-RL-v0.2-Q4_K_M.gguf

SYCLの結果

A770

model size params backend ngl test t/s
qwen3 8B Q4_K - Medium 4.68 GiB 8.19 B SYCL 99 pp512 776.07 ± 3.10
qwen3 8B Q4_K - Medium 4.68 GiB 8.19 B SYCL 99 tg128 17.78 ± 0.06

B580

model size params backend ngl test t/s
qwen3 8B Q4_K - Medium 4.68 GiB 8.19 B SYCL 99 pp512 792.13 ± 0.28
qwen3 8B Q4_K - Medium 4.68 GiB 8.19 B SYCL 99 tg128 53.31 ± 0.66

Vulkanの結果

A770

model size params backend ngl test t/s
qwen3 8B Q4_K - Medium 4.68 GiB 8.19 B Vulkan 99 pp512 855.92 ± 1.56
qwen3 8B Q4_K - Medium 4.68 GiB 8.19 B Vulkan 99 tg128 30.53 ± 0.10

B580

model size params backend ngl test t/s
qwen3 8B Q4_K - Medium 4.68 GiB 8.19 B Vulkan 99 pp512 835.60 ± 1.88
qwen3 8B Q4_K - Medium 4.68 GiB 8.19 B Vulkan 99 tg128 27.19 ± 0.04

GPT-OSS-Swallow-20B-RL-v0.1

こちらはVRAMが多いA770の勝利です。

GGUFを こちら からダウンロードして使っています。

SYCLの結果

A770

build/bin/llama-bench -m /home/hoge/models/GPT-OSS-Swallow-20B-RL-v0.1-Q4_K_M.gguf -ngl 30
model size params backend ngl test t/s
gpt-oss 20B Q4_K - Medium 14.71 GiB 20.91 B SYCL 30 pp512 529.08 ± 12.05
gpt-oss 20B Q4_K - Medium 14.71 GiB 20.91 B SYCL 30 tg128 16.14 ± 0.05

B580

build/bin/llama-bench -m /home/hoge/models/GPT-OSS-Swallow-20B-RL-v0.1-Q4_K_M.gguf -ngl 16
model size params backend ngl test t/s
gpt-oss 20B Q4_K - Medium 14.71 GiB 20.91 B SYCL 16 pp512 411.73 ± 8.15
gpt-oss 20B Q4_K - Medium 14.71 GiB 20.91 B SYCL 16 tg128 18.61 ± 0.11

Vulkanの結果

A770

model size params backend ngl test t/s
gpt-oss 20B Q4_K - Medium 14.71 GiB 20.91 B Vulkan 30 pp512 1175.11 ± 5.61
gpt-oss 20B Q4_K - Medium 14.71 GiB 20.91 B Vulkan 30 tg128 40.14 ± 0.05

B580

model size params backend ngl test t/s
gpt-oss 20B Q4_K - Medium 14.71 GiB 20.91 B Vulkan 16 pp512 293.34 ± 42.27
gpt-oss 20B Q4_K - Medium 14.71 GiB 20.91 B Vulkan 16 tg128 21.40 ± 0.10




以上の内容はhttps://touch-sp.hateblo.jp/entry/2026/02/22/160942より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14