0. 前提チェック

nvidia-smi     # L4 GPU が認識されているか確認

1. NVIDIA CUDA リポジトリ追加 & nvcc 導入

# リポジトリキー登録（Ubuntu 22.04 / x86_64）
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update

# CUDA Toolkit 12.4（nvcc を含む）を導入
sudo apt-get install -y cuda-toolkit-12-4

# 環境変数を追加（恒久化）
echo 'export CUDA_HOME=/usr/local/cuda-12.4' >> ~/.bashrc
echo 'export PATH=$CUDA_HOME/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

# 確認
nvcc --version

2. A1111 venv を有効化

cd ~/stable-diffusion-webui
source venv/bin/activate

3. Torch / torchvision を cu124 に固定

# A1111 が勝手に最新版を入れないよう固定
echo 'export TORCH_COMMAND="pip install --index-url https://download.pytorch.org/whl/cu124 torch==2.6.0 torchvision==0.21.0"' >> ./webui-user.sh

# クリーンインストール
pip uninstall -y xformers torch torchvision torchaudio triton
pip cache purge

pip install --index-url https://download.pytorch.org/whl/cu124 \
  torch==2.6.0 torchvision==0.21.0

確認：

python - <<'PY'
import torch, torchvision
print("torch:", torch.__version__, "cuda:", torch.version.cuda)
print("torchvision:", torchvision.__version__)
PY

4. xFormers を依存無視でソースビルド

ポイント： --no-deps を付けないと torch>=2.8 を強制される

# ビルドツール
sudo apt-get install -y build-essential cmake ninja-build python3-dev
pip install -U pip setuptools wheel cmake ninja

# L4 (Compute Capability 8.9) に限定
export TORCH_CUDA_ARCH_LIST="8.9"
# ビルドが重い場合は並列数を制限
# export MAX_JOBS=4

# xFormers ビルド
pip install -v --no-cache-dir --no-build-isolation --no-binary xformers --no-deps xformers==0.0.32.post2

5. 動作確認

python - <<'PY'
import torch, xformers
print("torch:", torch.__version__, "cuda:", torch.version.cuda, "avail:", torch.cuda.is_available())
print("xformers import OK")
PY

6. A1111 を起動

xFormers 有効

./webui.sh --listen --port 7860 --xformers

SDPA で運用（おすすめ・十分速い）

./webui.sh --listen --port 7860
# → Settings → Optimization → Cross attention を SDPA に

トラブルシュート

torch が 2.8 に戻る → --no-deps を忘れていないか確認
nvcc が無い → CUDA Toolkit が未導入、または PATH が未設定
ビルドエラー（リソース不足） → export MAX_JOBS=4
不要な警告 (pytorch-lightning → torchmetrics) →
残すなら：pip install torchmetrics>=0.7.0
不要なら：pip uninstall -y pytorch-lightning