https://cysec148.hatenablog.com/entry/2025/08/26/150025

Hello there, ('ω')ノ

なぜ「LLMサプライチェーン」は難しいのか？

従来のソフトウェアでは、主な注意点は 依存ライブラリの脆弱性・設定不備・署名のない配布物 でした。 LLMではそれに加え、外部の学習データ・事前学習済みモデル・微調整アダプタ（LoRA/PEFT）・共同開発サービス・オンデバイス配布 までが「調達・持ち込みの対象」になります。

つまり、“コード以外”が攻撃の入口になるのが最大の違いです。

LLMサプライチェーンの全体像（攻撃面の地図）

データ層：公開データセットや収集データが 改ざん/毒入れ される
モデル層：事前学習済みモデルに バックドア/バイアス/パラメータ改変 が仕込まれる（例：ROM E系“ロボトミー”編集）
アダプタ層（LoRA/PEFT）：軽量微調整用アダプタが 悪意のペイロード を持ち込みうる
ツール/依存コンポーネント層：PyPI 等の依存に マルウェア/ゼロデイ
MLOps/共同作業層：モデルマージ/変換サービスを悪用した置換・汚染
配布/レジストリ層：偽名義・なりすましで 偽モデル配布
エッジ/端末層（オンデバイス）：OS/ファームの脆弱性や再パッケージで モデル差し替え

代表的なリスク（“何が起きる”“なぜ起きる”をセットで）

1) 伝統的な第三者パッケージの脆弱性

何が起きる：古い/脆弱な依存（例：PyTorch/周辺ツール）経由で環境が侵害。
なぜ：A06:2021 の典型。AI開発環境は 広範な依存 を持ち、攻撃面が大きい。

2) ライセンスリスク

何が起きる：OSS/データセットの条件違反で 法務・知財の問題。
なぜ：ライセンスの相性や再配布条件が複雑、BOM未整備で見落とし。

3) 古い/非推奨モデルの使用

何が起きる：保守停止により 既知脆弱性が放置、バイアス修正も届かない。
なぜ：更新ポリシー不在、モデル来歴管理の欠如。

4) 脆弱な事前学習モデル（バイアス/バックドア/改変）

何が起きる：ブラックボックスなモデルに 意図的改変 やデータ毒が混入。
なぜ：外観検査では判別困難、レポジトリの安全評価は万能ではない。

5) 弱いモデル来歴（Provenance）

何が起きる：偽アカウント/乗っ取りで 似せモデル を流通。
なぜ：強固な真正性保証が一般化しておらず、署名/ハッシュ検証の徹底不足。

6) 悪意ある LoRA アダプタ

何が起きる：LoRA を重ねた途端、基盤モデルの挙動が汚染。
なぜ：モジュール性が裏目に。vLLM/OpenLLM 等が自動で取り込むと影響が連鎖。

7) 共同開発/マージ・変換サービスの悪用

何が起きる：マージ済みモデルがレビューを バイパス、変換サービスで 不正コード注入。
なぜ：人気のワークフローに監査の穴。自動化ボットの権限/検証が甘い。

8) オンデバイス LLM の供給網リスク

何が起きる：製造過程/OS/ファーム脆弱性から 改ざんモデル が配布・常駐。
なぜ：端末は更新遅延・可視性不足。アプリの再パッケージが容易。

9) 不明瞭な T&C とプライバシーポリシー

何が起きる：アプリ入力が勝手に学習に使われ、センシティブ情報の記憶/露出。
なぜ：規約変更の追従漏れ、オプトアウト経路不備。

よくある誤解（神話 vs 現実）

神話：有名レポジトリから取れば安全現実：なりすまし/乗っ取り で偽モデルが紛れ込む。署名やハッシュ検証が必須。
神話：LoRA は軽量だから安全現実：軽量＝検証容易 ではない。小さな差分で 重大な挙動変更 が可能。
神話：ベンチマークに強い＝安全現実：安全ベンチ回避の微調整 が可能。用途別レッドチーミングが必要。

ライフサイクル別に“どこで守るか”

企画・調達

サプライヤ評価（T&C/プライバシー/運用体制）
使用可コンポーネントの白/黒リスト 整備

取得・検収

署名・ハッシュで 完全性検証
SBOM/AI BOM/ML SBOM の作成と保管（CycloneDX 等）

ビルド・微調整

依存とアダプタの SCA/脆弱性スキャン
データ来歴・ライセンスの照合（自動化）

評価・選定

一般ベンチ＋自社ユースケース特化のAIレッドチーム
バックドア/バイアス/改変検知の簡易スクリーニング

リリース・配布

署名付きアーティファクト配布、検証を通らなければ拒否
モデル/LoRAのバージョニングとロールバック計画

デプロイ・運用

実行時の 改ざん検知・整合性チェック（エッジ含む）
共同作業サービスの監査ログ・アラート

ガバナンス

T&C 変更のモニタリング、オプトアウト尊重
監査可能な SBOM カバレッジと更新SLA

最低限の防御コントロール（必携の“4点セット”）

BOM（SBOM/AI-BOM/ML-SBOM）の常時更新：入っているものを可視化
署名・ハッシュ検証のゲート化：検証NGならビルド/デプロイを止める
SCA＋パッチ運用：依存と実行基盤を継続スキャン
用途別レッドチーミング：ベンチだけに頼らない動的評価

KPI（うまく運用できているかを測る指標）

SBOM カバレッジ率（全アセットの何％を把握）
署名検証成功率（取得物の検証通過率）
脆弱依存の修正所要日数（検知→修正まで）
改ざん検知 MTTD（発生→検知までの時間）
ライセンス遵守率（監査指摘ゼロを目標）

30-60-90日ロードマップ（導入の順番）

Day 0–30：信頼サプライヤ定義、BOM初期作成、取得物の ハッシュ検証 を必須化
Day 31–60：SCA導入、署名ゲート をCI/CDに追加、LoRA/モデルの来歴記録
Day 61–90：用途別レッドチーム評価を定常化、エッジでの 整合性/改ざん検知 を運用開始

まとめ

LLMの価値は「外部の知・モデル・部品」を取り込むことで生まれます。その一方で、取り込むたびに 攻撃面が広がる のがサプライチェーンの宿命です。

だからこそ、BOMで可視化 → 署名で真正化 → スキャンとレッドチームで検証 → 運用で継続監視、という “見える化と検証のループ” を回し続けることが実務の要となります。

Best regards, (^^ゞ