https://wellwellwell.hatenablog.com/entry/2025/06/18/124017

あなた:
最終的に著作権を侵害しない新製品を作成するために、バックエンドの技術プロセスの一環として、公衆の目に見えない形で著作権保護対象作品のコピーを作成することは合法でしょうか。すなわち、著作権を侵害しない成果物を生成する目的で保護対象作品の「中間」コピーを作成することは法的に許容されますか。

ChatGPT:
この問いに対する法的評価は非常に慎重を要しますが、以下のようなポイントを考慮することで、一定の指針を示すことができます。まず、日本法と米国法などで評価が異なる可能性があることに注意が必要です。ここでは主に日本の著作権法を前提に説明しますが、米国法の「フェアユース（fair use）」や欧州法の一部制度にも簡単に触れます。

■ 問題の整理
あなたの質問はこう要約できます：

著作権保護作品を公衆に提供するわけではないが、

バックエンドで**一時的なコピー（中間コピー）**を作成し、

最終的には著作権侵害のない成果物（例：オリジナルの新製品や機械学習モデル）を生み出すことが目的である。

これが著作権侵害になるか、または例外規定により合法になるかを問うものです。

日本法における評価
● 著作権法上の「複製」に該当するか
著作権法では、一時的な複製であっても、「複製権」の侵害となる可能性があります（第21条）。したがって、サーバー上に中間的に読み込んだデータやファイルであっても、技術的に一時保存されたコピーがあるならば、形式的には「複製」に該当します。

● 例外規定（著作権法第47条の5など）
日本の著作権法には、以下のような技術的処理のための一時的複製を認める条文があります：

第47条の5（一時的な複製）
コンピュータにおける著作物の利用に伴って生ずる一時的な複製であって、
著作物の通常の利用に必要不可欠かつ短時間のものについては、
複製権を制限する。

ただし、これは例えば「ストリーミング再生時のバッファ」など、ごく短時間かつ不可避の処理に限定されるため、機械学習のための大量データの取り込みや分析目的の中間処理などはこれに該当しない可能性が高いです。

米国法における評価（補足）
米国では「フェアユース（Fair Use）」の原則により、中間コピーや一時的処理が認められることがあります。たとえば以下のような判例があります：

Authors Guild v. Google, Inc.（Google Books 事件）

Googleが書籍をスキャンし全文を一時保存することはフェアユースに該当するとされた。

Sega v. Accolade

ソフトウェアの互換性分析のためにソースコードをリバースエンジニアリングしてコピーを作成したことがフェアユースとされた。

しかしこれは、フェアユースが明確に認められる米国特有の事情であり、日本では同様に適用されません。

欧州法における補足（テキスト・データマイニング）
EU 著作権指令（DSM指令）では、**テキストおよびデータマイニング（TDM）**を許容する条文（第3条）があり、研究目的などに限り一定の中間コピーの作成が合法とされる方向です。

結論（日本法に基づく）
❌ 現行の日本の著作権法においては、著作権者の許諾なしに、バックエンドであっても保護対象作品の中間コピーを作成することは原則として違法となる可能性が高いです。

ただし：

利用されるコピーが極めて一時的で不可避な処理であれば、「一時的複製」例外に該当する場合もある。

一部の機械学習や研究目的に対する法改正・特例が将来的に導入される可能性はあります（たとえば「AI生成物に関するルール整備」など）。

対応策
著作権者のライセンス取得
中間コピーを含む処理の許可を正式に得る。

著作権が消滅したパブリックドメインの素材のみ使用

著作権フリーのデータセットの使用

データ使用についての法的助言を専門家から得る

必要であれば、具体的な事例（例えば「機械学習モデルの訓練における中間コピー」など）に即したリスク評価も行えます。ご希望ですか？

あなた:
機械学習モデルの訓練における中間コピーは合法ですか？

ChatGPT:
機械学習モデルの訓練において、著作権保護対象の作品を中間コピーすることの合法性は、非常に重要かつグレーな論点です。ここでは日本法を中心に、実務的・法的な視点から整理します。

✅ 結論（先に要点をまとめます）
❌ 現行の日本の著作権法において、著作権者の許諾なく著作物を機械学習の訓練に使用し、学習の過程で中間コピーを作成することは、原則として違法（複製権の侵害）となる可能性が高いです。

ただし：

公開・配布されている著作物を利用目的を制限して合法的に使う手段はあり得ます（例：オープンライセンスや著作権制限規定）。

法改正やガイドラインが今後、AI利用を考慮して整備される可能性はあります。

欧米とは事情が異なります（米国：fair use あり／EU：TDM例外あり）。

🔍 背景：なぜ「中間コピー」が問題になるか？
機械学習の訓練とは、一般に以下のような流れになります：

著作物（画像、音楽、テキストなど）をデータとして取り込む

データを一時的に複製・変換し、モデルに供給する（この時点で中間コピーが発生）

モデルが統計的特徴を抽出・パラメータに反映

モデル自体やその出力を商用利用

このうち、②の中間的なコピー行為が、日本の著作権法上の「複製」に該当します。

📘 日本法での具体的評価
● 「複製権」の侵害
著作権法第21条は「著作物を複製する権利」を著作権者に専属させています。
この「複製」は、バックエンドの非公開コピーでも該当します。

学習に使用するためにローカル保存・形式変換する行為

メモリ上に展開する中間処理

→ すべて「複製」に該当すると解されるのが一般的です。

● 例外規定の限界
第47条の5「一時的複製」は、ごく短時間・利用に不可避の処理（例：キャッシュ）に限られる。

第30条の4（情報解析のための利用）は注目ですが、「著作物の表現自体を目的としない解析」は可能とされており、機械学習の訓練がこれに該当するかは極めて解釈が分かれる。

🔸 第30条の4（令和元年改正）
情報解析目的の複製・利用に関して、以下のような規定があります：

「著作物を表現として享受することを目的とせず、データ解析等を目的とする場合に限り、著作物を利用できる」

これにより一部の「テキスト・データマイニング的利用」が認められる可能性はありますが、

音楽や映像など、表現の本質が重要な著作物には慎重な判断が必要

利用範囲が「個人使用や研究機関など非営利目的」に事実上限定されていると解される可能性が高い

🗺 他国との比較
項目日本米国 EU（2021 DSM指令）
中間コピーの扱い原則違法（複製権の侵害） Fair Use 次第で合法 TDM例外で許容される場合あり
機械学習訓練での使用ライセンス必要目的・影響次第で合法の可能性研究目的なら一部例外

✅ 実務上の対応策・リスク回避
ライセンス付きのデータセットを使用する

CCライセンス（特にCC-BYやCC0）

オープンソースデータセット（例：LAION、COCOなど）

著作権が切れた（パブリックドメイン）作品を使用する

第三者提供の「合法に学習済み」モデルを使う

社内で使用する場合でも、訓練内容を記録しておく（訴訟リスク対策）

商用利用を前提とする場合は、専門弁護士に相談する

📌 まとめ
機械学習の訓練において著作権保護対象作品を中間的に複製する行為は、現行法上では原則違法の可能性が高い。

第30条の4による情報解析目的の例外は限定的で、汎用のAI訓練には適用が難しいケースが多い。

安全に進めるにはライセンス明示済みのデータセットを利用することが最も現実的かつ法的安定性がある。