https://wellwellwell.hatenablog.com/entry/2025/06/15/182634

gov.uscourts.nysd.623701.26.0.pdf

※下線部は引用者による

予備的声明

音楽の基本的な構成要素を使って、誰もが自由に新しい曲を作ることができます。Udioのテクノロジーは、それを誰にでも可能にします。人工知能を搭載したUdioのサービスにより、これまで以上に多くの人々 ― 熟練したミュージシャンから一般の音楽愛好家まで ― が、頭の中にあるアイデアを、高品質で素晴らしいサウンドの、かつてない音楽へと変換できるようになりました。

この訴訟は、こうした状況に終止符を打つことを目指しています。原告は世界最大のレコードレーベルであり、音楽業界を独占しています。彼らの訴訟の前提は、音楽スタイル ― オペラ、ジャズ、ラップミュージックの特徴的なサウンド ― が、何らかの形で独占的であるということです。

音楽のジャンル全体は、それらのスタイルを開拓し、発展させ、磨き上げてきた世代のミュージシャンによって制作された録音の権利を取得した企業によって実質的に所有されており、各企業は他者の革新と創造性を基にして芸術の進歩を段階的に推進してきた、という考え方が根底にあります。

この前提は根本的に間違っています。数十年にわたる判例により、いかなる企業も音楽のジャンルやスタイルを支配していないことが確立されているため、Udioはこの訴訟で勝訴するでしょう。

人々が新しい芸術的表現を生み出すのを支援することは、著作権法が奨励するために設計されたものであり、禁止するために設計されたものではありません。長年の法理によれば、Udioが行ったこと、つまり、既存の録音をデータとして利用し、様々な音楽スタイルのサウンドのパターンを特定して分析し、人々が独自の新しい創作を行えるようにすることは、著作権法における典型的な「フェアユース」です。

A. Udioとは何か、そしてどのように機能するか

Udioは新しい音楽を作るためのツールです。ジャンル、スタイル、その他の音楽要素を分かりやすい英語で記述することで、斬新な芸術表現を生み出すことができます。

例えば、Udioに1980年代初頭の「ニューウェーブ」シンセポップ風で、テンポは明るいものの重苦しい雰囲気の曲を生成するように指示すると、ユーザーが何度か繰り返し調整を加えることで、記述したジャンルの特徴的な楽器編成、音色、そして全体的な構成を持つオーディオファイルが生成されます。ユーザーは、独自のオリジナル歌詞や、別の人工知能プラットフォームによって生成された新しい歌詞を、音声出力に組み込むようツールに指示することもできます。

Udioが一般公開されてからまだ数ヶ月しか経っていませんが、すでに人々は独自のアイデアを様々な方法で表現するためにUdioを利用しています。あるユーザーは婚約者にプロポーズするために曲1を作成しました（彼女はイエスと答えました）。

Udioのおかげで、かつてミュージシャンだったが両手が不自由になったユーザーが、再び音楽を作ることができるようになりました。また、コメディアンのキング・ウィロニウスは「BBL Drizzy」という今やバイラルヒットの曲を作成し、この曲はプロデューサーのメトロ・ブーミンによってサンプリングされました。スーパースターのドレイクを含む何百人もの人々が、このサンプリングに基づいてトラックを作成しています。他のUdioユーザーには、このプラットフォームを利用して作詞作曲や音楽制作の世界で新しい才能を発掘したレコード会社から連絡があります。

この民主化された創造性の急増の技術的基盤は、音楽の仕組みを根底から覆すモデルです。このモデルは「ニューラルネットワーク」と呼ばれるコンピュータープログラムの一種で、さまざまな種類の録音のインスタンスをプログラムに多数表示することで構築されました。このモデルは、構成要素を分析することで、録音の聴覚特性に関する驚くほど複雑な統計的知見を導き出しました。

例えば、どのような種類の音がどのような音楽に現れる傾向があるか、ポップソングの形態はどのような傾向があるか、カントリー、ロック、ヒップホップにおけるドラムビートの一般的な変化、これらの異なるジャンルにおけるギターの音色の傾向などです。Udioのエンジニアは、さらに広範囲にわたる改良を重ね、事実上誰もがこのモデルの力を活用して新しい音楽を生み出すことができるツールを開発しました。

明確に述べれば、Udioのサービスの基盤となるモデルは、既存のコンテンツのライブラリではなく、既存の録音からつなぎ合わせた「サンプル」のコラージュを出力するものです。このモデルは、いかなる録音のコピーも保存しません。むしろ、それは様々な音楽スタイルの構成に関する膨大な情報源であり、それらのスタイルの作品の全く新しい聴覚的表現を生成するために使用されます。

Udioは、クリエイティブコミュニティとの協力的で相互に有益な関係を常に模索してきました。既存の著作権で保護された歌詞を含むユーザープロンプトを防ぐための技術的対策を実装しました。既存のアーティストの声にあまりにも似ている出力をブロックするフィルターを開発した後にのみ、製品をリリースしました。

音楽業界全体のミュージシャンやプロデューサーに製品のデモンストレーションを行っており、その多くが楽曲やアルバム制作の制作ワークフローにUdioを使用することに興奮しています。また、一流アーティストやプロデューサーとアドバイザーパートナーシップを結んでいます。業界の主要ステークホルダーとの既存の共生関係のリストは延々と続き、潜在的な関係は事実上無限です。

B. 原告の唯一の主張 ― 学習過程で使用された、誰にも見られず聞かれていないコピーが著作権を侵害しているという主張 ― そして、法律が最終的にそれを否定する理由

原告は、米国の消費者が現在聴く傾向にある録音の75%以上を管理している可能性が高いレコードレーベル群です。原告はUdioが著作権侵害の責任を負うと主張していますが、原告が違法であると主張する唯一の行為は、Udioがモデルの「学習」過程の一環として音声録音のコピーを作成したというものです。

訴状は、Udio によって生成された出力が原告の権利を侵害したという主張を明確に否定しています。同上。訴状には、特定の既存の曲に類似しているとされる出力の様々な例が含まれていますが、同上。 ¶¶ 52-68において、訴状は、これらの出力が訴訟の対象となる著作権侵害を構成すると主張しているわけではないことをわざわざ主張しています（同上、¶ 51（「原告は…これらの出力自体が著作権で保護された録音物を侵害していると主張しているわけではない」）。

法的に言えば、この重要な点が全てを決定づけます。長年の判例によれば、最終的に著作権を侵害しない新製品を作成するために、バックエンドの技術プロセスの一環として、公衆の目に見えない形で保護対象作品のコピーを作成することはフェアユースです。

議会は1791年にこの国で最初の著作権法を制定しました。それ以来233年間、いかなる判例も、ただの一度も、反対の結論に達していません。この問題はこれまで何度も何度も提起されてきたが、そのたびに最終的な結論は、著作権を侵害しない成果物を生成する目的で保護対象作品の「中間」コピーを作成することは許容されるが、訴訟の対象にはならないというものである。

例えば、Authors Guild v. Google, Inc., 804 F.3d 202 (2d Cir. 2015)（多数の大学図書館にある書籍をすべてコピーし、収集した資料の商用の全文検索可能な索引を作成するためのフェアユース）；Kelly v. Arriba Soft Corp., 336 F.3d 811 (9th Cir. 2003)（画像検索機能を作成する目的で、オープンインターネット上の基本的にすべての画像をコピーし、ユーザーにサムネイル版を表示するフェアユース）；A.V. ex rel. Vanderhye v. iParadigms, LLC, 562 F.3d 630 (4th Cir. 2009)（学生の論文を盗作検出ツールにコピーするためのフェアユース）。コピーが原告の著作権者自身の製品と競合する最終成果物を作成するために行われた場合も、結果は同じでした。

例えば、Sega Enters. Ltd. v. Accolade, Inc., 977 F.2d 1510 (9th Cir. 1992)（著作権で保護されたオペレーティングシステムをコピーして、所有者自身のゲームと直接競合する、無許可だが著作権を侵害していないビデオゲームを作成するためのフェアユース）、Google LLC v. Oracle Am., Inc., 593 U.S. 1 (2021)（著作権で保護されたコンピュータソフトウェアの保護された部分をコピーして、直接競合する製品を作成するためのフェアユース）を参照。

したがって、この訴訟は、真に前例のない結果を求めています。すなわち、新技術の開発過程の一環として原告の著作物をコピーすることは、その新技術の最終的な成果物自体は著作権を侵害していないにもかかわらず、フェアユースではなく著作権侵害として訴えられるべきであるという判決です。

以下略

私見

Udioの主張は、以前記事にしたSunoの主張とほぼ同一である。

その主張を雑駁にまとめるとこうなる。

・　われわれ（生成AI音楽ソフト事業者）のやっていることは、既存の音源をデータとして利用し、様々な音楽スタイルのサウンドのパターンを特定して分析し、人々が独自の新しい創作を行えるようにしているだけであり、これは著作権法における典型的な「フェアユース」にあたる。

・　生成AIによって出力された曲が特定の既存の曲に類似しているとしても、その出力物自体は著作権侵害とはならない（これは原告も認めている）。

・　判例によれば、最終的に著作権を侵害しない新製品を作成するために、バックエンドの技術プロセスの一環として、公衆の目に見えない形で著作権保護対象作品のコピーを作成することはフェアユースである。すなわち、著作権を侵害しない成果物を生成する目的で保護対象作品の「中間」コピーを作成することは法的に許容される。

・　原告は、新技術の開発過程の一環として原告の著作物をコピーすることは、その新技術の最終的な成果物自体は著作権を侵害していないにもかかわらず、フェアユースではなく著作権侵害となると主張するが、その主張は認められない。

例えばこれを音楽ではなくて小説や詩などの文学作品で考えてみよう。

小説生成AIで作成された小説を発表し、販売している事業者がいるとする。

そのAIは既存の小説（著作権失効前のも含む）を大量に記憶学習させ、使用者の指示に応じてさまざまなスタイルの作品を生み出すが、最終的な作品自体は特定の既存の作品のコピー（盗用）とまでは言えない。

この場合、出版社が共同して事業者を著作権侵害で訴えることが可能か？

音楽と文学の表現としての特性、また両者が商品として流通する市場の特性の違いから、上記のような事態は俄には想定し難いが、原理的には同じである。

これはあくまでも直感的な私見だが、出力物自体が著作権法を侵害するものでない以上、違法性を認めるのは難しいのではないかと思う。少なくとも現行法でこれを違法とすることはできないのではないだろうか（日本とアメリカでは法律も事情も異なるが、アメリカでもフェアユースを持ち出すまでもなくそもそも違法とはいえないのではないだろうか）。

もちろんこれはあくまで法的な議論をした場合であり、倫理的な問題は別である。学生が卒論に使ったり研究者が論文に使うのはもちろん「アウト」だが、違法とまではいえないだろうという話である。

アメリカの訴訟の行く末に注目したいと思う。

一方で、菊地成孔がAI使用による楽曲制作について長文のステートメントを発表した。

ch.nicovideo.jp

これについても改めて感想を書きたい。