今回は、日本ディープラーニング協会(JDLA)から公開された「生成AI開発契約ガイドライン第1版」の内容を読み解き、そこから得られた学びを整理しました。

生成AI時代の開発契約が、従来型AIとどう異なるのかを体系的に理解する良い機会となりました。

www.jdla.org

はじめに

2012年のディープラーニング技術の発展に端を発した第三次AIブームは、画像認識や需要予測といった分野で「従来型AI」の導入を促進しました。これらの開発契約では、モデルの著作権や学習用データセットの扱いが主要な論点となり、経済産業省の「AI・データの利用に関する契約ガイドライン(AI編)」が重要な指針となっていました。

しかし、2022年のChatGPTの登場以降、生成AIのブームが到来しました。この飛躍的な性能向上は、Transformerという仕組みが大きな要因です。高性能なモデル開発には巨大なパラメータ、大量の学習データ、そして膨大な計算資源が必要となるため、一企業が単独でモデルをゼロから開発することは困難な状況です。そのため、多くの企業にとって生成AIの導入は、既存モデルの「カスタマイズ」が中心となります。

このガイドラインでは、この生成AIのカスタマイズとしての「開発」と従来型AI開発との違い、そしてその差異を契約にどう反映させるべきかが解説されています。

第1章 生成AIの「開発」とは

生成AIの「開発」とは、実質的には自社向けのカスタマイズを指し、その実現手法にはいくつかの方法があげられています。

  1. ファインチューニング・転移学習:開発済みの生成AIに対し、比較的小量の追加データを学習させる手法です。データを実際に用いてAIの学習を行う点で、従来型AI開発と共通する部分が多くあります。
  2. プロンプトエンジニアリング:生成AIへの入力(プロンプト)を適切に設計する手法です。プロンプトの工夫次第で出力の質が大きく変わるため、ビジネスの現場で重要な技術となります。この工夫をシステムに組み込むことで、高品質な回答を自動で生成でき、プロンプト自体が著作権の対象となる可能性もあります。
  3. RAG(Retrieval-Augmented Generation):モデルに直接データを学習させるのではなく、外部データベースに必要な情報を格納し、都度その情報を取り出して生成AIに与えることで回答を生成する手法です。これにより、データベース内の最新情報や専門情報を反映した回答が可能になります。
  4. Function Calling:生成AIが外部のツールを利用して情報を取得する手法です。プロンプトの内容に応じて、生成AI自身がツールの利用を判断・実行し、必要な情報を取得します。これもモデル自体に手を加えるのではなく、外部ツールと連携するシステムを構築するアプローチです。

第2章 生成AIの開発の進め方と契約

生成AIの開発プロセスにおいても、従来型AIで提唱された「探索的段階型」の開発方式が採用されることがおおいとされています。

これは、アセスメント、PoC(概念実証)、開発、追加学習(運用)の4段階で進めるものです。アセスメントで課題を整理し、PoCで最小限の機能を持つプロトタイプを開発・検証します。PoCが成功すれば、そのプロトタイプを基に本格的な開発段階へと移行します。

契約形態については、各段階で個別に契約する方法も考えられますが、開発が成功した場合の権利帰属といった基本的な条件をあらかじめ合意できるため、基本契約と個別契約を組み合わせるなど案件の状況に応じた柔軟な対応が望ましいとされています。

契約の法的性質としては、生成AIが出力する過程の不確実性や、ベースとなるモデルが第三者製であることから、ベンダが一定の性能を保証することは困難です。そのため、特定の成果物の完成を目的とする「請負契約」よりも、専門的な作業の遂行を目的とする「準委任契約」が妥当であることが多いとされています。

第3章 生成AIの開発の特殊性

生成AIの開発は、既存モデルのカスタマイズや周辺システムの開発が中心となるため、従来とは異なる二つの特殊性に留意する必要があるとされています。

一つ目は、AIモデル自体を一から開発するわけではないという点です。第三者が提供するモデルを利用するため、権利帰属が問題となる「成果物」は、AIモデルそのものではなく、RAGの検索システムやプロンプトといった周辺部分になります。これらの成果物にはベンダのノウハウが凝縮されているため、ベンダが著作権の帰属を望むことが多い一方、ユーザ側の知見が大きく寄与する場合もあり、案件ごとに個別の検討が必要とされています。

二つ目は、ベンダ以外の第三者が有償で提供する生成AIを利用することが多いという点です。これにより、ユーザとベンダ双方が、その第三者利用規約を遵守する必要があります。また、予期せぬ仕様変更やアップデートのリスクも考慮する必要についても言及されています。

これらの特殊性から、契約で定めるべき「成果物」も開発形態に応じて異なります。プロンプトエンジニアリングではプロンプトのひな形や自動調整システム、RAGではデータベースやデータ変換プログラムなどが成果物となり得ます。契約当事者間で成果物の範囲について明確な合意を形成しておくことが重要とされています。

第4章 生成AI開発契約の主要論点

ガイドラインでは、生成AI開発契約と従来型AI開発契約の違いを踏まえ、注意すべき点を二つ挙げています。それは、「AIモデルは一から作らないこと」「多くの場合、第三者提供の有償AIを使うこと」です。このため、契約上の権利や責任に関する議論は、AIモデル自体ではなく、その周辺システムやプロンプトが中心となります。

具体的な契約条項では、以下のような点が論点とされています。

  • 秘密情報の取り扱い:ユーザから提供されたデータが外部の生成AIサービスに入力されるため、ベンダはサービス提供者との間で、入力情報をAIの学習に利用しない旨の契約を締結することが求められます。
  • ベンダの責任と限界:ベースモデルが外部サービスであるため、ベンダが品質を保証することは難しく、その責任範囲は限定的とならざるを得ません。
  • 成果物の著作権:成果物(RAGシステムやプロンプト等)の著作権をユーザ、ベンダ、あるいは共同のいずれに帰属させるか、柔軟な取り決めが必要です。ガイドラインのひな形では、ベンダ帰属、ユーザ帰属、共有の3つの選択肢が示されています。

また、ガイドラインには具体的な仮想事例に基づき、各開発段階における契約書別紙の記載例も示されており、実務を進めるうえで非常に参考になります。

おわりに

今回、「生成AI開発契約ガイドライン第1版」を読み解くことで、生成AIの開発が持つ特有の構造と、それに伴う契約上の留意点を体系的に理解することができました。

特に、成果物の対象がAIモデルそのものではなく、その周辺システムへとシフトしている点、そして第三者サービスの利用規約という外部要因を常に考慮する必要がある点は、従来型AI開発との大きな違いであり、実務を進めるうえで重要な示唆を与えてくれます。

技術の進化とともに法務や契約のあり方も変化していく中で、こうした最新の動向を継続的に学び、自身の知識をアップデートしていくことの重要性を改めて認識しました。