04月11日
(金)
2025年
問題の中心:著作権、AIトレーニングとLLM – エグゼクティブサマリー
By CCC
本ブログ記事は2024年9月23日に原文が投稿されたものの翻訳になります。
過去2年間、ChatGPT、Claude、Geminiなど、大規模言語モデル(LLM)に基づき、容易にアクセスできる新しい人工知能(AI)ツールが爆発的に増加しました。世間の注目を集めたこれらのツールは、私たちの生活を多くの側面で改善するものとして、高い期待が寄せられています。しかし同時に、AIテクノロジーと著作権の兼ね合いについては重大な疑問が湧き起こっています。
Journal of the Copyright Societyに掲載予定の最新の論文、The Heart of the Matter: Copyright, AI Training, and LLMs(問題の中心:著作権、AIトレーニングとLLM)は、著作権とAIがどのように関わり合っているかを説明しています。同論文は、著作権と生成AIの関係の主要な分野を取り上げ、LLMでコピーが作成、使用される仕組み、このような利用から生じうる重大な著作権侵害の問題、これらの問題については各国で対応に一貫性がなく、係争中の事例が多数あることを考察しています。そして、これらの課題に関して、ライセンシングは合理的な解決策であると結論づけています。直接ライセンシングおよび任意契約型の包括ライセンシングはいずれも、著作権者とユーザーが協業し、イノベーションを実現するうえで、重要な役割を果たすことができます。
著作権保護された著作物のLLMにおける使用
LLMは膨大な量のテキスト著作物を使用しますが、多くは著作権で保護されています。LLMが元にする著作物をコピーする際、著作権の問題が発生します。たとえば次のような場合です。
- LLMのトレーニングデータセットに著作権保護された資料を許可なく利用すると、違法コピーの作成になることがあります。トレーニングプロセスで生成されたコピー、トレーニング後にLLMに埋め込まれたトレーニングデータの表現の形式のコピーなどです。これは著作権侵害のおそれがあります。
- アウトプット、つまりLLMのようなAIシステムによって生成された資料が、著作権で保護された著作物のインプットと同一、あるいは非常に類似している場合、適切な著作権の制限や例外に該当しない限り、著作権侵害になることがあります。
ライセンシングは必須
著作権が重要であることは明白ですが、それがどのように適用されるかは甚だ曖昧です。その問題への対応は、テクノロジーおよび著作権で保護された著作物が使用される場所によって大きく異なります。AI(あるいはテキスト・データマイニングなどAIに組み込まれている使用)に特化した法規制が制定されている、あるいは検討中という国もありますが、法規制をまったく制定していない国もあります。法規制に取り組んでいる国の間でも、一貫性があるとは言えず、複雑な法的状況を慎重に見極める必要があります。多数の訴訟がさまざまな管轄区域、段階で、それぞれのプロセスで起こされていることが、問題をさらに複雑にしています。これらの訴訟に同じ決定が行われることはないでしょう。
全世界で共通の単一の著作権法は存在せず、国によって著作権およびAI関連の問題に対するアプローチは大きく異なり、著作権およびAIに関するすべての決定が一手に委ねられている裁判所もありません。グローバル規模のライセンスは、著作権者とユーザーが著作権保護された著作物の利用について合意に至るのを容易にします。ライセンスは、一貫性と責任のある著作権の使用を認めることにより、イノベーションと進歩を可能にして、科学と文化の計り知れない発展を支援します。ライセンスは、LLMのトレーニングや使用に際して、著作権で保護された著作物でできることとできないことについて受け入れ可能なガイドラインを設定し、現在係争中および将来の訴訟にまつわる不確実性の多くを解消する見込みがあります。
直接ライセンスおよび包括ライセンスはいずれも不確実性を軽減し、発展的なエコシステムを確立、前進させるうえで非常に重要です。一人あるいは複数の著作権者とユーザーの間の合意である直接ライセンシングの場合は、支払い、タイミングなどの条件を関係者が柔軟に決めることができ、特殊なユースケースにも対応が可能です。限定された著作物を高価値あるいは個別に特定の方法で使用する場合は、直接ライセンシングが適しており、著作権者にもユーザーにもメリットがあります。
任意契約型の包括ライセンシングもライセンシングにまつわる難題を解決するうえで不可欠です。このタイプでは、ユーザーは単一のライセンスで、複数の著作権者から広範な著作物の利用許諾を得ることができます。各著作権者と個別に交渉する必要はありません。このアプローチによると、著作権で保護されている著作物を利用する許諾を与えたり、得たりすることが効率的にできるため、著作権者とユーザーの両方に高い利便性があります。重要なのは、この方法で提供される権利は、国によって法規制が異なっていても、グローバルに使用できるように条件が調整されていることです。同時に、包括ライセンスを用いると、著作権者は直接的にやりとりするよりも多くのユーザーに認知され、役立つことができます。
要約すると、ライセンシングにより、著作権で保護された質の高い著作物にコンプライアンスを遵守してアクセスし、革新的な利用につなげることができます。ライセンシングはこれまでも常に、著作権を尊重しつつ、イノベーションに活路をもたらしてきました。それがコピー機の発明やワールドワイドウェブの登場につながっています。AIについても、同じ役割を果たすでしょう。
The Heart of the Matter: Copyright, AI Training, and LLMs (問題の中心:著作権、AIトレーニングとLLM)は、Daniel Gervais (Milton R. Underwood Chair in Law, Vanderbilt University)、Noam Shemtov (Professor in Intellectual Property and Technology Law/Deputy Head of CCLS, Queen Mary University of London)、 Haralambos Marmanis (Executive Vice President and CTO, CCC)、Catherine Zaller Rowland (Vice President and General Counsel, CCC) の共著です。
全文を読む
トピック:人工知能(AI)