
06月09日
(月)
2025年
正しい?間違い?著作権とAIに関する思いこみを見直しましょう
By Beth Johnson
本ブログ記事は2024年7月31日に原文が投稿されたものの翻訳になります。
著作権で保護された著作物は人工知能(AI )システムの燃料と呼べるものですが、AIモデルのトレーニング資料にコンテンツが利用される際、著作権がどのように適用されるのかについては誤解が根強く残っています。このような誤解は、AIのエンドユーザーアプリケーションにおけるコンテンツ利用にも広がっています。主な例としては、収集した文献の要約、インサイト抽出のための文書精査、文献スクリーニングの自動化、コンテンツセットからのビジュアル制作などがあります。
著作権とAIについてよくある思いこみを例と共に確認し、この問題について広く信じられているいくつかの誤解の解消に取り組みましょう。
1. 正しい?間違い?生成AIシステムのトレーニングの過程ではコピーは作成されていません。人間と同じように、「機械」はコンテンツを読み、そこから学んでいるだけです。
間違いです。人間と機械の学習方法には多くの違いがあります。人間は直接的な経験、観察、模倣、抽象的な思考などを組み合わせて学習します。一方、大規模言語モデル(LLM)は大量のトレーニングデータを処理することから「学習」します。その際、トレーニングデータはコピーされ、保存されます。
LLMをトレーニングするプロセスにおいては、膨大な量のデータをモデルに与えます。そのデータには、テキスト、画像、オーディオ、ビデオなどのファイルが含まれています。著作権で保護されたコンテンツの利用は最も重要です。というのは、その中には広範なトピック、スタイル、複雑性を網羅する、多様で質の高い資料が含まれているからです。これらの資料があるからこそ、AIプロバイダーは、さらに多用途かつ堅牢で、ひいてはさらに信頼できるアウトプットを生み出すモデルを制作することができます。
LLMは、トレーニングに用いられたオリジナルの著作物の表現を保持しています。一般的に、LLMはトレーニング資料のローカルコピーを作成および保存して、学習プロセスを加速、オリジナルのデータセットへのアクセスを提供します。コンテンツはそれから「トークン化」されます(文章は単語やフレーズに分けられ、単語は文字に分けられます)。これにより確実に、テキストデータはLLMが処理できるフォーマットに転換されますが、同時にオリジナルの著作物のセマンティック構造と意味は保持されます。LLMはオリジナルの著作物の単語の表現に基づいて、その文脈を認識します。これらのシステムはまた、著作物のかなりの部分、あるいは場合によっては全体を一語一句そのままに再現できます。これらの著作物をAIシステムにコピーおよび保持すること、そしてアウトプットで複製することは、著作権に関わります。したがって、著作権コンプライアンスを遵守するためには適切なライセンシングが不可欠です。
2. 正しい?間違い?著作権で保護されたコンテンツをLLMシステムのトレーニングに利用するのはフェアユースです。(注)
状況次第です。現在、著者、出版社、その他の権利保有者からAI企業に対して、コンテンツをLLMのトレーニングに許諾なく利用したことについて、多数の著作権侵害訴訟が起こされています。これらの訴訟は未だ係争中です。AI企業の中には、著作権で保護されている著作物をそのように利用するのは「フェアユース」だと主張している企業もあります。米国では、フェアユースの法理が、特定の状況(例:批評、解説、ニュース報道、教育、学問、研究)では、著作権で保護された著作物を許諾なく利用することを認め、表現の自由を推進しています。
個々の利用がフェアユースに該当するかどうかを決めるのは、事実次第というところが多分にあります。1つとして同じケースはなく、個別に評価することが必要です。すべてのAI関連活動に画一的に適用されるフェアユースの包括的なルールや例外はありません。適切なライセンスの確保は、特定のAI関連活動を目的とする場合も含め、著作権で保護されたコンテンツの利用許諾を得るために最善の方法です。
(注)フェアユースは米国における法理であり日本の著作権法ではフェアユースの法理は採用されていません。
3. 正しい?間違い?AIシステムにオープンアクセス(OA)コンテンツだけ利用していれば、著作権侵害の問題はすべて避けられます。
間違いです。OAコンテンツを利用する場合は、コンテンツの利用を許諾しているOAライセンスの種類を理解することが重要です。例えば、クリエイティブコモンズのライセンスはOAライセンスの1つですが、その中にも 主に6つの種類があり、それぞれ許諾内容が異なり、著者のクレジットの表示も含めて、特定の利用条件が定められています。そのようなライセンスの中には、商用利用を許諾しているものもありますが、厳格に非商用に利用を限定しているものもあります。さらに、著作権者の中には、クリエイティブコモンズのライセンスとは異なる条件で、独自のOAライセンスフォームを使用している場合もあります。
OAライセンスについては、許諾されやすい場合もありますが、個々のOAライセンス条件を理解し、遵守することが必須です。
4. 正しい?間違い? 著作権はイノベーションを妨げています。
間違いです。米国では著作権法は科学と有用な技芸の発展を目的として 制定されました。アメリカ合衆国憲法は、著作権条項(第1条8項8節)において、著者は一定期間にわたり成果物から報償を得る権利があると定めています。著作権は、クリエイターに金銭的インセンティブ、法的保護、創作物による貢献に対する評価を与えることにより、イノベーションを促進します。コピー機の発明からインターネットの発展まで、著作権はテクノロジーの進化を長く支えてきました。ライセンシングは、直接ライセンシングおよび包括ライセンシングのいずれも、著作権を尊重し、イノベーションを支援する有益な方法です。著作権で保護された著作物の利用に対する適切な報酬は、研究開発への投資、技術進歩の推進、多様な創作表現の支援を後押しします。著作権は社会におけるイノベーションと経済成長に極めて重要な役割を果たし続けています。
さらに詳しくは、AIと著作権およびライセンシング のインサイトページをご覧ください。
著作権ライセンスでビジネスを推進
組織全体の従業員に情報を周知し、彼らのニーズに応える著作権コンプライアンス戦略を持つことにより、組織は、効率性の向上、コラボレーションの改善、著作権侵害リスクの最小化に向けて足場を固めることができ、そして究極的にはイノベーションと新しい発見の推進に貢献することができます。
コンテンツ管理およびライセンシングソリューションについては、ここをクリックしてご連絡ください。