2025年12月03日

生成AIと著作権-利用と権利保護の両立にむけて

保険研究部   研究理事 兼 ヘルスケアリサーチセンター長

松澤 登 (まつざわ のぼる)

研究・専門分野
保険業法・保険法|企業法務

このレポートの関連カテゴリ

文字サイズ

1――はじめに

今回のレポートでは生成AIに関連する著作権法上の問題について検討する。まず、生成AIとは、知的財産戦略本部構想委員会(第2回)資料11によれば、「コンテンツやモノについてデータから学習し、それを使用して創造的かつ現実的な、まったく新しいアウトプットを生み出す機械学習手法」であるとされている。現在提供されている生成AIの典型例としては、ChatGPTやCopilotが挙げられる。

生成AIの構築にあたっては、AI開発者が著作物を含むデータを収集・複製し、モデルに入力して学習させる。著作権法における著作物等の定義については後述するが、論文や記事(単なる事実の記載を除く)、イラストを含む美術作品、動画、音楽などはすべて著作物に該当する。例えば、著作物を無断で複製することは著作者の権利侵害となる。したがって生成AIの学習にあたって、学習過程における著作物の複製・入力が違法となるか(後述する主要論点①)が問題となる。

また、生成AIにプロンプト(指示・質問)を入力することでテキストや画像などが生成される。生成されたテキスト・画像が既存の著作物の権利を侵害していないかどうか問題となる。ここには二つの問題があり、ひとつは利用者が特定の作品を複製することを意図したプロンプト(指令)を入力して、結果として特定の作品によく似た結果が出力されるケース(後述する主要論点②)が問題となる。もうひとつは、これに付随して、利用者がそのようなプロンプトを入力していないにもかかわらず、生成AIが学習データと同一または類似した内容を出力する場合も問題となる。

以下では、文化審議会著作権分科会法制度小委員会の「AIと著作権に関する考え方」2(以下、「考え方」)を基礎資料として検討を行う。これは判例の蓄積がない中で生成AIに関する著作権の考え方を示すことを目的にまとめられた報告書である。

2――生成AIの学習の仕組み

2――生成AIの学習の仕組み

生成AIと著作権の関係を論じるにあたり、まず生成AIの基本的な仕組みを確認する。生成AIには、主に開発者、サービス提供者(以下「提供者」)、および利用者という三つの主体が関与する。本稿では議論を明確化するため、提供者と開発者を同一主体として扱う。生成AIの学習から出力に至る一般的なプロセスは、図1に示すとおりである3
【図1】生成AIの学習から生成物の出力まで
(ステップ1)まず、生成AIを構築するために、開発者が著作物を含む事前学習用のデータをモデルに読み込ませる。この工程により、生成AIの基盤となる学習済みモデルが構築される。

(ステップ2)次に、開発者は基盤モデルに対し、生成AIの用途(例:画像生成に特化したモデル)に応じた追加学習用データを読み込ませる。これによりシステムとしての生成AIは完成することとなる(追加学習済みモデル)。

(ステップ3)利用者が生成AIから生成物を出力させるためのプロンプトを入力する。この工程では、AIがプロンプトに基づき関連情報を検索し、必要に応じてデータベースを参照する。これは後述する検索拡張生成(RAG)技術を利用するものである。

(ステップ4)最後に、生成AIが生成結果を提示する。
 
3 考え方p18・p19参照。

3――著作権法

3――著作権法

1|総論
著作権法は、著作物の公正な利用を確保しつつ、著作者(著作物の創作者)の権利を保護することを目的としている(著作権法1条)。すなわち、著作物の利用促進と著作者の権利保護の両立を図る法律である。著作者が有する著作権は、知的財産権の一種である。知的財産権とは、形を持たない無体物に関する権利を定めるものである。例えば、絵画の著作権は、有体物としての絵画そのものの所有権とは独立し、絵画の表現という無体物に対して認められる4

著作権法は著作物を「思想又は感情を創作的に表現したものであって、文芸、学術、美術又は音楽の範囲に属するもの」と定義している(同法2条1項1号)。そのため、以下のようなものは著作物として保護されない。

・思想や感情を含まない単なる事実やデータ
・創作性のない、ありふれた表現
・アイデアにとどまり、表現として具体化されていないもの
・文芸・学術・美術・音楽の範囲に属さない実用品など

著作物の具体例は上述した。
 
4 なお、著作権法は演奏者の権利として著作隣接権を規定するが、本稿では省略する。
2著作者の権利および権利制限
ただし、著作権法は、著作物を利用するすべての行為に著作者の権利が及ぶと定めているわけではない。例えば、論文を読む、絵画を鑑賞するなどの行為そのものには著作権は及ばない。著作権が及ぶのは、法が規定する特定の利用行為に限られる。具体的に生成AIと関連する権利としては、(1)著作物を複製する権利(複製権、著作権法21条)、(2)公衆送信する権利(公衆送信権、著作権法23条)、(3)著作物を翻訳・編曲・変形等する権利(翻案権、著作権法27条)等がある。

AIの学習・生成過程では、特に複製権が重要となる。複製権は「有形的に再製すること」と定義されている(著作権法2条1項15号)。「再製」とは、既存の著作物に「依拠」して、その表現上の「本質的特徴を直接感得しうるもの」5を作成することをいう6

ここで依拠性とは既存の著作物の表現をもとにして制作したということである7が、一般に、依拠性とは、既存の著作物の表現を基にして制作したことを指す。一般には、(1)生成物が既存の著作物と高度に類似していること(同一性)、および(2)作成者が当該著作物にアクセス可能であったこと、という二点から判断される8。したがって、生成物が既存の著作物と同一性を有すると認定されれば、その表現の本質的特徴を直接感得できるものと評価される。次に、依拠性の判断として、作成者が既存著作物にアクセス可能であったかが検討され、この二点によって複製権侵害の有無が判断されてきた(図2。以下、本稿の図はいずれも筆者作成)。
【図2】複製権
絵画をコピー機で複製する行為は複製権の侵害となる。また、手書きであっても、オリジナルと極めて類似した作品を作成した場合も複製権侵害が成立し得る。AI学習の場合、デジタル形式の著作物を収集し、モデルに取り込む一連の工程が複製に該当する。

これらの権利を行使するには著作者の許諾が必要となるが、許諾を要せずに利用できる場合が著作権法に規定されている。これらの規定は著作者の権利を制限するものであるため、権利制限という。権利制限の典型的な場合として、私的利用のための複製がある(著作権法30条)。例えば、図書館から借りてきた本の文章を、個人で私用のため書き写すような行為(複製行為)には著作者の権利が及ばない9。そして次項で取り上げるのが、生成AIをはじめとする学習用データの利用に大きく関連する権利制限である。
 
5 本質的特徴を直接感得するとは、表現において既存の著作物と生成物とがほとんど同じものであると感じ取れることをいう。実際の事件では微妙な判断を要するものも多い。
6 岡村久道「著作権法(第4版)」(民事法研究会、2019年10月)p150参照。
7 依拠性とは、著作権の発生が登録などの方式を要せず発生するため、その結果として既存の著作物をもとにしていることを複製等の権利侵害の要件とするとされている(前掲注5p23参照)。この依拠性は原告(被侵害者)に立証責任がある。
8 細かく言えば、依拠性を判断する場合の同一性(類似性)とは、例えば同じ間違いをしている場合などにも認められるため、表現上の「本質的特徴を直接感得しうるもの」とは範囲が異なる(田村善之「生成AIをめぐる著作権法の課題」知的財産法政策学研究(70巻2025年)p47参照。
9 ちなみに公衆の使用のためのコピー機を利用する場合などは権利制限の範囲外(=著作者の権利が及ぶ。著作権法30条1項1号)である。
3生成AIに関連する著作権法の規定
関連する条文は以下の2条である。

(1) 非享受目的規定
まず、AI学習と特に関連する規定として、著作権法30条の4(いわゆる非享受目的規定)が挙げられる。同条は、著作物に表現された思想や感情を「享受する目的」がない場合には、必要と認められる限度で利用を認めるというものである。これは、著作物の本来的な目的である「享受」(内容を鑑賞すること)を伴わない利用は、一般に著作者の利益を害しにくい。このため、同条は「高度に柔軟な権利制限規定」として導入された(以下「非享受目的規定」。図3参照)。
【図3】非享受目的規定
典型的なケースとして「情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう)の用に供する場合」が挙げられている(同条2号)。すなわち、情報をデータとしてデータベースに読み込み、解析のために活用する場合は著作者の権利が及ばない(権利制限)。ただし、著作物の種類及び用途並びに利用の態様に照らし著作者の利益を不当に害することとなる場合には権利制限が否定される(=著作権法違反である。同条但し書き)。
(2) 軽微利用
次に、著作権法47条の5(軽微利用)である。同条は、公衆に提供された著作物にあっては、電子計算機を用いた情報処理により新たな知見又は情報を創出することによって著作物の利用の促進に資する場合において、著作物のうちその利用に供される部分の占める割合、その利用に供される部分の量、その利用に供される際の表示の精度その他の要素に照らし軽微なものに限っては、利用できるとする(軽微利用)。著作物の利用の促進に資する場合として、電子計算機を用いて、(1)検索により求める情報を検索し、その結果を提供すること(同条1項1号。検索結果として新聞記事の一部をスニペット表示するなど)、および(2)情報解析を行い、及びその結果を提供すること(同条1項2号)が挙げられている。2号はAI学習とも関係が深い。情報解析の過程で享受目的が含まれる場合でも、著作者の利益が軽微にとどまると判断されれば利用を認めるものであり、「相当程度柔軟性のある規定」として設けられた(図4)10
【図4】軽微利用
また、これらの規定において「柔軟性」という概念が用いられているのは、米国著作権法107条のフェアユース規定の影響を受けたものとされる。米国では、著作物を著作者の許諾なしに利用できる根拠として抽象的な規定であるフェアユースの考え方を採用している10。フェアユース規定により公正な利用に該当すると判断される場合には、具体的なケースに応じて裁判により解釈を示してきた歴史がある。日本では従来、権利制限規定は個別的・限定的であった。しかし、IT社会の進展を背景に、法改正により抽象度の高い柔軟な権利制限規定が導入された。
 
10 澤田将史「『AIと著作権に関する考え方について』開発・学習段階のポイント」(ジュリスト2024年6月1599号)p63参照。なお、本条では解析の対象となる著作物が著作権を侵害して公衆提供されたものであることを知りながら利用する場合は著作権の制限は行われない(違法となる)。
11 上野達弘「デジタル・ネット時代における権利制限」(ジュリスト1584号)p38参照。

4――開発者の開発・学習行為と著作権法

4――開発者の開発・学習行為と著作権法

1基盤モデル構築のための事前学習
AIモデルの事前学習におけるデータの入力・複製が著作権法上合法かどうかは、非享受目的規定(30条の4)の適用が鍵となる。学習用データとは、生データを欠測値や外れ値の除去、タグ付け(アノテーション)12などの加工を施した構築されたデータ集合をいう13

事前学習に関するこれらデータの複製・入力については、大量の情報から当該情報の要素に係る情報を抽出して解析を行うものである14ことから「情報解析の用に供する」行為にかかるものと考えられる。そして、人による享受目的がないことから、非享受目的利用として著作権法30条の4第2項に該当し、原則として著作権侵害には当たらない。

また、基盤モデルに入力された事前学習データは、最終的に数値パラメータとして抽象化さるにとどまる15。そのため、元の著作物の創作的表現がモデル内部に保持されることは通常ないとされる。したがって考え方でも、事前学習済みのAIモデル自体には「学習に用いられた著作物の複製物とはいえない場合が多いと考えられ(る)」とされている16
 
12 ラベル(タグ)を付けることで、情報の整理・意味づけを行うことを指す。
13 「AI時代の知的財産権検討会中間とりまとめ」https://www.kantei.go.jp/jp/singi/titeki2/chitekizaisan2024/0528_ai.pdf p5参照。
14 前掲注11澤田p63参照。
15 前掲注14 p5参照。ただし、結果的に学習データの表現が残っていると評価せざるを得ない場合もあるとの見解がある(前掲注8田村p73注97)、また奥邨弘司「生成AIと著作権~『考え方について』に関する3つの論点」(知的財産法政策研究vol.70(2025)p136では学習データの創作的表現が生成段階でも利用されることを「通貫現象」と呼ぶ。
16 考え方p30参照。なお、同じく考え方では、学習データである著作物と類似性のある生成物を高確率で生成する状態にある等の場合は、学習済みモデルに学習データである著作物の創作的表現が残存しているとして、学習済みモデルが著作物の複製物と判断される場合があるとする。
2|生成AIモデル構築のための追加学習
追加学習データの複製・入力についても、事前学習と同様に非享受目的規定の範囲内と解され、原則として著作権侵害には該当しない。ただし、「考え方」では、学習済みモデルに対し小規模なデータセットを用いた追加学習を行うことで、当該データセットの影響が強く反映された生成物を出力できる技術が存在する点を指摘している17。すなわち、追加学習は生成物の出力に直接影響を与えるために行われるステップであることから、生成物に学習データに存在する既存の著作物の複製を出力することが技術的に可能であるとする。

そして、「考え方」では、追加学習が特定の著作物の創作的表現を直接感得できる生成物の出力を目的としていると評価される場合には、享受目的があるため、30条の4の非享受目的規定は適用されないと整理している。つまり、この場合は複製権侵害の可能性がある。しかし、開発者が享受目的を有していたかどうかを、著作者側が立証することは困難である。この点、考え方でも、単にAIが学習した著作物と創作的表現が共通した生成物が生成される事例があっただけでは、開発・学習段階における享受目的を推認することはできないとしている18。例えば、特定の既存画像を再現できることを宣伝文句として提供している場合を除けば、開発者が享受目的で追加学習を行ったと立証する事例は多くないと考えられる。

さらに、「享受」目的がある場合には著作権法47条の5の「軽微利用」が問題となる。同条の適用にあたっては、出力された生成物における創造的表現が「著作物のうちその利用に供される部分の占める割合、その利用に供される部分の量、その利用に供される際の表示の精度その他の要素に照らし軽微なもの」にとどまるときは、軽微利用として複製権を侵害しない。したがって、既存の著作物の表現が生成物に付随的に表れているということにとどまるのであれば同条の権利制限の範囲内と思われる。他方、開発者が既存の著作物の複製となる生成物の出力を目的と評価されるに至るような場合には、「軽微利用」とはいいがたく、同条においても権利制限にはならないと考えられる。
 
17 考え方p12参照。
18 なお、考え方では、学習された著作物と創作的表現が共通した生成物の生成が著しく頻発する場合には開発・学習段階での享受目的を推認する一要素となるとする(p21)が、著しく頻発するとはどういうことなのか、立証のハードルが高いと考えられる。
3作風
追加学習において、特定のクリエイターの少量の著作物を学習データとして読み込ませることで当該作品群の影響を強く受けた生成物の生成を可能にすることが行われており、その結果、当該クリエイターの作風を模倣した生成物が出力される可能性がある点への懸念が示されている19

例えば「漫画家〇〇風」や「イラストレーター△△風」などの画像が考えられるが、このように、作風の類似は原則としてアイデアの範疇にとどまり、作風が共通するだけでは著作権侵害には該当しない。上述の通り、著作権法は表現を保護する法律であり、そのもととなるアイデアについては保護が及ばないためである。もっとも、作風と具体的な表現の境界は明確ではなく、既存の著作物の創作的表現が直接感得できる場合には、著作権侵害に該当する恐れがあると考え方では述べられている20

また、考え方では、このような場合に至らなくても、アイデアや作風を模倣した出力をするAIについて、生成行為が営業上の利益や人格的利益を侵害する場合に不法行為に該当する可能性があるとしている21
 
19 考え方p20参照。
20 考え方p21参照。
21 考え方p23・p24参照。なお、前掲注16奥邨p109では、著作権法30条の4の適用外になる場合は、47条の5で判断されることとなるが、合法となる範囲は狭いとする。
4|検索拡張生成(RAG)
利用者がプロンプトを入力した際に、当該プロンプトに基づいて既存のデータベースやインターネット上のデータに含まれる著作物の内容をベクトルに変換(=コンピュータが読み取れるデジタル形式に変換)してデータベースを作成し、これを参照しつつ回答を生成する技術があり、これを検索拡張生成(Retrieval-Augmented Generation、以下、「RAG」)という22。RAGは生成AIの回答出力にあたって、学習データ以外の信頼できるデータを参照することで、ハルシネーション(幻想)を防止すること等に役立つ。

RAGにおける検索結果の複製は、AIモデルによる情報参照を目的とするものであり、享受を伴わない。このため、非享受目的規定が適用され、原則として著作権侵害には当たらない。

他方、上記の追加学習で述べたところと同様に、「学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的と評価される場合」には、「享受目的」があるため、著作権法に違反することとなる。ただ、このような場合は追加学習で述べたところと同様に判断される。

そしてRAGでは、直近のインターネット検索を行うことから、特にロングテール・クエリ(めったにない質問)に関するプロンプトが入力された場合には、多くの検索結果が存在しないことがあり、検索結果の著作物が生成物に近い形で出力されてしまう可能性がある。ただ、このようなケースは偶々生ずることはあっても、それが「享受目的」と評価されることは多くはないものと考えられる。

仮に「享受目的」と評価されるような場合には、軽微利用にかかる著作権法47条の5の適用の有無が問題となる。この点は上述4-2で述べた通りであるが、プロンプトに応じて偶々それだけが出力されたものと言えるにとどまるであれば、同条権利制限の範囲内である(権利侵害はない)と考えられる23
 
22 考え方p20・p21参照。
23 他方、前掲注11澤田p64では、著作物の創作的表現が含まれる要約を出力するケースや出力結果たる画像に創作的表現の一部がそのまま出力されるようなケースについては、著作物の創作的表現の提供を主たる目的とするもので、付随的とはいえず著作権法45条の7の適用場面は限られるとする。

本資料記載のデータは各種の情報源から入手・加工したものであり、その正確性と完全性を保証するものではありません。
また、本資料は情報提供が目的であり、記載の意見や予測は、いかなる契約の締結や解約を勧誘するものではありません。

(2025年12月03日「基礎研レポート」)

このレポートの関連カテゴリ

Xでシェアする Facebookでシェアする

保険研究部   研究理事 兼 ヘルスケアリサーチセンター長

松澤 登 (まつざわ のぼる)

研究・専門分野
保険業法・保険法|企業法務

週間アクセスランキング

ピックアップ

【生成AIと著作権-利用と権利保護の両立にむけて】【シンクタンク】ニッセイ基礎研究所は、保険・年金・社会保障、経済・金融・不動産、暮らし・高齢社会、経営・ビジネスなどの各専門領域の研究員を抱え、様々な情報提供を行っています。

生成AIと著作権-利用と権利保護の両立にむけてのレポート Topへ