このコラムでは、Chat GPTのような生成AIを業務で利用する際に、気を付けるべき法律問題について解説します。
1.著作物を指示文(プロンプト)に入力していいか?
Chat GPTのような生成AIに、他人の著作物である文章(テキスト)や画像などを入力しても問題ないでしょうか。
(1)そもそも「著作物」とは?
「著作物」の意味を正面から説明しようとすると、なかなか難解な議論になってしまうので、本コラムのテーマである生成AIの利用との関係では、文章、イラスト、写真、動画、音楽、ソフトウェア・プログラム(ソースコード)などの広義のコンテンツ類で、気持ちや考えの「表現」に作者の個性が多少なりとも表れているものは著作物になると考えていただければいいと思います。なお、これらのコンテンツ以外は著作物にならない、という意味ではないですが、生成AIの利用の局面では、いったんこれらのコンテンツについての著作権を気にすればいいと思います。
株価や気温などの単なる事実データは著作物ではなく、文章でも新聞の見出しのような短い文章は、表現に個性を出す幅が小さいので普通は著作物ではないといわれています。契約書や、決まった作図法で描かれる設計図なども著作物でないとされることが多いです。
他方、イラスト、写真、動画やある程度まとまりのある文章は、多くの場合著作物になる、と考えていただいていいと思います。短い文章であっても、俳句などは通常著作物になるといわれています。また、高度な創作性が必要とされるわけではなく、たとえば普通の幼稚園児が描いた絵や、小学生が書いた作文なども立派な著作物です。
なお、アイデアなど(気持ちや考え)それ自体は著作物ではなく、それを表現したものが著作物です。例えば、映画や小説のストーリーや設定自体は著作物ではないので、ストーリーや設定を真似しても著作権侵害にはなりません。
著作物については、いったんこの程度の理解でよいかと思います。
(2)著作物の利用についての、著作権法のルール
あるコンテンツが「著作物」にあたるとすると、著作権法で利用に制限がかかってきます。
著作権者の許諾がないとできないもののうち代表的なものとしては、①複製(コピー)、②翻案(改変や翻訳など)、③公衆送信/送信可能化(インターネット上にアップロードしアクセスできるようにすること)があります。例えば、小説を本屋で買ってきて、それを自分で読んで楽しむとか、いらなくなったのでほかの人に売る、あるいは中古書店で売ることは著作権者の許諾がなくてもできるのですが、コピーを取ったり、その小説を改変して新しい小説を作ったり、インターネット上にアップロードしたりすることは(原則として)できないわけです。それらの行為については、著作権者の許諾が必要となり、そうすることで、著作権者が流通をコントロールし、課金することもできるわけです。
なお、上に書いたように、いわゆる「パクリ」行為が全て著作権侵害になるわけではなく、例えば他人が作った小説のストーリーや設定を真似して自分で小説を作るのは著作権侵害にはなりません。ストーリーや設定は具体的な表現ではなく「アイデア」で、「アイデア」は著作権法の保護対象ではないとされているからです。なお、これは著作権法が「表現」は重要だけれども「アイデア」は重要ではないから保護しなくていい、と考えているからではなく、アイデアまで作者に専有させて許諾がないと他の人が使えなくなってしまうと、学問の発展や創作活動の過剰な制約になってしまうと考えられているからです。
ただ、上に書いたような行為(複製・翻案・公衆送信/送信可能化など)が全て著作権者の許諾がないとできないようにすると過剰な制約になるので、一部の行為は著作権者の許諾がなくてもできることになっています。例えば、私的利用の例外(著作権法30条1項、47条の6第1項1号)というのがあり、個人や家庭内で使うためにコピーを取ったり、翻訳したりすることは、著作権者の許可がなくてもできます。また、公正な慣行に従ったうえで、著作物の一部を批評などのために引用することもできます(著作権法32条1項)。ただ、前者の私的利用の例外については、すこし議論のあるところではありますが、企業内の業務のための利用は、たとえ一従業員が自分だけで使う目的であっても、該当しないとされている(原則に戻って、著作権者の許可がないとできない)ことに注意です。
(3)情報解析の例外
生成AIの指示文(プロンプト)として(他人の)著作物を入力する場合、コピー&ペーストの作業が入りますので、複製行為が発生します。このため、どこかの例外に当たらない限り、複製権侵害として著作権侵害になってしまいます。
生成AIの指示文(プロンプト)への入力の際に使える例外として、著作権法30条の4第2号の「情報解析」があります。情報解析とは、「多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うこと」とされており、生成AIでの分析は、この「情報解析」にあたるとされています。ただ、「著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的」(享受目的)もある場合はこの例外が使えないとされています。享受目的とは、著作物を見たり聞いたりして知的、精神的な欲求を満たす利用をする目的ですが、文章であれば読む、画像であれば見る、という、著作物のユーザーとしての本来的な利用方法と考えていただければよいと思います。
指示文(プロンプト)への入力の場合、指示文(プロンプト)に入力した著作物と似た生成物を生成させる目的の場合は、結局元の著作物(と似た)著作物を享受することになるので、享受目的がある(→著作権法30条の4第2号の例外が使えず、著作権侵害になる)と考えられます。そうでなく、入力した著作物とは全然違うものを出力させようとする場合は、この「情報解析」の例外が使えると考えられます。なお、指示文(プロンプト)の書き方を工夫しても、結局指示文(プロンプト)に入力した他人の著作物と似たAI生成物が出てくる可能性はありますが、その時は、下の「3.」に書いた通り、そのAI生成物を利用するとやはり著作権侵害になってしまう(可能性が高い)ため、利用しないようにする必要があると考えられます。
なお、指示文(プロンプト)に入力した著作物と似た生成物を生成させる目的の場合など、「情報解析」の例外が使えない場合でも、個人や家庭内で楽しむといった私的使用のためであれば著作権法30条1項に基づき許されます。ただ、この著作権法30条1項は、企業の業務で使う場合は、たとえ一従業員の使用でもこの例外には当たらないと考えられているので注意です。
2.作風を指示文(プロンプト)に入力していいか?
「村上春樹のような文章を生成して」など、作風を指示文(プロンプト)に入力してよいでしょうか。
指示文(プロンプト)への入力自体が著作権侵害になることはありませんが、その結果、村上春樹のある小説などと似た文章を生成した場合は、そのAI生成物を利用することで著作権侵害になる可能性があります。その場合の扱いは、次の「3.」で説明します。
3.AI生成物の利用が他人の著作権を侵害しないか?
出てきたAI生成物が他人の著作物に類似する場合、著作権侵害になる可能性があります。
指示文(プロンプト)に他人の著作物や作風を入力した場合は、生成物がそれに似ていないかチェックする必要がありますし、それ以外の場合でも、出てきたAI生成物をウェブにアップロードするなど広く使う場合は、リスク低減のため、コピペチェックツール、類似画像検索などで、似たようなものがないかチェックするのが望ましいでしょう。
なお、理論的には、著作権の侵害となるのは、他人の著作物に依拠してまねた(依拠性)場合に限られます。このため、偶然似たAI生成物が生成された場合でも、依拠していないという反論ができるのではないか、という問題はあります。しかし、生成AIの場合、生成AIの学習用データセットにその著作物が入っていたら(原則として)依拠性が肯定されるという見解が優勢であり、そうすると、そもそもどのような学習用データセットを使っているか確認するのは難しいですし、また、自分自身で依拠したかどうかについても、依拠していないと反証するのは簡単ではありませんので、依拠性がないという反論をするのは、実際には難しいと思われます。
4.AI生成物は著作権で保護されるか?
自社がAIを使って生成した生成物に著作権が認められるでしょうか。著作権がないとすると、(そもそも、それがAIで生成したものかどうか外から見てわかるのかという問題もありますが)第三者が複製・翻案・公衆送信/送信可能化した場合でも、著作権侵害にならない(著作権で保護されない)ことになります。
著作者になれるのは人間だけでAIは著作者にはなれません。このため、生成AIに指示文(プロンプト)を入力した人が「著作者」になるのか、という問題になります。通常は否定されるように思われますが、その人が、出てきた生成物の創作的表現部分について、生成AIに対して具体的・詳細な指示をしていた場合などは、生成AIに指示文(プロンプト)を入力した人が著作者になる可能性もあると思われます。
なお、もともとAIが生成したものであっても、それを人間が改変した場合は、改変部分については改変した人が著作権者となりますので、その部分については著作権で守られることになります。
5.個人データを指示文(プロンプト)に入力していいか?
(1)第三者提供に当たらないか?
生成AIに個人データを入力する場合、個人データの第三者提供(個人情報保護法27条)に当たり、あらかじめ本人の同意をとらなければいけないのではないか、という問題があります。
まず、入力した個人データが生成AI事業者によって機械学習に使われる場合、個人データの(生成AI事業者への)第三者提供(個人情報保護法27条)に当たり、本人の同意がないとやってはいけないと考えられます。なお、委託(個人情報保護法27条5項1号)の場合は本人の同意がなくてもできることもありますが(ただ、提供先が海外だと原則として同意が必要です)、生成AI事業者自身の機械学習に使われるのであれば、委託にあたると考えるのも難しいと思われます。
他方、生成AI事業者による機械学習に使われない場合は、そもそも(生成AI事業者への)第三者提供に当たらないという考え方もあります。すなわち、個人データをクラウドサービスに預けている場合で、当該クラウドサービスの事業者との契約で、当該個人データを当該業者が取り扱わない旨が定められ、適切にアクセス制御を行っている場合は、「第三者提供」にあたらないと考えられています(個人情報保護委員会の出している、「個人情報の保護に関する法律についてのガイドライン」 に関するQ&A7-53)が、その場合に準じて考えるということです。この考え方だと、本人の同意をとらなくてもいいことになります。ただ、生成AI事業者が不正監視・誤用防止のためにデータを処理することがある場合にも、このようなクラウドサービスと同じように考えてよいのか、という問題はあります。
なお、個人情報保護委員会は、2023年6月2日付で「生成AIサービスの利用に関する注意喚起等」を公表しており、その中で、「個人情報取扱事業者が、あらかじめ本人の同意を得ることなく生成AIサービスに個人データを含むプロンプトを入力し、当該個人データが当該プロンプトに対する応答結果の出力以外の目的で取り扱われる場合、当該個人情報取扱事業者は個人情報保護法の規定に違反することとなる可能性がある。そのため、このようなプロンプトの入力を行う場合には、当該生成AIサービスを提供する事業者が、当該個人データを機械学習に利用しないこと等を十分に確認すること。」と書いています。必ずしも明らかではないものの、生成AI事業者による機械学習に利用されないのであれば、指示文(プロンプト)に個人データを入力しても第三者提供に当たらない、という立場に立っているようにも読める記述です。
(2)利用目的に反しないか?
ここまで説明してきた第三者提供の問題とは別に、生成AIサービスへの入力が、当該企業が特定した利用目的(プライバシーポリシーなどで公表していることが多いです)の範囲内なのか、という問題があります。個人情報保護委員会も、上記の注意喚起で「個人情報取扱事業者が生成AIサービスに個人情報を含むプロンプトを入力する場合には、特定された当該個人情報の利用目的を達成するために必要な範囲内であることを十分に確認すること。」と書いています。
生成AIサービスへの入力は、通常目的ではなく手段に過ぎないため、最終的な目的が、特定された「利用目的」の範囲内であればいいため、最終目的を確認すればいいことになります。例外的に、「プロファイリング」を行う場合は、そのことも利用目的として明記しておく必要がある(個人情報保護委員会「個人情報の保護に関する法律についてのガイドライン」に関するQ&A2-1)ので注意してください。
6.秘密情報を指示文(プロンプト)に入力していいか?
(1)自社の秘密情報を指示文(プロンプト)に入力する場合
AI事業者が指示文(プロンプト)に入力した情報を機械学習に使う場合、同じ生成AIサービスを使う他のユーザーに秘密情報が洩れる可能性があります。このようなリスクを避けるためには、機械学習に使われない設定にしておく必要があります。なお、ChatGPTでは、個人用プランであればデフォルト設定では機械学習に使われるもののオプトアウトすることで使われないようにでき(無料プラン・有料プランいずれも同じ)、企業向けプランでは機械学習に使われない設定になっているようです。
また、機械学習に使われる場合は、不正競争防止法の「営業秘密」としての保護が失われる可能性もあります。
(2)他社の秘密情報を指示文(プロンプト)に入力する場合
他社の秘密情報の場合は、その会社との間で締結した秘密保持義務に注意する必要があります。秘密保持義務は、秘密保持契約を締結している場合はその中に書かれていますし、業務委託契約など、一般の事業上の契約でも、秘密保持条項が入っていることが多いですので、その内容をチェックする必要があります。
秘密保持条項の対象となる「秘密情報」(これも、契約のなかに定義が書かれていることがほとんどですので、そこをチェックする必要があります)に当たる場合、一般的な秘密保持条項では、「第三者」への開示は(秘密情報の主体である)相手方の許諾がないとできないと書かれているのが普通です。生成AIへの入力が、生成AI事業者への開示に当たると考えると、秘密保持義務違反になってしまいます。
たとえ生成AI事業者が機械学習に使わないとしても、第三者である生成AI事業者への提供であることは否定できないのではないか、とは思われます。もっとも、生成AIの指示文(プロンプト)への入力は、それが機械学習に使われないのであれば、クラウドサービス上で第三者が提供するソフトウェアを使っているに過ぎないといえ、秘密保持条項の中の第三者提供禁止がそのようなことまで禁止する趣旨ではないと考えるのも、一定の合理性はあると思われます。したがって、情報の機密性の高さなども考慮して、実質的に判断していくしかないと思われます。
7.その他の注意点
上に書いた以外に、以下の点に注意する必要があります。なお、「その他の注意点」としてまとめたのは、以下の点が、これまで説明してきたものより重要性が低いという理由ではなく(むしろ、これまで書いてきたもの以上に重要なものが多いです)、常識に従って判断すればいいものが多いためです。
・よく知られているように、ChatGPTなどの文書生成AIは、誤った情報をそれらしく言う(ハルシネーション)傾向があります。これは、文書生成AIが、次に来る確率の高い単語がどれなのか学習用データセットで学習することで構築したものであるため、仕組み上避けられないものです。たとえば、「昔々あるところにおじいさんと」に続く単語は、「おばあさん」が一番高い、ということを学習してモデルを構築し、続く可能性が高い単語を出力する(ただ、常に一番可能性が高い単語を出力するわけではない)、という仕組みになっています。このように、文書生成AIの回答は、学習したデータをもとに、次に続く可能性の高い単語をつなげて出力しているに過ぎませんので、内容が正確である保証はなく、利用者が自分で正確性をチェックしたうえで使う必要があります。
・生成AIの出力するコンテンツが性差別、人種差別などの差別につながる場合は、そのコンテンツを利用する企業が法的責任を負ったり、レピュテーション上のダメージを被るリスクがあります。
・生成AIを使ったサービスが、医師法、薬機法、弁護士法、金融商品取引法などの業法に違反する場合もあります。
[ディスクレイマー]
本コラムは、お客様の参考として一般的な情報を提供するものであり、具体的な法的助言を意図したものではありません。また、分かりやすさを保つため、法的には厳密さを欠く表現にしている部分も多くあります。実際の事案を検討される際には、必要に応じて専門家にご相談ください。