生成AIの学習と著作権の考察

大規模言語モデル(LLM)の動作原理と著作権侵害リスクに関する専門的検証報告書

もう少し勉強しようと思いまして、追加でレポート作ってもらいました。以下のような質問をしています。


冒頭:ご質問の要点のまとめ


ユーザー様から提起された主な論点と疑問は以下の通りです。

● LLMの技術的本質: LLMはWeb上の情報をそのまま取り込んでいるのではなく、あくまで統計的なパターン学習を行っているという認識は正しいか。

● 盗用の主張の是非: パターン学習に基づいている場合、特定のソースの盗用や、著作権侵害の主張は当てはまらないのではないか。

 ※あえてそういう風に聞きました

● 学習とパターン化の用語の正確性: AIの動作を「学習」ではなく「パターン化」と呼ぶ方がより正確な認識ではないか。

● 画像生成AIとの共通性: 画像生成AIと文章生成AIの法的・技術的な議論の構造は共通しているか。

● 創作的介入によるリスク低減: AI生成物に大幅な加筆修正(推敲、校正、創作的介入)を行うことで、法的リスクは低くなるという認識は正しいか。


_____________________


前回の内容をもう少し深堀りして、そもそもLLMってなんなのか、完全には排除できないリスクをどうやって下げるのか、と言った観点からもう少し詳しく見解をもらいました。


やはりそのまま出てきたものを商用利用することは一発アウトかな、と思います。ただ、では、加筆修正はどこまでやったら創作性が認められるか、というと、あまり具体的な話ではなくて、とりあえずログを取っておくことと、出てきたものをそのまま出してませんよ(と言うしかない?)、と主張するしかないのかな、と。


じゃぁ、生成AIは盗作ツールだ、みたいな主張は正しいのか、というと、「暗記(Memorization)」の部分があるため、それがどれだけ排除できるか、というのが技術的な課題点として指摘されました。

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る