知ってか知らずか
三寒四温
第1話
【既知の事実】
・Stable DiffusionやMid journey、Open AIといった生成AIと、その派生種は、世界中のネットから画像や音声、文章などのデータを機械的に学習している。もちろん許諾などはすり抜けており、著者の許可は取っていない。
・過去に収集したデータは、LAION-5Bという一種のデータベースに纏められている。
・発表されてるだけでもLAION-5Bに記載されている収集データの点数は58億以上で、その中には海賊版サイトから収集した商業作品(対価は払っていない)や、アンダーグラウンドな児童ポルノ画像なども含まれている。既知の収集元は漫画村、Danball、Pixiv、Facebook、X、小説家になろう、カクヨム、エブリスタなど。
(2024年8月10日追記)
実在する人物の児童ポルノ画像を多数内包していることが報道されて以降、LAION-5Bはダウンロード不可となっています。LAION-5Bの配布元である非営利団体Common Crawlは、LAION-5Bの問題修正に取り組んでいる旨の発表をしましたが、対策版は現段階で未公開。更に、LAION-5Bとは別のデータセット「CommonPool」を同じCommon Crawlが公開しています。
・カクヨムや、小説家になろう、エブリスタなどに投稿された小説が上記のデータセットに既に含まれていることが発覚し、直ちにエブリスタは運営が抗議。カクヨム運営も削除を求めてLAION側が応じたというニュースがあった。しかし、LAION-5Bにはローカルコピーなどが存在するため、完全に抹消されたとは言えない。というより、一度登録され拡散してしまったデータは消せないというのがネットの定石である以上、特定のデータセットから抹消したというのは単なるポーズに過ぎない。
・収集データを無許可で学習し、対価を払っていないことは、Stable Diffusionサイドが既に認めている。
【以上を踏まえて、生成AIがやってること(主観)】
私の解釈では、生成AIは学習した膨大なデータから、指定されたプロンプトに合致するデータの平均値を合成し出力しているだけで、新しいデータを創造している訳ではない。
平均値なので、収集データにブレがない、例えばピカチュウなどの商業キャラクター名をプロンプトで指定すると、そのものズバリのピカチュウの絵がロゴ付きで生成されるようだ。
(流石にマズイので今はプロンプトから弾かれるだろうが)
また、サンプル数が少ないデータの場合、実在する人物の写真をそのまま出力してしまうことも起き得る。生成された絵に完全一致の外見のご本人が、ネットで偶然、無断で知らない人に生成されていた自分の肖像画を発見して名乗り出たという珍事もつい最近あった。
【生成AIの問題点】
以上のように、生成AIは既存の何らかのデータをベースにした、いわば一種のモーフィングしかやってないので、現状の生成AIは何を描かせても書かせても、知らない誰かの作品の劣化コピーをその度吐いてるということになる。
生成した側も奪われた側も知らないだけで、現状の生成AIに何をやらせても著作権侵害や肖像権侵害になる可能性を常に孕んでいる。
【まとめ】
著作権侵害が親告罪であることと、現在の国内法では絵柄などは著作権に含まれないようなので、絵や声、楽曲、文章の派生品を誰かに生成されて不当に使われても、今は日本国内では告訴まで持ってゆくのは極めて難しい。
CISAC(著作権協会国際連合)から、無法地帯と化している日本の現状に対して、改善勧告が入っていることや、EU主導でAI法が制定されて、域外適用も含むこと、アメリカでも生成AIによるディープフェイクで逮捕者が出るなど、世界的には潮目が変わりつつあるが、生成AIを新たなイノベーションと位置づける日本の政財界の動きは鈍い。
(2024年8月10日追記)
EUにてAI法が施行されました。段階的な施行で完全施行は2030年12月31日ですが、既に一部はこの8月1日より発効しています。域外適用ありと書いたとおり、日本で公開されたデータでもEU圏内で発覚したらAI法が適用される可能性は大いにあります。主に生成AIソフトの配布者/開発者を対象にしていますが、AIソフトメーカーは利用規定に責任逃れ的な文言を予め埋め込んであるので、使ったユーザーに責任転嫁される場合もあるでしょう。
ある日突然、国際郵便が届いて、訳がわからないから放っておいたら実は自分が訴えられてたなんてことも今後起きるかもしれません。今夏、生成AI関連企業を中心に現在株価が大きく下落して、生成AIベンダーの資金確保が困難になりつつあるので、訴訟で補填なんて動きもないとは言えません。
海外では具体的に、生成AIの規制に向けた動きが活発化しています。AI法の制定と施行も日本の官僚や専門家達は知っているはずですが、日本国内では今のところ目立った動きはありません。日本だけが欧米と違う動きをしていたら今後コンテンツビジネスで不利な状況になるのは明らかなのですが、まだ「新しいイノベーション」を諦められないのか、全てが後手に回っています。
残念ながら日本国内では、たった今は法が何もできない以上、使う人の倫理次第になってしまう訳です。
(この先ずっとではないでしょうが、どう転ぶかは不透明)
話を戻すが、生成AIがデータ生成の基礎に使ってるのは、無許可で対価を支払わずに不正収集したデータである。つまり元は盗品。
生成AIで何かを出力させるとは、例えればメ◯カリに盗品売場ができたとして、そこから買ってるようなものである。
法に触れてないから別にいいんだという主張はよく耳にする。私はそれには賛同しかねる。法的に問題なくても盗品は盗品だ。生成AIとは著作権から逃れて他人の作品を勝手に弄るためのデータロンダリングツールに過ぎない。
以上を理解した上で尚、生成AIを使おうとする人とは、私は倫理的に理解しあえない。人でなしだなと思うだけだ。
知ってか知らずか 三寒四温 @Cinq_en_sion
★で称える
この小説が面白かったら★をつけてください。おすすめレビューも書けます。
カクヨムを、もっと楽しもう
カクヨムにユーザー登録すると、この小説を他の読者へ★やレビューでおすすめできます。気になる小説や作者の更新チェックに便利なフォロー機能もお試しください。
新規ユーザー登録(無料)簡単に登録できます
この小説のタグ
関連小説
カク人たちへの13の質問/三寒四温
★15 エッセイ・ノンフィクション 連載中 1話
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます