前のエピソード――第35話　努力義務と特定小型原付

ＡＧＩとはArtificial general intelligence.

つまり汎用人工知能の事である。

現在は、ＣｈａｔＧＰＴ４．０あたりで、すでにこれをＡＧＩなどという人がいるので、今回ＡＧＩとして書いているが、本当は、現状の物はＡＩ等ではなく、自動生成プログラム。

つまり、本質的にはデータベース付きジェネレータであろう。

さて、今、世界は急速に反ＡＧＩというか、反生成ＡＩに動き出している。

これは、もう明らかに予想出来ていた事だった。

日本だけが、周回遅れのまま推進していて、著作権にデータ学習を許可する部分｜（３４条の４）を追加してあるから合法。合法と、ＡＩ推進派は粋っているが、その法律があるのは日本だけ。

そしていま普及してしまった文章生成ＡＩも、画像生成ＡＩも、映像生成ＡＩも、みんな海外製だ。

日本でやっているサービスも、そのコア部分とデータを含めて全て日本製というのは数えるほどもない。

この海外製のソフトたちは、いま急速に劣勢に立たされていることを日本のメディアは一切報道しない。

Ｇｏｏｇｌｅのバードも、そのデータは個人情報を、許可を得ずに勝手に集め、勝手に使っているとして、集団訴訟が起きた。ＯｐｅｎＡＩはもうちょっと前から訴えられていて、集団訴訟の真っただ中にいる。ＥＵ圏内も同様である。

米国では画像生成ＡＩが激しい訴訟合戦になって、制作会社のＣＥＯは、正直に答えず逃げに回る。

とうとう、米国では俳優や脚本家が集団でストライキを起こすに至る。

こんな状態になって、米国では大分知られてきたことは、生成ＡＩは、ずっと生の人間が作ったデータを必要とし続けるために、作家も絵描きも、俳優も、搾取され続けると言う事だ。

何故、そうなっているのか。

生成ＡＩは、少なくとも『ウロボロス』ではない。

※Ouroboros（ウロボロス）とは、古代のギリシャ時代の象徴の1つである。

自分の尾を噛んで環を作る蛇または竜で表されるシンボル画像である。

これは、頭が尻尾をかむことで、始めと終わりがないとされ、自己の消尽と更新を繰り返す永劫回帰や無限を表すなどとされる。

それ以外には真理と知識の合体であるとか、創造の真理などともされ、様々な意味を持つ。

生成ＡＩと称している物は、巨大な検索エンジンに、統計処理とニューラルネットワークがくっついたものにすぎないという事実だ。

このプログラムは、入力されたデータをひたすら統計解析によって分類し、タグをつけていく。

多く出現するものほど、重要なデータとしてマーキングしていく。統計上、そうなる。

その結果として、如何にも人間が作ったかのような文章が、統計上のデータを使う事で、可能になっている。

このプログラムは意味は理解しない。そういう造りにはなっていないので、人間が行う所の学習とはかけ離れている。どちらかと言えば、統計解析によって分類されたデータ蓄積を学習と言っているのだ。

だから、自分が出力したデータを、取り込んでいくと、次第に統計データに大きな偏りが生じ始める。

それは統計情報だけで意味づけしているプログラムでは、避けられない事態だ。

偏りがどんどん進むと、統計上のメジャーデータが先鋭化して、急峻な山を形成し、他は低い山になる。すると、とうとう意味のない文章しか生成できなくなることが分かっている。

実はこれは画像生成も同じで、生成したデータだけで学習を行うと、10世代もいかないうちからモデルに狂いが出始め、２０世代あたりから目立っておかしくなり始める。３０世代を数えるころには、もう、まったく使い物にならなくなっている。

それ故に、人間が描いたものかをＡＩが検証して、ＡＩが作ったと判断できるものを機械学習の対象から外そうとして、そういうプログラムを作り始めているという。（つまり、人間がやるような、真の学習ができないから、人間の作ったデータを永遠に盗み続けようとするという、滑稽な話だ）

文章の方も、同じ結果になる。

それだからこそ、大企業はインターネット上のデータを大規模にスクレイピングしているのだ。

これは、ずっと続くだろう。

しかし、インターネット上にあるデータの殆どが、生成ＡＩが作り出したもので溢れかえっていくと、もう生身の人間が作り出した文章データを正しく学習できなくなる可能性が高い。

それは統計上のメジャーなデータが生成ＡＩの作り出したジャンクな文章で占められ、人間が作ったデータはマイノリティになる。

それはあくまでもＡＬＴなデータの一つでしかなくなるのだ。

そうなると何が起こるか。

まず著名なＳＮＳは殆どスクレイピングの対象でありながら、おそらくＢＯＴによって、生成ＡＩが吐き出したジャンクが多数を占めるようになる。

そうなると、悪意のある誰かが、生成ＡＩを使って大規模に、偽情報を作ってまき散らした場合、それを、生成ＡＩが取り込んで機械学習してしまうと、もう偽情報の方が、簡単に真になってしまうのだ。

生成ＡＩは意味を判断できないから、偽であるとか真であるとか、考えない。

そういう判断が出来る様なプログラムは、残念ながら、実現できない。

もしかしたら、生成ＡＩが作り出した文章ならば弾くという、余計な処理を追加するかもしれないが、その判断は簡単ではなく、１００％の精度で動作する事は期待できない。

恐らくは８割くらいのジャンクは弾くかもしれないが、残る２割は、人間が手を入れている文章かもしれず、それを機械学習させる事がいいのかは、判断が出来ない。

そして、こういう迷惑行為を防ぐのは容易ではない。

まず、そうした情報を受け取る人間が、それは偽情報だという、認識が必要になる。

そして、生成ＡＩの知識を書き換えられない様にしてしまうと、アップデートができない。かといって、人間が書き換えを出来る様にしたとしても、それは膨大な手間が必要になり、現実的ではない。

正しく、パンドラの壺｜（これはギリシャ語の場合。英語だと函）は開けられてしまったのだ。

追記：　生成ＡＩによるディープフェイクのレベルはどんどん上がっていて、もはや本人と、その本人を良く知る知人友人でなければ、それがフェイクであると判断出来ないビデオ映像や、写真のように見える画像データがＳＮＳに出現していて、米国を揺るがしている。

声すらも、生成ＡＩが生成し始めると、良く出来たＡＩ生成声は、よほど注意して聞かない限り、判別不可能であろう。

ＳＮＳに写真を上げる行為は、もはやディープフェイクの素材提供となっていると思っていい。

声の入ったYoutubeとかTikTokも同じ。下手に４Kとかの映像で多数上げてしまうと、ＡＩの機械学習の餌になっている、という寒い状況である。

これはインターネット時代の終わりの始まりなのだろうか？

作者を応援しよう！

ハートをクリックで、簡単に応援の気持ちを伝えられます。（ログインが必要です）

応援したユーザー

新規登録で充実の読書を

マイページ: 読書の状況から作品を自動で分類して簡単に管理できる; 小説の未読話数がひと目でわかり前回の続きから読める; フォローしたユーザーの活動を追える
通知: 小説の更新や作者の新作の情報を受け取れる
閲覧履歴: 以前読んだ小説が一覧で見つけやすい

カクヨムで可能な読書体験をくわしく知る

次のエピソード第37話　ラノベのレッテル貼り

作者を応援しよう！

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

文字サイズ

背景色

フォント

組み方向

応援の気持ちを届けよう

フォロー機能を活用しよう

フォロー機能を活用しよう