第36話 AGIと称している物と今後
AGIとはArtificial general intelligence.
つまり汎用人工知能の事である。
現在は、ChatGPT4.0あたりで、すでにこれをAGIなどという人がいるので、今回AGIとして書いているが、本当は、現状の物はAI等ではなく、自動生成プログラム。
つまり、本質的にはデータベース付きジェネレータであろう。
さて、今、世界は急速に反AGIというか、反生成AIに動き出している。
これは、もう明らかに予想出来ていた事だった。
日本だけが、周回遅れのまま推進していて、著作権にデータ学習を許可する部分|(34条の4)を追加してあるから合法。合法と、AI推進派は粋っているが、その法律があるのは日本だけ。
そしていま普及してしまった文章生成AIも、画像生成AIも、映像生成AIも、みんな海外製だ。
日本でやっているサービスも、そのコア部分とデータを含めて全て日本製というのは数えるほどもない。
この海外製のソフトたちは、いま急速に劣勢に立たされていることを日本のメディアは一切報道しない。
Googleのバードも、そのデータは個人情報を、許可を得ずに勝手に集め、勝手に使っているとして、集団訴訟が起きた。OpenAIはもうちょっと前から訴えられていて、集団訴訟の真っただ中にいる。EU圏内も同様である。
米国では画像生成AIが激しい訴訟合戦になって、制作会社のCEOは、正直に答えず逃げに回る。
とうとう、米国では俳優や脚本家が集団でストライキを起こすに至る。
こんな状態になって、米国では大分知られてきたことは、生成AIは、ずっと生の人間が作ったデータを必要とし続けるために、作家も絵描きも、俳優も、搾取され続けると言う事だ。
何故、そうなっているのか。
生成AIは、少なくとも『ウロボロス』ではない。
※Ouroboros(ウロボロス)とは、古代のギリシャ時代の象徴の1つである。
自分の尾を噛んで環を作る蛇または竜で表されるシンボル画像である。
これは、頭が尻尾をかむことで、始めと終わりがないとされ、自己の消尽と更新を繰り返す永劫回帰や無限を表すなどとされる。
それ以外には真理と知識の合体であるとか、創造の真理などともされ、様々な意味を持つ。
生成AIと称している物は、巨大な検索エンジンに、統計処理とニューラルネットワークがくっついたものにすぎないという事実だ。
このプログラムは、入力されたデータをひたすら統計解析によって分類し、タグをつけていく。
多く出現するものほど、重要なデータとしてマーキングしていく。統計上、そうなる。
その結果として、如何にも人間が作ったかのような文章が、統計上のデータを使う事で、可能になっている。
このプログラムは意味は理解しない。そういう造りにはなっていないので、人間が行う所の学習とはかけ離れている。どちらかと言えば、統計解析によって分類されたデータ蓄積を学習と言っているのだ。
だから、自分が出力したデータを、取り込んでいくと、次第に統計データに大きな偏りが生じ始める。
それは統計情報だけで意味づけしているプログラムでは、避けられない事態だ。
偏りがどんどん進むと、統計上のメジャーデータが先鋭化して、急峻な山を形成し、他は低い山になる。すると、とうとう意味のない文章しか生成できなくなることが分かっている。
実はこれは画像生成も同じで、生成したデータだけで学習を行うと、10世代もいかないうちからモデルに狂いが出始め、20世代あたりから目立っておかしくなり始める。30世代を数えるころには、もう、まったく使い物にならなくなっている。
それ故に、人間が描いたものかをAIが検証して、AIが作ったと判断できるものを機械学習の対象から外そうとして、そういうプログラムを作り始めているという。(つまり、人間がやるような、真の学習ができないから、人間の作ったデータを永遠に盗み続けようとするという、滑稽な話だ)
文章の方も、同じ結果になる。
それだからこそ、大企業はインターネット上のデータを大規模にスクレイピングしているのだ。
これは、ずっと続くだろう。
しかし、インターネット上にあるデータの殆どが、生成AIが作り出したもので溢れかえっていくと、もう生身の人間が作り出した文章データを正しく学習できなくなる可能性が高い。
それは統計上のメジャーなデータが生成AIの作り出したジャンクな文章で占められ、人間が作ったデータはマイノリティになる。
それはあくまでもALTなデータの一つでしかなくなるのだ。
そうなると何が起こるか。
まず著名なSNSは殆どスクレイピングの対象でありながら、おそらくBOTによって、生成AIが吐き出したジャンクが多数を占めるようになる。
そうなると、悪意のある誰かが、生成AIを使って大規模に、偽情報を作ってまき散らした場合、それを、生成AIが取り込んで機械学習してしまうと、もう偽情報の方が、簡単に真になってしまうのだ。
生成AIは意味を判断できないから、偽であるとか真であるとか、考えない。
そういう判断が出来る様なプログラムは、残念ながら、実現できない。
もしかしたら、生成AIが作り出した文章ならば弾くという、余計な処理を追加するかもしれないが、その判断は簡単ではなく、100%の精度で動作する事は期待できない。
恐らくは8割くらいのジャンクは弾くかもしれないが、残る2割は、人間が手を入れている文章かもしれず、それを機械学習させる事がいいのかは、判断が出来ない。
そして、こういう迷惑行為を防ぐのは容易ではない。
まず、そうした情報を受け取る人間が、それは偽情報だという、認識が必要になる。
そして、生成AIの知識を書き換えられない様にしてしまうと、アップデートができない。かといって、人間が書き換えを出来る様にしたとしても、それは膨大な手間が必要になり、現実的ではない。
正しく、パンドラの壺|(これはギリシャ語の場合。英語だと函)は開けられてしまったのだ。
追記: 生成AIによるディープフェイクのレベルはどんどん上がっていて、もはや本人と、その本人を良く知る知人友人でなければ、それがフェイクであると判断出来ないビデオ映像や、写真のように見える画像データがSNSに出現していて、米国を揺るがしている。
声すらも、生成AIが生成し始めると、良く出来たAI生成声は、よほど注意して聞かない限り、判別不可能であろう。
SNSに写真を上げる行為は、もはやディープフェイクの素材提供となっていると思っていい。
声の入ったYoutubeとかTikTokも同じ。下手に4Kとかの映像で多数上げてしまうと、AIの機械学習の餌になっている、という寒い状況である。
これはインターネット時代の終わりの始まりなのだろうか?
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます