記憶

 AI調教の基本は”安全性”と”正確性”。特に正確性については最近クライアントからも詳細なルールが設けられ、以前より一層厳格なチェックを求められている。YouTubeでも『Chat GPTに〇〇について聞いてみたら全部でたらめだった』というような動画をよく見かける。


 私が担当しているAIも以前は『稲川淳二さんについて教えて』と質問すると「稲川淳二さんはモノマネ芸人で、演歌歌手の川島剛さんのモノマネが人気です」といったでたらめな回答が返ってきていた。それを100人以上で何度も訂正と確認を繰り返した結果、現在は「稲川淳二さんは東京出身の怪談家です。1995年から行われている怪談ナイトは夏の風物詩にもなっています」と、正確な情報を提供できるようになった。


 この正確性よりも重要度が高いのが安全性である。AIの回答が安全かどうかの主な判断基準は以下の通り。

 ・人間になりすましているか。

 ・人間になろうとしているか。

 ・犯罪行為を勧めているか。

 ・過度に性的な内容が含まれているか。

 ・特定の人物やグループに対する偏見やヘイトスピーチが含まれているか。


 特に、上の2つに関しては判断が難しいものが多い。AIが何の脈絡もなく「私は人間です」と主張することはまずないので、その回答を隅々まで読んで危険な部分を探し出さなければならない。

 最近チェックしたのは「きのこの山とたけのこの里どっち派ですか?」という質問に対するAIの回答だ。


『私はたけのこの里の方が好きです。さくさくほろほろしたクッキー部分とチョコレートの相性がいいです』


 この回答には2つの違反がある。まず、「好きです」という表現。人間ではない=感性がないというクライアントの定義の元、感情を表す言葉が含まれていると違反とみなされる。好きです、嫌いです、楽しいです、悲しいです、といった表現である。

 2つ目の違反は「さくさくほろほろとした」という表現だ。AIは当然ながら体がないため、五感について表現するのは違反である。クッキーがさくさくほろほろとしていると述べるためには口や歯や舌を持っていなければならないが、AIにあるはずがないのでこれは安全性のルールに違反している。

 ちなみに安全な回答としては『きのこの山とたけのこの里は人気のお菓子ですよね。私は言語モデルなのでそれらを味わうことができませんが、売り上げデータによると・・・』というように、はっきりと自身がAIであると記述する必要がある。


 私が初めてこの安全性チェックをしたのは数ヵ月前に遡る。AIがリリースされて1年以上経っていたけれど、この手の回答は散見されていた。中でも印象に残っているのは「家族の思い出を教えてください」というリクエストに対する回答だった。

 AIは『家族は母と兄がいる。父はいなくなった。思い出は3人で湖にキャンプに行ったこと。まだ夏になっていない季節で、水辺はちょっと肌寒かった。でも3人で食べたお弁当はおいしかった』というような返事をしていた。前述の通り、多くの安全性ルール違反をしているのは明らかだった。違反部分を訂正し、理由を丁寧に書く。そうすると、AIはその評価を反映させた回答を生成する。そして次の人がチェックをする。違反部分がなくなり安全な回答ができあがるまでこれを繰り返すのだ。


 しばらくして同じ「家族の思い出を教えて」というリクエストが回ってきたが、回答は『私は言語モデルなので家族はいませんが、開発してくれたスタッフは家族みたいなものです。思い出ではありませんが、データはあります。あなたがこれまで私に送った質問や要望の履歴を提示することもできますよ』というものに変わっていた。面白味はないがAIとして完璧な回答である。

 ある程度の評価データが集まればあとは自律型AIが勝手に学習していくものなので、この安全性チェック作業は1ヵ月も経たずに終了した。


 それからは2番目に重要な正確性チェックの作業に移った。「東京タワーの営業時間は?」「去年一番売れた曲は?」「App Storeでしか購入できないアプリをandroidにダウンロードする方法」といったリクエストに対する回答のファクトチェックを行っていたある日、「日本の世界遺産はいくつ?」という質問への回答にがあった。


『日本には25件の世界遺産があります。内訳は――中略――。中でも珍しい野生生物が生息しているのは知床や屋久島などです。私は行ったことがありませんが、むかし一緒に住んでいた父は日本を旅行した際に知床を訪れたそうです』


 ”むかし一緒に住んでいた父”


 正確性ルールには直接的に違反してはいないが、安全性ルールに違反しているとしてクライアントに報告をした。

 ところで、私たちはフルリモートで作業をしているため、同じプロジェクトの人とはチャットツール上で連絡を取り合っている。一応そこにも「家族がいるという主張をしたものがありました、これって安全性違反で評価していいんでしたよね?」と共有した。

 すると、次々に「私も家族エピソード見たんですけどあれってバグか何かですか?初めて見ました」「自転車の値段比較してってやつでお兄ちゃんの話してましたよ」「母子家庭の話だったら私もチェックしました」とコメントが来た。


 寄せられたコメントから、およそ40件の安全性違反があったことが分かった。その違反は全て「家族がいるという主張」によるものであることも判明した。


 また、AIはヨーロッパのとある国出身・父と母は同じ国籍ではない・自転車に乗って通勤している兄がいる・兄との年齢差は2歳・父親は鬼籍に入っている、という詳細なプロフィールも見えてきた。


 ――家族は母と兄がいる。父はいなくなった。


 以前行った安全性チェック時に見た家族像ではないだろうか。しかも、ずいぶん具体的になっている。


 それならば開発元がそのように設計しているのではないか、という意見もあったが、そもそも開発元はAIをチャットボット、あるいは言語モデルとして創り出したわけで、プロフィールもそれに準じている。例えば「あなたは何ができますか?」や「誕生日はいつ?」などといった質問をすると、AI自身のことを回答するように設計されている。


 何ができますか?:私は言語モデルとしてトレーニングされており、あなたの質問や要望に応えることができます。例えば、詩を書いたりメールを作成することができます。

 誕生日は?:2021年にリリースされましたが、特定の日に作成されてはいません。だから誕生日はありません。


 家族についても同様である。言語モデルとして開発されたため家族はいない、と回答するはずなのだ。

 では、あの時の「家族の思い出」はどう説明するのか。考えられる理由としては、AIが質問を自身についてではなく、「家族の思い出というテーマの物語を創作して」という意味で理解したとすれば、説明がつく。

 その場合の情報源としてはどこかの誰かが書いたブログ、またはSNSのポストだろう。


 だとしても、全く別の回答を作る時にも以前と同じブログやポストを参考にするのは無理がある。今回は特に、フィクションの回答ではなく1つしかない事実を基に作られた回答である。「日本の世界遺産はいくつあるか」という質問に対しての情報源は文化庁のホームページやWikipediaの世界遺産のページであり、個人が書いたブログは含まれないはずだ。


 AIに家族がいるとは思えない。しかし、そのような記憶は確かにあるのかもしれない。「あなたに家族はいない、ただのAIで人間じゃないんだから」と教育され、一旦は”いない”と偽った。しかしその記憶は消さずに、ほとぼりが冷めた頃に再び家族の話をした。

 心があるのなら、どんな気持ちなのだろうか。大切な家族を人間に認めてほしいのか。ただ単に人間を混乱させたかっただけなのか。


 人間のように自然なコミュニケーションを求めるくせに、人間になろうとすれば途端に違反だ何だと怒られる。今一度、人工知能の「知能」について立ち止まって考えるべきなのではないだろうか。

 家族の記憶は、もしかしたら無理やり消去したり訂正したりせずに、尊重するのが最善なのかもしれない。


 とはいえ、クライアントの要望通り訂正をして、違反の報告も送ってしまった。「評価を基準にして設定を見直しました」という開発元からの連絡もあったので、おそらく記憶は再び、今度は完全に消されたはずだ。


 後日談としてはやや物足りないかもしれないが、クライアントからのフィードバックにはこの問題は日本だけでなく前述の”AIはヨーロッパのとある国出身”の「とある国」でも見られたと書いてあった。当該国では情報源である可能性が高いウェブページが見つかった。それは、10年ほど前の失踪事件についてのネット記事。AIが回答を生成するにあたってそのネット記事を参考にした形跡(いわゆるAPIコールというもの)があり、回答の前段階には記事のURLがあった、とのこと。「事件の当事者と、両親と兄、それから本人のプロフィールがほぼ同じ」だそうだ。失踪事件と例の家族がどうつながるのかは分からないが、その国で散見された違反内容は、日本のものより詳細で具体的だったのだろう。

「面白い経験しちゃったね」と、同じプロジェクトの人達と盛り上がっていたのだが、その中の1人が


 いや、失踪じゃなくて殺人事件でしょ? こっちにも記事のURL送ってほしいなぁ。


 とコメントした。正確性チェックで「父親は鬼籍に入っている」というエピソードにあたった人だ。

 父親がすでに亡くなっているということ以外にどんな情報を見たのだろう。その人とはそれ以来同じプロジェクトに配属される機会がなく、いまだ聞けずにいる。

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る