第3話 チューリングテストとは何ですか?
――チューリングテストは、1950年にイギリスの数学者アラン・チューリングによって提案された、人工知能の能力を評価するための基準である。
このテストは、コンピューターが人間との対話を通じて自然な振る舞いをするかどうかを判断することを目的とする。
チューリングテストでは、評価者――つまり、紛れもない"人間"がコンピュータープログラムと対話を行う。この対話はテキストベースで行われることが一般的であるが、音声や画像を使用するバリエーションも存在している。
そして評価者は一方で、人工知能ではない"ただの人間"とも同じ対話をする。この時、評価者側には現在対話している相手が"AIか人間であるか"は隠された状態であり、その上で評価者はその名の通り"評価"しなければならない。
――今話した相手は"AI"だったのか"人間"だったのか。
もし、複数の評価者がこの区別を行うことが出来なかった場合、参加した人工知能は"チューリングテストに合格した"……つまり、"知性のある存在だ"と判定される。
「チューリングテストには問題がありますけどね」
素っ気ない様子でメグルが言うと、砂尾は「分かっているさ」と、くつくつ笑ってみせた。
「歴史を紐とけば問題提起は古くからあるが……決定的な出来事は2014年。ロンドンで行われたテストに参加した、"齢13歳の少年の設定とされた人工知能"……Eugene Goostmanが30%を超える評価者たちから人間と間違われ、世界初の"合格者"であるとされた。しかし、ここに異を唱える学者は少なくなかった」
「実際、Eugeneは人工知能ではなく"チャットボット"ですしね。それは、"人と自然な対話をする為だけに生まれた存在"で、オレたちが思う"強いAI"足り得ないものです」
チャットボット。
つまりそれは、"人と会話をすることこそが目的"の機械だ。
チューリングテストが人と自然な会話が出来ることを合格の指標とするのなら、チャットボットはボーダーラインを難なくクリアできる。
しかしそれは、チューリングテストが生まれた本来の理由からはかけ離れた結果を生んでしまう。
「ジョン・サールの哲学的批判から始まり、チューリングテストの結果が必ずしも人工知能に自意識があるかを測る指標とならないことは各所で論議されています」
「勉強しているね、我が弟子よ。しかし、現実問題としてチューリングテストを超える手法が確立しているのもまた事実だ。例えば、今キミが話しをしている存在。砂尾ジャクソンに自意識があると、どうやって仮定する? 突き詰めると、自意識の立証はチューリングテストという答えに行き着く」
「…………」
押し黙ったメグル。
彼の師匠が語る内容は間違っていなかった。
現実問題、新たに生まれた人工知能が"強いAI"であるか。
それを推測する上でチューリングテストは切っても切れない立ち位置にある。
そしてクオリアにとって、それが今日訪れたというだけだった。
「……ぱ、パパとめぐるんは何を話しているの?」
「さあ? 僕はメグルほど、頭もよくないし詳しくない」
「ふ、双葉ちんは分かるっ?」
「……砂尾先生はクオリアに私たちと同じ自意識があるかを確認したい。名高くんはそれをさせたくない。突き詰めるとこの程度の話よ」
教室の隅に寄った部員たちはこそこそとそんな話をしていた。
そんな井戸端会議など聞こえていないのか、二人は傍観者たちの理解を置いてけぼりにしたまま、話を進めていた。
「キミは何を恐れている?」
砂尾はそう聞いた。
メグルは俯いて、「別に」と小さく答える。
「恐れてなんてないですよ」
「キミが言う通り、クオリアが"弱いAI"であるのなら、心配する必要など皆無だと思うんだけどね。その態度が、全てを物語っているのではないかと……"人間"の私には、そう思えてならない」
クオリアが"強いAI"か"弱いAI"であるか。
意識体験と呼ばれる事象を体験しているか否か。
――ここでこのテストを断るということは、メグルの答えが半ば確定してい締まっていることを意味する。
クオリアは人間と同程度の――意識体験を持っていることを。
メグルは小さく息をついて、答えた。
「分かりました」
「よし、なら早急に始めてしまおう。おっと、その前に――"エリーザ"」
『はい』
「学園に平穏を」
『すでに権限を学園側に戻しております』
そこで突如として、午後の授業を開始するチャイムが鳴り響く。
騒然とする校内の様子が、どこかしこから聞こえる声で鮮明に浮かぶ。
「ではやっていこうか」
「……あ、じゃあオレたちは授業へ――」
「棄権する場合はこっちで勝手にやらせてもらうが? ああ、安心すると良い。顧問の教員には了承を得ている。君たちの時間を拝借するってね」
「…………」
ドアにまで手をかけていたメグルだったが、むっとした表情を作り、腕を組んで元の席に座りなおした。
「よし。では、そこの三人」
名指しをされた三人はびくりと肩を震わせた。
真理衣、愛人、そして双葉。
それぞれの顔を見やって、砂尾は白い歯を輝かせる。
「手伝ってもらおうか。なに、部活の一環だ」
***
部室にはメグルと砂尾の二人だけとなった。
残る部員たちは廊下に出て、顔の見えないところに座り込んでいる。
砂尾は「今説明したとおりだ」と告げた。
「分かるか?」
「親父さんの作ったこのアプリから、各々の携帯端末に同じ質問がされる」
クオリア、双葉、真理衣、愛人の四名が"回答者"。
そしてこの四名からリアルタイムで返答が来る。それぞれはA・B・C・Dとラベリングされたユーザーネームが付けられており、メグルと砂尾は誰がどのアルファベットに属するのか分からない状態となっている。
「質問に対する回答を見て、オレと親父さん"評価者"はそれがAIか人間かをジャッジしなければならない」
「ああそうだ。そしてクオリアは機械知性であるがゆえに、レスポンスの早さが人知を超える。よって、全ての解答が集まった段階において、順不同で答えを開示していく。これはなぜかわかるかい?」
「あくまでチューリングテストの目的は"真の知性があるかないか"だから、だろ」
「そうだ。特定の、この回答者が"機械である"と分かってしまうと、我々人間には"偏見"が生まれる。その時点で、テストの目的から逸脱してしまう」
チューリングテストの本質は回答者が"機械か人か"という単純なものではない。
それは"自我を持つか持たないか"である。
人間の中にも賢いと言われる人もいれば、言葉汚く"馬鹿"と罵られる人もいる。
もしAIに意識体験があった場合、それは単純に"数学があまりにも得意な人"の定義に当てはまる。
つまり、計算結果が出る速度は意識体験の有無を判定する要因にならない。
「質問に対する回答の内容もそうだが、前後の文脈、内容の独創性……俺もそうだし、そんな俺の弟子であるキミならば、ある程度以上の精度を持って評価が可能なはずだ」
「例えば、クオリアに対して1:1で評価が割れた場合はどうするんですか?」
「それはないと思うがな。……キミが嘘をつかない限り。"エリーザ"用意した質問を送信してくれ」
『了解しました』
そこで砂尾の作ったアプリを通して、それぞれの端末に質問が送られた。
メグルの持つスマホにもインストールされているそれは、一見すると若者が普段使いしているSNSのグループチャットと似通っている。
唯一の違いはこれ見よがしに"A"や"B"と書かれた匿名のアイコン、そして返答までの時間が表記されることだった。
『こんにちは、今日はチューリングテストに参加していただきありがとうございます。本日はこれから出す質問を通すことで、あなたがたが本物の人間であることを証明していただきます』
数分して、一斉に回答が表示された。
A)『分かりました』
D)『よろしくお願いします』
B)『了解』
C)『はい』
砂尾は対面に座るメグルに問う。
「どうだい?」
「まだ何とも言えません」
「そりゃそうだ。では、次に進もう」
『一つ目の質問です。あなたは今、特定の異性に恋をしていると仮定します。その相手に会えばドキドキして、言葉を詰まらせてしまう。そこでその感情を"恋である"と自覚する場面について、教えてください』
今度は返信までに数分の間があった。
当然である――とメグルは思っていた。
質問の内容が抽象的であるが故に、"人間の脳"であれば、回答までに時間がかかっておかしくない。
メグルは回答に目を通した。
D)『理由なんてない。好きだから好きなんだと思う』
A)『経験をしたことがないので分かりません』
B)『"ち〇ちん見せて欲しい"って考えるみたいな?』
C)『私はそれが恋であるかどうかをまず疑ってかかります』
メグルの言うことが正しければ、この中に"弱いAI"
つまり、自我を持たない"ただの計算機"が紛れ込んでいる。
逆に、そうではなくこの全てに人間と機械の違いを見いだせなかった場合……それはクオリアに自意識がある事の証明となる。
「さあ、我が弟子よ――ゲームのスタートだ」
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます