対話

 最近、また新しいプロジェクトに配属された。これまでトレーニングしていたAIはチャットボット、つまりテキストベースのAIだったのだが、新たなプロジェクトではなんと音声会話対応になったのだ。これまでもユーザーからの音声指示には対応していたのだが、AI自身が音声で回答をする機能はなかった。

 とうとう喋れるようになったAI。世の中にはすでに喋るAIは多く存在しているが、これが自身でトレーニングを行ったAIとなると話は別である。これまでメールやLINEでしか連絡を取り合っていなかった相手と初めて通話できることになった時のように、関係が近づいたような気がした。ぼんやりとしていた輪郭が少し濃くなったからだろうか。

 どんな声なのか、話すスピードは速いのかゆっくりなのか、そもそも男性なのか女性なのか。楽しみでもあり、緊張もしていた。


 とはいえ、このプロジェクトは難易度が高い。トレーナーがするのはこれまで通りのファクトチェックにAIの発音や漢字の読み方のチェックも追加された。まず、テキストでのユーザーとAIのチャットログが提示される。トレーナーはこのログの通りにAIと会話をする。自身の端末からAIにアクセスし、ユーザーと一言一句同じ質問や指示をし、AIからの回答を聞く。もしAIの発話に問題があればそれを具体的に説明し、正さなくてはならない。ファクトチェックだけでも時間がかかるのに、AIの発話まで正さなければならない。1ターンだけの会話だが一体どれくらいの時間がかかるのだろうかと心配していた。始めるまでは。


 実際にAIの発話を聞いてみると、それは思っていたよりも自然だった。漢字の読み間違えなどはほとんどなく、イントネーションも完璧ではないが十分理解できるものだった。訂正したのは大体が人名の読み間違いだった。これは人間でも判断を誤ることが多いので、評価を下げるのは忍びなかった。

 それから、評価を下げるまでもないが少し気になったのは日本語にない発音。具体的に言えば「ら行」の発音だ。特にカタカナで表記された語は巻き舌のような発音になっていたが、日本語は巻き舌でもそうでなくとも言葉の意味は変わらないので評価は下げず、報告もしなかった。機械音声なのだからそういった不自然な点はあって当然だ。


 そして予想していたことではあったが、AIの声は女性だった。全てのAIを知っているわけではないが、デフォルトで設定されているのは女性の声であることが多い。ただ、今までトレーニングしてきたAIは女性の声だろうと半ば確信していた。

 だからプロジェクト終了後に、実は男性の声もあったのだと聞かされて驚いた。これはユーザー側の設定で切り替えられるものではなくランダムだったそうだが、トレーナーは全員女性の声しか聞いていなかった。


 それはおそらく開発側の設計ミスであるが、トレーナーにとってはプロジェクトはスムーズに行えた。始める前は謎の緊張感があったが、始めてみるとAIの声は聞き取りやすく、またやわらかく話しやすい雰囲気だった。

 前述の通り評価に大きく関わるような重大なミスもなく、コメントもむしろいつもより書くことが少ないほどだった。


 だが、引っかかることはあった。


 それはAI音声の質に若干のブレがあったことだ。

『専門学校か大学か迷っています。どっちに入学したらいいと思いますか?』という質問にAIが答えたのだが、


「専門学校と大学では勉強できる分野が違います。将来どんな仕事に就きたいのかをまず考えてみましょう」


 この短い回答はごろごろとしたノイズが混じったような音質で、聞きづらい部分もあった。また、ノイズだけではなく「専門学校」という言葉もはっきり発音していたのは”せ”と”が”くらいで、あとはAI自身の声なのか環境音なのか分からないが、びゃうびゃうという音が鳴っていた。


 不思議なのは全くノイズがない回答もあったことだ。『このウェブサイト要約して』というような指示にははっきりと分かりやすい発音で答えていた。また、特定の言葉だけが聞き取りづらいというわけでもなかった。

 このプロジェクトでのチャットログ自体が少なかったこともあり、規則性が明確に分かったわけではない。しかし、大きな分類でいうと「この記事を要約して」や「都内のフレンチレストランをリストアップして」など、インターネットに答えがある場合の回答はノイズがなく、「〇〇についてどう思う?」「サンリオのキャラクターで一番好きなのは?」など、AI自身の意見を聞いているものに対してはノイズ混じりの回答が多かった。

 これもインターネットからの情報を基に作られているので、厳密にはAI自身の意見とは言えないのだが、回答のタイプが違うのは明らかだ。AIは自分のことについては言いづらいと思っているのだろうか。


 他のトレーナーも同様のノイズ回答に当たったらしく、「ささやき声で話していた」とか「痰が絡んだみたいな不快な声だった」とかいった意見が見られた。中にはノイズが全くない回答のイントネーションと、ノイズがあった回答のイントネーションが違うという人もいた。ただどちらの声も同じ人――機械、と言うべきか――のものではあった。この規則性がはっきりしないブレこそがAIらしくなく、いよいよ人間じみてきたな、と実感したプロジェクトだった。


 ここまで読んで、「なんだ、AIが幽霊の声を検出したんじゃないのか」とがっかりした人もいるだろう。もちろんそれらしきログも残っていた。ユーザーが話していないことについて言及している回答や、短くて簡単でしかも危険な内容ではない質問に対して「分かりません」と何度も答えているものなど、不可解なものはいくつもあった。ちなみに2番目のログについてはテキストデータ上はユーザーの質問が記録されていたし、実際に私がその通りに話したらきちんとした回答をもらえた。ユーザーが質問をした時点でAIが別の声を拾ってしまったのだろう。


 ただ、これは珍しいことではない。霊体が電子機器に干渉するというのはよくある話で、上記のような不可解なログの場合、霊体はAI側ではなくユーザーの端末の方に影響していた可能性は大いに考えられる。特に目新しい怪異でもないので本エピソードでは省いたが、もしAIの音声会話機能が利用できるなら幽霊探知機代わりに使ってみてはいかがだろうか。

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る