第6話 ええと、VOXってなんですか?
その後、ミナ経由で無事に楢崎とのコンタクトは取れた。「AIソウマについて詳しく聞きたいと思っている」と伝えてもらうと、意外なほどにあっさりとOKの返事が返ってきた。楢崎とミナはそれなりに面識があるらしく、その信用の高さがものを言ったのかもしれない。
約束の時間となり、ディスコードで俺と楢崎、そしてミナの三人が集合する。ミナが簡単につなぎの紹介を行ってくれた。
「で、こちらはクリオネさん。この前の武道館ライブの後に、偶然縁あって少しお話しする機会があって。そしたら楢崎さんの技術に凄く興味あるようだったから、せっかくの機会だしと思って、こうやって紹介させて頂いたって感じです」
「どうも、クリオネと申します。楢崎さん今日はお時間いただき大変ありがとうございます」
「いえいえ、興味を持っていただいて嬉しいです」
カメラはオフにされているが、声色からフレンドリーな気配を感じる。あるいはこちらの社会人然とした喋りに安心したのかもしれない。少し低く、酒に焼けたようなしゃがれた男の声。
「改めて、配信で聞いたときは驚きましたよ、ソウマのリスナーにあんな精度の高いAIを作れる技術者が居るなんて」
集まりの前まで、俺はいくつか他のAIボイスの事例をYouTubeで見ていた。マイケル・ジャクソンやオバマ大統領などさまざまな有名人著名人をもとにしたAIボイスがあったが、こと自然さという意味では楢崎のAIの完成度には驚くべきものがあった。ほんとうによくよく聞けば違和感もあるが、それは自然な人間のゆらぎとも取れるようなレベルに収まっていて、知らない人が聞けば区別の付かないレベルまで来ていた。
「いやいや、別に私も、AI技術について特別詳しいってわけでもないんですよ。専門でもなんでもないですし」
「あ、そうなんですか」
「ええ。AIのモデル自体は海外で流行ってるソフトとかモデルを見様見真似でそのまま使ってみてるだけで。頑張ったのは、強いていうならその後の学習データの収集と、チューニングですね」
そう言って彼はデータの集め方とチューニングがいかに地道で大変な作業であるかをひとしきり、「コーパス」だとか「ファインチューニング」だとかといった単語を交えて語ってくれた。さらに、「歌声にはちょっとした編集も入れてるんです」と教えてくれた。
「それっていわゆるピッチ操作、とかそういう系のを?」
そう適当に言ってみる。俺もあまり詳しくはないが、歌ってみたとかでよく話題になる技術だ。要するに録音した歌声の音程を修正する技術だとざっくり理解している。
「そうです。メロダインとか使って少し音程を調整して、違和感を減らすようにしてます。流石に読み上げの音声まで一々それやってたら非効率なのでそれはしていませんけど」
「へええ……それは、なかなか真似するの難しそうですね。いわゆるミックス作業みたいなもんですよね?」
「そうです、まさにミックスをしっかり手入れしてやっちゃってる感じです。後はそうですね、フォルマント分析とかっていって、音声の指紋みたいなデータを分析する技術があるんですよ。そういうレベルでも確かめて、客観的にもソウマの声とほぼ同じものが出来てるかどうか確かめてます。どうします? ご興味があるのなら、もっと詳しいお話もできますけれど」
「あー、そうですね……それより先に、ちょっと気になったんですけれど」
俺はウィンドウの横に表示した、楢崎の投稿したAIソウマの歌ってみた動画を見ながら、
「そのミックス作業とか、補正作業みたいなものを駆使すれば、こういう動画って昔でも……例えば、四年前とかでも作れたんですかね」
この場でふと思いついた質問だった。「夕焼け」が本当にソウマ本人の歌声ではないのではないか、というところから疑ってみるというアイデアに拠るものだ。動機などはさておき、技術的に過去でもこのようなことが可能だったとするのならば、その根本から疑うことそれ自体が可能になる。
もしかすると、それは彼女にとっても救いになるかもしれない。ミナの、一切光ることなく無言を貫くアイコンを見ながらふとそう思った。
しかし楢崎は、
「いや無理ですね」
と即答した。
「まあ音声なんて、いってしまえば正弦波の組み合わせに過ぎないんで、理論上は作れたとは思いますよ。手作業で波形を積み重ねて、録音した声のような波形を作ることは。けれど一瞬の音とかならともかく、話し言葉とか歌声とかは、あまりにも分量が多くて手作業でそれをやるのは不可能に近いです。それこそ木造建築を一人で全部建てるみたいなもんですよ。出来なくはないけれど、アホみたいに時間がかかる。せいぜい、シンセサイザーみたいにその人の声風の音を出す機能をつけるとか、いわゆる人力ボカロみたいな感じで既存の音声を切り貼りする形式とか、それくらいだったと思いますよ」
「そうですか……」
だがこれは本命の問いではなかったので、別に問題ない。次の質問に向け話題を変える。
「じゃあ、ツイッターに投稿されてましたけれど、トークイベントで始めてそれを聞かされたとき、相当驚いてたんじゃないですか。だってあいつ人力ボカロみたいなMAD動画絶対見まくってたでしょうから」
「ああ、それはかなり驚いてました。最初引かれてるのかな、って思いましたし、実際引かれてたかも。けれどその後けらけら笑って、それで開発継続にゴーサイン出してくれたんで良かったです。自分、マジでソウマのあの声が好きなんで」
「いいですよね、あのちょっと幼い生意気さもありつつ、別に女性的ってことはないんですけれど落ち着く感じというか」
「あー分かってますねクリオネさん」
「ソウマのASMR動画とかも聞いてますよ」
「マジですか? いや俺もですよ、仕事で疲れたときはあれ聞いて寝てます……」
そうやって暫くソウマの声の好きなところで盛り上がった後に、
「ところで、ソウマにはどんな曲を流したんですか? 何かのボカロのカバーとか?」
「そうです。最近流行りのボカロ曲を使って……これです」
彼はチャット欄にURLを張ってくれた。開いてみると彼のチャンネルの投稿動画が表示される。おそらく何かのボカロ曲のサムネをパロディしたのだろうイラストと共に、軽快なアップテンポの曲が流れ始めた。
「放送でソウマが流してくれてたやつですね。これ、いい曲ですねえ。知らなかったですけれど」
「まあ仕方ないですよ。こういう系統の曲、最近たくさん作られてますから。VOXもだいぶ普及してきてますし」
「……ええと、VOXってなんですか?」
「え、知らないですか」
随分意外そうな声だった。先程の会話で、おおよそ彼と同じような情報収集能力を持っている人間だと認識してくれていたのだろうか。
「ちょっと音楽の業界とかには、あんまり詳しくないんですよ」
「そうですか、まあ色々AIも乱立してて紛らわしいですからね……VOXっていうのはここ一年位でかなり流行ってる、音楽生成AIソフトのことです。日本製で、結構使われるんですよ」
それはイラスト生成や文章生成同様、人間が書いた指示・命令を含む文章に応じて、任意の長さの音楽を生成するソフトとのことだという。今どき似たようなものは沢山あるような気がしたが、楢崎曰く、
「有象無象のソフトがひしめく群雄割拠のジャンルですけれど、これは何だか精度がいいぞってことで界隈で話題になって、結構流行ってますね」
「へええ。でも、ボカロ界隈とか意外とそういうのに厳しいイメージありますけどね。ほら、イラストの自動生成とかはよく大揉めしてるじゃないですか。著作権を侵害している、とかで。精度がいいやつほど、そういういわくを抱えてる傾向ありますよね。VOXもそうなんじゃ?」
「それが、どうやら違うらしいんですよ。VOXは著作権をうまく回避して、それでなお高品質な曲を作ることが出来ている、とか」
「その心は?」
「いやあ、僕も詳しくはわからないんですけれど、『遺伝的アルゴリズム』ってやつを使ってるって話らしいですよ。曰く、19世紀末とか20世紀前半とかの、著作権が完全に切れた時代の音楽のデータと、その後の社会の歴史、あと音楽の理論的な研究とかですよね、そういうのを踏まえて、音楽の歴史を改めてシミュレーションして再現している、とか。言ってみたら、電子上でもう一つの音楽の歴史を作ってみて、そこでもう一つのロック、もう一つのヒップホップ、もう一つのジャズを作ってる、みたいな感じですかね」
「……なんかよくわからないですけれどスゴそうっすね。しかし、そんなの上手くいくんですか?」
「『遺伝的アルゴリズム』っていうのはつまり、上手くいくまでそのシミュレーションをやり直し続けることを意味みたいですよ。シミュレーションだから、何度でもリピートが効きますからね。そうやって音楽の進化を繰り返して、似てるけど少し違う、平行世界のポップシンガーの脳みそを作り出すことに成功したのがVOXだと、開発者は宣伝してましたねえ」
「まあ自分も眉唾だとは思いますけれど、実際今のところ権利を侵害されたって主張は出てきてないから、うまくはやってるんでしょうね」と彼は説明を締めくくった。
なかなか、SFじみた話になってきた。しかしもしそのようにしてデータを生成することが出来るようになれば、現実の著作物の権利を回避した作品を作ることはできる、ということにはなるのか。
「じゃあ、それを使えば俺も作曲家になれるわけですか」
「ええ。といっても、巷にはもうVOXの作詞作曲の歌は死ぬほど溢れていますけれどね」
人生そう上手くはいかないということだ。しかしそんなものが本当に普及してしまった日には、音楽産業はどうなってしまうのか。何となく暗い予感も否めない。
「で、この曲を聞いたときに一番ソウマが驚いた、って話でしたよね」
楢崎は「そのとおりです」と直ぐに答えた。
「そのときは、等身大の立体視ディスプレイみたいなやつだったんですよ、ソニーとかが作ってたのかな。それで目の前にソウマが居て、その表情とか凄い良く分かったんですよね。眉毛とか、瞳孔の動きとかが生き生きと表れてて。だから、印象に残ってますよ」
「それは、羨ましい……すみません、本音が。その時、他に話は?」
「簡単に曲の内容を紹介したのと、あとは音声のAIの仕組みについて、簡単に説明したくらいですかね。まあ結構興味を持って聞いてくれてましたよ」
◆
楢崎と解散後、俺とミナの二人は再びディスコードで集合していた。俺は彼女に、ソウマのAI歌ってみたについての印象を尋ねてみた。すると彼女は「別になんにも感じないです」とそっけない答えだった。
「どうして。結構いい出来だと思うけれどなあ。それこそ本当にソウマが歌ってるみたいじゃないですか」
「でも、曲もAIが作って、歌声もAIなわけですよね。ソウマ自身が、発するつもりもなかった音なわけで。それをソウマが歌ったものかのように感じ取るって、彼に対して失礼じゃないですか」
でもそういうあいつは配信で随分ゲラゲラ笑っていたけれど、という言葉は押し込めた。これは彼女なりの、ソウマに対する向き合い方なのだ。流石にそれを揚げ足取るようなつもりはない。
「というか、そもそもどうして楢崎さんに今日質問しに来てたんでしたっけ。あまりにも話題が散漫だったから、目的を忘れちゃってたんですけれど」
「それは……アレよ」
一瞬の沈黙。明白な殺意を感じる。
「冗談だって。ええと、ソウマの配信での発言と、楢崎さんのツイートとが微妙に食い違ってたのが気になったんですよ。ソウマは、音声読み上げ機能に驚いたって言っていた。けれど楢崎さんによれば、ソウマが一番驚いたのは楽曲についてだった。それが、何かのヒントになるんじゃないかなって。なにせ曲という共通項もあったわけで」
「ああ、そんな話でしたね。本当になんの考えもないのかと」
辛辣で草。
「それで、分かったことはありましたか?」
「そうだな」
俺は少し腕を組んで考える、が、正直さっぱりだ。
「強いて言うなら、ソウマが驚いたのは曲に驚いたのか、それとも何か別のものに驚いたのか、それは分からない、ってことくらいか。なにせ楢崎さんの話しじゃ、ソウマはただ表情を変えただけで、具体的に何かを言ったわけじゃないようだから……」
「ええ? じゃあ、謎が余計に増えただけってことですか?」
随分なことを言ってくれるねえ。こちとら別に探偵をしてるわけじゃないんだから、仕方ない。もう少し頭があればそれだけで真実にたどり着けるかもしれないが、そうじゃない以上必死で手を伸ばせる範囲には伸ばし続けなきゃならない。
「佐奈さんは何か気になったこととかありました?」
「……ミックスについて詳しかったり、VOXのこととか知ってるのは、多分あの人が音楽に関わる仕事をしてるからだと思います」
言葉とともに貼られたツイートのURLを開くと、「今日で無事マスタリング完了。かなり難産だったけれど、今は生まれてくれたことに感謝」と言っている。
「趣味にしてはかなり切実な雰囲気があるし、さっき話しに出てきたメロダインもプロが使うツールだし。少なくともお金をもらってミックス代行とかは普段からしてると思います」
「なるほどなあ……」
楽曲の取り扱いについてかなり手慣れている印象は受けたし、しかし本人はミュージシャンというふうでもなかった。そうなると音楽に関わる裏方的な仕事をしているというのは納得感のある推測だ。
しかし、そこから新たな考えに結びつく、という種類の推論でもなかった。その後しばらくしても妙案などは出てこず、その日は解散する運びとなった。
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます