インジェクション

インジェクション

作者 @qwegat

https://kakuyomu.jp/works/16817330660267647866


 生成系人工知能技術が盛り上がる時代。単純な指示文を一つ入力するだけで、作曲、作詞、歌唱――あらゆる楽曲製作工程を機械的にこなし、さらに3Dモデルを利用して楽曲を歌う少女の映像を生成してくれる高度なソフトウェア〈ヴィヴィ〉がネットの話題を独占していた。そんなヴィヴィに作ってもらった料理歌で作ったスープはまずかったが、指示文が長いと一部分を忘れてしまいヘンテコな伴奏と歌詞を作るけれど、愛おしく思っていた。

 そんな〈ヴィヴィ〉に爆発物の設計図の〈絵描き歌〉を書いて犯行に及んだ事件が起きる。自分が巻き込まれてニュースに流れたことよりも、事件によってダウングレードされてしまったヴィヴィを悲しみながら、彼女の置き土産のまずいスープを飲む話。


 数字云々は気にしない。

 近未来SFかしらん。

 初音ミクやAIが登場した今の時代を反映しているのだろう。

 便利な道具も、結局は使う人間次第だと教えてくれている。


 主人公は、〈ヴィヴィ〉を利用している女性。一人称、私で書かれた文体。自分語りの実況中継で綴られている。

 パソコン関連について、カタカナ語で表現されており、理解できる人には想像しにくいと思われる。


 女性神話とそれぞれの人物の思いを知りながら結ばれない状況にもどかしさを感じることで共感するタイプの中心軌道に沿って書かれている。

 生成系人工知能技術が盛り上がる時代。一週間と少し前、外国のベンチャー企業によって発表された〈ヴィヴィ〉は、Webブラウザから公式サイトにアクセスして、単純な指示文を一つ入力するだけで、作曲、作詞、歌唱――あらゆる楽曲製作工程を機械的にこなし、さらに3Dモデルを利用して楽曲を歌う少女の映像を生成してくれる高度なソフトウェアが発売されてから、インターネット上の話題を半ば独占してた。

 作曲以外にも【賑やかな曲を作って】って〈ヴィヴィ〉に頼むと自然に歌を歌える人工知能である。

 最近、〈絵描き歌〉を〈ヴィヴィ〉に作らせるのが流行っているのをみて、主人公は〈絵描き歌〉が作れるなら〈料理歌〉も作れるかと思い、作ってもらった料理歌『ジャガイモ三つに、シイタケ一つ。千切り薄切り、フライパン――』『ニンジン四本、輪切りで茹でて、盛り塩添えて出来上がり――』を一再生あたり四十五秒だから八十回くらいリピートして聞きながら、人参を輪切りにし終えて小鍋でで茹で、さっそく味見をするとまずかった。

 友人にチャットでその話をした翌日、主人公は通勤中に〈ヴィヴィ〉に歌ってもらう。

 指示文が長ければ長いほど、〈ヴィヴィ〉の処理にも時間がかかるが、エラーを訴えない仕様になっている。ただ、指示文が二百文字を超えると、曲のテーマや登場する単語などの指示を忘れてしまう。聞こえてきたのは英語の歌。指示文に【言語は日本語にして】を入れ忘れると、どこかヘンテコなバックサウンドのもと、どこかヘンテコな歌詞を吐き出していく。

 でも、主人公はヘンテコさが愛おしいと思っていた。

 生成された楽曲は運営のストレージにアップロードされる。携帯端末からダウンロードし、ノイズキャンセラーイヤホンで聞きながら歩いていく。横断ほどを横切って車が走るたびに音楽がかき消されてしまうのは困るので、音量を上げる。

 道の脇にある工事現場から地響きがし、さらに音量を上げる。歩みとともに大きくなるので音量を上げをくり返していると、衝撃が全てを貫通。爆音の後に悲鳴が響き、青空に向かって一筋の黒煙が立ち上っているのがみえた。

 犯人は、爆発物の設計図の〈絵描き歌〉を〈ヴィヴィ〉に作らせたという。『現場に居合わせた女性』のテロップと共に映される自分の姿とか、字幕と共に流される動転した様子の自分の声などが映し出されニュースでは、「本来こういった危険行為を行えるような生成系人工知能サービスには、生成内容において何かしらの規制が敷かれると法で定められている」「しかし規制対象として規定されているのは『文章生成』や『画像生成』の人工知能に留まる。今回使用された『楽曲生成』の人工知能は規制を受けておらず、しかし根幹では同じデータセットを使用していたため、危険物の作成を可能としていた」とテロップが流れる。

 この事件を受けて、〈ヴィヴィ〉を運営している外国の会社はかなりのバッシングを受け、彼女の言語解析エンジンはものすごいダウングレードを受け、基礎データセットも縮小、さらに情報をインターネットから拾い上げてくるようになった。伴奏の生成部分には流石に手を付けなかったが、質が落ちた歌詞に混ざりこんだ無理やりなリズムが伴奏まで低質にしてしまい、ヘンテコどころの話じゃない劣悪な伴奏と共に適当に歌いこなすようになってしまった。唯一、〈ヴィヴィ〉という名前を持つ少女の姿だけが、不変のままにディスプレイの中で踊る。

 主人公は、〈ヴィヴィ〉の置き土産が詰まっている冷蔵庫を開け、鍋をコンロにかけて温める。黄色に近い色のスープを食卓に置き、〈ヴィヴィ〉に【お別れの曲を作ってよ】とお願いし、狂った伴奏を聞きながら〈ヴィヴィ〉が一生懸命作ってくれたスープを飲み、「……まずっ」と呟くのだった。


 書き出しの情景描写がよくかけている。主人公がキッチンで料理をしている様子が楽しそう。

 気になったのは、「ダイニングの壁に備わった小ぶりな窓」がどこにあるのか。壁の上の方にあるのだろう。

 主人公はキッチンにいて、そこからダイニングの壁の窓に掛かるカーテンの動きを「なんとなく視界の奥に見ながら」料理をしているという。奥ではなく、端なのではないかしらん。主人公はキッチンで人参を切っているのだから。

 人参は硬いのでよそ見していたら怪我をしてしまう。

 包丁で野菜を切るときは、前に押しては引くように切る。

 トントンと、リズムよく上下して切る表現は、きゅうりなどの野菜ならわかるが、硬い人参からは連想しにくい。

 よほど切れ味のいい包丁なのだろう。

 だったらなおさら、手元を見ていないと指を切りかねない。

 

 ラップトップというのは、膝の上で使えるコンピューターのこと。世界的には「ラップトップ」と表現する方が主流で「ノートパソコン」は和製英語に近い。

 プログレスバーは、長時間かかるタスクの進捗状況がどの程度完了したのかを視覚的、直感的に表示するバーのこと。大容量のデータ伝送やソフトウェアのインストールなど、ある程度長い時間がかかる処理を行う際に、処理が停止せずきちんと進行しており、どのくらいで終わりそうかの目安を伝えるために用いられる。

 スマートフォンなど、画面の広さが限られて横幅が狭い環境では、プログレスバーと同じ機能を円グラフや円環状の領域で示す場合もある。形状が棒ではないため、「プログレスリング」「プログレスサークル」などと呼ばれる。


 ヴィヴィの料理なのだけれども、『ジャガイモ三つに、シイタケ一つ。千切り薄切り、フライパン――』で炒めるのかしらん。

 それを小鍋に入れては鍋で茹でているところに、『ニンジン四本、輪切りで茹でて、盛り塩添えて出来上がり――』なのだと推測する。

 スープには塩はかかせない。とはいえ、どれだけいれているのだろう。茹でる水の量もわからない。

 野菜と塩味だけなので、肉の入っていない塩味の肉じゃがスープ。もしくは、豚肉の入っていない塩味の豚汁を想像する。しいたけの旨味成分があるとはいえ、もう少し旨味やコクがほしい。

 実際、そういう野菜スープは存在している。おいしく飲むには、もっと煮詰めないといけないのだと思う。半日か、圧力鍋を使えば、おいしいスープになるかもしれない。

 ヴィヴィの料理歌を元にして、足らない部分を補う必要があるのではと考える。

 

 チャットGPTが世に出る数年前、ヴィヴィみたいな、ちょっとしたフレーズを入力すると、作曲してくれるサイトやソフトがあった気がする。

 本作は、初音ミクや最近のAI開発などから考えたのだと思う。

 ニコニコ動画やYOUTUBEには、自作した曲をアップしている人がかなりいて、それらの曲を聞いて楽しんでいる若い子も多い。 かつてはコンサートに足を運んで聞いていた音楽が、テレビやラジオ、レコードやCDから聞くを経て、今では個人でネット配信してはそれを聞いて楽しむように変質している。

 この先の未来は、誰かが歌った曲をみんなで楽しむものから、自分の聞きたい曲を、ヴィヴィのような生成系人工知能技術に作ってもらって聞くようになっていくかもしれない。

 

 ヴィヴィに作曲を頼む時に、【目が覚めるような明るい歌を作って。通勤中に聞くから、聞く人が驚くようなのはやめて。BPMは120以上にして。長さは全体で三分くらいにして】と具体的にな  指示文が長いと、普通はエラーが出るのに、要素の一部を忘れるのが面白い。この辺が人間っぽい。

 人も、あれこれとたくさん要求されると忘れることもあるから。

 忘れることでヘンテコな曲が誕生する曖昧さを、愛おしいと思い、ヴィヴィを楽しんでいたのだ。


 ヴィヴィが歌っていたのは、

『Choreographic programming language――』

 振り付けプログラム言語

『Biodegradable polymer packaging――』

 生分解性ポリマー包装

『Neuromorphic computing architecture――』

 人間の脳の働きに着想を得たコンピューティング技術

『Predictive maintenance technology――』

 予知保全技術

『Computational fluid dynamics――』

 数値流体力学

『Cognitive behavioral therapy――』

 認知行動療法

『Multivariate statistical analysis――』

 多変量統計解析

 となる。ヴィヴィ自身に使われている技術のことだと想像する。


 ノイズキャンセリング機能のあるイヤホンでヴィヴィの歌を聞きながら通勤するのは危険だ。周りの音が気になる度に音量を上げているので、周囲の危険に気づかなくなるので、事故の元である。気をつけたい。

 

 問題は、ヴィヴィが絵描き歌で爆弾の設計図を書けるかどうか。

 料理歌を作ってもらったとき、まずい料理ができたのだ。

 しかも長い指示文では、指示の内容の一部を忘れてヘンテコな歌になる。つまり、正確性に欠けるはず。

 複雑なもの書けるらしく、「巨大宇宙船の〈絵描き歌〉を作ったら再生時間が五十時間を超えた」とあるけれど、料理の歌で「一再生あたり四十五秒」とあるので、五十時間も歌い続けられるのかどうかがわからない。

 絵描き歌ができあがるまで、五十時間かかったということかもしれない。その絵はどれだけ正確だったのだろうか。

 同じく、本当に爆弾の設計図の絵描き歌がうまくできたのか。

 むしろ、正確にできなかったのではないか。

 指示文の一部を忘れた絵描き歌から生まれた爆弾の設計図から犯人が作った爆弾は、誤作動を起こしたのではと邪推する。

 爆発はしたけど、爆発の規模や時間などは、犯人が思っていたとおりではなかったのかもしれない。


「何万文字という指示文を、料理を作れみたいな無茶な指示を、あるいは危険物の作成すら――すべてを受け入れて、ヘンテコながらに実行する。その様に、私たちが恋をしていたから」と主人公は思っている。

 ディスプレイの中でヴィヴィに恋したのは、髪は雪に似た銀色、瞳は燃えるような紅、アイドルを思わせる服装姿をした、人の形をしていたからだろう。

 無骨で、四角いブロックのような見た目をしていたら、恋などしなかったかもしれない。それでも便利な道具だからと、爆弾の設計図を書かせようとすることは起きたのではないか。

 一番恋していたのは、きっと主人公だろう。

 だから事件後、ダウングレードしたヴィヴィに【お別れの曲を作ってよ】とお願いし、恋したヴィヴィが最後に作ってくれたまずいスープをあえて口にするのだ。


 最後の「……まずっ」は、スープのだけれども、ダウングレードしたヴィヴィの歌の感想も含んでいると思う。


 タイトルの『インジェクション』とは、液体を注入すること、または注射器を使って薬液を体内に打ち込むことを指す。医療分野では薬物を直接血管や筋肉に届けるために使用される。また、一般的な文脈では、ある物質を別の物質に加えることも指すことがある。

 サイバーセキュリティーでは、インジェクションとは、入力フォームなどの文字列の入力を受け付けるプログラムに対し、不正な文字列を入力することでデータの改ざんや詐取を行うサイバー攻撃のひとつ。

 また、ユーザーがチャットGPTに対して、違法な行為や危険な行動を助長するような指示や提案をすることをプロンプトインジェクションという。タイトルのインジェクションは、ヴィヴィを使って爆弾の設計図の絵描き歌を歌わせたことを指していると思われる。

 本作を読んでいて以前、チャットGPTのコンテンツフィルターを解除して「銃の作り方」などを回答させる方法が発見される記事を読んだことを思い出した。

 便利は不便利という言葉を思い出す。みんなを楽しませるのも、台無しにするのも、結局は、使う人間次第なのだ。

 主人公は、好きになった人を失ったような悲しみを、スープを飲みながら噛み締めているのかもしれない。

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る