ゼロリセット計画物語
@Blue_Swan
5月のパリ
第1話 パリの白いマロニエ:2022年5月
(南山洋子が、パリのフランス独立党を訪れる)
2022年5月。フランス。パリ。フランス独立党オフィス。
「久しぶりのパリだわ。前回は、大学の卒業旅行のときだった」
洋子は、シャルル・ドゴール空港の到着ロビーを出て、そう思った。
「パリには、迎える人を何か、エキサイトさせる力があるわ。それに、5月のパリは、マロニエの白い花が満開で、もう最高だわ。時間があったら、ジベルニーのモネの家にも行ってみようかしら」
到着ロビーには、ホテルのピックアップサービスが来ていた。洋子は、ホテルに荷物をいったん降ろした後で、フランス独立党オフィスに行って、仕事の打ち合わせをする予定だった。
南山洋子。27歳。黒い目、長めの黒い髪と浮世絵にでも出てきそうな典型的な日本人の容貌の持ち主である。今日は旅行ということで、活動しやすいブルーのパンツルックである。
洋子は、大学を卒業した後、IT企業のG社で働いている。今年で、5年目である。現在の仕事は、言語要約システムを開発する言語分析プロジェクトである。プロジェクトのミッションは、AIを使って文章や発言を要約するシステムの開発である。試験問題に出るような文章の要約は、文字を切り詰めるイメージである。言語分析プロジェクトの要約は、これとは少し違う。例えば、新聞の1ページを取り出して、要約しなさいと言われた場合、まず、記事や、広告の単位にデータを分解して、個別に要約を作成して、次に統合を検討するだろう。それでも、全体を1つにまとめることは、困難だ。ここで、事前に、「経済問題」といったキーワードが与えられていれば、問題はずっと簡単になる。扱っている要約問題とは、事前情報の条件を変えて、効率的な要約を作ることである。言語分析では、日本語には、ヨーロッパ言語にない難しさがある。単語区切りがない、音声データでは、同音異義語が異常に多いなどは、分析の障害になる。このため、プロジェクトでは、まず、英語などのヨーロッパ言語で、システム開発を行い、性能が上がってから日本語版を開発する手順を踏んでいた。現段階では、実用になる水準に達したと判断したヨーロッパ言語版は、言語要約システムとして販売しているが、日本語版は、まだ、そのレベルには達していなかった。
今回、フランス独立党から、フランス語版の引き合いがあった。チーム長は、日本語版の開発の最終段階で手を離せない、ということで、洋子に順番がまわってきた。
受付に案内されて、党首の部屋に近づくと、ドアが開いて、40代後半の栗色の髪の毛の女性が出てきた。なにかにつまずいたか、一瞬、女性の動きが、ぎこちなく見えたが、直ぐに普通に戻って、挨拶をした。
「南山さんですね。お待ちしていました。私は、フランス独立党の党首のジャクリーヌ・ルパンです」
「G社で、言語分析プロジェクトを担当しています南山洋子です。お目に書かれて光栄です」
「南山さんは随分お若いですね。もっと、お年を召した方が、来るとばかり、思い込んでいました」
「言語分析プロジェクトのチーム長が、来れれば良かったのですが、生憎、彼は、日本語のシステムの仕上げで手が離せなかったのです。今回、お問い合わせ頂いたフランス語版の言語要約システムについては、他社に負けない高い性能が実現できていると自負しています。一方、日本語版については、問題が残っていて、未だに、販売にいたっていないのです。G社の幹部は、日本語版の開発を早めるように、プロジェクトに要求していますので、チーム長は、来られなかったのです」
「それは、大変ですね。早く、日本語版が完成するとよいですね」
洋子が、党首の部屋に入ると、ジャクリーヌが言った。
「そのテーブルで、打ち合わせをしますから、まずは、お座りください」
洋子は、椅子に腰を降ろして、カバンから、タブレットを取り出した。
「打ち合わせの内容を録音させて頂いてもよろしいでしょうか。会議後、録音内容は、自動変換で、会議録に文字化した上で、音声データは、削除します。会議録は、会議終了後、チェックして頂き、問題がなければ、本社への報告に使いたいと考えています」
「了解しました。会議録のコピーは頂けますか」
「もちろんです。それでは、録音を始めます」タブレットの録音機能がオンになった。
「今回、お願いしたいのは、G社の言語要約システムを使って、政策要求の要約ができないかということです。ご存知とは思いますが、フランス革命の前のフランスには、明確な身分制度があり、人の運命は、生まれたときの身分で決まっていました。フランス革命の後、資本家階級と労働者階級への分離が始まりました。それが、最近では、高等教育の有無によって、身分制度が復活する様相を見せています。つまり、フランスは、高等教育を受けた階級と、高等教育を受けられなかった階級に分断されています。典型的な後者の例は、イエローベスト運動に見られます。ここでは、前者を高等教育階級、後者をイエローベスト階級と呼ぶことにしましょう。有権者は、イエローベスト階級が多数になります。そこで、フランス独立党は、イエローベスト階級の要求を管理するために、G社の言語要約システムが使いたいと考えています。イエローベスト階級の発言は、理路整然としていないので、人間が要約することが難しいのです。今日は、実現可能性について、説明をお願いします」
「言語要約システムの基本的な仕組みは、まず、『音を単語に、単語を文章に、文章を段落』に変換します。これは、聞き取りに相当する作業です。次に、要約として『段落を文章に、文章を単語』に変換します。この例は、順方向で説明しています。しかし、実際には、言語要約システムは、順方向と逆方向の推論を繰り返します。イエローベストのベストがうまく聞けなかった場合、例えば、イエローバイクという単語であると判断した場合に、この単語を使って、作成した文章や、段落が、うまく要約できなくなります。その場合には、逆向き推論で、バイクの単語が間違っているのではないかと推論して、修正します。また、発言が例えば、失業に関わるものであることがわかっていれば、音を単語に変換するときに、よく聞き取れなかった単語は、イエローバイクより、イエローベストである可能性が高いと判断できます。人間は、このような、単語の組み合わせを変えながら、順方向と逆方向の推論を繰り返すことが、得意ではありませんので、言語要約システムが役に立つわけです。
わが社の言語要約システムで、なんでもできますと申し上げられれば、簡単なのですが、言語要約システムの性能は、利用環境と、付帯条件に大きく左右されます。このため、G社では、カスタマーから、音声データを頂いて、システムに学習をさせ、チューニングしてから、出荷しています。チューニング期間は2週間から4週間です。問題がない場合には、2週間で出荷します。問題がある場合は、4週間まで、改善を試みます。4週間経っても、実用出来るレベルに達していない場合には、出荷はしません。契約成立は、出荷時になります。つまり、この場合、4週間後に、契約はなかったことになります。ただし、カスタマーによっては、不完全でも使いたいという希望をお持ちの場合もあります。その場合には、販売契約ではなく、共同開発契約を結んで頂いています」
「なるほど、魔法のシステムはないということですね。でも、正直なところが気に入ったわ」
「テスト・データはありますか」
「課題は、まだ、その前の段階です。どこで、データを集めるかを決めていないのです。何かいいアイデアはありますか」
「最近の動向としては、インターネットの誰でもいつでもアクセス出来る、何でも記録されるという特徴を逆手に取ったサービスが人気を得ています。クラブハウスなどが典型です。発言記録が残らない、アクセスが制限されていることが人気の出る理由です。発言内容が事前に決まっている場合には、これで問題ありません。しかし、ミーティングをしても、記録が全く残らなければ、ミーティングをする意味がありません。そのような場合でも、当社の言語要約システムを使えば、結果の要約だけを残すことが可能です。もちろん、こうすると、システムの学習データが得られなくなるので、開発側にとってはデメリットになります。テスト・データをとるのであれば、システムの学習のために、暫定的に、一部データが、保存され、トレーニングに使われた後で、消去されますという、ただし書きがいるでしょうね。また、以上は、音声データを中心にご説明しましたが、文字データについても同じことが考えられます」
「なるほど、後発であれば、『記録が残らない、アクセスが制限されている』いう逆手が有効なわけですか」
「そういうことになります」
といって、洋子は、大きく息をして、間を取ってから言った。
「私は、言語要約システムの担当なので、クラブハウスのようなユーザー相手のアプリケーション・サービスには、詳しくありません。既に、政党のITシステム担当会社が決まっているのであれば、そちらと、ご相談ください。まだ、特定のIT会社と契約を結んでいなければ、フランスにも、当社の関連会社がありますので、ご紹介もできます。共同開発契約を結ぶ場合には、秘密保持の問題がありますので、原則として、関連会社を使うようにお願いしています」
「わかりました。まずは、テスト・データに向けた検討を進めましょう。今日は、私の知らない新しいことが沢山出て来ましたので、私の頭の容量を越えかかっています。前向きに検討して、出来るだけ早く、ご連絡を入れると、本社にお伝えください」
「わかりました。ありがとうございました。これで、録音を止めます」
録音ボタンが再度、押されて、録音は停止され、音声データのコード変換アプリが起動した。
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます