作家SF

研究テーマ:人工知能を用いた特定の作家の文体の再現


1.目的


 現在、文章生成AIはニュース記事の作成をはじめとした多様な用途で使われている。しかしながら現在の用途としては事務的な文章の生成が多く、文学・芸術など文化的な分野で用いられる例は少ない。


 本稿では文学への応用可能性の一例として、既存の作家の文体を模倣するAIの作成方法の検討を行う。


2.方法


 文章生成AIに用いられる主要な3つの方法(拡張マルコフ連鎖法・ミーム発現法・ランダム辞書法)を用い、それぞれ数種類の学習元データから文章作成AIを作成する。


 例文を文章生成AIで加工して文を生成する。生成された文章を筆者判定エンジンで判定し、目的の作家との文体の類似度を算定する。例文としてはJAS規格の日本語版自然言語例文を用いる。


 類似度から、ある作家の文体を模倣するために最適な手法を検討する。


3.結果


<略>


4.考察


 拡張マルコフ連鎖法は一部で文意が変わってしまう例がみられるものの、文体の類似度という点においては全体として高い。図3-32に示されるように特に学習元データに著作を用いた場合の結果は比較的類似度が高く、有望な手法であるといえる。


 しかしながら今回研究の対象とした作家は若くして亡くなっており、遺したのも3本の長編に加えて複数の短編やブログ記事のみとなっている。結果として学習に使えるデータの量が少なくなってしまったことで、類似度は7割程度にとどまっているものと思われる。


 なお、一般にこの作者の作品と見なされている長編がもう1作存在するが、これは遺作を友人が引き継いだ作品であり、学習元とするには不適当であることから除外した。


 特筆すべき結果として、ミーム発現法では学習元データとして「作家の著作」よりも「その作家が生前読んでいた作品群」を用いたほうが類似度が高くなった点が挙げられる。


 タナカらの先行研究によると、ミームとは人間あるいは動物が持つ文化的な遺伝子のことである[13]。ミーム発現法はこの遺伝子、つまりミームのセットの中から必要に応じて適したものを発現させる方法である。


 本研究におけるミーム発現法の有効性の高さは、「ある人が書く文章は、その人が過去に読んだ文章の切り貼りによって構成されており、オリジナリティとは基本的には組み合わせの問題に過ぎない」というタナカらの仮説が有力であることを示唆している。


 本研究によって、作家の文体を模倣するにあたってはミーム発現法が有力な手法であることが分かった。将来の展望としては、小説だけでなく映画やテレビアニメ等の他媒体由来のミームも扱えるよう改良することで、より精確な模倣を行うことなどが考えられる。


参考文献


<略>

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る