第8話 自主企画、その結果……

 自主企画を立ち上げ多くの方にご参加頂き何よりでした、みたいな内容が前回エピソードのハイライトでした。


 当初は、品詞の組み合わせのみを分析するつもりでした。

 実際、分析を進め、助詞-終助詞_記号-句点の組み合わせが多いというような結果が得られました。


 こちらの分析結果とは別に、平均文長やひらがなと漢字の比率も調べました。こちらはおまけのような位置づけのつもりでした。


 もうなんとなくお気づきかもしれませんが、このひらがな比率などの結果の方が、どういうわけか好評でした。


 比率や文長の分析は簡単にできますが、品詞の組み合わせの調査は手作業の部分が多く、わりと時間がかかります。にもかかわらず、あんまり反応がよくなかったかな? と思う次第です。


 正直、助詞-終助詞_記号-句点の比率が多かったです、と例文付きでいわれても、いまいちピンとこないかもしれないです。ちなみに、が助詞-終助詞で、は記号-句点です。



 正確には、品詞の組み合わせという文章の特徴を用いて、教師あり学習の一つである決定木という手法で分析しています。

 この手法でも、いわゆるAI診断みたいなイメージで、未学習の作品が誰の作品なのか当てることができます。

 どんな基準で分類しているかわからない――ブラックボックス化しているなんて言われることもありますが、この手法であれば、助詞-終助詞_記号-句点の比率が多い時は〇〇さんというように、どのように分類しているかわかります。


 で、今回参加下さった方々の中で、作品数の多い方は、精度よく分類することができていました。なので、著者推定という意味では、先行研究で示された通りの結果が得られてよかった、と前向きにとらえることにしています。評判はいまいちだった印象ですが(汗)

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る