第8話 自主企画、その結果……
自主企画を立ち上げ多くの方にご参加頂き何よりでした、みたいな内容が前回エピソードのハイライトでした。
当初は、品詞の組み合わせのみを分析するつもりでした。
実際、分析を進め、助詞-終助詞_記号-句点の組み合わせが多いというような結果が得られました。
こちらの分析結果とは別に、平均文長やひらがなと漢字の比率も調べました。こちらはおまけのような位置づけのつもりでした。
もうなんとなくお気づきかもしれませんが、このひらがな比率などの結果の方が、どういうわけか好評でした。
比率や文長の分析は簡単にできますが、品詞の組み合わせの調査は手作業の部分が多く、わりと時間がかかります。にもかかわらず、あんまり反応がよくなかったかな? と思う次第です。
正直、助詞-終助詞_記号-句点の比率が多かったです、と例文付きでいわれても、いまいちピンとこないかもしれないです。ちなみに、ひどいのかい。のかいが助詞-終助詞で、。は記号-句点です。
正確には、品詞の組み合わせという文章の特徴を用いて、教師あり学習の一つである決定木という手法で分析しています。
この手法でも、いわゆるAI診断みたいなイメージで、未学習の作品が誰の作品なのか当てることができます。
どんな基準で分類しているかわからない――ブラックボックス化しているなんて言われることもありますが、この手法であれば、助詞-終助詞_記号-句点の比率が多い時は〇〇さんというように、どのように分類しているかわかります。
で、今回参加下さった方々の中で、作品数の多い方は、精度よく分類することができていました。なので、著者推定という意味では、先行研究で示された通りの結果が得られてよかった、と前向きにとらえることにしています。評判はいまいちだった印象ですが(汗)
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます