第6話 テキストではないものを対象にした分析

 作品の本文やキャッチコピーだけではなく、星の数や公開日、フォロー数、タグなどもデータとして集めています。

 テキストマイニングの応用では、タグの相関ルールを紹介していますが、実際これは分かち書き(文章から単語を抽出する処理)をしていないため、テキストマイニングに該当しないと思います。そんな細かいことを気にしている方はいないでしょうし、そもそもそんなに読まれていないので、相関ルールのエピソードを投稿しました。


 タグの相関ルール以外にも、分析した結果があるのでここで紹介します。


・古い投稿作品ほど星が多いというわけではない

 2017年や2018年、2019年の作品を調べました。横軸を公開日、縦軸を星の数としグラフを描きましたが、右肩下がりになるような傾向は顕著に表れませんでした。

 なお、小説フォロー数も、応援コメント数も同じ傾向でした。


・一話の文字数が少ないジャンルはエッセイと詩

 エッセイと詩のジャンルは一話あたり文字数が少なく1000文字ほど。次点は創作論で1500文字です。その他のジャンルは全て変わらず、2500文字となりました。


・星の平均値は2.49

 星の数をおすすめレビュー数で割った値を平均星の数とし、集めた作品全体で平均値を求めると、その数値は2.49でした。最大値は3、最小値は0となるような指標です。


・星よりも応援コメントの方がもらいにくい

 横軸を応援コメントの数、縦軸をおすすめレビューの数(星をつけた人の数)としてグラフ化すると、応援コメントは頂きにくいことがわかります。


 直感的になんとなくわかるような内容だと思います。

 こうやって、データを集めて可視化して図を眺めるのは、何だか楽しいと思います。

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る