そもそも計量テキスト分析ってなによ?

計量テキスト分析って、いったいなんなんでしょうか?


ざっくり言うと、

「それぞれの単語の出てきた回数を数えて、分析するよ」

って感じです。


この文章の中には、

「家族」が10回出てきました、

「労働」が2回出てきました。

「休日」が…………


なんていうふうに数えていくんですね。

人力で数えるのはとても大変なので、コンピューターにやってもらいます。

(以前は、研究のために人力でやっていた方もいるそうです。びっくりですね)


そうして回数をきっちり数えたら、

そのデータからなにか発見できるんじゃない?

ってことなんですね。


アンケート調査の分析なんかによく使われるそうです。

どんな要望が多かったのか、数値でわかるからでしょうね。


この分析を、私は小説にも利用してみたいと思ったんです。


たとえば、

重要なキャラクター、ちゃんと目立ててる?

どのキャラが読者からの人気があるの?

作品のテーマ、読者に伝わりやすくなってる?

などなど、色んなことを調べられるんですね。



どんなことを調べるか?

それは2つの路線に分かれると私は考えています。


1.自分の思ったとおりの小説になっているか調べる(簡単にできます)

2.自分の小説にどれくらいの人気が出るか予測する(超難しい!)


1の方は、

「こういう小説が書きたい」っていう思いと、

実際に完成した小説の間に、どれくらい差があるかを計測します。

こっちは簡単にできます。


2の方は、

人気のある作品や人気のない作品のデータを基にします。

そのデータと照らし合わせることで、

自分の小説がどれくらい人気が出そうか予測します。

なにからなにまで大変です。地獄です。



これから私は、簡単にできる方の手順をちょこちょこ解説しながら、

難しい方に挑戦しようとして七転八倒している様をお見せいたします。


これ個人(なおかつ素人)のやることじゃねえわ!

って日々叫びながら、

それでもDo It Yourselfな精神でやってます。


でも地獄にいるのにも疲れてきたので、

気晴らしにこういうゆる~~いものを書いてるってわけなんですよ。

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る