前のエピソード――コーディングルールを作ってみよう！

前回、コーディングルールを作りました。

なので今回はそれを使って、分析をやってみましょう。

「ツール」→「コーディング」→「クロス集計」をクリックします。

すると、コーディング・クロス集計、というウィンドウが開きます。

まずは上部にある、

コーディングルール・ファイルの[参照]ボタンをクリックします。

そして前回用意したテキストファイルを開きます。

その下にある、

コーディング単位は「文」もしくは「段落」を指定します。

ここも例によって、という感じですね。

その横には、

クロス集計というものがあります。

ここでは、外部変数を指定します。

外部変数のおさらいを一応すると、

エクセルファイルで、B列やC列とかに記入したやつですね。

「エピソード」とか「章」とか「作者名」とかです。

今回はエピソードごとに分けて集計するので、

「エピソード」を選択します。

（くどいようですが、エクセルファイルを作成した時に別の名前で記入していた場合はその名前のを選択です）

ちなみに、セル内容というところは、

初期設定の「度数とパーセント」ままで大丈夫です！

ここまでの設定が終わったら、

右側にある[集計]ボタンをクリックします！

処理が終わるまで少々お待ちください！

処理が終わると、結果が表示されます。

「第1話では、『＊キャラＡ』グループの文章が〇個ありました」

「第2話だと、『＊キャラＡ』グループの文章が×個でした」

「第3話だと……」

ということが表示された結果からわかります。

セル内容を「度数とパーセント」に指定していた場合は、

「21(15.91%)」などのように、数値が表示されていると思います。

この場合、

21は「指定の語が登場していた文章数」

15.91%は「全体の何%でその文章があったか」

を示しています。

ここらへん、もうちょっと丁寧に解説しますね。

まず、具体例があった方がわかりやすいと思うので、

前回に例示したコーディングルールを再掲します。

＊アムリタ

アムリタ or アム or リータ

もし、

「アムリタは目を覚ました。」

という文章があったとすると、

KH Coderはこの文章を「＊アムリタ」の文章として認識します。

文章単位で「＊〇〇である」と判定されるところがポイントです。

ちなみにこの単位は、コーディング単位でその範囲が変動します。

（このへんの説明はちょっとだけ複雑なので、次回に後回しします！）

イメージとしては、

「アムリタは目を覚ました。」→＊アムリタ

「彼女はアムって呼ばれている。」→＊アムリタ

「つぐみは確かにいやな女の子だった。」→該当するグループなし

「そして彼はトモビキ。」→＊トモビキ

「トモビキとアムリタは仲が良い」→＊アムリタ、＊トモビキ

というふうに文章がマーキングされていきます。

上に書いた5つの文章で分析した場合、

「指定の語が登場していた文章数」は、

＊アムリタは3つあるので、3と表示されます。

＊トモビキなら、2です。

そして、

「全体の何%でその文章があったか」

ということを考えていくと、

まず文章は5つあります。

＊アムリタはそのうち3つあるので、

3÷5×100で60%となります。

＊トモビキだと、全体が5に対して＊トモビキが2つなので、

2÷5×100で40%ですね。

こういった計算をした結果として、

＊アムリタ　＊トモビキ

3(40.00%)　2(20.00%)

と表示されているのです。

さて、表の読み方はわかりましたが、

ウィンドウの下部を見ると、

マップ：[ヒート][バブル]

折れ線：[すべて][選択]

というボタンが見つかります。

さらにその横にある[コピー（表全体）]のボタンをクリックすると、

表をそのままエクセルファイルにペーストできるようになります。

今回は、折れ線の横の[すべて]をクリックしてみましょう。

するとしばらく処理した後、

新しいウィンドウで折れ線グラフが表示されます。

このグラフは、

集計結果の、%の方のデータを使って作られています。

今回の分析では、

・キャラ名でコーディングルールを作る

・エピソードごとに集計結果を出す

という操作を行っているので、

「各エピソードで、キャラがどれくらい登場していたか」

ということが可視化されています。

これによって、

「こいつ、中盤からやけに影薄いな！」

「このキャラ、動かしやすかったのか、思ったより登場してるな」

なんてことが発見できます！

私が過去にカクヨムの小説を分析した時には、

「キャラ15%仮説」なんてものを提唱していました。

たとえば、

キャラＡの名前が全体の15%以上の文で登場しているエピソードがあったとします。

すると、そのエピソードの応援コメントでも、キャラＡについて言及されているってことが多く見られたんですね。

このことから、

「たくさん登場させる（≒名前をたくさん出す）と、そのキャラの人気が自然と上がるのではないか？」

という仮説を立てたわけです。

別の言い方をすると、

「目立たせたいキャラなら、15%以上は出しなさいよ」

ってことですね。

15%が信頼に足る数字かどうかはともかく、

そもそも登場していないキャラの人気が出るはずもありません。

なのでこのクロス集計を用いて、

登場回数を確保できているか調査することをオススメします。

データを用いて影の濃さを管理すれば、

人気の出てほしいキャラが注目される小説を書くことも夢ではないのです！

作者を応援しよう！

ハートをクリックで、簡単に応援の気持ちを伝えられます。（ログインが必要です）

応援したユーザー

新規登録で充実の読書を

マイページ: 読書の状況から作品を自動で分類して簡単に管理できる; 小説の未読話数がひと目でわかり前回の続きから読める; フォローしたユーザーの活動を追える
通知: 小説の更新や作者の新作の情報を受け取れる
閲覧履歴: 以前読んだ小説が一覧で見つけやすい

カクヨムで可能な読書体験をくわしく知る

次のエピソード補足情報：集計単位の「文」とか「段落」ってなんなの？

作者を応援しよう！

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

文字サイズ

背景色

フォント

組み方向

応援の気持ちを届けよう

フォロー機能を活用しよう

フォロー機能を活用しよう