ノート1.16 215,590作品って、どれくらい紹介文を書いてるの?
(注意)本作のデータは全て2021年1月19日から20日にかけて取得されたものです。
――――――――――――――――
「うーん……」
俺――
「ケイコちゃん」
「あ、タケル君」
ケイコちゃんは俺の存在に気付くと、手に持っていたものをサッと見えないところに隠した。いつもは可愛らしい笑顔も、なんだかぎこちない。
「何を見てたんだ?」
「べ、別に何でもないわ。タケル君には関係ない事よ」
「俺に隠し事だなんて珍しいな。別に笑わないから教えてくれよ」
「本当?」
「うん、約束する」
「実は――お見合いの話が来てるの」
「え!?」
「まだ正式な話じゃないわ。こんな人がいるけど私にどうかって、ある人から勧められちゃって。懇意にしてる方だからむげにお断りするのも失礼だし……」
「と言うことは、さっき読んでたのは
釣書とは縁談の際に交換する書面のことで、就職活動における履歴書のようなものだ。
「ううん、そんな堅苦しいものじゃなくて、自己紹介とかそんなレベルのものよ」
「ふーん……」
「タケル君は、私が結婚して研究所からいなくなったら淋しいと思う?」
「べ、別にー? 俺はなんとも思わないぞ? ケイコちゃんがいなくたって研究は続けられるし!」
「ふふっ、タケル君。声が裏返ってるわよ」
「う……」
「ありがとう。やっぱりこの話は断るわね」
「そうか。それは――良かった」
「え? 何か言った?」
「いや、別に」
「と言うことで、この紹介文はもう用済みかー。経歴や中身は面白かったから捨てるのがもったいないけど」
「どれくらい書いてあったの?」
「便箋に 2 枚、ぎっしりと。主に自慢話ばっかりだったけどね」
「ふーん」
「そう言えば、カクヨムの小説紹介文にも『ここに小説が書いてある!』って思うくらいぎっしり書いてあることってあるよね」
「カクヨムの紹介文は、小説のあらすじや登場人物の紹介などの小説に関する情報を最大 1 万文字まで書くことが出来る。仕様上は、確かに小説の 4 話から 5 話分を書くことが出来るな」
「1 万字も書けるの! 私は『読み専』だから全然知らなかったわ」
「じゃぁ、折角だし今日はカクヨムの紹介文について統計を見てみようか」
「是非是非」
――――――――――――――――
統計情報(2021年1月20日現在)
――――――――――――――――
総文字数:29,801,598文字
最大値:10,000文字
最小値:0文字
中央値:91文字
最頻値:0文字
平均値:138文字
――――――――――――――――
「本当に 10,000 字も書いてる作品があるのね」
「そのようだな」
「中央値が 91 文字ってことは、キャッチコピーよりは多いってこと――」
「ちょっと待ってくれ。実は、今回の統計は非常に変わってるんだ。早速だが文字数別の作品数分布を見てくれ」
「ん、どういうことかしら――」
――――――――――――――――
統計情報:紹介文の文字数別作品数分布(2021年1月20日)
――――――――――――――――
0文字:31,940作品 (14.82%, 14.82%)(※最頻値)
1文字:72作品 (0.03%, 14.85%)
2文字:116作品 (0.05%, 14.90%)
3文字:138作品 (0.06%, 14.97%)
4文字:258作品 (0.12%, 15.09%)
5文字:306作品 (0.14%, 15.23%)
6文字:309作品 (0.14%, 15.37%)
7文字:452作品 (0.21%, 15.58%)
8文字:511作品 (0.24%, 15.82%)
9文字:530作品 (0.25%, 16.06%)
10文字:644作品 (0.30%, 16.36%)
11文字:749作品 (0.35%, 16.71%)
12文字:790作品 (0.37%, 17.08%)
13文字:850作品 (0.39%, 17.47%)
14文字:846作品 (0.39%, 17.86%)
15文字:992作品 (0.46%, 18.32%)
16文字:891作品 (0.41%, 18.74%)
17文字:990作品 (0.46%, 19.20%)
18文字:933作品 (0.43%, 19.63%)
19文字:919作品 (0.43%, 20.05%)
20文字:901作品 (0.42%, 20.47%)
21文字:947作品 (0.44%, 20.91%)
22文字:991作品 (0.46%, 21.37%)
23文字:987作品 (0.46%, 21.83%)
24文字:949作品 (0.44%, 22.27%)
25文字:1,036作品 (0.48%, 22.75%)
26文字:1,067作品 (0.49%, 23.25%)
27文字:1,071作品 (0.50%, 23.74%)(※山のピーク)
28文字:915作品 (0.42%, 24.17%)
29文字:1,056作品 (0.49%, 24.66%)
30文字:964作品 (0.45%, 25.10%)
31文字:947作品 (0.44%, 25.54%)
32文字:945作品 (0.44%, 25.98%)
33文字:971作品 (0.45%, 26.43%)
34文字:928作品 (0.43%, 26.86%)
35文字:972作品 (0.45%, 27.31%)
36文字:958作品 (0.44%, 27.76%)
37文字:994作品 (0.46%, 28.22%)
38文字:862作品 (0.40%, 28.62%)
39文字:903作品 (0.42%, 29.04%)
40文字:919作品 (0.43%, 29.46%)
……
90文字:839作品 (0.39%, 49.67%)
91文字:804作品 (0.37%, 50.04%)(※中央値)
92文字:754作品 (0.35%, 50.39%)
……
137文字:625作品 (0.29%, 64.50%)
138文字:589作品 (0.27%, 64.77%)(※平均値付近)
139文字:607作品 (0.28%, 65.05%)
……
8,351文字:1作品 (0.00%, 100.00%)
9,330文字:1作品 (0.00%, 100.00%)
10,000文字:1作品 (0.00%, 100.00%)
――――――――――――――――
合計:215,590作品 (100.00%)
――――――――――――――――
「え、紹介文の無い作品が 3 万作品もあるの?」
「うん。最頻値が 0 文字であることから、紹介文無しの作品が 1 番多いということが分かる」
「マジでか。想像以上に多い……」
「さて、この分布の何が変かを説明していこう。
星や PV 数といった指標に現れていた『べき乗則』なら、1 番低い数字の作品数が 1 番多く、そこから単調に減少していった。しかし、紹介文の場合は 0 文字から 1 文字はガクンと減るものの、そこから段々作品数が増えていき一旦ピークが現れる。そのピークが 27 文字付近だ」
「え、中央値とか平均値じゃないの?」
「それが違うんだな。
全体から 0 文字の作品を抜いて最頻値を計算すると 27 文字になる。つまり、作品全体で考えた時の統計的指標――中央値、最頻値、平均値――いずれもこのデータを代表するのに相応しくない。だから、この分布は非常に変わってるんだ」
「うーん、力説された割にはよく分からなかった」
「そうか……それは残念だ」
「今までは気持ち悪いくらいに『べき乗則』や『対数正規分布』に従っていたけど、今回は当てはまる分布を見つけることが出来なかった。無念」
「★のときは? あれは結構ギザギザだったじゃない」
「そうなんだけど、ちょっと工夫することでうまく『べき乗則』に落とし込めてたからなぁ」
「そうだったっけ」
「うん。今回の場合は、0 文字を除外して考えたとしても対数正規分布に従ってる感じはしないし、他の分布もいろいろ試したけどあまり上手くいかなかった。強いて言えば、対数ラプラス分布に最も近かったが、それでも結構誤差が大きかったんだ」
「タケル君、お願いだから日本語を話して!」
「要約すると、数学って難しいねってこと」
「それはよーく知ってるわ」
――――――――――――――――
今日の研究ノートまとめ
――――――――――――――――
・小説の紹介文について調査
・紹介文の無い作品が 1 番多いが、27 文字付近にも作品数のピークがある
・中央値は 91 文字なので、全体的に見ればキャッチコピーより長い紹介文が圧倒的に多い
――――――――――――――――
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます