ノート1.2 215,590作品って、どれくらい★が輝いているの?

(注意)本作のデータは全て2021年1月19日から20日にかけて取得されたものです。


 ――――――――――――――――


「ねぇ、タケル君。ってなんで魅力的なの?」

「え? 星?」


 研究助手アシスタントで俺の幼馴染みであるとう景子けいこが、何の脈絡も無く俺――草薙くさなぎタケルに質問してきた。たまに変な質問をぶつけてくるケイコちゃんには困ったものだ。


 しかし、ちゃんと答えないとチコちゃんに叱ら――ごほん、研究所主任研究員マッドサイエンティスト沽券こけんに関わる!


「それはね、水素同士が起こす核融合反応によって放出されるある波長のスペクトルが――」

「私が言ってるのはのことなんだけど」

「あぁ、そっち……」

「って言うか、空に輝いている星の魅力を語るのにスペクトルって何? 小一時間問い詰めたい」

「頼むから忘れてくれーっ!」

「カクヨムの★は『おすすめレビュー』と呼ばれているから、勘違いしたのね。正確なことにこだわるタケル君らしいわ」

「初心者に向けた解説をどうもありがとう」

「最初の質問に戻るけど、『書き手』にとって★はなんでそんなに魅力的なの?」

「おすすめレビュー――小説トップページに輝く青い星は、カクヨム小説を評価する最も基本的な指標だからさ。各カクヨムユーザーは1作品当たり1~3個の星を付けることができ、後でキャンセルすることも可能。

 小説検索のランキングやコンテストの読者選考ではこの星が主な基準になると言われており、『書き手』は喉から手が出るほどこれを欲しがるぞ」

「『読み専』の私ににとっては、★が多ければその作品は面白いのかなーくらいの軽い気持ちだわ」

「そうなんだ。星に抱く感情はともかく、読む作品を選ぶ1つの指標には違いない。まずは、215,590作品に付けられた星の総数から見ていくことにしよう」

「はーい」


 ――――――――――――――――

 統計情報:おすすめレビュー(★)

 ――――――――――――――――

 総数:★4,411,399

 ――――――――――――――――


「441万ってすごい数ね」

「なお、この数字はあくまでデータを集めた時点で公開になっていた小説に対して統計を取ったものだ。データを集めるまでに非公開もしくは削除されてしまった作品についてはカウントできないから、実際に付けられた星の数はもっと多いだろうね」

「215,590作品合計で星が約440万ってことは、1作品当たりの平均は★20.46――」

「ちょっと待った」

「なによ、人がせっかくタケル君の代わりにデータを計算してあげてるのに」

「気持ちは嬉しいよ。だけど、その平均は統計的に意味をなさないんだ」

「え、どういうこと? 平均って統計学における基本中の基本よね」

「もちろんケイコちゃんの言う通りさ。普段俺たちが気軽に平均を使うのは、ある数字の塊を代表するのにふさわしいからだ」

「それはそうよ。テストの平均点とか」

「では、その常識をひっくり返そう。このデータを見てくれ」

「ん? どういうこと――」


 ――――――――――――――――

 統計情報:★の数による作品数の分布(出現率)

 ――――――――――――――――

 ★0:85,393作品 (39.61%)

 ★1:7,990作品 (3.71%)

 ★2:9,790作品 (4.54%)

 ★3:26,139作品 (12.12%)

 ★4:5,510作品 (2.56%)


  ……


 ★19:1,168作品 (0.54%)

 ★20:1,156作品 (0.54%)

 ★21:1,269作品 (0.59%)

 ★22:978作品 (0.45%)

 ★23:956作品 (0.44%)


  ……


 ★15,274:1作品 (0.00%)

 ★17,243:1作品 (0.00%)

 ★18,109:1作品 (0.00%)

 ★19,289:1作品 (0.00%)

 ★20,897:1作品 (0.00%)

 ――――――――――――――――

 合計:215,590作品 (100.00%)

 ――――――――――――――――


「え……全体の約4割の作品に★が付いてないってこと?」

「そういうことになるね。ちなみにグラフ化するとこんな感じになるぞ」


 https://pbs.twimg.com/media/EsYGohmVcAAamjj?format=jpg&name=large

(ツイート本体:https://twitter.com/t_kusanagi/status/1233347439223984129)


「ちょっと! 何よこのグラフ!? 線が0付近に張り付いちゃって見えないじゃない!!」

「悪い悪い。表示のさせ方が悪かったな。横軸を対数にしてもう一度見てみよう。なお、対数の時は0が表示できないから、★0の85,393作品はグラフには含まれていないぞ」

「はーい」


 https://pbs.twimg.com/media/EsYV7gQVkAIdoRo?format=jpg&name=large

(ツイート本体:https://twitter.com/t_kusanagi/status/1352792927836098560)


「滅茶苦茶ギザギザしてるわね」

「それだけ『おすすめレビューするときは3だ!』という『読み手』が多いことを如実に表しているな。


 この表や図を見ると、星が増えれば増えるほど作品の出現率は減っていくことが分かる。つまり、これは普段俺たちが見慣れているような平均値付近に分布のピークがあるようなデータじゃないんだ。この場合、平均で議論しても統計的には全く意味が無くなってしまうぞ。

 ちなみに、今回扱うような最初のデータが1番確率が高く、2番目以降は急激に値が低くなっていくようなものを『』と呼ぶ。今後頻出するので是非覚えておいて欲しい」

「『べき乗則』ね、分かったわ」



「と言う訳で、単純平均だと1作品当たり★20.46個付いているとケイコちゃんは言ったけど、これが集団を代表した値になっていないことは分かった?」

「……私が間違ってたわ。確かに、全く当てにならないわね。じゃぁ、この先はどうやって話を進めるの?」

「平均値以外の統計量が必要だ。中央値や最頻値なんかがいいだろう。データを小さい順に並べたとき中央にくる値のことで、例えば次のような5個のデータの場合――


『0 0 0 1 2』(平均値:0.6)


 ――中央値は真ん中の0だ。つまり、数字の塊を半分こする境目を表している」

「なるほど」

「最頻値は読んで字のごとく、最も頻繁に現れる値のことだ。上の例だとやはり0だな。さて、皆さんお待ちかねの星に関する統計を発表するぞ」


 ――――――――――――――――

 統計情報:おすすめレビュー(★)

 ――――――――――――――――

 最大値:★20,897

 最小値:★0

 中央値:★3

 最頻値:★0

(平均値:★20.46)

 ――――――――――――――――


「1人でも★3で評価してくれれば、全作品の上位半分以上になれるのね。かなり意外」

「85,068作品が★0という事実を見れば、そこまで驚くような結果ではないけどな。最後に、星の累積分布を見てみよう」


 ――――――――――――――――

 統計情報:★の数別累計作品数

 ――――――――――――――――

 ★0~★0:85,393作品 (39.61%)

 ★0~★1:93,383作品 (43.32%)

 ★0~★2:103,173作品 (47.86%)

 ★0~★3:129,312作品 (59.98%)

 ★0~★4:134,822作品 (62.54%)


  ……


 ★0~★26:193,414作品 (89.71%)

 ★0~★27:194,223作品 (90.09%)

 ★0~★28:194,893作品 (90.40%)


  ……


 ★0~★249:213,419作品 (98.99%)

 ★0~★250:213,426作品 (99.00%)

 ★0~★251:213,432作品 (99.00%)


  ……


 ★0~★18,109:215,588作品 (100.00%)

 ★0~★19,289:215,589作品 (100.00%)

 ★0~★20,897:215,590作品 (100.00%)

 ――――――――――――――――

 合計:215,590作品 (100.00%)

 ――――――――――――――――


「この表はどうやって読むの?」

「例えば、★0~★4の作品だけをカウントすると134,822作品になることを表している」

「なるほど。つまり、全作品の約90%は★26以下ってことなのね」

「そう言うことになるな。★250以上の作品が全体に占める割合は1%以下。ランキングで★1,000とか見慣れちゃってるかもしれないけど、全体で見れば滅茶苦茶レアケースだという事は分かって貰えただろうか」

「えぇ。逆に言うと、私達が思った以上に埋もれた作品が沢山あるってことだわ」

「誰かスコップしてあげてくれ」

「いやいや、そう言うタケル君が星を付けてあげればいいじゃない」

「もちろん面白いと思ったらちゃんと星は付けてるぞ」

「本当に? 履歴を確認すると、タケル君が星を最後に付けた日付と最後から2番目に付けた日付が相当開いてるようだけど?」

「ちょ、そんな情報開示するのやめてえええぇぇ!」



 ――――――――――――――――

 今日の研究ノートまとめ

 ――――――――――――――――

 ・1作品当たりの平均獲得おすすめレビュー数は★20.46だが、この数字にほとんど意味は無い

 ・★3で上位50%、★27で上位90%、★250で上位99%

 ・★が0の作品で面白いと思ったら、積極的に★をつけよう!

 ――――――――――――――――

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る