ノート1.13 215,590作品って、どんなタグとセルフレイティングがついてるの?
(注意)本作のデータは全て2021年1月19日から20日にかけて取得されたものです。
――――――――――――――――
「タケル君、もしかして新しいセーター買った?」
俺――
「お、よく分かったな。気がつかないかと思ったよ」
「失礼ね。こう見えても私は女の子よ? オシャレには敏感なんだから」
そう言いながらケイコちゃんは俺の周りを歩き回って、俺の体を隅から隅まで観察した。
「まぁ、30点ってところね」
「厳しいっ!」
「そんなことないし。以前よりも倍増だわ」
「それって、元々は15点しかなかったってことだよね……」
「正確には15点未満かしら――って言うかタケル君、商品タグが付きっぱなしよ?」
「あ、ほんとだ」
ケイコちゃんが指差した方を見ると、セーターの裾付近からタグがぶらーんと垂れ下がっていた。
タグの存在を完全に忘れてた。寒いから早く着替えようとしたせいだな。さて、こいつを一体どうしようか――と俺が思案している間に、ケイコちゃんはすでにハサミを手に持っていた。
「だらしないわねぇ。私が取ってあげるから、じっとしててね」
「分かった」
「『脱いだ』って言って」
「え?」
「服を着たままボタン縫ったり繕ったりするときにするおまじないよ。べ、別にやましい意味なんかないんだからね?」
「分かってるよ。『脱いだ』」
そう言うと、ケイコちゃんはタグの紐をハサミで切った。
「はい。取れたわ」
「ありがとう」
「これ、ICタグなのね。世の中進歩してるなー」
「最近の世の中はタグだらけだ。今、俺が解析してるカクヨムのサイトもHTMLタグというもので書かれている。タグによってどこにどんな情報が書いてあるかが分かるからこそ、データを効率良く収集出来るんだ。タグ様々だな」
「そう言えば、カクヨムの小説にもタグがあるわね」
「そうだな。『書き手』が作品に対して最大8個のタグを任意に付けることが出来る。これは小説検索のキーワードにもなるので、地味ながら割と重要だったりする」
「普段あんまり意識しないけど、確かに検索結果にはタイトルやジャンルと共にタグが表示されてるもんね」
「トップページなどに表示されないので優先度は下がるが、それでも小説のイメージを得られる情報には違いない」
「カクヨムにはどんなタグがあるのかしら?」
「じゃぁ、今日はそのデータを見ていくことにしよう。
今回のデータなんだが、タグと同様の働きをしている『セルフレイティング』もタグの1種として扱うことにするよ」
「えーっと、『読み手』に注意喚起するための機能だっけ?」
「その通りだ。セルフレイティングは『残酷描写有り』、『暴力描写有り』、『性描写有り』の3種類あり、タグとは独立に設定可能だ。過激な表現が苦手な『読み手』が不快な思いをしないように、あらかじめ『この小説は○○な表現が含まれてますよ』と情報を伝えることが出来る。
なお、カクヨムのヘルプによると、レイティング設定の基準はR15相当らしい」
「なるほどね。私は残酷な描写が好きじゃないから、表示してくれるととても助かるわ」
「と言うことで、まずはタグとセルフレイティングが付いている作品数とその種類を見てみよう」
――――――――――――――――
統計情報:タグとセルフレイティング(2021年1月20日)
――――――――――――――――
タグもしくはセルフレイティングが付いている作品:181,583作品
種類:114,413種類 + セルフレイティング3種類
延べ数:1,004,955タグ
――――――――――――――――
「自由に設定できるからあんまり付いてないのかと思ったけど、私の想像と逆だったわ」
「実に84.23%の作品に、何らかのタグもしくはセルフレイティングが付いているという現状が分かった。その種類は11万以上! 任意だから当たり前と言えば当たり前なんだけど、みんな好き放題に付けているな」
「そう言うこの作品だって、相当自由に付けてるじゃない。何かの詐欺広告かと思うくらい怪しい文言が並んでるわよ?」
「いやはや、これは手厳しい」
「次は、あるタグがどれくらいの作品に表れているのかを統計的に見てみよう」
「これにはセルフレイティングは入ってるの?」
「セルフレイティング込みのデータだ。結果はこうなった――」
――――――――――――――――
統計情報:タグとセルフレイティングの統計量
――――――――――――――――
最大値:41,719作品
最小値:1作品
中央値:1作品
最頻値:1作品
(平均値:8.78作品)
――――――――――――――――
「おぉ、たった1つのタグが4万作品に付いてるってことね」
「うん。どのタグが1位かは後で見てみることにしよう」
「中央値も最頻値も 1 ってことは、大半が出現回数 1 回のタグって認識でいいのかしら」
「その通りだ。そして、タグの出現頻度は『べき乗則』になっている」
「え、忘れた頃にやって来るのか……」
――――――――――――――――
統計情報:タグとセルフレイティングの出現回数別頻度分布(出現率, 累計)
――――――――――――――――
1作品:84,766種類 (74.09%, 74.09%)
2作品:11,133種類 (9.73%, 83.82%)
3作品:4,615種類 (4.03%, 87.85%)
4作品:2,656種類 (2.32%, 90.17%)
5作品:1,652種類 (1.44%, 91.61%)
6作品:1,208種類 (1.06%, 92.67%)
7作品:953種類 (0.83%, 93.50%)
8作品:690種類 (0.60%, 94.11%)
9作品:556種類 (0.49%, 94.59%)
10作品:431種類 (0.38%, 94.97%)
……
29,919作品:1種類 (0.00%, 100.00%)
37,154作品:1種類 (0.00%, 100.00%)
41,719作品:1種類 (0.00%, 100.00%)
――――――――――――――――
合計:114,416種類 (100.00%)
――――――――――――――――
「なんか今までで1番極端な気がするわ」
「ははっ、そうかもしれないな。まぁ、『書き手』が自由に選べるって言うのが要因だろう。これは個人的な意見で根拠はないけど、自由意志に任せるとより強く『べき乗則』が現れる傾向にある気がするね」
「ほんと、不思議よね~」
「最後は皆さんにとって1番興味があるであろう、タグの出現頻度ランキングだ」
「待ってました!」
「あるタグがたくさんの作品に現れると言うことは、良い言い方をすれば人気が高く普遍性があり、うがった言い方をするとテンプレを表していると言うことになる」
「ものは言い様ね」
「俺は別にテンプレは悪いことだとは思わないけどね。
さて、今日はちょっと趣向を変えて、まずは30位から20位までを見てみよう」
「お、上位を後に持ってくるのか。引っ張るねー、タケル君」
「ワクワク感を演出してると言って欲しいな!」
――――――――――――――――
統計情報:タグとセルフレイティング出現頻度順位
21位~30位(出現率, 累計)
――――――――――――――――
30位:4,084作品 (0.41%, 66.85%) ほのぼの
29位:4,121作品 (0.41%, 67.26%) 詩
28位:4,235作品 (0.42%, 67.68%) 異世界転生
27位:4,330作品 (0.43%, 68.11%) 百合
26位:4,538作品 (0.45%, 68.56%) 純文学
25位:4,627作品 (0.46%, 69.02%) シリアス
24位:4,759作品 (0.47%, 69.50%) バトル
23位:4,867作品 (0.48%, 69.98%) 女主人公
22位:5,010作品 (0.50%, 70.48%) 男主人公
21位:5,069作品 (0.50%, 70.98%) ホラー
――――――――――――――――
「このランキングには、詩や異世界転生、純文学と言ったジャンル分けに使用されるものや、ほのぼの、シリアス、ホラーと言った雰囲気を表すものが主に入っている」
「私は27位の百合が気になるわね。最近流行ってるからなー。後、女主人公と男主人公がほぼ同数で並んでるのは偶然かしら?」
「なかなか面白い結果だな。カクヨムの『書き手』が男主人公も女主人公も偏りなく描いており、幅広い読者層を取り込めることを示してるんじゃないだろうか」
「次は20位から11位だ」
「今度はどんな感じかな?」
――――――――――――――――
統計情報:タグとセルフレイティング出現頻度順位
11位~20位(出現率, 累計)
――――――――――――――――
20位:5,593作品 (0.56%, 71.54%) SF
19位:5,817作品 (0.58%, 72.12%) 現代
18位:5,861作品 (0.58%, 72.70%) 万人向け
17位:6,055作品 (0.60%, 73.30%) コメディ
16位:6,123作品 (0.61%, 73.91%) ショートショート
15位:6,681作品 (0.66%, 74.58%) 高校生
14位:7,527作品 (0.75%, 75.33%) 日常
13位:7,841作品 (0.78%, 76.11%) ラブコメ
12位:9,369作品 (0.93%, 77.04%) 青春
11位:10,086作品 (1.00%, 78.04%) 異世界
――――――――――――――――
「この辺になってくると、ほぼジャンル分けを意味するタグばかりだ」
「でも、ラブコメとかSFってジャンルにもあるわよね。なんでわざわざタグに入ってるのかしら?」
「ジャンルは異世界ファンタジーにしたけどラブコメ要素も入ってる、と言うパターンだろう。逆に、ジャンルはSFで舞台は地球じゃないどこか――つまり異世界ということもあり得る」
「ふむ、『書き手』の人は結構欲張りなのかもしれないわね」
「そりゃね。はっきり言って、読んで貰うためならタブーでもなんでもやっちゃうのが『書き手』という人種だよ?」
「マジでか」
「そして、このランキングももう1つの特徴は、高校生、日常、ラブコメ、青春の塊だろう。やはり、高校生を主人公にした日常青春ラブコメが人気であることを示しているな」
「一言に凝縮しちゃった……」
「さぁ、いよいよ大トリだ。一体何が飛び出してくるのか?」
「きっとカクヨムの今を表すタグのはずよ!」
――――――――――――――――
統計情報:タグとセルフレイティング出現頻度順位
1位~10位(出現率, 累計)
――――――――――――――――
10位:10,198作品 (1.01%, 79.06%) 魔法
9位:12,937作品 (1.29%, 80.35%) ファンタジー
8位:13,015作品 (1.30%, 81.64%) 学園
7位:13,327作品 (1.33%, 82.97%) ライトノベル
6位:20,071作品 (2.00%, 84.96%) カクヨムオンリー
5位:20,992作品 (2.09%, 87.05%) 性描写有り
4位:21,319作品 (2.12%, 89.17%) 恋愛
3位:29,919作品 (2.98%, 92.15%) 短編
2位:37,154作品 (3.70%, 95.85%) 暴力描写有り
1位:41,719作品 (4.15%, 100.00%) 残酷描写有り
――――――――――――――――
「1位と2位がセルフレイティングだったと言うことで、タグの中で実質1位は『短編』という結果になったぞ」
「タケル君は『カクヨムには短編が多い』とデータを見せながら言い続けてたけど、『書き手』の皆さんが自ら証明してくれたわね」
「そう言うことだ。ちなみに『中編』というタグは386作品で281位タイ、『長編』タグは1,299作品で83位だった」
「中編を自らアピールする作品は少ないのか。確かに、あんまり見かけたこと無いもんなー」
「そして、タグの実質2位は恋愛! これはもう言うまでもないな。普遍的なテーマだし納得だ」
「えぇ。これ無しの小説なんて私は考えられないわ。甘くて切ない恋。はぁ、私も燃え上がるような恋がしてみたい!」
「突然乙女モードに入ったな……」
「タケル君、そんなこと言ったら女の子に嫌われるよ?」
「ご、ごめん」
「話を戻しましょ。魔法とファンタジーは異世界ファンジーの興隆を物語ってるわね」
「もうちょっと上かなと思ったけど、さらに大分類のライトノベルやカクヨムオンリーには勝てなかったようだ」
「これがカクヨムの『今』なのね」
「そうだな。何が人気なのか、どんなものを『書き手』が書いているのかがよく分かるデータだったと思う」
「ところでタケル君、31位以降のデータはどうなってるの?」
「もちろん手元に持っているが、今回は紙面の都合で全部を紹介することは出来なかった。どこかの機会にランキングを掲載できればと思っている。
だが、この話には続きがあるんだ」
「お、統計の応用編ね」
「いや、そうじゃない」
「え? どのタグが統計的に見て★が集まってるとか、そう言う話はしないの?」
「もちろんそれも行いたいが、俺が語りたいのはそっちじゃない――機械学習編に続く!」
「えぇ、そっちに飛んじゃうの!? 一体何が始まるのかしら!!」
――――――――――――――――
今日の研究ノートまとめ
――――――――――――――――
・タグとセルフレイティングについて調査した結果、8割以上の作品に何らかのタグが付いていることが判明
・出現頻度上位のタグは大分類が多い
・タグにはカクヨムの今が反映されている
――――――――――――――――
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます