カクヨムユーザーの生態~111,402人分のデータを分析してみた
草薙 健(タケル)
研究ノート
閲覧する前に必ずお読みください
第1話 プロローグ(※必ずお読みください)
ここは、『カクヨム総合研究所』。とある小説好きの富豪が設立した、私設研究所である。
「見える……見えるぞ! カクヨムユーザーの実態が……!
厨二病全開で奇声を上げているのは、俺――
つまり――
PVが伸びない。コメントがつかない。星なんてつくわけもない。
などという初心者が必ず通る道を、となりのトトロの主題歌『さんぽ』を口ずさみながら今現在歩んでいる真っ最中である。
「どう? データは集まった?」
脳天気に俺に話しかけてきたのは、
ちなみに、カクヨムユーザー歴は俺よりずっと長い。
「あぁ、なんとかね」
「おぉ! 流石タケル君。結局何人分のユーザーデータが集まったの?」
「十一万千四百二人――漢字だと読みにくいな。111,402人だ」
「ほわっ! 11万人!?」
「
そう。俺はどうやったら小説が読まれるのかを研究するべく、せっせとカクヨムユーザーのデータを集めていたのだ。
え? そんなことより、『とにかく書きまくって小説の技術を磨け』だって? ほっといて。
『カクヨムユーザーはどんな生態をしているんだろう?』という、純粋な知的好奇心に負けたんだよ!
「そんな数のデータ、一体どうやって集めたの?」
「ふふふ……よくぞ聞いてくれた、我が助手よ。
『小説家になろう』みたいにWeb API(注1)が提供されていないカクヨムでは、プログラミングによって直接データを取得することが難しい。そこで、今回はWebスクレイピング(注2)という技術を利用してデータを取得した。
ユーザーの探索方法は二つ。
一つは小説の新着ページだ(https://kakuyomu.jp/recent_works?page=1)。ここから全小説を探索することが可能で、その作者を記録することでユーザーを抽出できる。もちろん、重複しないようにしているぞ。
この集め方の欠点は、小説を書いているユーザーしか集められないことだ。
もう一つは、ユーザーのプロフィールページから見ることが出来るフォロー・フォロワー関係だ(例:草薙 健(タケル)の場合:https://kakuyomu.jp/users/takerukusanagi/following_users?page=1)。
この場合、ユーザー同士が繋がっている限り、小説を書いているか書いていないかに関わらず、ユーザーデータを集めることが可能だ。
この集め方の欠点は、フォローされていないユーザーは拾えないことだ」
「なるほど。2つの欠点を相互に補ってるのね」
「その通りだ。データは2020年2月18日から21日にかけて収集したぞ。だから、現在の情報とは異なっている場合がある」
「はーい」
「また、あくまで個人的に集めたデータのため、公式発表の数字と異なる場合があるかもしれない。あくまで参考値として見て欲しい」
「了解しましたっ!」
ケイコは、びしっと右手で敬礼した。
「それじゃぁ、分析結果を見ていこう」
俺は、表紙に『カクヨムユーザーの生態~111,402人分のデータを分析してみた』と書かれた研究ノートのページを開いた。
――――――――――――――――
<注意事項>
本作は、『50の質問だって? よろしい、ならば戦争だ。』の『よろしい、ならば分析だ。(作者同士のネットワーク編)』の実質的な続編となっております。本作から読み始めても分かるように書いてますが、下記URLから読み始めることを推奨します。
https://kakuyomu.jp/works/1177354054893608096/episodes/1177354054894285897
本作は、カクヨムの公式ホームページから個人的に集めたデータを元に執筆されています。データは2020年2月18日から21日にかけて収集しました。従って、現在の情報とは異なる場合があります。
また、本作による直接的、間接的な損害について、筆者は一切の責任を負いかねます。あらかじめご了承ください。
本作では図を使用することがあります。しかし、カクヨムは図をアップロードすることが出来ないため、Twitterを利用します。その都度URLは掲載しますが、よろしければ下記アカウントのフォローをよろしくお願いします。
https://twitter.com/t_kusanagi
登場人物
・
本作の語り部。永遠の中二病。
・
本作の聞き手。タケルの幼馴染。
それでは、分析結果をお楽しみください。
(注1)Web API:"Web Application Programming Interface" の略で、Webサービスをプログラミングによって操作するための手法。あらかじめ決められたエンコード方式で情報を取得できるため、統計情報を計算するときには大変便利。しかし、残念ながらカクヨムはWeb APIを提供していない。(参考:なろうデベロッパー https://dev.syosetu.com/)
(注2)Webスクレイピング:Web上のデータを自動的に集めるための手法。Web APIとは違い、Webブラウザと同様に直接ページデータを取得するため、Webブラウザから見られること以上のデータを取得することはほとんど不可能。
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます