カクヨムユーザーの生態~111,402人分のデータを分析してみた

草薙 健(タケル)

研究ノート

閲覧する前に必ずお読みください

第1話 プロローグ(※必ずお読みください)

 ここは、『カクヨム総合研究所』。とある小説好きの富豪が設立した、私設研究所である。


「見える……見えるぞ! カクヨムユーザーの実態が……! パイソンPython (3.6.3)により強化された我が右腕が疼く……。カクヨムを……今こそ我が手中に!」


 厨二病全開で奇声を上げているのは、俺――研究所主任研究員マッドサイエンティスト草薙くさなぎタケルだ。この研究ノートを書いているのは二〇二〇年二月。俺のカクヨム歴は二〇一九年末からと、カクヨムユーザーとしてはまだまだひよっこである。


 つまり――


 PVが伸びない。コメントがつかない。星なんてつくわけもない。


 などという初心者が必ず通る道を、となりのトトロの主題歌『さんぽ』を口ずさみながら今現在歩んでいる真っ最中である。


「どう? データは集まった?」


 脳天気に俺に話しかけてきたのは、研究助手アシスタントで俺の幼馴染みであるとう景子けいこだ。彼女は根っからの小説好きだが、自分では小説を書いていない。所謂いわゆる『読み専』である。

 ちなみに、カクヨムユーザー歴は俺よりずっと長い。


「あぁ、なんとかね」

「おぉ! 流石タケル君。結局何人分のユーザーデータが集まったの?」

「十一万千四百二人――漢字だと読みにくいな。111,402人だ」

「ほわっ! 11万人!?」

研究所主任研究員マッドサイエンティストに、不可能の文字は無い!」


 そう。俺はどうやったら小説が読まれるのかを研究するべく、せっせとカクヨムユーザーのデータを集めていたのだ。


 え? そんなことより、『とにかく書きまくって小説の技術を磨け』だって? ほっといて。


『カクヨムユーザーはどんな生態をしているんだろう?』という、純粋な知的好奇心に負けたんだよ!


「そんな数のデータ、一体どうやって集めたの?」

「ふふふ……よくぞ聞いてくれた、我が助手よ。


『小説家になろう』みたいにWeb API(注1)が提供されていないカクヨムでは、プログラミングによって直接データを取得することが難しい。そこで、今回はWebスクレイピング(注2)という技術を利用してデータを取得した。


 ユーザーの探索方法は二つ。


 一つは小説の新着ページだ(https://kakuyomu.jp/recent_works?page=1)。ここから全小説を探索することが可能で、その作者を記録することでユーザーを抽出できる。もちろん、重複しないようにしているぞ。

 この集め方の欠点は、小説を書いているユーザーしか集められないことだ。


 もう一つは、ユーザーのプロフィールページから見ることが出来るフォロー・フォロワー関係だ(例:草薙 健(タケル)の場合:https://kakuyomu.jp/users/takerukusanagi/following_users?page=1)。

 この場合、ユーザー同士が繋がっている限り、小説を書いているか書いていないかに関わらず、ユーザーデータを集めることが可能だ。

 この集め方の欠点は、フォローされていないユーザーは拾えないことだ」

「なるほど。2つの欠点を相互に補ってるのね」

「その通りだ。データは2020年2月18日から21日にかけて収集したぞ。だから、現在の情報とは異なっている場合がある」

「はーい」

「また、あくまで個人的に集めたデータのため、公式発表の数字と異なる場合があるかもしれない。あくまで参考値として見て欲しい」

「了解しましたっ!」


 ケイコは、びしっと右手で敬礼した。


「それじゃぁ、分析結果を見ていこう」


 俺は、表紙に『カクヨムユーザーの生態~111,402人分のデータを分析してみた』と書かれた研究ノートのページを開いた。



 ――――――――――――――――


 <注意事項>

 本作は、『50の質問だって? よろしい、ならば戦争だ。』の『よろしい、ならば分析だ。(作者同士のネットワーク編)』の実質的な続編となっております。本作から読み始めても分かるように書いてますが、下記URLから読み始めることを推奨します。


https://kakuyomu.jp/works/1177354054893608096/episodes/1177354054894285897


 本作は、カクヨムの公式ホームページから個人的に集めたデータを元に執筆されています。データは2020年2月18日から21日にかけて収集しました。従って、現在の情報とは異なる場合があります。


 また、本作による直接的、間接的な損害について、筆者は一切の責任を負いかねます。あらかじめご了承ください。


 本作では図を使用することがあります。しかし、カクヨムは図をアップロードすることが出来ないため、Twitterを利用します。その都度URLは掲載しますが、よろしければ下記アカウントのフォローをよろしくお願いします。


 https://twitter.com/t_kusanagi


 登場人物

 ・草薙くさなぎタケル

  本作の語り部。永遠の中二病。


 ・とう景子けいこ

  本作の聞き手。タケルの幼馴染。


 それでは、分析結果をお楽しみください。



(注1)Web API:"Web Application Programming Interface" の略で、Webサービスをプログラミングによって操作するための手法。あらかじめ決められたエンコード方式で情報を取得できるため、統計情報を計算するときには大変便利。しかし、残念ながらカクヨムはWeb APIを提供していない。(参考:なろうデベロッパー https://dev.syosetu.com/)


(注2)Webスクレイピング:Web上のデータを自動的に集めるための手法。Web APIとは違い、Webブラウザと同様に直接ページデータを取得するため、Webブラウザから見られること以上のデータを取得することはほとんど不可能。

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る