データの見方(ランキングなど)について

 本作品におけるデータの見方について説明します。2020年12月29日時点で、以下のように表示されています。

――――――――――――――――――――――――――――――――――――――

123位, Not verified(公式: 全期間456位, 週間ランキング表示エラー)朝読小説賞応募作品

カクヨム著者太郎「ここのタイトルが長くて何が悪い!? 俺は異世界に転生して自由気ままに小説を書くんだいっ」

https://kakuyomu.jp/works/1234567890123456789

異世界ファンタジー/123話(連載中)/99,999(813.00±12.34)文字

2020-12-01 12:00:00: ☆12.00 (0~0) 係数: 2.34, ♡5, 6コメント

2021-01-05 02:34:56: ☆123 (+111.00), ♡45 (+40), 67コメント (+61), 8,910pv, 12フォロワー

備考: 説明文に朝読小説賞キャッチが書かれていない可能性があります。もしくはフォーマットが不明瞭です。

――――――――――――――――――――――――――――――――――――――


 1行目:『123位』


 本作品のランキング(例では123位)は、公式が提供しているランキングとは。本作品では、2020年12月1日からデータ取得日(2021-01-05 03:00:00)における☆の増分で降順ソートしています。すなわち、例においては+111.00と書かれている部分を基準に並べ替えています。

 なお、☆の推定値が日によって多少変動することがあり、それが原因でランキングがひっくり返ることが起こりえます。これは仕様ですのでご了承下さい。タイの場合は、後で説明する公式の全期間ランキングを用いて順位を決定しています。


 1行目:『Not verified』


 Not verifiedは、その作品がコンテストの応募基準を満たしていないときに表示されます。第6回カクヨムWeb小説コンテストの場合は10万文字より低いとき、カクヨムWeb小説短編賞2020の場合は1万文字より大きい、または、小説のステータスが連載中になっている場合に相当します。

 基準を満たしている場合はVerifiedとなり、その隣にNot verifiedな小説を除いた本作品基準によるランキングが表示されます。


 1行目:『公式: 全期間456位, 週間ランキング表示エラー』


 公式の全期間ランキングは、以下のページからアクセスできるページから順位を取得しています。


<カクコン006・異世界ファンタジー部門>

https://kakuyomu.jp/search?contest_path_segment=kakuyomu_web_novel_006&contest_category_number=1&order=popular

<カクコン006・現代ファンタジー部門>

https://kakuyomu.jp/search?contest_path_segment=kakuyomu_web_novel_006&contest_category_number=2&order=popular

<カクコン006・恋愛部門>

https://kakuyomu.jp/search?contest_path_segment=kakuyomu_web_novel_006&contest_category_number=3&order=popular

<カクコン006・ラブコメ部門>

https://kakuyomu.jp/search?contest_path_segment=kakuyomu_web_novel_006&contest_category_number=4&order=popular

<カクコン006・キャラクター文芸部門>

https://kakuyomu.jp/search?contest_path_segment=kakuyomu_web_novel_006&contest_category_number=5&order=popular

<カクコン006・どんでん返し部門>

https://kakuyomu.jp/search?contest_path_segment=kakuyomu_web_novel_006&contest_category_number=6&order=popular

<カクヨムWeb小説短編賞2020>

https://kakuyomu.jp/search?contest_path_segment=kakuyomu_web_short_2020&order=popular


「第6回カクヨムWeb小説コンテストトップページ」→「部門の週間ランキングを表示させる」→「複数の条件で絞り込む」→「人気順」でアクセスできるページです。余談ですが、小説のデータを集める際はこのページから取得しています。


 週間ランキングは、皆さんが一番気に掛けているであろう以下のページから取得しています。


https://kakuyomu.jp/contests/kakuyomu_web_novel_006

https://kakuyomu.jp/contests/kakuyomu_web_short_2020


 なお、たまに例のような『週間ランキング表示エラー』と表示されることがありますが、これは。実は、たまに100の倍数(稀に100の倍数-1も)のデータが欠落していることがあるんです。恐らくシステムのバグだと思います。データベースが正常なクエリが返せてない可能性が高いです。

 皆さんも暇なときにランキングのページをめくって、この様な現象が起こるかどうか確かめてみて下さい。


 データを集め始めた当初は週間ランキングのページからデータを取得していたのですが、上のような現象が発生することに気がついて、全期間ランキングに変更したという経緯があります。


 1行目:『朝読小説賞応募作品』


 作品のタグに『朝読小説賞』が含まれている場合に表示されます。朝読小説賞に応募したつもりなのにこれが表示されていない場合は、タグの表記が間違っています。変なスペースとか、誤字はありませんか? すぐに修正しましょう。


 2行目~3行目は著者、タイトル、小説へのURLです。


 4行目:『異世界ファンタジー/123話(連載中)/99,999(813.00±12.34)文字』


 ジャンル、話数、連載中 or 完結済、文字数です。文字数は『小説全体の文字数(1エピソードの平均文字数±標準偏差)』となっております。標準偏差はデータのばらつきを表す統計量で、大きければ大きいほどばらつきが大きいことを示しています。読みやすさの指標になるかなと思って表示しています。


 5行目:『2020-12-01 12:00:00: ☆12.00 (0~0) 係数: 2.34, ♡5, 6コメント』


 2020年12月1日より前に投稿された作品は、上記のように表示されます。また、2020年12月1日以降に投稿された作品は、公開日時が表示されます。

 後ろに続くデータは、『☆の推定について』で説明した方法によって計算した、2020年12月1日における☆の推定値、☆の範囲、係数です。♡とコメントは、12月1日より前に付けられたものをカウントしたものです。


 6行目:『2021-01-05 03:00:00: ☆123 (+111.00), ♡45 (+40), 67コメント (+61), 8,910pv, 12フォロワー』


 データを取得した時点における☆、♡、コメント、pv数、フォロワー数です。☆、♡およびコメントの後ろに書いてあるのは、2020年12月1日からの増分です。pvやフォロワー数も前日比なら出せるんですが、表示がややこしくなるかなと思って出していません。

 なお、『新たに何人のユーザーが小説をフォローして、何人のユーザーがフォローをか』なんていう恐ろしいデータもありますが、皆さん見たいですか? 実は☆や♡のマイナスもちゃっかりカウントしてます。生々しいですよ、ほんと。


 7行目:『備考: 説明文に朝読小説賞キャッチが書かれていない可能性があります。もしくはフォーマットが不明瞭です。』


 これは、『朝読小説賞』のタグがついた小説にだけ表示される可能性があります。応募要項によると、朝読小説賞に応募するためには紹介文に以下のようなフォーマットで情報を記載する必要があります。

――――――――――――――――――――――――――――――――――――――

記入例

主人公: ●●歳、朝読小説賞キャッチ: ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●


キャッチは、投稿時につけるキャッチと同じものでも可。


上記の●部分に対応する情報を入れてください。

https://kakuyomu.jp/contests/kakuyomu_web_novel_006/detailより引用)

――――――――――――――――――――――――――――――――――――――

 最初、愚直にこのフォーマットになっているか検出しようとしたら、無視している作品が出るわ出るわ……。皆さん、募集要項はちゃんと読んだ方がいいと思うんです。

 まぁ、お節介でやっているのに愚痴を言ってもしょうがないので、私のアルゴリズムでは正規表現で次のようなフォーマットを満たしているとき、朝読小説賞用の情報がちゃんと記載されていると判定することにしました。


 "主人公(.|\s)+キャッチ"


 プログラムの正規表現をここで説明することはしません。興味がある人は自分で調べて下さい。

 簡単に言うと、『主人公』と『キャッチ』というキーワードが最低限紹介文に入っているかどうかを調べています。従って、『主人公○○歳、●●●――』しか書いていない作品は、備考が表示されます。

 備考が表示されている人は、上のフォーマットに従うのが安全と思われるので是非書き直して下さい。


 なお、短編賞で『朝読小説賞』のタグが入っている場合は、『備考: 短編賞から朝読小説賞へ応募することはできません(タグに「朝読小説賞」が含まれています)。』が表示されます。



 長くなりましたが説明は以上です。何か分からないこと、こんなことは出来ないか? などの要望があれば、遠慮無くコメントを下さい。よろしくお願いします。

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る