ノート4.10 タグのクラスタリングによって、新しいジャンルの発見を試みる(その3)
(注意)本作のデータは全て2021年1月19日から20日にかけて取得されたものです。
――――――――――――――――
「ねぇ、タケル君。その木っぽい図は何?」
俺――
「デンドログラム――樹形図だ。クラスターの結果を分かりやすく示すために使われるぞ」
「ふーん。殿堂グラフって、なんだか偉そうね」
「デンドログラムな……。樹のような形の図だから樹形図。そのまんま。
前回の研究ノートにも載せただろ? 手書きだったけど」
「あぁー、あれは樹形図って言うのね。知らなかった。えーっと、前回の研究ノートはっと――」
――――――――――――――――
タグクラスタリング(クラスター数:12)
――――――――――――――――
┏ クラスター 12:1,047タグ(代表タグ『ほのぼの』)
┏┫
┏┫┗ クラスター 11:136タグ(代表タグ『ミステリー』)
┏┫┗ クラスター 5:119タグ(代表タグ『ホラー』)
┏┫┗クラスター 9:1,469タグ(代表タグ『歴史・時代・伝奇』)
┏┫┗ クラスター 6:78タグ(代表タグ『けものフレンズ』)
┏┫┗ クラスター 4:2,64タグ(代表タグ『SF』)
┃┃ ┏ クラスター 2:792タグ(代表タグ『短編』)
┃┃┏┫
┏┫┗┫┗ クラスター 10:223タグ(※)
┫┃ ┗ クラスター 7:1,793タグ(代表タグ『現代ドラマ』)
┃┗ クラスター 3:822タグ(代表タグ『恋愛』)
┃┏ クラスター 1:1,152タグ(代表タグ『残酷描写有り』)
┗┫
┗ クラスター 8:387タグ(代表タグ『異世界ファンタジー』)
――――――――――――――――
(※)代表タグ『エッセイ・ノンフィクション』)
グラフ情報:
https://pbs.twimg.com/media/Et8y-5XVgAEdtM4?format=jpg&name=large
(ツイート本体:https://twitter.com/t_kusanagi/status/1359862157723066368)
――――――――――――――――
「そうそう。クラスター数 12 のところで、まさかの『ほのぼの』タグが出てきたのよね」
「その通りだ。今日は、いよいよその辺を掘り下げて調べていくぞ」
「すっごく楽しみ」
「ここからは、各クラスター毎に詳しく展開していく。まずは、1 番気になるクラスターである 12 から見ていこう」
「『ほのぼの』の他にはどんなタグが出てくるのかしら?」
「まずは最初の分岐だ」
――――――――――――――――
タグクラスタリング
対象:クラスター 12
――――――――――――――――
┏ クラスター 12-1:965タグ(代表タグ『ほのぼの』)
(12)┫
┗ クラスター 12-2:82タグ(代表タグ『二次創作』)
――――――――――――――――
「あらら? 『二次創作』? 意外なものが飛び出してきた」
「俺はそんなことないと思ったけどね。カクヨムには主要 12 ジャンルの他に、二次創作可能な作品が 32 種類もある。このクラスター 12 に主要ジャンルキーワードが含まれていないのはすでに分かってるから、『けものフレンズ』以外の二次創作が現れたのは自然だと思うぞ」
「なるほど。って言うか、『けものフレンズ』が特殊すぎたのかな」
「そう言うことだね」
「では、クラスター 12 をもう 1 つ分岐させてみよう。なお、ここからはクラスター 12-1 の結果だけに注目することにするぞ」
「『日常系』とか出てきたら、このクラスターの性質は決まったも同然ね」
――――――――――――――――
タグクラスタリング
対象:クラスター 12
――――――――――――――――
┏ クラスター 12-1:782タグ(代表タグ『ほのぼの』)
┏┫
(12)┫┗ クラスター 12-3:183タグ(代表タグ『いじめ』)
┗ クラスター 12-2:82タグ(代表タグ『二次創作』)
――――――――――――――――
「え……嘘でしょ……」
「俺も最初はカテゴリーエラーかと思ったが、クラスター 12-3 を詳しく調べていくと『裁判』、『被害者』、『パワハラ』、『ニート』、『犯罪』と言った社会問題を表すようなタグが多数含まれていた。
従って、このクラスターは『社会問題』がテーマだと思われる」
「うーん、『現代ドラマ』や『エッセイ・ノンフィクション』で扱われそうな内容な気がするけど、タグの分類としては独立してるってことなのか」
「むしろ、その 2 つに分散してしまっていることが独立したクラスターだと判定された原因かもしれないね」
「さぁ、どんどん分岐させよう。次はどんなタグが出てくるのか?」
――――――――――――――――
タグクラスタリング
対象:クラスター 12
――――――――――――――――
┏ クラスター 12-4:404タグ(代表タグ『あやかし』)
┏┫
┏┫┗ クラスター 12-1:378タグ(代表タグ『ほのぼの』)
(12)┫┗ クラスター 12-3:183タグ(代表タグ『いじめ』)
┗ クラスター 12-2:82タグ(代表タグ『二次創作』)
――――――――――――――――
「『あやかし』! 私の好きなものが出てきて嬉しいなー。タケル君は『夏目友人帳』って知ってる?」
「うん。アニメで何シリーズもあったから最初は見るのをためらったんだが、結局あれよあれよと全部見てしまった。
『あやかし』は商業作品でも一大勢力を築いているため、どんな雰囲気かはご存じの方も多いだろう。ややシリアス寄りの『化物語』や『蟲師』、他にも『このはな綺譚』や『妖怪アパートの幽雅な日常』、『ゆらぎ荘の幽奈さん』、『いなり、こんこん、恋いろは。』――」
「はいはい。そこまでにしようね、タケル君。って言うか、全部マンガやアニメじゃない! ここはカクヨムよ? 例を挙げるなら小説にしなさいよね」
「『化物語』は小説だと思うんだが……まぁいっか。
『ホラー』と言うには雰囲気が明るく、謎解き要素があったとしても超常現象が関わっていれば『ミステリー』からはそっぽを向かれる。カクヨムの『現代ファンタジー』はバトルものが中心で『あやかし』の入り込む余地は少ない。明らかに『現代ドラマ』ではないし、『詩・童話・その他』にぶち込むのはあまりに切ない。
このクラスターからはそんな声が聞こえてくるようだ」
「確かに、よくよく考えるとどのカテゴリーにするか難しい内容ね」
「さて、そろそろ結論を述べたいので、このクラスター 12-4 がこの先どんな分岐をするのか一気に見て欲しい」
――――――――――――――――
タグクラスタリング
対象:クラスター 12
――――――――――――――――
┏ クラスター 12-5:285タグ(代表タグ『幻想』)
┏┫
┏┫┗ クラスター 12-6:285タグ(代表タグ『巫女』)
┃┗ クラスター 12-4:119タグ(代表タグ『あやかし』)
┏┫┏ クラスター 12-7:285タグ(代表タグ『友情』)
┃┗┫
┏┫ ┗ クラスター 12-1:93タグ(代表タグ『ほのぼの』)
(12)┫┗ クラスター 12-3:183タグ(代表タグ『いじめ』)
┗ クラスター 12-2:82タグ(代表タグ『二次創作』)
――――――――――――――――
「『幻想』、『巫女』、そして『あやかし』――ファンタジーなんだけどどこか和風の幽霊や妖怪を想起させる。そんなタグがちゃんと集まってるのね」
「その通りだ。
一方の『ほのぼの』だが、なんと『日常系』というタグがしっかり含まれているんだ! その他には『幼児』や『グルメ』と言ったものが並び、まさに『のんのんびより』を彷彿とさせるクラスターを形成している」
「のんのんびより? 何それ」
「日本の田舎は――いいところだ」
「目を細めながらそんな説明されても全く分からないわ……」
「小学校 1 年生から中学校 3 年生の 5 人しかいないとある田舎の分校を舞台にした日常系さ。まさに『ほのぼの』がピッタリの作品だよ」
「へぇ、そうなんだ」
「結論だ。俺はこのクラスタリングの結果から、カクヨムには『ほのぼの・あやかし』と言う大分類が存在すると確信した」
「それには私も同意。ぜひ『あやかし』のカテゴリー独立運動を!」
「さて、次に主要なジャンルキーワードがどこに現れるのかを見ておこう」
「まだ出てきてないのって何だっけ?」
「『現代ファンタジー』、『ラブコメ』、『創作論・評論』、そして『詩・童話・その他』だ」
「ふむ、どれもあの辺にありそうと予想出来るものばかりね」
「そうだな。一応ちゃんと確認しておきたいので、付き合ってくれ」
「分かったわ」
「まずは『現代ファンタジー』だ」
――――――――――――――――
タグクラスタリング
対象:クラスター 1 と 8
――――――――――――――――
┏ クラスター 1-1:881タグ(代表タグ『残酷描写有り』)
┏┫
┫┗ クラスター 1-2:183タグ(代表タグ『現代ファンタジー』)
┗ クラスター 8:387タグ(代表タグ『異世界ファンタジー』)
――――――――――――――――
「ここしかないわね」
「そうだな。これはみんな納得だろう。
ちなみに、『現代ファンタジー』は『VRMMO』、『巨大ロボット』、『戦争』や『シェアワールド』といった様々なクラスターに早々と分かれていくのに対し、『異世界ファンタジー』はなかなかサブカテゴリーが現れないことが分かった」
「それが意味するのはどういうこと?」
「つまり、『異世界ファンタジー』のクラスターに含まれるタグはどれも近い距離にあって、差違があまり無いことを示唆している。よくテンプレって言われるけど、ジャンルそのものがテンプレ化していることを傍証する結果だと思う」
「でも、そこに人気が集まってるのよね。なんだか不思議だわー」
「逆に言えば、それだけ単純化されてて分かりやすいってことだと思うよ」
「そう言う見方もあるのか」
「次はクラスター 3 を見ていくんだが、個人的に見せたいものがあるのでちょっとだけ深掘りするぞ」
「ん? 何か面白いものが見られるのかしら」
――――――――――――――――
タグクラスタリング
対象:クラスター 3
――――――――――――――――
┏ クラスター 3-5:181タグ(代表タグ『ボーイズラブ』)
┏┫
┏┫┗ クラスター 3-6:22タグ(代表タグ『百合』)
┏┫┗ クラスター 3-1:177タグ(代表タグ『恋愛』)
┃┗ クラスター 3-3:102タグ(代表タグ『ハッピーエンド』)
(3) ┫ ┏ クラスター 3-4:156タグ(代表タグ『女子高生』)
┗┫
┗ クラスター 3-2:184タグ(代表タグ『ラブコメ』)
――――――――――――――――
「おおおお、『百合』と『BL』が分かれてる!」
「そうなんだよ。女の子同士の恋愛を指す『百合』と、文字通り男の子同士の恋愛である『ボーイズラブ』が、しっかりくっきり早い段階で分かれましたとさ。ここ、重要なポイントね。
『マリア様が見てる』だなー、懐かしい。ごきげんよう、お姉様」
「うーん、世代がばれるチョイス。今なら『やがて君になる』や『抱かれたい男1位に脅されています。』よ」
「あれ、折角小説を例に挙げたのに……」
「あ、そうだった」
「『ラブコメ』の方はと言うと、『女子高生』が早々とクラスター化を果たした。ちなみにこの中には『妹』、『メイド』、『レンタル奥様』、『
「あれ? 私みたいな『幼馴染み』は出てこないの?」
「『幼馴染み』は『女子高生』とは相容れないらしい。クラスター 3-2 の方に含まれており、早い段階で枝分かれして 1 つの勢力を築くぞ」
「じゃぁ、私はタケル君にとって特別ねっ」
「ちょ、恥ずかしいことを臆面も無く言わないでよ」
「ふふふ」
「最後は、クラスター 2 と 10 を分岐させよう」
――――――――――――――――
タグクラスタリング
対象:クラスター 2 と10
――――――――――――――――
┏ クラスター 2-1:422タグ(代表タグ『短編』)
┏┫
┃┗ クラスター 2-2:147タグ(代表タグ『詩・童話・その他』)
┫┏ クラスター 10-1:151タグ(代表タグ『エッセイ・ノンフィクション』)
┗┫
┗ クラスター 10-2:72タグ(代表タグ『創作論・評論』)
――――――――――――――――
「『短編』と『詩・童話・その他』が一緒だったのか。なるほどなるほど。確かに、詩は短編以上に短いことが多いからなー」
「『エッセイ・ノンフィクション』と『創作論・評論』が分かれるのも、まぁそうだよねという結果だな。ちなみに、前者のクラスターには『うつ病』や『発達障害』、後者には『映画』や『カクヨム』といったタグが含まれていた」
「ちゃんと評論してる人達がいらっしゃるのね。後で探しに行こーっと」
「この結果を見て、ケイコちゃんはどう思った?」
「信じられないほどきっちり分類出来てて、本当に驚いたわ。クラスタリング、お見それしました」
「分析を行った俺自身がビックリしてるよ。カクヨムの真実をまた 1 つ炙り出せてとても満足してる。
なお、今回はクラスタリングの手法として階層型クラスタリング、タグ同士の近さを測る指標としてユークリッド距離を用いたが、別の手法――例えば非階層型クラスタリング等を使えばまた違った結果が得られるだろう。
その辺は、また別の場面で紹介出来ればと思う」
「他にクラスタリングする題材なんてあったっけ?」
「もちろんあるぞ」
「何?」
「それは小説だ」
「あっ、分かったわ! 今度は似たような小説をクラスタリングするって事ね!」
「ご名答。つまり、レコメンデーション――小説推薦が実装出来るってことだ。ある人が何かの小説を読んだとき、同じクラスターに属する別の小説が好きかも知れない。こんなことがデータから言えればスマートだと思わない?」
「面白そう! で、そのデータはどこ? 早くみせてよー」
「え、えーっと、今はここには無いかなー」
「ちょっと、タケル君。なんで声が裏返ってるの?」
「いや、き、気のせいだよ。俺は普通だ。元気いっぱい」
「あーっ、もしかしてまだ何も出来てないんでしょ!?」
「……はい」
「もう、だったら最初から素直にそう言えばいいのに」
「と言うことで、大変申し訳ないけど気長に待って貰えると有り難い」
「『読み手』の皆さん、タケル君もこう言ってるし、私と一緒にちょっと待とうね。約束だから、ね?」
――――――――――――――――
今日の研究ノートまとめ
――――――――――――――――
・階層型クラスタリングによるジャンル分けを行った
・その結果、『異世界ファンタジー』や『恋愛』という従来のジャンルに加えて、『けものフレンズ』や『ほのぼの・あやかし』といった大分類が存在することを明らかにした
・『恋愛』クラスター内では、早々にBL、百合、その他が別々のクラスターに分かれ、クラスタリングがかなり有効に機能しているとが伺える
――――――――――――――――
参考:クラスター数 40 のデンドログラム
https://pbs.twimg.com/media/EuCA8yEVgAcdEn5?format=jpg&name=large
(ツイート本体:https://twitter.com/t_kusanagi/status/1360229304924184579)
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます