• 二次創作
  • 現代ファンタジー

涼宮ハルヒのテキストマイニング

涼宮ハルヒシリーズは第9巻「分裂」までと「秘話」を合わせて、約117万字ほどある。
解析対象としては少ないが、「憂鬱」「溜息」「消失」の三つの長編について、KH Corderを使用してみた。
ここでは共起ネットワークだけを扱う。

共起ネットワーク図とは雑駁に言うと
「ある一定領域に高頻度で出現する語句の関連性を画像として表示したもの」

・ファイル設定
重要な語は強制抽出語とする。
涼宮
ハルヒ
キョン
古泉
朝比奈
長門

・出力設定
共起ネットワーク
最小出現数60
描画数60
強い共起関係ほど太い線
出現数の多い語ほど大きい円、フォントも大きく
最小スパニング協調
ラベルが重ならないように調整

・結果
「憂鬱」
ひときわ大きい単語「ハルヒ」には「思う」「言う」「目」「前」「朝比奈」「顔」といった単語が高い頻度で現れる。これは物語が一人称(キョン)視点であることに起因するのだろう。
キャラクターの中では「ハルヒ」「朝比奈」だけが直接リンクしており、「長門」はその次、「古泉」にいたっては、長門より低い頻度である。ちなみに「朝倉」は「教室」だけとリンクしていた。原作では教室の外へ出ていない。彼女は教室の中だけの存在なのだ。

では「涼宮」はどうか。
「凉宮」と強く結びついている単語は……「世界」

「世界」近傍には「思う」「宇宙」「知る」「人間」「出来る」「今」が高頻度で出現する。
「憂鬱」はつまるところ凉宮ハルヒの内面(宇宙、世界)をキョン視点で見た(知る)物語であり、今更ながら、形を変えたボーイミーツガールなのがよく解る。

「溜息」
では朝比奈、古泉の存在感が大きく頻度も上がるが、「涼宮」-「世界」リンクは変わらない。

「消失」
ハルヒと同じくらい大きな単語が出現する。「長門」である。
「ハルヒ」-「朝比奈」の緊密さは変わらないが、「ハルヒ」と「長門」はともに「世界」「解る」「言う」という単語群と緊密な関係がある。物語の軸がハルヒから長門に移り、このキャラクターが大きく成長したのがよく解る。

……この作品以降、「涼宮」-「世界」関係は失われていく。



まだ使い始めたばかりですが、KH Corder、おもしろいです。


2件のコメント

  • いいですね。

    "「涼宮ハルヒの憂鬱」はいつまで「セカイ系」なのか?" というタイトルでどこかに投稿しましょう。読みたいです。

    KH Coderの「KH」がなんの頭文字かには定説がないようですので、kyon-haruhi coderという扱いにしてもいいですし(したから何かが起こるわけではないですが)。
  • 初めまして。
    片瀬智子と申します。

    今日は「観光の王様」へ、お星とすごく素敵なレビューをありがとうございました!
    長文で褒めて下さり、本当に嬉しかったです。

    変な内容だなと自分でも思っていたところ、オチまで褒めて頂いて嬉しすぎます。
    ありがとうございました。
コメントの投稿にはユーザー登録(無料)が必要です。もしくは、ログイン
投稿する