対応分析で他の人の小説を比べてみる!

比較をするなら対応分析!


ということで、

比較するものを見つけては対応分析する、

っていうのが楽しい遊び方です。


楽しかったり、学びになったりしますね。



自分と友人の文章を比較してみたり。

小説サークルなどがある方は、グループ内で比較すると面白いでしょう。


上達を目指すのであれば、

「この人の文章凄くいい!」

って思う人の小説と自分の小説を比較してみるのも手です。



エクセルファイルに、比較したい作品をどんどん入れていきましょう。

作者名や作品名の記入を忘れずに。



ここでポイント!

他の人と文章を比較する場合には、

「その他」の品詞を抽出する設定にしましょう。


その設定は、前処理をする前にします。


「前処理」→「語の取捨選択」

そして、品詞による語の選択から、

「その他」のところにチェックを入れます。


設定が終わったら、前処理を実行しましょう。


この操作によって、

「そして」「しかし」のような接続詞をはじめとして、

様々な語が抽出されるようになります。



ただし「。」や「、」なんかも抽出されるようになってしまいます。

これらは比較する時に邪魔になると思います。


なのでまずは抽出語リストをチェックしましょう。


「。」や「、」は相当上位にいることでしょう。

その他にも、いわゆる「てにをは」なんかも上位にいると思われます。


それらの「これはいらないんじゃないか?」って語が、どこまであるか見ます。


チェックするのは、いらない上位の語が何回出ているか、です。



対応分析の設定で、

「最大出現数」というものを設定できます。


たとえばこれを「100」と設定すると、

101回以上出現している語は分析の対象から外せます。


なので「最大出現数」を設定することで、「。」や「、」などを除外できるわけですね。



これで対応分析してみるのですが、

その結果を見ると、気になることがあると思います。


キャラクター名や、特定の作品でのみ登場する語です。


たとえば「転生」という語は、

使う作品と、一回も使わない作品とで、はっきり分かれますよね。


キャラクター名もまた、その作品特有の語と言えます。


これらは原点からかなり遠い位置に配置されるはずです。

そういった作品特有の語が、対応分析の結果に大きな影響を与えている懸念が、当然生じます。


今度はこういった、特有の語を省いていく作業をします。


テキストファイルに記入していきます。



転生

リコーダー

卓球

武将



というふうに。


こうやって、省きたい語を羅列したテキストファイルを、

KH Coderに読み込ませて反映します。


「前処理」→「語の取捨選択」をクリックします。

開いたウィンドウ右側の、

使用しない語の指定。


その下の、ファイルから読み込みにチェックを入れ、

参照から用意したテキストファイルを指定します。



これで、省きたい語を省くことが可能です。

なおこの際、改めて前処理をする必要はありません。


読み込ませた時点で、指定した語は省かれます。

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る