対応分析で他の人の小説を比べてみる!
比較をするなら対応分析!
ということで、
比較するものを見つけては対応分析する、
っていうのが楽しい遊び方です。
楽しかったり、学びになったりしますね。
自分と友人の文章を比較してみたり。
小説サークルなどがある方は、グループ内で比較すると面白いでしょう。
上達を目指すのであれば、
「この人の文章凄くいい!」
って思う人の小説と自分の小説を比較してみるのも手です。
エクセルファイルに、比較したい作品をどんどん入れていきましょう。
作者名や作品名の記入を忘れずに。
ここでポイント!
他の人と文章を比較する場合には、
「その他」の品詞を抽出する設定にしましょう。
その設定は、前処理をする前にします。
「前処理」→「語の取捨選択」
そして、品詞による語の選択から、
「その他」のところにチェックを入れます。
設定が終わったら、前処理を実行しましょう。
この操作によって、
「そして」「しかし」のような接続詞をはじめとして、
様々な語が抽出されるようになります。
ただし「。」や「、」なんかも抽出されるようになってしまいます。
これらは比較する時に邪魔になると思います。
なのでまずは抽出語リストをチェックしましょう。
「。」や「、」は相当上位にいることでしょう。
その他にも、いわゆる「てにをは」なんかも上位にいると思われます。
それらの「これはいらないんじゃないか?」って語が、どこまであるか見ます。
チェックするのは、いらない上位の語が何回出ているか、です。
対応分析の設定で、
「最大出現数」というものを設定できます。
たとえばこれを「100」と設定すると、
101回以上出現している語は分析の対象から外せます。
なので「最大出現数」を設定することで、「。」や「、」などを除外できるわけですね。
これで対応分析してみるのですが、
その結果を見ると、気になることがあると思います。
キャラクター名や、特定の作品でのみ登場する語です。
たとえば「転生」という語は、
使う作品と、一回も使わない作品とで、はっきり分かれますよね。
キャラクター名もまた、その作品特有の語と言えます。
これらは原点からかなり遠い位置に配置されるはずです。
そういった作品特有の語が、対応分析の結果に大きな影響を与えている懸念が、当然生じます。
今度はこういった、特有の語を省いていく作業をします。
テキストファイルに記入していきます。
転生
リコーダー
卓球
武将
というふうに。
こうやって、省きたい語を羅列したテキストファイルを、
KH Coderに読み込ませて反映します。
「前処理」→「語の取捨選択」をクリックします。
開いたウィンドウ右側の、
使用しない語の指定。
その下の、ファイルから読み込みにチェックを入れ、
参照から用意したテキストファイルを指定します。
これで、省きたい語を省くことが可能です。
なおこの際、改めて前処理をする必要はありません。
読み込ませた時点で、指定した語は省かれます。
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます