分析開始!手始めに簡単なものを2つやってみよう!

さて、前回までに前処理をするための下準備を行い、

さらに「前処理」→「前処理の実行」から実際に前処理を行いました。

これで分析を行える状態になりました。



まずは簡単で見栄えのよい分析を2つ、紹介します。



1.抽出語リスト

2.共起ネットワーク図

です。



1.抽出語リスト

「ツール」→「抽出語」→「抽出語リスト」から実行できます。


登場回数の多い順に、抽出された語が表示されます。


通常であれば、

・主要登場人物の名前

・「言う」「思う」などの一般的な動詞

が上位に表示されているはずです。



ただし抽出する品詞に「その他」を含めている場合は、

上位のほとんどは「その他」の語になるはずです。


こんな時は、フィルタ設定を行います。

「フィルタ設定」のボタンを押すと、

リストに表示する品詞を選べます。


ここで「その他」のチェックを外すことで、

抽出語リストから「その他」の語を除外できます。

もちろん「その他」以外の品詞でも同じことができます。

なので、名詞だけ調べたい、動詞だけ調べたい、という使い方も可能です。



検索もできます。

表示したい語を検索ボックスに入力し、エンターキーか[検索]ボタンを押します。

ただしこの時、動詞などは基本形で入力します。



そしてリストに表示されている語をクリックすると、

KWICコンコーダンス、というウィンドウが開きます。


KWICコンコーダンスでは、抽出語リストでクリックした語を使用している文章のリストが表示されています。

抽出語リストでクリックした語は赤く表示されているはずです。


ここでもリストからダブルクリックすることで、文章を見ることができます。

自分がその言葉をどんなふうに使っているかを確認できるわけですね。


しかしKWICコンコーダンスでの操作についての詳しい説明は、ここでは省きます。



それでは抽出語リストの説明に戻ります。

ウィンドウの右下に[Excel出力]というボタンがあります。


そうです。

リストをエクセルファイルとして出力できるのです!


どのような形式にするかを選択する画面が出ています。

色々ありますが、

「品詞別」か「頻出150語」のどちらかを選択して、

あとは初期設定のままで、初心者的には問題ないです。


「頻出150語」だとそのまま多い順に150語の表を作成してくれます。

そして「品詞別」では、品詞ごとに仕分けた上で頻出語を作成してくれます。


「頻出150語」は抽出語リストで表示されているのと同じ内容です。

なので「品詞別」でエクセルファイルを出力した方が楽しいと思います。


「自分はどのような語を用いる傾向にあるのか?」

ということを知る際にも、

「品詞別」の方がわかりやすいのではないでしょうか。




2.共起ネットワーク図


文章を分析していくと、

「Aという単語は、Bという単語の近くによく出てくる」

といった傾向が見えてきます。

(人間には見えなくても、コンピューターには見えます)


このような共起関係をわかりやすく図にしたものが、

共起ネットワーク図です。



共起ネットワーク図は見栄えが良いです。

なので、ツイッターなどで分析のことを発信する時には、

この図を用いることが多いです。


実際に分析していく過程では、

「使わないわけじゃないけど、重要度は低め」

というような位置だと思います。


分析の材料にするための分析、という感じですね。

共起ネットワーク図で得た情報を参考にして、他の分析をするイメージです。



「ツール」→「抽出語」→「共起ネットワーク」を選択します。

するとオプション画面が開きます。


まず左上にある、「集計単位」を指定します。

「文」もしくは「段落」にすると良いでしょう。


他の分析においても、この集計単位を指定することがよくあります。

いずれの分析でも、基本的には文もしくは段落に設定しておくことが望ましいです。



その下には、分析に使う語の範囲を設定する項目があります。

最小出現数は、あらかじめKH Coderが自動的に決定してくれています。

分析に使う語の量が、ある程度の数になるように設定してくれているのです。

なので、ここはそのままでも大丈夫です。


品詞による語の取捨選択という項目も、そのままで大丈夫でしょう。


ただし「その他」の品詞の語を抽出している場合は、

「その他」にチェックが入っていないか確認しておいた方が良いです。



右側にも色々と項目があり、あれこれ設定できるようになっています。

しかしこっちも、最初のうちはほぼいじらなくてOKです。

お好みで「強い共起関係ほど濃い線に」にチェックを入れてください。


そして右下の[OK]ボタンを押すと、処理が開始されます。

処理にはしばらく時間がかかります。

のほほんと待ちます。



処理が終わると、新しいウィンドウが開き、

共起ネットワーク図が表示されます。


この図では、

線で結ばれている単語が、共起関係にあるということです。

さらに、関係の強い語同士でいくつかにグループ分けがされています。

グループは色で表現されています。


そして図は、右下にある[保存]ボタンで保存できます。

emfやpdf、pngなどの形式で保存できます。

私はネットに投稿するためにpngで保存しています。

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る