計量テキスト分析に必要な環境とは?

計量テキスト分析は、

パソコンとネット環境があれば、無料でできます!

強いて言えば、パソコンを動かす電気代が必要になるくらいです!



計量テキスト分析とか、テキストマイニングとか言われている手法。

そのノウハウの本についてAmazonで調べてみると、

R(MeCab)

KH Coder

の二種類の方法があるらしいとわかります。



Rは統計分析に向いているプログラミング言語です。

テキスト分析のためのプログラムを自作したり、他の人が作ったのを持ってきたりして分析するみたいですね。


そしてMeCabというのは、形態素解析という作業を行うためのツールで、

これを利用した上でRによる分析をする手順となります。

ちなみに形態素解析というのは、ド素人がわざわざ覚える必要のない知識です。

私もよく知らないまま分析していたくらいです。


RもMeCabも使用するのに料金はかかりません。

つまり無料です。タダです。



で、もう片方のKH Coder。

こっちもフリーソフトです。

フリーソフトなので無料で手に入ります。


ぶっちゃけこのソフトでは、

様々な分析において先述のRを用いています。

MeCabも利用しています。


分析したい文章を、KH Coder用に少し加工したら、

後はKH Coderに指示するだけで勝手に分析してくれます。

手順を覚えれば、後は分析やプログラミングに関する知識が無くても分析できちゃいます。



「じゃあこっちでいいじゃん!」

って思った人がいそうですね。


うん、私もそう思ってます。


私の場合、選んだと言うよりかは、

最初に見つけたのがこっちだったから、

という理由でKH Coderを使用しています。


そして「じゃあこっちでいいじゃん」という理屈で、

Rを用いた分析に一切手を伸ばしていないのが現状です。



そういうわけでここからは、

KH Coderでの分析を前提として話を進めていきます。



※ちなみに私が「テキストマイニング」ではなく、

「計量テキスト分析」を用いているのは、

KH Coderについての書籍ではこっちの表現だったからです。


※分析の知識が無くても分析できる、

とは書いてみたものの、

多少は知識があった方が的確に分析できるのも事実です。

その「多少の知識」をこれからお伝えしていければと思います。


※KH Coderは下記のサイトで入手できます。

http://khcoder.net/

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る