マニュアルを読まない人のためのマニュアル

KH Coderで読み込むファイルを作ろう!

KH Coderにはちゃんとマニュアルが付いてきます。

でも文字ばっかなので、読むの面倒くさい!って人もいることでしょう。

私もそうでした。

そして肝心な部分の説明を読んでいなくて、数時間悩んだこともありました。


なので、マニュアルを読まない人のためのマニュアルを書くことにしました。


操作方法などを全部覚える必要なんて、ないんですよ。

「簡単な分析をするのに必要な操作だけ覚えればいいじゃん!」

って考え方をしてみます。



まずKH Coderに読み込ませるファイルを作らなくてはいけません。

KH Coderが読み込んでくれるのは、

・テキストファイル(.txtというやつです)

・エクセルファイル

・CSV

・TSV

です。

CSVとTSVは、表計算やデータベースで用いられることのあるファイル形式らしいです。


ここで早速エクセルを使います。

エクセルだとデータの管理が楽ちんです。


まずA列には小説の本文を入れます。

初期設定だとA列に入れられている文章を分析対象の文としてKH Coderが認識するからです。


これだけでも分析は可能なのですが、

さらに横の列に情報を追加していくことが可能です。


たとえばB列に、第何話であるかを入れておきます。

こうすることで、エピソードごとに分けての分析が可能となります。


さらに、第1章、第2章、と物語に区切りをつけている場合は、

C列にそれを書き込んでおくと良いでしょう。


その場合、


 本文   エピソード 章

第1話の本文 0001 01

第2話の本文 0002 01

第3話の本文 0003 01

第4話の本文 0004 01

第5話の本文 0005 02


というような表になります。


この際、セルを文字列設定にして、「0001」というふうに管理しているのがポイントです。

あるいは「a001」みたいな感じでも良いです。


実は、普通に「1,2,3,4,~~~,10,11,~~~~」

と書かない方がいいのです。


なぜならグラフを作った時に、

「1,10,11,2,3,4,~~」

と、思わぬ並び方をしてしまうからです。


これを回避するために、aなり0を頭に置くわけです。

私が「0001」と4桁の数字にしているのは、

たとえば第2章の第3話だったら「0203」と表記することも可能だからです。


つまるところ、ちゃんとした並び順になりさえすれば、

どんな表記でもOKってことです。


さて、先ほどの表を再掲します。


 本文   エピソード 章

第1話の本文 0001 01

第2話の本文 0002 01

第3話の本文 0003 01

第4話の本文 0004 01

第5話の本文 0005 02


1行目は、ラベルとして扱われます。

「本文」「作品名」「作者名」「エピソード」なんていうふうにラベルを表記しておきます。

私はA列1行目(A1)には「本文」と書いていますが、書かなくても分析に支障は無かったような気がします。


エピソード以外にも、記入しておくと良い情報としては、

・作品名

・作者名

・ジャンル

・章

があります。


作者名やジャンルまで用意しておくと、

「自分と、大好きな作家さんの文章を比べてみよう!」

「ラブコメと異世界ファンタジーとで、どう文章が違うか調べてみよう!」

なんてことができるんですね。



なので、そういうことも調べてみたい人はどんどん情報を追加していきましょう。


私の設定では、

B列:作品名

C列:作者名

D列:エピソード

としておくことが多いです。


作者ごとの比較をしたくなったら、

新しく用意したエクセルファイルにA列~C列をコピペするためです。



なお本文に関してですが、改行とかは特に編集しません。

文章を一話分、丸々コピーしたら、セルの中にそのままペーストします。


セルをダブルクリックして、セルの中に文章を入力するモードにしてからペースト。

これで問題なくコピペできるはずです。



作者によって改行の仕方とか異なりますから、

そこを統一規格にした方が良いんじゃないか?

と考えたこともありました。


だけど、フォーマットを決めて、そのとおりに文章を編集するのって、大変ですよね。

その大変な作業に見合うだけの効果があるんでしょうか?


軽く検証してみたところ、

「少なくとも、素人分析においてはほぼ効果なし」

という結果になりました。


労力だけかかって、結果は全然変わらない、なんてことがほとんどです。

なのでそのままコピペで大丈夫です。



貼り付けた本文のせいで、縦に長いセルになってしまう場合があります。

そんな時は、行の長さを設定します。


表の左上の三角をクリックして、表全体を選択します。

その後、表の左側を右クリックします。

すると「行の高さ」というものがあるので、それをクリックします。

行の高さは19くらいに設定すればいいと思います。

(環境によって最適な設定が変わるかもしれません)



なおエクセルファイルは、専用に新しいフォルダを作って、そこに入れておくことをオススメします。

これからKH Coderで分析するにあたり、様々なファイルが自動的に作られたり、自分で用意したりすることになります。


なので作品ごとに分けて管理した方が、目当てのファイルを見つけやすくなると思います。


なお、今回の内容の一部を、

図を用いてわかりやすく説明するブログ記事を作りました。

是非こちらもご活用ください!

https://note.mu/chikamichik/n/n77c54e876810

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る