コーディングルールを作ってみよう!
マニュアルを読まない人のマニュアルは、
今回と次回の内容で最後となります。
今回と次回の2回で挑戦するのは、
コーディングルールを作り、
特定の語の登場頻度をグラフ化する。
という分析です。
「なんのこっちゃ?」って感じですよね。
順を追って説明します。
まず「コーディングルールってなに?」ってところから始めましょう。
KH Coderでは、
「コーディングルール」というものを作成することで、
特定の語のグループを作ることができます。
実際にどんなふうに作るのか見た方が早いかもしれませんね。
こんな感じです。
*アムリタ
アムリタ or アム or リータ
*トモビキ
トモビキ | トモ
*クシャ美
クシャ美 | シュバリー
私が自分の作品を分析する際に用いたコーディングルールの一部を持ってきました。
これを例に見ていきましょう。
まず「*」がついている部分は、
いわばグループ名です。
そしてその下に列挙されているのが、
そのグループに属する語です。
*アムリタ
アムリタ or アム or リータ
であれば、
「*アムリタ」がグループ名。
それに属する語が「アムリタ」と「アム」と「リータ」です。
*トモビキ
トモビキ | トモ
であれば、
「*トモビキ」がグループ名。
そして「トモビキ」と「トモ」がグループに属する語ですね。
語と語の間にある「or」と「|」は同じ働きをしていて、
単語の区切りとなっています。
「トモビキトモ」ではないよ。「トモビキ」と「トモ」だよ。と伝えています。
(厳密には全く違うんですけど、今回はわかりやすさ重視なので、そのように説明しておきます)
コーディングルールを設定することによって、
指定した語が登場する文を数えることができます。
つまり、「アムリタ」って語が含まれる文章があったら、
それは「*アムリタ」グループの文章として数えられます。
「アムリタ」だけではなく、
「アム」や「リータ」のどれか1つでも登場すれば、
その文章は「*アムリタ」グループとして扱われます。
文章が複数のグループに所属することもあり得ます。
「アムリタとクシャ美はトモビキを睨んだ。」なんて文章があったら、
その文は「*アムリタ」と「*クシャ美」と「*トモビキ」、全てのグループに属していることとなります。
この後の分析では、
「第1話では、『*アムリタ』グループの文章が〇個ありました」
「第2話だと、『*アムリタ』グループの文章が×個でした」
「第3話だと……」
と比較し、グラフを作っていきます。
それによって、
小説の見せ場や、読者が面白いと感じやすい場所を推測できます。
なのでコーディングルールでは、
登場人物の名前や、特定のテーマに関する語を指定していきます。
上記の「*アムリタ」などはまさに登場人物の名前のグループです。
「アム」などあだ名などで呼ばれることもあるので、そのあだ名も指定しています。
特定のテーマに関する語というのは上の例にはありませんが、
もし恋愛ものの作品なら、
「*恋愛」というグループを作って、
「キス」「好き」「愛」「恋」「恋愛」といった語を指定する、
ということが考えられますね。
要するに、作品の肝となる部分を設定してね、ってことです。
では実際にコーディングルールを作成してみましょう。
今回は単純に、
主要登場人物でコーディングルールを作ります。
まずは抽出語リストを確認します。
名前がちゃんと抽出されていないと、分析しようがないからです。
登場人物の名前で検索してみて、
ちゃんと表示されたらオッケーです。
表示されなかった場合、名前が複数の語に分割されている可能性があります。
その場合は、
1.分割されている語の1つを採用する
2.強制抽出する語に名前を入れて、もう一度前処理をする
のどちらかで対処します。
できれば、2の方法を使うことをオススメします。
キャラによっては、苗字で呼ばれたり名前で呼ばれたりあだ名だったり、
様々な呼ばれ方をすると思います。
その全てをまとめてグループにしてあげましょう。
そのためにも、あだ名も含めて、強制抽出することをオススメします。
強制抽出の手順は、
「下準備の後編です!分析開始までもう少し!」
に書いてありますので、そちらを参考にしてください。
さていよいよ、コーディングルールの記入に移ります。
コーディングルールは、テキストファイル(txt)で表記します。
Windowsなら、「メモ帳」というアプリを用いるのが一般的でしょうか?
エクスプローラーの画面で、右クリックから
「新規作成」→「テキスト ドキュメント」
でもテキストファイルを作れるはずです。
そうして作ったテキストファイルを開けば、
メモ帳で編集できると思います。
「*」は、
エンターキーの近くにある、
「け」「:」のキーとシフトキーで入力できます。
ちなみに「*」は全角でも半角でも大丈夫です。
キーボードによっては、少し位置が異なるかもしれません。
自分のキーボードではどこを押せばいいのか、確認してみてくださいね。
そして「*キャラA」などとグループ名を書いたら、改行します。
改行したところから、グループに属する語を指定します。
「or(|)」は半角の文字でなくてはなりません。
全角はダメです。
そして「or(|)」の前後には、半角スペースを1つずつ入れます。
こうすることで、2つ以上の語をグループの仲間として登録できます。
つまり、
語1 半角スペース orか| 半角スペース 語2
というふうに書いていくのです。
「|」は、
バックスペースキーの左隣。
「¥」のキーとシフトキーで入力できます。
「*」同様、キーボードによっては、位置が異なるかもしれません。
こちらも確認してみてください。
コーディングルールは他にも様々な条件で指定できます。
ですが、本当に色んな条件があるので、
今回は「or(|)」だけを使います。
*キャラA
苗字 | 名前 | あだ名
*キャラB
苗字 | 名前 | あだ名
*キャラC
苗字 | 名前 | あだ名 | あだ名2
といった具合に、
主に登場するキャラクターのグループを次々と設定していきましょう。
思い付く限り書けたら、
コーディングルールの設定は完了です。
次回はこのコーディングルールを使って、分析をしてみます!
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます