概要とやり方


「概要」

 今回、私はPython言語を用いて「平仮名をランダムに自動生成するプログラム」を作成しました。ここで使われる文字は、五十音に加えて濁音・半濁音、そして拗音の、全74音です。このプログラムは下に貼っておきます。ただ、Pythonの環境が無い方の場合は、「ランダム文字列ジェネレーター - HAYU/IO(1)」などを用いてみてもいいかもしれません。



「プログラム」

1: import random

2: def random_str(length):

3: chars = 'あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわをんがぎぐげござじずぜぞだでどばびぶべぼぱぴぷぺぽゃゅょ' #づぢ無し

4: return ''.join([random.choice(chars) for _ in range(length)])

5: if __name__ == '__main__':

6: print(random_str(1000))



「やり方」

 文字列はランダムに生成されますから、ここではどのような文字列であれば意味の通る文章となるかがキモになってきます。そこで私は以下のような規定を設けました。

①意味明瞭であっても、抽出するのは三文字以上

②意味明瞭な文字列の定義は【1,単一の自立語、また自立語と付属語の組み合わせであること。2,自立語と付属語の組み合わせでは、自立語が前にあること。3,固有名詞は、一般的な辞書に載っるもののみとし、それ以外の固有名詞は除外すること。4,その文字列を用いて意味の通る例文が作れること】をすべて満たすもの

③古語的言い回しや古語については認めるが、歴史的仮名遣いは×

④促音「っ」は適宜「つ」をその代わりにしてもよい

 ①については、どうしても一文字、二文字の名詞や言葉を抽出するとなると当然これが一番多くなってしまうため、程よい三文字にしたということです。

 ②について特筆すべき物は3でしょうか。辞書に載った一般名詞はOKとのことですが、辞書によってまちまちなので、この場合、結局は私が判断することになりそうです。

 ③について。例えば今は無き助動詞「めり」の入った「鴨なんめり」は認めますが、病の歴史的仮名遣い版「やまひ」は認めない、ということです。ただし、現在文法における歴史的仮名遣いの助動詞はもちろん認めます。

 ④について。拗音と違い、こちらは手動で切り替えることにしました。



 それでは、次からひとまず5000文字のランダム平仮名を投稿します。まずはこれを分析してみましょう。





(1)https://apps.hayu.io/random

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る