おわりに(100文字の文章が完成する確率)


 無限の猿定理の欠点、それは文字数の長い文章やそれらの集合体――小説を作り上げるのにとてつもない時間がかかるということです。確率がとんでもなく低くなってしまうのですよね。

 また、今回は私が人力で「意味の通る文章」を探したので、これまた効率が悪い。ですからせめて、辞書に存在する文や日常語彙をすべてデータとして持ち合わせた自動確認プログラム、もしくは膨大なデータを深層学習した「意味の通る文章を探す人工知能」でもあれば、少しは楽になります。

 ただランダムな文字列は、本当に極端な意外性を持っているので(「やぶにいもとふく」、なんてシュールレアリスムっぽい)、上で言ったような意味の通る文章を自動で探すものがあれば、案外小説の案を考える際補助的に使えるかもしれません。ただ人力でやるのは時間の無駄だとわかりましたので、変わり者以外は真似しないほうが賢明です💦



 最後におまけとして、もし百文字の意味の通る文章をこの手法で生成するとしたら、どのくらいの確立になるかを調べてみましょう。

 まず計一万文字の文字数結果を見てみます。

・三文字は290

・四文字は73

・五文字は31

・六文字は7

・七文字は2

・八文字は2

・九文字は1

 となりました。それぞれ隣同士の文字数の数を割ってみると(=四文字から三文字を割れば、四文字になった時どの程度確率が減っているかがわかる)、三文字から四文字は25%、四から五は42%、五から六は22%、六から七は28%……。今回は五文字が二回目の調査で非常に多かったので、ここだけ変に高くなっていますが、これらの割合を平均化すると29%!

 つまり一文字増えるごとに、その文字数が生じる確率は三割に落ちるということです。例えば今回、二回目の調査では三文字は64%でした。これに0.3をかけると約20%となります。おお、当たってますね。つまり、三文字の出る割合からに98回0.3を書ければ、百文字が出てくる割合が出ます。物凄い小さな数字になることは目に見えてますね……。一応やってみましょう。

 今回は一回目の三文字確率と二回目のそれを平均化した72%から始めます。72*0.3^98=4.1230202e-50。

 となると、簡略化しても4.1^-50=0.00000000000000000000000000000000000000000000000041%(ゼロの数あってないかも)

 くらいですね。はい、文章はきちんと自分の頭で考えましょー。

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

自動で小説を生み出す最も単純な方法 凪常サツキ @sa-na-e

★で称える

この小説が面白かったら★をつけてください。おすすめレビューも書けます。

カクヨムを、もっと楽しもう

この小説のおすすめレビューを見る

この小説のタグ