最低条件を決める
前項に引き続き、「言葉にできない」出力パターンについて考察してみる。
一つ目。小文字や長音符(ー)が連続するケース。
つまりは「シェャクスピア」や「シーークスピア」といったものだ。後者については発音自体は可能であるが……ひとつだけ繋がれるのが妥当だろう。表現するのなら「シーイクスピア」とするべきだ。
注意するべきは、拗音(チャ、キュなど)後の長音符と促音符(ッ)は問題なく適応されるということ(チャールズ、チェック)か。
二つ目。「ン」の直後に拗音に用いる小文字(ァ行、ャ行、ヮ)が来るケース。
「ン」は発音の際に口を閉じるので、口を開けた状態を前提とする拗音になることはないという考えだ。
三つ目。言葉の末尾に「ッ」が来るケース。
これに関しては、かなり違和感を覚える人もいるだろう。「えっ」「あれっ」という言葉は日常的に用いられるし、一部の漫画でも「あるッ」やら「だとッ」という表現が見られる。
だが、考えてもらいたい。あなたはその「っ」を発音しているだろうか。
ローマ字に直す際のことを考えれば分かるだろう。「エックス」は「ekkusu」、「チョップ」は「tyoppu」となるように、促音符は直後の文字の子音を重ねるように記載する。
だから、末尾に「ッ」が来た時は、直後の文字に該当するものがないので、それを表現することが出来ないのだ。(長音符はチルダ(^)を付けることで対応可能)
結論としては、「末尾の促音符は別に要らない」となる。「あれっ」は「あれ」でも表現できるからだ。
さて、以上の三ケースを、シェイクスピアのケース――七文字のカタカナに当てはめてみることにする。
(ツッコミどころはあるでしょうが、余談にて弁明します)
一文字目については、小文字と長音符を除いた72種類が取り得る文字となる。
(「ン」が先頭にくる言葉は「ンジャメナ」など少数ながら存在しているし、発音も可能であるので含んでいる)
二文字目。直前に小文字と長音符が出てこないので、一文字目が「ン」以外ならば83種類全部が取り得るだろう。「ン」となった場合は、拗音がらみの9種類を除いた74種類が取り得る文字である。
三文字目以降については、大文字と小文字に分かれることになり、それに応じて出力するべき文字が変わる。
まず直前の文字が大文字の場合、これは二文字目と同じ結果だ。「ン」以外と「ン」でパターンを分けるだけでいい。
小文字の場合だが――拗音系(ャ、ァなど)ならば、拗音が連続しなければ問題ない。つまり、74種類が取り得るパターンになる。
「ッ」「ー」の場合、拗音を始めとして、「ッ」も「ー」も出てこない。「アッー」「アーッ」が発音できないのと同じだ。よって、72種類が対象となる。
なお、最終文字についてだけは、無条件で「ッ」が取り除かれる。他の条件は同じとなる。
これより、総ケース数を計算してみる。
一文字目は前述の通り、72通り。
二文字目は 71/72(「ン」以外の大文字が出る)の確率で83通りとなり、1/72の確率で74通り。
三文字目から六文字目は 71/83の確率で83通りとなり、10/83の確率(「ン」+拗音の場合)で74通り。2/83の確率(ー、ッ)で72通りとなる。
最後の文字は「ッ」が抜けるので、71/83の確率で82通りとなり、10/83の確率で73通り。2/83の確率で72通りとなる。
(厳密に言えば、三文字目以降については正確な値ではない。前の文字までの出現確率が考慮されていないからだ。ただし、それによる誤差は微々たるものなので、今回は割愛している)
よって計算式は、
72 ×(71/72 × 83 + 1/72 × 74)×(71/83 × 83 + 10/83 × 74 + 2/83 × 72)
^ 4 ×(71/83 × 82 + 10/83 × 73 + 2/83 × 72)となる。
計算結果は――約21兆3959億2000万パターンとなった(ググル電卓を使用)。
元々の総件数である83の7乗、約27兆1360億5100万パターンに比べると、おおよそ5兆7000億件ほど削れている。全体の二割ほどが減った計算となる。
……これは大きな後押しとなったのではないか?
(余談)
この前提には、ツッコミどころがある。
例えば「モュ」といった言葉を発音出来るのかというと、出来ない。
普通、拗音は「キャ」「ミュ」「ショ」といった具合に、イ段の言葉に重ねるのが一般的である。
だから厳密には、更に条件を定めるべきなのだが……これ、実装するのがかなり面倒なのである。
今のところ、乱数の割り当てを「大文字用」と「小文字用」に割り当てることで、どうにか実装しようとしているが、ここに「段」の観点も追加する必要が出てくる。
それだけならまだしも、「ツァ」やら「トゥ」やら「モォ」といった表現もあるのだ。条件分岐だけで頭がおかしくなりそうである。
下手に定義して、出力すべき文字が出ないのも困るのだ――故に今回は見送りとしている。
もう一点は「ン」がらみの条件。
「アンンド」や「アンード」、「アッンド」「アンッド」という具合に「ン」というのは大文字ではあるが、他の大文字と比べて性質が異なっている。
(実際は「撥音」と呼ばれ、文字と言うよりも、どちらかと言えば「口を閉じる」という記号に近いのだから、当たり前ではある)
さて、上記のケースを取り除くか、否か。
非常に悩ましい話ではあったが、結局残すことにした。先頭文字でも説明した通り、発音自体は可能であるからだ。
基準がぐらぐら過ぎると言われたら、否定はできない。
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます