最低条件を決める


 前項に引き続き、「言葉にできない」出力パターンについて考察してみる。


 一つ目。小文字や長音符(ー)が連続するケース。

 つまりは「シクスピア」や「シクスピア」といったものだ。後者については発音自体は可能であるが……ひとつだけ繋がれるのが妥当だろう。表現するのなら「シクスピア」とするべきだ。

 注意するべきは、拗音(チャ、キュなど)後の長音符と促音符(ッ)は問題なく適応されるということ(チルズ、チク)か。


 二つ目。「ン」の直後に拗音に用いる小文字(ァ行、ャ行、ヮ)が来るケース。

「ン」は発音の際に口を閉じるので、口を開けた状態を前提とする拗音になることはないという考えだ。


 三つ目。言葉の末尾に「ッ」が来るケース。

 これに関しては、かなり違和感を覚える人もいるだろう。「えっ」「あれっ」という言葉は日常的に用いられるし、一部の漫画でも「あるッ」やら「だとッ」という表現が見られる。

 だが、考えてもらいたい。あなたはその「っ」を発音しているだろうか。

 ローマ字に直す際のことを考えれば分かるだろう。「エックス」は「ekkusu」、「チョップ」は「tyoppu」となるように、促音符は直後の文字の子音を重ねるように記載する。

 だから、末尾に「ッ」が来た時は、に該当するものがないので、それを表現することが出来ないのだ。(長音符はチルダ(^)を付けることで対応可能)

 結論としては、「末尾の促音符は別に要らない」となる。「あれっ」は「あれ」でも表現できるからだ。

 


 さて、以上の三ケースを、シェイクスピアのケース――七文字のカタカナに当てはめてみることにする。

(ツッコミどころはあるでしょうが、余談にて弁明します)


 一文字目については、小文字と長音符を除いた72種類が取り得る文字となる。

(「ン」が先頭にくる言葉は「ンジャメナ」など少数ながら存在しているし、発音も可能であるので含んでいる)


 二文字目。直前に小文字と長音符が出てこないので、一文字目が「ン」以外ならば83種類全部が取り得るだろう。「ン」となった場合は、拗音がらみの9種類を除いた74種類が取り得る文字である。


 三文字目以降については、大文字と小文字に分かれることになり、それに応じて出力するべき文字が変わる。

 まず直前の文字が大文字の場合、これは二文字目と同じ結果だ。「ン」以外と「ン」でパターンを分けるだけでいい。

 小文字の場合だが――拗音系(ャ、ァなど)ならば、拗音が連続しなければ問題ない。つまり、74種類が取り得るパターンになる。

「ッ」「ー」の場合、拗音を始めとして、「ッ」も「ー」も出てこない。「ア」「ア」が発音できないのと同じだ。よって、72種類が対象となる。

 なお、最終文字についてだけは、無条件で「ッ」が取り除かれる。他の条件は同じとなる。


 これより、総ケース数を計算してみる。

 一文字目は前述の通り、72通り。

 二文字目は 71/72(「ン」以外の大文字が出る)の確率で83通りとなり、1/72の確率で74通り。

 三文字目から六文字目は 71/83の確率で83通りとなり、10/83の確率(「ン」+拗音の場合)で74通り。2/83の確率(ー、ッ)で72通りとなる。

 最後の文字は「ッ」が抜けるので、71/83の確率で82通りとなり、10/83の確率で73通り。2/83の確率で72通りとなる。

(厳密に言えば、三文字目以降については正確な値ではない。前の文字までの出現確率が考慮されていないからだ。ただし、それによる誤差は微々たるものなので、今回は割愛している)


 よって計算式は、

 72 ×(71/72 × 83 + 1/72 × 74)×(71/83 × 83 + 10/83 × 74 + 2/83 × 72)

^ 4 ×(71/83 × 82 + 10/83 × 73 + 2/83 × 72)となる。


 計算結果は――約21兆3959億2000万パターンとなった(ググル電卓を使用)。

 元々の総件数である83の7乗、約27兆1360億5100万パターンに比べると、おおよそ5兆7000億件ほど削れている。全体の二割ほどが減った計算となる。


……これは大きな後押しとなったのではないか?


(余談)

 この前提には、ツッコミどころがある。


 例えば「モュ」といった言葉を発音出来るのかというと、出来ない。

 普通、拗音は「キャ」「ミュ」「ショ」といった具合に、イ段の言葉に重ねるのが一般的である。

 だから厳密には、更に条件を定めるべきなのだが……これ、実装するのがかなり面倒なのである。

 今のところ、乱数の割り当てを「大文字用」と「小文字用」に割り当てることで、どうにか実装しようとしているが、ここに「段」の観点も追加する必要が出てくる。

 それだけならまだしも、「ツァ」やら「トゥ」やら「モォ」といった表現もあるのだ。条件分岐だけで頭がおかしくなりそうである。

 下手に定義して、文字が出ないのも困るのだ――故に今回は見送りとしている。


 もう一点は「ン」がらみの条件。

「アド」や「アド」、「アド」「アド」という具合に「ン」というのは大文字ではあるが、他の大文字と比べて性質が異なっている。

(実際は「撥音」と呼ばれ、文字と言うよりも、どちらかと言えば「口を閉じる」というに近いのだから、当たり前ではある)

 さて、上記のケースを取り除くか、否か。

 非常に悩ましい話ではあったが、結局残すことにした。先頭文字でも説明した通り、発音自体は可能であるからだ。


 基準がぐらぐら過ぎると言われたら、否定はできない。

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る