1-3-3.特殊な電子文字表記

📖この節では、次の項目について説明する。

  【サロゲートペア

   🖈Unicodeのサロゲート方式

   🖈Unicodeの仕様

   🖈サロゲート未対応プログラム

   🖈Unicode文字セットのあく

  【だくぎょう

   🖈V音のとらえ方

   🖈濁点ワ行とその奇異さ

   🖈Unicode結合文字とその問題


 なお、この節では横文字があまりに多いため、縦組み表示を常用している人へも横組み表示をすいしょうする。



      †



📕【サロゲートペア

 〈UTF-16フォーマットにおいて2文字を使って一文字を表現することにした文字〉の意。


   📍Unicodeのサロゲート方式


 UTF-16では一文字2バイトで記録するが、2バイトでは16ビットの表現範囲、つまり「#𝟶〜#𝙵𝙵𝙵𝙵」からはみ出る文字番号を表現できない。

 それを解決するため、特別な16ビット文字を2文字分使って、その範囲を表現する方式が採用された。

 これを「surrogateサロゲートだい〉」と呼ぶ。

 うち、先にくる特別文字を「上位サロゲート文字」、後にくるそれを「下位サロゲート文字」、その2文字の組みを「surrogateサロゲート pairペア」、サロゲートペアを処理して得られる文字を「サロゲートペア文字」と呼ぶ。


   📍Unicodeの仕様


 ところで32ビット有れば、「0〜4,294,967,295(#𝟶〜#𝙵𝙵𝙵𝙵𝙵𝙵𝙵𝙵)」の数値が表現できるはず。

 にもかかわらずUnicodeが、21ビット相当の「1,114,112(#𝟷𝟶𝙵𝙵𝙵𝙵)」文字までしか扱えないのは、このサロゲートを実現する都合による制限。

 まあさすがに文字なんて42億個も要らんでしょ、111万文字使いきれるかどうかも怪しい……。

 そのように、〈何らかの問題を回避したために含まれてしまう制限〉を、一般に「よう」と呼ぶ。

 そして、大抵の製品における「回避した問題」とは、「コスト」である。

 カネに糸目を付けなければ仕様など無い!(無くはない


   📍サロゲート未対応プログラム


 ただ残念ながら、サロゲートを正常に処理できないプログラムが、少なからず存在する。

 『Javaジャバ』『JavaScriptジャバスクリプト』、主にお前らで作られたプログラムの事だ!(

 ので、サロゲートペア文字を使用するのは、極力避けたほうが良い(重要でなければその限りではない)。

 ざっくり、USC-4区間文字がサロゲートペア文字、という事になるが、惜しまれることに絵文字の大半がこれに該当する。

 そういや、コンピュータ上での「emojiエモジ)」を最初に考案したのは『ドワンゴ』のくりしげたか氏だから、あの人はもっとめられていい(

 なお「絵文字的なフォント」は以前から存在したが、フォントは飽くまで「文字番号に対応した画像」であって、「役割を定義された文字」ではない。


   📍Unicodeの文字セットのあく


 文字番号の確認は、次のサイトで簡単に行なえる。


 🌐 『Unicode一覧表』

 http://www.shurey.com/js/works/unicode.html


 文字がどの番号領域に割り当てられているかを一覧するには、次のサイトが有用である。


 🌐 『Unicode - CyberLibrarian』

 http://www.asahi-net.or.jp/~ax2s-kmtn/ref/unicode/


 組み合わせると、前者のサイトで文字番号を調べ、その文字の詳細情報や関連する別字についてを後者のサイトで詳しく知ることができる。


 ところで、テキストデータとは結局ただの文字番号のれつであり、文字番号とは結局ただの数値である。

 つまり文字そのものではないから、ある文字が正常に表示できるかどうかは文字種によらず、完全に環境次第となる。

 よって、入力変換ソフトが〝環境依存〟と報告してくるような文字も、やはり使用を避けたほうが良い。

 なお私見、文字表示が実際に正常にできるかどうかを確認するには、まずPCに比べれば環境がそこそこ整っていない、スマートフォン等で閲覧してみること。

 ならびにPC上でも、だいぶ前の時点で更新が終了しているフリーフォントなどを適用してるのが、手っ取り早いのでオススメする。


 また、縦書き表示に対応していない文字が多数あるので、特に記号を中心によく確認したほうが良い。

 ……継続した波線を記述するための「波ダッシュ」が縦書き表示に対応してなかったりとか、どういうことだってばよ(


 それにしても、だいぶ前からコンピュータを使っての文章作成が、主流になっているもの。

 にもかかわらず、それに関する留意点を体系的に解説する手引き、ないし国語辞書がまだ普及していないのは、残念に思われる。



      †



📕【だくぎょう

 〈アルファベットのヴィー音を表現するための〉の意。

 〝ヷヸヴヹヺ〟および〝ゔ〟がこれ。


   📍V音のとらえ方


 古くから〝V音はB音とは異なる特殊な表記が必要〟との説が存在し、たとえば〈violin〉は{バイオリン}よりも{ヴァイオリン}と好んで表記される。

 これは、〝かつては〔ユー〕〔ヴィー〕の区別があいまいだった〟という事に起因するもの。

 〈いくさおと〉が{walküreウァルキューレ}だったり{valkyrjaヴァルキュリエ}だったり、また「virus病毒」の読みが{ウィルス}だったり{ヴィールス}だったりするのはこのため。

 ほか〔ダブルユー〕についても、〝字形からすればむしろ「ダブルヴィー(=ヴィーヴィー)」ではないか〟との疑問も挙げられている。

 そういった所から、〝〔ヴィー〕とは〔ユー〕が濁ったものであるから、「U=ウ」「V=ヴ」との割り当てがとうなのではないか〟と考えられたものである。

 実際、V音とはまず{u}を意識し、そのまま空気の流れを止めずにどうにか振動だけさせて濁らせる感じの発音がおよそ相当するもの。

 したがって、〝V音はくちびるむな〟との指導をされる事もある。

 一方でB音は空気の流れを止める、つまり{っb}のようなイメージに近い。


 ただし、日本語的にはV音も結局B音で発音するので、バ行で表記するのが不適切なわけではない。

 だいいち、英語では母音の発音のほうが重要なのであり、およそ二十数種のそれが有るとされ、その表現に{アイウエオ}5音では圧倒的に不足する。

 つまり、子音だけをいくら工夫してもムダなのであり、どのような表記であっても結局は正確にならない、というのが事実であるわけだ。

 ので、「」というのがファイナルアンサーかもしれない(


 ちなみに英語でも、歌唱内においてはV音はB音で発音されるが、これ理由わかる人教えてプリーズ(

 発音のタイミングやめいりょうさの問題かな。


   📍濁点ワ行とその奇異さ


 コンピュータ上の文字体系では、かつて〝ヴ〟のみが存在し、これに小書きカタカナを添えて、V音を〝ヴァva ヴィvi vu ヴェve ヴォvo〟と表現した。

 Unicodeの登場により濁点ワ行が追加されて、コンピュータ上でも〝va vi vu ve vo〟と単一ので表現できるようにはなった。

 ただ、筆記においてはその記述法はかつてから存在したが、しかし「ヷイオリン」のような表記には強い違和感も感じられ、あまり普及しているものではない。

 なお、ひらがなについては〝ゔ〟のみが定義されている。


   📍Unicode結合文字とその問題


 ほか、Unicodeには「けつごう」とよばれる、ある文字に後置きした「けつごう」で装飾して特殊な一文字を表現する、という機構が存在する。 

 この「◌゙ 結合文字」や「◌゚ 結合文字」を後置きする事によって、


  • あ゙い゙ゔえ゙お゙ぁ゙ぃ゙ぅ゙ぇ゙ぉ゙ゔ゙がぎぐげごが゙ぎ゙ぐ゙げ゙ご゙ざじずぜぞざ゙じ゙ず゙ぜ゙ぞ゙だぢづでどだ゙ぢ゙づ゙で゙ど゙っ゙な゙に゙ぬ゙ね゙の゙ばびぶべぼば゙び゙ぶ゙べ゙ぼ゙ぱ゙ぴ゙ぷ゙ぺ゙ぽ゙ま゙み゙む゙め゙も゙や゙ゆ゙よ゙ゃ゙ゅ゙ょ゙ら゙り゙る゙れ゙ろ゙わ゙ゐ゙ゑ゙を゙ん゙ゎ゙愛゙死゙天゙流゙


  • 〝ア゚イ゚ウ゚エ゚オ゚ァ゚ィ゚ゥ゚ェ゚ォ゚゚ヴ゚カ゚キ゚ク゚ケ゚コ゚ガ゚ギ゚グ゚ゲ゚ゴ゚ヵ゚ヶ゚サ゚シ゚ス゚セ゚ソ゚ザ゚ジ゚ズ゚ゼ゚ゾ゚タ゚チ゚ツ゚テ゚ト゚ダ゚ヂ゚ヅ゚デ゚ド゚ッ゚ナ゚ニ゚ヌ゚ネ゚ノ゚パピプペポバ゚ビ゚ブ゚ベ゚ボ゚パ゚ピ゚プ゚ペ゚ポ゚マ゚ミ゚ム゚メ゚モ゚ヤ゚ユ゚ヨ゚ャ゚ュ゚ョ゚ラ゚リ゚ル゚レ゚ロ゚ワ゚ヰ゚ヱ゚ヲ゚ン゚ヮ゚愛゚死゚天゚流゚


のように、無節操に濁点や半濁点を付与できる。

 ……濁点文字に半濁点ついたやつってどう発音すんのカーチャン(


 ただし文字結合の実装は、い変わらず個々のプログラムに任せられている。

 またフォントによっても、対応未対応がある。

 そのため、環境によって表示が異なったり、文字化けしたりするため、やはりこれも使用は極力避けたほうが良く、入力方法もあえてここでは解説しない。


 なお、結合文字はUnicodeにおいて、字形として単体で定義されているもの。

 その観点で、それ自体は字形を意味しないサロゲート文字とは、別扱いである。

  • Xで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る