1-3-3.特殊な電子文字表記
📖この節では、次の項目について説明する。
【サロゲートペア
🖈Unicodeのサロゲート方式
🖈Unicodeの仕様
🖈サロゲート未対応プログラム
🖈Unicode文字セットの
【
🖈V音の
🖈濁点ワ行とその奇異さ
🖈Unicode結合文字とその問題
なお、この節では横文字があまりに多いため、縦組み表示を常用している人へも横組み表示を
†
📕【サロゲートペア
〈UTF-16フォーマットにおいて2文字を使って一文字を表現することにした文字〉の意。
📍Unicodeのサロゲート方式
UTF-16では一文字2バイトで記録するが、2バイトでは16ビットの表現範囲、つまり「#𝟶〜#𝙵𝙵𝙵𝙵」からはみ出る文字番号を表現できない。
それを解決するため、特別な16ビット文字を2文字分使って、その範囲を表現する方式が採用された。
これを「
うち、先にくる特別文字を「上位サロゲート文字」、後にくるそれを「下位サロゲート文字」、その2文字の組みを「
📍Unicodeの仕様
ところで32ビット有れば、「0〜4,294,967,295(#𝟶〜#𝙵𝙵𝙵𝙵𝙵𝙵𝙵𝙵)」の数値が表現できるはず。
にもかかわらずUnicodeが、21ビット相当の「1,114,112(#𝟷𝟶𝙵𝙵𝙵𝙵)」文字までしか扱えないのは、このサロゲートを実現する都合による制限。
まあさすがに文字なんて42億個も要らんでしょ、111万文字使いきれるかどうかも怪しい……。
そのように、〈何らかの問題を回避したために含まれてしまう制限〉を、一般に「
そして、大抵の製品における「回避した問題」とは、「コスト」である。
カネに糸目を付けなければ仕様など無い!(無くはない
📍サロゲート未対応プログラム
ただ残念ながら、サロゲートを正常に処理できないプログラムが、少なからず存在する。
『
ので、サロゲートペア文字を重要な部分で使用するのは、極力避けたほうが良い(重要でなければその限りではない)。
ざっくり、USC-4区間文字がサロゲートペア文字、という事になるが、惜しまれることに絵文字の大半がこれに該当する。
そういや、コンピュータ上での「
なお「絵文字的なフォント」は以前から存在したが、フォントは飽くまで「文字番号に対応した画像」であって、「役割を定義された文字」ではない。
📍Unicodeの文字セットの
文字番号の確認は、次のサイトで簡単に行なえる。
🌐 『Unicode一覧表』
http://www.shurey.com/js/works/unicode.html
文字がどの番号領域に割り当てられているかを一覧するには、次のサイトが有用である。
🌐 『Unicode - CyberLibrarian』
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/unicode/
組み合わせると、前者のサイトで文字番号を調べ、その文字の詳細情報や関連する別字についてを後者のサイトで詳しく知ることができる。
ところで、テキストデータとは結局ただの文字番号の
つまり文字そのものではないから、ある文字が正常に表示できるかどうかは文字種によらず、完全に環境次第となる。
よって、入力変換ソフトが〝環境依存〟と報告してくるような文字も、やはり使用を避けたほうが良い。
なお私見、文字表示が実際に正常にできるかどうかを確認するには、まずPCに比べれば環境がそこそこ整っていない、スマートフォン等で閲覧してみること。
また、縦書き表示に対応していない文字が多数あるので、特に記号を中心によく確認したほうが良い。
……継続した波線を記述するための「
それにしても、だいぶ前からコンピュータを使っての文章作成が、主流になっているもの。
にもかかわらず、それに関する留意点を体系的に解説する手引き、ないし国語辞書がまだ普及していないのは、残念に思われる。
†
📕【
〈アルファベットの
〝ヷヸヴヹヺ〟および〝ゔ〟がこれ。
📍V音の
古くから〝V音はB音とは異なる特殊な
これは、〝かつては〔
〈
ほか〔
そういった所から、〝〔
実際、V音とはまず{u}を意識し、そのまま空気の流れを止めずにどうにか振動だけさせて濁らせる感じの発音がおよそ相当するもの。
したがって、〝V音は
一方でB音は空気の流れを止める、つまり{っb}のようなイメージに近い。
ただし、日本語的にはV音も結局B音で発音するので、バ行で表記するのが不適切なわけではない。
だいいち、英語では母音の発音のほうが重要なのであり、およそ二十数種のそれが有るとされ、その表現に{アイウエオ}5音では圧倒的に不足する。
つまり、子音だけをいくら工夫してもムダなのであり、どのような表記であっても結局は正確にならない、というのが事実であるわけだ。
ので、「正直どうでもいい」というのがファイナルアンサーかもしれない(
ちなみに英語でも、歌唱内においてはV音はB音で発音されるが、これ理由わかる人教えてプリーズ(
発音のタイミングや
📍濁点ワ行とその奇異さ
コンピュータ上の文字体系では、かつて〝ヴ〟のみが存在し、これに小書きカタカナを添えて、V音を〝
Unicodeの登場により濁点ワ行が追加されて、コンピュータ上でも〝
ただ、筆記においてはその記述法はかつてから存在したが、しかし「ヷイオリン」のような表記には強い違和感も感じられ、あまり普及しているものではない。
なお、ひらがなについては〝ゔ〟のみが定義されている。
📍Unicode結合文字とその問題
ほか、Unicodeには「
この「◌゙ 結合文字」や「◌゚ 結合文字」を後置きする事によって、
• あ゙い゙ゔえ゙お゙ぁ゙ぃ゙ぅ゙ぇ゙ぉ゙ゔ゙がぎぐげごが゙ぎ゙ぐ゙げ゙ご゙ざじずぜぞざ゙じ゙ず゙ぜ゙ぞ゙だぢづでどだ゙ぢ゙づ゙で゙ど゙っ゙な゙に゙ぬ゙ね゙の゙ばびぶべぼば゙び゙ぶ゙べ゙ぼ゙ぱ゙ぴ゙ぷ゙ぺ゙ぽ゙ま゙み゙む゙め゙も゙や゙ゆ゙よ゙ゃ゙ゅ゙ょ゙ら゙り゙る゙れ゙ろ゙わ゙ゐ゙ゑ゙を゙ん゙ゎ゙愛゙死゙天゙流゙
• 〝ア゚イ゚ウ゚エ゚オ゚ァ゚ィ゚ゥ゚ェ゚ォ゚゚ヴ゚カ゚キ゚ク゚ケ゚コ゚ガ゚ギ゚グ゚ゲ゚ゴ゚ヵ゚ヶ゚サ゚シ゚ス゚セ゚ソ゚ザ゚ジ゚ズ゚ゼ゚ゾ゚タ゚チ゚ツ゚テ゚ト゚ダ゚ヂ゚ヅ゚デ゚ド゚ッ゚ナ゚ニ゚ヌ゚ネ゚ノ゚パピプペポバ゚ビ゚ブ゚ベ゚ボ゚パ゚ピ゚プ゚ペ゚ポ゚マ゚ミ゚ム゚メ゚モ゚ヤ゚ユ゚ヨ゚ャ゚ュ゚ョ゚ラ゚リ゚ル゚レ゚ロ゚ワ゚ヰ゚ヱ゚ヲ゚ン゚ヮ゚愛゚死゚天゚流゚
のように、無節操に濁点や半濁点を付与できる。
……濁点文字に半濁点ついたやつってどう発音すんのカーチャン(
ただし文字結合の実装は、
またフォントによっても、対応未対応がある。
そのため、環境によって表示が異なったり、文字化けしたりするため、やはりこれも使用は極力避けたほうが良く、入力方法もあえてここでは解説しない。
なお、結合文字はUnicodeにおいて、字形として単体で定義されているもの。
その観点で、それ自体は字形を意味しないサロゲート文字とは、別扱いである。
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます