ブン章のブン解

 まず、テキスト(Text)という単語は辞書で引くといくつかの意味が出てきます。ここで言うTextは「文章」あるいは「本文」の意味です。


 意外に思う方もいるかもしれませんが、文章にはさらに単語や文字と言った要素が含まれています。これらの要素に意味を持たせて接続したものが、文章になるわけですね。


 例えば、「私はインドゾウの上に地球を半分に割り乗せる」と言う文章を考えてみましょう。


 これを単語に分解すると例えば、「私、は、インドゾウ、の、上、に、地球、を、半分、に、割り、乗せる」と品詞や動詞などのセットに分解できます。


 このように分解してそれぞれの役割を特定する作業は形態素解析と呼ばれ、日常で使われる言葉(自然言語)を機械に読み取らせる際にはよく行われる処理です。身近な例では、キーボードで打ち込んだ平仮名を変換する際にこの処理が行われています(ただし、あなたが鍵盤楽器を弾いた場合はおそらくこの処理は行われません)。


 形態素解析について深く踏み込むことはしませんが、重要なことは「文字列が文章と呼ばれるためには意味が伴わなくてはならない」ということです。


 この事実は文字列の存在する場所がコンピュータの画面上であろうが、使い古されたノートの上であろうが、寝ている友人の額の上であったとしても、変わることはありません。この場合はおそらく、その友人の額に書かれた肉の文字は漢字の練習のために書かれたものではないでしょう(あるいは、インドゾウに地球を乗せる前に、動詞だけ取り除いてみるとわかりやすいかもしれません)。


 幸いにも、少なくとも私達がChatAIでなければ、この「文字列に意味をもたせる」という作業は長年の練習によって特に意識せずに行うことができます。


 しかし、コンピュータは(おそらく怠惰なために)この練習を積んでいません。そこで、コンピュータに文字列を文章として読ませてやるために設計されたのが Markup ということです。


 では、どのようにしてこの設計を実現させたのでしょうか。


 前ページの引用によれば、「要素はコンテンツのその部分の目的を説明するタグを使用してマークアップされ」ているようです。やはり解り難いですね。


 ここでいう要素とは「単語」や「文章」(= Text)のことです。


 ただし、文章と言っても本文全体のことではもちろんありません(そうであるならば、こんな量の文字をタイプしなくても済んだのですが)。


 本文全体(正確には、本文を含んだページ全体)を指す言葉は、この文脈ではコンテンツと呼ばれている部分です。


 では、本文全体の中で文章が「目的を説明するタグを使用してマークアップ」されているとは何を指すのでしょうか。

  • Twitterで共有
  • Facebookで共有
  • はてなブックマークでブックマーク

作者を応援しよう!

ハートをクリックで、簡単に応援の気持ちを伝えられます。(ログインが必要です)

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

マイページ
読書の状況から作品を自動で分類して簡単に管理できる
小説の未読話数がひと目でわかり前回の続きから読める
フォローしたユーザーの活動を追える
通知
小説の更新や作者の新作の情報を受け取れる
閲覧履歴
以前読んだ小説が一覧で見つけやすい
新規ユーザー登録無料

アカウントをお持ちの方はログイン

カクヨムで可能な読書体験をくわしく知る