ぼくの大好きな符号化文字

ときどき私的な席で「どんな仕事をしてるんです?」と聞かれます。「フリーライターです」と答えるとたいていは納得してくれますが、なかには「で、どんなものを書いてるんです?」と突っ込んでくる人もおられる。

すると、はたと考え込んでしまいます。もちろん自分がどんなことを書いているかは分かっている。同時に、それがすごく面白いと思っているから原稿に書いているわけです。でも、その面白さを専門外の人にも分かりやすく説明するって、案外むずかしいものです。もっとも、それをすることは自分の足下を見つめ直すことになるのかもしれません。


1989年の印刷文字

ぼくの専門は符号化文字です。文字コードとかフォントとか、符号化文字に関わる全般。このブログでこのところ集中的に取り上げている常用漢字表の改定も、そうした視点から見ています。では、その符号化文字とはなにか?

もう20年以上も前、1989年だったと思います。手塚治虫が亡くなった際、朝日新聞の社説に追悼文が掲載されました。内容はとても手塚に好意的なもので、当時多くの人が抱いた喪失感をよく表していたと記憶します。

うろ覚えで恐縮ですが、冒頭で当時の電車の中の風景を描写していました。電車に乗れば多くの人がマンガ雑誌を立ち読みしていると。外国から来た人はその風景に驚くけれど、それは日本ではごく当たり前のことなのだ。そして、その多くの人が読んでいるマンガを、今日たらしめた人こそが手塚治虫だ。そんなことを書いていたはずです。

ここで手塚について立ち入るつもりはありません。期せずしてこの追悼記事は、印刷文字が主流だった時代の情景を描写していたことを指摘したいのです。今電車に乗ればマンガを読んでいる人は少数派で、ではほとんどの人々が何をしているかというと携帯電話を見ていますね。時代は変わりました。そのディスプレイに表示されているのが符号化文字です。パソコンなどデジタル機器はみな同じ。一方で、マンガや小説など紙に印刷されたのが印刷文字というわけです。

ずっと前、印刷文字を指して「紙の上のシミ」と評した人がいました。彼はそうした「シミ」と違い、デジタル・テキストは自由自在に編集・整形が可能であることを強調しようとしたのですが、この表現は文字としての新旧の違いも、よく表していたように思います。

紙に印刷された途端、文字は固定され、定型化しますね。消しゴムでこすっても消えないし、用紙が上等なものなら100年以上その形をとどめるでしょう。その定型性、永続性こそが印刷文字の美点だったわけです。面白いことに符号化文字はそれとは正反対です。

符号化文字とは不定形なもの

まず符号化文字の特質として挙げるべきは、不定形であるという点です。符号化文字の実体は不可視の電気信号です。その高低の組み合わせを符号として使っています。電気信号だから人の目には見えません。必要なときに限ってフォントを使って「文字の形」を見えるようにします。この「限って」というのがポイントで、つまり機械にとっては「文字の形」など見える必要はないわけです。

一例を挙げると、携帯電話同士でメールをやり取りするとして、あなたの携帯電話に表示されたメールの文字「そのもの」が、相手の携帯電話に表示されるわけではありません。あなたの携帯電話が送信するのは符号だけです。そして、それを受信した相手の携帯電話は、内蔵しているフォントを使ってディスプレイに文字を表示させるわけです。

符号化文字の場合、あなたの見ている文字の形「そのもの」が、相手に届くわけではない。このことは、一つにはあなたのパソコンで表示させているのがゴシック体でも、相手は明朝体かもよ、というような意味なのですが、別の意味でもあります。たとえ同じ明朝体であっても、じつは微妙に文字の形は違うものなのです。下図をご覧下さい。

ここに掲げる2つの明朝体は、どちらもかなり前からパソコンや出版物で使われている、実績のあるものです。しかし赤い矢印を見て分かるとおり、左は「士」なのに、右は「土」ですね。今はかなり整理されましたが、10年以上前はこのような微妙な違いはもっとたくさんありました。

この違いは、どちらが正しくてどちらが間違っているということではありません。フォントは1字ずつ人間が書いているのですから、このような違いがでるのも、ある意味で当然です。しかしここで伝えたいのは、フォントの豆知識ではありません。

前述のとおり、符号化文字である以上、送信側と受信側は必ず別々のフォントによって文字を表示させています。そうであるなら、上図のような違いがでるのもまた当然だといえないでしょうか。符号化文字にとって、このような違いが生じることは前提条件です。むしろ符号化文字とは、人々がそうした些細な違いに気づかないことによって成り立っている技術だといえるでしょう。

一方で、印刷文字はこういうことは絶対にありません。印刷会社で印刷された本が、トラックで運ばれて本屋さんに並ぶ。その本をあなたが買って開いた途端に文字が変わるなんてことはないですね。あなたが読むのは印刷会社が印刷した文字の形「そのもの」です。これと比べれば、符号化文字はなんと不安定で危ういものでしょう。

符号と文字の形の対応をきめる「約束事」

ではもう一つ、符号化文字の不安定なところを体験してみましょう。インターネット・ブラウザで「エンコーディング」などのメニューを操作して、今とは違う項目に切り替えてみてください。それまできちんと読めていた画面が、一瞬にして意味不明の文字群に変わるはずです(下図)。

これが文字化けです。符号は、ある「約束事」にもとづいて文字の形に割り当てられています。この約束事が文字コードです。これには多くの種類があります。符号としては同一でも、約束事が変わればそれに対応する文字も変わるのです。上図でいうと、上の画面「符」にあたる符号と、下の画面「隨ヲ」にあたる符号は同一です(ちなみに言うと「E7 AC A6」という符号です)。同じ符号でも、約束事が変えられたので違う文字になってしまったわけです。

符号がきちんと人の読めるような文字の形として表示されるのは、メーカーが「約束事」を守った結果にすぎない。これが符号化文字のもつ、もう一つの「危うさ」です。約束は守るのが当然という人もいるでしょうが、逆にいえば約束を破れば読めなくなるわけです。

人間のやることです。そのつもりがなくても、知らずに破ってしまうということもあるでしょうし、なにかの不具合で意図せず破ってしまうことだってあるでしょう。また、現代ではいくつものシステムが組み合わさって動作するのが普通です。その中のたった一つが約束に違反しただけでも、全体に悪影響を及ぼして文字化けにつながることもあるでしょう。

つまり、あなたが機械で読んでいる符号化文字は、複雑に入り組んだシステムが、全て順調に動いているから読めるだけなのです。どうも危ういと思いませんか。これも、あの懐かしい印刷文字にはない性質です。

符号化文字の美点

ここまで、符号化文字とはもともと不定形で、その不定形さに人々が気づかないことによって成り立っていること、そして符号と文字の形の対応は「約束事」で決められているに過ぎず、それを意識的に守ることによって初めて人が読めるようになること、この2つの特質について述べました。これらのことは従来の印刷文字にはない「危うさ」でもあります。でも安心してください、符号化文字にはそうしたデメリットを上回る素晴らしい美点があります。

たとえば編集・加工が容易になり、便利な検索・置換もできるようになりました。また劣化しない完全な複製ができるようになりました。それから伝達が容易になることで情報の流動性が飛躍的に高まりました。これらはパソコンやインターネットの普及は当然ですが、それ以前の問題として符号化文字という技術、つまり「文字の形」ではなく、符号を操作の対象とすることで初めて実現したことだといえます。もちろん、どれも印刷文字にはできないことばかりです。

世の中には「デジタル」「情報」「流通」「革命」等々の単語を織り込んだ書籍、あるいはウェブページがあふれています。そこにこめられた主張はともかくとして、ぼくなどは思うのです。それらはまずもって、符号化文字という技術がもたらした現象ではないでしょうかと。なんで、それが気にならないのかなあ。

おわりに

まあ、そうした華々しい主張は知識のある方々にお任せしましょう。餅は餅屋でありまして、ぼくはむしろ前の方で長々と書いた、符号化文字のいささか危ういところに惹かれるのです。だって「気づかないこと」で成り立っているんですよ。だったら、とことん気づいてみたいと思うじゃないですか。さらに「約束事」! なんと人間臭く、なんと儚いのでしょう。完全無欠な約束事など、あるわけがない。そこに、ぼくの飯の種がある。

以上、ずいぶん長文になってしまいましたが、ぼくの守備範囲としている符号化文字について、専門用語は一切抜きにして、なるべくわかりやすく書いてみました。しかし、むずかしいですね。望むらくは、こういう文章をいろんなところで書ければよいのですが。