例示字体の恣意的あるいは便宜的なものであること

ogwata2006-02-08


ある人が「山本さんのコメント、むずかしくて分かりづらい」と言っていた。なるほど、山本さんは突き詰めて考える質の人だから、万人向けとは言いづらいかもしれない。僕が理解している範囲で、文字コード規格における例示字体が、どうして恣意的で便宜的なものであるか、書き留めておこう。


たぶん、これを分かってもらう一番良い例は、図として掲げたJIS X 0213における旧人名用漢字許容字体表の文字だろう(現在はすべて人名用漢字)。これらは、すべての法定文字をJISで符号化させるためにJIS X 0213に収録されたもの。で、注意して欲しいことはこれらには包摂範囲はないってことです。JIS X 0213規格票のp.35「6.6.3.1 漢字の字体の包摂規準の適用」に、

C) 次の面区点位置には、包摂規準を適用しない

として、上記の文字が指定されております。なぜか? それは、「人名用漢字許容〈字体〉表」というくらいで、これは字体を決めたのものなので、他の字体を包摂したら、正確な字体の再現ができないからであります。つまり、これらに関しては他の文字とは違う特権的な扱いであると言うことができるでしょう。これがつまり「便宜的」ということの例です。


と言ってべつに悪い事じゃないです。日本の文字コードが日本人の名前の字体を正確に再現できることは当然のこと。だけど、それはあくまで「規格の都合」、あるいは「符号化の都合」であって、自然な文字のあり方とは異質のものです。この「符号化の都合」とは、言葉を換えれば「恣意的」ということですね。つまり一種のフィクションであると。


文字を符号化するという作業には、上記のような人間くさい話がたくさん付きまといます。きれいに割り切れるものじゃないんですね。山本さんがコメントでおっしゃった、

頻度調査などを用いることで、具体的な字形があるprototypicalな例示字形に収束するはずだという想定は、あくまで一つの文字に一つのコードを割り当てるという目的意識がある場合にだけ便宜的に成り立つわけです。

というのは、こうしたことを言い当てようとしたものだと思います。