キャラクターセットの情報交換からグリフセットの情報交換へ

Googleでいろいろ検索しているうちに、以下のような文章に巡り会いました。

漢字文化圏における文字コードの過去・現在・未来

この文章、JIS文字コードだけでなく、中国、韓国その他漢字使用国の文字コードの歴史を概観し、論点を整理、次のトレンドまで展望するという、全部で36ページにもなる非常な力作です。


大和総研の小川創生さんとおっしゃる方が執筆したもので、元は『DIR IT FOCUS』2005年9月号に掲載されたもののようです。こうしてネットで公開していただいたから読めたわけで、良い時代になったものです。ただ今、僕もよく似た趣旨の文章を書いているのですが、先行研究としてすごく参考になりました。


とくに終わりの方の〈グリフセットとグリフ識別子をどのように扱うかは、今後の規格化の焦点になると予想される。〉という部分、それから〈Unicodeが国際的な業界標準である現状を踏まえたうえで、「我が国」の文字コードUnicodeを介して漢字文化圏で共有されているのだという視点を持つことが必要である。〉という部分(いずれもp.33)、これは本当にその通りだと思います。


それから文字についてスッキリ視点が整理されていることも特徴。今まで僕はグリフ(Glyph)*1JIS X 0208などにおける「字体」と、本当に同じに考えてよいのかためらっていましたが、この文章ではきっぱり同じに定義しており、僕としては「そっか、これでよかったんだ」と力を得ました。となると、グリフを包摂したものが文字コード規格の「キャラクター」(正確には制御文字を除いた図形文字)であるということになりますね。こうすればAdobe-Japan1-5なんかのグリフセットを、JISなどのキャラクターセットと同じ文脈で論じ分けることができます。おお、一歩前進だ。


読み終わって思うことは、今後の文字実装の大きな潮流は、キャラクターセットの情報交換からグリフセットの情報交換へ移行するのではないかということ。これは日本の固有事情ですが、他国へも波及するかは分かりません(台湾とかね)。この文章を読む前には、「包摂の範囲内の字体を情報交換する技術」なんて言ってましたが(→PAGE2006のセッション事前打ち合わせ)、ようするにそういうことですね。いや、勉強させてもらいました。


ところで、末尾の参考文献で、僕の連載を挙げていただいているのは非常にありがたいのですが、じつはこれ、古いurlなんですよ。これをクリックするとINTERNET Watchのトップにリダイレクトされちゃいます。きっと昔から読んでいただいているんでしょうね。最近ほとんど更新していなかったから自業自得なのですが。

*1:キャラクターとグリフについては、ISO/IEC TR 15285を参照。