芝野さん、安岡さんへのお答え


前のエントリへのコメントが長くなったので、新しいエントリを作りましょう。
まずは、ぼくの原稿を読んでくださったことにお礼申し上げます。その上でいただいたコメントを整理しようと思います。一番大きいと思われる問題の部分は、「第2部 新常用漢字表と文字コード規格 第5回 なぜUnicode正規化は生まれたか」にある、1988年9月時点のUnicodeの骨子をまとめたうちの、以下の部分です。

  • 合成ずみ文字を排除し、合成列により符号化する


つまり、最初期のUnicodeはアクセント記号付きのラテン文字を符号化する方法として合成列方式だけとしていたのが、UCSと合流する過程の中でISO 8859-1との互換をとらなければならなくなり、1990年3月にこれを廃棄、合成ずみ文字も収録したというのが上記の原稿内容でした。


前のエントリへのコメントでぼくが「ケアレスミス」と書いたものこそケアレスミスで、このコメントの内容は取り下げます。ただし、だからといって上記の原稿の内容に固執しているわけではありません。ぼくの書きたいことは「本当のこと」です。もしも書いた内容が間違っていたら、これまでしてきた通りお詫びして訂正するのみです。

その上で芝野さんからいただいたコメントですが、この論点に関しては以下がその指摘です。

Beckerの論文では,2ページの1.3 Technical summary of Unicodeで16bit fixed lengthとFixed one-to-one correspondenceが挙げられており,これは,IS0 2022やISO 6937などの合成アプローチを採用しないことを宣言していました。


この「Beckerの論文」とは、この原稿の註8で示した『Unicode 88』(1988年9月)のことです。芝野さんが引用された部分は2ページ目。ぼく自身はこの部分により、このときのUnicodeが、16ビット固定長であり、既存規格との一対一対応による互換(16ビット長なので符号位置は互換にできないので、レパートリとして互換にする)を基本方針としていたと理解したのですが、しかしこの部分が合成方法のことまで含意しているとは思いませんでした。この『Unicode 88』の中に合成列にするか否かの言及があればいいなと思っていたのですが、それが見つからなかったので、『Ten Years of Unicode』の記述に依ったというわけです。

これに関しては、安岡さんが以下のように指摘してくださっています。

「合成ずみ文字を排除し、合成列により符号化する」ですけど。これ、Unicode Draft 1 (1989年9月)の時点までは、Becker本人が「dynamic composition」という言い方で、かなり強く主張してた点ですよ。Unicode Draft 2 (1990年4月)でISO 8859-1互換を打ち出したので、取り下げざるを得なくなりましたけど。

ぼくの誤解かもしれませんが、これは1990年4月にUnicode Draft 2で取り下げられるまで、「dynamic composition」の名称でベッカーは合成列方式を主張していた、ということではないでしょうか。だとすると、現在の原稿の内容とおおむね一致します。


コメントを拝見すると「1988年9月時点のUnicodeは、合成列方式をとっていない」というご指摘のように思うのですが、ここまで書いたような理由で、よくその内容が理解できておりません。もしもよろしければ、この点についてお教えいただければ幸いです。

なお、安岡さんが出された『Unicode』(IEEE International Conference on Systems, Man, and Cybernetics 1990年10月 pp.499-504)ですが、安岡さんの『文字符号の歴史 欧米と日本編』の引用文献を拝見して、ぜひ読んでみたいと思い、各種WebCatを探したのですが、日本では見つけられませんでした。Unicode Draft1やDraft2も同様です。ぼくが依った文献はほとんど註に示したとおりです。基本文献ですので、なんとか読めないものかと現在も思っているのですが。

さっきも「Google News Archive Search」で1990年前後を「Unicode」等で検索してみたのですが、一番古いもので1991年2月のTHE NEW YORK TIMESですね(これはこれで興味深い内容ですが)。このあたりの文献に関しては、本当に苦労します。

また、『Ten Years of Unicode』の客観性にいささか不安があることはご指摘のとおりです。直接の筆者は外部ではあっても友好関係のライターのようですし。もしや刊行物かと思って調べてみたのですが、それらしいものは見つかりませんでした。そこで註5では「彼等自身の編集による」と断ったうえで引用しました。本文中では限定的な使用にとどめ、明確な資料と考えられる『Unicode 88』になるべく依ろうとしましたが、足りない部分はこれらを使用しました。


他にもお答えしなければならない点が残っていますが、それは追って書こうと思います。