第2部第2回「常用漢字表の改定で発生する、漢字政策の玉突き現象」に対する訂正のお知らせ

標記の記事について、重大な間違いがふくまれていることが分かりました。編集部に以下のような訂正文を送りましたが、実際に訂正されるまでしばらく時間がかかることが考えられます。そこでこちらで一足先に公開することにします。

◆訂正

 私は常用漢字表に略字体が追加された場合、JIS X 0213として考えられる対処は2つあるとして、その一方の「(1)従来の面区点位置はそのままに、2004年改正以前の略字体を空き領域に新規追加する」について、以下のように書いた。

 しかし、じつをいうとこれはあまり大きな問題にはならない。なぜならJIS X 0213は制定当初からJIS X 0208とは非互換だったからだ[*1]。たとえばJIS X 0213の制定目的の一つに、JIS X 0208では表現できなかった政令文字を総て収録するというものがあった。具体的には当時人名用漢字許容字体として運用されていた常用漢字異体字を収録したのだが、これによりJIS X 0213は制定当初からJIS X 0208と非互換となっていた[*2]。


 たしかに(1)のケースでは、例示字体同士で見ると一見大きな非互換のように思えるが、包摂の範囲同士を見るとJIS X 0208の範囲はJIS X 0213のものを包含している。83JISで大きな問題になった29区点のように、例示字体はもちろん包摂の範囲も変わってしまった非互換変更とは比較にならず、JIS X 0213制定時に発生した非互換と同種のものだ。つまり従来からの非互換を拡大はしても、新たに発生するような種類のものではない。おそらく規格票でJIS X 0208から包摂範囲が分離された面区点を明示する程度の改正になるはずだ(2001年の初版にも同様の記述がある)。それでも、この対応法が問題を引き起こさないのかというと決してそのようなことはない。これは後述する。

 ここにある「あまり大きな問題にはならない」という認識は間違いだった。仮にこの対処法をとった場合、JIS X 0208:1997及びJIS X 0213:2000との間に深刻な非互換問題が発生する。以下これについて詳しく説明するが、ここでは分かりやすさのためにJIS X 0208:1997に代表させる。JIS X 0213:2000については、区点40-04とあるのを面区点01-40-04に置き換えて読んでいただきたい。

 現状でJIS X 0208:1997においては、区点40-04に点なし「箸」を割り当てている。一方でここで説明した(1)の対処法とは、現行の点つき「箸」の例示字体を割り当てられた01-40-04はそのままに、空き領域の01-13-xxに点なし「箸」を追加する改正をおこなうというものだった。

 この対処法にもとづく改正JIS X 0213:20xxを実装した環境と、旧来のJIS X 0208を実装した環境との間で何が起こるだろう? それは同じ点なし「箸」を表示しているのに、一方のJIS X 0213:20xx環境では01-13-xx、他方のJIS X 0208:1997環境では区点40-04と違う符号位置であるという事態だ。つまりこのJIS X 0213:20xxでは、改正の前後で「同じ文字」に対して違う符号位置が割り当てられているという深刻な非互換が発生する。

 仮にこの改正をおこなった場合に影響を受ける環境として、たとえばシフトJISを実装する多くの携帯電話、そしてマイクロソフトWindows XP以前のOS、Mac OS Xバージョン10.4以前などが挙げられるだろう。シフトJISではJIS X 0208JIS X 0201を主な文字セットにするし、Windows XPでは日本語文字セットとしてJIS X 0208:1990とJIS X 0212Mac OS Xバージョン10.4以前では日本語文字セットとしてJIS X 0213:2000を実装する。これらの台数から社会的な影響は大きいと考えられる。しかし私の原稿はこれを見落としていた。読者の皆さんには深くお詫びするとともに、上記に引用にした部分を次のものに差し替える。

●正
 では、どんな非互換なのだろう。改正JIS X 0213:20xxを実装した環境と、旧来のJIS X 0208:1997を実装した環境があったと仮定して、双方で同じ点なし「箸」を表示しているのに、一方のJIS X 0213:20xx環境では01-13-xx、他方のJIS X 0208:1997環境では区点40-04と違う符号位置であるということになる。つまりこのJIS X 0213:20xxでは、改正の前後で「同じ文字」に対して違う符号位置が割り当てられているという深刻な非互換が発生する。


 この非互換が明確な形をとるのは情報交換だ。JIS X 0208:1997からJIS X 0213:20xxへ情報交換をした場合には、字体の変化は包摂の範囲にとどまり往復の保全性(次回で詳述)も確保されるが、逆の場合では、送るJIS X 0213:20xxでは「箸」だが受けるJIS X 0208:1997では空白領域なので、「・」「□」等が表示されてしまう。つまり文字化けだ。


 ここではJIS X 0208:1997の実装環境を例にとったが、同じことはJIS X 0213:2000を実装した環境でもおこる。JIS X 0213:2000はJIS X 0208:1997をそっくり内包しているからだ。この改正をおこなった場合に影響を受ける環境として、たとえばシフトJISを実装する多くの携帯電話、そしてマイクロソフトWindows XP以前のOS、Mac OS Xバージョン10.4以前などが挙げられるだろう。


 シフトJISではJIS X 0208JIS X 0201を主な文字セットにするし、Windows XPでは日本語文字セットとしてJIS X 0208:1990とJIS X 0212、同様にMac OS Xバージョン10.4以前ではJIS X 0213:2000を実装する。実際にここで検討しているような対処がおこなわれるのは、2010年春に予定されている常用漢字表を改訂の数年後となるはずだ。その段階ではこれらの環境は現在より減ってはいるだろうが、無視できる台数とは思えない。これを考えれば(1)の対処法の与える社会的な影響は大きい。


 また、関連して以下の部分を訂正する。

●誤
 このように多かれ少なかれ、どちらの対応をとっても不整合はおきる。それゆえに“常用漢字表の改定にあたっては、点のない略字体の「箸」を追加しないでほしい”という安岡氏の結論になるのだが、しかし本当に深刻な不整合は、時間もあったろうが氏の指摘しなかった点にある。それはどちらの対応を選択しても、JIS X 0221(=ISO/IEC 10646Unicode。以下、ISO/IEC 10646の略称である「UCS」で統一1)と非互換になってしまうことだ(図6)。同じ非互換でも、規格で定められた符号化方法が現在ほとんど使われていないJIS X 0208との非互換より、今まさに実装の主流を占めつつあるUCSとの非互換の方がインパクトは上だろう。しかもJIS X 0208は国内規格であるのに対し、UCSは国際規格であり影響は他国にも及ぶ。


●正
 ここで、字種候補案のうち問題になるのは「常用漢字表に印刷標準字体と違う字体=略字体が追加された場合」に限られることに注意してほしい。こうして“常用漢字表の改定にあたっては、点のない略字体の「箸」を追加しないでほしい”という安岡氏の結論になる。しかし逆に、いわゆる康煕字典体を追加すれば、ひとまず混乱はおきない。ここから常用漢字表の改訂にあたっては略字体ではなく、今までの国語施策の流れどおり印刷標準字体が追加されるだろうという予測が成り立つ(これについては後で再び検討する)。


 これは何を意味するのか。もう一度、図4にある問題になる字の一覧を見てほしい。ここに挙げられている斜線の左右の字体、略字体といわゆる康煕字典体は、いずれも包摂の範囲内におさまる違いしかない。ということは、ここまで検討してきたことは、以下のように言い直すことがだろう。すなわち「包摂の範囲内にある字体を新たに追加しようとした場合、どんな混乱がおこるか」であると。


 文字コード規格では字体の違いがあっても「同じ字」として区別しないことにしている。これが包摂の範囲だ。では、なにとなにが「同じ字」とできるか、どこからどこまでが「同じ字」か、さらに「同じ字」としたものをどう処理するか。じつは視点を日本の外に転じると、コンピュータにおける国際標準の世界は、10年ほど前からこの問題をめぐってさまざまな議論がおき、さまざまな対処がされてきた。それは現在もつづいている。


 日本はそうした状況における台風の眼の一つでもある。その理由として2000年の表外漢字字体表にはじまり、2001年のJIS X 0213制定、そして2004年の改正と、文字をめぐる動きがつづいたことも挙げられるが、日本では字体を細かく区別する傾向が少しずつ強くなってきており、それがこうした漢字政策に対する推進圧になり、さらに国際規格にも影響を与えていると考えられる。そして今、再び常用漢字表の改訂により大きな動きが始まろうとしている。いったい、これからどうなるのだろう? これを考えるために、国際規格やインターネット標準における「情報化時代」の現実を見ていきたいと思う。


 まずはJIS X 0221(=ISO/IEC 10646Unicode。以下、ISO/IEC 10646の略称である「UCS」で統一[*6])だ。先にJIS X 0213に対して略字体を追加する2つの対処法を検討した。そこで、同じようにそれぞれの対処がされた場合にUCSはどうなるかを見てみよう。やはりここでもJIS X 0213と同様、どちらの対応を選択しても非互換になってしまう(図6)。

      • -

[*5]……ISO/IEC 10646はISO(International Organization for Standardization国際標準化機構)とIEC(International Electrotechnical Commission:国際電気標準会議)の合同による国際的な公的規格(デジュール規格)。規格名を『Universal Multiple-Octet Coded Character Set』といい、UCSはその略称。これはWTO/TBT協定(貿易の技術的障害に関する協定)第2条第4項に基づき、JIS X 0221『国際符号化文字集合』として翻訳されている(http://www.meti.go.jp/policy/trade_policy/wto_agreements/marrakech/html/wto06m.html#02)。一方、Unicodeは国際的なIT企業や業界団体を会員とするUnicodeコンソーシアムによるデファクト規格。両者は文字セットを共有し、連携をとりながら規格開発を進めている。


 また図2を差し替える。以下に訂正後のバージョンを掲げる。



なお、上記の変更にともない小見出しの変更や追加をおこなったが、これについては省略させていただく。


                        • -

以上が訂正文です。この見落としはかなり大きなもので、責任は重く受け止めています。18日の時点で現在掲載されている分に続く第2部の後半を編集部に渡していますが、この掲載を取り止め連載を中止することも考えました。しかし上のような見落としをしていたとしても、これは最終的にこの原稿が言おうとしていることに直接の影響は与えないこと、そしてこの原稿が言おうとしていることはあまり他の人が書いておらず、多少の価値はあると考えられることから、最後まで書いて読者の皆さんの判断を仰ぐことにしました。

この点、どうかご了承いただきたいと思います。

なお、第2部の後半の掲載日が分かり次第お知らせしようと思いますが、おそらく近日中には公開されることと思います。