パブリックコメントへの応募(書きかけ先行公開版) [2]

パブコメ応募を考えている皆さん、頑張ってますか〜? その後、修整したり加えたりしたものを公開します。「頬、填、剥、叱」については、前回のエントリにあるような符号化文字云々はバッサリ削りました。今さら根幹部分に文句を言っても仕方ない。これは「頬、填、剥、叱」に変更がなかった際の原稿用にとっておくことにします。

また、前回のパブコメ審議では字種、音訓、字体、総合という分類をおこなったと記憶しますので、見出しにこれを掲げました。見出しそのものも、なるべく内容が端的に分かるようにしました。

前回から、あまり内容の変わってない「諜」への疑問、読み書き能力調査の件は省略しました。12月19日のエントリをご参照ください。

下記以外に、「表の見方」の書き方が混乱している件(都道府県名漢字、「*」の示し方)、それに「<>」ではなく「〈〉」を使うべきことを書こうと思っているのですが、最後までいくかなあ。

DTP方面の人々は、試案で「<>」が引用符として使われているのは気にならないのでしょうか? これ、おかしいですよね。

JIS X 4051では、「<>」と「〈〉」では文字クラスが異なります。この結果、試案では「<>」の前後のアキ量が本来と異なってしまい、読みやすさを損なっています。文化庁が自分達の政策を広く受け入れてもらいたいと願うなら、経済産業省の政策である工業標準をあからさまに無視するのは避けるべきと思う――なんてことを書こうと思っているんですが、時間がないなあ。誰か書かないかなあ……。ま、名指しはしませんが。

〔字体〕「頬、填、剥、叱」は携帯電話で文字化けを起こす

以下、JIS X 0208例示字体を「頬A、填A、剥A、叱A」、試案にある通用字体を「頬B、填B、剥B、叱B」、一括して呼ぶ場合は前者を「A字体」、後者を「B字体」と呼ぶ(なお、前回も書いたが、ISO-2022-JPでは試案の字体をすべて表現できないにも関わらず、それへの配慮がないままパブリックコメントをメールで受け付けたことを、私は大変残念に思っている)。

情報機器から試案をみたとき、最大の問題点は現在の携帯電話のほとんどは「頬B、填B、剥B、叱B」を符号化できないことだ。これらB字体はJIS X 0213に収録されているが、現在の携帯電話のほとんどはそれよりも文字数の少ないJIS X 0208の文字セットに基づいている。この結果、携帯電話のほとんどはB字体が符号化できない。

これについて、私は『INTERNET Watch』誌(インプレス)に以下のような文章を寄稿した。


あらためて簡単にまとめると、試案「表の見方」にある「付」の一文により、現在の携帯電話等ではB字体が表示できないという問題は免罪される。

情報機器に搭載されている印刷文字字体の関係で,本表の掲出字体とは異なる字体(中略)しか用いることができない場合については,当該の字体の使用を妨げるものではない。(試案、p.2)

しかし、すべての問題が解決するわけではない。たとえば、Windows Vista以降やMac OS X10.1以降等のパソコンから、携帯電話にB字体をメールするとどうなるか。この場合、ほとんどの携帯電話はB字体を符号化できないので、「?」などの意味不明な文字に置き換えてしまう。こうして、前掲「表の見方」の一文は画面表示や印刷の問題は解決できても、情報交換・情報処理などの前には力を失ってしまう。

この問題が厄介なのは、「新しい常用漢字表にもとづこう」と考えた善意の人が、意識せずに文字化けを撒き散らすことになることだ。内閣府がおこなった調査『主要耐久消費財等の普及率(一般世帯)』によると、2009年3月における携帯電話の世帯普及率はじつに90.3パーセントにのぼる。このようなほとんどの国民の持つ機器が、前述の文字化けをおこす可能性をもつ。試案が「情報化時代への対応」を謳う以上、この問題への対処を怠るべきではない。

しかし、現実には解決はむずかしいと言わざるを得ない。根本的にはA字体を通用字体にするか、これらの文字の収録そのものを取り止めることでしか解決は望めないからだ。一部にはA字体を許容字体にするよう提案する声もある。それも一案だが、結局は画面表示を解決するにとどまる限定的な対策であることは指摘しておきたい。

問題となる4文字のうち、「叱」については「凸版調査(3)」で「叱A」が1,837位、「叱B」が2,168位と、試案に収録されなかった字体の方がむしろ頻度が高いことが分かっている*1。また、国語研究所の「現代日本語書き言葉均衡コーパス」でも「叱」については同じ使用実態が明らかになっており、同所の高田智和氏もこの字について「「印刷標準字体」(引用者註:叱B)よりも第1水準・第2水準の字体(引用者註:叱A)の方が、印刷文字としては普及している」*2と指摘する。

試案は追加字種における字体の考え方として、「当該の字種における「最も頻度高く使用されている字体」」を採用したことを掲げている(試案、p.(12))。そうであるなら、試案は「叱B」を採用すべきではなかった。また、もともと表外漢字字体表で「叱A」は印刷標準字体の個別デザイン差であることから、「叱A」が通用字体になることへの抵抗も少ないと考えられる。

しかし、残りの「頬A、填A、剥A」に対しては、使用頻度の点からいっても、またこれらが表外漢字字体表の簡易慣用字体ではないことからいっても、これらを通用字体にすべきとは思えない(国語研究所「現代日本語書き言葉均衡コーパス」でもこれらA字体の頻度は低い)。しかし、前述のようにB字体のままでは文字化けが発生するわけで、私自身も悩みながらこの文章を書いている。これら3字を許容字体にすることは最低限度の措置として、いっそ収録中止を考えてもよいかもしれない。

[字種]「楷」の収録を支持するが、「錮」は削除せよ

 試案でもっとも基本となる考え方は「コミュニケーションの手段としての漢字使用」だ。この考え方に立てば、あまりに頻度が低い字は追加すべきではない。しかし、ある字がどのようにして「頻度が低い」とできるかは、必ずしも自明ではない。

頻度については『漢字出現頻度表 順位対照表(Ver.1.3)』という資料が公開されている。そこでこの資料を使って、追加字種の中から「頻度が低い字種」をあぶり出そうとしたのだが、残念ながら中途で断念せざるを得なかった。

まず、ここには順位のみで使用頻度数が記載されていない。日本の漢字においては2,000字弱が9割以上を占める一方、残り1割以下を埋めるのに数万字が必要となることが知られている(この有り様は、ジップの法則として知られている)。1位と500位の頻度の差はきわめて大きいけれど、2,500位と3,000位の差はより少なくなる。3,000位と3,500位の差はさらに少ないはずだ。また、どのような頻度調査でも上位100を占める漢字はさほど変わらないが、2,000位の前後100文字は調査ごとに変わってくる。

つまり頻度の低い漢字は、ちょっとしたサンプルの異同で大きく順位が変動する。したがって、低頻度の漢字を検討する際には十分に慎重であるべきだ。なのに使用頻度を伏せられたまま順位だけで比較すれば、結果は恣意的なものにならざるを得ない。そもそもこの資料は、なぜか凡例が省略されており、意図するところが十分には理解できない。なぜこのような不完全な資料を公開したのか、不可解に思う。

そのような理由で、漢字小委員会が公開しているデータの範囲では、客観的な字種の検討は不可能といえる。十分な調査結果の公開がなされなかったことを残念に思う(ついでながら、今回の調査の目玉といえる『出現文字列頻度数調査』が一切公開されていないことも大変残念だ)。そこで、ここでは客観的な資料を必要としない範囲で、言えるだけのことを言おうと思う。

第2次試案で追加されたうち、「楷」は外すべきではない。公共性が高いからだ。この字は凸版調査(3)では順位外ときわめて頻度が低い。しかし、この字は役所の窓口におかれている申込用紙などでよく使われている(交ぜ書きの「かい書」もよく見かける)。そうした性質上、頻度調査では実態が明らかになりづらい。ある意味で頻度が低いのも当然だ。しかし、この字が常用漢字表に入れば、役所の窓口やそこに来る人々は助かるはずだ。

反面で、同じ順位外でも「錮」は外してよい。「禁固」という十分普及した言い換えがあるからだ。もしかしたら、この字を提案した内閣法制局なりに「禁固」では言い換えができない切実な理由があるのかもしれない。しかし、漢字小委員会に提出された資料『新常用漢字表に追加すべき漢字について』には、これについて言及がない。主張されていない以上は、言い換えはできるとするのが適当だろう。したがって、この字は不要と考えられる。

*1:『漢字出現頻度数 順位対照表(Ver.1.3)』p.37、p.44

*2:JIS X 0213:2004運用の検証』国立国語研究所、2009年、p.26