あいかわらずバタバタしてますが

国語研が1億語ものの大規模コーパス計画を打ち出した。

書き言葉を対象にしたものであり、記事によれば〈常用漢字表の見直し、(略)など幅広い応用が期待される。〉とあるので、字体レベルまで分別可能であることが期待できそう。同様に〈公開できないのではあまり意味がない。〉とあるので、これは面白いことになりそう。

関連して2日間にわたってシンポジウムを開催するとか。

ついでといっては失礼ながら


3月には、他にも見逃せないシンポジウムがある。

どちらも行きたいなぁ。とくに京大のものは大変面白そうだ。安岡さんの1976年のJIS漢字案というのも気になるが、なんといっても漢字字体規範データベースの石塚先生が北海道からいらっしゃる様子(しかし本当にご本人が?)。

また川幡さんの報告も見逃せない。なぜならこの発表は、既に起きているUCS(≒Unicode)の重複符号化をIDS(Ideographic Description Sequence: 漢字構成記述文字列)を使って明確にし、少しでも信頼性を向上させようという、まことに英雄的な試みの途中報告のはずなのだ。うーん、なんとか行きたい。