あいかわらずバタバタしてますが

国語研が1億語ものの大規模コーパス計画を打ち出した。

書き言葉を対象にしたものであり、記事によれば〈常用漢字表の見直し、(略)など幅広い応用が期待される。〉とあるので、字体レベルまで分別可能であることが期待できそう。同様に〈公開できないのではあまり意味がない。〉とあるので、これは面白いことになりそう。

関連して2日間にわたってシンポジウムを開催するとか。