2006-03-01 あいかわらずバタバタしてますが 文字 国語研が1億語ものの大規模コーパス計画を打ち出した。 「書き言葉」1億語集約へ 辞書編集などへ応用期待(asahi.com) 書き言葉を対象にしたものであり、記事によれば〈常用漢字表の見直し、(略)など幅広い応用が期待される。〉とあるので、字体レベルまで分別可能であることが期待できそう。同様に〈公開できないのではあまり意味がない。〉とあるので、これは面白いことになりそう。関連して2日間にわたってシンポジウムを開催するとか。 第13回国立国語研究所国際シンポジウム「言語コーパスの構築と活用」