漢字字体規範データベースのurlが変更


もう10日くらい前に、池田先生からお知らせいただいていたのですが、もしやあまり周知されていないのではと思い、遅ればせながらお伝えします。以下のurlで、以前は引用文献が16だったのを、32に増強した上で公開されています。これらの多くは写本(もしくは影印)ですが、刊本(整版の宋版や活字版の慶長勅版など)も含まれてます。


いくつかの検索方法があるけれど、たとえば任意の漢字を検索窓に入力することで、その文字が各引用文献の中でどう書かれているのか、画像により一覧できるというすぐれもの。最大のポイントは信頼性の高い文献資料の画像データを、併置して見せてくれるというところにあります。

たとえばこのデータベースにより、デジタルフォントを含め活字として定型化される以前の文字が、どのように書かれていたかが一望の下に明らかになります。着、吊、笑、虎なんてあたりを検索すると面白いのではないのでしょうか。

『日本語の研究』第1巻第4号所載の「漢字字体規範データベース」*1では、このデータベースの概要が述べられています。興味のある人は国会図書館のサービスを通して複写を取り寄せるとよいのではないでしょうか*2

Unicodeベースで構築されているのだと思いますが、CJK互換漢字は、いったんJIS X 0208の包摂規準をベースにしたルールにより置き換えがなされた上で検索されます。たとえばFA64は「逸」に置き換えられるといったように。もっとも対象はBMPに限られるようで、1面以降のExtension B(例えば土吉など)はエラーになります。

それから、常用漢字表(当用漢字字体表)の新字体など異体字を持つものは、JIS X 0208の範囲内で全ての異体字が同時に検索、表示されます(たとえば医・醫/釈・釋/灯・燈/曽・曾/冨・富/竜・龍/体・躰・軆・體/剣・剱・劍・劒・劔・釼など)。ただし、それぞれの欄に表示される字体画像は、どのようなロジックによる違いなのか、一見しただけでは僕には分かりませんでした。

参考文献として、京都大学「東洋学へのコンピュータ利用第17回研究セミナー」レジュメ記載「漢字字体規範データベースとその応用」*3も挙げておきましょう。これらの論文には、このデータベースによって中国や日本の規範字体の変遷が、どのように見て取れるのかが書かれています。ぜひ読んでみてください。

*1:石塚晴道・豊島正之・池田証寿・白井純・高田智和・山口慶

*2:この論文の英・中・韓訳をウェブで公開することを計画中とか。ということは原文も公開するのでしょうね。一日も早い実現が待たれます

*3:石塚晴通・池田証寿・岡墻裕剛