Sigilでダブリンコアにもとづいたメタ情報を入力する(下)

4月30日のエントリのつづき。じつは、前のを書き終わった時点でメタデータの入力は終わっていた、というよりそう思っていた。しかし定め無きこの世で、確かなことなど一つもない。大きな問題発覚。
それは、今回の我々が発行しようという電子書籍が逐次刊行物、要するに雑誌の創刊第1号だということ。

書籍とは一度限りの物だ。重版はするかもしれないが、これは基本的に同じ内容を印刷するもの。続編がある場合は続とか第2巻等がつくだけでなく、書名が変わる場合もある。ただし著者が変わることは、まずない。
一方で逐次刊行物は誌名は変わらないのが基本。毎号内容が違うものを、定期・不定期の違いはあれど、終わりを定めず継続して刊行する。さらに第○号など順序を示す表示がなされる。もちろん著者(というより執筆者)だって同じと限らない。このように書籍とは根本から形態が違うので、書誌の記述だって変わるだろうとは素人でも察しがつく。

あらためてダブリンコアで用意されているタグをみると、逐次刊行物を意味するような、例えば巻数・号数を示す等のタグが見当たらない。つまり自分が入力したメタデータのセットは、書籍用に他ならないと気づいた。これでは我々の刊行物を正確に記述したとは言えない。はてさて、どうすればよいのだろう?

そうした疑問をTwitterでつぶやいたところ、親切な識者の皆さんがお答えくださったのが以下のもの。

Sigilでダブリンコアにもとづいた逐次刊行物のメタ情報を入力する(togetter)

簡単にここでの議論をまとめると、以下のようになるだろう。

  • 現在のダブリン・コアだけでは、逐次刊行物を正確に記述することはできない。
  • したがって、ダブリン・コアに基づく現在のEPUB2でも、逐次刊行物を記述することはできない。
  • ダブリン・コア以外で逐次刊行物を含めたメタデータの標準にPRISM: Publishing Requirements for Industry Standard Metadata (PDF) がある。
  • しかし、SigilがPRISMに対応していないので(というよりEPUB2自体に未対応なので)、今回の場合は選択外。
  • 現在策定中のEPUB3では、このPRISMを取り入れ逐次刊行物に対応することも審議中。
  • もちろん、これが使えるようになるのは未来の話。実装されるのはさらに未来。だからこれも選択外。
  • 一方、国立国会図書館ダブリンコアメタデータ記述(DC-NDL)では、逐次刊行物に関してどのように規定しているか。
    • NDL蔵書目録および雑誌記事索引をダブリン・コア(DC-NDL)に対応させる一覧表が以下のもの
    • ただし、これは雑誌記事単位のメタデータを記述した物であり、ここでの目的である逐次刊行物としてのメタデータ記述とは目的がそぐわない。
      • 具体的に言うと、我々の目的では誌名が title 要素になるが、上記の対応表では記事名に割り当てられている。
    • 一方で、国立国会図書館デジタルアーカイブポータル(PORTA)では検索結果をXMLに出力するサービスがあるので、これを参照することで1冊単位の逐次刊行物のメタデータの記述法を観察することができる。
    • たとえば我々と似た形態である論文誌『国語語彙史の研究』メタデータは以下のように記述されている。
      • title要素は誌名+号数+「.」
      • creator要素は編集団体名+編
      • description要素を繰り返す形で、出版地、形態(総ページ数:サイズ)、注記、内容として全掲載論文名と執筆者名を「.」と全角空白で区切って記述、本体価格、NS-MARC番号。
      • publisher要素として版元名
  • またインプレスEPUBによる雑誌『On Deck』のcontent.opfは、以下の通り。
    • title要素は、誌名+年月日+号
    • creator要素は、社名
    • publisher要素も、社名
    • date要素はevent属性で年月日(発行日?)
    • identifier要素は、 opf:scheme属性で識別子“IRD”を指定し、雑誌名+号数を記述
      • この“IRD”という識別子が何を意味するのか不明。誰か教えて。
    • 以上で終わりという(言語は自明なので省略したが)、まことにシンプルなメタデータの記述方法。
  • 結局のところ、Sigilでの入力にそのまま使えるような逐次刊行物の標準や、その記述方法はない。
    • EPUB2が逐次刊行物に未対応、かつ世の中でEPUBメタデータを生かす仕組み自体が未整備というのが現状。
  • したがって、ユーザーはなるべく公的な標準を意識しつつ、自分で工夫して入力することになる。

このようにして、形態の似ているDC-NDLにおける『国語語彙史の研究』や『On Deck』での記述を参考にしつつ、自分でルールを決めて入力することになった。その結果が以下の画面。

そして、content.opfのうち、ここから生成されたmetadata要素を、そのまま引用すると以下のとおり。


論集文字 第1号
うさぱら有限会社
文字研究会
小形克宏
比留間直和
前川孝志
関口正裕
萩原正人
師茂樹
大石十三夫
内田明
小形克宏
application/epub+zip
2185-7687
ⒸMoji-Kenkyuukai, OGATA Katsuhiro, HIRUMA Naokazu, MAEKAWA Takashi, SEKIGUCHI Masahiro, HAGIWARA Masato, MORO Shigeki, 2011, Published in Japan.
http://id.ndl.go.jp/auth/ndlsh/00566335
http://id.ndl.go.jp/auth/ndlsh/00718485
http://id.ndl.go.jp/auth/ndlsh/00737938
http://id.ndl.go.jp/auth/ndlsh/00737936
http://id.ndl.go.jp/auth/ndlsh/00826341
http://id.ndl.go.jp/auth/ndlsh/00566684
Text
http://sites.google.com/site/mojiken/activities/5th_ws/20100811_ogata.pdf?attredirects=0
http://sites.google.com/site/mojiken/activities/5th_ws/20100811_hiruma.pdf?attredirects=0
http://sites.google.com/site/mojiken/activities/5th_ws/20100811_mahekawa.pdf?attredirects=0
http://sites.google.com/site/mojiken/activities/5th_ws/20100811_sekiguchi.pdf?attredirects=0
http://www.slideshare.net/mhagiwara/20100811-kanji-workshop-with-preciselytimed-corpus
http://sites.google.com/site/mojiken/activities/5th_ws/20100811_moro.pdf?attredirects=0
内容 : はじめに/改定常用漢字表を考える意味 小形克宏. 新聞表記と常用漢字表改定 比留間直和. 国語教育の現場から改定常用漢字表を考へる 前川孝志. 改正常用漢字表で情報システムはどうなるのだろう? 関口正裕. ウェブ上における使用実態統計から改定常用漢字表を考える 萩原正人. [資料紹介]漢字出現頻度数調査 師茂樹. [付録]改正常用漢字表 文化審議会答申 .
2011-05-03
2011-05-05
ja
urn:uuid:de2599ce-9b73-4bb0-bae8-3586f331e8eb

上記のポイントは以下の通り。

  • title要素はDC-NDLでの『国語語彙史の研究』のように誌名+号数(区切りは半角空白)
  • creator要素は同じく編集団体名(「編」はつけなかった)
  • publisher要素は版元*1
  • 執筆者はcontributor要素(貢献者)のopf:role属性として、「creator」を意味する識別子"cre"を指定
  • identifier要素はISSN属性でISSN番号を記入
  • rights属性として、奥付のⒸ表示をそのまま記入。編集団体+執筆者全員を並べているが、これは共同の著作物をあらわす記述法。
  • subject要素は前回エントリ参照
  • source要素も同じく
  • description要素はDC-NDLのように、内容として掲載論文を併記する形にした。ただし、電子雑誌なので出版地や形態等は省略。
  • identifier要素のopf:scheme属性は、Sigilが自動的に吐き出した物で、こちらは関知していない。

そこでの意図を一言でまとめると「なるべく逐次刊行物としての性格を際立たせようと努めた」ということになろうか。Togetterをよく読めば分かるとおり、ツィートした時点では、執筆者は著者を表わすcreator要素*2で記述しようと思っていた。しかし、DC-NDLでの記述をつらつらと眺めるうちに、逐次刊行物のcreator要素が、毎号違うのはおかしいことに気づいた。
おわかりだろうか。つまり執筆者名をcreator要素にすると、号によってその内容が変わることになる。単行本ならまだしも、逐次刊行物としては不自然だろうということ。
そこで、creator要素からは一段格の落ちるcontributor要素(貢献者)のopf:role属性として、「creator」を記述することにしたというわけだ。
ただし、注意してほしいのはrights属性にⒸ表示で執筆者名を併記していること。これは万国著作権条約に根拠を持つ財産権を保証する表示だから、メタデータでは格下でも、実際には執筆者を手厚く遇していることを意味する。


疲れてきたので、ここらへんで。最後に付言すると、上記のごとく結局title要素として「誌名+号数」を選んだわけだが、やはりこれは違和感が残る。逐次刊行物ならtitle要素は雑誌名だけが自然なはずだ。
よくよく見ると、「国語語彙史の研究」は逐次刊行物ではなく書籍の扱いだ。国会図書館PORTAで、他の逐次刊行物(ある大学の学会誌)を参照してみると、やはり誌名のみがtitle要素になっている。ただし、この場合はdescription要素として、今回の目的にはそぐわない「収蔵期間」が入る。
ここらへんは図書館に収納するために作られたDC-NDLの限界と言うべきかもしれない。目的が違うのだから仕方ないが、やはりEPUBで出版するためのメタデータとしては齟齬がある。つまり同じ書誌でも(専門の用語で何と呼ぶのか知らないが)収蔵情報と出版情報とでは記述方法が異なってくるということ。ここでは、もちろん出版情報を記述しようとしている。
ともあれ、逐次刊行物では、本来title要素は誌名単体。号数等は別の要素、あるいは属性というのが筋と言えるのではないか。この辺は将来を期待したいもの。


ええい、もう一つ書いておこう。Sigilにおける謎の挙動について。上記のごとくSigilで「creator」を指定するには、Meta Editorの画面で、「Add Adv.」のボタンを押し、「creator」を選ぶことになる(前回エントリ参照)。ところが、まったく同じ方法で入力しているにも関わらず、なぜか一旦この画面を閉じた後で再度開くと、「creator」として入力したはずのものが、「Author」欄に移動してしまっていることがある。下図のように。

そして忌々しいのは、この場合content.opfを開いてみると、意図せずしてcreator要素として書き出されてしまうことなのだ。以下のように。

文字研究会
小形克宏
比留間直和
前川孝志
関口正裕
萩原正人
師茂樹

なんなのでしょうね、これ? この上にある決定版のcontent.opfと比べてくださいな。この作業中にSigilのアップデータがきたので、原因は古いバージョン特有のものかと思ったら、新しいバージョン(ver. 0.3.4)でも再現した。しかし再現しない場合もあるのだ。法則性は今のところ不明。意図せずに対応する要素が変わってしまうのは、本当に困る。
結局、Meta Editorでの「Author」欄の対応先が、creator要素のopf:role="aut"なのか、それともcontributor要素のopf:role="cre"なのか、Sigil自身が決めかねているとも受け取れる。どっちでもいいから、安定した動作をしてくれの一言に尽きる。お宅のSigilはどうですか?

*1:エントリの趣旨とはずれるが版元について一言。文字研究会は非営利団体のため、営利を追求する版元にはなれない。そこで今回は、小形の会社が販売を代理する形で版元を引き受けることになった。

*2:Sigilでは「Author」欄に記入。