丁建勤(上海圖書館 上海 200031)
《書目記錄功能需求》 (Functional Requirements for Bibliographic Records,簡稱FRBR)是國際編目界的重要理論成果。FRBR模型以用戶需求為出發(fā)點,改變了傳統(tǒng)書目記錄的扁平結構,試圖以作品、內容表達、載體表現(xiàn)和單件(work、expression、manifestation、item)為層級來組織揭示資源,通過揭示書目記錄之間、書目記錄中各個描述對象之間的相互關系,使目錄成為一種方便用戶查找和瀏覽的聚合檢索工具。目前,F(xiàn)RBR模型的實現(xiàn)方式主要有非FRBR記錄的FRBR化顯示、直接編制和存儲FRBR記錄兩種[1]。
OCLC(Online Computer Library Center,聯(lián)機計算機圖書館中心)從2001年開始致力于FRBR 及其應用研究,并進行了一系列的實驗項目,其中一個就是探索使用一些算法聚合現(xiàn)有的作品及內容版本記錄。作品聚集的算法就是對每一個書目記錄生成一個著者/題名信息鍵(author/title key),然后利用這些信息鍵把作品集中到一起[2]。
中國國家圖書館基于Primo資源發(fā)現(xiàn)系統(tǒng)進行了國家書目FBBR化試驗,工作內容包括制定FBBR化規(guī)則、數(shù)據(jù)進入Primo前的規(guī)范化處理、Primo內部數(shù)據(jù)格式的生成和Primo前端檢索結果的展示等[3]。
通過改變元數(shù)據(jù)的現(xiàn)有結構和組成,實現(xiàn)按照FRBR模型對信息的各種實體及其屬性進行編目揭示是FRBR化的重要實現(xiàn)方式[1]。例如,中國國家圖書館曹寧主持的FRBR化實驗項目,通過新增自定義字段標識和處理規(guī)則,實現(xiàn)記錄的FRBR化標記和顯示[4]。
鑒于前(非)FRBR的MARC(Machine Readable Catalogue,機器可讀目錄)記錄的FRBR化處理存在一定的難度, MARC格式的FRBR化改造既可實現(xiàn)MARC記錄編制符合FRBR模型,又可避免新增自定義字段標識可能造成的數(shù)據(jù)交換困難,方便數(shù)據(jù)處理和展示。UNIMARC(Universal Machine Readable Cataloging,國際機讀目錄格式)永久委員會(The Permanent UNIMARC Committee ,簡稱PUC)致力于UNIMARC的持續(xù)更新,UNIMARC的FRBR化改造是其重要任務?!禪NIMARC手冊:書目格式》和《UNIMARC手冊:規(guī)范格式》(以下簡稱UNIMARC規(guī)范數(shù)據(jù)格式)的第3版及2012年更新版[5-6],包含了相當多的FRBR化改造成果。
UNIMARC規(guī)范數(shù)據(jù)格式“154編碼數(shù)據(jù)字段:題名”的$a子字段第1字符位為“實體類型代碼”,其用一個單字符代碼來表示實體的類型,其中“a”為作品,“b”為內容表達[7]。這表明規(guī)范數(shù)據(jù)描述對象包括FRBR第一組實體的作品和內容表達。《國際編目原則聲明》 (Statement of International Cataloguing Principles,簡稱ICP)5.1條款規(guī)定“一般而言,應為每一載體表現(xiàn)創(chuàng)建一條獨立的書目著錄”[8],因此,F(xiàn)RBR第一組實體和對應的UNIMARC處理格式的關系已相當清晰,如表1所示。
表1 FRBR第一組實體和對應的UNIMARC處理格式
應指出的是,ICP 5.2條款同時規(guī)定“書目著錄通常以作為載體表現(xiàn)代表的單件為基礎,并可包括屬于被體現(xiàn)的作品和內容表達的屬性”[8],因此UNIMARC書目數(shù)據(jù)格式依然可以描述作品和內容表達的部分屬性,如ISRC(International Standard Recording Code,國際標準音像制品編碼)(016字段)、 “首選檢索點(作品識別)”(506字段)、“首選檢索點(內容表達識別)”(507字段)等。應注意的是,UNIMARC書目數(shù)據(jù)格式以FRBR實體及其屬性為依據(jù),對某些字段進行了評估和重新定位,如100字段$a子字段的17~19字符位“閱讀對象”代碼屬于內容表達,擬通過新增書目數(shù)據(jù)和規(guī)范數(shù)據(jù)格式184字段(尚未正式發(fā)布)予以描述,184字段啟用后,100字段$a子字段的17~19字符位必須填“x”(不適用)。又如,書目數(shù)據(jù)格式101字段的$a子字段“正文、聲道等語種”、$b子字段“中間語種”、$c子字段“原著語種”、$d子字段“提要語種”、$j子字段“字幕語種”均為內容表達的屬性,若記錄編制符合FRBR,就不宜使用上述子字段,而應在規(guī)范記錄中予以描述。因此,書目數(shù)據(jù)可以沒有101字段(在沒有$e、$f、$g、$h、$i等載體表現(xiàn)子字段描述的情況下),反之可啟用新定義的第一指示符值“8”予以說明。
UNIMARC規(guī)范數(shù)據(jù)格式(2012年更新版)新增了FRBR第一組實體的作品、內容表達題名字段。其中作品層包括規(guī)范數(shù)據(jù)2--、4--、5--、7--字段的-31“規(guī)范檢索點——題名”字段、-41“規(guī)范檢索點——名稱/題名”字段,內容表達層包括規(guī)范數(shù)據(jù)2--、4--、5--、7--字段的-32字段“規(guī)范檢索點——題名”、-42字段“規(guī)范檢索點——名稱/題名”[6]。與此相適應,書目數(shù)據(jù)格式同步增加了506字段“首選檢索點(作品)”、507字段“首選檢索點(內容表達)”、576字段“名稱/首選檢索點(作品)”、577字段“名稱/首選檢索點(內容表達)”,如表2所示。
表2 FRBR實體屬性和UNIMARC題名字段一覽表
UNIMARC規(guī)范數(shù)據(jù)格式(2012年更新版)在52-字段前新增了5-1、5-2相關檢索點,分別用以描述作品和內容表達的相關創(chuàng)作者和實現(xiàn)(貢獻)者[6]。同時將6--字段“分類和實體歷史塊”更名為“主題分析和實體歷史塊”,并新增了60-、61-、63-、64-字段主題檢索點用以描述作品的主題,其中63-和64-字段分別為作品、內容表達的題名主題,如表3所示。
UNIMARC在進行FRBR化改造的同時,依然保留原先的某些字段,尤其是原先的“統(tǒng)一題名”(現(xiàn)名“首選檢索點”),以兼容前FRBR和非FRBR記錄。因此,一般而言先前記錄仍然可以使用,如表4所示。
表3 FRBR第一組實體的相關創(chuàng)作者、實現(xiàn)者、主題檢索點一覽表
表4 前(非)FRBR和FRBR記錄的題名字段表
FRBR作品和內容表達層應對應創(chuàng)建UNIMARC規(guī)范記錄,由于中文編目沒有復合標目的概念,因此,所謂對應的規(guī)范記錄主要是指以231或232字段為核心的數(shù)據(jù)。書目數(shù)據(jù)編制時,應注意查檢規(guī)范文檔,506、507字段直接引用規(guī)范記錄的231、232字段。對于一個作品存在多個內容表達及其載體表現(xiàn)的情況下,在引用作品和內容表達規(guī)范記錄數(shù)據(jù)元素的基礎上,添加載體表現(xiàn)屬性,將有助于提高編目質量和編目效率。
當規(guī)范文檔缺乏相應記錄時,應首先編制規(guī)范記錄。應指出的是,內容表達實體沒有題名屬性,換句話說,內容表達規(guī)范記錄中的題名子字段可以從作品規(guī)范記錄中復制,只需要在作品題名后附加屬性。因此,同一種書目數(shù)據(jù)是否需要同時描述506、507字段還有待于進一步探討。
當一種著作只有一種內容表達,而這種內容表達也只有一種載體表現(xiàn)時,國內有的實驗項目只建立一條載體表現(xiàn)層的元數(shù)據(jù),不再編制作品和內容表達的元數(shù)據(jù)[4]。
編目人員可以利用新增的501、502、511、512字段分別著錄作品和內容表達的創(chuàng)作者和實現(xiàn)者,利用6--字段描述作品的主題關系,以構建和完善書目關系。應注意的是,中文編目若能實現(xiàn)501、511字段的合理次序(如規(guī)定創(chuàng)作者著錄于第一個501、511字段,其后創(chuàng)作者著錄于后續(xù)的501、511字段),將彌補缺乏復合標目的缺陷,為后續(xù)FRBR化處理和顯示創(chuàng)造條件。
中國國家圖書館國家書目實驗表明,約有30%的書目數(shù)據(jù)可參與FRBR化聚合[3],即大部分書目記錄是一種著作的內容表達的載體表現(xiàn),因此這部分數(shù)據(jù)可以考慮暫時不予升級轉換處理。
一般而言,存量前(非)FRBR記錄的升級完善主要有兩種方式。一種是通過編寫算法進行數(shù)據(jù)轉換(包括必要的人工干預),尤其是在新舊系統(tǒng)更換所涉數(shù)據(jù)遷移時,可在分析存量書目數(shù)據(jù)編制特性的基礎上,同步完成數(shù)據(jù)清洗、作品和內容表達規(guī)范記錄的自動生成,減少編目工作量,為今后數(shù)據(jù)的進一步完善提供可能。應該看到,UNIMARC的FRBR改造和國內外前(非)FRBR記錄的FRBR化顯示處理,為存量書目數(shù)據(jù)升級轉換提供了有力支持。第二種方式是在FRBR化記錄編制時,通過作品和內容表達規(guī)范記錄的引用和創(chuàng)建,逐漸修改、完善所涉存量數(shù)據(jù)。
在現(xiàn)行MARC環(huán)境下,關注和思考MARC格式的FRBR化改造和記錄編制,不僅有利于MARC數(shù)據(jù)的FRBR化呈現(xiàn)和服務,也有助于今后可能進行的新型書目數(shù)據(jù)格式的MARC數(shù)據(jù)轉換處理。
[1]詹麗華.基于FRBR的信息組織的評價研究[J].圖書館雜志,2012(11):35-37.
[2]張俊娥.淺析OCLC的FRBR作品聚集算法[J].大學圖書館學報,2006(6):66-69,93.
[3]廖永霞.中國國家書目的FRBR化實踐與思考[J].圖書情報工作,2013,57(17):102-108.
[4]曹 寧.根據(jù)FRBR模型重新構造書目數(shù)據(jù)體系的探索[J].數(shù)字圖書館論壇,2008(5):43-48,75.
[5]UNIMARC Bibliographic,3rd edition. UPDATES 2012[EB/OL].[2014-01-03].http://www.ifla.org/node/7974.
[6]UNIMARC Authorities,3rd edition. UPDATES 2012[EB/OL].[2014-01-03].http://www.ifla.org/node/7950.
[7]維 勒.UNIMARC手冊:規(guī)范格式[M]《.中國機讀規(guī)范格式》工作組,譯.北京:國家圖書館出版社,2013:73.
[8]Statement of International Cataloguing Principles[EB/OL].[2014-03-15].http://www.ifla.org/publications/statement-of-internationalcataloguing-principles.