丁建勤(上海圖書(shū)館 上海 200031)
《書(shū)目記錄功能需求》 (Functional Requirements for Bibliographic Records,簡(jiǎn)稱(chēng)FRBR)是國(guó)際編目界的重要理論成果。FRBR模型以用戶(hù)需求為出發(fā)點(diǎn),改變了傳統(tǒng)書(shū)目記錄的扁平結(jié)構(gòu),試圖以作品、內(nèi)容表達(dá)、載體表現(xiàn)和單件(work、expression、manifestation、item)為層級(jí)來(lái)組織揭示資源,通過(guò)揭示書(shū)目記錄之間、書(shū)目記錄中各個(gè)描述對(duì)象之間的相互關(guān)系,使目錄成為一種方便用戶(hù)查找和瀏覽的聚合檢索工具。目前,F(xiàn)RBR模型的實(shí)現(xiàn)方式主要有非FRBR記錄的FRBR化顯示、直接編制和存儲(chǔ)FRBR記錄兩種[1]。
OCLC(Online Computer Library Center,聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心)從2001年開(kāi)始致力于FRBR 及其應(yīng)用研究,并進(jìn)行了一系列的實(shí)驗(yàn)項(xiàng)目,其中一個(gè)就是探索使用一些算法聚合現(xiàn)有的作品及內(nèi)容版本記錄。作品聚集的算法就是對(duì)每一個(gè)書(shū)目記錄生成一個(gè)著者/題名信息鍵(author/title key),然后利用這些信息鍵把作品集中到一起[2]。
中國(guó)國(guó)家圖書(shū)館基于Primo資源發(fā)現(xiàn)系統(tǒng)進(jìn)行了國(guó)家書(shū)目FBBR化試驗(yàn),工作內(nèi)容包括制定FBBR化規(guī)則、數(shù)據(jù)進(jìn)入Primo前的規(guī)范化處理、Primo內(nèi)部數(shù)據(jù)格式的生成和Primo前端檢索結(jié)果的展示等[3]。
通過(guò)改變?cè)獢?shù)據(jù)的現(xiàn)有結(jié)構(gòu)和組成,實(shí)現(xiàn)按照FRBR模型對(duì)信息的各種實(shí)體及其屬性進(jìn)行編目揭示是FRBR化的重要實(shí)現(xiàn)方式[1]。例如,中國(guó)國(guó)家圖書(shū)館曹寧主持的FRBR化實(shí)驗(yàn)項(xiàng)目,通過(guò)新增自定義字段標(biāo)識(shí)和處理規(guī)則,實(shí)現(xiàn)記錄的FRBR化標(biāo)記和顯示[4]。
鑒于前(非)FRBR的MARC(Machine Readable Catalogue,機(jī)器可讀目錄)記錄的FRBR化處理存在一定的難度, MARC格式的FRBR化改造既可實(shí)現(xiàn)MARC記錄編制符合FRBR模型,又可避免新增自定義字段標(biāo)識(shí)可能造成的數(shù)據(jù)交換困難,方便數(shù)據(jù)處理和展示。UNIMARC(Universal Machine Readable Cataloging,國(guó)際機(jī)讀目錄格式)永久委員會(huì)(The Permanent UNIMARC Committee ,簡(jiǎn)稱(chēng)PUC)致力于UNIMARC的持續(xù)更新,UNIMARC的FRBR化改造是其重要任務(wù)。《UNIMARC手冊(cè):書(shū)目格式》和《UNIMARC手冊(cè):規(guī)范格式》(以下簡(jiǎn)稱(chēng)UNIMARC規(guī)范數(shù)據(jù)格式)的第3版及2012年更新版[5-6],包含了相當(dāng)多的FRBR化改造成果。
UNIMARC規(guī)范數(shù)據(jù)格式“154編碼數(shù)據(jù)字段:題名”的$a子字段第1字符位為“實(shí)體類(lèi)型代碼”,其用一個(gè)單字符代碼來(lái)表示實(shí)體的類(lèi)型,其中“a”為作品,“b”為內(nèi)容表達(dá)[7]。這表明規(guī)范數(shù)據(jù)描述對(duì)象包括FRBR第一組實(shí)體的作品和內(nèi)容表達(dá)。《國(guó)際編目原則聲明》 (Statement of International Cataloguing Principles,簡(jiǎn)稱(chēng)ICP)5.1條款規(guī)定“一般而言,應(yīng)為每一載體表現(xiàn)創(chuàng)建一條獨(dú)立的書(shū)目著錄”[8],因此,F(xiàn)RBR第一組實(shí)體和對(duì)應(yīng)的UNIMARC處理格式的關(guān)系已相當(dāng)清晰,如表1所示。
表1 FRBR第一組實(shí)體和對(duì)應(yīng)的UNIMARC處理格式
應(yīng)指出的是,ICP 5.2條款同時(shí)規(guī)定“書(shū)目著錄通常以作為載體表現(xiàn)代表的單件為基礎(chǔ),并可包括屬于被體現(xiàn)的作品和內(nèi)容表達(dá)的屬性”[8],因此UNIMARC書(shū)目數(shù)據(jù)格式依然可以描述作品和內(nèi)容表達(dá)的部分屬性,如ISRC(International Standard Recording Code,國(guó)際標(biāo)準(zhǔn)音像制品編碼)(016字段)、 “首選檢索點(diǎn)(作品識(shí)別)”(506字段)、“首選檢索點(diǎn)(內(nèi)容表達(dá)識(shí)別)”(507字段)等。應(yīng)注意的是,UNIMARC書(shū)目數(shù)據(jù)格式以FRBR實(shí)體及其屬性為依據(jù),對(duì)某些字段進(jìn)行了評(píng)估和重新定位,如100字段$a子字段的17~19字符位“閱讀對(duì)象”代碼屬于內(nèi)容表達(dá),擬通過(guò)新增書(shū)目數(shù)據(jù)和規(guī)范數(shù)據(jù)格式184字段(尚未正式發(fā)布)予以描述,184字段啟用后,100字段$a子字段的17~19字符位必須填“x”(不適用)。又如,書(shū)目數(shù)據(jù)格式101字段的$a子字段“正文、聲道等語(yǔ)種”、$b子字段“中間語(yǔ)種”、$c子字段“原著語(yǔ)種”、$d子字段“提要語(yǔ)種”、$j子字段“字幕語(yǔ)種”均為內(nèi)容表達(dá)的屬性,若記錄編制符合FRBR,就不宜使用上述子字段,而應(yīng)在規(guī)范記錄中予以描述。因此,書(shū)目數(shù)據(jù)可以沒(méi)有101字段(在沒(méi)有$e、$f、$g、$h、$i等載體表現(xiàn)子字段描述的情況下),反之可啟用新定義的第一指示符值“8”予以說(shuō)明。
UNIMARC規(guī)范數(shù)據(jù)格式(2012年更新版)新增了FRBR第一組實(shí)體的作品、內(nèi)容表達(dá)題名字段。其中作品層包括規(guī)范數(shù)據(jù)2--、4--、5--、7--字段的-31“規(guī)范檢索點(diǎn)——題名”字段、-41“規(guī)范檢索點(diǎn)——名稱(chēng)/題名”字段,內(nèi)容表達(dá)層包括規(guī)范數(shù)據(jù)2--、4--、5--、7--字段的-32字段“規(guī)范檢索點(diǎn)——題名”、-42字段“規(guī)范檢索點(diǎn)——名稱(chēng)/題名”[6]。與此相適應(yīng),書(shū)目數(shù)據(jù)格式同步增加了506字段“首選檢索點(diǎn)(作品)”、507字段“首選檢索點(diǎn)(內(nèi)容表達(dá))”、576字段“名稱(chēng)/首選檢索點(diǎn)(作品)”、577字段“名稱(chēng)/首選檢索點(diǎn)(內(nèi)容表達(dá))”,如表2所示。
表2 FRBR實(shí)體屬性和UNIMARC題名字段一覽表
UNIMARC規(guī)范數(shù)據(jù)格式(2012年更新版)在52-字段前新增了5-1、5-2相關(guān)檢索點(diǎn),分別用以描述作品和內(nèi)容表達(dá)的相關(guān)創(chuàng)作者和實(shí)現(xiàn)(貢獻(xiàn))者[6]。同時(shí)將6--字段“分類(lèi)和實(shí)體歷史塊”更名為“主題分析和實(shí)體歷史塊”,并新增了60-、61-、63-、64-字段主題檢索點(diǎn)用以描述作品的主題,其中63-和64-字段分別為作品、內(nèi)容表達(dá)的題名主題,如表3所示。
UNIMARC在進(jìn)行FRBR化改造的同時(shí),依然保留原先的某些字段,尤其是原先的“統(tǒng)一題名”(現(xiàn)名“首選檢索點(diǎn)”),以兼容前FRBR和非FRBR記錄。因此,一般而言先前記錄仍然可以使用,如表4所示。
表3 FRBR第一組實(shí)體的相關(guān)創(chuàng)作者、實(shí)現(xiàn)者、主題檢索點(diǎn)一覽表
表4 前(非)FRBR和FRBR記錄的題名字段表
FRBR作品和內(nèi)容表達(dá)層應(yīng)對(duì)應(yīng)創(chuàng)建UNIMARC規(guī)范記錄,由于中文編目沒(méi)有復(fù)合標(biāo)目的概念,因此,所謂對(duì)應(yīng)的規(guī)范記錄主要是指以231或232字段為核心的數(shù)據(jù)。書(shū)目數(shù)據(jù)編制時(shí),應(yīng)注意查檢規(guī)范文檔,506、507字段直接引用規(guī)范記錄的231、232字段。對(duì)于一個(gè)作品存在多個(gè)內(nèi)容表達(dá)及其載體表現(xiàn)的情況下,在引用作品和內(nèi)容表達(dá)規(guī)范記錄數(shù)據(jù)元素的基礎(chǔ)上,添加載體表現(xiàn)屬性,將有助于提高編目質(zhì)量和編目效率。
當(dāng)規(guī)范文檔缺乏相應(yīng)記錄時(shí),應(yīng)首先編制規(guī)范記錄。應(yīng)指出的是,內(nèi)容表達(dá)實(shí)體沒(méi)有題名屬性,換句話說(shuō),內(nèi)容表達(dá)規(guī)范記錄中的題名子字段可以從作品規(guī)范記錄中復(fù)制,只需要在作品題名后附加屬性。因此,同一種書(shū)目數(shù)據(jù)是否需要同時(shí)描述506、507字段還有待于進(jìn)一步探討。
當(dāng)一種著作只有一種內(nèi)容表達(dá),而這種內(nèi)容表達(dá)也只有一種載體表現(xiàn)時(shí),國(guó)內(nèi)有的實(shí)驗(yàn)項(xiàng)目只建立一條載體表現(xiàn)層的元數(shù)據(jù),不再編制作品和內(nèi)容表達(dá)的元數(shù)據(jù)[4]。
編目人員可以利用新增的501、502、511、512字段分別著錄作品和內(nèi)容表達(dá)的創(chuàng)作者和實(shí)現(xiàn)者,利用6--字段描述作品的主題關(guān)系,以構(gòu)建和完善書(shū)目關(guān)系。應(yīng)注意的是,中文編目若能實(shí)現(xiàn)501、511字段的合理次序(如規(guī)定創(chuàng)作者著錄于第一個(gè)501、511字段,其后創(chuàng)作者著錄于后續(xù)的501、511字段),將彌補(bǔ)缺乏復(fù)合標(biāo)目的缺陷,為后續(xù)FRBR化處理和顯示創(chuàng)造條件。
中國(guó)國(guó)家圖書(shū)館國(guó)家書(shū)目實(shí)驗(yàn)表明,約有30%的書(shū)目數(shù)據(jù)可參與FRBR化聚合[3],即大部分書(shū)目記錄是一種著作的內(nèi)容表達(dá)的載體表現(xiàn),因此這部分?jǐn)?shù)據(jù)可以考慮暫時(shí)不予升級(jí)轉(zhuǎn)換處理。
一般而言,存量前(非)FRBR記錄的升級(jí)完善主要有兩種方式。一種是通過(guò)編寫(xiě)算法進(jìn)行數(shù)據(jù)轉(zhuǎn)換(包括必要的人工干預(yù)),尤其是在新舊系統(tǒng)更換所涉數(shù)據(jù)遷移時(shí),可在分析存量書(shū)目數(shù)據(jù)編制特性的基礎(chǔ)上,同步完成數(shù)據(jù)清洗、作品和內(nèi)容表達(dá)規(guī)范記錄的自動(dòng)生成,減少編目工作量,為今后數(shù)據(jù)的進(jìn)一步完善提供可能。應(yīng)該看到,UNIMARC的FRBR改造和國(guó)內(nèi)外前(非)FRBR記錄的FRBR化顯示處理,為存量書(shū)目數(shù)據(jù)升級(jí)轉(zhuǎn)換提供了有力支持。第二種方式是在FRBR化記錄編制時(shí),通過(guò)作品和內(nèi)容表達(dá)規(guī)范記錄的引用和創(chuàng)建,逐漸修改、完善所涉存量數(shù)據(jù)。
在現(xiàn)行MARC環(huán)境下,關(guān)注和思考MARC格式的FRBR化改造和記錄編制,不僅有利于MARC數(shù)據(jù)的FRBR化呈現(xiàn)和服務(wù),也有助于今后可能進(jìn)行的新型書(shū)目數(shù)據(jù)格式的MARC數(shù)據(jù)轉(zhuǎn)換處理。
[1]詹麗華.基于FRBR的信息組織的評(píng)價(jià)研究[J].圖書(shū)館雜志,2012(11):35-37.
[2]張俊娥.淺析OCLC的FRBR作品聚集算法[J].大學(xué)圖書(shū)館學(xué)報(bào),2006(6):66-69,93.
[3]廖永霞.中國(guó)國(guó)家書(shū)目的FRBR化實(shí)踐與思考[J].圖書(shū)情報(bào)工作,2013,57(17):102-108.
[4]曹 寧.根據(jù)FRBR模型重新構(gòu)造書(shū)目數(shù)據(jù)體系的探索[J].數(shù)字圖書(shū)館論壇,2008(5):43-48,75.
[5]UNIMARC Bibliographic,3rd edition. UPDATES 2012[EB/OL].[2014-01-03].http://www.ifla.org/node/7974.
[6]UNIMARC Authorities,3rd edition. UPDATES 2012[EB/OL].[2014-01-03].http://www.ifla.org/node/7950.
[7]維 勒.UNIMARC手冊(cè):規(guī)范格式[M]《.中國(guó)機(jī)讀規(guī)范格式》工作組,譯.北京:國(guó)家圖書(shū)館出版社,2013:73.
[8]Statement of International Cataloguing Principles[EB/OL].[2014-03-15].http://www.ifla.org/publications/statement-of-internationalcataloguing-principles.