郝嘉樹
摘要:文章梳理了國(guó)外近些年開展的名稱規(guī)范項(xiàng)目,對(duì)各項(xiàng)目和相關(guān)研究進(jìn)行介紹和評(píng)價(jià):認(rèn)為項(xiàng)目中使用的方法有傳統(tǒng)的人工維護(hù)、基于著者交互的自規(guī)范和自動(dòng)名稱消歧等3種維護(hù)模式,各模式各有優(yōu)劣;同時(shí),認(rèn)為規(guī)范數(shù)據(jù)的語(yǔ)義化、開放化和關(guān)聯(lián)化、多種維護(hù)模式相結(jié)合的大資源規(guī)范控制、越來越方便用戶使用和從標(biāo)目向唯一標(biāo)識(shí)符方向發(fā)展,是未來名稱規(guī)范發(fā)展走向和趨勢(shì)。
關(guān)鍵詞:名稱規(guī)范項(xiàng)目;名稱規(guī)范維護(hù)模式;開放關(guān)聯(lián)數(shù)據(jù);大資源規(guī)范控制;用戶便利性;唯一標(biāo)識(shí)符
中圖分類號(hào):G254 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.11968/tsyqb.1003-6938.2016042
1.引言
我國(guó)名稱規(guī)范控制工作存在一些突出的問題,如依賴于自上而下、由領(lǐng)域內(nèi)少數(shù)權(quán)威機(jī)構(gòu)維護(hù)的模式使得名稱規(guī)范控制能力跟不上資源增長(zhǎng)的速度,面對(duì)海量數(shù)據(jù)完全由編目員承擔(dān)的方式耗費(fèi)人力財(cái)力而又效率偏低,MARC格式和交換協(xié)議使我國(guó)名稱規(guī)范封閉在圖書館環(huán)境內(nèi),限制了數(shù)據(jù)的開放、交換和使用,等等。與此同時(shí),近幾年計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的發(fā)展使規(guī)范控制的環(huán)境和對(duì)象悄然發(fā)生著變化,展現(xiàn)出一些新的走向,如面對(duì)越來越以人為中心組織資源的趨勢(shì),名稱規(guī)范急需尋找擺脫困境的出口。
了解國(guó)外開展的項(xiàng)目與借鑒他國(guó)名稱規(guī)范控制工作的模式與經(jīng)驗(yàn),并掌握和跟隨最新的發(fā)展趨勢(shì),從而引領(lǐng)我國(guó)名稱規(guī)范控制工作走出困境是解決問題的一大出路。但目前我國(guó)對(duì)他國(guó)名稱規(guī)范相關(guān)項(xiàng)目尚無系統(tǒng)的介紹,相關(guān)研究也只是散落于個(gè)別文獻(xiàn)中。針對(duì)該情況,本文對(duì)國(guó)外近些年開展的名稱規(guī)范項(xiàng)目進(jìn)行了梳理和評(píng)價(jià):對(duì)項(xiàng)目中使用的方法進(jìn)行了總結(jié),歸納出名稱規(guī)范維護(hù)模式的類型,并分析各類型的優(yōu)劣,給出使用建議:在此基礎(chǔ)上,對(duì)名稱規(guī)范發(fā)展趨勢(shì)進(jìn)行歸納和分析。
2.國(guó)外名稱規(guī)范項(xiàng)目
2.1NACo與VIAF
NAC0(Name Authority Cooperative Program,名稱規(guī)范合作項(xiàng)目)和VIAF(virtual International Autllority File,虛擬國(guó)際規(guī)范文檔)分別由LC PCC(Library of Congress Program for Cooperative Cataloging,美國(guó)國(guó)會(huì)圖書館編目合作項(xiàng)目)和OCLC(OnlineComputer Library Center,聯(lián)機(jī)圖書館中心)牽頭于1976年和2003年開始實(shí)行。兩個(gè)項(xiàng)目都聯(lián)合了若干國(guó)家、地區(qū)圖書館和相關(guān)機(jī)構(gòu)參與合作,目的同為構(gòu)建大規(guī)模的名稱規(guī)范檔并可用于共建共享,但在成員管理、數(shù)據(jù)制作與提交和服務(wù)理念方面NACO和VIAF存在以下差異。
(1)在成員管理方面,NACO會(huì)給成員提供完整的培訓(xùn)課程,并且授權(quán)后才能開始工作以保證數(shù)據(jù)質(zhì)量,VIAF則不提供培訓(xùn),主要讓成員配合解決數(shù)據(jù)分歧和沖突方面的問題;NACO成員主要參加業(yè)務(wù)交流和名稱規(guī)范相關(guān)政策及標(biāo)準(zhǔn)的制定等,VIAF除讓成員制定VIAF政策外,還需提供運(yùn)營(yíng)方面的建議并幫組推廣VIAF的使用。
(2)在數(shù)據(jù)制作與提交方面,NACO對(duì)成員提交的數(shù)據(jù)質(zhì)量要求較高,需按照一系列的標(biāo)準(zhǔn)和規(guī)則建立和維護(hù)規(guī)范記錄,對(duì)有維護(hù)能力的機(jī)構(gòu)規(guī)定每年提交的數(shù)量,其他的則參與NACO的數(shù)據(jù)質(zhì)量監(jiān)控;OCLC也規(guī)定成員數(shù)據(jù)要符合VIAF政策和范例,并且要求成員能提供大量的能明顯提升VIAF數(shù)量的規(guī)范文檔,同時(shí)還得提交書目數(shù)據(jù)。
(3)在提供服務(wù)方面,NACO專注于成員數(shù)據(jù)之間的共編和共享,而VIAF更加強(qiáng)調(diào)服務(wù)理念,提供世界上主要名稱規(guī)范文檔的便捷獲取服務(wù),并于2012年由項(xiàng)目轉(zhuǎn)變成為OCLC服務(wù),將各國(guó)名稱規(guī)范檔進(jìn)行映射,可提供名稱的多種形式和變體,并附有著者的著述、合著者等內(nèi)容信息,另外與Wikipedia(維基百科)、ISNI(Imernntional StandardName Identifier,國(guó)際標(biāo)準(zhǔn)名稱標(biāo)識(shí)符)等合作將應(yīng)用范圍拓展到圖書館以外的領(lǐng)域。
(4)LC與OCLC都較早開始對(duì)開放關(guān)聯(lián)數(shù)據(jù)進(jìn)行研究及應(yīng)用。LC主要采用MODS對(duì)LCNAF(Li brary of Congress Name Authority File,國(guó)會(huì)圖書館名稱規(guī)范檔)進(jìn)行語(yǔ)義化描述,并開發(fā)了基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的BIBFRAME(書目框架),規(guī)范數(shù)據(jù)是其中四種數(shù)據(jù)類型之一。OCLC主要采用Schema.org和SKOS對(duì)VIAF進(jìn)行語(yǔ)義化描述,并研發(fā)了VIAF的關(guān)聯(lián)數(shù)據(jù)服務(wù)。
2.2NameProject
由于機(jī)構(gòu)知識(shí)庫(kù)在英國(guó)大量增長(zhǎng)導(dǎo)致文獻(xiàn)的著者名稱需要規(guī)范控制,JISC(Joint Inform~ion SystemCommittee,聯(lián)合信息系統(tǒng)委員會(huì)1于2008年聯(lián)合87家機(jī)構(gòu)倉(cāng)庫(kù)開展了Names Proiect項(xiàng)目,以尋找唯一辨識(shí)英國(guó)科研產(chǎn)出者的方法。為進(jìn)一步推進(jìn)項(xiàng)目發(fā)展,JISC要求各機(jī)構(gòu)提交執(zhí)行規(guī)范控制的調(diào)查文檔,并于2009年發(fā)布最終報(bào)告,報(bào)告內(nèi)容包括名稱規(guī)范控制現(xiàn)狀、界定用于名稱規(guī)范服務(wù)所需要的數(shù)據(jù)元素集和試驗(yàn)性系統(tǒng)的需求分析。并最終于2013年從Zetoc、EthOS、Je-S等機(jī)構(gòu)知識(shí)庫(kù)抽取數(shù)據(jù)構(gòu)建了試驗(yàn)原型系統(tǒng),該系統(tǒng)包含5萬個(gè)人和機(jī)構(gòu)數(shù)據(jù),提供簡(jiǎn)單查詢功能,可返回作者的文獻(xiàn)列表。
Name Project為解決文獻(xiàn)類資源的名稱規(guī)范控制提供了可行方案,其從已有數(shù)據(jù)源中搜集名稱方面數(shù)據(jù)的做法可用來自動(dòng)產(chǎn)生相當(dāng)規(guī)模的名稱規(guī)范數(shù)據(jù)用于更廣范圍的共享。該項(xiàng)目的特點(diǎn)是沒有為著者建立規(guī)范標(biāo)目,而是為每個(gè)作者分配ID,可連接作者名稱的不同形式,并通過ID聚合發(fā)布文獻(xiàn)。該做法更像是檢索控制而不是規(guī)范控制,由于資源類型的差異,該項(xiàng)目建立的規(guī)范數(shù)據(jù)與LCNAF重復(fù)率很低。
2.3ULAN
Getty公司構(gòu)建的ULAN(Union List of Artist Names,藝術(shù)家名稱聯(lián)合列表)于1984年開始籌建,起初為自身項(xiàng)目提供受控的藝術(shù)家名稱,后將服務(wù)對(duì)象擴(kuò)展到博物館、圖書館、檔案館和藝術(shù)類書目項(xiàng)目,為搜索藝術(shù)家提供檢索點(diǎn)、編目提供標(biāo)準(zhǔn)名稱和作為研究工具。ULAN于90年代改變列表形式采用敘詞表結(jié)構(gòu)表示數(shù)據(jù),出版形式為印刷本,目前因數(shù)據(jù)量大改為網(wǎng)絡(luò)版,并提供數(shù)據(jù)下載。
ULAN的數(shù)據(jù)維護(hù)方法與圖書館傳統(tǒng)方式一樣由專職人員負(fù)責(zé),無法滿足大量新增資源規(guī)范控制的需要。ULAN秉承Gettv制作敘詞表的做法和經(jīng)驗(yàn),目前完全根據(jù)用戶的需要和反饋新建規(guī)范記錄,并且采用敘詞表結(jié)構(gòu)表示數(shù)據(jù),揭示的內(nèi)容增加了等級(jí)結(jié)構(gòu)和擴(kuò)展了相關(guān)關(guān)系種類,并描述了名稱類型、語(yǔ)種、新舊程度和是否與LC重復(fù)等。
2.4Stylometry
S州ometry(文體學(xué))起初用于經(jīng)典文學(xué)作品中匿名作品的身份識(shí)別,后來隨機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,有學(xué)者將其用于當(dāng)代著述中同名著者的區(qū)分。著者無意識(shí)和根深蒂固的寫作風(fēng)格會(huì)在著述中通過各種特征表現(xiàn)出來,因此可以通過計(jì)算機(jī)統(tǒng)計(jì)特征來分析著者寫作風(fēng)格,幫助區(qū)分同名著者作品。利用Stylometry開展同名著者作品的區(qū)分要根據(jù)文獻(xiàn)類型提取能體現(xiàn)文體風(fēng)格的識(shí)別特征指標(biāo),設(shè)計(jì)各識(shí)別指標(biāo)的統(tǒng)計(jì)方法和公式,并采用N-gram、支持向量機(jī)等計(jì)算同名著者作品的相似程度。
2.5IDs
文獻(xiàn)數(shù)據(jù)庫(kù)文章數(shù)量巨大,重名、別稱、翻譯問題、名字變動(dòng)和西方名字縮寫現(xiàn)象嚴(yán)重,導(dǎo)致系統(tǒng)無法辨析著者的唯一性。從2005年開始資源出版商和服務(wù)商相繼推出Research ID、Scopus Author ID、Pubmed author ID和arXiv Author ID等,即為文章著者分配能唯一標(biāo)識(shí)其學(xué)術(shù)身份的標(biāo)識(shí)符,旨在消除姓名混淆和重名問題。這些著者唯一標(biāo)識(shí)解決方案有各自的目標(biāo)和應(yīng)用邊界,削弱了著者標(biāo)識(shí)符的辨識(shí)度,阻礙了與外界的共享。
針對(duì)以上情況,近幾年出現(xiàn)了ORCID(Open Researcher and Contributor Identifier,開放研究者和貢獻(xiàn)者標(biāo)識(shí)符),目的是解決各系統(tǒng)間著者姓名混淆和識(shí)別問題。ORCID在兼容性方面建立與各系統(tǒng)著者標(biāo)識(shí)符的關(guān)聯(lián),并將著者相關(guān)信息和科研情況聚合起來;在共享性方面不限語(yǔ)言、機(jī)構(gòu)和地理限制,免費(fèi)向全球?qū)W術(shù)界開放并提供服務(wù),這種擴(kuò)大數(shù)據(jù)和服務(wù)范圍的做法才能真正起到不同著者唯一身份辨識(shí)的作用。有學(xué)者對(duì)用戶參與維護(hù)自身信息的積極性提出質(zhì)疑,但有研究表明從事學(xué)術(shù)研究的人員希望自己的文獻(xiàn)和相關(guān)信息被傳播和得到認(rèn)同,并有動(dòng)力參與此類活動(dòng)。
2.6AND
AND(Automatic Name Disambiguation,自動(dòng)名稱消歧)是利用機(jī)器學(xué)習(xí)方法對(duì)著者文獻(xiàn)信息特征進(jìn)行自動(dòng)分類及聚類,從而將同一人的作品聚合在一起,而將不同人的作品分開的過程。國(guó)內(nèi)外有較多開展AND技術(shù)的研究,主要分為基于監(jiān)督和非監(jiān)督兩類方法,其中以Han H等人的最具代表性,兩類方法都實(shí)現(xiàn)了人名自動(dòng)消歧?;诒O(jiān)督的方法中,Han H等人在標(biāo)注訓(xùn)練集的基礎(chǔ)上利用文獻(xiàn)信息的題目、出版物名稱和合著者,分別采用Naive Bayesian(樸素貝葉斯)和SVM(支持向量機(jī))對(duì)文獻(xiàn)作者進(jìn)行排歧,同時(shí)解決了同名和名稱變體兩個(gè)問題:后來為彌補(bǔ)監(jiān)督學(xué)習(xí)方法的不足,Han H等人提出Kway聚類算法,該算法將每個(gè)文獻(xiàn)看作一個(gè)特征向量,仍采用題目、出版物名稱和合著者作為特征,并用TF-IDF(逆文檔頻率)和NTF(標(biāo)準(zhǔn)詞項(xiàng)頻率)計(jì)算權(quán)重,文獻(xiàn)之間采用余弦函數(shù)形成相似度矩陣,最終將同一人的作品聚合在一起。兩種方法對(duì)來自網(wǎng)絡(luò)資源的消歧準(zhǔn)確率分別為90%以上和58%。
2.7FOAF
FOAF(Friend-of-a-Friend,朋友的朋友)是用定義好的RDF詞匯表形式化描述個(gè)人信息和其相關(guān)的社會(huì)網(wǎng)絡(luò),其本質(zhì)為描述個(gè)人的簡(jiǎn)單本體。它由Dan Brickley和Libby Miller于2000年創(chuàng)建,遵循W3C體系,最初只描述個(gè)人,后擴(kuò)展到各類群體,如機(jī)構(gòu)、公司和地點(diǎn),F(xiàn)OAF描述詞匯歷經(jīng)10次更新于2014最終確定下來不再更改。
FOAF在名稱與主題規(guī)范數(shù)據(jù)中得到廣泛應(yīng)用。名稱規(guī)范檔中的VIAF和LCNAF、主題詞表LCSH、Agrovoc和AAT等都用FOAF進(jìn)行語(yǔ)義化描述。FOAF包含姓名、出生日期、興趣、職業(yè)、項(xiàng)目、發(fā)表的著作以及和其他人之間的關(guān)系等內(nèi)容,可用來完善名稱規(guī)范數(shù)據(jù)附加成分和單純參照,提高名稱規(guī)范數(shù)據(jù)質(zhì)量,另外FOAF可通過URI(Uniform Resource Identifier,統(tǒng)一資源標(biāo)識(shí)符)和詞匯集的關(guān)聯(lián)自動(dòng)發(fā)現(xiàn)和整合開放數(shù)據(jù)集合中特定人的相關(guān)信息,用于名稱規(guī)范數(shù)據(jù)的資源發(fā)現(xiàn)和共享。
2.8ISNI
ISNI作為ISO標(biāo)準(zhǔn)始于2007年,目的是為創(chuàng)作和發(fā)布內(nèi)容產(chǎn)品的責(zé)任人(包括研究人員、出版機(jī)構(gòu)、發(fā)明家、程序員和表演者等)分配一個(gè)永久的唯一標(biāo)識(shí)符,同時(shí)讓ISNI在全球范圍的知識(shí)庫(kù)使用從而使作品可以無歧義的歸屬其作者。ISNI數(shù)據(jù)庫(kù)目前由30家機(jī)構(gòu)和數(shù)據(jù)庫(kù)、40家國(guó)家和研究類型的圖書館組成,有近9百萬ISNI標(biāo)識(shí)符,提供檢索工具用于查詢ISNI號(hào),并可作為關(guān)聯(lián)數(shù)據(jù)重要部分應(yīng)用于語(yǔ)義網(wǎng)。
ISNI機(jī)制將對(duì)圖書館名稱規(guī)范產(chǎn)生重大影響。ISNI對(duì)于唯一標(biāo)示符的分配把控嚴(yán)格,多樣查重后才賦予新ISNI號(hào)以保障著者名稱標(biāo)識(shí)的權(quán)威性和全球唯一性:還開發(fā)映射算法與其他機(jī)構(gòu)數(shù)據(jù)庫(kù)匹配用于搜集、補(bǔ)充和完善著者信息,并與來源數(shù)據(jù)庫(kù)保持同步實(shí)現(xiàn)ISNI的實(shí)時(shí)更新。以上機(jī)制保證ISNI在全球范圍的通用性和唯一性,如同ISBN的實(shí)施措施,隨著ISNI的普及圖書館OPAC、機(jī)構(gòu)知識(shí)庫(kù)、文獻(xiàn)數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)資源等的人名識(shí)別將迎刃而解,不再需要大量人員維護(hù)規(guī)范數(shù)據(jù)和掛接文獻(xiàn),工作重點(diǎn)也轉(zhuǎn)移到用戶注冊(cè)、查重與質(zhì)量認(rèn)證。
2.9FRAD和BIBFRAME Authority
FRAD(Functional Reqmrements for Authority Data,名稱規(guī)范數(shù)據(jù)的功能需求)是IFLA FRBR家族中的一部分,于2009年被IFLA編目組和分類標(biāo)引組常務(wù)委員會(huì)批準(zhǔn),它擴(kuò)充了FRBR第二組實(shí)體(相關(guān)責(zé)任者)的概念模型,為名稱規(guī)范提供了一個(gè)明確定義的結(jié)構(gòu)化參考框架。該框架中,用更接近真實(shí)情況的E-R模型(實(shí)體關(guān)系模型)描述責(zé)任者及其屬性,還有與其他實(shí)體的關(guān)系,改變了MARC格式扁平、線性和單一的表示形式。
FRAD模型除包含名稱規(guī)范數(shù)據(jù)中承載的信息外,為迎合用戶需求具體定義了16個(gè)實(shí)體和各實(shí)體包含的屬性以及四大類關(guān)系,并提供明確的定義及結(jié)構(gòu)。FRAD用實(shí)體(Entity)描述責(zé)任者,用屬性揭示責(zé)任者特征幫助用戶進(jìn)行查找和辨識(shí),用關(guān)系反映責(zé)任者之間的立體、網(wǎng)狀關(guān)系,以便用戶在書目世界“航行”。
BIBFRAME作為表達(dá)書目數(shù)據(jù)的新方法用于取代世界各國(guó)沿用至今的MARC,使得書目數(shù)據(jù)在整個(gè)互聯(lián)網(wǎng)能得到便捷的交換、發(fā)現(xiàn)和共享,其中的BIBFRAME Authority(比圖書館傳統(tǒng)的Authority含義更加廣泛,囊括主題規(guī)范等方面的內(nèi)容)既實(shí)現(xiàn)了傳統(tǒng)的規(guī)范控制功能,又有網(wǎng)絡(luò)資源規(guī)范控制的特點(diǎn),如對(duì)數(shù)據(jù)的結(jié)構(gòu)化描述以及與外部RDF數(shù)據(jù)的關(guān)聯(lián)。
BIBFRAME Authority中發(fā)布的與名稱規(guī)范相關(guān)的類為代理,包含人、機(jī)構(gòu)和會(huì)議等5個(gè)子類,包括的詞匯有name、alternative name、authority link、data、control code和description等。BIBFRAME Authority與其它規(guī)范控制方法并非競(jìng)爭(zhēng)關(guān)系,而是作為一個(gè)輕量級(jí)的抽象層定義規(guī)范數(shù)據(jù)如何與作品和實(shí)例關(guān)聯(lián),以及如何指向已有的規(guī)范數(shù)據(jù),使得規(guī)范控制在互聯(lián)網(wǎng)環(huán)境下更加有效的發(fā)揮作用。
2.10UTL
UTL(University of Tennessee Library,田納西大學(xué)圖書館)針對(duì)小型圖書館沒有充足的人力、時(shí)間等資源構(gòu)建名稱規(guī)范檔制定了相應(yīng)的策略。UTL首先將圖書館書目中所有著者羅列為一張表,并記錄著者頻次及出處,再根據(jù)制定的標(biāo)準(zhǔn)篩選出需要規(guī)范的著者,該標(biāo)準(zhǔn)規(guī)定著者頻率大于3或者是有名的人物才建立名稱規(guī)范記錄:其次到LCNAF和VIAF中尋找該著者的名稱規(guī)范形式,在沒有匹配情況下才新建記錄:最后通過列表中出處到書目庫(kù)搜集著者相關(guān)信息。并通過網(wǎng)絡(luò)、各種工具書和數(shù)據(jù)庫(kù)進(jìn)行完善。
該策略對(duì)少產(chǎn)或無名著者不建立規(guī)范記錄,將精力集中于真正需要消除歧義的著者名稱上,并利用已有的規(guī)范檔減少工作量,節(jié)省了人力和時(shí)間,適合資源有限的圖書館,也是快速構(gòu)建本地名稱規(guī)范檔從無到有的有效模式。
2.11BibApp
BiBApp是由伊利諾伊大學(xué)香檳分校和威斯康星大學(xué)麥迪遜分校圖書館聯(lián)合開發(fā)的用于搜索校園專家的一款軟件,最新版本為2011年發(fā)布的BibAppl.1。該軟件可方便的管理研究人員的科研成果、瀏覽他人相關(guān)信息及成果,并能輕松的找到項(xiàng)目合作人。圖書館對(duì)名稱規(guī)范的維護(hù)和應(yīng)用可借鑒BibApp軟件,通過用戶參與幫助消除同名作者歧義,并開發(fā)相關(guān)功能供用戶使用,同時(shí)又注重友好性體驗(yàn)。另外圖書館可以從BibApp這類的應(yīng)用中收割信息幫助識(shí)別和完善名稱規(guī)范數(shù)據(jù)。
3.名稱規(guī)范維護(hù)的模式及分析
從國(guó)外開展的名稱規(guī)范項(xiàng)目和研究之中可以得出當(dāng)前名稱規(guī)范維護(hù)模式主要有三種類型,本文對(duì)它們的優(yōu)勢(shì)和劣勢(shì)進(jìn)行分析并提供使用建議,以幫助相關(guān)機(jī)構(gòu)選擇開展名稱規(guī)范維護(hù)的方法和模式。
3.1三種維護(hù)模式
(1)傳統(tǒng)的人工維護(hù)模式。傳統(tǒng)的人工維護(hù)模式采用自上而下、由領(lǐng)域內(nèi)少數(shù)權(quán)威機(jī)構(gòu)的專業(yè)編目人員維護(hù)名稱規(guī)范以及掛接書目數(shù)據(jù),各國(guó)家圖書館名稱規(guī)范檔、ULAN和UTL都采用該種維護(hù)模式;另外也有像網(wǎng)絡(luò)社區(qū)、社交軟件等自發(fā)、小規(guī)模的通過人工維護(hù)進(jìn)行身份辨識(shí)和消除重名問題的應(yīng)用。
傳統(tǒng)人工維護(hù)模式主要依據(jù)相關(guān)標(biāo)準(zhǔn)和管理系統(tǒng)進(jìn)行名稱規(guī)范控制。目前國(guó)際上主要有兩套名稱規(guī)范格式和著錄體系,分別為IFLA的《UNIMARC/規(guī)范格式》、《規(guī)范和參照款目指南》和LC的《MARC21規(guī)范數(shù)據(jù)格式》,各機(jī)構(gòu)基于此開展名稱規(guī)范數(shù)據(jù)的維護(hù):另外利用帶有相關(guān)功能的系統(tǒng)管理規(guī)范數(shù)據(jù),進(jìn)行存取、增刪改操作和實(shí)施規(guī)范控制。
由于傳統(tǒng)維護(hù)模式效率低下催生了聯(lián)合規(guī)范項(xiàng)目,由圖書館及相關(guān)機(jī)構(gòu)聯(lián)合起來參與名稱規(guī)范的共建共享,擴(kuò)大名稱規(guī)范控制的范圍,如VIAF和NACO。但該方式仍無法彌補(bǔ)傳統(tǒng)模式的缺陷,規(guī)范控制能力跟不上資源增長(zhǎng)的速度。
(2)基于著者交互的自規(guī)范模式。自規(guī)范模式發(fā)起于機(jī)構(gòu)知識(shí)庫(kù)和文獻(xiàn)數(shù)據(jù)庫(kù),典型項(xiàng)目有NameProiect和各IDs,這些系統(tǒng)大都由著者填寫自身及相關(guān)學(xué)術(shù)信息或是進(jìn)行身份識(shí)別認(rèn)證,系統(tǒng)會(huì)為著者分配一個(gè)唯一標(biāo)識(shí)符以解決姓名混淆和重名問題。多次注冊(cè)、多入口操作和多個(gè)標(biāo)識(shí)符問題又促使了ISNI和ORCID的發(fā)展,使得唯一標(biāo)識(shí)符擴(kuò)大到世界范圍并且擴(kuò)展為標(biāo)準(zhǔn)。
基于著者交互的自規(guī)范是一種自下而上、去中心化的由著者主導(dǎo)的聯(lián)合共建模式,著者了解自身相關(guān)信息和著述,通過UGC(User Generated Content,用戶創(chuàng)造內(nèi)容)形式整合存在頭腦里有關(guān)人、機(jī)構(gòu)等的事實(shí)信息,并通過系統(tǒng)自發(fā)、協(xié)同的實(shí)現(xiàn)名稱規(guī)范信息的生成、完善以及不同實(shí)體的辨識(shí),可作為名稱規(guī)范數(shù)據(jù)維護(hù)的另一方法和模式。
基于著者交互的自規(guī)范需要以交互網(wǎng)絡(luò)平臺(tái)為渠道,通過著者的參與在平臺(tái)中新增或修改信息項(xiàng)從而實(shí)現(xiàn)規(guī)范數(shù)據(jù)的維護(hù)。在搭建交互平臺(tái)中,要規(guī)避專業(yè)的MARC格式,通過技術(shù)手段和友好性設(shè)計(jì)降低用戶參與的復(fù)雜度:另外只維護(hù)數(shù)據(jù)難以提高著者的參與度,要設(shè)計(jì)能幫助個(gè)人管理、統(tǒng)計(jì)、方便生成科研成果的相關(guān)功能來增強(qiáng)著者參與的積極性。
(3)自動(dòng)名稱消歧模式。自動(dòng)名稱消歧模式主要應(yīng)用在文獻(xiàn)數(shù)據(jù)庫(kù)和學(xué)術(shù)機(jī)構(gòu)庫(kù)中的數(shù)字(化)文獻(xiàn),Stylometrv和AND都屬于該模式。stvlometrv是從著作內(nèi)容的角度區(qū)分同名著者作品,AND則是通過著作外部特征來幫助區(qū)分同名著者作品。該類數(shù)據(jù)數(shù)量巨大且重名現(xiàn)象嚴(yán)重,將易于抽取的著者文獻(xiàn)信息項(xiàng),如主題、合著者、研究方向、出版物名稱及類型、引文和分類號(hào)等作為辨識(shí)特征,利用自然語(yǔ)言學(xué)和機(jī)器學(xué)習(xí)技術(shù)自動(dòng)區(qū)分重名著者和聚合別名著者的作品,從而實(shí)現(xiàn)名稱規(guī)范控制,可作為名稱規(guī)范維護(hù)的又一重要途徑和模式。
Stvlometry中,可有效區(qū)分著者文體的識(shí)別指標(biāo)有四方面:詞匯特征方面包括基于字和詞的特征,句法特征方面有功能詞、詞性和標(biāo)點(diǎn)符號(hào),結(jié)構(gòu)特征分為文本總行數(shù)、總句數(shù)、總段落數(shù)、平均每段句數(shù)、詞數(shù)和字?jǐn)?shù)等,內(nèi)容特征方面是抽取文獻(xiàn)表達(dá)的主題。stvlometry方法比較適合單一作者的文獻(xiàn),不適用于有多個(gè)作者的情況。AND中,基于監(jiān)督的分類方法有較高的準(zhǔn)確度,但需人工構(gòu)建訓(xùn)練集,面對(duì)海量數(shù)據(jù)進(jìn)行人工標(biāo)注工作量巨大,限制了該方法在著者消歧中的應(yīng)用?;诜潜O(jiān)督的聚類方法不需要訓(xùn)練數(shù)據(jù),適用性較高,是當(dāng)前人名消歧的主流方法,但判斷數(shù)據(jù)分布、設(shè)定聚類個(gè)數(shù)等因素影響準(zhǔn)確性,可使用EM算法和Gibbs抽樣彌補(bǔ)一般聚類算法的不足。
3.2各模式優(yōu)劣分析
傳統(tǒng)模式制作的規(guī)范數(shù)據(jù)質(zhì)量高但維護(hù)效率低下。傳統(tǒng)維護(hù)模式由專門的編目員根據(jù)著錄格式和規(guī)則對(duì)數(shù)據(jù)進(jìn)行辨識(shí)、新建和完善,客觀性和準(zhǔn)確性強(qiáng),但受有效信息源獲取的影響,存在不完整、甚至是白板數(shù)據(jù)。另外面對(duì)日益增長(zhǎng)的書目和各類型資源,采用由領(lǐng)域內(nèi)少數(shù)權(quán)威機(jī)構(gòu)維護(hù)的模式使規(guī)范數(shù)據(jù)的規(guī)模和范圍受到影響和限制,規(guī)范控制能力遠(yuǎn)跟不上資源增長(zhǎng)的速度。
著者交互的自規(guī)范可以緩解傳統(tǒng)維護(hù)模式的突出問題,但目前還很難完成規(guī)范數(shù)據(jù)的快速擴(kuò)張。著者能較容易的辨識(shí)規(guī)范庫(kù)中同名數(shù)據(jù),發(fā)現(xiàn)由更名、別名構(gòu)建的重復(fù)記錄;通過添加、修改相關(guān)信息項(xiàng)可完善名稱規(guī)范數(shù)據(jù),提高數(shù)據(jù)質(zhì)量:除此之外,廣泛的著者參與能消除傳統(tǒng)維護(hù)的局限,擴(kuò)大名稱規(guī)范數(shù)據(jù)的規(guī)模和范圍。但自規(guī)范也存在局限性,仍由人承擔(dān)維護(hù)工作再加上著者參與驅(qū)動(dòng)力的問題,目前還很難快速完成規(guī)模擴(kuò)張,另外著者參與存在信息真實(shí)性問題,還需要進(jìn)行申明和認(rèn)證。
自動(dòng)名稱消歧效率高但準(zhǔn)確性較差。自動(dòng)名稱消歧能根據(jù)文獻(xiàn)內(nèi)、外部特征對(duì)海量數(shù)據(jù)快速區(qū)分重名著者和聚合別名著者作品,從而實(shí)現(xiàn)名稱規(guī)范維護(hù)及控制,但準(zhǔn)確性受選取的特征項(xiàng)、特征項(xiàng)信息完整程度和算法影響大。
究竟采用何種方式維護(hù)名稱規(guī)范數(shù)據(jù),首先要了解各維護(hù)模式的優(yōu)勢(shì)和劣勢(shì)(見表1)。三種維護(hù)模式中客觀性和完整性之間、準(zhǔn)確性和效率之間成反比關(guān)系,并且有各自適合的資源類型:其次要結(jié)合自身情況,如項(xiàng)目目的、人力和時(shí)間、規(guī)范對(duì)象的類型和規(guī)模等因素選擇合適的開展方式。對(duì)于專業(yè)領(lǐng)域、小規(guī)模而且人力有限的情況可采用傳統(tǒng)維護(hù)模式,對(duì)于多來源、大規(guī)模數(shù)字資源宜選用自動(dòng)消歧方式;另外三種維護(hù)方式并不相互排斥,可結(jié)合起來使用,前期可選擇自動(dòng)名稱消歧并對(duì)結(jié)果進(jìn)行檢驗(yàn),區(qū)分效果差的資源類型再采用傳統(tǒng)和自規(guī)范模式維護(hù)完成,在提高效率的同時(shí)保證準(zhǔn)確性,同時(shí)也擴(kuò)大了規(guī)范控制能力和范圍。
4.名稱規(guī)范的發(fā)展趨勢(shì)
4.1規(guī)范數(shù)據(jù)的語(yǔ)義化、開放化和關(guān)聯(lián)化
名稱規(guī)范的MARC格式和交換協(xié)議使其封閉在圖書館內(nèi),限制了數(shù)據(jù)開放、交換和使用。隨著技術(shù)的發(fā)展和信息環(huán)境的改變,讀者利用圖書館資源的對(duì)象和方式發(fā)生巨大變化,MARC的種種局限,如揭示粒度粗、扁平化和可擴(kuò)展性差等,在網(wǎng)絡(luò)時(shí)代越來越成為絆腳石:另外只有Z39.50接口和IS02709用于互操作,MARC格式的數(shù)據(jù)被牢牢圈養(yǎng)在各個(gè)圖書館OPAC范圍內(nèi)。
發(fā)布開放關(guān)聯(lián)數(shù)據(jù)可彌補(bǔ)圖書館規(guī)范數(shù)據(jù)的封閉性、無語(yǔ)義、粗粒度、關(guān)系揭示少和擴(kuò)展性差的不足,打破規(guī)范數(shù)據(jù)維護(hù)與利用的困境,也為轉(zhuǎn)變資源組織的模式提供了全新的思路,隨著BIBFRAME、Schema.org等的推行,規(guī)范數(shù)據(jù)的開放關(guān)聯(lián)必然成為一個(gè)重要趨勢(shì)。事實(shí)上一些國(guó)家和機(jī)構(gòu)已邁出了一步,大英圖書館和德國(guó)國(guó)家圖書館等一批國(guó)家圖書館已將自己的名稱規(guī)范發(fā)布成了關(guān)聯(lián)數(shù)據(jù),OCLC還研發(fā)了VIAF的關(guān)聯(lián)數(shù)據(jù)服務(wù).LC也開發(fā)了符合關(guān)聯(lián)數(shù)據(jù)規(guī)范的BIBFRAME書目數(shù)據(jù)格式,規(guī)范數(shù)據(jù)是其中的數(shù)據(jù)類型之一。新的數(shù)據(jù)規(guī)范一方面充分考慮與過去MARC的兼容,保證規(guī)范數(shù)據(jù)的語(yǔ)義內(nèi)容能夠遷移到新的系統(tǒng)中:另一方面也為未來的規(guī)范控制探索了可行的技術(shù)方案。將名稱規(guī)范發(fā)布為開放關(guān)聯(lián)數(shù)據(jù),要經(jīng)過語(yǔ)義化、開放化和關(guān)聯(lián)化的過程:
(1)語(yǔ)義化就是將名稱規(guī)范數(shù)據(jù)的MARC格式轉(zhuǎn)換為RDF表達(dá)形式,即使用“主體一謂詞一客體”三元組(Triple)對(duì)規(guī)范數(shù)據(jù)中各項(xiàng)內(nèi)容進(jìn)行結(jié)構(gòu)化描述。RDF的三元組描述方式及URI技術(shù)可以容易的關(guān)聯(lián)和發(fā)現(xiàn)資源而不需任何人工干預(yù),RDF Schema實(shí)現(xiàn)理解從而可自動(dòng)定向獲取資源和相關(guān)信息。數(shù)據(jù)語(yǔ)義化后可以被機(jī)器理解和處理,為擴(kuò)展本地名稱規(guī)范數(shù)據(jù)種類、范圍和規(guī)模提供技術(shù)保障。轉(zhuǎn)化過程中,為保證共享和重用,要盡量利用已標(biāo)準(zhǔn)化和成熟的詞匯集描述數(shù)據(jù),避免自造新詞匯。同時(shí)建立規(guī)范數(shù)據(jù)MARC格式字段及子字段對(duì)應(yīng)的RDF詞匯映射表,方便計(jì)算機(jī)自動(dòng)批量實(shí)現(xiàn)名稱規(guī)范數(shù)據(jù)的語(yǔ)義化描述。
(2)開放化通過URI表示和HrITP URI訪問實(shí)現(xiàn)數(shù)據(jù)的參引(Dereference),以確保圖書館高質(zhì)量的規(guī)范數(shù)據(jù)和資源被外部檢索使用,并能發(fā)揮對(duì)網(wǎng)絡(luò)信息的規(guī)范控制作用。根據(jù)數(shù)據(jù)存儲(chǔ)方式、數(shù)量大小、更新頻率和訪問方式的不同,一般可考慮采用以下幾種方式開放數(shù)據(jù):①發(fā)布靜態(tài)的RDF文件,適用于數(shù)據(jù)量很小的情況:②將RDF文件存儲(chǔ)在RDF數(shù)據(jù)庫(kù)中,并采用Pubby等服務(wù)器作為關(guān)聯(lián)數(shù)據(jù)服務(wù)的前端,適用于數(shù)據(jù)量大的情況;③在請(qǐng)求數(shù)據(jù)時(shí)根據(jù)原始數(shù)據(jù)在線生成RDF數(shù)據(jù),適用于更新頻率多的情況;④D2R方式,即從關(guān)系數(shù)據(jù)庫(kù)到RDF數(shù)據(jù)轉(zhuǎn)換,適用于關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)據(jù)發(fā)布成關(guān)聯(lián)數(shù)據(jù)。
(3)關(guān)聯(lián)化通過語(yǔ)義詞匯將不同數(shù)據(jù)集合以各種關(guān)系形式連接起來,通過從一個(gè)數(shù)據(jù)集跳轉(zhuǎn)到另一個(gè)數(shù)據(jù)集,從而能極大程度的發(fā)現(xiàn)資源,擴(kuò)大本地名稱規(guī)范數(shù)據(jù)規(guī)模,完善自身名稱規(guī)范數(shù)據(jù)。OCLC已經(jīng)開始將VIAF的URIs添加到LC規(guī)范數(shù)據(jù)和Wikipedia當(dāng)中,從而使LC數(shù)據(jù)可以被VIAF服務(wù)發(fā)現(xiàn),同時(shí)獲取Wikipedia中的信息。關(guān)聯(lián)其他數(shù)據(jù)源雖然可通過匹配算法實(shí)現(xiàn),但仍需要人工修正,因此要根據(jù)一定的標(biāo)準(zhǔn)來選擇關(guān)聯(lián)的來源數(shù)據(jù):一是該資源被廣泛參考引用,二是該資源可用于豐富、完善本地?cái)?shù)據(jù)。
4.2多種維護(hù)模式相結(jié)合實(shí)現(xiàn)大資源規(guī)范控制
名稱規(guī)范維護(hù)工作一直局限于專著,網(wǎng)絡(luò)資源、機(jī)構(gòu)知識(shí)庫(kù)和文獻(xiàn)數(shù)據(jù)庫(kù)等對(duì)規(guī)范控制的需要促進(jìn)了大資源規(guī)范控制。網(wǎng)絡(luò)上充斥的錯(cuò)誤、冗余和虛假信息需要規(guī)范控制發(fā)揮作用,該需求促進(jìn)了語(yǔ)義網(wǎng)技術(shù)的發(fā)展和各規(guī)范數(shù)據(jù)的發(fā)布:機(jī)構(gòu)知識(shí)倉(cāng)庫(kù)和文獻(xiàn)數(shù)據(jù)庫(kù)重名、別名和翻譯規(guī)則等現(xiàn)象嚴(yán)重,急需進(jìn)行名稱規(guī)范以提高檢準(zhǔn)率,IDs和ISNI都是該需求下的產(chǎn)物。各類型資源對(duì)規(guī)范控制的需要日趨顯著促進(jìn)了大資源規(guī)范控制觀念的產(chǎn)生,即對(duì)各類型的海量資源開展全面的名稱規(guī)范控制,伴隨相關(guān)技術(shù)的成熟,實(shí)現(xiàn)大資源規(guī)范控制是名稱規(guī)范的另一重要趨勢(shì)。
未來的名稱規(guī)范控制不應(yīng)只局限于一種維護(hù)模式,而是要根據(jù)資源的類型和規(guī)模、自身情況和項(xiàng)目要求等采用多種模式相結(jié)合的方式進(jìn)行名稱規(guī)范維護(hù),從而應(yīng)對(duì)海量資源的快速增長(zhǎng),實(shí)現(xiàn)大資源規(guī)范控制。面對(duì)各類型海量資源規(guī)范控制的需要再采用傳統(tǒng)的維護(hù)模式顯然不現(xiàn)實(shí),需借鑒Web2,0環(huán)境下的自規(guī)范和機(jī)器學(xué)習(xí)領(lǐng)域的自動(dòng)名稱消歧方法。自規(guī)范是一種自下而上、去中心化的維護(hù)模式,有作者自發(fā)、協(xié)同的實(shí)現(xiàn)個(gè)人信息生成、完善以及不同人辨識(shí),能有效彌補(bǔ)著者信息難以獲取的問題:自動(dòng)名稱消歧方法非常適用于不斷擴(kuò)大的網(wǎng)絡(luò)和數(shù)字化環(huán)境的趨勢(shì),有快速區(qū)分海量資源中重名著者及其作品的能力,解決名稱控制范圍和能力低下等問題。
同時(shí),也不必要求對(duì)各種類型的資源都規(guī)范的越嚴(yán)格越好(如文學(xué)作品),所有的規(guī)范數(shù)據(jù)都做到信息項(xiàng)和參照關(guān)系完備,如此一定是以犧牲效率為代價(jià)。不同的應(yīng)用領(lǐng)域有不同的需求,如網(wǎng)絡(luò)環(huán)境下的規(guī)范控制只能追求合適,無法追求完美。而評(píng)價(jià)是否合適主要以能否滿足需求為標(biāo)準(zhǔn),如IFLA在FRAD中總結(jié)的查找、辨識(shí)、提供情境、證明、選擇和探索等。借鑒ULAN、UTL等的做法,可只對(duì)著名、出現(xiàn)頻率高和用戶需要的作者進(jìn)行高質(zhì)量的維護(hù),而對(duì)于一般的人名規(guī)范更多的從人名區(qū)分和消歧的角度完成規(guī)范控制即可。
4.3越來越方便用戶使用
《國(guó)際編目原則聲明》中的最高原則為用戶的便利性,對(duì)應(yīng)到名稱規(guī)范中即在抉擇著錄及檢索用的名稱規(guī)范數(shù)據(jù)時(shí)應(yīng)該考慮到用戶的需求。目前大部分圖書館名稱規(guī)范標(biāo)目(首選檢索點(diǎn))選取的原則為唯一性和一致性,如用生卒年保證標(biāo)目的唯一性,但從用戶的角度來講,生卒年信息并不能幫助他們有效選擇名稱和區(qū)分相似、同名著者。具體表現(xiàn)在使用OPAC檢索著者名稱,返回內(nèi)容或混亂或沒有能容易辨識(shí)、區(qū)分著者名稱的信息項(xiàng),導(dǎo)致用戶難以選擇所需的名稱規(guī)范數(shù)據(jù)。
近些年名稱規(guī)范逐漸從用戶的角度考慮格式和規(guī)則的制定,方便用戶使用在今后的名稱規(guī)范制作中會(huì)越來越得到重視和體現(xiàn)。1961年的“巴黎原則”只描述了選擇單一形式的名稱作為規(guī)范標(biāo)目,卻沒有考慮、解決如何區(qū)分相似名稱;1984年在IFLAUBC(Universal BibliograDhic Control,世界書目控制)國(guó)際會(huì)議中,允許以非編目形式記錄能區(qū)分著者的信息,即以注釋的形式將幫助區(qū)分著者的信息和來源放在690字段,但只提供給編目員使用,而不包括用戶:1999年成立的FRANAR(Functional Requirements and Numbering of Authority Records,規(guī)范記錄的功能需求與編號(hào)工作組)意識(shí)到只通過名稱不足以判定其代表的實(shí)體,在規(guī)定用戶任務(wù)時(shí)有兩條都與相似著者的名稱識(shí)別相關(guān),但并沒有說明提供給編目員還是用戶使用;2009年發(fā)布的FRAD增加了描述用戶任務(wù)的信息,但沒有解決以何種形式和用哪些信息為用戶提供區(qū)分不同著者的服務(wù):隨后一年發(fā)布的RDA(Resource Descrmdon&Access;,資源描述與檢索)中規(guī)定了對(duì)于無法區(qū)分的名稱規(guī)范使用描述性短語(yǔ)進(jìn)行識(shí)別:西華盛頓大學(xué)經(jīng)過研究認(rèn)為從事的領(lǐng)域容易區(qū)分著者,并建議在FRAD中增加該方面的屬性。
另外在名稱規(guī)范的應(yīng)用方面將越來越注重用戶的友好性體驗(yàn)。隨著數(shù)字資源越來越以人為中心進(jìn)行組織,名稱規(guī)范的應(yīng)用價(jià)值將得到進(jìn)一步彰顯,相應(yīng)的要設(shè)立友好性體驗(yàn)才能充分發(fā)揮名稱規(guī)范控制作用。目前已有一些機(jī)構(gòu)在有意識(shí)地增強(qiáng)名稱規(guī)范區(qū)分度以提高用戶體驗(yàn),如香港中文大學(xué)圖書館利用DSpace開發(fā)的機(jī)構(gòu)知識(shí)庫(kù)對(duì)作者加入部門、中文名等屬性幫助用戶選擇正確的著者:Eprints作為世界上第一個(gè)數(shù)字知識(shí)倉(cāng)庫(kù)軟件開發(fā)了自動(dòng)填詞功能,用戶輸入著者檢索詞時(shí),系統(tǒng)會(huì)自動(dòng)列出相似詞條,供用戶區(qū)分和選取特定的責(zé)任者名稱。
隨著RDA、BIBFRAME等的提出和推行,其規(guī)范數(shù)據(jù)要充分考慮用戶的需求,在屬性中擴(kuò)展消歧短語(yǔ)幫助辨識(shí)、區(qū)分和選擇名稱規(guī)范,并制定生成消歧短語(yǔ)的相關(guān)規(guī)則等。在開發(fā)基于名稱規(guī)范的應(yīng)用時(shí),還需要挖掘方便用戶使用的界面和功能,如為用戶提供容易識(shí)別著者的信息項(xiàng),制定合適長(zhǎng)度的消歧短語(yǔ)在充分揭示信息的同時(shí)又不引起噪音,對(duì)相似著者的辨識(shí)使用瀏覽、鼠標(biāo)懸浮和機(jī)器提問等顯示形式方便用戶選擇等,從而滿足未來普遍存在的以作者為中心的資源組織方式。
4.4從標(biāo)目向唯一標(biāo)識(shí)符方向發(fā)展
基于MARC格式的標(biāo)目及統(tǒng)一標(biāo)目形式實(shí)際是一種較淺層次的名稱規(guī)范。名稱規(guī)范為實(shí)現(xiàn)區(qū)分和聚集功能,采用MARC格式承載標(biāo)目和統(tǒng)一標(biāo)目的方法實(shí)現(xiàn)對(duì)著者的唯一標(biāo)識(shí),其實(shí)質(zhì)是對(duì)著者的名稱形式進(jìn)行統(tǒng)一,而不是對(duì)人的唯一標(biāo)識(shí),因此會(huì)遇到名稱變更、重名和翻譯等諸多問題。另外不同機(jī)構(gòu)之間對(duì)首選標(biāo)目原則、姓名著錄次序、縮寫方式等存在不同的規(guī)則和標(biāo)準(zhǔn),人為造成再次的不統(tǒng)一。
基于E-R模型的唯一標(biāo)識(shí)符其實(shí)質(zhì)是對(duì)人的唯一認(rèn)證,可解決標(biāo)目的諸多問題。FRBR家族的出現(xiàn)促進(jìn)了名稱規(guī)范的發(fā)展,采用E-R模型對(duì)名稱規(guī)范的揭示更加細(xì)粒度、立體化和滿足用戶需要,也更接近現(xiàn)實(shí)中的真實(shí)情況,其實(shí)質(zhì)是對(duì)人的唯一認(rèn)證。其中的唯一標(biāo)識(shí)符對(duì)著者的揭示是一種獨(dú)立于名稱形式的表達(dá)模型,它唯一標(biāo)示著者、標(biāo)識(shí)符公開和有明確的界定,并且不會(huì)隨著名稱的變更發(fā)生改變,能使統(tǒng)一標(biāo)目的問題得到有效解決,即不需要選擇任何一種優(yōu)先形式作為標(biāo)目,從而繞開標(biāo)目由名稱及其變動(dòng)帶來的重名、別稱、翻譯問題、名字變動(dòng)和西方名字縮寫等諸多問題。隨著關(guān)聯(lián)數(shù)據(jù)的普及和大批量數(shù)據(jù)的發(fā)布,會(huì)更加促使名稱規(guī)范向著者唯一標(biāo)識(shí)符方向發(fā)展,最終取代標(biāo)目的形式,完成從名稱到人的本質(zhì)性認(rèn)證(見圖1)。
5.結(jié)語(yǔ)
當(dāng)前我國(guó)名稱規(guī)范的諸多問題要求改革現(xiàn)有的維護(hù)方法,采用多種模式相結(jié)合的方式進(jìn)行名稱規(guī)范維護(hù),同時(shí)要緊隨國(guó)際上的發(fā)展動(dòng)向,幫助我國(guó)名稱規(guī)范控制工作走出困境。其實(shí),傳統(tǒng)的圖書館名稱規(guī)范控制和整序工作,在新趨勢(shì)下并沒有失去其價(jià)值,圖書館數(shù)百年積累起來的規(guī)范控制經(jīng)驗(yàn),如果能積極的迎合時(shí)代和環(huán)境的發(fā)展趨勢(shì),不僅能實(shí)現(xiàn)過去沒有實(shí)現(xiàn)的理想,而且能在更大范圍內(nèi)發(fā)揚(yáng)光大。