摘 要:本文首先對KBART進行概述,然后闡述基于KBART的元數(shù)據(jù)交換的相關(guān)建議,以及基于KBART的期刊元數(shù)據(jù)的開放存取類型,最后總結(jié)KBART針對期刊元數(shù)據(jù)的開放與共享做出的改進。
關(guān)鍵詞:KBART;期刊元數(shù)據(jù);開放;共享
1 KBART概述
KBART是知識庫及其相關(guān)工具的推薦實施規(guī)范,全稱為Knowledge Bases and Related Tools Recommended Practice。作為提高知識庫數(shù)據(jù)效率和有效性的數(shù)字資源規(guī)范,KBART為信息供應(yīng)鏈中的各方提供了關(guān)于元數(shù)據(jù)格式和元數(shù)據(jù)規(guī)范等的直接指導(dǎo),確保內(nèi)容提供商與知識庫開發(fā)者之間準(zhǔn)確的元數(shù)據(jù)交換,通過改善鏈接解析器和知識庫的數(shù)據(jù)供應(yīng),解決影響開放鏈接的問題[1]。
2007年,英國連續(xù)出版物集團(United Kingdom Serials Group,UKSG) 出版了由James Culling撰寫的《鏈接解析器和連續(xù)出版物的供應(yīng)鏈》(Link resolvers and the serials supply chain) 研究報告[2]。Culling在該報告中確認(rèn)和描述影響開放鏈接有效性的一系列問題,并建議成立一個工作組,目的在于確定和向整個業(yè)界推廣“最佳實踐”的解決方案,以改進與知識庫間的元數(shù)據(jù)交換。2008年1月,由UKSG和NISO(美國國家信息標(biāo)準(zhǔn)協(xié)會National Information Standards Organization)組成的聯(lián)合工作組正式啟動,開始負責(zé)此項工作。由此產(chǎn)生的KBART推薦實踐規(guī)范提供了將數(shù)據(jù)傳輸?shù)街R庫的指南,包括格式和數(shù)據(jù)交換方法。
第1階段于2010年完成,發(fā)布了第一期推薦實施規(guī)范(NISO RP-7-2010),目標(biāo)是改善鏈接解析器和知識庫的數(shù)據(jù)供應(yīng),以提高OpenURL鏈接的效率和有效性,第一階段報告提供了實現(xiàn)此目標(biāo)的基礎(chǔ)建議。第2階段于2014年完成,在第1階段的基礎(chǔ)上,第2階段的工作重點在于解決那些影響元數(shù)據(jù)供應(yīng)中更具體和更復(fù)雜的問題上,修訂元數(shù)據(jù)供應(yīng)傳輸規(guī)范,深入調(diào)查用戶需求,改善知識庫的數(shù)據(jù)供應(yīng)情況,明確提供商合作框架,同時建立信息門戶,開展系列推廣活動,并提供全面的信息資源。知識庫提供商及其客戶(主要是高校圖書館) 均受益于內(nèi)容提供商所提供的高質(zhì)量的數(shù)據(jù),發(fā)布商也會受益于其內(nèi)容的準(zhǔn)確鏈接。2014年4月發(fā)布了第二期推薦實踐規(guī)范( NISO RP-9-2014)修正草案。重點修訂內(nèi)容包括:與聯(lián)盟、開放獲取出版物、電子圖書和會議論文集等相關(guān)的元數(shù)據(jù)規(guī)范,以及數(shù)據(jù)交換和傳輸?shù)姆椒?、交換頻率、數(shù)據(jù)格式、數(shù)據(jù)發(fā)布等。在第二期推薦實踐規(guī)范修正草案發(fā)布后,工作組過渡到由跨行業(yè)專業(yè)人士組成的NISO常務(wù)委員會。該小組的重點是授予KBART認(rèn)可并提供社區(qū)外展和教育。
2 基于KBART的元數(shù)據(jù)交換
元數(shù)據(jù),通常定義為描述數(shù)據(jù)的數(shù)據(jù),旨在便利存取、管理、共享和處理大量結(jié)構(gòu)化和或非結(jié)構(gòu)化的數(shù)據(jù)。元數(shù)據(jù)交換使數(shù)據(jù)交換各方之間按共同規(guī)則描述元數(shù)據(jù)信息,完成對元數(shù)據(jù)的存取交換功能。KBART推薦實施規(guī)范的一個關(guān)鍵組成部分就是對于內(nèi)容提供商和知識庫供應(yīng)商之間進行元數(shù)據(jù)交換的相關(guān)建議,而元數(shù)據(jù)交換是元數(shù)據(jù)開放與共享的基礎(chǔ)。
2.1 KBART元數(shù)據(jù)字段
在內(nèi)容提供商所提供的元數(shù)據(jù)文件中,應(yīng)當(dāng)將表1的這些字段作為列名。由于元數(shù)據(jù)文件的接收者希望以匹配的格式接收所有文件,因此即使內(nèi)容提供者無法提供任何信息或者沒有適合特定字段的信息,每個字段也應(yīng)按表1給出的順序列出來。為避免混淆和不必要的錯誤,內(nèi)容提供商需要在生成的每個文件上標(biāo)記列標(biāo)題。為了提供KBART未作要求的其他用途的附加信息,允許內(nèi)容提供商在最后一個KBART使用位置(排在第25位的access_type)之后添加額外的元數(shù)據(jù)字段。NISO常務(wù)委員會目前在工作中看到的額外字段包括聯(lián)機計算機圖書館中心(OCLC)編號、主題、標(biāo)題歷史記錄等。
對于多次更改刊名的期刊,在生成基于KBART的元數(shù)據(jù)文件時,可參考表2。
2.2 元數(shù)據(jù)文件格式
所有基于KBART的元數(shù)據(jù)文件都應(yīng)以純文本形式提供,并編碼為UTF-8。每個文件都應(yīng)以制表符分隔,并且按照KBART推薦實施規(guī)范中的順序排列。與文件中所表示內(nèi)容相關(guān)的所有字段都是必填字段。
2.3 元數(shù)據(jù)文件命名
KBART推薦的文件命名格式為:[ProviderName]_[Region/Consortium]_[PackageName]_[YYYY-MM-DD].txt。括號中的每個元素代表如下定義名稱的可變部分。
1)ProviderName是托管數(shù)據(jù)的平臺名稱。該元素有助于區(qū)分文件的來源。例如,PsycARTICLES數(shù)據(jù)庫可通過多家內(nèi)容提供商獲得,包括EBSCO,Ovid和美國心理學(xué)協(xié)會。要根據(jù)文件的來源填寫相應(yīng)的內(nèi)容提供商名稱。
2)Region/Consortium提供關(guān)于元數(shù)據(jù)集的銷售地點,或者可以使用這個數(shù)據(jù)集的聯(lián)盟的相關(guān)信息。如果文件是通用的,則應(yīng)使用“Global”作為此元素。
3)PackageName是元數(shù)據(jù)集的名稱,因為內(nèi)容提供商的客戶希望在知識庫中標(biāo)記它。
4)YYYY-MM-DD是使用ISO 8601日期格式的文件創(chuàng)建日期。
綜上,“TaylorandFrancis_Global_AllTitles_2014-08-30.txt”為符合KBART的文件名 。該文件由TaylorandFrancis提供,標(biāo)題列表不特定于某個地區(qū)或聯(lián)盟,包括內(nèi)容提供商提供的所有標(biāo)題,創(chuàng)建日期是2014年8月30日?!癝pringer_Asia-Pacific_Medicine_2016-01-28.txt”也為符合KBART的文件名。該文件由Springer提供,銷往亞太地區(qū),元數(shù)據(jù)集名稱為“Medicine”,創(chuàng)建日期是2016年1月28日。
2.4 元數(shù)據(jù)文件交換的方法
生成基于KBART的元數(shù)據(jù)文件后,內(nèi)容提供商必須能夠?qū)⑽募峁┙o知識庫供應(yīng)商。首選的傳遞方法是將文件發(fā)布到專用網(wǎng)頁或文件傳輸協(xié)議(FTP)站點。使用電子郵件進行傳遞并不理想,因為將其納入自動化處理程序非常困難。但是,如果將文件發(fā)布到網(wǎng)頁或FTP是無法實現(xiàn)的,則用電子郵件進行傳遞也是可接受的替代方案。
2.5 元數(shù)據(jù)文件交換的頻率
創(chuàng)建和交付基于KBART的元數(shù)據(jù)文件不是一次性的行為。要使內(nèi)容提供商的數(shù)據(jù)能夠準(zhǔn)確地反映在知識庫中,必須定期創(chuàng)建和交付元數(shù)據(jù)文件。KBART建議大多數(shù)內(nèi)容提供商每月更新一次,但是內(nèi)容提供商可以依據(jù)實際的館藏資源變化率大致調(diào)整元數(shù)據(jù)交換的頻率。
3 基于KBART的期刊元數(shù)據(jù)的開放存取類型
期刊元數(shù)據(jù)包括表1中列出的適用于連續(xù)出版物的KBART字段。由于有很多文章刊載在期刊中,每一篇文章又包括很多元數(shù)據(jù),如標(biāo)題、摘要、關(guān)鍵詞、參考文獻等,因此本文中所提及的期刊元數(shù)據(jù)也包括這些元數(shù)據(jù)。
通常無法輕易判定,對于通過開放存取獲得可利用的文章或標(biāo)題,是免費的還是需要收費的。因為在這方面存在多種可能性,不能簡單地采用二元對立的思維來看待。比如,一個期刊中的單篇或多篇文章可通過作者付費的開放存取獲得,而期刊的其余部分僅可通過訂閱獲得。在某些情況下,發(fā)布者會選擇自某一卷或某一期發(fā)布以來的一段時間之后,將所有內(nèi)容進行開放存取。目前基于KBART的期刊元數(shù)據(jù)的開放存取類型如下:
1)延遲開放存取??梢酝ㄟ^開放存取獲得最近12個月以前的刊名數(shù)據(jù),而最近12個月的相關(guān)內(nèi)容需要訂閱。
2)標(biāo)題轉(zhuǎn)換開放存取。由不同出版商購買和銷售時,從開放存取或免費獲取的標(biāo)題轉(zhuǎn)換為需要付費訂閱的標(biāo)題。
3)作者付費的混合型開放存取??偟膩碚f,對于內(nèi)容的訪問需要訂閱,但是一些特定的文章可以在作者付費的支持下,通過開放存取獲得。
在所有這些情況下,很難確定用戶在任何時間都可能被拒絕訪問期刊元數(shù)據(jù)的原因。因為KBART期刊元數(shù)據(jù)文件處于標(biāo)題級別而不是文章級別,所以幾乎不可能解釋各種各樣的開放存取和免費可用的內(nèi)容模型。KBART建議以后能夠從文章級別進行處理,從而更好地解決這個問題。
4 KBART針對期刊元數(shù)據(jù)的開放與共享做出的改進
針對期刊元數(shù)據(jù)的開放存取問題,在第二期推薦實踐規(guī)范(NISO RP-9-2014)中,KBART修改了一個字段,并且添加了一個字段和可選的自由文本元數(shù)據(jù)。這些元數(shù)據(jù)有望改善最終用戶的訪問權(quán)限,而且內(nèi)容提供商和第三方供應(yīng)商能夠更容易解決開放存取的問題。
4.1 修改的字段名:notes
對于一些內(nèi)容提供商來說,他們希望對開放存取范圍進行注釋,尤其是對混合型開放存取的注釋。對此,KBART將使用可選的“notes”字段?!皀otes”字段仍然是KBART第二階段的自由文本和可選字段,可以比較容易地解釋特定標(biāo)題(包括但不限于有關(guān)開放存取內(nèi)容的注釋)的細微差別。這可能會為第三方供應(yīng)商提供幫助,比如鏈接解析器供應(yīng)商以及圖書館。
4.2 新增的字段名:access_type
這個新的必填字段可以有2個值,包括F和P。使用“F”表示期刊元數(shù)據(jù)是開放存取或可以免費訪問的。使用“P”表示需要支付某種費用(例如,訂閱、購買等)才能訪問期刊元數(shù)據(jù)。對于包含免費和付費內(nèi)容的混合型開放存取期刊,出版商和供應(yīng)商應(yīng)根據(jù)需要進行多次記錄,以指明免費訪問的范圍和需要支付費用訪問的范圍。例如,如果期刊有一年的推遲間隔,其中最近12個月是付費訪問,這會由兩個記錄表示,第一個記錄在access_type字段中的值是“P”(付費),第二個記錄在access_type字段中的值是“F”(免費),即對于超過12個月的內(nèi)容是免費的。
當(dāng)同時采用access_type字段和embargo_info字段時,KBART建議在這兩個字段中都需要進行兩次記錄。一個記錄是推遲間隔之前的免費內(nèi)容(標(biāo)記為“F”表示免費),第二個記錄表示需要訂閱的內(nèi)容(標(biāo)記為“P”表示需要付費)。
參考文獻
[1]姚曉霞,劉娟娟,鄧石等.突破開放鏈接瓶頸的數(shù)字資源規(guī)范KBART解析[J].圖書情報工作.2018(6):26-30.
[2]James Culling. Link Resolvers and the Serials Supply Chain[EB/OL].[2019-02-08].http://www.uksg.org/sites/uksg.org/files/uksg_link_resolvers_final_report.pdf.
作者簡介
趙宇曦(1996-),女,漢族,北京,上海大學(xué)圖書情報檔案系,碩士研究生,研究方向:檔案學(xué)。