都平平 彭 琳 李雨珂 耿彩芳 李 真 劉計(jì)萍
2016 年起,開(kāi)放存取知識(shí)庫(kù)聯(lián)盟COAR(Confederation of Open Access Repositories)啟動(dòng)了研究項(xiàng)目“下一代機(jī)構(gòu)知識(shí)庫(kù)”(Next Generation Repositories),項(xiàng)目核心思想是將機(jī)構(gòu)知識(shí)庫(kù)(IR)提升到能面向研究、開(kāi)放并有助于創(chuàng)新,同時(shí)方便機(jī)構(gòu)知識(shí)系統(tǒng)中各類學(xué)術(shù)資源群的統(tǒng)一集體管理[1]。傳統(tǒng)的機(jī)構(gòu)知識(shí)庫(kù)首先是對(duì)研究最終成果(論文、論著、專利等)的管理,這些成果屬于“白色資源”的范疇,其次是對(duì)發(fā)布在網(wǎng)絡(luò)上(論壇、學(xué)術(shù)博客、微信群等)資源的管理,這些資源屬于“類白色資源”的范疇。但科學(xué)研究過(guò)程中的數(shù)據(jù)采集和管理并未全面納入IR 的管理范疇。隨著開(kāi)放科學(xué)運(yùn)動(dòng)的深入,研究過(guò)程中數(shù)據(jù)集的采集和長(zhǎng)期保存正在成為學(xué)科學(xué)術(shù)實(shí)踐的一部分。這些數(shù)據(jù)資源屬于“灰色資源”的范疇?;疑墨I(xiàn)(grey literature)一般指非公開(kāi)出版的文獻(xiàn),介于白色文獻(xiàn)(正式出版發(fā)行)與黑色文獻(xiàn)(不公開(kāi)出版并具有隱秘性)之間的文獻(xiàn),是很難通過(guò)常規(guī)的出版流通途徑和一般的查詢方法接觸到的文獻(xiàn)[2]。傳統(tǒng)的機(jī)構(gòu)知識(shí)資源管理運(yùn)行正在開(kāi)始新的升級(jí)探索——它在原有的白色資源、類白色資源的基礎(chǔ)上,增加了包含研究數(shù)據(jù)管理(RDM)在內(nèi)的灰色資源管理,甚至擴(kuò)大到黑色資源的管理。隨著開(kāi)放科學(xué)、開(kāi)放數(shù)據(jù)運(yùn)動(dòng)的發(fā)展,數(shù)據(jù)資源成為重要的現(xiàn)代戰(zhàn)略資源,其重要程度將越來(lái)越凸顯,直面數(shù)據(jù)建設(shè)和開(kāi)放共享問(wèn)題已經(jīng)成為學(xué)界關(guān)注熱點(diǎn)。圖書(shū)館一直是高校IR 建設(shè)的主體,IR 中開(kāi)放數(shù)據(jù)資源建設(shè)和管理也是高校圖書(shū)館迫切需要解決的問(wèn)題。新媒體聯(lián)盟的地平線報(bào)告將科學(xué)數(shù)據(jù)管理視為學(xué)術(shù)研究型圖書(shū)館必須適應(yīng)的一種趨勢(shì)[3]。在高校圖書(shū)館的開(kāi)放資源建設(shè)探索中,資源的建設(shè)策略與再利用模式一直都是研究重點(diǎn)[4]。在當(dāng)前建設(shè)“雙一流”高校和“雙一流”學(xué)科的背景下,如何對(duì)機(jī)構(gòu)科研數(shù)據(jù)進(jìn)行有效的管理和利用,實(shí)現(xiàn)高??蒲袛?shù)據(jù)的開(kāi)放共享是當(dāng)前高??蒲袛?shù)據(jù)管理面臨的一個(gè)重要挑戰(zhàn)。本文基于下一代IR 的建設(shè)目標(biāo),探索灰色資源,尤其是灰色科研數(shù)據(jù)資源的采集、存儲(chǔ)、共享和復(fù)用策略,為高校圖書(shū)館建設(shè)和管理下一代IR 中灰色數(shù)據(jù)資源提供思路和方法。
Clifford A. Lynch[5]從大學(xué)的角度為IR 做了如下定義,他認(rèn)為:“大學(xué)中的IR 是大學(xué)為其員工提供的一套服務(wù),用于管理和傳播大學(xué)的各個(gè)部門(mén)及其成員創(chuàng)作的數(shù)字化產(chǎn)品”。而SPARC 的Richard K.Johoson[6]則認(rèn)為,IR 是一個(gè)數(shù)字化資源集合,捕獲并保存單個(gè)或多個(gè)團(tuán)體中的智力產(chǎn)品。中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心[7]是我國(guó)較早研究IR 并開(kāi)展實(shí)踐的單位,其對(duì)IR 的定義是:“機(jī)構(gòu)知識(shí)庫(kù)是研究機(jī)構(gòu)實(shí)施知識(shí)管理的工具,是機(jī)構(gòu)有效管理其知識(shí)資產(chǎn)的工具,也是機(jī)構(gòu)知識(shí)能力建設(shè)的重要機(jī)制?!痹谶@個(gè)定義中,IR 的范圍從機(jī)構(gòu)的“知識(shí)產(chǎn)品”擴(kuò)展到了“知識(shí)資產(chǎn)”。從使用者的角度上看,IR 是一個(gè)機(jī)構(gòu)建立的,以網(wǎng)絡(luò)為依托及傳播途徑,以收集、整理、保存、檢索、提供利用為目的,以本機(jī)構(gòu)成員在工作過(guò)程中所創(chuàng)建的各種數(shù)字化產(chǎn)品為內(nèi)容的知識(shí)庫(kù)。綜上所述:IR 應(yīng)是把機(jī)構(gòu)內(nèi)部各種系統(tǒng)、各個(gè)團(tuán)隊(duì)、各個(gè)成員、各個(gè)類型散存的各類知識(shí)成果記錄、集成、再組織、展現(xiàn),它展現(xiàn)機(jī)構(gòu)成果,復(fù)用成果,盤(pán)活機(jī)構(gòu)知識(shí)資產(chǎn),為團(tuán)隊(duì)及其成員提供學(xué)習(xí)、科研服務(wù)支持。
傳統(tǒng)IR 的資源建設(shè)模式,主要收集的是公開(kāi)發(fā)表的論文、著作、專利、報(bào)告等。2016 年COAR 啟動(dòng)的“下一代機(jī)構(gòu)知識(shí)庫(kù)”項(xiàng)目,核心是將其提升到能面向研究(研究過(guò)程和研究成果)、開(kāi)放(規(guī)范的開(kāi)放適應(yīng)和復(fù)用)并有助于創(chuàng)新(依據(jù)前人的成果開(kāi)展進(jìn)一步的研究創(chuàng)新),同時(shí)便于學(xué)術(shù)群體集體管理(涵蓋機(jī)構(gòu)產(chǎn)生的各類知識(shí))。但在我國(guó),高校IR 的資源內(nèi)容以公開(kāi)發(fā)表的期刊論文等白色文獻(xiàn)為主, 資源類型一般不超過(guò)10種;而以波士頓大學(xué)為代表的國(guó)外高校IR,包含大量會(huì)議材料、數(shù)據(jù)庫(kù)、軟件、樂(lè)譜、法律備忘錄等形式,資源類型多達(dá) 28 種[8]。2018 年,龔亦農(nóng)[9]等對(duì)我國(guó) IR 建設(shè)現(xiàn)狀摸底調(diào)查顯示,我國(guó)IR 總數(shù)為472 個(gè),IR 收錄成果類型集中在3 類學(xué)術(shù)論文(期刊論文、會(huì)議論文、學(xué)位論文)和專利,其他類型成果(包括圖書(shū))的實(shí)際收錄比例極小[9]。蔡思明選取75 所“211 工程”高校圖書(shū)館進(jìn)行調(diào)研發(fā)現(xiàn),各校自建數(shù)據(jù)庫(kù)大多停留在文獻(xiàn)資源組織和整合的淺層面上,缺乏關(guān)鍵技術(shù)的應(yīng)用去揭示資源的內(nèi)部聯(lián)系[10]。根據(jù)本課題組對(duì)我國(guó)42 所雙一流高校圖書(shū)館所建機(jī)構(gòu)知識(shí)庫(kù)的調(diào)研,目前,我國(guó)許多高校建設(shè)的IR 大部分是相對(duì)獨(dú)立的一種“重組型”靜態(tài)數(shù)據(jù)庫(kù),其功能大部分僅限于本校所公開(kāi)學(xué)術(shù)研究成果的收集、整理、長(zhǎng)期保存和檢索利用,對(duì)隱性資源(灰色和黑色文獻(xiàn))挖掘和保存不足。
相比之下,國(guó)外高校和研究機(jī)構(gòu)重視灰色資源的建設(shè)。在當(dāng)前開(kāi)放科學(xué)、開(kāi)放研究的背景下,國(guó)外高校和研究所尤其重視灰色數(shù)據(jù)資源的建設(shè),他們對(duì)灰色研究數(shù)據(jù)資源的管理方式經(jīng)歷了從IR 到數(shù)據(jù)存儲(chǔ)管理中心再到數(shù)據(jù)監(jiān)管發(fā)布中心的演變[10-11]。最初的國(guó)外高校IR 或機(jī)構(gòu)倉(cāng)儲(chǔ),也是僅限于保存研究論文、報(bào)告或少部分灰色文獻(xiàn)(主要是內(nèi)部出版物:內(nèi)刊、報(bào)道、會(huì)議紀(jì)要等)等成果數(shù)據(jù),隨著公眾和科學(xué)界對(duì)研究數(shù)據(jù)管理和共享的重視和需求越來(lái)越高,國(guó)外高校圖書(shū)館通過(guò)升級(jí)與優(yōu)化傳統(tǒng)機(jī)構(gòu)知識(shí)庫(kù)服務(wù)功能(如明尼蘇達(dá)大學(xué)UDC、康奈爾大學(xué)eCommons)或者構(gòu)建獨(dú)立的數(shù)據(jù)服務(wù)平臺(tái)(如伊利諾伊大學(xué)厄巴納香檳分校Illinois Data Bank、密歇根大學(xué) Deep Blue Data、普渡大學(xué)PURR)兩種方式來(lái)實(shí)現(xiàn)科研數(shù)據(jù)長(zhǎng)期保存與共享[12]。
1.機(jī)構(gòu)知識(shí)庫(kù)資源類型界定與特點(diǎn)分析。傳統(tǒng)IR主要涵蓋資源類型為白色資源(公開(kāi)發(fā)表的學(xué)術(shù)成果),但在實(shí)際研究中產(chǎn)生的資源類型涵蓋了多種文獻(xiàn)類型。根據(jù)信息來(lái)源和共享性可分為白色資源、灰色資源和黑色資源。隨著計(jì)算機(jī)技術(shù)和信息技術(shù)的發(fā)展,網(wǎng)絡(luò)資源及富媒體電子資源的產(chǎn)生,資源逐步向數(shù)字化、信息化發(fā)展,形成了多元化的資源、信息、知識(shí)格局,資源的類型更為廣泛,從信息來(lái)源和共享性(公開(kāi)性)角度,可將學(xué)術(shù)資源分為學(xué)術(shù)研究成果(多為白色資源)、學(xué)術(shù)研究過(guò)程數(shù)據(jù)(機(jī)構(gòu)灰色資源)和學(xué)術(shù)活動(dòng)軌跡及成果(類白色資源或類灰色資源)。表1 總結(jié)了IR 的主要資源,資源類型及特點(diǎn)。
表1 機(jī)構(gòu)知識(shí)庫(kù)主要資源、資源類型及特點(diǎn)
2.傳統(tǒng)機(jī)構(gòu)知識(shí)庫(kù)與下一代機(jī)構(gòu)知識(shí)庫(kù)的關(guān)系。圖1 總結(jié)了傳統(tǒng)IR 和“下一代”IR 關(guān)聯(lián)關(guān)系。下一代IR要收集的機(jī)構(gòu)成果范圍更廣,從白色資源向灰色資源發(fā)展,包括在研究過(guò)程中產(chǎn)生的灰色數(shù)據(jù)資源,也包括從網(wǎng)絡(luò)上可以直接收集到類白色資源的網(wǎng)絡(luò)資源。吳建中[1]總結(jié)了下一代IR 的特點(diǎn):首先,IR 的重點(diǎn)從存儲(chǔ)走向加值,加大資源利用。所以,下一代IR 中資源建設(shè)不僅僅是資源獲取和管理,還包括資源關(guān)聯(lián)和復(fù)用。其次,資源開(kāi)放獲取只是手段,目的是要推動(dòng)科研工作和創(chuàng)新。在推動(dòng)開(kāi)放獲取的同時(shí),要把研究數(shù)據(jù)管理融入IR。第三是IR 之間要合作,要增強(qiáng)IR 之間的關(guān)聯(lián)度和協(xié)作創(chuàng)新,共同推進(jìn)數(shù)據(jù)開(kāi)放共享。劉建國(guó)等[13]指出,重點(diǎn)學(xué)科是高校學(xué)科建設(shè)的優(yōu)勢(shì)所在,這些資源的收集和組織水平很大程度上代表著該校教學(xué)水平。當(dāng)前,“雙一流”高校和“雙一流”學(xué)科建設(shè)強(qiáng)調(diào)學(xué)科建設(shè)向世界一流水平看齊,高校應(yīng)關(guān)注科學(xué)數(shù)據(jù)管理等新興內(nèi)容。
圖1 傳統(tǒng)IR 和“下一代”IR 關(guān)聯(lián)關(guān)系
本文研究的灰色數(shù)據(jù)資源指的是研究過(guò)程中形成的有價(jià)值的知識(shí)資源。表2(見(jiàn)下頁(yè))從研究項(xiàng)目的生命周期角度歸納了下一代IR 所包含的資源,包括立項(xiàng)報(bào)告、專利申請(qǐng)報(bào)告、研究數(shù)據(jù)、科研數(shù)據(jù)、討論文檔、記錄文案、研究報(bào)告、實(shí)驗(yàn)照片及圖譜、結(jié)題報(bào)告、成果匯編等。科研課題的立項(xiàng)報(bào)告和專利申請(qǐng)文件往往包含著科研人員最新的研究探索結(jié)果,包含最新的研究文獻(xiàn),是本研究重要的學(xué)術(shù)參考文獻(xiàn),這是高?;疑墨I(xiàn)最多的一類資源[14]。
表2 下一代機(jī)構(gòu)知識(shí)庫(kù)的研究過(guò)程全流程資源構(gòu)成
1.灰色數(shù)據(jù)資源的采集方式。龔亦農(nóng)等[9]的調(diào)查顯示,我國(guó)IR 收集的成果類型受數(shù)據(jù)采集加工自動(dòng)化程度的影響較大。期刊論文、會(huì)議論文和專利比較容易通過(guò)商業(yè)數(shù)據(jù)庫(kù)批量自動(dòng)采集,所以這些成果是我國(guó)IR收集的主要成果類型,而高校項(xiàng)目課題組在研究過(guò)程中產(chǎn)生的科學(xué)數(shù)據(jù)、研究數(shù)據(jù)目前沒(méi)有可自動(dòng)采集的信息源,完全依賴自存儲(chǔ),在IR 中收集這些資源的實(shí)踐難度較大?;疑墨I(xiàn)的收集方法包括采購(gòu)、捐贈(zèng)、呈繳、交換、現(xiàn)場(chǎng)收集、索取、網(wǎng)絡(luò)檢索獲取、復(fù)制、資源共享等[15]。高校的灰色數(shù)據(jù)資源主要流通于各單位內(nèi)部,具有機(jī)密性和限制公開(kāi)性。極少數(shù)研究人員掌握數(shù)據(jù)的擁有權(quán),這些數(shù)據(jù)資源含有大量的行業(yè)內(nèi)部研究信息與可持續(xù)研究開(kāi)發(fā)和利用的潛在功能。對(duì)于這些資源,高校圖書(shū)館很難通過(guò)正常渠道收集,只能通過(guò)特殊手段,如通過(guò)行政手段征集獲得。在當(dāng)前我國(guó)建設(shè)“雙一流”高校、“雙一流”學(xué)科的背景下,高校圖書(shū)館的灰色數(shù)據(jù)資源采集應(yīng)優(yōu)先面向“雙一流”學(xué)科的特色館藏建設(shè)。
據(jù)本課題組調(diào)查,目前我國(guó)高校有部分IR 中存儲(chǔ)科研項(xiàng)目信息。例如:武漢大學(xué)機(jī)構(gòu)知識(shí)庫(kù)成果類型中包括科研項(xiàng)目,讀者可按發(fā)表年份、語(yǔ)種、有無(wú)全文、機(jī)構(gòu)單位檢索瀏覽本校師生的科研項(xiàng)目的元數(shù)據(jù)信息,包括項(xiàng)目負(fù)責(zé)人、項(xiàng)目編號(hào)、項(xiàng)目類別。這些元數(shù)據(jù)信息可通過(guò)科研處的信息導(dǎo)入到IR 中,對(duì)于圖書(shū)館來(lái)說(shuō)采集起來(lái)比較容易。難點(diǎn)是課題組研究過(guò)程數(shù)據(jù)的收集,這些數(shù)據(jù)要通過(guò)科研人員自存儲(chǔ)的方式進(jìn)行。目前,國(guó)內(nèi)外研究資助機(jī)構(gòu)都陸續(xù)推出了資助項(xiàng)目提交數(shù)據(jù)管理方案,資助項(xiàng)目提交研究數(shù)據(jù)的要求。一些科技期刊也推出了提交論文附屬數(shù)據(jù)的要求[16]。這些都是有利于鼓勵(lì)和要求科研人員向單位的IR 提交研究數(shù)據(jù)的外部條件。高校也可制定相關(guān)的數(shù)據(jù)提交要求,提高IR 中自存儲(chǔ)研究數(shù)據(jù)的比例。
2.灰色數(shù)據(jù)資源保存方式。Rodrigues[17]指出,機(jī)構(gòu)知識(shí)庫(kù)、主題倉(cāng)儲(chǔ)庫(kù)和集中式數(shù)據(jù)倉(cāng)儲(chǔ)庫(kù)是保存科研數(shù)據(jù)的最佳選擇。司莉等[18]總結(jié)了高校研究數(shù)據(jù)的特點(diǎn),包括:①科研活動(dòng)通常每個(gè)項(xiàng)目參加的人數(shù)少,每個(gè)科研項(xiàng)目產(chǎn)生的數(shù)據(jù)集較少;②數(shù)據(jù)通常就保存在項(xiàng)目組成員的個(gè)人計(jì)算機(jī)里,缺乏統(tǒng)一標(biāo)準(zhǔn)與分享機(jī)制;③缺乏項(xiàng)目結(jié)題后對(duì)數(shù)據(jù)開(kāi)放分享重用和長(zhǎng)期保存?;谶@樣的“小科學(xué)研究”的特點(diǎn)[19],IR 是保存機(jī)構(gòu)中科研人員研究數(shù)據(jù)最好的平臺(tái)。Palmer[20]總結(jié)了利用IR 保存科研數(shù)據(jù)的意義,包括更全面地評(píng)估研究的影響力、提升研究者及所在機(jī)構(gòu)的知名度、支持高校的學(xué)術(shù)出版、贏得更多的科研資助等。Cragin 等[21]對(duì)美國(guó)伊利諾大學(xué)香檳分校和普渡大學(xué)研究人員的調(diào)查發(fā)現(xiàn),IR 是研究人員提交科研數(shù)據(jù)的第一選擇,他們認(rèn)為圖書(shū)館員能協(xié)助他們解決各種問(wèn)題,科研數(shù)據(jù)在IR 中能得到妥善處理和利用,同時(shí)IR 能幫助他們擴(kuò)大和外界的學(xué)術(shù)交流。文獻(xiàn)顯示,國(guó)外高校圖書(shū)館建設(shè)本校研究數(shù)據(jù)資源有兩種途徑,一個(gè)是利用機(jī)構(gòu)知識(shí)庫(kù)收集,另一個(gè)是單獨(dú)建設(shè)研究數(shù)據(jù)平臺(tái)。在我國(guó),武漢大學(xué)圖書(shū)館、復(fù)旦大學(xué)圖書(shū)館和北京大學(xué)圖書(shū)館相繼推出了研究數(shù)據(jù)平臺(tái),但沒(méi)有融入IR。如果將來(lái)這些數(shù)據(jù)平臺(tái)可以和IR 進(jìn)行融合,就會(huì)更全面地揭示研究者研究項(xiàng)目的成果,更全面地評(píng)估研究的影響力。
吳建中[1]指出,下一代機(jī)構(gòu)知識(shí)庫(kù)的數(shù)據(jù)管理面臨三方面的挑戰(zhàn)。首先就是研究人員參與不足;其次是上級(jí)機(jī)構(gòu)沒(méi)有制定相關(guān)政策;第三是存儲(chǔ)與保存基礎(chǔ)設(shè)施薄弱。盡管有開(kāi)放科學(xué)、開(kāi)放數(shù)據(jù)運(yùn)動(dòng)的宣傳,但科研人員數(shù)據(jù)復(fù)用實(shí)踐仍然很不普遍,他們有各種各樣的顧慮不愿意把自己手中的數(shù)據(jù)開(kāi)放共享,比如濫用和侵權(quán)風(fēng)險(xiǎn),來(lái)自組織的壓力,害怕喪失學(xué)術(shù)優(yōu)勢(shì)[22]。其結(jié)果是科研人員難以獲取或者無(wú)法復(fù)用共享數(shù)據(jù),呈現(xiàn)出對(duì)數(shù)據(jù)復(fù)用價(jià)值的高度認(rèn)可與低水平數(shù)據(jù)復(fù)用實(shí)踐之間的矛盾。因此,高校圖書(shū)館首先要打消科研人員對(duì)數(shù)據(jù)共享的顧慮和擔(dān)心,做好數(shù)據(jù)資源共享的宣傳和培訓(xùn)。第二,圖書(shū)館開(kāi)展灰色數(shù)據(jù)資源利用規(guī)劃時(shí),要取得上級(jí)機(jī)構(gòu)的支持,學(xué)校的相關(guān)政策是IR 數(shù)據(jù)管理的保障。第三,研究過(guò)程灰色數(shù)據(jù)資源的管理目標(biāo)就是要保證學(xué)術(shù)研究記錄的完整性、連續(xù)性和真實(shí)性,保證數(shù)據(jù)以可存儲(chǔ)、可訪問(wèn)、可共享和可理解的形式呈現(xiàn)給用戶復(fù)用[23,24]。龔曉陽(yáng)等[25]總結(jié)了下一代IR 與傳統(tǒng)IR 的技術(shù)優(yōu)勢(shì),包括:①注重互操作性,支持資源交互和資源同步傳輸;②注重資源發(fā)現(xiàn),支持批量發(fā)現(xiàn)和導(dǎo)航發(fā)現(xiàn);③支持收集學(xué)術(shù)活動(dòng)信息;④支持對(duì)資源唯一標(biāo)識(shí)符的識(shí)別,實(shí)現(xiàn)定向識(shí)別目標(biāo)網(wǎng)頁(yè)實(shí)體。為保證數(shù)據(jù)管理的有效性,國(guó)際上已經(jīng)開(kāi)發(fā)了一系列標(biāo)準(zhǔn)和方案, 如數(shù)據(jù)類型和格式標(biāo)準(zhǔn)、元數(shù)據(jù)方案以及數(shù)據(jù)監(jiān)護(hù)需求調(diào)查模板等,其目的是通過(guò)對(duì)科學(xué)數(shù)據(jù)的持續(xù)監(jiān)護(hù)實(shí)現(xiàn)數(shù)據(jù)的發(fā)現(xiàn)、互操作和復(fù)用。
數(shù)據(jù)復(fù)用(Data Reuse),有時(shí)也譯為“數(shù)據(jù)重用”“數(shù)據(jù)再利用”,指的是為了新的研究目的對(duì)數(shù)據(jù)的二次使用。本文根據(jù)下一代機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)目標(biāo),提出以下灰色數(shù)據(jù)資源的開(kāi)放共享與復(fù)用策略。
1.營(yíng)造開(kāi)放數(shù)據(jù)的文化氛圍,關(guān)注技術(shù)手段,促進(jìn)數(shù)據(jù)開(kāi)放共享。高校圖書(shū)館一直都是機(jī)構(gòu)知識(shí)庫(kù)建設(shè)的主題,積極宣傳推進(jìn)文獻(xiàn)資源開(kāi)放獲取。在推動(dòng)灰色數(shù)據(jù)資源開(kāi)放共享和復(fù)用時(shí),圖書(shū)館應(yīng)積極宣傳開(kāi)放科學(xué)開(kāi)放數(shù)據(jù)的理念,宣傳國(guó)際科學(xué)數(shù)據(jù)管理比較認(rèn)同F(xiàn)AIR 數(shù)據(jù)管理原則和評(píng)價(jià)數(shù)據(jù)管理FAIR 程度的指標(biāo)[26],推動(dòng)各方的了解、支持和參與數(shù)據(jù)開(kāi)放和共享復(fù)用。針對(duì)機(jī)構(gòu)知識(shí)庫(kù)的局限性,國(guó)際上很多一流高校圖書(shū)館也在積極探索升級(jí)完善IR。比如美國(guó)明尼蘇達(dá)大學(xué)的研究數(shù)據(jù)庫(kù)就是大學(xué)機(jī)構(gòu)知識(shí)庫(kù)的子集,具有自定義元數(shù)據(jù)模式與提交工作流的功能。該數(shù)據(jù)庫(kù)為用戶提供靈活的數(shù)據(jù)訪問(wèn)方式,滿足科研項(xiàng)目資助者對(duì)項(xiàng)目數(shù)據(jù)存儲(chǔ)和保存的要求[27]。我國(guó)高校圖書(shū)館也在嘗試拓展IR 數(shù)據(jù)共享的功能。例如:西安交通大學(xué)圖書(shū)館建設(shè)的IR[28],研究了IR 與學(xué)校不同信息平臺(tái)及相關(guān)數(shù)據(jù)庫(kù)平臺(tái)的數(shù)據(jù)共享集成和再利用,突破IR 信息孤島瓶頸,使得IR 為學(xué)校教學(xué)和科研提供數(shù)據(jù)支撐及科研成果管理的拓展應(yīng)用奠定基礎(chǔ)。
2.規(guī)范出版授權(quán)許可協(xié)議。濫用數(shù)據(jù)和侵權(quán)風(fēng)險(xiǎn)是阻礙學(xué)者開(kāi)放數(shù)據(jù)、共享數(shù)據(jù)的主要障礙之一。高校圖書(shū)館應(yīng)幫助學(xué)者提高版權(quán)意識(shí)和協(xié)議能力。國(guó)外部分高校(如美國(guó)MIT、哈佛大學(xué)等)為本校學(xué)者提供協(xié)議模板的做法值得我國(guó)高校圖書(shū)館借鑒[29]。同時(shí)應(yīng)宣傳科學(xué)數(shù)據(jù)管理的FAIR 原則并不是要求所有數(shù)據(jù)無(wú)條件開(kāi)放共享,F(xiàn)AIR 原則倡導(dǎo)“盡可能地開(kāi)放,并在必要時(shí)封閉(as open as possible,as closed as necessary)”[30]的數(shù)據(jù)管理路徑。提倡數(shù)據(jù)的擁有者盡可能最大限度地開(kāi)放他們的數(shù)據(jù),共享數(shù)據(jù)利用復(fù)用。但對(duì)于敏感數(shù)據(jù),如健康數(shù)據(jù)或者涉及安全的數(shù)據(jù)就應(yīng)該限制數(shù)據(jù)的訪問(wèn)和共享。同時(shí),高校圖書(shū)館要宣傳知識(shí)共享許可協(xié)議(Creative Commons license),即 CC 協(xié)議[31],允許他人傳播作品的公共版權(quán)許可。CC 協(xié)議的限制條件,包括署名(BY)、禁止商用(NC)、禁止修改(ND)和相同方式分享(SA)四種條款的單項(xiàng)或者組合,CC0 協(xié)議相當(dāng)于放棄以上四種權(quán)利的CC 協(xié)議授權(quán),數(shù)據(jù)使用者完全沒(méi)有任何限制。對(duì)于存儲(chǔ)在IR 中的研究數(shù)據(jù),要有訪問(wèn)使用的許可協(xié)議,對(duì)數(shù)據(jù)開(kāi)放共享程度做出說(shuō)明。例如:中國(guó)科學(xué)院高能物理研究所IR 提供數(shù)據(jù)集檢索[32],用戶點(diǎn)擊下載數(shù)據(jù)集的時(shí)候,可見(jiàn)到“關(guān)于請(qǐng)求全文的合理使用聲明”,用戶需提供姓名、所在機(jī)構(gòu)、個(gè)人電子郵箱、請(qǐng)求理由等信息,待作者授權(quán)通過(guò)后才可以下載數(shù)據(jù)集。
3.加強(qiáng)校際合作與交流,促進(jìn)資源開(kāi)放共享。雖然我國(guó)IR 數(shù)量越來(lái)越多,但各個(gè)IR 仍然處于孤島狀態(tài),沒(méi)有建立起IR 之間的有效關(guān)聯(lián),IR 的資源難以被利用與共享檢索。下一代機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)目標(biāo)要通過(guò)IR合作,建立各個(gè)IR 之間的關(guān)聯(lián)和協(xié)作,共同分享本地資源。龔亦農(nóng)等的調(diào)查發(fā)現(xiàn),聯(lián)盟是推進(jìn)我國(guó)IR 建設(shè)的主力。IR 聯(lián)盟除了統(tǒng)籌規(guī)劃組織管理外,還為成員提供IR 托管服務(wù),幫助構(gòu)建IR 門(mén)戶,構(gòu)建OA 政策。所以,在促進(jìn)下一代IR 灰色數(shù)據(jù)資源開(kāi)放共享的進(jìn)程中,IR 聯(lián)盟還將發(fā)揮重要作用。
本文對(duì)下一代機(jī)構(gòu)知識(shí)庫(kù)中灰色資源進(jìn)行了梳理,重點(diǎn)對(duì)灰色數(shù)據(jù)資源的類型和特點(diǎn)進(jìn)行了分析,明確下一代IR 中灰色數(shù)據(jù)資源管理范圍、采集存儲(chǔ)策略、共享方式及復(fù)用策略,并對(duì)灰色資源的關(guān)聯(lián)組織進(jìn)行了規(guī)劃,分析了灰色資源的數(shù)據(jù)共享及數(shù)據(jù)復(fù)用策略,并提出促進(jìn)高?;疑珨?shù)據(jù)資源建設(shè)的手段。首先,在高校營(yíng)造開(kāi)放數(shù)據(jù)的文化氛圍、關(guān)注技術(shù)手段促進(jìn)數(shù)據(jù)開(kāi)放共享;其次,規(guī)范出版授權(quán)許可協(xié)議;再次,加強(qiáng)校際合作與交流,促進(jìn)資源開(kāi)放共享,為下一代IR中灰色數(shù)據(jù)資源建設(shè)和使用提供思路和方法。本文僅限于在理論上的分析,缺乏實(shí)際案例分析,對(duì)高校圖書(shū)館采集和復(fù)用灰色數(shù)據(jù)資源缺乏可操作性的指導(dǎo),這是本文的局限性也是將來(lái)的研究方向。