田 稷
(浙江大學(xué)圖書館,杭州,310027)
隨著信息技術(shù)的發(fā)展和時代的進步,開放科學(xué)日益成為科技與社會創(chuàng)新的基礎(chǔ)、促進科研人員合作與交流的重要環(huán)境。開放科學(xué)的重要基礎(chǔ)包括科技論文開放獲取與科學(xué)數(shù)據(jù)開放共享。數(shù)據(jù)出版作為科學(xué)數(shù)據(jù)開放共享非常重要的新模式,近年成為出版界、圖書館界、政府相關(guān)機構(gòu)、研究人員關(guān)注的熱點。由于數(shù)據(jù)成果并不包括在當(dāng)前的學(xué)術(shù)評價體系中、數(shù)據(jù)共享缺乏原生動力、數(shù)據(jù)出版增量迅猛引發(fā)評議瓶頸等,科學(xué)數(shù)據(jù)出版目前仍存在許多需要克服和解決的問題和挑戰(zhàn)。
本文提出一種科學(xué)數(shù)據(jù)混合出版新模式:采用混合評議對規(guī)?;某霭鏀?shù)據(jù)進行質(zhì)量審核;采取免費或有條件使用數(shù)據(jù)的靈活機制來提升學(xué)術(shù)交流效率,促進數(shù)據(jù)交換與共享;將集成出版模式、數(shù)據(jù)倉儲出版模式和數(shù)據(jù)期刊獨立出版模式的功能融合到同一平臺,以提高作者的參與度和認可度,并為數(shù)據(jù)期刊提供優(yōu)質(zhì)的稿件來源。最后探討了高校圖書館在科學(xué)數(shù)據(jù)混合出版中可以發(fā)揮的重要作用。
科學(xué)數(shù)據(jù)出版目前并無統(tǒng)一的定義。有研究認為,科學(xué)數(shù)據(jù)出版是遵循規(guī)范的質(zhì)量管理和控制流程前提下的正式的科學(xué)數(shù)據(jù)發(fā)布。廣義的數(shù)據(jù)出版可包括任何數(shù)據(jù)上傳到網(wǎng)絡(luò)并支持開放獲取的行為,但一般更被認可的,是指包含數(shù)據(jù)提交、同行評議、數(shù)據(jù)發(fā)布和永久存儲、數(shù)據(jù)引用、影響力評價等具有完整生命周期的學(xué)術(shù)數(shù)據(jù)發(fā)布行為。
目前國內(nèi)外對科學(xué)數(shù)據(jù)出版及其模式的研究與實踐尚處于初級階段。在研究方面,國外文獻主要集中在數(shù)據(jù)出版的技術(shù)、安全、隱私保護等方面,如范登·愛因登(Van den Eynden)等介紹了社會科學(xué)研究數(shù)據(jù)自出版系統(tǒng)ReShare,期刊可選擇同行評審員訪問已發(fā)布數(shù)據(jù)集,通過同行評議實行期刊發(fā)表;侯賽尼· K(Al-Hussaeni K)等研究了數(shù)據(jù)出版中不同級別的隱私保護技術(shù);賴?yán)≧eilly S)等研究了集中出版模式中生成或重用原始數(shù)據(jù)的研究人員,提供交流機制的出版商,以及提供并保存支持學(xué)術(shù)交流和已發(fā)表記錄的證據(jù)的“圖書館與數(shù)據(jù)”人員的角色與利益;亞森(Yaseen S)等研究如何在數(shù)據(jù)出版中的隱私安全和應(yīng)用中取得折衷的技術(shù)等。國內(nèi)文獻主要涉及不同模式的比較研究,如黃國彬根據(jù)科學(xué)數(shù)據(jù)產(chǎn)生情形,將科學(xué)數(shù)據(jù)出版分為集成出版和獨立出版兩種模式,得出獨立出版模式的質(zhì)量審核更為完善的結(jié)論,并討論不同的出版模式的不同費用標(biāo)準(zhǔn)和承擔(dān)主體;梁子裕在分析評價數(shù)據(jù)論文出版、獨立出版、合作出版等三種國外科學(xué)數(shù)據(jù)出版模式的優(yōu)缺點的基礎(chǔ)之上,提出對我國數(shù)據(jù)出版模式的借鑒與優(yōu)化策略;張靜蓓等將科學(xué)數(shù)據(jù)出版分為數(shù)據(jù)獨立出版、數(shù)據(jù)論文出版、合作出版和期刊自行出版四種模式,分析每種模式的數(shù)據(jù)出版流程,研究其引用策略。
在實踐方面,科學(xué)數(shù)據(jù)出版主要分成如下三種模式。
集成出版:學(xué)術(shù)論文公開發(fā)表在傳統(tǒng)期刊或開放獲取期刊上,支撐該論文的數(shù)據(jù)則提交給期刊認可的知識庫,這是目前大多數(shù)期刊對發(fā)表需要數(shù)據(jù)支撐的論文時采用的模式。如《自然》()、《科學(xué)》()、PLoS等推薦或者強制要求科研人員將論文所涉數(shù)據(jù)提交到指定知識庫或公共知識庫中。
數(shù)據(jù)期刊獨立出版:與開放獲取期刊類似,只是用數(shù)據(jù)代替了論文。如中國科學(xué)院的《中國科學(xué)數(shù)據(jù)》,是目前中國唯一的專門面向多學(xué)科領(lǐng)域的數(shù)據(jù)學(xué)術(shù)期刊。整個出版設(shè)計與傳統(tǒng)期刊類似,有正式的刊號及具體的期號,經(jīng)同行評議后正式發(fā)表和公開。
數(shù)據(jù)倉儲獨立出版:數(shù)據(jù)也是獨立存在,但并不要求同行評審及強制全部公開,如Figshare和ResearchGate。它們接收作者上傳數(shù)據(jù)、圖表、多媒體、海報、論文(包括預(yù)印本)和文件等,可以存儲暫時不想公開的數(shù)據(jù)。Figshare強調(diào)體現(xiàn)數(shù)據(jù)的優(yōu)先發(fā)布,平臺提供瀏覽、下載和引用統(tǒng)計等功能。
以上三種模式中,集成出版的數(shù)據(jù)僅是期刊論文的支撐,量少且并不一定完整;數(shù)據(jù)期刊獨立出版的數(shù)據(jù)均通過同行評審,質(zhì)量高,但能夠出版的數(shù)據(jù)非常有限。這兩種出版模式能接納數(shù)據(jù)的量都很少,存在數(shù)據(jù)孤島和創(chuàng)新孤島,不利于實現(xiàn)大規(guī)模的數(shù)據(jù)開放與共享。數(shù)據(jù)倉儲獨立出版模式實現(xiàn)了以存儲和公開為主要目的的廣義的數(shù)據(jù)出版,可以實現(xiàn)大范圍的數(shù)據(jù)共享,但平臺“重存儲,輕利用”,對數(shù)據(jù)的審核側(cè)重于技術(shù)質(zhì)量和元數(shù)據(jù)的全面性、準(zhǔn)確性,并不審核數(shù)據(jù)的科學(xué)質(zhì)量。這樣,優(yōu)質(zhì)數(shù)據(jù)淹沒在海量數(shù)據(jù)中,難以辨識和獲?。欢易髡呖赡芴峁┩耆赓M的數(shù)據(jù),也可能僅存儲而不公開,存在作者與用戶激勵和平臺認可度等問題,對平臺的可持續(xù)發(fā)展和深度利用帶來困擾。針對這些問題,本文以數(shù)據(jù)倉儲獨立出版模式為基礎(chǔ),將上面三種出版模式功能結(jié)合在一起,提出一種能將高質(zhì)量、高價值數(shù)據(jù)從海量數(shù)據(jù)中顯現(xiàn)出來,促進數(shù)據(jù)的利用和共享的科學(xué)數(shù)據(jù)混合出版模式。
科學(xué)數(shù)據(jù)混合出版模式,是將所有能支撐學(xué)術(shù)論文的數(shù)據(jù)、獨立的研究數(shù)據(jù)或成果等作為出版對象,用戶、圖書館館員或同行評議專家均可對通過規(guī)范審查的數(shù)據(jù)進行有償或無償?shù)馁|(zhì)量審核,基于免費、收費、交換或合作署名等機制共享與利用數(shù)據(jù),通過數(shù)據(jù)倉儲平臺公開或數(shù)據(jù)期刊獨立公開的形式出版數(shù)據(jù)。即所謂混合,是在質(zhì)量評議、收費機制和出版形態(tài)等方面多種機制的混合,力爭打造一個良好的數(shù)據(jù)出版生態(tài)環(huán)境?;旌铣霭婺J降牧鞒倘鐖D1所示。
圖1 科學(xué)數(shù)據(jù)混合出版流程圖
作者向數(shù)據(jù)出版平臺提交其研究過程或成果數(shù)據(jù)。簡單易操作等良好的用戶體驗是影響作者選擇平臺的重要因素。出版平臺需要提供專門的提交模板,作者只需在模板上按規(guī)定格式填充相關(guān)內(nèi)容即可。除常規(guī)的題名、作者、學(xué)科分類選項、文檔類型(數(shù)據(jù)集、圖表等)、描述、基金、參考文獻鏈接、許可等選項外,混合出版模式的數(shù)據(jù)提交模板還包括質(zhì)量評議選項、數(shù)據(jù)公開條件(免費、收費或交換)選項、研究要素公開選項。
平臺根據(jù)規(guī)定格式,審核作者提交的內(nèi)容是否符合規(guī)范,如數(shù)據(jù)類型和格式是否符合要求,數(shù)據(jù)描述等必要選項是否完整等。由平臺管理方和系統(tǒng)完成規(guī)范審核,并不對數(shù)據(jù)的科學(xué)性和質(zhì)量進行評定。
通過規(guī)范審核的數(shù)據(jù)在平臺上公開發(fā)布,未通過審核的返回作者修改。
出版平臺一旦發(fā)表某一數(shù)據(jù),所有訪問數(shù)據(jù)的用戶都可以直接對之進行網(wǎng)絡(luò)評議、打分、討論等互動與交流?;旌铣霭婺J讲捎萌N方式對數(shù)據(jù)進行質(zhì)量評議,具體包括用戶評議、圖書館員評議和同行專家評議。
用戶評議:類似豆瓣點評和淘寶買家評價,平臺設(shè)置評議選項,用戶可以對數(shù)據(jù)的各種要素進行打分和評價,包括內(nèi)容質(zhì)量、應(yīng)用價值等。此處的用戶包含所有訪問數(shù)據(jù)的人,可以是同行,也可以是跨學(xué)科使用的研究者。
圖書館員評議:圖書館員利用其專業(yè)素養(yǎng),實現(xiàn):(1)對用戶評議的內(nèi)容進行整理;(2)利用數(shù)據(jù)的下載量、引用量和Altmetrics指數(shù)等,形成計量學(xué)意義上的數(shù)據(jù)影響力評價;(3)通過對數(shù)據(jù)的描述文檔進行分析,對數(shù)據(jù)的創(chuàng)新性進行評議。在這些基礎(chǔ)上形成評議結(jié)論,作為同行專家選擇數(shù)據(jù)并進行評議的重要參考。
同行專家評議:由平臺構(gòu)建開放性的網(wǎng)絡(luò)同行評議專家?guī)?,同行專家自愿加入。同行專家主要對?shù)據(jù)的科學(xué)性和內(nèi)容質(zhì)量進行評議,然后形成供用戶和數(shù)據(jù)期刊選擇優(yōu)質(zhì)數(shù)據(jù)的重要參考意見。
為激勵更多人參與評議,評議行為可以是收費方式,也可以是免費方式。對于收費評議,評議費用可由數(shù)據(jù)作者提供、用戶(包括個人或數(shù)據(jù)期刊)提供和平臺提供等。
科學(xué)數(shù)據(jù)利用主要涉及數(shù)據(jù)下載和數(shù)據(jù)引用。此外,用戶可能不僅僅對數(shù)據(jù)本身感興趣,還對實驗流程、方法、材料、經(jīng)驗教訓(xùn)等科學(xué)數(shù)據(jù)研究要素感興趣,由此將催生對數(shù)據(jù)研究要素的需求和利用。
數(shù)據(jù)可以在平臺永久保存,實現(xiàn)自出版;數(shù)據(jù)期刊可以基于數(shù)據(jù)評議結(jié)果選擇合適的對象進行正式出版。
相對當(dāng)前主要的數(shù)據(jù)出版模式,數(shù)據(jù)混合出版模式具有如下創(chuàng)新特征和優(yōu)勢:
任何出版都意味著對出版對象的內(nèi)容質(zhì)量給以一定程度的認可,傳統(tǒng)出版采用同行評議方式來實現(xiàn)。雖然數(shù)據(jù)出版并不需要強制進行同行評議,但同行評議仍然是保證出版質(zhì)量的最佳方式。但對于集成出版模式和數(shù)據(jù)倉儲獨立出版模式,數(shù)據(jù)質(zhì)量審核存在缺乏評議標(biāo)準(zhǔn)、評議時間成本高昂(如評議一份數(shù)學(xué)或物理數(shù)據(jù)需要6—8個小時)、目前科學(xué)共同體尚未給數(shù)據(jù)同行評議專家以相應(yīng)的社會及學(xué)術(shù)認可而嚴(yán)重影響評議者的積極性等困難,特別對于數(shù)據(jù)倉儲獨立出版模式,最大的困難在于提交給平臺的數(shù)據(jù)數(shù)量和增長速度遠遠大于傳統(tǒng)出版,數(shù)據(jù)同行評議的專家嚴(yán)重缺乏,無法實現(xiàn)對規(guī)模化的數(shù)據(jù)進行質(zhì)量審核。
混合出版模式的一個重要特征和優(yōu)勢就在于它采用混合評議方式實現(xiàn)規(guī)?;某霭鏀?shù)據(jù)質(zhì)量審核。數(shù)據(jù)用戶根據(jù)自己對數(shù)據(jù)的利用情況給以質(zhì)量評議;圖書館員基于用戶評議結(jié)果,或者直接基于數(shù)據(jù)的下載量、引用量等計量學(xué)指標(biāo)表現(xiàn),選擇數(shù)據(jù)并對之進行更深入的創(chuàng)新性和影響力評價,形成評價結(jié)論;同行專家參考圖書館員評議或數(shù)據(jù)的計量學(xué)指標(biāo)表現(xiàn),有目的地選擇數(shù)據(jù)進行評價,然后形成可供用戶選擇或數(shù)據(jù)期刊選擇優(yōu)質(zhì)數(shù)據(jù)的推薦意見。由于包括作者與讀者的所有用戶和圖書館員都可參與質(zhì)量評議,平臺的同行專家?guī)鞂λ型袑<议_放,這種具有社交網(wǎng)絡(luò)屬性的評議方式時效性高、參評人員數(shù)量有保障、評議完全透明和公開,混合評議將在很大程度解決數(shù)據(jù)出版的質(zhì)量評議瓶頸問題。
由于目前科學(xué)數(shù)據(jù)出版平臺大多是由公共資金支持建設(shè)與運維,社會資金運營的出版平臺所收取的費用也僅是數(shù)據(jù)存儲與管理費用,不能像傳統(tǒng)出版那樣從成熟的產(chǎn)業(yè)鏈中獲得穩(wěn)定利潤來支付同行評議專家勞動報酬,這樣的資金運作方式不能長遠支持對科學(xué)數(shù)據(jù)的同行評議。
混合評議將通過收費與免費相結(jié)合的評議方式來解決此問題。用戶、圖書館員和同行專家都可以自愿提供對數(shù)據(jù)的免費評議,但合理的收費機制將激勵更多的人參與。如渴望得到質(zhì)量評議的作者可以主動提供費用,吸引他人對自己公開的數(shù)據(jù)進行質(zhì)量評議;用戶可以提供評議費用,讓他人幫助自己盡快在海量數(shù)據(jù)中找到想要的優(yōu)質(zhì)數(shù)據(jù);數(shù)據(jù)期刊可以提供評議費用,讓大家?guī)椭x擇和審核自己期刊想組稿發(fā)表的數(shù)據(jù);平臺管理方也可以有意提供評議費用,吸引更多人評價更多的數(shù)據(jù),從而進一步提升平臺的學(xué)術(shù)價值和影響力,費用來源可以是平臺廣告費、政府或社會機構(gòu)支持等。這樣的混合評議收費機制在極大提升出版數(shù)據(jù)的評議比例的同時,也為長遠解決數(shù)據(jù)出版中的質(zhì)量評議費用問題提供有效方案。
雖然出版的科學(xué)數(shù)據(jù)很多是公共資助項目的產(chǎn)物,但也必須認可不同科研人員的不同勞動與智慧,開放科學(xué)并不應(yīng)該總是向所有人員全部無償開放。如果一刀切地要求作者都無償共享數(shù)據(jù),那么部分人可能會選擇不發(fā)表或有保留地發(fā)表。筆者曾就此對浙江大學(xué)4個學(xué)院10位不同專業(yè)的老師進行了訪談?wù){(diào)查,他們都愿意在合適的平臺上公開自己長期研究積累的各種數(shù)據(jù)。其中2人愿意無條件公開,8人表示主要是希望讓人知道這些數(shù)據(jù)的存在,以及存在何處,5人希望是有條件的共享,如數(shù)據(jù)交換、合作署名,或者收取一定費用。另一方面,他們表示,如果可以基于別人的數(shù)據(jù)進行研究,也愿意通過類似喜馬拉雅平臺的知識付費方式滿足自己的數(shù)據(jù)需求。
當(dāng)前主流的數(shù)據(jù)出版模式中,平臺對數(shù)據(jù)作者免費或收取一定費用,數(shù)據(jù)利用方一般并不付費,這種單向收費方式不利于數(shù)據(jù)的完全開放與利用。為了鼓勵更多的人共享與利用數(shù)據(jù),促進數(shù)據(jù)的交換和研究人員之間的合作,混合出版模式采取靈活機制來多樣性鼓勵大家利用數(shù)據(jù)。數(shù)據(jù)的下載既可以是免費的,也可以是收費的,收費與否及收費多少由作者或傳播者自行確定。數(shù)據(jù)引用則分兩種情況,一種是傳統(tǒng)意義上的引用,另一種是借用作者的數(shù)據(jù)進行自己的研究。對于傳統(tǒng)意義的引用,應(yīng)該是完全免費;但對于將別人出版的科學(xué)數(shù)據(jù)作為自己研究的一部分,用戶應(yīng)根據(jù)原數(shù)據(jù)作者或傳播者的要求進行免費或收費引用,或者通過數(shù)據(jù)交換或共同署名的方式進行引用。
開放科學(xué)環(huán)境下,科研人員擔(dān)心各種開放模式帶來的變化有可能影響到對他們的學(xué)術(shù)認可與評價?;旌铣霭婺J饺诤狭藬?shù)據(jù)倉儲出版和數(shù)據(jù)期刊出版功能,平臺可以根據(jù)混合評議及數(shù)據(jù)利用的綜合表現(xiàn),向數(shù)據(jù)期刊推薦數(shù)據(jù)。數(shù)據(jù)期刊選擇表現(xiàn)優(yōu)秀的數(shù)據(jù),進行同行評議或直接在數(shù)據(jù)期刊上正式發(fā)表,這個過程讓作者得到了學(xué)術(shù)共同體的認可。而對于未能在數(shù)據(jù)期刊上發(fā)表的數(shù)據(jù),平臺不僅提供永久的公開與保存,而且由于有用戶評議和圖書館評議機制的保障,高質(zhì)量數(shù)據(jù)的可發(fā)現(xiàn)性將得以大幅度提升,進而提高平臺的社會認可度。學(xué)術(shù)認可度與社會認可度的提升將吸引更多作者將自己的研究成果公開到平臺上出版,以及更多的用戶關(guān)注和利用平臺數(shù)據(jù)。
開放科學(xué)為圖書館事業(yè)的發(fā)展帶來了新的挑戰(zhàn)和要求,也帶來了新興機遇。圖書館深度參與科學(xué)數(shù)據(jù)出版,是未來高校圖書館的發(fā)展趨勢之一。
館員的職業(yè)素養(yǎng)為圖書館參與科學(xué)數(shù)據(jù)出版打下了堅實的基礎(chǔ)。開放科學(xué)環(huán)境下,出版商、圖書館、集成商和作者將在信息的創(chuàng)造和傳播過程中進一步融合,圖書館館員在科學(xué)數(shù)據(jù)的描述、組織、選擇、評價、服務(wù)等過程中都可以發(fā)揮重要作用,如制定數(shù)據(jù)規(guī)范與標(biāo)準(zhǔn)、質(zhì)量評議、數(shù)據(jù)分析與服務(wù)、永久存儲與管理等:
元數(shù)據(jù)是推進科學(xué)數(shù)據(jù)共享、實現(xiàn)數(shù)據(jù)出版、支持數(shù)據(jù)的可發(fā)現(xiàn)和利用的重要基礎(chǔ)。目前的數(shù)據(jù)倉儲獨立出版平臺(如圖文數(shù)據(jù)共享(Figshare))上數(shù)據(jù)的元數(shù)據(jù)只是按都柏林核心(Dublin Core,DC)元數(shù)據(jù)標(biāo)準(zhǔn)創(chuàng)建后,由作者進行核查和修改,這樣簡單的元數(shù)據(jù)并不能很好地支持對數(shù)據(jù)的深度揭示與利用。另一方面,科學(xué)數(shù)據(jù)有實驗數(shù)據(jù)、測量數(shù)據(jù)、統(tǒng)計數(shù)據(jù)、觀察數(shù)據(jù)、調(diào)查數(shù)據(jù)等,各個學(xué)科特點不盡相同,數(shù)據(jù)種類和格式存在多樣性和復(fù)雜性,給數(shù)據(jù)出版的平臺設(shè)計和數(shù)據(jù)的共享與利用帶來挑戰(zhàn)。而且相對學(xué)術(shù)論文而言,科學(xué)數(shù)據(jù)缺乏獨立性,為了使數(shù)據(jù)更易于獲取、互連和可發(fā)現(xiàn),需要高質(zhì)量的元數(shù)據(jù)來幫助理解和使用。高校圖書館在元數(shù)據(jù)標(biāo)準(zhǔn)制定與數(shù)據(jù)標(biāo)引方面具有極其豐富的經(jīng)驗和專業(yè)的人才隊伍,館員可以制定更為專業(yè)和科學(xué)的元數(shù)據(jù)標(biāo)準(zhǔn),借助工具和技術(shù),實現(xiàn)對大規(guī)模數(shù)據(jù)的有效標(biāo)引。
由于混合出版模式中數(shù)據(jù)質(zhì)量評議的開放性和眾包性,數(shù)據(jù)出版平臺將匯集各種反饋意見和積淀各種利用數(shù)據(jù)。高校圖書館近年引進了大量具有一定學(xué)科背景的高學(xué)歷館員,可以利用他們的專業(yè)知識和職業(yè)素養(yǎng)對這些信息進行梳理與挖掘,基于用戶利用信息進行質(zhì)量評議;可根據(jù)數(shù)據(jù)的關(guān)注度、下載量、引用量等的統(tǒng)計分析出數(shù)據(jù)的受眾面、影響力等,構(gòu)建相應(yīng)的質(zhì)量評價等級標(biāo)準(zhǔn),對數(shù)據(jù)進行分類分級;可以利用科技查新等技能深入分析數(shù)據(jù)描述文檔,對數(shù)據(jù)內(nèi)容的創(chuàng)新性給以評價,為數(shù)據(jù)的后續(xù)利用提供指導(dǎo)性意見。而且,可以借鑒文獻傳遞機制,以聯(lián)盟的形式制定統(tǒng)一的評議標(biāo)準(zhǔn),讓眾多圖書館及館員參與,從而實現(xiàn)數(shù)據(jù)質(zhì)量評議的標(biāo)準(zhǔn)化和規(guī)?;?/p>
科學(xué)數(shù)據(jù)混合出版模式不僅實現(xiàn)數(shù)據(jù)的公開與長期保存,更關(guān)注如何進行有效的利用。高校圖書館可以借助其服務(wù)師生和科研人員的專業(yè)知識與技能,在科學(xué)數(shù)據(jù)利用與服務(wù)方面發(fā)揮重要作用。如引導(dǎo)師生積極出版自己的科研數(shù)據(jù),幫助查找和使用研究數(shù)據(jù);幫助研究人員發(fā)現(xiàn)與尋找合作對象,促進科研合作與交流、學(xué)科交叉與科學(xué)創(chuàng)新。
科學(xué)數(shù)據(jù)蘊含巨大的應(yīng)用價值,圖書館館員可以開展針對科學(xué)數(shù)據(jù)的多種增值服務(wù)。如根據(jù)研究人員、課題組或?qū)W科需求,檢索收集專題數(shù)據(jù)并按主題或?qū)W科進行二次分類、標(biāo)引等,形成特定數(shù)據(jù)集,幫助用戶在海量數(shù)據(jù)集中專注跟蹤了解自己的研究領(lǐng)域;對特定數(shù)據(jù)集進行數(shù)據(jù)挖掘與可視化關(guān)聯(lián)分析,幫助用戶對數(shù)據(jù)進行深層利用,使其隱藏的重要價值得以顯現(xiàn);幫助交叉學(xué)科項目收集、整理數(shù)據(jù),形成相應(yīng)的交叉學(xué)科數(shù)據(jù)利用平臺;跟蹤收集與整理失敗數(shù)據(jù),形成極具利用價值的失敗數(shù)據(jù)檢索與利用平臺等等。
科學(xué)數(shù)據(jù)將與傳統(tǒng)文獻一樣,成為人類發(fā)展歷程中非常重要的知識類型。圖書館一直擔(dān)負著人類知識積淀與傳承的重要歷史使命,必然將這一新型知識納入圖書館統(tǒng)一收藏、管理、揭示與應(yīng)用。目前科學(xué)數(shù)據(jù)出版平臺的承建主體和運維經(jīng)費來源多種多樣,有的承建主體是政府或行業(yè)學(xué)會、協(xié)會等(如《中國科學(xué)數(shù)據(jù)》),也有承建主體是社會資本支持的商業(yè)機構(gòu)(如圖文數(shù)據(jù)共享);出版數(shù)據(jù)的學(xué)科領(lǐng)域、要求、標(biāo)準(zhǔn)等也各不相同,在平臺連續(xù)性、永久性、標(biāo)準(zhǔn)統(tǒng)一性等多方面都存在問題。解決這些問題,需要數(shù)據(jù)出版平臺最終從多元化向歸核化轉(zhuǎn)變。而科學(xué)數(shù)據(jù)混合出版模式由于有圖書館的多重參與,無論平臺的承建主體是誰、運維經(jīng)費來源何處,由圖書館永久保存數(shù)據(jù),將可以最大程度地保障科學(xué)數(shù)據(jù)出版的完整性、連續(xù)性、公共性和服務(wù)性。
過去兩年產(chǎn)生了全球迄今為止50%的數(shù)據(jù),但僅有2%的數(shù)據(jù)得到了分析。科學(xué)數(shù)據(jù)混合出版模式采用開放性的混合評議機制,大大提升數(shù)據(jù)的質(zhì)量評議比例,將更多的高質(zhì)量數(shù)據(jù)從海量數(shù)據(jù)中突顯出來,為用戶選擇和使用數(shù)據(jù)提供了有效參考;設(shè)置免費、收費、數(shù)據(jù)交換與共同署名等靈活多樣的激勵機制,可以提升數(shù)據(jù)出版內(nèi)生動力,實現(xiàn)平臺運維的自主造血,從而打造一個能長效運行的數(shù)據(jù)出版生態(tài)環(huán)境,積極推進開放科學(xué)環(huán)境下數(shù)據(jù)出版的健康長遠發(fā)展?;旌铣霭婺J郊哿水?dāng)前主流數(shù)據(jù)出版模式的優(yōu)點,克服了它們的弊端。文章尚未對混合數(shù)據(jù)出版模式中涉及到的法律與隱私,收費的實現(xiàn)方法及其可能帶來的其他問題,圖書館評議與打分標(biāo)準(zhǔn)、專家評議標(biāo)準(zhǔn),科學(xué)數(shù)據(jù)的增值服務(wù)中包含的知識產(chǎn)權(quán)問題,圖書館如何實現(xiàn)永久保存等問題進行深層次的探討,有待今后進一步研究。但無論如何,作為數(shù)據(jù)出版體系中一個重要角色,高校圖書館需要未雨綢繆并積極參與,才能為其在數(shù)據(jù)時代的轉(zhuǎn)型升級贏得更強的競爭力。
注 釋
[1][11]黃國彬,王舒,屈亞杰.科學(xué)數(shù)據(jù)出版模式比較研究[J].大學(xué)圖書館學(xué)報,2018,36(1):34-40+33
[2]何琳,常穎聰.國內(nèi)外科學(xué)數(shù)據(jù)出版研究進展[J].圖書情報工作,2014,58(5):104-110
[3]Eynden V,Corti L.Advancing research data publishing practices for the social sciences: from archive activity to empowering researchers[J].,2017,18(2):113-121
[4]Al-Hussaeni K,F(xiàn)ung B C M,Iqbal F,et al.Differentially private multidimensional data publishing[J].,2018,56(3):717-752
[5]Reilly S,Schallier W,et al.Report on integration of data and publication [EB/OL].[2019-10-07].https://zenodo.org/record/8307#.XZqkmWZ5vIU
[6]Yaseen S,Abbas S M A,Anjum A,et al.Improved Generalization for Secure Data Publishing[J].,2018,6:27156-27165
[7]梁子裕.國外科研數(shù)據(jù)出版模式研究[J].出版發(fā)行研究,2017(3):82-85
[8]張靜蓓,任樹懷.科研數(shù)據(jù)出版模式、流程及引用策略研究[J].圖書情報工作,2015,59(9):21-27
[9]《中國科學(xué)數(shù)據(jù)》編輯部.中國科學(xué)數(shù)據(jù)[EB/OL].[2019-03-04].http://www.csdata.org/
[12]Figshare[EB/OL].https:// figshare.com/
[13][14]劉鳳紅,張?zhí)?開放科學(xué)背景下新興學(xué)術(shù)論文出版類型:研究要素出版[J].中國科技期刊研究,2017,28(02):138-144
[15]屈寶強,王凱.數(shù)據(jù)出版視角下的科學(xué)數(shù)據(jù)同行評議[J].圖書館雜志,2017,36(10):71-77
[16]frontier[EB/OL].[2019-04-04].https://www.frontiersin.org/
[17]BahlaiCA,BartlettLJ,et al.Open Science Isn't Always Open to All Scientists[J].American Scientist,2019,107(2):78-82
[18]國際科學(xué)編輯.中國相關(guān)機構(gòu)明確力挺論文開放獲取、支持S計劃[EB/OL].[2019-10-08].http://m.sohu.com/a/281258891_100191228
[19]科塔學(xué)術(shù).Figshare 數(shù)據(jù)知識庫[EB/OL].[2019-08-08].https://www.sciping.com/18605.html
[20]Purohit S,Chappell A.Effective Tooling for Linked Data Publishing in Scientific Research[C].2016 IEEE Tenth International Conference on Semantic Computing(ICSC),2016:24-31
[21]Smith M.Communicating with data : new roles for scientists,publishers and librarians[J].,2011,24(3): 203-205
[22]Paige.「上云」不是終點,釋放數(shù)據(jù)價值才是數(shù)字經(jīng)濟時代的「加油站」[EB/OL].[2019-10-07].https://www.geek-share.com/detail/2780650703.html