亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科研數(shù)據(jù)的開放:進(jìn)展、模式與新探索

        2016-04-07 02:00:42張麗麗黎建輝
        大數(shù)據(jù) 2016年6期
        關(guān)鍵詞:科學(xué)

        張麗麗,黎建輝

        中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190

        科研數(shù)據(jù)的開放:進(jìn)展、模式與新探索

        張麗麗,黎建輝

        中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190

        明確了科研數(shù)據(jù)的概念和分類,從原則、政策、技術(shù)、配套措施等方面總結(jié)了科研數(shù)據(jù)開放的當(dāng)前進(jìn)展,并將科研數(shù)據(jù)開放主要概括為自上而下的開放模式、橫縱聯(lián)合的開放模式與自下而上的開放模式3類。進(jìn)一步分析指出,科研數(shù)據(jù)開放需要在強(qiáng)有力的行政力量支持下,配套更多的激勵(lì)措施,調(diào)動(dòng)數(shù)據(jù)擁有者的參與意愿。作為推動(dòng)研究數(shù)據(jù)共享的一種有效形式,研究數(shù)據(jù)出版提供了可行方案,以《中國科學(xué)數(shù)據(jù)》為例,闡釋了數(shù)據(jù)期刊在推動(dòng)科研數(shù)據(jù)出版中的積極實(shí)踐及其戰(zhàn)略意義。

        科研數(shù)據(jù);數(shù)據(jù)開放;數(shù)據(jù)共享;數(shù)據(jù)出版

        1 引言

        自幾千年前的經(jīng)驗(yàn)科學(xué)到近幾百年的理論科學(xué),再到最近幾十年興盛的計(jì)算科學(xué)乃至今天流行的e-Science,科研范式不斷變化,科研數(shù)據(jù)生長周期從未停止,數(shù)據(jù)共享話題同樣經(jīng)久不衰。本文立足大數(shù)據(jù)時(shí)代的科研變革,探討新時(shí)期科研數(shù)據(jù)開放的新趨勢(shì),以期望對(duì)推進(jìn)科研數(shù)據(jù)共享有所幫助。

        2 科研數(shù)據(jù)概述

        “數(shù)據(jù)是用于荷載情報(bào)的物理符號(hào),是對(duì)客觀事物的數(shù)學(xué)表示”[1],是未經(jīng)整理的可被判讀的數(shù)字、文字、符號(hào)、圖像、聲音樣本等[2]。“科學(xué)數(shù)據(jù)(scientific data)”描述的是有科研價(jià)值的數(shù)據(jù)集①http://www. nature.com/ sdata/about,主要來源于假設(shè)科學(xué)中證偽實(shí)驗(yàn)所收集的數(shù)據(jù)和發(fā)現(xiàn)科學(xué)中捕獲并加工而成的數(shù)據(jù)。在此基礎(chǔ)上,科研數(shù)據(jù)是通過收集、觀察、生產(chǎn)、分析加工并為科學(xué)研究成果所用的數(shù)據(jù)②http://www. bu.edu/ datamanagement/ background/ whatisdata/,它是科學(xué)、技術(shù)、醫(yī)學(xué)等領(lǐng)域知識(shí)的構(gòu)建基礎(chǔ)③https://www. elsevier.com/ about/openscience/researchdata。

        科研數(shù)據(jù)來源廣泛,主要產(chǎn)生于政府行政管理活動(dòng)、公益事業(yè)運(yùn)行和科學(xué)研究等場(chǎng)景。政府部門負(fù)責(zé)社會(huì)運(yùn)行的方方面面,其中包含大量的科學(xué)研究基礎(chǔ)數(shù)據(jù),這些公共數(shù)據(jù)具有在新產(chǎn)品和服務(wù)中重用的巨大潛力,能夠通過分享數(shù)據(jù)收獲更多④http://ec.europa. eu/digitalagenda/en/opendata-0。此外還包括大量公共部門生產(chǎn)與捕獲的公益性數(shù)據(jù)資源。而科學(xué)研究活動(dòng)本身也是研究數(shù)據(jù)使用和再生產(chǎn)的主要途徑之一。

        3 開放科研數(shù)據(jù)進(jìn)展

        3.1 全面開放的公益原則

        2001年11月,開放社會(huì)基金會(huì)(Open Society Foundations,OSF)在匈牙利召開有關(guān)開放訪問的國際研討會(huì),會(huì)上發(fā)表的《布達(dá)佩斯開放存取計(jì)劃》⑤http://www. budapestopen accessinitiative. org/background提出開放存?。╫pen access,OA)概念,成為“免費(fèi)存取”的前奏。一系列國際組織紛紛提出或持續(xù)更新基于項(xiàng)目或科研領(lǐng)域的數(shù)據(jù)共享原則。其中,國際核苷序列聯(lián)合數(shù)據(jù)庫聯(lián)盟(INSDC)[3]在《國際核酸序列數(shù)據(jù)庫合作政策》中提出免費(fèi)、非限制性的數(shù)據(jù)存取政策原則。《OECD公共經(jīng)費(fèi)支持的科研數(shù)據(jù)存取原則與指導(dǎo)》⑥http://www.oecd. org/sti/sci-tech/ 38500813.pdf強(qiáng)調(diào)了開放、靈活、透明、依法、知識(shí)產(chǎn)權(quán)保護(hù)、負(fù)責(zé)、專業(yè)、互操作性、質(zhì)量、安全、效率、義務(wù)、可持續(xù)性原則。地球觀測(cè)組織(GEO)⑦h(yuǎn)ttp://www. earthobservations. org/dswg.php提出,數(shù)據(jù)、元數(shù)據(jù)和數(shù)據(jù)產(chǎn)品都默認(rèn)為開放數(shù)據(jù),在最短時(shí)間內(nèi)免費(fèi)、無障礙地提供給注冊(cè)用戶使用,并在重用中予以標(biāo)識(shí)。此外,聯(lián)合國政府間海洋學(xué)委員會(huì)(IOC)⑧http://www. iode.org/index. php?option=com_ content&view= article&id= 51&Itemid=95的《IOC海洋學(xué)數(shù)據(jù)交換政策》、歐洲核子研究組織(CERN)數(shù)據(jù)開放門戶⑨http://opendata. cern.ch/about等也都提出了所在行業(yè)領(lǐng)域的數(shù)據(jù)共享原則或內(nèi)容等。國際科學(xué)理事會(huì)(ICSU)、國際科學(xué)院組織(IAP)、發(fā)展中國家科學(xué)院(TWAS)以及國際社會(huì)科學(xué)理事會(huì)(ISSC)等聯(lián)合發(fā)布的《大數(shù)據(jù)時(shí)代的數(shù)據(jù)開放國際協(xié)定》[4]也倡導(dǎo)勢(shì)在必行的數(shù)據(jù)開放與全球力量參與。這些不同機(jī)構(gòu)組織與行業(yè)領(lǐng)域的科研數(shù)據(jù)開放都貫穿著“全面、開放(full and open)”的基本原則。

        3.2 政府主導(dǎo)的開放政策

        開放數(shù)據(jù)應(yīng)同時(shí)滿足技術(shù)層面和法律層面的開放⑩http://data. worldbank.org/ about/opengovernmentdata-toolkit/ knowledgerepository。政府開放數(shù)據(jù)建設(shè),借助法律手段與技術(shù)實(shí)現(xiàn),將開放科學(xué)理念推向新的發(fā)展高度。

        各國及地區(qū)政府在頒布數(shù)據(jù)共享法規(guī)政策的同時(shí),也成為開放科研數(shù)據(jù)的積極踐行者,這在開放政府的專門網(wǎng)站中也有體現(xiàn),如美國的Data.gov、英國的Data. gov.uk、挪威的data.norge.no、澳大利亞的Data.gov.au、加拿大的Data.gc.ca、肯尼亞的opendata.go.ke、荷蘭的data. overheid.nl、歐盟的publicdata.eu等?http://zh. wikipedia. org/zh/%E9%96% 8B%E6%94%BE% E8%B3%87%E6% 96%99國家和地區(qū)進(jìn)行的政府?dāng)?shù)據(jù)開放實(shí)踐。

        來自美國的開放政府支持者提出“開放政府?dāng)?shù)據(jù)八項(xiàng)原則”?http://opengovdata. org/,包括完整性、原始性、及時(shí)性、可獲取性、機(jī)器可處理、無差別性、非專屬性、免授權(quán),為開放數(shù)據(jù)實(shí)踐提供了參考指南。在我國,研究數(shù)據(jù)共享政策建設(shè)依托行業(yè)實(shí)踐逐步推進(jìn),如《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》《加快推進(jìn)云計(jì)算與大數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)》等。諸多公共領(lǐng)域?qū)嵺`也在日趨深入,如中華人民共和國國家統(tǒng)計(jì)局推行的統(tǒng)計(jì)數(shù)據(jù)公開共享(data.stats.gov.cn)、國家科技基礎(chǔ)條件平臺(tái)資助建立的學(xué)科數(shù)據(jù)共享平臺(tái)(www.escience.gov.cn)等所推進(jìn)的科研數(shù)據(jù)開放工作。

        3.3 開放技術(shù)的全面深入

        信息技術(shù)廣泛滲透科研數(shù)據(jù)管理的全周期,從數(shù)據(jù)的生產(chǎn)與捕獲、數(shù)據(jù)管理(加工處理保存)到數(shù)據(jù)的分享重用,涵蓋諸如語義關(guān)聯(lián)、元數(shù)據(jù)可擴(kuò)展性與互操作、數(shù)據(jù)的結(jié)構(gòu)化與關(guān)聯(lián)化、數(shù)據(jù)的長期保存與智能化分析處理、數(shù)據(jù)集成平臺(tái)的一攬子服務(wù)等。

        整體框架設(shè)計(jì)方面,技術(shù)探索主要面向一體化、協(xié)同化數(shù)據(jù)中心共享平臺(tái)建設(shè)探索,通過統(tǒng)一平臺(tái)、網(wǎng)絡(luò)、系統(tǒng)的建設(shè)來發(fā)揮數(shù)據(jù)共享的統(tǒng)一管理與數(shù)據(jù)中心的優(yōu)勢(shì)[5],實(shí)現(xiàn)不同數(shù)據(jù)集的訪問操作。

        數(shù)據(jù)的生產(chǎn)與捕獲方面,我國近90%的重大科研基礎(chǔ)項(xiàng)目實(shí)現(xiàn)科研數(shù)據(jù)自動(dòng)化采集、70%以上實(shí)現(xiàn)自動(dòng)錄入網(wǎng)絡(luò)傳輸[6],這為高通量數(shù)據(jù)的生產(chǎn)與服務(wù)提供了基礎(chǔ),觀測(cè)與加工處理儀器設(shè)備以及自動(dòng)化采集、傳輸與處理技術(shù)皆得到長足發(fā)展。

        數(shù)據(jù)分析處理方面,R語言、Rapid Miner、Mahout等主流數(shù)據(jù)分析工具的模型算法、可視化、大數(shù)據(jù)處理能力在面向大數(shù)據(jù)集分析的工作中得以發(fā)展,但仍需優(yōu)秀的可視化能力與分布式的數(shù)據(jù)分析模式建設(shè)[7]。面向服務(wù)架構(gòu)(serviceoriented architecture,SOA)利用Web Service技術(shù)對(duì)格式各異的數(shù)據(jù)建立統(tǒng)一的數(shù)據(jù)共享接口設(shè)計(jì)方案,實(shí)現(xiàn)對(duì)各種數(shù)據(jù)資源的集中管理與統(tǒng)一調(diào)度,提高數(shù)據(jù)返回的速率[8]?;貧w、聚類、決策樹、可視化、KNN算法、PCA、統(tǒng)計(jì)、隨機(jī)森林、時(shí)間序列、文本挖掘等仍是數(shù)據(jù)科學(xué)的流行算法?http://www. kdnuggets.com/ 2016/09/pollalgorithms-useddata-scientists. html。云計(jì)算方面的主流工具包括Amazon EC2、Microsoft Azure以及OpenStack;面向大數(shù)據(jù)的分析處理方面,MapReduce、Apache Spark、Hadoop、MongoDB等提供了各具特色的框架與解決方案。

        數(shù)據(jù)的發(fā)布共享與利用方面,技術(shù)研究包括利用新一代網(wǎng)絡(luò)技術(shù)來探索數(shù)據(jù)統(tǒng)一發(fā)布和數(shù)據(jù)共享框架建設(shè),同時(shí)在數(shù)據(jù)安全與數(shù)據(jù)的權(quán)限控制等方面提供切實(shí)可行的技術(shù)解決方案[9]。依托研究數(shù)據(jù)與科技文獻(xiàn)交叉引用[10],利用DOI關(guān)聯(lián)模型進(jìn)行數(shù)據(jù)深層價(jià)值挖掘與利用情況的追蹤,為數(shù)據(jù)價(jià)值體現(xiàn)提供計(jì)量基礎(chǔ)。此外,相關(guān)技術(shù)還包括大數(shù)據(jù)處理環(huán)境下關(guān)于海量數(shù)據(jù)長期保存與高效訪問等內(nèi)容。

        此外,基于本體[11]的邏輯構(gòu)建與語義檢索、關(guān)聯(lián)數(shù)據(jù)技術(shù)(如RDF語義鏈接功能實(shí)現(xiàn)[12]等智能化技術(shù)實(shí)踐)也取得了長足發(fā)展。面向大數(shù)據(jù)時(shí)代,用于解決大數(shù)據(jù)異構(gòu)化加工處理、不確定性分析、復(fù)雜系統(tǒng)建模、大數(shù)據(jù)價(jià)值挖掘等方面的技術(shù)探索也為數(shù)據(jù)密集型科研帶來了新的解決方案。

        為補(bǔ)償數(shù)據(jù)共享供給者的勞動(dòng)付出、維護(hù)數(shù)據(jù)共享鏈條的持續(xù)生長,適當(dāng)?shù)臄?shù)據(jù)發(fā)布時(shí)機(jī)與發(fā)布內(nèi)容規(guī)范、數(shù)據(jù)獲取授權(quán)機(jī)制的有效補(bǔ)充以及數(shù)據(jù)引用溯源等方面的激勵(lì)與監(jiān)督措施,成為推動(dòng)開放共享理念與實(shí)踐互聯(lián)的積極策略。

        (1)設(shè)置保護(hù)期限

        為了更好地鼓勵(lì)科研數(shù)據(jù)的共享,一些數(shù)據(jù)共享計(jì)劃涵蓋了延遲科研數(shù)據(jù)發(fā)布時(shí)限的要求。以期刊為例,提交《自然》?http://www. nature.com/ nature/authors/ policy/embargo. html的論文不得早于成果發(fā)表一周向媒體發(fā)布。中國科學(xué)院、國家自然科學(xué)基金委員會(huì)聲明[13],其資助項(xiàng)目產(chǎn)生的論文需提交指定機(jī)構(gòu)或知識(shí)庫,并在發(fā)表后12個(gè)月內(nèi)開放獲取。施普林格(Springer)將先前12個(gè)月數(shù)據(jù)滯后發(fā)布的使用范圍由針對(duì)有相應(yīng)管理要求的機(jī)構(gòu)資助出版擴(kuò)展為全部。Emerald將先前允許機(jī)構(gòu)存儲(chǔ)庫存取數(shù)據(jù)并及時(shí)發(fā)布的政策修改為根據(jù)機(jī)構(gòu)要求執(zhí)行24個(gè)月的發(fā)布時(shí)限,但作者自愿存儲(chǔ)行為則不存在發(fā)布時(shí)間限制,即“自愿分享,義務(wù)除外”模式[14]。

        (2)內(nèi)容分級(jí)控制

        為解決信息發(fā)布的控制性問題,開放存取運(yùn)動(dòng)提出了“金色道路(golden route)”和“綠色道路(green route)”?http://www. ercim.eu/ publication/ Ercim_News/ enw64/jeffery. html, 以促進(jìn)有限制的科研數(shù)據(jù)共享。

        涉密數(shù)據(jù)的開放則需要相關(guān)法律與行業(yè)準(zhǔn)則規(guī)范。例如,我國《氣象資料共享系統(tǒng)建設(shè)氣象數(shù)據(jù)分級(jí)與分類(草案)》規(guī)定,氣象數(shù)據(jù)對(duì)外服務(wù)分為絕密、機(jī)密、保密、內(nèi)部和公開5級(jí),以規(guī)范數(shù)據(jù)開放工作。

        科研數(shù)據(jù)的共享方式還受到科研數(shù)據(jù)組織形式與價(jià)值的影響。仍以氣象數(shù)據(jù)為例,《氣象資料共享管理辦法》規(guī)定,氣象科研數(shù)據(jù)的提供利用,按用戶對(duì)象和級(jí)別分為無償、有償兩類。數(shù)據(jù)的精細(xì)化加工

        3.4 開放數(shù)據(jù)的配套舉措意味著更多的成本投入。為此,面向客戶需求所進(jìn)行的數(shù)據(jù)深度分析與加工仍采取一定的有償機(jī)制來推動(dòng)數(shù)據(jù)交流。

        當(dāng)科研數(shù)據(jù)仍處于政策法規(guī)合理約束的未解禁期或者知識(shí)產(chǎn)權(quán)、保密與隱私權(quán)保護(hù)下的未公開狀態(tài),仍然可以建立資源授權(quán)的補(bǔ)充機(jī)制來滿足“灰色地帶”的數(shù)據(jù)開放需求。授權(quán)機(jī)制包括兩方面:一是對(duì)數(shù)據(jù)擁有者占有權(quán)力的認(rèn)可授權(quán);二是對(duì)數(shù)據(jù)使用者申請(qǐng)使用行為的認(rèn)可授權(quán)。例如免費(fèi)開源軟件授權(quán)(free and open source software license)[15]、知識(shí)共享(creative common)?http://creative commons.org/ licenses/和開放數(shù)據(jù)共用(open data common)?http:// opendata commons.org/等。英國的“皇家版權(quán)(Crown Copyright)”?http://www. nationalarchives. gov.uk/informationmanagement/ re-using-publicsectorinformation/ copyright/crowncopyright/、美國國家生物信息技術(shù)中心(NCBI)的dbGaP存儲(chǔ)庫?http://www. ncbi.nlm.nih. gov/projects/ gap/cgi-bin/ about.html等都進(jìn)行了相關(guān)探索實(shí)踐。

        (3)引用、關(guān)聯(lián)與溯源

        從數(shù)據(jù)引用的表現(xiàn)形式來分,科研數(shù)據(jù)的引用可分為傳統(tǒng)文獻(xiàn)引用、獨(dú)立數(shù)據(jù)引用和混合引用3種模式。和傳統(tǒng)科研學(xué)術(shù)認(rèn)可方式類似,科研數(shù)據(jù)的使用也需要通過標(biāo)識(shí)、引用的方式來跟蹤數(shù)據(jù)集的利用情況,并通過計(jì)量分析與大眾評(píng)議等渠道實(shí)現(xiàn)對(duì)發(fā)布數(shù)據(jù)的真實(shí)性、準(zhǔn)確性和著作權(quán)等方面的重復(fù)校驗(yàn)。數(shù)據(jù)引用探討包括微觀層面的技術(shù)標(biāo)準(zhǔn)規(guī)范、工具方法以及宏觀方面的數(shù)據(jù)引用政策、指南、數(shù)據(jù)引用聲明等。我國的冰川(雪冰)凍土學(xué)科中心、寒區(qū)旱區(qū)科學(xué)數(shù)據(jù)中心、中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心等也提出了數(shù)據(jù)引用規(guī)范指南。

        與此同時(shí),關(guān)聯(lián)數(shù)據(jù)通過網(wǎng)絡(luò)標(biāo)識(shí)符認(rèn)定事實(shí)、概念、人、地方、現(xiàn)象以及擁有共同特性的文件,從而使人發(fā)現(xiàn)數(shù)據(jù)的關(guān)聯(lián),并借此增加數(shù)據(jù)集的應(yīng)用價(jià)值?http://www.nsf. gov/eng/general/ dmp.jsp。建立在關(guān)聯(lián)數(shù)據(jù)基礎(chǔ)上的溯源模型,幫助數(shù)據(jù)使用者更好地校驗(yàn)數(shù)據(jù)質(zhì)量,推動(dòng)數(shù)據(jù)共享。

        4 開放科研數(shù)據(jù)的典型模式

        參考科研數(shù)據(jù)的來源與開放實(shí)踐所選取的路徑,大致可分為自上而下的開放模式、橫縱聯(lián)合的開放模式與自下而上的開放模式3種情況。

        4.1 典型的開放模式歸納

        在自上而下的開放模式中,科研數(shù)據(jù)開放的政策與經(jīng)費(fèi)發(fā)起者(多為政府)成為推動(dòng)科研數(shù)據(jù)開放的原動(dòng)力。這一類數(shù)據(jù)的開放共享以不斷積累的數(shù)據(jù)為基礎(chǔ),相應(yīng)提升數(shù)據(jù)開放體量,并通過數(shù)據(jù)生產(chǎn)與獲取能力的不斷提高擴(kuò)展數(shù)據(jù)共享服務(wù)的能力和水平。對(duì)這些數(shù)據(jù)而言,開放共享并非道德層面的高尚行為,而是所有權(quán)性質(zhì)的必然要求。例如,美國國家科學(xué)基金會(huì)(NSF)積極推進(jìn)新的數(shù)據(jù)政策,要求所有項(xiàng)目申請(qǐng)需同時(shí)提交一份“數(shù)據(jù)管理計(jì)劃”,對(duì)項(xiàng)目產(chǎn)生數(shù)據(jù)的存取歸檔與共享等方面做出明確規(guī)定。英國自然環(huán)境研究理事會(huì)(NERC)?http://www. nerc.ac.uk/ research/sites/ data/數(shù)據(jù)政策規(guī)定項(xiàng)目期間產(chǎn)生的有長期利用價(jià)值的數(shù)據(jù)需提交NERC數(shù)據(jù)中心,以保障其價(jià)值的持續(xù)性發(fā)揮等。

        橫縱聯(lián)合的共享模式多以存在隸屬或管轄權(quán)利的部門內(nèi)部以及跨部門之間的多元化合作為主,尤以數(shù)據(jù)共享的國際、區(qū)域與學(xué)科交叉方向的聯(lián)盟組織的科研數(shù)據(jù)開放較為常見,如地學(xué)領(lǐng)域的地球系統(tǒng)科學(xué)聯(lián)盟(ESSP)、國際地球觀測(cè)組織、災(zāi)害風(fēng)險(xiǎn)綜合研究計(jì)劃(IRDR),生物學(xué)領(lǐng)域的物種2000(Species 2000)、全球生物多樣性信息網(wǎng)絡(luò)(GBIF)以及著名的人類基因組計(jì)劃(HGP)、國際虛擬天文臺(tái)聯(lián)盟(IVOA)等展開的科研數(shù)據(jù)開放活動(dòng)。參與聯(lián)盟組織的會(huì)員按照統(tǒng)一的章程,共同維護(hù)數(shù)據(jù)資源的積累和服務(wù)能力的提升。這種看似松散的組織恰恰成為當(dāng)前國際范圍內(nèi)科研數(shù)據(jù)積累與推動(dòng)開放的中堅(jiān)力量,甚至在某些領(lǐng)域也形成壟斷局面。

        自下而上的開放模式多立足于一定的激勵(lì)措施基礎(chǔ)上,推動(dòng)數(shù)據(jù)的擁有者根據(jù)一定的規(guī)則主動(dòng)地參與數(shù)據(jù)開放。這一開放模式的組織形式更為松散、開放,同時(shí)也成為推動(dòng)科研數(shù)據(jù)開放共享不可忽視的重要組成部分。例如,在期刊方面,越來越多的出版機(jī)構(gòu)要求研究論文的發(fā)表包括數(shù)據(jù)方面的配套開放。其中,《科學(xué)》等雜志對(duì)來稿涉及的數(shù)據(jù)提出管理要求。許多機(jī)構(gòu)存儲(chǔ)庫也紛紛提出數(shù)據(jù)開放資源計(jì)劃與實(shí)踐,如PANGAEA(德國)、arXiv(美國)、RePEc(英國)、PubMed Central(美國)、Figshare(英國)等在數(shù)據(jù)資源的持續(xù)積累與開放共享方面提供了多樣化的支持[16]。

        4.2 開放中的焦點(diǎn)問題

        利益機(jī)制研究是解決共享難題的焦點(diǎn)。首先引入相關(guān)利益者的視角,無論哪種數(shù)據(jù)開放模式,政府部門、公共服務(wù)機(jī)構(gòu)、科研人員與社會(huì)公眾都是重要的參與者(見表1),他們?cè)诳蒲袛?shù)據(jù)開放活動(dòng)中肩負(fù)不同責(zé)任,利益焦點(diǎn)各有側(cè)重。

        其中,政府部門作為數(shù)據(jù)監(jiān)管者,在負(fù)責(zé)立法與實(shí)施的同時(shí),還需配套合理的激勵(lì)機(jī)制,以促進(jìn)數(shù)據(jù)的開放重用。而激勵(lì)措施的建立,既要滿足數(shù)據(jù)生產(chǎn)者的利益需要,又應(yīng)該維護(hù)數(shù)據(jù)使用者的合法權(quán)益,并通過公共服務(wù)機(jī)構(gòu)助推科研數(shù)據(jù)開放的深度和廣度。

        從利益相關(guān)者的視角分析中不難看的動(dòng)力多源自于數(shù)據(jù)擁有者本身的自愿行為。Boulton G等[17]描述的“以科研數(shù)據(jù)開放為核心的開放科學(xué)框架”(如圖1所示)中,也可以看到類似的情況。在知識(shí)的聯(lián)合生產(chǎn)過程中,行政管理數(shù)據(jù)開放需要政府部門強(qiáng)有力的制度框架約束。這類科研數(shù)據(jù)的開放采取自上而下的道路,開放的程度和范圍密切地與政府法規(guī)政策框架相適應(yīng)。而對(duì)于后兩類科研數(shù)據(jù)共享而言,數(shù)據(jù)開放更多地采取和自下而上相結(jié)合的手出,科研數(shù)據(jù)的共享不意味著“殺雞取卵”,數(shù)據(jù)共享工作的展開應(yīng)以認(rèn)可數(shù)據(jù)生產(chǎn)者與發(fā)布者的科研價(jià)值為第一要?jiǎng)?wù)。將相關(guān)利益者置于開放共享模式之中,可以繼續(xù)識(shí)別出3種主要開放模式的關(guān)鍵領(lǐng)導(dǎo)力。其中,自上而下的科研數(shù)據(jù)開放模式中,政府或組織的行政命令成為推進(jìn)數(shù)據(jù)共享的核心力量;橫縱聯(lián)合的共享模式則是組織章程與自愿分享兩股力量共同推進(jìn)的杰作;自下而上的共享模式中,數(shù)據(jù)開放

        段來推進(jìn)。由此可見,針對(duì)公共部門科研數(shù)據(jù)以及科學(xué)科研數(shù)據(jù)的開放共享,為了更好地適應(yīng)目前主流的3種科研數(shù)據(jù)共享模式運(yùn)行,還需要合理配套激勵(lì)機(jī)制,為此需要進(jìn)行更多探索。

        表1 科研數(shù)據(jù)開放中的相關(guān)利益者

        圖1 以科研數(shù)據(jù)開放為核心的開放科學(xué)框架

        5 開放科研數(shù)據(jù)的新探索

        在推動(dòng)科研數(shù)據(jù)開放的探索中,學(xué)術(shù)出版機(jī)構(gòu)進(jìn)行的以數(shù)據(jù)為核心的出版活動(dòng)提供了一種值得關(guān)注的解決方案。

        5.1 關(guān)于科研數(shù)據(jù)出版

        作為開放科學(xué)運(yùn)動(dòng)(open science movement)的核心部分,數(shù)據(jù)出版的主要目標(biāo)是提升數(shù)據(jù)在科研成果中的首要性地位,包括獨(dú)立數(shù)據(jù)出版(standalone data publication)、學(xué)術(shù)論文輔助數(shù)據(jù)出版(data publication by proxy)、附錄數(shù)據(jù)出版(appendix data)、期刊數(shù)據(jù)檔案出版(journal driven data archival)以及數(shù)據(jù)論文出版(overlay publication)等類別[18]。其中,尤以易于數(shù)據(jù)獲取與使用的獨(dú)立數(shù)據(jù)出版為近年來發(fā)展熱點(diǎn)。

        在研究數(shù)據(jù)出版中,科研人員與數(shù)據(jù)工作者按照規(guī)范的質(zhì)量管理和控制流程,以數(shù)據(jù)論文的方式,通過互聯(lián)網(wǎng)公開發(fā)布其通過觀察、實(shí)驗(yàn)、計(jì)算分析等科研過程所產(chǎn)生的原始數(shù)據(jù),或通過對(duì)已有的數(shù)據(jù)進(jìn)行系統(tǒng)化地收集、整理和再加工后形成數(shù)據(jù)產(chǎn)品,供其他使用者便捷地發(fā)現(xiàn)、獲取、理解和再分析利用,且可在科研論文及相關(guān)科研成果中引用。

        此外,研究數(shù)據(jù)出版的迅速發(fā)展,為多元化的科研數(shù)據(jù)存儲(chǔ)提供了可能,進(jìn)而為打破現(xiàn)有科研領(lǐng)域的數(shù)據(jù)資源壟斷提供了新的契機(jī),同時(shí)對(duì)我國研究數(shù)據(jù)的出版事業(yè)具有積極的戰(zhàn)略性意義。

        5.2 《中國科學(xué)數(shù)據(jù)》的出版實(shí)踐

        《中國科學(xué)數(shù)據(jù)》于2015年創(chuàng)刊,由中國科學(xué)院主管,中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心主辦,是國家網(wǎng)絡(luò)連續(xù)型出版物的首批試點(diǎn)刊物。作為目前中國唯一的專門面向多學(xué)科領(lǐng)域研究數(shù)據(jù)出版的學(xué)術(shù)期刊,該刊致力于研究數(shù)據(jù)的開放、共享和引用,推進(jìn)研究數(shù)據(jù)的長期保存與數(shù)據(jù)資產(chǎn)管理,探索研究數(shù)據(jù)工作的有效評(píng)價(jià)機(jī)制,推動(dòng)數(shù)據(jù)科學(xué)的發(fā)展。

        《中國科學(xué)數(shù)據(jù)》收錄的研究數(shù)據(jù)論文,結(jié)合傳統(tǒng)期刊論文內(nèi)容和結(jié)構(gòu)化描述模式,是對(duì)具有科學(xué)價(jià)值的某類或某個(gè)數(shù)據(jù)集進(jìn)行規(guī)范化描述所形成的科學(xué)研究論文,能夠使數(shù)據(jù)更具發(fā)現(xiàn)性、引用性、解釋性和重用性。該刊收錄的數(shù)據(jù)論文需提供所發(fā)表數(shù)據(jù)集的描述細(xì)節(jié),包括數(shù)據(jù)收集和加工處理方法、數(shù)據(jù)質(zhì)量評(píng)估和驗(yàn)證的方法、便于理解和使用數(shù)據(jù)的相關(guān)信息等,但不包含新的科學(xué)假設(shè)。完整的數(shù)據(jù)論文出版應(yīng)包括數(shù)據(jù)論文和對(duì)應(yīng)數(shù)據(jù)集兩部分,二者通過唯一標(biāo)識(shí)符實(shí)現(xiàn)一致性關(guān)聯(lián),經(jīng)同行專家評(píng)議保障數(shù)據(jù)的高質(zhì)量與可讀性?!吨袊茖W(xué)數(shù)據(jù)》現(xiàn)已正式出版兩期內(nèi)容(2016年6月和9月),所發(fā)表的數(shù)據(jù)論文內(nèi)容涵蓋地球科學(xué)、生物科學(xué)、化學(xué)科學(xué)、空間天文與信息科學(xué)等方面的數(shù)據(jù)內(nèi)容。

        為更好地了解數(shù)據(jù)出版進(jìn)展情況,該刊相關(guān)人員同時(shí)組織調(diào)查?http://www. csdata.org/ paperView?id=9,反饋顯示,數(shù)據(jù)出版作為推動(dòng)科研數(shù)據(jù)共享的有效途徑之一,獲得越來越多的支持,配套工具發(fā)展初具規(guī)模,但在學(xué)術(shù)地位和行業(yè)認(rèn)可度等方面有待提升,出版運(yùn)營模式尚不成熟,引用評(píng)價(jià)機(jī)制等方面亟待發(fā)展。

        6 結(jié)束語

        綜上,筆者針對(duì)科研數(shù)據(jù)開放實(shí)踐的現(xiàn)狀與實(shí)際內(nèi)容進(jìn)行了梳理,從“完全開放”的公益原則、政府為主所推進(jìn)的開放政策演進(jìn)、開放技術(shù)的支撐與配套數(shù)據(jù)開放的諸多舉措中,不難看到,典型的自上而下的開放模式、橫縱聯(lián)合的共享與自下而上的三大類共享模式中,數(shù)據(jù)開放的原動(dòng)力需要更多地調(diào)動(dòng)數(shù)據(jù)擁有者的積極參與意愿。為此,有必要在科研數(shù)據(jù)開放現(xiàn)有成果的基礎(chǔ)上,深入探討有關(guān)激勵(lì)措施方面的內(nèi)容。保護(hù)期限、分級(jí)控制、引用關(guān)聯(lián)與溯源為此提供了一些參考,研究數(shù)據(jù)出版也提供了另一種思路。希望上述分析,尤其是研究數(shù)據(jù)出版領(lǐng)域的相關(guān)推介,能夠?yàn)楦玫赝苿?dòng)科研數(shù)據(jù)開放共享提供一定的指導(dǎo)。

        [1] 嚴(yán)怡民. 情報(bào)學(xué)概論(修訂版)[M]. 武漢: 武漢大學(xué)出版社, 1994. YAN Y M. Introduction to information science (revised edition) [M]. Wuhan: Wuhan University Press, 1994.

        [2] 于良芝. 圖書館學(xué)導(dǎo)論[M]. 北京: 科學(xué)出版社, 2003. YU L Z. An introduction to library science[M]. Beijing: Science Press, 2003. [3] BRUNAK S, DANCHIN A, HATTORI M, et al. Nucleotide sequence database policies[J]. Science, 2002, 298 (5597): 1333. [4] ICSU, ISSC, TWAS, et al. Open data in a big data world[R]. [S.l.:s.n.], 2015.

        [5] 羅朝宇, 衣豐超, 袁興剛, 等. 基于一體化平臺(tái)數(shù)據(jù)中心的數(shù)據(jù)共享平臺(tái)在電力企業(yè)的應(yīng)用[C]//2013電力行業(yè)信息化年會(huì)論文集, 11月30日—12月1日, 2013, 北京, 中國. 北京: 人民郵電出版社, 2013: 5. LUO Z Y, YI F C, YUAN X G, et al. Application in electronic enterprise for data sharingplatform based on integrated data centers[C]//The Annual Conference on Electric Power Industry Informationization, November 30-December 1, 2013, Beijing, China. Beijing: Posts and Telecom Press, 2013: 5.

        [6] 國家科技基礎(chǔ)條件平臺(tái)中心. 國家科學(xué)數(shù)據(jù)資源發(fā)展報(bào)告[R]. [S.l.:s.n.], 2015. National Science & Technology Infrastructure Center. Annual report for national scientific data resources development[R]. [S.l.:s.n.], 2015.

        [7] 楊京, 王效岳, 白如江, 等. 大數(shù)據(jù)背景下數(shù)據(jù)科學(xué)分析工具現(xiàn)狀及發(fā)展趨勢(shì)[J]. 情報(bào)理論與實(shí)踐, 2015, 3(38): 134-137, 144. YANG J, WANG X Y, BAI R J, et al. Big data analysis tools in data science: current current status quo and development[J]. Information Studies:Theory & Application, 2015, 3(38): 134-137, 144.

        [8] 孫周軍, 何惠儀, 徐美紅, 等. 基于SOA架構(gòu)建立氣象科學(xué)數(shù)據(jù)共享系統(tǒng)方法研究[J]. 電腦知識(shí)與技術(shù), 2010(8): 1888-1891. SUN Z J, HE H Y, XU M H, et al. The research of the method of constructing meteorological scientific data sharing system based on SOA[J].Computer Knowledge and Technology, 2010(8): 1888-1891.

        [9] 陸冬云, 張和珍, 何險(xiǎn)峰, 等. 科學(xué)數(shù)據(jù)庫建設(shè)框架—— 統(tǒng)一發(fā)布及數(shù)據(jù)共享方案[J]. 計(jì)算機(jī)與應(yīng)用化學(xué), 2004(1): 103-106. LU D Y, ZHANG H Z, HE X F, et al. Framework for scientific dataconstruction-uniform solution for distribution and data sharing [J]. Computers and Applied Chemistry, 2004(1): 103-106.

        [10] 郭學(xué)武. 基于引文的科學(xué)數(shù)據(jù)與科技文獻(xiàn)關(guān)聯(lián)研究[J]. 情報(bào)科學(xué), 2014, 32(4): 59-62,125. GUO X W. Link study of scientific data and scientific literature based on citation analysis[J]. Information Science, 2014, 32(4): 59-62,125.

        [11] 張乃靜, 鞠洪波, 紀(jì)平. 本體構(gòu)建理論在林業(yè)科學(xué)數(shù)據(jù)共享中的應(yīng)用研究[J]. 西北林學(xué)院學(xué)報(bào), 2013(6): 151-156. ZHANG N J, JU H B, JI P. Application of ontology construction theory in forestry data sharing[J].Journal of Northwest Forestry University, 2013(6): 151-156.

        [12] 司莉, 李鑫. 基于關(guān)聯(lián)數(shù)據(jù)的科學(xué)數(shù)據(jù)集成與共享研究—— 以Bio2RDF項(xiàng)目為例[J]. 圖書館學(xué)研究, 2014(21): 51-55. SI L, LI X. Linked data oriented scientific data integration and data sharing-case study of Bio2RDF project [J]. Researches in Library Science, 2014(21): 51-55.

        [13] 中國科學(xué)院、國家自然科學(xué)基金委員會(huì). 中國科學(xué)院、國家自然科學(xué)基金委員會(huì)發(fā)布關(guān)于實(shí)施開放獲取政策的聲明[J]. 圖書情報(bào)工作, 2014, 58(11): 96. CAS, NSFC. Announcement for open access policy by CAS &NSFC[J]. Library and Information Service, 2014, 58(11): 96. [14] SUTTON S. Open access, publisher embargoes, and the voluntary nature of scholarship [J].C&RL News, 2013(10): 468-472.

        [15] MORANDO F. Legal interoperability: making open (government) data business and communities [J]. JLIS.it, 2013, 4(1): 441-452.

        [16] 黃永文, 張建勇, 謝靖, 等. 開放資源的再利用模式研究[J]. 圖書情報(bào)工作, 2013, 57(21): 32-37. HUANG Y W, ZHANG J Y, XIE J, et al. Research on recycling models of open resources[J]. Library and Information Service, 2013, 57(21): 32-37.

        [17] BOULTON G. Open data in a big data world-the science international accord[R]. [S.l.:s.n.], 2016.

        [18] LAWRENCE B, JONES C, MATTHEWS B, et al. Citation and peer review of data: movingtowards formal data publication[J]. The International Journal of Digital Curation, 2011, 2(6): 4-37.

        Research data openness: development, models and new exploration

        ZHANG Lili, LI Jianhui
        Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China

        The concept and clarification of research data were analyzed. Judging from the aspects of principals, policies, technologies and procedures,the current state of research data openness was described. The practices have been summarized into three main kinds with top-down model, down-top model as well as horizontal-vertical model for research data openness. Further analysis shows that, besides the government forces, we still need more incentives to increase the willingness to open research data while the research data publication provides another effective solution. Take "China Scientific Data" for example, as a scholar journal publishing scientific data papers, it may help to promote research data open in a way.

        research data, data openness, data sharing, data publishing

        G203

        A

        10.11959/j.issn.2096-0271.2016063

        張麗麗(1984-),女,中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)中心助理研究員,《中國科學(xué)數(shù)據(jù)》期刊編輯部副主任,主要研究方向?yàn)檠芯繑?shù)據(jù)治理、信息經(jīng)濟(jì)學(xué)。

        黎建輝(1973-),男,博士,中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心研究員、博士生導(dǎo)師,大數(shù)據(jù)技術(shù)與應(yīng)用發(fā)展部主任,CODATA中國委員會(huì)秘書長,主要研究方向?yàn)榇髷?shù)據(jù)管理、大數(shù)據(jù)分析與處理。

        2016-09-23

        國家自然科學(xué)基金資助項(xiàng)目(No.91546125)

        Foundation Item:The National Natural Science Foundation of China(No.91546125)

        猜你喜歡
        科學(xué)
        點(diǎn)擊科學(xué)
        走進(jìn)科學(xué)
        走進(jìn)科學(xué)
        點(diǎn)擊科學(xué)
        點(diǎn)擊科學(xué)
        點(diǎn)擊科學(xué)
        走進(jìn)科學(xué)
        科學(xué)大爆炸
        科學(xué)
        科學(xué)怪咖
        精品国产三区在线观看| 97se在线| 男人阁久久| 国产视频一区二区三区久久亚洲| 在线观看av网站永久| 婷婷中文字幕综合在线| 在线人妻无码一区二区| 久久久精品国产亚洲av网不卡| 日本区一区二区三视频| 熟女无套内射线观56| 欧美在线不卡视频| 91亚洲国产成人久久精品网站| 极品一区二区在线视频观看| 欧美俄罗斯40老熟妇| 美女av一区二区三区| 亚洲美腿丝袜综合一区| 国产高清精品在线二区| 亚洲天堂av在线网站| 少妇高潮流白浆在线观看| 中文文精品字幕一区二区| 国产中文字幕亚洲综合| 极品人妻少妇av免费久久| 精品深夜av无码一区二区| 午夜无码一区二区三区在线| 国产精品一区二区蜜臀av| 欧美亚洲一区二区三区| 精品香蕉久久久爽爽| 特级毛片a级毛片在线播放www| 国产亚洲精品精品综合伦理| 色婷婷亚洲精品综合影院| 欧美在线播放一区二区| 亚洲国产综合久久精品 | 亚洲xxxx做受欧美| 国产精品不卡无码AV在线播放 | 一区二区三区人妻av | 国产一品道av在线一二三区| 亚洲在线视频一区二区 | www.狠狠艹| 人妻少妇粉嫩av专区一| 国产a级毛片久久久精品毛片| 欧美日韩精品一区二区三区不卡|