顏嘉麒 閔超 余厚強 魏家鵬 賈韜 馬建
摘? ?要:大科學裝置和大規(guī)模科學基礎(chǔ)設(shè)施產(chǎn)生的科學數(shù)據(jù)促進了領(lǐng)域科學研究的新一輪發(fā)展,更加驅(qū)動了科學研究者之間的創(chuàng)新科研協(xié)作??茖W數(shù)據(jù)驅(qū)動的科研協(xié)作,成為科學研究的新范式和大趨勢。第六屆中國科學數(shù)據(jù)大會以“科學數(shù)據(jù)與重大科研基礎(chǔ)設(shè)置”為主題,關(guān)注科學數(shù)據(jù)管理與開放共享過程中的政策、方法、技術(shù)及基礎(chǔ)設(shè)施建設(shè)等問題。文章以大會分論壇“科學數(shù)據(jù)驅(qū)動的科研協(xié)作”內(nèi)容的梳理和總結(jié)為基礎(chǔ),從科學數(shù)據(jù)驅(qū)動的科研協(xié)作之機理、特征、案例、研究路徑等視角進行述評,揭示了科學數(shù)據(jù)驅(qū)動的科研協(xié)作的新范式,提出了未來研究方向與機會。
關(guān)鍵詞:科研協(xié)作;科學數(shù)據(jù);科學裝置;科學基礎(chǔ)設(shè)施
中圖分類號:G250.2;G311? ?文獻標識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2020052
Abstract The scientific research data generated by large scale scientific apparatus and research infrastructures has accelerated the new development in scientific domain research, driving innovative research collaborations among scientific researchers. The collaboration driven by scientific data has become a new paradigm and trend for scientific research. Under such circumstances, the 6th China Data Science Conference (CDSC) was held with the theme of "Scientific Data and Large Scale Scientific Infrastructure", focusing on the problems occurring in the process of scientific data management and sharing, including policies, methods, technologies, and infrastructures construction, etc. As a summary of the Workshop of Scientific Data driven Research Collaboration (SDRC) in the CDSC, the paper made investigation and study of the mechanism, features, cases, and research paths of SDRC. New paradigm of research collaboration driven by scientific data was identified, and proposals were put forward for future research directions and opportunities, which provides a foundation for the theoretical and practical development of scientific research collaboration.
Key words research collaboration; scientific data; scientific apparatus; research infrastructures
1? ?引言
科學數(shù)據(jù)是國家科技創(chuàng)新發(fā)展和經(jīng)濟社會進步的重要基礎(chǔ)性戰(zhàn)略資源,是科研創(chuàng)新最基本、最活躍、影響面最寬的科技資源。隨著大天區(qū)面積多目標光纖光譜天文望遠鏡(LAMOST)、大亞灣核反應(yīng)堆中微子實驗、500米口徑球面射電望遠鏡(FAST)等近年來相繼投入運行使用,這些科研基礎(chǔ)設(shè)施將產(chǎn)生大量可靠的科學數(shù)據(jù)資源。以這些大科學裝置產(chǎn)生的數(shù)據(jù)為代表,科學數(shù)據(jù)引發(fā)領(lǐng)域科學研究的范式變革,驅(qū)動了科學研究者之間的科研協(xié)作創(chuàng)新??茖W數(shù)據(jù)驅(qū)動的科研協(xié)作方式,成為科學研究的新范式和大趨勢。在此背景下, 2019年8月21-23日在中國貴陽主辦的第六屆中國科學數(shù)據(jù)大會以“科學數(shù)據(jù)與重大科研基礎(chǔ)設(shè)施”為主題,設(shè)有5個大會報告、21個并行分會、216個分會報告,關(guān)注科學數(shù)據(jù)管理與開放共享過程中的政策、方法、技術(shù)及基礎(chǔ)設(shè)施建設(shè)等問題。
中國科學數(shù)據(jù)大會是在2013年由國際科技數(shù)據(jù)委員會(Committee on Data for Science and Technology,CODATA)中國全國委員會發(fā)起并開始籌備, 旨在推動我國科學數(shù)據(jù)的開放、技術(shù)交流及數(shù)據(jù)科學的發(fā)展。中國科學數(shù)據(jù)大會在我國加快科研大數(shù)據(jù)開放共享、大數(shù)據(jù)時代科研信息化基礎(chǔ)環(huán)境建設(shè)、全球影響力科技創(chuàng)新中心建設(shè)、科學數(shù)據(jù)與數(shù)據(jù)科學學科建設(shè)、科學數(shù)據(jù)服務(wù)創(chuàng)新發(fā)展等方面起到積極的推動作用??茖W大數(shù)據(jù)是中國科學數(shù)據(jù)大會長期以來關(guān)注的重要問題,首屆科學數(shù)據(jù)大會就以“科研大數(shù)據(jù)與數(shù)據(jù)科學”為主題;在第四屆科學數(shù)據(jù)大會上,中科院副院長張亞平還指出,在科學研究領(lǐng)域,繼觀測實驗、理論分析、計算模擬之后,一種“大數(shù)據(jù)驅(qū)動的科學發(fā)現(xiàn)”新模式已經(jīng)開始顯現(xiàn),科學大數(shù)據(jù)已經(jīng)成為科技創(chuàng)新的新引擎。
本次中國科學數(shù)據(jù)大會上,南京大學信息管理學院顏嘉麒副教授、閔超助理教授、南京理工大學經(jīng)濟管理學院余厚強副教授、西南大學計算機與信息科學學院賈韜教授與香港城市大學資訊系統(tǒng)系的馬建教授共同發(fā)起并籌辦了“科學數(shù)據(jù)驅(qū)動的科研協(xié)作”主題分會。來自上海交通大學、中科院成都文獻情報中心、大連理工大學等機構(gòu)的演講嘉賓和科研人員共50余人參加了分會的現(xiàn)場討論與交流。本文通過對會議內(nèi)容與嘉賓研討的梳理和總結(jié),從科學數(shù)據(jù)驅(qū)動的科研協(xié)作之機理、特點、案例、研究路徑等視角進行述評,提出未來研究方向與機會,以期為相關(guān)實踐與理論發(fā)展提供參考。
2? ?科學大數(shù)據(jù)背景下科研協(xié)作范式的轉(zhuǎn)變
科學數(shù)據(jù)產(chǎn)生,通常是由科學研究者以特定的科學裝置(或者特定的實驗環(huán)境)通過某種實驗程序收集而來。從信息系統(tǒng)(Human, System, Information)的研究角度[1]來看,科學數(shù)據(jù)驅(qū)動的科研協(xié)作主要是由科學研究者、科研裝置(環(huán)境)、科學數(shù)據(jù)三個因素組成的科研協(xié)作新范式(見圖1)??茖W研究者是科學實踐的主體,確定研究對象并設(shè)計科學活動??茖W裝置(環(huán)境)是科學活動中科學研究者采用的實踐工具,也代表科學活動的程序和規(guī)范??茖W數(shù)據(jù)是表征研究對象客體各種特征的產(chǎn)物,是通過科學活動由某種科學裝置(環(huán)境)而產(chǎn)生的。
傳統(tǒng)的科研協(xié)作是科學研究者主導的[2]??茖W研究者使用科學裝置,科學裝置產(chǎn)生科學數(shù)據(jù),科學研究者處理科學數(shù)據(jù)??茖W研究者的基本特征是能動性和創(chuàng)造性。科學研究者以個體面貌出現(xiàn),也以群體面貌出現(xiàn)??茖W研究者之間的科研協(xié)作隨著研究者之間越來越明確的分工而顯得越來越明顯??茖W裝置(環(huán)境)的基本特征是規(guī)范性和工具性,而科學數(shù)據(jù)的基本特征是客觀性和對象性。隨著科研協(xié)作的發(fā)展,多套科學裝置協(xié)作同時研究一個科學問題、多份科學數(shù)據(jù)互相驗證科學研究的情形也變得越來越常見。
科學大數(shù)據(jù)是指與科學研究相關(guān)的大數(shù)據(jù)[3]。在科學大數(shù)據(jù)時代,科學研究者、科學裝置和科學數(shù)據(jù)三者之間的相互作用和影響進一步促進了科學協(xié)作新模式的出現(xiàn)。重大科研基礎(chǔ)設(shè)施的建設(shè)與更新,引發(fā)數(shù)據(jù)快速累積;高通量儀器設(shè)備以及新數(shù)據(jù)處理技術(shù)和方法帶來了科學數(shù)據(jù)的快速增長,打破了過去由科學研究者主導科研協(xié)作的平衡。五百米口徑球面射電望遠鏡(FAST)多科學目標巡天每天將產(chǎn)生約500TB的零級未壓縮數(shù)據(jù),需要100G高速網(wǎng)絡(luò)將數(shù)據(jù)傳輸至數(shù)據(jù)中心進行處理①。FAST科學工程的建立和產(chǎn)生的大量難以處理的科學數(shù)據(jù),驅(qū)使天文學家主動尋求與全球范圍內(nèi)計算機科學家、人工智能專家、軟硬件工程師的跨領(lǐng)域科研協(xié)作。同樣的,在生命科學領(lǐng)域,高通量測序技術(shù)能一次對幾十萬到幾百萬條DNA分子進行序列測定。我國具有龐大的基因數(shù)據(jù)產(chǎn)出能力,隨著國家在人口健康領(lǐng)域的戰(zhàn)略部署,將產(chǎn)生百PB級的基因數(shù)據(jù)①,占世界總數(shù)的一半以上。這種大規(guī)模的基因數(shù)據(jù),使得生命科學在生命科學家與數(shù)據(jù)庫、數(shù)據(jù)科學、信息管理等領(lǐng)域?qū)<业幕优c協(xié)作中迸發(fā)出新的科學發(fā)現(xiàn)模式。
有別于實驗科學、理論科學、計算科學,上述這種科學發(fā)現(xiàn)模式強調(diào)數(shù)據(jù)作為科學發(fā)現(xiàn)的基礎(chǔ),并以數(shù)據(jù)為中心和驅(qū)動、基于對海量數(shù)據(jù)的處理和分析去發(fā)現(xiàn)新知識為基本特征??茖W研究者參與到科學數(shù)據(jù)的采集、存儲、管理、分析、可視化和知識發(fā)現(xiàn)的各個不同階段,形成科學協(xié)作、科學發(fā)現(xiàn)的新方法和新途徑。
3? ?科學數(shù)據(jù)驅(qū)動科研協(xié)作的特征
科學數(shù)據(jù)驅(qū)動的科研協(xié)作模式順應(yīng)的是科學研究范式的改變。20世紀,科學史學家普賴斯[4]就曾經(jīng)指出科學研究的模式將由大學實驗室所從事的小科學(Little Science)轉(zhuǎn)變?yōu)槎鄬W科整合應(yīng)用性的大科學(Big Science)。普賴斯指出,小科學強調(diào)昔日個人化的研究成果,而由于科學文獻數(shù)量大增、資訊超載,致使科學研究者無法及時充分掌握及利用科學資訊,且造成研究之重復(fù),因而現(xiàn)在的研究趨向集體研究而產(chǎn)生大科學[5]。大科學研究模式的改變,使得科學協(xié)作也已經(jīng)從研究者之間的“合作”,逐漸轉(zhuǎn)變?yōu)橛纱罅靠茖W數(shù)據(jù)產(chǎn)生驅(qū)動下,科學家、工程師、從業(yè)者之間以及他們與科研儀器之間的“協(xié)同工作”。具體說來,與傳統(tǒng)科研協(xié)作相比,科學數(shù)據(jù)驅(qū)動的科研協(xié)作至少在以下六方面表現(xiàn)出顯著的特征。
3.1? ? 科學合作規(guī)模持續(xù)增大
在過去的數(shù)十年間,科學研究的主體整體上經(jīng)歷了從單打獨斗到團隊合作的發(fā)展變遷,尤其是近年來呈現(xiàn)出從小團隊科研到大團隊科研的明顯趨勢。科學研究者之間的頻繁合作行為表現(xiàn)在不斷增長的科研團隊規(guī)模,而團隊規(guī)模的增長在科學論文合著行為中體現(xiàn)得十分明顯。胡志剛②基于科睿唯安公司的InCites工具分析發(fā)現(xiàn),如今論文合著中科研團隊的規(guī)模已經(jīng)增長到四十年前的三倍多。在1980-1984年間,一篇科學論文的作者數(shù)量平均是3.29人,而這一數(shù)字到2015-2019年間已增長到6.91人。與此同時,科學合作在多個層面得到加強,國家間的合作占比從原來的4.1%增加到22.25%,專業(yè)學術(shù)機構(gòu)與產(chǎn)業(yè)界的合作比例亦增加到原來水平的兩倍有余。
3.2? ? ?科學合作模式呈現(xiàn)異質(zhì)性
在合作規(guī)模持續(xù)增長的宏大背景下,科學合作模式在不同主體之間涌現(xiàn)出異質(zhì)性。(1)在合作模式研究方面,陳云偉③利用論文作者合作網(wǎng)絡(luò)社團劃分的方法,在量子信息、腦科學、碳纖維、稀土、大氣灰霾等領(lǐng)域展開大量實證研究。他發(fā)現(xiàn)不同的科研單元呈現(xiàn)迥異的科研工作模式,如在量子信息領(lǐng)域的四個頂級科研單元中,我國科研單元呈現(xiàn)出顯著的集團軍式的合作模式,具備明顯的聯(lián)合攻關(guān)特征,而國外科研單元中的科學研究者則在論文發(fā)表方面表現(xiàn)出較為疏松的合作網(wǎng)絡(luò);(2)在國際合作方面,沙特阿拉伯是國際化程度最高的國家,約四分之三的論文來自國際合作。中國大陸、土耳其和印度的國際論文比例則處于相對靠后的位置;(3)在產(chǎn)學研合作方面,瑞士以高達7.26%的產(chǎn)學研合作論文比例高居全球首位,中國的產(chǎn)學研合作則低于世界平均水平。不同學科內(nèi)部的合作模式也具有差異性,如天文學與天體物理學由于研究工作的獨特性質(zhì),近一半的論文來自國際合作;再如石油工程領(lǐng)域的產(chǎn)學研合作比例遠高于其他領(lǐng)域④。
3.3? ? ?從合作發(fā)文到基于儀器設(shè)備、基礎(chǔ)設(shè)施的科研協(xié)作
合作發(fā)文的背后是科研相關(guān)人員之間愈發(fā)頻繁的協(xié)同工作,典型代表是以大型科研裝置、設(shè)備、儀器等科學基礎(chǔ)設(shè)施為中心,吸引越來越多的科學工作者投身其中。然而,正如本次會議上魏家鵬①和顏嘉麒②總結(jié)的,目前科研儀器設(shè)備在科研協(xié)作中發(fā)揮作用還受到一些障礙的影響,如用戶范圍有限[6]、使用門檻偏高[7]、共享平臺缺乏[8]等。他們基于區(qū)塊鏈技術(shù)思想,分別從制度與技術(shù)方面提出一種科研設(shè)備共享平臺的設(shè)計方案。在科研設(shè)備的共享過程中,通過引入積分、賬戶等制度,將設(shè)備擁有者、申請者、使用者的權(quán)益與積分進行錨定,建立一整套安全、高效、可流轉(zhuǎn)的設(shè)備共享生態(tài)系統(tǒng);在技術(shù)方面,借助區(qū)塊鏈去中心化、可信以及不可篡改的技術(shù)特征,完整嵌入科學設(shè)備的積分記錄系統(tǒng),從而真實記錄每一次協(xié)作的發(fā)生。他們指出,該方案的本質(zhì)即是在保證科研設(shè)備所有權(quán)不發(fā)生轉(zhuǎn)移的前提下,通過Token積分對科研設(shè)備的使用權(quán)進行流轉(zhuǎn)與共享,從而增益科學價值,促進科研協(xié)作。
3.4? ? 科學數(shù)據(jù)的保存和利用需要更加規(guī)范化
科學數(shù)據(jù)集一方面產(chǎn)生于科研發(fā)現(xiàn)與協(xié)作過程,如今越來越呈現(xiàn)出數(shù)量大、種類多、來源廣等特征;另一方面,科研工作者對科學數(shù)據(jù)的使用需求日益多樣化,對這些數(shù)據(jù)的挖掘與利用也進一步推動著科學發(fā)現(xiàn)與協(xié)作的升級。與會者分別從天文學與地球科學兩個學科角度闡述了這一問題。左雨萌③指出天文歷史數(shù)據(jù)的長期保存是天文數(shù)據(jù)管理中的重要問題,原因在于數(shù)據(jù)的未來復(fù)用往往受到數(shù)據(jù)保存中一系列格式轉(zhuǎn)化的影響,這就需要數(shù)據(jù)生產(chǎn)者、保存者與使用者的多方協(xié)同。哈佛大學圖書館與史密森天文臺的合作項目Phaedra,為天文手稿、文獻、文物等多種實體包含的珍貴數(shù)據(jù)提供了成功復(fù)用的案例。余厚強等④從地球系統(tǒng)科學出發(fā),通過對數(shù)據(jù)共享平臺的統(tǒng)計和內(nèi)容分析,發(fā)現(xiàn)科學數(shù)據(jù)集的使用方式除了學術(shù)需求外,還存在教育需求、社會需求等多樣方式。不過他們也指出,傳統(tǒng)的數(shù)據(jù)引證方式只能反映不足8%的數(shù)據(jù)集使用需求,因此有必要建立更加規(guī)范化、標準化的科學數(shù)據(jù)引證、評價與共享體系。
3.5? ? 科學數(shù)據(jù)共享在科研協(xié)作中具有重要位置
如今科學研究越來越依賴于數(shù)據(jù),對科學數(shù)據(jù)進行共享也成為科研協(xié)作的重要基石與驅(qū)動因素[9]。為此,我國采用建立機構(gòu)知識庫、國家級科研數(shù)據(jù)中心等方式,促進科研數(shù)據(jù)的跨機構(gòu)、跨行業(yè)共享與交流??蒲袛?shù)據(jù)需要共享,其原因在于,一方面科研數(shù)據(jù)包含的信息類和數(shù)據(jù)項豐富[10], 包括科研人員數(shù)據(jù)、科研資料數(shù)據(jù)、科研技術(shù)數(shù)據(jù)以及科研環(huán)境數(shù)據(jù)等,貫穿于科研的整個生命周期,價值巨大;另一方面,科研數(shù)據(jù)的共享有利于減少數(shù)據(jù)的重復(fù)生產(chǎn)、降低數(shù)據(jù)的使用成本、增進科研成果的同行評議[11],進一步有助于提高我國科學研究成果的產(chǎn)出。然而,顏嘉麒等①②指出,現(xiàn)有的科研數(shù)據(jù)共享平臺尚未很好地實現(xiàn)共享交流的效果,主要體現(xiàn)在“不能共享”“不愿共享”和“不敢共享”。其主要原因在于,已有平臺的接入機制少、成本高、障礙多;數(shù)據(jù)共享者面臨的風險責任與權(quán)利收益之間存在矛盾[12];傳統(tǒng)有限防護機制未能很好保障數(shù)據(jù)安全。顏嘉麒等同時認為,區(qū)塊鏈中的分布式共享賬本技術(shù)有潛力為構(gòu)建開放、安全、可信的科研數(shù)據(jù)共享網(wǎng)絡(luò)提供技術(shù)與制度方面的參考。
3.6? ? 科學協(xié)作促使科學家在全球范圍內(nèi)流動
大規(guī)??茖W設(shè)施的投入、科學資源的配置和科學數(shù)據(jù)的產(chǎn)生同樣驅(qū)動和引導了科學家的流動,并激發(fā)出更多的科學協(xié)作機會,這尤其體現(xiàn)在科研人員的國際流動上??蒲腥藛T的流動,一方面在流入國與流出國之間建立起聯(lián)系,背后是科學知識的流動與科學影響的輸出,另一方面也有可能造成不同地區(qū)科學人才結(jié)構(gòu)的失衡。這更體現(xiàn)了科學裝置投入和科學數(shù)據(jù)產(chǎn)生對吸引人才的重要作用。李江等⑤基于對全球范圍科學家簡歷數(shù)據(jù)的分析,認為科學人員的流動已經(jīng)從某些地區(qū)的人才流失、人才回流發(fā)展到全球范圍內(nèi)的人才環(huán)流。他們構(gòu)建出科學家流動的三維地圖,按照年份、學科、地區(qū)、機構(gòu)等條件展示科學家流動的特征與趨勢??茖W家去新的機構(gòu)、城市與國家任職,這一信息反映在其簡歷信息上,尤其是以O(shè)RCID為代表的大型數(shù)據(jù)集,系統(tǒng)記錄了科學家流動的全球數(shù)據(jù)。當然,科學家流動除了受到科研條件與科研資源的影響,還受制于諸多復(fù)雜的因素,如經(jīng)濟發(fā)展、自然環(huán)境、社會環(huán)境、子女教育等。
4? ?案例分析:LAMOST科學數(shù)據(jù)驅(qū)動的科研協(xié)作
大科學裝置是一種在物理上不可分割的科研資源,產(chǎn)生的大規(guī)??茖W數(shù)據(jù)促使來自不同團體的科學家組成研究團隊協(xié)同工作,有效降低了科學合作中的協(xié)調(diào)成本[13-14]。以2008年建成的LAMOST天文望遠鏡為例,它是中科院國家天文臺的國家重大科技基礎(chǔ)設(shè)施,以大視場、大光譜觀測等特點居于國際領(lǐng)先地位。2019年3月,巡天7年的LAMOST望遠鏡發(fā)布DR6數(shù)據(jù)集,其中包括4902個觀測天區(qū)與1125萬條光譜,成為世界首個突破千萬量級的光譜巡天項目[15]。
LAMOST的建造與使用是大科學裝置促進科研協(xié)作在全球范圍內(nèi)開展的鮮明案例。Web of Science數(shù)據(jù)庫與美國國家太空總署(NASA)的天體物理數(shù)據(jù)系統(tǒng)ADS顯示,截至2018年,除了中國以外,美國、英國、澳大利亞、德國、法國、加拿大、西班牙、日本、意大利、丹麥等國家均在不同程度上利用LAMOST產(chǎn)出科研論文。這些科研成果隨著LAMOST觀測數(shù)據(jù)集度過保護期后向國際學術(shù)界開放共享的步伐,在成果數(shù)量上呈現(xiàn)出指數(shù)型快速增長的態(tài)勢。相關(guān)的科研協(xié)作主要體現(xiàn)在LAMOST巡天項目與有關(guān)科研計劃的數(shù)據(jù)發(fā)布、天文觀測與研究、多種望遠鏡觀測結(jié)果的比較等工作上。主要的研究問題則包括光譜技術(shù)、恒星豐度與基本參數(shù)、銀河系動力學、數(shù)據(jù)分析方法等眾多方面。
基于LAMOST的科研協(xié)作同樣展現(xiàn)出多樣性的合作來源與異質(zhì)性的合作模式。在國際合作層面,有國外科研機構(gòu)參與的論文數(shù)量已經(jīng)超過單純由中國科研機構(gòu)完成的論文數(shù)量,并且前者比后者多出25%的可觀比例。其中,在有國外機構(gòu)參與的論文中,又有近四分之一是單純由國外機構(gòu)自身或者相互合作完成。毫無疑問,中國是國際合作網(wǎng)絡(luò)的核心,與美國、德國、英國等發(fā)達國家之間的合作更加頻繁;而歐洲國家如法國、英國、德國、比利時等之間的合作也保持在較高的水平上。在機構(gòu)合作層面,盡管中科院系統(tǒng)的科研院所具有臨近優(yōu)勢,但是一系列國外科研機構(gòu)同樣在使用LAMOST與其開放的數(shù)據(jù)從事科學研究,其中不乏美國勞倫斯理工學院、加州理工學院,意大利國家天體物理研究所,澳大利亞悉尼大學,以及英國劍橋大學等世界著名科研機構(gòu)。同樣地,中科院國家天文臺與南京天文光學技術(shù)研究所作為機構(gòu)合作網(wǎng)絡(luò)中的兩個中心節(jié)點,與國內(nèi)外科研機構(gòu)在協(xié)同利用LAMOST上起到重要的樞紐與協(xié)調(diào)作用。在科學家個人層面,如果將個人合作關(guān)系繪制成網(wǎng)絡(luò)圖,可以看到某些顯著的合作模式從圖中涌現(xiàn)出來(見圖2)。整張合作網(wǎng)絡(luò)在微觀上呈現(xiàn)密集的合作狀態(tài),科學家個人之間的合作逐步在本地形成了內(nèi)部凝聚的合作群體,這些合作群體的規(guī)模有大有小,散布于整張網(wǎng)絡(luò)的各個位置。在網(wǎng)絡(luò)中非常顯著的位置,出現(xiàn)了一個規(guī)模很大的連通分支,它主要是有中國科學家群體組成的密集合作網(wǎng)絡(luò),經(jīng)由各種網(wǎng)絡(luò)路徑與其他網(wǎng)絡(luò)節(jié)點(科學家)產(chǎn)生千絲萬縷的合作聯(lián)系。網(wǎng)絡(luò)中還有其他一些內(nèi)部聯(lián)系緊密的子網(wǎng)絡(luò),它們內(nèi)部發(fā)生頻繁的合作,同時通過某些橋節(jié)點而與其他子網(wǎng)絡(luò)內(nèi)的科學家產(chǎn)生聯(lián)系。如比利時皇家天文臺的Peter De Cat連接了多個中外研究群體。LAMOST無疑為全球天文學家解決天文學問題提供了良好的觀測工具與協(xié)作平臺。
5? ?未來的研究方向與機會
隨著科學大數(shù)據(jù)的公開與普及,科研人員如何合理地分配與利用科學裝置及其產(chǎn)生的大量科研數(shù)據(jù),以及科研人員在更廣泛的層面上應(yīng)該如何更好地開展科研合作,已經(jīng)成為科學界日益關(guān)注的問題。對此議題的深入探討將推進科學數(shù)據(jù)共享與科研合作朝向高效、高產(chǎn)與高影響的方向發(fā)展?!翱茖W數(shù)據(jù)驅(qū)動的科研協(xié)作”科研論壇,經(jīng)過研討,與會專家認為科學數(shù)據(jù)驅(qū)動的科研協(xié)作在以下三個主要方向上展現(xiàn)出豐富的研究機遇。
5.1? ? 科研協(xié)作的分析與描述
通過應(yīng)用數(shù)理統(tǒng)計和計算技術(shù)等數(shù)學方法對科研協(xié)作活動的過程、形式、規(guī)模、影響進行定量分析,從中找出科學數(shù)據(jù)驅(qū)動的科研協(xié)作的活動規(guī)律性。科研協(xié)作的計量與描述研究方法主要源于情報科學和科學學,亦包括網(wǎng)絡(luò)計量學和替代計量學的方法。
(1)非正式科學交流環(huán)境下的科研協(xié)作模式。科學大數(shù)據(jù)環(huán)境下涌現(xiàn)出許多新的科研協(xié)作模式。在正式科學交流所使用的平臺和工具之外,研究者通過非正式科學交流渠道實現(xiàn)科研協(xié)作,也在發(fā)揮重要作用。分析和描述非正式科學交流環(huán)境里的科研協(xié)作模式,包括通過社交媒體平臺分享合作信息、推廣科研成果,通過眾包平臺實現(xiàn)數(shù)據(jù)分布式標注等,將成為科學計量學領(lǐng)域重要的研究課題。
(2)科研協(xié)作的規(guī)模與網(wǎng)絡(luò)分析??蒲袇f(xié)作規(guī)模是指參與科研協(xié)作的人員數(shù)量、資金投入、時間投入等要素的規(guī)模,能夠反映科研協(xié)作的整體發(fā)展態(tài)勢。在科學大數(shù)據(jù)的環(huán)境下,科研協(xié)作網(wǎng)絡(luò)層次更加豐富,包括國家層次、機構(gòu)層次和個人層次的合作網(wǎng)絡(luò)。未來科學計量研究除了通過合著關(guān)系構(gòu)建,也可以考慮使用基金項目、會議組織等其他各種形式豐富的合作聯(lián)系,更加立體的揭示科研協(xié)作的核心人員、合作模式。
(3)區(qū)域間科研協(xié)作發(fā)展趨勢與影響力??茖W大數(shù)據(jù)環(huán)境下科研協(xié)作是跨國界跨區(qū)域的合作。國家之間科研協(xié)作的橫向比較,通過統(tǒng)計其科研協(xié)作發(fā)展隨時間的變化,分析各國科研協(xié)作的項目、政策,洞察國家科研協(xié)作的宏觀趨勢??鐓^(qū)域科研協(xié)作表現(xiàn)在不同的地理層次,洲際、國際、省際、市際乃至校際之間的科研協(xié)作,呈現(xiàn)出不同的特點,在設(shè)計初衷和目標使命方面亦存在不同,分析跨區(qū)域科研協(xié)作項目的影響力,有助于理解地理要素對科研協(xié)作的作用。
5.2? ? 科研協(xié)作的設(shè)計與實現(xiàn)
通過信息技術(shù)與科學學的組合,解決在科學協(xié)作中遇到的技術(shù)與工程問題。科研協(xié)作的設(shè)計與實現(xiàn)的研究方法主要借鑒計算機科學和軟件工程等工程學的研究方法,通過不斷進步的信息通訊技術(shù)實現(xiàn)和支持科學數(shù)據(jù)驅(qū)動的科研協(xié)作。該方向的主要課題包括但不限于:
(1)科學數(shù)據(jù)資源共享機制、科研協(xié)作平臺框架設(shè)計。在科學大數(shù)據(jù)環(huán)境下,科研資源分享方式與傳統(tǒng)科研環(huán)境下的科學數(shù)據(jù)共享發(fā)生了本質(zhì)的改變。多源、多維與海量的科學大數(shù)據(jù)需要更加高效的共享機制和科研協(xié)作平臺。如何利用人工智能、區(qū)塊鏈、協(xié)同計算等前沿信息技術(shù),設(shè)計更能保證隱私和權(quán)益的科學數(shù)據(jù)資源共享機制、更有效率的科研協(xié)作平臺,是未來研究支持科研協(xié)作一個重要的研究方向。
(2)科研智能協(xié)作具體推薦與分析算法??茖W大數(shù)據(jù)環(huán)境下,科研工作者在不同項目里的角色更加多樣化,可以參與的科研協(xié)作形式更加豐富,在科研工作可以發(fā)揮的作用越來越多。通過機器學習與推薦系統(tǒng)算法,智能推薦與分析科研協(xié)作的模式,可以實現(xiàn)更有效率的科研協(xié)作服務(wù),并且可以進一步通過數(shù)據(jù)分析驅(qū)動創(chuàng)新的科研協(xié)作。
(3)科學數(shù)據(jù)共享中的質(zhì)量控制和信息安全問題研究??茖W數(shù)據(jù)的質(zhì)量控制與信息安全問題是指數(shù)據(jù)存儲穩(wěn)定性、數(shù)據(jù)質(zhì)量、防止黑客攻擊等保障科學數(shù)據(jù)可被安全訪問的基本問題,是科研協(xié)作得以開展的基礎(chǔ)??茖W大數(shù)據(jù)環(huán)境下,科學數(shù)據(jù)的內(nèi)容、種類、數(shù)量等都發(fā)生了變化。在這種新環(huán)境下,如何通過各種加密方式、授權(quán)管理、質(zhì)量檢測和信息安全手段來控制和保護科學數(shù)據(jù)的共享,將會成為未來研究的熱點和重點。
5.3? ? 科研協(xié)作的管理與規(guī)劃
通過社會學和管理學的研究方法,旨在解決科研協(xié)作的管理和規(guī)劃問題??蒲袇f(xié)作的管理與規(guī)劃的研究方法主要借鑒管理學、運籌學和經(jīng)濟學等社會學的研究方法。該方向的主要課題包括但不限于:
(1)科研協(xié)作相關(guān)科技政策與科學大數(shù)據(jù)規(guī)范化管理研究。政府和管理部門為了鼓勵和支持科研協(xié)作,應(yīng)該如何規(guī)范科學大數(shù)據(jù)的采集、使用、共享等方面的管理,是在科學大數(shù)據(jù)背景下科技管理的重要課題??萍颊唧w系實施上,如何將數(shù)據(jù)管理與科研研究模式相結(jié)合,必然為科技管理的研究者帶來很多未來的研究機會。
(2)科技資源統(tǒng)籌、利益分配與共享激勵措施??萍假Y源是創(chuàng)新體系的重要組成要素,決定了創(chuàng)新能力的強弱。在科學大數(shù)據(jù)環(huán)境下,更加需要統(tǒng)籌科技資源總體狀況。因此,研究如何根據(jù)不同類型科技基礎(chǔ)條件資源的發(fā)展特點分配利益,設(shè)計充分調(diào)動參與者積極性的共享激勵措施政策,也會是未來的研究熱點。
(3)科研協(xié)作項目的評審機制與經(jīng)濟和社會效益評估。科學大數(shù)據(jù)環(huán)境下,對科學產(chǎn)出的評價更加全面和多樣化。如何設(shè)計健全科學協(xié)作項目的評審機制,如對科研協(xié)作項目不僅從科技產(chǎn)出,也從經(jīng)濟和社會角度進行多角度評估,會是未來科學評價的重點。
6? ?結(jié)語
隨著大規(guī)模科學數(shù)據(jù)的增長,基于科學數(shù)據(jù)驅(qū)動的科研協(xié)作成為必然趨勢,呈現(xiàn)出新特點和新模式,構(gòu)成科學數(shù)據(jù)大會中的重要議題??梢灶A(yù)見,未來人與人、人與儀器之間的交互越來越普遍,科研協(xié)作將更加緊密地圍繞科學數(shù)據(jù)來展開。但是,科學數(shù)據(jù)問題也存在學科差異。在自然科學如高能物理學、天體物理學等,基于大科學裝置產(chǎn)生的大規(guī)模科學數(shù)據(jù)十分普遍;在工程技術(shù)領(lǐng)域如物聯(lián)網(wǎng)、森林監(jiān)控體系等,基于海量傳感器產(chǎn)生的海量數(shù)據(jù)得到廣泛積累;在人文社科領(lǐng)域如考古、新聞傳播領(lǐng)域,基于數(shù)字人文、3D建模、社交媒體等的大數(shù)據(jù)引領(lǐng)學科研究新范式。這些不同學科的科學數(shù)據(jù),在屬性特點、存儲傳播和研究路徑方面都表現(xiàn)出差異,需要開展針對性的研究。
參考文獻:
[1]? Gregor S.The Nature of Theory in Information Systems[J].MIS Quarterly,2006,30(3):611-642.
[2]? 王赟,魏子晗,沈絲楚,等.世紀科學之問“合作+行為是如何進化的”——中國學者的回應(yīng)[J].科學通報,2016,61(1):20-33.
[3]? 孫建軍,李陽.科學大數(shù)據(jù):范式重塑與價值實現(xiàn)[J].圖書與情報,2017(5):20-26.
[4]? Price D J d S.Little science,big science[M].New York: Columbia Univ.Press,1963.
[5]? 劉則淵,陳悅,朱曉宇.普賴斯對科學學理論的貢獻——紀念科學計量學之父普賴斯逝世30周年[J].科學學研究,2013,31(12):1761-1772.
[6]? 宋立榮,劉春曉,張薇.我國大型科學儀器資源開放共享建設(shè)中問題及對策思考[J].情報雜志,2014,33(11):1-6,13.
[7]? 劉洋,何建佳.大型科學儀器設(shè)備共享的合作收益分配模型——基于努力因素的分析[J].科技管理研究,2017,37(3):179-184.
[8]? 董誠,張新民,侯敏.大型科學儀器共享的三層次模型及實例分析[J].中國基礎(chǔ)科學,2012,14(5):55-59.
[9]? 黎建輝,沈志宏,孟小峰.科學大數(shù)據(jù)管理:概念、技術(shù)與系統(tǒng)[J].計算機研究與發(fā)展,2017,54(2):235-247.
[10]? Fischer B A,Zigmond M J.The Essential Nature of Sharing in Science[J].Science & Engineering Ethics,2010,16(4):783-799.
[11]? Tenopir C,Allard S,Douglass K,et al.Data sharing by scientists:practices and perceptions[J].PLoS ONE,2011,6:e21101.
[12]? Christine L.Borgman,青秀玲.科研數(shù)據(jù)共享的挑戰(zhàn)[J].現(xiàn)代圖書情報技術(shù),2013(5):1-20.
[13]? 黃敏,楊海珍.加強大科學裝置的管理[J].中國科學院院刊,2006(3):41-46.
[14]? 張玲玲,王蝶,張利斌.跨學科性與團隊合作對大科學裝置科學效益的影響研究[J].管理世界,2019,35(12):199-212.
[15]? 國家天文臺.LAMOST DR6數(shù)據(jù)集正式發(fā)布[EB/OL].[2019-12-20].http://www.bao.ac.cn/xwzx/gdtpxw/201903/t20190327_5262549.html.