聶華
摘要 以O(shè)penAIRE-COAR2014 年會的基本情況為背景,介紹全球范圍內(nèi)開放獲取運動的最新發(fā)展,包括開放獲取生態(tài)系統(tǒng)涉及到的聯(lián)盟、機構(gòu)、其他參與方及其項目的進展,開放獲取涉及的多元化和多樣性的主題和內(nèi)容。同時,思考全球尤其是歐洲的開放獲取運動的進展和路徑為中國開放獲取運動的發(fā)展所帶來的影響、促進以及啟示。
關(guān)鍵詞 開放獲取 開放知識庫 研究數(shù)據(jù) 文本與數(shù)據(jù)挖掘
歐洲開放獲取基礎(chǔ)設(shè)施研究項目(Open AccessInfrastructure Research for Europe,簡稱OpenAIRE)和國際開放知識庫聯(lián)盟(Confederation of Open AccessRepositories,簡稱COAR)于2014年5月21日-22日在位于希臘雅典的著名的衛(wèi)城博物館聯(lián)合舉辦2014年年會。本屆年會共有來自世界各國的170多名代表參加,同時還有90多位代表通過網(wǎng)絡(luò)直播觀摩會議。參會者廣泛代表了開放獲取的不同參與方,包括來自各類相關(guān)聯(lián)盟和機構(gòu)的負責(zé)人、數(shù)據(jù)和技術(shù)專家、歐盟盟國代表、歐盟委員會官員,圖書館館員、出版商、新型出版組織和先導(dǎo)項目、知識庫管理者以及其他開放獲取運動的倡導(dǎo)者、擁護者和踐行者。年會廣泛探討了開放獲取生態(tài)系統(tǒng)所覆蓋的多樣化的主題,包括開放獲取系統(tǒng)的構(gòu)建與整合、開放獲取的影響和成果、大數(shù)據(jù)和文本與數(shù)據(jù)挖掘等。四個分主題為:聯(lián)合開放知識庫網(wǎng)絡(luò)(Aligning Repository Networks)、研究數(shù)據(jù):機構(gòu)以及更廣泛的視角( Research Data in an Institutional Contextand Beyond)、通過文本與數(shù)據(jù)挖掘最大化對于開放的科學(xué)研究成果的利用( Maximizing the Exploitation of Open Research Results through TDM)、開放性的影響力以及如何評價科學(xué)研究( The Impactof Openness and How to Evaluate Research)。本次年會對于開放獲取運動在全球范圍內(nèi)的發(fā)展進行了全景掃描,積極參與開放獲取運動的主要機構(gòu)、聯(lián)盟和專家學(xué)者介紹了開放獲取生態(tài)系統(tǒng)值得關(guān)注的最新進展,涉及了廣泛的多元化主題。本文在全面介紹會議內(nèi)容的同時,思考全球、尤其是歐洲的開放獲取運動發(fā)展前沿為中國開放獲取運動的發(fā)展帶來的影響、促進以及啟示。
1 OpenAIRF和COAR簡介
一直以來,歐盟委員會將開放獲取視為提升歐洲核心競爭力的關(guān)鍵舉措。本次年會的主辦方之一——OpenAIRE,是由歐盟第七框架計劃(Seventh Framework Programme,簡稱FP7)資助,于2009年12月立項的一個三年期項目。OpenAIRE在不到一年的時間內(nèi)得到歐盟范圍內(nèi)27個國家的38個合作方的積極響應(yīng)和參與,其目標是促成對于科學(xué)研究的完整價值的全面的無邊界的開放獲取。除了在政策和理念層面上倡導(dǎo)和促進開放獲取的發(fā)展之外,作為歐盟開放獲取的基礎(chǔ)設(shè)施,OpenAIRE面向研究者、數(shù)據(jù)提供者、科研管理者和資助機構(gòu)提供系列基礎(chǔ)設(shè)施和服務(wù)。OpenAIRE廣泛選用低成本技術(shù)開發(fā)并維護面向數(shù)據(jù)和論文的開放獲取基礎(chǔ)設(shè)施,以此為基礎(chǔ)按照機構(gòu)或者學(xué)科/主題構(gòu)建知識庫(ZENODO),供研究者和數(shù)據(jù)提供者等存繳研究數(shù)據(jù)和研究論文。7天乘以24小時開放的門戶(OpenAIRE Portal)提供研究成果記錄的開放獲取,以及由研究成果到作者、數(shù)據(jù)、軟件、出版信息和資助信息等的可靠鏈接。同時,OpenAIRE還通過32個國家級的開放獲取工作臺,整合包括圖書館和研究機構(gòu)在內(nèi)的各方面的資源,提供關(guān)于開放獲取政策的制訂和協(xié)同、相關(guān)指南的共享和規(guī)范,以及一些確定目標的活動的組織和實施。截至2014年5月20日,OpenAIRE的包羅萬象的泛化知識庫的統(tǒng)計數(shù)字是:840萬件已發(fā)表成果(論文、圖書等),700萬名作者,460多個數(shù)據(jù)提供者,歐盟和英國維康基金會(Wellcome Trust)等2個資助機構(gòu)的8萬個研究項目的鏈接以及3萬3千個注冊組織。OpenAIRE還開發(fā)了多個增值服務(wù),用戶可以利用這些服務(wù)對知識庫的內(nèi)容進行數(shù)據(jù)挖掘、統(tǒng)計和報告等。
成立于2009年,并在幾年之問發(fā)展迅速的COAR是目前最為活躍的開放獲取國際組織之一。COAR成立的初衷可追溯到2005-2009年歐盟委員會資助的歐盟DRIVE項目(Digital Repository Infrastructure Vision for Europe,歐洲數(shù)字知識庫基礎(chǔ)設(shè)施展望)。該項目發(fā)現(xiàn),為促進全球知識庫共同體和世界各地的虛擬知識庫網(wǎng)絡(luò)的實現(xiàn),一個凝聚機構(gòu)和組織的國際知識庫共同體的組織模式是非常必要的,這一共識促成COAR于2009年9月正式成立,并在其后的幾年間發(fā)展為一個包括24個國家近100家組織和機構(gòu)參與的國際聯(lián)盟。它的核心任務(wù)是“通過一個開放獲取數(shù)字知識庫的全球網(wǎng)絡(luò),擴大研究成果的可見度,促進研究成果的廣泛應(yīng)用?!贝送?,COAR的目標是讓世界的每個公民能夠從公共資助的研究產(chǎn)出中獲取知識,或者從中獲益。COAR的主要任務(wù)是:通過OA知識庫擴大研究成果的可見度;作為知識庫及其網(wǎng)絡(luò)、國家和國際層面的基于電子基礎(chǔ)設(shè)施知識庫的展示途徑;確定和推廣知識庫的內(nèi)容繳存策略,并促進與出版商的共識;致力于知識庫標準化和互操作性的知識庫共同體開展緊密合作;為知識庫管理者和從業(yè)人員提供專業(yè)咨詢及交流機會。目前COAR在中國有三個正式成員:中國科學(xué)院文獻情報中心、北京大學(xué)圖書館和廈門大學(xué)圖書館。
2 聯(lián)合開放知識庫網(wǎng)絡(luò)(Aligning Repository net-works)
作為開放獲取的綠色途徑,開放知識庫仍然是與會者的重點關(guān)注之一。會上的報告更多地集中在全球范圍內(nèi)機構(gòu)庫網(wǎng)絡(luò)發(fā)展的多樣化態(tài)勢,以及相關(guān)機構(gòu)和組織如何通過一系列的努力和舉措對全球的機構(gòu)庫網(wǎng)絡(luò)進行整合。endprint
有關(guān)背景可以追溯到2014年3月由COAR主辦的“聯(lián)合知識庫網(wǎng)絡(luò)”會議。題為“向一個無縫連接的全球科學(xué)研究基礎(chǔ)架構(gòu)推進”的會議報告指出:科學(xué)研究正在不斷國際化,許多今天的世界所面臨的問題,比如氣候變化、貧困、健康都具有全球化的屬性,因此必須通過科學(xué)研究人員的跨地區(qū)、跨學(xué)科的合作來共同面對和解決。在此背景下,科學(xué)研究的基礎(chǔ)架構(gòu)必須對這一需求有所應(yīng)對和順應(yīng)。開放知識庫正在成為科學(xué)研究基礎(chǔ)架構(gòu)的關(guān)鍵組成部分。作為科學(xué)研究架構(gòu)系統(tǒng)中的重要的內(nèi)容表現(xiàn)層,開放知識庫具有供研究人員和全世界獲取研究成果,供研究機構(gòu)管理其科研產(chǎn)出,供政府、資助機構(gòu)和組織獲得相關(guān)信息等重要功能。自開放獲取運動啟動以來,世界很多地區(qū)和國家開始開放知識庫網(wǎng)絡(luò)的建設(shè)。這些網(wǎng)絡(luò)在特定的本地情景中基于不同的需求和政策而發(fā)展,因此處于不同的發(fā)展階段,具備不同的特征和特點。然而,開放知識庫的真正價值在于它們之間的無縫連接以及在此基礎(chǔ)上對全球研究成果的統(tǒng)一獲取,也只有在此基礎(chǔ)上,才能夠進行整合、數(shù)據(jù)挖掘,開發(fā)新的工具和服務(wù),并產(chǎn)生新的知識。來自澳大利亞、加拿大、中國、歐洲、拉丁美洲和美國的代表在會議上確定了聯(lián)合開放知識庫網(wǎng)絡(luò)在政策、技術(shù)和服務(wù)方面的具體舉措及其實施的優(yōu)先級。在政策(和法律)方面提出優(yōu)先的延遲期,強調(diào)對于研究成果的開放獲取的任何延遲都在削弱和剝奪科研過程和創(chuàng)新,對于成果的立即開放是最好實踐。如果必須設(shè)定延遲期,根據(jù)學(xué)科的差異,最多為6-12個月。在技術(shù)和語義互操作方面,倡議并推動全球開放知識庫應(yīng)用ORCID作為作者唯一識別號,鼓勵使用永久標識符,將表達重要概念的特定的詞表元素標準化,包括但不限于:延遲期、獲取和重用條件、資助方ID等,建立并采用具有共性的方法收集使用數(shù)據(jù)和影響因子,應(yīng)用有關(guān)在知識庫網(wǎng)絡(luò)之間和科研信息系統(tǒng)之間的數(shù)據(jù)交換的協(xié)議。在服務(wù)方面,共享研究數(shù)據(jù)管理以及成果與數(shù)據(jù)鏈接相關(guān)的創(chuàng)新實踐;促進知識庫在研究評價系統(tǒng)發(fā)揮更為關(guān)鍵的作用;在全球范圍內(nèi)收集整理對于科學(xué)研究至關(guān)重要的開放知識庫服務(wù)清單(例如:知識庫注冊、出版商政策注冊等),并討論如何為這些服務(wù)提供必要的支持。
繼FP7項目于2013年結(jié)束后,歐洲開放獲取知識庫在歐盟Horizon 2020計劃[7]的框架下得到進一步的繁榮和發(fā)展。相應(yīng)地,OpenAIRE 2020主要著力于三個方向的計劃:1)支持歐盟委員會的Horizon 2020科學(xué)出版開放獲取和開放數(shù)據(jù)實驗計劃的愿景;2)開發(fā)構(gòu)建一個泛歐洲研究信息管理系統(tǒng),目標是跟蹤、監(jiān)控歐盟和其他國家資助項目的開放獲取學(xué)術(shù)成果;3)創(chuàng)建一個國際開放知識庫合作平臺,真正支持全球化科學(xué)研究和學(xué)術(shù)交流,通過一系列的目標明確的培訓(xùn)和實驗性項目,進一步加強由COAR啟動的與澳大利亞、中國、歐洲、拉丁美洲和美國等國家和地區(qū)在開放共享的很多共同領(lǐng)域的對話,包括政策、指南、使用統(tǒng)計、影響力、數(shù)據(jù)知識庫的連接和整合等。
美國也開始努力構(gòu)建全國性的開放知識庫網(wǎng)絡(luò)。SFIARE( Share Access Research Ecosystem)[9]是美國研究圖書館學(xué)會(Association of ResearchLibraries,ARL)聯(lián)合美國公立與授地大學(xué)聯(lián)盟(APUL, Association of Public and I,and-grand Universities)和美國大學(xué)聯(lián)盟(Association of American Universities,AAU)共同發(fā)起的全國高等教育領(lǐng)域開放獲取先導(dǎo)項目,旨在建立強壯的研究成果知識庫生態(tài)系統(tǒng),從而影響和改善現(xiàn)存的研究環(huán)境,收集和發(fā)布研究成果并保障其可發(fā)現(xiàn)、可獲取、重用以及長期保存。根據(jù)AAU的統(tǒng)計數(shù)字,2011年AAU聯(lián)盟成員高校獲得了總計235億美元的美國聯(lián)邦科研經(jīng)費,占全部經(jīng)費的57.7%。而2007年到2011年,美國高校的學(xué)術(shù)成果發(fā)表總數(shù)為113萬項,占全國的67%、全球的19%。然而,對于如此龐大的公共科研經(jīng)費的使用以及成果產(chǎn)出情況的跟蹤和報告非常匱乏,并無統(tǒng)一的、結(jié)構(gòu)化的方法和途徑對研究成果進行及時有效和整合后的發(fā)布。
在此背景下,SHARE項目計劃的第一步是構(gòu)建一個供研究機構(gòu)準確及時地跟蹤和報告研究成果的通知系統(tǒng)(notification system),以此為基礎(chǔ)層,依次建立注冊層( Registry layer).發(fā)現(xiàn)層(discoverylayer)和內(nèi)容集合層(Content Aggregation Layer),向研究人員、機構(gòu)、資助方、公眾和業(yè)界提供相應(yīng)的服務(wù)。
SHARE近期發(fā)布了最新的技術(shù)和其他方面的進展和計劃。2014年6月,SFIARE的開放科學(xué)中心(Center of Open Science,COS)團隊發(fā)布系統(tǒng)的開發(fā)工作取得的進展包括:開始對開放內(nèi)容來源的內(nèi)容、API、收割方法等進行評估,這些來源包括ClinicalTrials. gov、美國能源部(DOE)、SciTech、ImpactStory、CrossRef、國家醫(yī)學(xué)圖書館PubMed Central、公共科學(xué)圖書館(PLOS)等。除了這些初始的內(nèi)容來源外,還開發(fā)了一個用來管理不同來源的內(nèi)容的scraping integration API(整合API)。7月份,開發(fā)團隊開始通過OAI-PMH元數(shù)據(jù)收割協(xié)議處理來自PLOS、Altmetric、CrossRef、arXiv和其他機構(gòu)知識庫的內(nèi)容。目前,所有工作及其成果已經(jīng)在SHARE知識庫的GitHub上開放共享。SHARE的長遠目標是建立健壯的知識庫生態(tài)系統(tǒng),以此為平臺及時、規(guī)范、全面地向所有相關(guān)方提供科學(xué)研究信息。通知系統(tǒng)可以被看作全面收集研究項目和活動相關(guān)原始數(shù)據(jù)的“書目”,而注冊系統(tǒng)(Registry System)將進一步清洗由通知系統(tǒng)收集的原始數(shù)據(jù)并進行明確歸類,比如,與具體的研究項目連接的預(yù)印本、正式發(fā)表論文、數(shù)據(jù)集等。注冊系統(tǒng)將提供面向公眾開放的檢索API,允許其他系統(tǒng)調(diào)用,目的是向科學(xué)家、研發(fā)公司以及其他興趣方提供一個可以長期有效地發(fā)現(xiàn)、獲取和復(fù)用研究成果的平臺。endprint
拉丁美洲國家因其在開放獲取政策和立法方面的突破而受到矚目,同時,通過合作建設(shè)開放知識庫網(wǎng)絡(luò)來支持有關(guān)的政策和法律法規(guī),從另一個方面促進了拉丁美洲的科學(xué)研究水平的提升。La Refer encla知識庫網(wǎng)絡(luò)由阿根廷、巴西、哥倫比亞、智利、墨西哥、秘魯、委內(nèi)瑞拉等八個國家聯(lián)合發(fā)起,截至2014年3月,存繳內(nèi)容近60萬條。項目最大的效果是有效地提升了拉丁美洲研究成果的可見度,并通過參與國際聯(lián)盟和國家間的合作,在開放知識庫相關(guān)政策、技術(shù)和最佳實踐等方面得到交流和促進。
國際機構(gòu)近年來對于開放獲取的關(guān)注和參與在持續(xù)加強。世界銀行于2012年確定并推出研究成果和知識產(chǎn)品的新的開放獲取政策,新政策延續(xù)了世界銀行近年來為加強信息公開,使其研究成果盡可能得到廣泛傳播利用所做的努力。作為政策的實際落實,啟動了世界銀行開放知識庫(OpenKnowledge Repository,OKR)。對OKR中存繳的所有內(nèi)容采用“創(chuàng)作共享”CC授權(quán)許可。為促進開放獲取,世界銀行還開發(fā)了一個能夠允許其他知識庫下載部分OKR內(nèi)容并保存到本地的系統(tǒng),這項服務(wù)使得網(wǎng)絡(luò)帶寬有限的發(fā)展中國家尤其受益,下載統(tǒng)計已經(jīng)可以看到這一效果。
隨著開放學(xué)術(shù)的發(fā)展,研究者開始在更為廣泛的情景中展望機構(gòu)知識庫的新作用。機構(gòu)知識庫的傳統(tǒng)作用包括作為開放獲取綠色路徑,作為機構(gòu)科研產(chǎn)出以及教學(xué)資料的展示窗口和作為機構(gòu)科研成果管理機制組成部分等。隨著開放學(xué)術(shù)的發(fā)展,機構(gòu)知識庫作為出版平臺,提供各種推動學(xué)術(shù)交流的增值服務(wù),以及作為科研管理系統(tǒng)的功能和作用將更為迫切和突出。機構(gòu)知識庫提供這些增值服務(wù)和履行新功能的基礎(chǔ)和前提是在收繳內(nèi)容方面著力加強。根據(jù)OpenDOAR統(tǒng)計,在注冊的2129個機構(gòu)知識庫中,成果條數(shù)超過10萬的只有74個,成果條數(shù)超過1萬條的只有570個。從地域方面看,巨大的南北差異造成當(dāng)前的學(xué)術(shù)出版體系的先天的不平等,而不平等的學(xué)術(shù)出版體系造成發(fā)展中國家的研究人員無論是發(fā)表機會還是獲取研究成果的機會都處于當(dāng)然的劣勢。因此,開放機構(gòu)知識庫正在發(fā)揮的作用以及潛在的作用還在于促進既有的學(xué)術(shù)出版體系向著更為平等和理想的方向演變。分布式的開放獲取機構(gòu)庫網(wǎng)絡(luò)將是機構(gòu)庫發(fā)展和提供增值服務(wù)的必要的起點,開放機構(gòu)庫增值服務(wù)的一個很好的嘗試是利用機構(gòu)知識庫平臺進行出版,這是機構(gòu)促進一個更具有廣度的學(xué)術(shù)交流體系的合法化的可行的途徑,也是必要的努力。
3 研究數(shù)據(jù):機構(gòu)視角以及更廣泛的情景(Re-search data in an institutional context and beyond)
本屆年會對研究數(shù)據(jù)予以更為集中的關(guān)注和討論,并著重從機構(gòu)的情景和更為廣泛的視角探討研究數(shù)據(jù)管理的相關(guān)政策、工具和服務(wù),以及研究數(shù)據(jù)管理與科學(xué)研究流程及其管理在架構(gòu)層面的融合。愛丁堡大學(xué)是英國最早開展研究數(shù)據(jù)管理的大學(xué)之一,早在2011年5月即發(fā)布了由大學(xué)評議會/大學(xué)管理處決議通過的“研究數(shù)據(jù)管理政策”。負責(zé)知識管理的副校長、CIO和圖書館館長杰夫海伍德在報告中介紹愛丁堡大學(xué)研究數(shù)據(jù)管理的路線圖和系列服務(wù),探討研究數(shù)據(jù)管理相關(guān)政策的制定及其在機構(gòu)中落實的各種保障條件。所謂研究數(shù)據(jù),指在研究過程中產(chǎn)生的任何數(shù)據(jù)和全部數(shù)據(jù)。世界經(jīng)合組織將數(shù)據(jù)描述為“公共財”,因此應(yīng)該開放。英國研究理事會早在2009年即提出研究項目應(yīng)該保證其數(shù)據(jù)至少在10年內(nèi)能夠妥善保存和有效獲取。資助機構(gòu)的數(shù)據(jù)政策不斷地對研究機構(gòu)的與研究數(shù)據(jù)管理相關(guān)的承諾和條款提出要求。2012-2013學(xué)年,愛丁堡大學(xué)提交研究申請2222項,其中934個項目獲得了總計3.01億英鎊的研究經(jīng)費。大部分項目是校內(nèi)、校際、甚至國際性的合作項目。無論從研究者、研究團隊、大學(xué)還是資助機構(gòu)的角度,亟需通過易用和宜用的工具對項目申請過程以及研究數(shù)據(jù)進行跟蹤和管理。愛丁堡大學(xué)RDM的目標是尋求包括研究人員、研究團隊、大學(xué)等參與方的共贏。信息服務(wù)研究數(shù)據(jù)管理實施委員會于2014年1月重新審核并發(fā)布了研究數(shù)據(jù)管理路線圖(version l.2),主要包括三大板塊:RDM支持性工作(理念倡導(dǎo)宣傳,培訓(xùn)和咨詢等);RDM系列服務(wù):數(shù)據(jù)管理計劃;實時數(shù)據(jù)管理和服務(wù)架構(gòu),包括實時工作文檔和數(shù)據(jù)存儲服務(wù)、數(shù)據(jù)出版/發(fā)表倉儲服務(wù)、數(shù)據(jù)長期存儲服務(wù)和數(shù)據(jù)集注冊服務(wù)等。
加拿大阿爾伯塔大學(xué)也是研究數(shù)據(jù)管理的早期踐行者之一。數(shù)據(jù)管理館員查爾斯·漢弗萊(Charles FIumphrey)主要介紹研究數(shù)據(jù)長尾效應(yīng)和研究數(shù)據(jù)的多樣化和多元化為研究數(shù)據(jù)管理所帶來的挑戰(zhàn)。研究數(shù)據(jù)管理架構(gòu)是在本地或者全球范圍聯(lián)合技術(shù)、服務(wù)和專家來支持科學(xué)研究全過程。因此,研究數(shù)據(jù)管理工作迫切需要多個參與方進行有效合作。其中,圖書館員對于科研項目流程中數(shù)據(jù)管理的全程參與的重要性在于保證研究人員能夠采用好的數(shù)據(jù)管理方法進行數(shù)據(jù)的收集和生產(chǎn)。加拿大已經(jīng)開始建立全國性機構(gòu)支持研究數(shù)據(jù)管理架構(gòu)的建立和運作,圖書館在該架構(gòu)的建設(shè)初始階段即已參與其中。
開放獲取期刊FlOOOR的瓦薩·霍迪亞(Var sha Khodiyar)描述出版過程的數(shù)據(jù)流,如何通過建立發(fā)表成果與底層基礎(chǔ)數(shù)據(jù)的鏈接,捕捉研究數(shù)據(jù)長尾。其中一個重要條件是研究者和作者在準備和提交數(shù)據(jù)過程中的配合與支持。FlOOOR以開放獲取形式出版生命科學(xué)領(lǐng)域的各種類型的重要的研究成果,其主要特點包括:出版周期為一周,透明的出版后同行評議,出版成果包含論文的全部數(shù)據(jù),接受非傳統(tǒng)的論文類型,包括純數(shù)據(jù)論文,所有發(fā)表的論文必須完全無條件開放獲取等。透明和開放是科學(xué)研究的基石,“不允許數(shù)據(jù)重用是科學(xué)的弊端”。研究表明,科學(xué)數(shù)據(jù)不可獲取是科學(xué)研究成果無法復(fù)制的主要原因。還有研究表明,數(shù)據(jù)的開放、共享和重用與論文的高引用率呈正相關(guān)。
會議邀請希恩·黑爾(Sean Hill)介紹被歐盟選定為未來新興技術(shù)旗艦項目之一的“人腦項目”(Human Brain Project)。這一項目凝聚了來自歐盟、美國、日本和中國等24個國家、126個機構(gòu)的近300名神經(jīng)科學(xué)、醫(yī)學(xué)和計算機領(lǐng)域的專家,在10年的項目執(zhí)行期間將耗資10億歐元,力圖整合跨學(xué)科的知識和研究力量,為基于信息通訊技術(shù)的新型腦研究模式奠定技術(shù)基礎(chǔ),并極大地加速腦科學(xué)研究成果的轉(zhuǎn)化,目標是切實提高衛(wèi)生服務(wù),改善公民健康狀況,提升歐洲的產(chǎn)業(yè)競爭地位。根據(jù)計劃,研究人員需將人類大腦切成8000片,利用高性能掃描儀進行數(shù)字化處理,繪制人腦詳圖;同時利用超級計算機描繪和模擬大腦所需的海量數(shù)據(jù),最后將成千上萬的神經(jīng)元模型組裝為一個可正常運轉(zhuǎn)的、完整的人類大腦模型。該項目是數(shù)據(jù)驅(qū)動的跨學(xué)科研究的典型案例,研究者采用醫(yī)學(xué)信息學(xué)方法,利用來自醫(yī)療機構(gòu)的檔案和其他數(shù)據(jù)庫的醫(yī)療大數(shù)據(jù)開發(fā)數(shù)據(jù)驅(qū)動的疾病生物學(xué)簽名(biological signatures),從而發(fā)現(xiàn)解釋疾病原因的新途徑并確定有效的治療新方法。endprint
全球化合作是新型研究模式的關(guān)鍵基礎(chǔ),而有效跟蹤數(shù)據(jù)起源并建立數(shù)據(jù)流,最終整合所有現(xiàn)存的數(shù)據(jù)架構(gòu)是合作的目標,人腦項目作為全球化合作項目,對于由機構(gòu)的研究數(shù)據(jù)集合而成的大數(shù)據(jù)的強調(diào)是這一規(guī)模巨大的全球化合作項目的最為重要的價值所在。
4 文本與數(shù)據(jù)挖掘最大化對于開放的科學(xué)研究成果的利用( Maximizing the exploitation of open re-search results through TDM)
越來越多的研究人員開始將視線轉(zhuǎn)向大規(guī)模文本和數(shù)據(jù)挖掘。本次年會的TDM主題引起與會者的強烈興趣和關(guān)注。文本與數(shù)據(jù)挖掘是從不斷產(chǎn)生和存儲的數(shù)字化數(shù)據(jù),或者說大數(shù)據(jù)中,通過分析和抽取而獲得新的洞察和知識的重要技術(shù)。作為一個新興的研究和技術(shù)領(lǐng)域,一方面需要了解其為現(xiàn)有的法律框架帶來的問題和挑戰(zhàn),另一萬面需要把握現(xiàn)有的法律框架對于該新興研究和技術(shù)的促進與制約,同時經(jīng)濟方面的因素也需要被包含在考量的范疇之內(nèi)。這也是本屆年會上與會者對于歐洲在TDM方面的一些新的限制和一些新的期待強烈關(guān)注的原因。當(dāng)前,仍然存在著很多法律和其他方面的障礙,限制研究人員對于大規(guī)模的數(shù)字內(nèi)容(大數(shù)據(jù))進行有效挖掘。
美國公共科學(xué)圖書館(Public Library of Sci ence)的宣傳推廣主管卡梅倫·尼倫(Cameron Ney lon)在報告中強調(diào),TDM的關(guān)鍵作用在于將作者的成果“有效地”傳遞給那些真正需要并能夠使用它的人,TDM是新型出版模式的核心,也是任何開放學(xué)術(shù)出版商以及網(wǎng)絡(luò)服務(wù)應(yīng)該向用戶提供的關(guān)鍵服務(wù)。它將是一個商業(yè)差異化的顯著標志,或者說是一個新的增長點。
英國曼徹斯特大學(xué)計算機學(xué)院文本挖掘國家研究中心的Sophia Ananiadou介紹Argo,一個允許互操作和客制化的文本挖掘與分析工作平臺。并以Argo的應(yīng)用案例為樣本,探討研究機構(gòu)和研究社區(qū)如何向研究人員提供更好的TDM服務(wù)。TDM涉及到語言、技術(shù)、學(xué)科、文本類型等多個方面的多樣性和復(fù)雜性,面臨眾多的技術(shù)和非技術(shù)方面的挑戰(zhàn)。因此,TDM架構(gòu)尤其強調(diào)模塊化、互操作性(通用的數(shù)據(jù)表現(xiàn)和數(shù)據(jù)類型)以及通用性(跨語言、跨學(xué)科、跨文本類型等)方面的要求。一個通用的、易用的工作平臺可以為研究人員進行與TDM相關(guān)的工作和項目提供直接有效的平臺、流程、技術(shù)和社區(qū)交流等各方面的支持。
5 開放性的影響力及我們?nèi)绾卧u價科學(xué)研究(The Impact of Openness and how to evaluate research)
開放性的影響力分主題聚集了數(shù)個有關(guān)科學(xué)研究評價的新方法和新趨勢的討論和報告。ACU MEN Project的報告提出評價研究人員學(xué)術(shù)影響力的新方法,討論現(xiàn)有的學(xué)術(shù)評價系統(tǒng)的缺陷和問題,以及評價指標與科學(xué)的功能之間的亟需跨越和彌補的鴻溝。Mendeley的報告討論研究成果記錄的個性化,強調(diào)機構(gòu)知識庫尚未嵌入到研究人員的日常工作流程中,這是機構(gòu)知識庫亟待提升的功能。Atomium Culture的報告[28]討論如何通過新型媒體和傳統(tǒng)媒體的合作提高科學(xué)研究影響力。
其中作為新型的開放出版模式的報告令人關(guān)注。互聯(lián)網(wǎng)已經(jīng)改變了學(xué)術(shù)出版范式。以雜志為單元的作為產(chǎn)品的出版分解為以論文為單元的作為服務(wù)的出版。成立于2007年的Frontier剛剛出版了第20000篇開放論文,至今Frontier已經(jīng)成為全球五個最大的開放獲取平臺之一。它的定位是面向科研社區(qū)、由科學(xué)家為科學(xué)家出版的網(wǎng)絡(luò)出版平臺,通過交互的在線平臺提供實時的嚴格、公平、透明、快速的同行評議,以及詳細的論文影響力評價。平均發(fā)表周期為84天,由全球的4500個相關(guān)領(lǐng)域的知名科學(xué)家和研究者擔(dān)任編輯。自2008年以來,所有的Frontier期刊的評價指標都高于平均值。
LIBRE是一個免費的開放同行評議平臺,由來自17個國家的108位研究者和學(xué)者志愿開發(fā)、維護和運行,他們的共同理念是開放性和透明性是學(xué)術(shù)評價和學(xué)術(shù)交流新紀元的標志。因此,開放的同行評議應(yīng)該成為開放出版范式中的一個必要的組成。研究者可以在LIBRE的開放平臺上自行提交論文,邀請專家根據(jù)提供的可以選擇的質(zhì)量和可見度相關(guān)的評價指標進行開放評議,對論文、作者和評議者進行評級。LIBRE的目標簡單而言是“謀求科學(xué)研究的解放”。
本次年會以主題為“五年后的學(xué)術(shù)交流:如何聯(lián)合起來一起向前?哪些問題最為優(yōu)先?”的開放討論作為會議總結(jié)。來自COAR、SPARC、OECD、HAL以及歐盟等國際組織、機構(gòu)和聯(lián)盟的代表對開放獲取的發(fā)展走向以及學(xué)術(shù)交流范式變遷提出看法,或者作出預(yù)測。①探討在開放獲取驅(qū)動下的學(xué)術(shù)交流的情景中,大學(xué)、科研機構(gòu)以及圖書館將發(fā)揮新的作用,扮演新的角色。大學(xué)應(yīng)該擔(dān)負起對于科學(xué)研究成果的全面責(zé)任。國際性的合作有助于提升圖書館館員在支持e-Research和學(xué)術(shù)交流方面的競爭力,包括提供支持學(xué)術(shù)交流的新的服務(wù)的組織模式等。②學(xué)術(shù)交流范式正在持續(xù)演變,但尚未達到快速演變、或者說巨變的階段。而新的技術(shù)已經(jīng)給學(xué)術(shù)交流范式的演變帶來巨大的驅(qū)動和壓力。我們可以將學(xué)術(shù)交流流程看作一系列的建筑模塊,參與到學(xué)術(shù)交流過程中的各方可以從各自的角度努力并聯(lián)手推進學(xué)術(shù)交流的革命。③開放獲取和開放科學(xué)已經(jīng)為技術(shù)創(chuàng)新、商業(yè)發(fā)展以及整個社會帶來巨大的影響,并將持續(xù)發(fā)揮其顛覆性的作用。④對于開放內(nèi)容的數(shù)據(jù)的共享和重用的需求持續(xù)增長,包括商業(yè)需求和非商業(yè)需求,這種需求帶來創(chuàng)新的可能,并為我們所面臨的社會挑戰(zhàn)帶來應(yīng)對的契機。
6 結(jié)語:啟示與思考
本屆OpenAIRE-COAR年會的交流廣泛而深入,參與方分布廣泛,互動式的討論更多地專注于開放獲取的實際操作層面。而世界范圍內(nèi)開放獲取的發(fā)展和學(xué)術(shù)交流的演變也為我們帶來深刻的有益的啟示。
(1) 合作共贏:成立開放獲取聯(lián)盟的重要性和必要性??梢杂^察到,在經(jīng)濟全球化、全球信息化的時代,全球范圍的合作是必然的發(fā)展趨勢。中國的高校和科研機構(gòu)亟待聯(lián)合起來,成立聯(lián)盟,如“中國高校開放獲取聯(lián)盟”,共同發(fā)起全國性的開放獲取先導(dǎo)項目,凝聚力量,搭建平臺,促進交流共享,并通過實際操作層面的具體實施,如構(gòu)建聯(lián)合的開放知識庫網(wǎng)絡(luò)等,并通過全國性知識庫的構(gòu)建和開放,無縫連接和整合,最終實現(xiàn)知識庫的真正價值,即支持科學(xué)研究和學(xué)術(shù)交流。
(2) 洞悉轉(zhuǎn)型:圖書館的角色和職責(zé)的重新定位。在科學(xué)研究走向開放與合作,學(xué)術(shù)交流范式持續(xù)演變的背景下,圖書館應(yīng)該大力提升其支持e-Research和學(xué)術(shù)交流方面的競爭力,并為教學(xué)科研和學(xué)術(shù)交流提供新的服務(wù)和支撐模式,包括機構(gòu)的開放信息架構(gòu)(Open Information Infrastructure)的構(gòu)建、開放出版、研究數(shù)據(jù)管理等。
(3) 增值服務(wù):機構(gòu)知識庫發(fā)展的新需求和新態(tài)勢。隨著學(xué)術(shù)交流的日益開放,機構(gòu)知識庫在履行學(xué)術(shù)成果的存檔、展示和管理等傳統(tǒng)功能之外,亟待提供各種推動學(xué)術(shù)交流和開放的增值服務(wù),包括作為開放出版平臺、開放的學(xué)者門戶,以及作為科研信息管理系統(tǒng)的功能和作用。機構(gòu)知識庫提供這些增值服務(wù)和履行新功能的基礎(chǔ)和前提,一是對機構(gòu)學(xué)術(shù)成果的全面和準確的收繳和整理,二是對教學(xué)科研流程以及科研管理的無縫嵌入和銜接。
(4) 研究數(shù)據(jù)管理的興起及其面臨的挑戰(zhàn):多樣化和多元化。在大數(shù)據(jù)背景下,數(shù)據(jù)驅(qū)動的科學(xué)研究成為充滿潛力的新的知識來源。研究數(shù)據(jù)的產(chǎn)生和積累呈指數(shù)級增長,以及研究數(shù)據(jù)的多樣化和多元化為研究數(shù)據(jù)管理帶來的挑戰(zhàn),需要包括學(xué)者和研究人員、管理者、圖書館員以及技術(shù)人員通過合作共同面對。
李克強總理在2014年全球研究理事會的致辭中提到:“應(yīng)采取多種方式,促進科學(xué)知識的廣泛傳播與共享,實現(xiàn)科學(xué)的最大價值,不斷增進人類福祉?!辈娬{(diào)“支持建立公共財政資助的科學(xué)知識開放獲取機制,促進中國和世界科學(xué)事業(yè)共同發(fā)展?!眹易匀豢茖W(xué)基金委員會和中國科學(xué)院于2014年5月分別發(fā)布《關(guān)于受資助科研論文實行開放獲取的政策聲明》和《關(guān)于公共資助科研項目發(fā)表的論文實行開放獲取的政策聲明》,中國開放獲取政策的發(fā)布引起廣泛關(guān)注,在OpenAIRECOAR年會期間的交流中,人們預(yù)測中國的開放獲取進程將會有更快的進步和更大的突破,為世界所期待。endprint