李廣建,羅立群
國家科研論文和科技信息高端交流平臺(以下簡稱“高端交流平臺”)已經(jīng)被正式列入《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》,這是黨和國家在“百年未有之大變局”時代對我國國家科技創(chuàng)新體系的高瞻遠矚,是對國家科技信息和科技情報體系的頂層設(shè)計,也是新時期科技情報研究和工作的指導(dǎo)思想,為科技情報的未來指明了發(fā)展方向。當前人工智能、生物基因、材料科學(xué)、綠色能源等顛覆性技術(shù)和新興科技對國際格局、世界生產(chǎn)力布局、國家現(xiàn)代化模式等諸多方面都產(chǎn)生了深遠的影響,科學(xué)進步、技術(shù)創(chuàng)新已成為各國政府推動本國社會經(jīng)濟發(fā)展的最重要手段??萍紕?chuàng)新成果日新月異,大量創(chuàng)新成果從全球各地的研究機構(gòu)和科技公司產(chǎn)出,新興技術(shù)創(chuàng)新呈現(xiàn)加速趨勢。在這個過程中,國際間的科技競爭日趨激烈,科技封鎖與技術(shù)制裁日趨增多,全球科技創(chuàng)新生態(tài)正在發(fā)生巨大變化,這就對我國科技信息和科技情報工作提出了新的要求。黨和國家在這種背景下提出構(gòu)建國家科研論文和科技信息高端交流平臺,是對科技信息和科技情報工作的巨大鞭策。鑒于當前高端交流平臺概念提出較新,對高端交流平臺的相關(guān)認識和研究較少,本文將討論高端交流平臺構(gòu)建的定位、高端交流平臺的核心特征,意在拋轉(zhuǎn)引玉,希望引起科技情報工作者和研究者對高端交流平臺足夠的重視和研究的熱情。
在國家“十四五”規(guī)劃中,高端交流平臺出現(xiàn)在《第四章 強化國家戰(zhàn)略科技力量》中,這表明高端交流平臺的構(gòu)建已上升到了國家戰(zhàn)略高度,是加強我國科學(xué)戰(zhàn)略力量的重要任務(wù)之一。因此,對高端交流平臺的定位不能僅從傳統(tǒng)學(xué)科的認識或字面上對其進行狹義的解讀,而是要充分注意到高端交流平臺相較于一般意義的平臺具有更豐富的內(nèi)涵和更高的定位。也就是說,應(yīng)站在全球科技格局和創(chuàng)新生態(tài)的角度去解讀高端交流平臺的定位。為此,本文從國家科技安全、國家重大需求、科技創(chuàng)新范式等三個不同的維度思考高端交流平臺的定位。
國家科技安全是一個國家推動本國科技戰(zhàn)略、發(fā)展本國科技實力、構(gòu)建本國科技創(chuàng)新體系的根本保障。所謂科技安全,是指在一定的社會環(huán)境條件下由科學(xué)技術(shù)因素以及科學(xué)技術(shù)與國家安全因素的相關(guān)性所構(gòu)成的一種國家安全態(tài)勢,這種態(tài)勢描述了國家利益免受國外科技優(yōu)勢威脅的能力、國家在所面臨的國際國內(nèi)環(huán)境中保障科學(xué)技術(shù)健康發(fā)展,以及依靠科學(xué)技術(shù)提高整體競爭力的能力和國家以科技手段維護國家綜合安全的能力[1]。近年來,隨著國際形勢變化,國際間科技競爭日趨白熱化,技術(shù)管制日趨增多,科技安全事件頻發(fā),對我國保障國家安全、解決重大需求、發(fā)展經(jīng)濟命脈的關(guān)鍵技術(shù)領(lǐng)域產(chǎn)生了重大的安全隱患。眾所周知,在大數(shù)據(jù)時代的科技創(chuàng)新活動中,科研工作者、科學(xué)家的智慧、知識等不僅僅以論文、著作的形式進行發(fā)表,在創(chuàng)新過程中還會產(chǎn)生許多相關(guān)的代碼、數(shù)據(jù)、實驗過程等附加成果,對科學(xué)研究成果的驗證、重用、落地、應(yīng)用起到了非常重要的支撐和加速作用,是國家科技創(chuàng)新的重要生產(chǎn)要素和戰(zhàn)略資源。盡管科學(xué)沒有國界,但科學(xué)成果的歸屬、使用是有國界的。以開放獲取平臺為例,全球主流的平臺和服務(wù),如開源代碼共享平臺Github,盡管其代碼的貢獻者來自全球,但其所有權(quán)及運營權(quán)均屬于美國微軟公司,受美國法律和政策管制。目前我國對這類關(guān)鍵的科技戰(zhàn)略資源和要素缺乏自主權(quán)和主導(dǎo)權(quán)。把“論文發(fā)表在祖國的大地上”是保障國家科技安全的重要舉措,而國家高端交流平臺正是這一舉措的物質(zhì)基礎(chǔ),幫助科學(xué)家能夠把自己的科技成果、聰明才智在祖國的大地上發(fā)芽生根,造福中國的科技創(chuàng)新事業(yè)。因此,面向國家科技安全是構(gòu)建國家高端交流平臺的首要定位和任務(wù),把科學(xué)研究成果發(fā)表或發(fā)布在祖國的科技創(chuàng)新平臺上是國家科技自立、自強的重要保障。當前國際上的霸權(quán)主義、保護主義、單邊主義正在抬頭,發(fā)達國家都在千方百計地筑強自己的科技優(yōu)勢,并采取各種手段打壓競爭對手,因此,堅持把科技自立自強作為國家發(fā)展的戰(zhàn)略支撐是立足當前錯綜復(fù)雜的國際形勢、著眼中華民族偉大復(fù)興的戰(zhàn)略布局,而國家高端交流平臺正是這一戰(zhàn)略支撐的重要組成部分,這一點必須要有清醒的認識。
高端交流平臺中的“高端”一詞本身就體現(xiàn)了對平臺的定位要求,高端交流平臺應(yīng)該是面向國家重大戰(zhàn)略需求的創(chuàng)新平臺,也是解決中國重大問題和卡脖子技術(shù)難題的平臺。面向國家重大需求,就是指高端交流平臺要為面向需求導(dǎo)向和問題導(dǎo)向的科技創(chuàng)新提供服務(wù)和支撐[2],對當前我國經(jīng)濟社會發(fā)展、國防建設(shè)、人民健康等重點領(lǐng)域中的基礎(chǔ)研究、關(guān)鍵技術(shù)、重要裝備進行重點研究和攻關(guān)。過去在我國科技創(chuàng)新中存在“種了別人的田、荒了自家的地”現(xiàn)象,將西方設(shè)定的研究方向奉為圭臬,視為自己的方向、研究領(lǐng)域和研究問題,緊跟與照搬“國際前沿”,而對我國有重大需求的研究方向和技術(shù)領(lǐng)域關(guān)注不夠。近年來,隨著我國科技實力和科技自信的增強,必然要從跟隨西方研究的創(chuàng)新大國向引領(lǐng)全球科技的創(chuàng)新強國邁進,這一轉(zhuǎn)變的起始就是要面向國家重大需求、面向國家經(jīng)濟主戰(zhàn)場,而高端交流平臺就是面向國家重大需求、引領(lǐng)全球創(chuàng)新的重要抓手。例如,可以借助高端交流平臺設(shè)立我國重大需求和全球重大挑戰(zhàn)的研究方向(如Covid-19疫苗的研發(fā)、國際空間合作、高端芯片制造技術(shù)),吸引各國優(yōu)秀科學(xué)家、聚集全球科研資源、充分發(fā)揮群體智慧,從而集中解決我國迫切需要解決的重大科學(xué)技術(shù)問題。一方面通過高端交流平臺提供的機制和載體,以新的研究領(lǐng)域和方向吸引和聚集世界科研工作者,可以使我國掌握相關(guān)領(lǐng)域的主導(dǎo)權(quán)和話語權(quán),解決我國的重大需求和關(guān)鍵技術(shù)問題;另一方面,借助高端交流平臺為各國科學(xué)家提供研究的載體(如科學(xué)計算平臺、科學(xué)數(shù)據(jù)平臺、科學(xué)交流平臺),以充分調(diào)動和利用各國的科研力量和創(chuàng)新資源,為我所用,從根本上轉(zhuǎn)變中國在全球科技創(chuàng)新鏈中的地位,從以往全球科技創(chuàng)新的“打工人”轉(zhuǎn)變?yōu)槿蚩萍紕?chuàng)新的“主人”。在這方面,美國ENIGMA平臺提供了可借鑒的經(jīng)驗,ENIGMA是迄今為止全球最大規(guī)模的大腦研究創(chuàng)新平臺,由南加州大學(xué)凱克醫(yī)學(xué)院創(chuàng)立[3],借助該平臺形成了由40個國家和地區(qū)的1,400名科學(xué)家組成的全球性研究組織,匯聚了全球最大規(guī)模的研究數(shù)據(jù)和研究成果,這些數(shù)據(jù)和成果可用于阿爾茨海默氏病、自閉癥和其他神經(jīng)系統(tǒng)疾病的靶向療法和干預(yù)措施等腦科學(xué)和神經(jīng)科學(xué)的重大研究問題。通過ENIGMA平臺的建設(shè),美國以及美國的研究機構(gòu)在腦科學(xué)領(lǐng)域處于全球領(lǐng)導(dǎo)地位,主導(dǎo)了全球腦科學(xué)的研究方向,平臺還充分利用了全球腦科學(xué)研究的力量,其研究實力和能力超越了任何國家或研究機構(gòu)。因此,面向國家重大需求,面向全球重大挑戰(zhàn),通過高端交流平臺可以使中國成為未來全球科技創(chuàng)新的策源地。
高端交流平臺作為科學(xué)研究和技術(shù)創(chuàng)新的載體和生態(tài),必然要緊跟時代步伐,適應(yīng)新時代的科學(xué)研究和技術(shù)創(chuàng)新的范式變化。范式是開展科學(xué)研究、構(gòu)建科學(xué)體系、從事技術(shù)創(chuàng)新過程中被廣泛接受的方法體系、理論框架。隨著科學(xué)的不斷進步和人類認知能力的提升,科學(xué)范式也在不斷演進。全球科學(xué)范式、創(chuàng)新范式在數(shù)字化技術(shù)的影響下產(chǎn)生了深刻的變革,正在重塑科學(xué)技術(shù)研究和創(chuàng)新的所有階段,包括從議程設(shè)置到實驗、知識、技術(shù)的創(chuàng)新與共享、研究成果的落地與應(yīng)用等諸多方面[4]。從技術(shù)角度看,以數(shù)據(jù)挖掘和機器學(xué)習(xí)為代表的人工智能技術(shù)的發(fā)展催生了數(shù)據(jù)科學(xué),為科學(xué)家?guī)砹藦姶蟮臄?shù)據(jù)驅(qū)動發(fā)現(xiàn)能力[5],以科學(xué)大數(shù)據(jù)為代表的第四范式正在不斷完善,并成為當前科學(xué)創(chuàng)新的重要范式?!犊茖W(xué)》雜志發(fā)文指出“人工智能改變了科學(xué)”,人工智能在科學(xué)研究和科學(xué)發(fā)現(xiàn)領(lǐng)域的應(yīng)用引發(fā)了科研活動的顛覆性變革,這就要求高端交流平臺的構(gòu)建要能夠適應(yīng)新的技術(shù)發(fā)展趨勢,使大數(shù)據(jù)技術(shù)、人工智能技術(shù)能夠無縫嵌入到科學(xué)研究工作中,成為科學(xué)家的助手和合作伙伴[6]。從科技創(chuàng)新主體看,隨著人們對研究對象的不斷深入,無論是在基礎(chǔ)研究領(lǐng)域還是在科技攻關(guān)領(lǐng)域,越來越多的問題解決,難以靠個人力量來實現(xiàn),而是比以往任何時候都更加需要全球各地的科研機構(gòu)、研究團隊和科學(xué)家精誠合作,甚至是全民參與,組成大型的科研團隊。目前全世界組織科研團隊的方式多種多樣,建立學(xué)術(shù)交流平臺是一種有效的方法,這就需要高端交流平臺立足全新的科研合作范式,為全球科學(xué)家提供方便接入、便捷協(xié)作、組織科學(xué)的協(xié)作與交流支撐。例如,歐盟的EU-Citizen.Science平臺通過提供工具、知識、培訓(xùn)等相關(guān)資源為歐盟的科學(xué)家、科學(xué)愛好者、自愿者提供了一個低門檻的科學(xué)研究的協(xié)作平臺[7]。從科技創(chuàng)新成果的發(fā)表或發(fā)布的形式看,以往的科研成果大都是以論文的形式進行發(fā)布,研究成果的可重現(xiàn)性較差,難以被其他科學(xué)家進行驗證或重用。《自然》雜志的調(diào)查表明,有60%的受訪者認為很難重復(fù)其他科學(xué)家的實驗[8]。近年來,隨著數(shù)字化技術(shù)、網(wǎng)絡(luò)化技術(shù)等信息技術(shù)發(fā)展,科研成果的發(fā)表形式不僅僅局限于文本形式的論文,還包括科學(xué)數(shù)據(jù)、科學(xué)計算的軟件代碼、科學(xué)實驗的電子筆記等,成果的形式正朝著機器可理解、結(jié)果可重現(xiàn)、過程可計算的方向發(fā)展,這就為科學(xué)研究成果的驗證提供了基礎(chǔ)。例如,由美國南加州大學(xué)信息科學(xué)研究所、計算機系、醫(yī)學(xué)院聯(lián)合開發(fā)的Automated Discovery of Scientific Knowledge(DISK)系統(tǒng)能夠自動讀取、理解并發(fā)現(xiàn)科學(xué)論文中提出的假設(shè),并利用隨論文提交的數(shù)據(jù)對假設(shè)進行驗證,還能隨著新研究成果的出現(xiàn)對以前的假設(shè)進行更新[9]。所有這些都對高端平臺提出了新的要求,要求高端平臺能夠適應(yīng)科學(xué)研究范式變化所帶來的科研新特征,為提高我國的科技創(chuàng)新效率、加強科技交流的強度、提升科技創(chuàng)新的質(zhì)量貢獻自己的力量。
從以上定位來看,高端交流平臺是一個具有中國特色的、能夠充分發(fā)揮科技人員聰明才智的、更加適合中國科技創(chuàng)新戰(zhàn)略需要的全新平臺。因此,構(gòu)建高端交流平臺一定要避免“邯鄲學(xué)步”式的復(fù)制和照搬西方科技創(chuàng)新體系和平臺,而是要基于中國國家科技戰(zhàn)略發(fā)展的根本需要以及對全球科技創(chuàng)新態(tài)勢的正確認知。筆者從開放、融合、計算三個維度闡釋高端交流平臺的核心特征。
開放、開源是新時期全球科技創(chuàng)新的新趨勢,開放可以使研究過程更加透明,幫助科學(xué)家將自己的研究成果快速地在全球進行驗證、重用、落地和應(yīng)用,同時開放改變了科學(xué)研究過程中原有的合作交流方式,加速了科學(xué)創(chuàng)新的步伐。從國家科技戰(zhàn)略角度看,需要深刻理解科學(xué)開放背后的戰(zhàn)略意圖。開放在本質(zhì)上有兩個方面的戰(zhàn)略功能。
首先,開放可以增強本國在全球科技創(chuàng)新中的話語權(quán)和控制力,但開放的前提條件是要有一套大家都必須遵守的規(guī)范和標準,這是開放的基礎(chǔ)。例如,全球研究者和貢獻者持久數(shù)字標識符ORCID.ORG平臺為個人從事研究和創(chuàng)新活動時提供了唯一、持久的標識符,目前已成為全球出版商和研究人員認可的身份標識。規(guī)范、標準以及開放的平臺勢必有意或無意地被嵌入開放規(guī)范和標準發(fā)起國的國家意志和意識形態(tài),是發(fā)起國科技主權(quán)或是科技霸權(quán)的一種延伸,此種延伸在大多數(shù)情況下是非常隱蔽的,但在必要時會受到發(fā)起國的相關(guān)法律和政策的管制。特別是在全球科技博弈的背景下,西方國家大力推進在全球開放科學(xué)中的戰(zhàn)略布局,并在全球范圍內(nèi)推廣自己國家或地區(qū)的開放科學(xué)標準和規(guī)范,以期能夠形成全球的規(guī)范和標準來加強本國在全球科技創(chuàng)新鏈中的地位和領(lǐng)導(dǎo)權(quán)。通過構(gòu)筑全球開放的話語權(quán)和控制力,可以幫助本國形成有影響力的創(chuàng)新協(xié)作網(wǎng)絡(luò),從而能夠更好地服務(wù)于本國的科技創(chuàng)新,以更低的成本充分地獲取和享有全球研究人員貢獻的先進的研究成果和創(chuàng)新的科學(xué)知識,解決重大的基礎(chǔ)性科學(xué)研究課題或其他重大挑戰(zhàn)。
其次,開放可以促進全球創(chuàng)新的信息、知識、理論的雙向流動、交互與融合,可以促進全球范圍內(nèi)新的科學(xué)發(fā)現(xiàn)和知識創(chuàng)新。開放可以幫助本國更好地融入全球已有的創(chuàng)新生態(tài)和創(chuàng)新網(wǎng)絡(luò),向全世界貢獻本國科學(xué)家的智慧。例如,5G技術(shù)、Covid-19疫苗、空間技術(shù)等能夠幫助全球特別是“一帶一路”國家、第三世界國家、不發(fā)達國家共享中國科技進步成果,通過這種主動的開放引領(lǐng)全球科技創(chuàng)新的方向,提升我國在全球的軟實力和影響力。
由此,高端交流平臺應(yīng)該具有開放性,能夠與外部的世界進行能量(如信息、知識、智慧)交換。但高端交流平臺不能為了開放而開放,為了融入全球創(chuàng)新生態(tài)而被動開放,開放是建立在國家的科技主權(quán)和科學(xué)安全基礎(chǔ)之上的開放,要從以往單向、被動、不對等的開放轉(zhuǎn)向雙向、主動、對等的開放。
第一,高端交流平臺要立足中國,積極主動地主導(dǎo)面向全球科技創(chuàng)新的開放的規(guī)范、標準的制定,開放規(guī)范和標準不能僅局限于國內(nèi),還要服務(wù)于全球,推動其成為國際通用的標準和規(guī)范,這是高端平臺開放的一個重要目標。對于國際上已有的開放標準和規(guī)范,高端交流平臺要建立由中國主導(dǎo)的、多國參與的、與國際平行的標準和規(guī)范,能夠?qū)崿F(xiàn)國際、國內(nèi)標準和規(guī)范的雙向映射和轉(zhuǎn)換,能夠通過云服務(wù)為全球的研究機構(gòu)、研究人員、出版商等提供便捷智能的映射和轉(zhuǎn)換服務(wù)。高端交流平臺要構(gòu)筑全球多極、多邊、平等的科學(xué)開放體系,這包括中國與西方國家、中國與亞洲國家、中國與“一帶一路”國家開放、共享的多邊關(guān)系,對創(chuàng)新要素,如論文、科學(xué)數(shù)據(jù)、代碼要基于對等的原則進行開放、交換和共享,從而保證高端交流平臺既能融入全球開放平臺,又具有足夠多的自主權(quán)。
第二,高端交流平臺要構(gòu)建服務(wù)于全球科學(xué)家的云開放平臺,要能夠覆蓋科學(xué)發(fā)現(xiàn)、知識創(chuàng)新的全生命周期;面向不同科學(xué)領(lǐng)域,將核心的科技創(chuàng)新戰(zhàn)略資源掌握在自己手中,這類戰(zhàn)略資源包括但不限于論文、書籍、軟件、科學(xué)數(shù)據(jù)、實驗過程、學(xué)者信息等。
第三,高端交流平臺在開放的過程中要“有所為,有所不為”,不是所有的科技創(chuàng)新要素、資源都要對外開放,特別是涉及生物技術(shù)、半導(dǎo)體技術(shù)、量子計算等對國家經(jīng)濟和國家安全最利害攸關(guān)的領(lǐng)域要分級、分類開放,在向世界貢獻中國智慧的同時也要保護好本國核心的研究成果、信息、數(shù)據(jù)不外泄。例如,美國通過《學(xué)術(shù)研究保護法》《出口管理條例》等法律法規(guī)對科學(xué)開放的領(lǐng)域、開放的國家、開放的級別等作出了非常詳細的規(guī)定,并在實踐中指導(dǎo)美國的各類科研平臺的開放活動。
科技創(chuàng)新是科學(xué)家在前人不斷摸索積累下,站在巨人肩膀上的產(chǎn)物[10]。人類的科技進步在最近一百年的成就已經(jīng)超過過去兩三千年成就的總和,這主要歸功于基于前人的研究基礎(chǔ),才使我們能夠取得更多的科技進步,其中科學(xué)知識的融合功不可沒。應(yīng)正確理解成果發(fā)布、知識融合與科技創(chuàng)新之間的關(guān)系,它們存在一種鏈式的傳導(dǎo)機制,即“發(fā)布→融合→創(chuàng)新”??茖W(xué)研究成果具有公共屬性。美國著名科學(xué)社會學(xué)家默頓指出科學(xué)的實質(zhì)性發(fā)現(xiàn)屬于整個社會[11],研究成果的發(fā)布保證了創(chuàng)新知識的快速傳播與使用[12],這是知識融合的前提,也是科學(xué)交流的重要手段。只有將科學(xué)思想、理論、知識等成果通過論文、著作、數(shù)據(jù)、代碼等形式向公眾發(fā)布出來,才能通過融合來推動知識的創(chuàng)新和科學(xué)的發(fā)現(xiàn),融合是促進科學(xué)創(chuàng)新非常重要的步驟[6],這是科技創(chuàng)新的本質(zhì)。以往科學(xué)成果和知識主要依靠于科學(xué)家通過頻繁的學(xué)術(shù)交流、大量的文獻閱讀、長期的知識積累在大腦中實現(xiàn)融合,這是一種內(nèi)化的、隱性的融合[13]。隨著科學(xué)研究越來越復(fù)雜,人類在認知方面的局限性和缺點越來越突出[14]。近年來,隨著知識計算、人工智能技術(shù)的進步,基于機器智能的知識融合為這項工作鋪平了道路,使科學(xué)家能夠通過機器輔助的方法迅速獲得科學(xué)新突破,基于機器智能的知識融合可以幫助科學(xué)家從海量的科學(xué)文獻中發(fā)現(xiàn)、融合有價值的知識、理論和思想,從而推動重大科學(xué)發(fā)現(xiàn)和創(chuàng)新。例如,當前美國在社會科學(xué)、醫(yī)學(xué)、工程與自然科學(xué)等領(lǐng)域已經(jīng)具備了很強的融合能力[15],能夠快速地發(fā)現(xiàn)、吸收、融合全球最先進的思想、理論、觀點、模型、知識,形成了一個多學(xué)科交叉、面向全球、分布式的“科研大腦”,極大地提升了美國在科學(xué)創(chuàng)新方面的效率和質(zhì)量,這一能力是美國稱霸全球科技的核心能力。
從我國“十四五”科技創(chuàng)新的新態(tài)勢和新需求來看,第四次工業(yè)革命加速演進,是以新一代信息技術(shù)、生物技術(shù)、新能源技術(shù)、新材料技術(shù)等領(lǐng)域的重大創(chuàng)新與交叉融合為核心驅(qū)動力的[16],這就要求高端交流平臺能夠構(gòu)建起推動科學(xué)創(chuàng)新的跨學(xué)科、高水平、全方位、深層次的科學(xué)融合體系,這是國家科技創(chuàng)新體系在大科學(xué)時代、大數(shù)據(jù)時代應(yīng)具備的一項重要特性。
首先,在高端交流平臺能力建設(shè)方面,融合的水平至少應(yīng)與成果發(fā)布的水平相匹配,甚至是更強大。如果將發(fā)布水平比作一個國家創(chuàng)新體系的“冰山一角”,那么融合就是水面之下隱藏的“冰山”,發(fā)布的程度、發(fā)布的內(nèi)容、發(fā)布的范圍應(yīng)與融合的程度、融合的內(nèi)容、融合的范圍相匹配,在構(gòu)建高端交流平臺時要未雨綢繆地同步謀劃發(fā)布與融合。例如,對全球發(fā)布科技論文的同時,高端交流平臺也要具備實時融合全球科技論文的能力,以及解決如何在技術(shù)、系統(tǒng)、平臺層面支持融合等問題。
其次,在微觀層面,高端交流平臺的融合體系應(yīng)通過開發(fā)融合算法、融合模型、融合系統(tǒng)實現(xiàn)不同粒度的科學(xué)創(chuàng)新要素的自動融合、智能融合,融合的要素包括科學(xué)論文、科學(xué)大數(shù)據(jù)、科學(xué)知識、科技情報、科學(xué)代碼,通過不同粒度的融合推動科學(xué)研究中的模型、方法、知識創(chuàng)新。例如,美國哈佛醫(yī)學(xué)院的EMMMA(Ecosystem of Machine- maintained modelswith Automated Analysis)平臺[17]就是一個先進的融合全球生物醫(yī)學(xué)模型的平臺,它能夠不間斷地用機器自動閱讀醫(yī)學(xué)文獻和醫(yī)學(xué)數(shù)據(jù),對其中的知識進行自動化的提取、融合并生成醫(yī)學(xué)模型,從而發(fā)現(xiàn)生物醫(yī)學(xué)文獻和數(shù)據(jù)中所蘊含的復(fù)雜機制,用于新藥物的研發(fā)或?qū)o法解釋的臨床現(xiàn)象進行機理上的解釋。
總之,高端交流平臺不僅僅是科技信息和科技論文的服務(wù)和服務(wù)系統(tǒng),它還應(yīng)該定位成從科學(xué)數(shù)據(jù)、科學(xué)知識到科學(xué)理論、科學(xué)思想的立體融合網(wǎng)絡(luò)和融合系統(tǒng),通過融合實現(xiàn)科學(xué)知識和智慧的涌現(xiàn),推動我國科技創(chuàng)新從點創(chuàng)新轉(zhuǎn)向面創(chuàng)新,從小微創(chuàng)新轉(zhuǎn)向重大創(chuàng)新、從低質(zhì)量創(chuàng)新轉(zhuǎn)向高質(zhì)量創(chuàng)新的跨越式發(fā)展。
一般意義上的計算是指通過遵循良好定義模型的算術(shù)或非算術(shù)步驟,借助計算設(shè)備將輸入轉(zhuǎn)變?yōu)檩敵鼋Y(jié)果的過程。在情報學(xué)領(lǐng)域中,計算泛指情報計算,是指利用情報計算模型、情報分析算法、情報計算框架,通過計算的方式解決科技信息服務(wù)、科學(xué)發(fā)現(xiàn)、知識創(chuàng)新中與知識、情報獲取、組織、分析、開發(fā)與利用相關(guān)的問題,使這些問題的解決模型化、形式化、自動化。計算在科學(xué)創(chuàng)新、科技情報工作中一直發(fā)揮著重要的作用。在人工智能大數(shù)據(jù)時代,新興的軟件技術(shù)、分析方法、建模技術(shù)以及智能算法為計算賦予了更大的能力。計算對科技創(chuàng)新的影響是顛覆性的,2021年Google公司借助128個TPU組成的深度計算設(shè)施解決了生物領(lǐng)域50年以來懸而未決的蛋白質(zhì)結(jié)構(gòu)預(yù)測問題,推動生物科學(xué)邁出了前進的一大步[18]。因此,計算將改寫和加速人類科學(xué)進程,計算背后的邏輯是科技創(chuàng)新將從以往人的智力驅(qū)動為主轉(zhuǎn)向計算力驅(qū)動為主,計算正成為未來科技創(chuàng)新、情報智慧服務(wù)最為核心和重要的能力。如同機器運轉(zhuǎn)需要電力驅(qū)動一樣,未來的科學(xué)發(fā)現(xiàn)、知識創(chuàng)新更離不開計算的驅(qū)動,計算賦能的智能機器將成為科學(xué)創(chuàng)新的主角。2020年美國與英國、日本等多國科學(xué)家在英國圖靈研究院聯(lián)合召開人工智能科學(xué)家大挑戰(zhàn)會議[19],提出了2050AI科學(xué)家計劃[20],旨在2050年之前通過多學(xué)科、多團隊聯(lián)合開發(fā)出能夠沖擊諾貝爾獎的人工智能科學(xué)家。這意味著智能機器自主從事科學(xué)發(fā)現(xiàn)將不再是天方夜譚,未來全球科技競爭將不僅僅局限于高水平科技人才,還將是綜合性、多學(xué)科、智慧化的情報計算實力的比拼,計算將會對科技創(chuàng)新的速度、強度、質(zhì)量帶來指數(shù)級的提升。
從國內(nèi)現(xiàn)狀來看,由于起步較晚,我國科技情報學(xué)者對情報計算、科學(xué)計算領(lǐng)域關(guān)注度不夠,特別是情報計算的關(guān)鍵算法、建模技術(shù)、核心軟件平臺等方面還存在許多卡脖子的難題,與歐美發(fā)達國家相比存在較大的差距,尚未形成自主可控的情報計算體系。應(yīng)該通過高端交流平臺的建設(shè),彌補這方面的短板,并后來居上。
首先,在情報計算平臺框架方面,高端交流平臺要加強、加快構(gòu)建自主可控的情報計算體系,特別是要加強可配置、自動化、面向科技情報的計算框架和系統(tǒng)的研發(fā)。情報計算體系有別于一般意義上的、通用的計算體系,其主要功能是屏蔽底層計算基礎(chǔ)設(shè)施的復(fù)雜性,解決科技情報分析、科技情報服務(wù)、科學(xué)發(fā)現(xiàn)和知識創(chuàng)新等情報業(yè)務(wù)中的計算問題,能夠根據(jù)情報內(nèi)容及應(yīng)用的不同學(xué)科、領(lǐng)域、場景快速組配個性化的情報分析流水線、情報計算平臺或系統(tǒng),形成面向不同類型科技情報服務(wù)的計算能力。例如,美國DARPA早在2010年就通過XDATA情報計算框架項目,在通用開源軟件的基礎(chǔ)之上研發(fā)了大批面向情報計算的工具、組件和開源軟件,形成了完整的情報計算體系,不同的科技情報機構(gòu)可以根據(jù)自身情報業(yè)務(wù)需求在此基礎(chǔ)之上快速搭建個性化的科技情報平臺。
其次,高端交流平臺要構(gòu)建分布式智能化、可復(fù)用、可共享的情報計算、情報分析的模型庫和算法庫。情報分析方法和經(jīng)驗是科技情報研究人員長期在科技情報研究和工作中積累的最佳實踐,是一種隱性知識,要將成熟的、共性的情報分析的方法、經(jīng)驗、知識通過抽象、集成、封包等建模方法將其轉(zhuǎn)化成可表征的、可計算的情報模型和情報算法。通過高端交流平臺的模型庫、算法庫實現(xiàn)最大程度的重用,從而實現(xiàn)規(guī)?;目萍记閳蠓治龊涂萍记閳蠓?wù)。
最后,高端交流平臺要加強知識計算、因果推理、自動建模、自動分析技術(shù)的研究,構(gòu)建人機協(xié)同的科技情報自動建模和自動分析平臺,在微觀層面能夠從大量的科技文獻、科技數(shù)據(jù)中進行自動閱讀和學(xué)習(xí)人類知識,能夠根據(jù)不同來源的知識構(gòu)建科學(xué)模型,實現(xiàn)自主知識創(chuàng)新和科學(xué)發(fā)現(xiàn)。例如,由亞利桑那州大學(xué)研發(fā)的Auto Mates系統(tǒng)[21]能夠從公開、多源的研究成果中(科學(xué)文獻,技術(shù)文檔、軟件代碼)進行自動的學(xué)習(xí),將不同的研究成果自動抽象轉(zhuǎn)化為可計算的科學(xué)模型,用以幫助科學(xué)家研究影響因素眾多的復(fù)雜科學(xué)問題。
在全球科技博弈日趨激烈、第四次工業(yè)革命加速演進的背景之下,國家高端交流平臺的構(gòu)建為科技情報界帶來了前所未有的發(fā)展機遇,這將是情報科學(xué)研究面向國家重大需求的重要實踐,為我國情報科學(xué)的創(chuàng)新與發(fā)展注入了新的動力。對國家高端交流平臺的認識和構(gòu)建并非一朝一夕所能夠完成的,而是一個不斷迭代和螺旋上升的過程。這就要求科技情報學(xué)者不斷對國家高端交流平臺開展研究,加深認識,唯有在不斷認識中變革,在不斷認識中顛覆,才能通過國家高端交流平臺的構(gòu)建引領(lǐng)中國科技情報事業(yè)不斷前行。