周園春,陳昕
專家視角
建立科學數據基礎制度,激發(fā)科學數據創(chuàng)新活力——兼論“數據二十條”與國家數據局成立
周園春,陳昕*
中國科學院計算機網絡信息中心,北京 100083
數據作為新型生產要素,是加快構建發(fā)展新格局的重要資源。數據基礎制度的建設事關國家發(fā)展大局,自黨的十九屆四中全會提出數據要素以來,得到了黨和國家的高度重視。2022年12月19日,中共中央、國務院印發(fā)《關于構建數據基礎制度更好發(fā)揮數據要素作用的意見》(以下簡稱《數據二十條》),從數據產權、流通交易、收益分配、安全治理等方面對數據基礎制度的構建提出了方案,對我國數據基礎制度的建立具有重大意義。2023年3月10日,國家數據局成立,標志著數據基礎制度建設的頂層組織框架基本成型,數據要素市場將進一步完善并進入提速發(fā)展新階段。
科學數據已經成為科學研究創(chuàng)新和社會經濟發(fā)展的戰(zhàn)略性、基礎性資源,必將成為數據要素的重要組成??茖W數據是科學研究的重要驅動力,具有其特色的生命周期及應用場景,除支撐科學研究外,也是支撐國民經濟發(fā)展和跨行業(yè)協同創(chuàng)新的重要要素。科學研究是實現國家創(chuàng)新發(fā)展的重要動力,也是落實和實踐數據基礎制度及數據要素化流通的重要領域??茖W研究的開放性,使得科學數據在國際合作等方面具有其先行先試優(yōu)勢。科學研究的創(chuàng)新性也將為新型生產關系等的實現,提供創(chuàng)新技術手段。
數據產權因其復雜性、動態(tài)性、多主體等問題,一直是數據產權制度亟待解決的基礎性問題。《數據二十條》提出了“三權分置”的數據產權制度框架,以促進流通為核心,兼顧多主體利益,并通過產權登記等新方式,構建新型的數據產權體系?!叭龣喾种谩钡奶岢觯矠榭茖W數據確權問題提出了解決方案,相應的,也對科學數據治理的相關環(huán)節(jié)提出了新的要求。
數據要素要流通、要交易,明確數據產權是基礎問題。然而,數據是無形資產,具有非消耗性的特點,其生產、流通、使用過程涉及多方主體,數據所有權難以界定?!稊祿畻l》借鑒了土地等其他生產要素的產權管理方式,提出“建立數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制”,直接面向數據流通,強化數據的加工、使用,鼓勵“數據產品經營”,為實體經濟賦能,在解決數據產權基礎性問題的基礎上,也具有明確的引導性。
科學數據的價值實現一般以聚合、整編、加工以及共享為前提。按照《數據二十條》的政策指引,弱化同樣復雜和困難的科學數據產權問題,而是率先明確對于科學數據流通和賦能更為重要的持有權、加工使用權和產品經營權,使得使用權可以在要素市場中流通,將有效盤活科學數據的流通和共享生態(tài),進而促進科學研究的創(chuàng)新發(fā)展。
《數據二十條》提出了多元主體產權配置結構,應“建立公共數據、企業(yè)數據、個人數據的分類分級確權授權制度”。在強化公共數據匯聚共享和開放開發(fā)的基礎上,也指出公共數據的使用在保護數據安全的基礎上,可包括“有條件無償使用”和“有條件有償使用”,這些政策對科學數據的管理和開放共享具有重要的引導作用。
科學數據多源自政府資金支持的項目和科學裝置,很多科學數據中心等平臺也因政府經費支持建設而具有公共服務平臺的屬性,因此,多數科學數據應屬于公共數據范疇。傳統(tǒng)上,科學數據共享以無償服務為主,《數據二十條》中提出的“有條件有償使用”等原則,為科學數據的開放流通和進一步賦能實體經濟等提出了更多的可能性。特別是,科學數據同行業(yè)領域關系密切,近年來來源日趨多樣,分類分級的授權機制有利于多類主體間的協作。
《數據二十條》同時提出要“審慎對待原始數據的流轉交易行為”,“原始數據不出域、數據可用不可見”等要求,對科學數據的服務模式和加工能力等設置了新規(guī)制。基于原始數據的數據產品加工,既是對數據價值的再發(fā)掘,也是對原始數據的安全保護。數據、模型、計算等資源相結合,有利于產生更符合領域和學科需要的科學數據服務。特別是,隨著新技術的發(fā)展,可探索新型科學數據服務模式,在保障科學數據安全和個人隱私的基礎上,提升科學數據服務水平,保障科學數據安全。
《數據二十條》提到“研究數據產權登記新方式”,從登記內容、登記手段、協同機制等方面都需要探索和創(chuàng)新,以解決數據要素組織形式多樣、可能被多次登記等問題,并同數據流通和數據市場相協同,將數據產權登記作為數據要素基礎服務。
科學數據往往也存在多種組織形式和加工程度。就數據粒度而言,有數據項、數據文件、數據集、數據庫等;就數據加工程度而言,包括原始數據、數據產品等,其中數據產品還可根據處理方法和加工程度等,被劃分為不同的產品等級,不同的學科領域也存在不同的劃分方式。開展科學數據產權登記,需要充分考慮科學數據的基本特征和學科特色,在國家統(tǒng)籌的數據資產登記的基礎上,在登記內容規(guī)范、登記模式、技術支持等方面做出適應性的擴展和補充。特別是在當前國家相關政策、平臺等尚未全面實施階段,應提前在科學數據管理相關環(huán)節(jié)對科學數據各環(huán)節(jié)的貢獻和處理等進行記錄,例如在數據出版等過程中體現數據來源、數據作者、共享范圍、許可協議等信息,確保數據來源可確認、三類權屬可界定、流通過程可追溯。
資產價值評估通常有多種方式。如果將數據要素作為生產投入來看,其價值評估主要從成本視角計價,包括采集成本、加工成本、流通成本等,對數據產品的質量控制等都是成本投入?!稊祿畻l》提出由數據要素市場來評價要素價值,從“有什么,提供什么”向需求牽引、市場化配置轉變,要素價值由市場評價,有助于激發(fā)數據提供方積極性,優(yōu)化數據生產加工模式和數據質量。
這種市場化資源配置和價值評價的機制,或將成為提升科學數據質量、優(yōu)化科學數據服務的重要手段。首先,數據質量提升和質量控制不再只是成本的增加,也將提升數據的使用價值和市場價值。當質量相關投入會帶來更高收益時,相關數據處理者將更愿意關注數據質量問題。其次,由于科學數據自身體量較大、結構復雜、形式多樣,其質量影響因素涉及科學數據生命周期的各個環(huán)節(jié),科學數據質量評價一直是一個難題,要素市場價值評價可成為科學數據質量體現的重要方面。此外,新的評價機制也會使科學數據質量管理的關注重點發(fā)生變化,從準確性、完整性、客觀性等科學數據內容質量要素向可訪問性、可信度、需求響應度等科學數據效用要素轉變。
《數據二十條》重點關注數據要素市場的高質量發(fā)展,強化流通和價值實現。在不同領域,流通市場和價值實現方式,也會存在一定差異。具體到科學研究領域,科學數據的主要流通場景還是在科學研究鏈條中,在此基礎上,適度延展至國民經濟發(fā)展的其他領域;科研人員作為科學數據的主要處理者,其關注的價值回報,除經濟價值外,也非常關注學術影響力和學術評價。對于科學數據的價值評價,應充分考慮科學數據學術價值的體現。一方面,應進一步推動數據論文、數據出版、數據引用等科學數據學術價值呈現方式的實踐與推廣;另一方面,應將科學數據形成的相關學術價值納入科技評價體系,按學術成果及影響評價貢獻,按照各環(huán)節(jié)參與情況,分配各環(huán)節(jié)參與主體的貢獻和評價收益。
數據要素收益分配,按照“誰投入、誰貢獻、誰受益”原則。以政府資金資助產生的公共數據需要充分考慮公益性和社會貢獻。而科學研究以認識世界、探索世界、改造世界為目的,本身就具有一定的公益性。科學數據作為科學研究的重要產出之一,在《科學數據管理辦法》中已提出,政府預算資金資助形成的科學數據,應以開放為常態(tài)、不開放為例外。在科學數據流通和收益分配過程中,既要尊重相關各類主體的貢獻,但也務必不能忽視其自身的公益屬性和社會屬性。
《數據二十條》兼顧安全與發(fā)展,在強調數據流通安全合規(guī)的同時,重視新模式、新方法的探索。在安全合規(guī)方面,不僅有專門的章節(jié)闡述安全治理制度,更是將分類分級、個人信息保護等貫穿全文;提出了行業(yè)監(jiān)管、第三方服務等合規(guī)治理手段。在創(chuàng)新方面,全文有30處提到了“新”,新型生產關系、跨境流動與合作的新途徑新模式、數據產權登記新方式、創(chuàng)新技術手段等等。不管是數據流通還是安全治理,都離不開新技術、新方法以及相關基礎設施的支持??茖W數據作為開放性較強的一類數據要素,在率先落實《數據二十條》的同時,在協同創(chuàng)新、可信流通、安全治理等技術創(chuàng)新方面也具有很大的潛力。
《中華人民共和國數據安全法》頒布以來,數據安全得到了高度重視?!稊祿畻l》進一步強調了應把安全貫穿數據治理全過程,不僅強化了政府、企業(yè)等主體的安全責任,還提出了多方參與的協同治理作用。在數據流通監(jiān)管方面,也提出了應完善數據全流程合規(guī)與監(jiān)管規(guī)則體系,培育第三方服務機構等。既強調監(jiān)管、監(jiān)測等公共服務的建設,也強調了行業(yè)協會、數據業(yè)務專業(yè)機構、新型科研服務機構等在數據合規(guī)評估等方面的重要作用。
科學數據管理與開放共享已具有一定的工作基礎,但更多的關注領域科學數據的處理和服務,面向科學數據治理和流通的公共服務尚不完善,特別是科學數據安全風險監(jiān)測與應急處置、科學數據溯源、質量評估、數據管理能力認證、數據資產登記等方面的服務能力亟待加強。為此,首先,應該讓科學數據真的“通起來、流起來”,通過科技資源標識、互操作規(guī)范等,促進數據整合互通和互操作。其次,構建合規(guī)公正的保障服務體系,采取可信存證、認證評估、安全監(jiān)測等服務手段,提升數據可用性和可靠性,保障數據安全和用戶權益。再次,構建集約高效的科學數據公共服務和基礎設施,為科學數據流通提供支撐與保障。
《數據二十條》提出的是一套新型的數據基礎制度框架,需要探索新的服務模式和新的技術手段,鼓勵先行先試和試驗探索??茖W數據也需要探索賦能新范式創(chuàng)新的流通模式和創(chuàng)新生態(tài),并為國家數據要素市場建設提供示范和技術支撐。
數據要素流通需要發(fā)展協同創(chuàng)新的流通模式,科學數據的流通也需要相適應的協同創(chuàng)新環(huán)境,使得科學數據“活起來、動起來”,實現不同主體資源的互通、互聯、互認。通過構建面向流通的數據基礎設施,建立可信、透明的科學數據基礎設施環(huán)境和資源網絡,打通科學數據中心等不同主體;加強數據分析能力建設,讓數據活起來;構建跨中心的科學數據工作流管理和調度環(huán)境,在創(chuàng)新環(huán)境里有序流轉,讓數據動起來;真正服務重大科學問題,讓數據用起來。
《數據二十條》提出,支持開展數據流通相關安全技術研發(fā)和服務,促進不同場景下數據要素安全可信流通。安全技術研究一定程度上也屬于科學研究的范疇,和科技創(chuàng)新、科學數據要素治理等也密切相關。應加強區(qū)塊鏈、隱私計算、智能監(jiān)測、安全審計等可信流通與安全治理的關鍵技術攻關,并同相關合規(guī)性要求相融合,為數據要素流通提供技術支持。同時,科學數據要素流通也是安全治理的重要場景,特別是在跨境流通方面,部分開放性較強的領域的科學數據或可作為突破口,在國際標準、研究合作等方面做出示范。
Developing Scientific Data Fundamental Institution for Stimulating Its Innovation Energy: On ‘Data 20 Article’ and Establishment of National Data Bureau
10.19788/j.issn.2096-6369.230105
第一作者周園春,男,研究員,研究方向:科學大數據、大數據分析與挖掘、知識圖譜等;E-mail:zyc@cnic.cn。通信作者陳昕,女,高級工程師,研究方向:大數據管理與分析、知識發(fā)現與關聯數據;E-mail:chx@cnic.cn。
周園春
中國科學院計算機網絡信息中心副主任