王知凡
近日,國務院印發(fā)了《科學數據管理辦法》(以下簡稱為《辦法》),首次從國家層面提出了科學數據管理的指導意見,明確了各類主體的責任分工。
2015年國務院印發(fā)的《促進大數據發(fā)展行動綱要》中明確指出,要積極推動由國家公共財政支持的公益性科研活動獲取和產生的科學數據逐步開放和共享。不久前出臺的《辦法》,秉承了這一指導思想,在科學數據這一領域,做出了更為詳細的規(guī)定。
數據作為一項戰(zhàn)略資源,無論在科研生產還是社會財富的創(chuàng)造上都發(fā)揮著越來越重要的作用。數據價值的挖掘和轉化不僅僅是簡單的開放共享就能實現的。原始數據簡單的存儲和堆砌還不能稱之為數據資源,數據資源是指經過一定加工處理、能夠直接應用于生產生活并產生經濟價值的數據。
例如氣象監(jiān)測數據,如果僅是簡單歷史數據存儲,這些數據就只能發(fā)揮最初步、有限的查詢價值;如果通過這些歷史數據構建預測模型,實現氣象預測,就實現了數據價值的進一步開發(fā),但這些還遠遠不夠。
自從大數據的概念在世界范圍內興起,業(yè)界爭論最多的話題之一就是數據孤島現象極大地制約了數據價值的挖掘。從國內情況來看,各級政府部門、科研機構和商業(yè)機構都積累了大量的原始數據,這些獨立割裂的、未公開的數據往往只應用于某一次統(tǒng)計行為或科研活動,造成了空有“寶山”而無人開發(fā)的現象。
《辦法》的核心內容,就明確指出未來將由各級政府牽頭,建立科學數據中心,主持管理跨領域科學數據的匯交和共享工作。
打通數據壁壘后,跨領域的數據融合所產生的價值遠不止“1+1=2”。還以氣象數據為例,如果加入交通數據、物流數據、居民消費數據等,分析出幾類數據之間的相關性,就可以通過氣象預測推斷出某一地區(qū)居民未來一段時間的出行、商品消耗情況,提前做好交通管理、物流貨運計劃等。數據在這里,不僅本身具備了商業(yè)價值,數據應用后還衍生出了更大的社會、經濟價值。
從原始數據到數據資源的轉化不僅需要大量智慧、人力的付出,也需要經濟成本的付出。從多源數據的調取、數據質量的研判、原始數據結構化加工到數據模型的構建、實驗糾錯等,這個過程復雜而漫長,不是某一方單打獨斗就可以完成的。
《辦法》中規(guī)定,國家各級政府部門負責科學數據的管理,并建設數據共享平臺,鼓勵社會組織和企業(yè)對數據進行挖掘、開展市場化增值服務。
數據資源作為一種資源形式,其價值大小最終也需要市場的檢驗。沒有商業(yè)利益的驅動很難產生契合市場要求的產品,沒有國家的統(tǒng)籌規(guī)劃也無法產生有序的市場。數據資源的價值開發(fā)需要政府和市場兩方力量共同結合,才能事半功倍。數據價值挖掘的最佳路徑是在政府指導和行政支持下,引入社會資本,構建完整的商業(yè)價值鏈。
政府指導和行政支持一是從宏觀上把控方向,保證科學數據的開發(fā)應用符合國計民生的需求,知識產權清晰,不涉及國家秘密和安全、商業(yè)秘密,以及個人隱私;二是跨領域的數據調取和多部門聯動協調工作,保證數據源的供給。
社會資本的引入是指吸收商業(yè)主體參與科學數據產品立項工作并鼓勵其進行投資,一方面可以加快科學數據的開發(fā)轉化進程,形成“遍地開花”局面;另一方面商業(yè)主體往往對市場需求有更強的敏銳性,更加注重投入產出比,可以保證數據產品的效益最大化。
構建科學數據完整的商業(yè)價值鏈包括原始數據的采集、產權的交易、數據價值的進一步挖掘、商業(yè)數據產品的構建及交易、衍生經濟和社會價值回報。只有打通這個鏈條上的各個環(huán)節(jié),才能讓數據價值挖掘和轉化在市場化的驅動下自發(fā)、流暢地運轉起來,也可以在市場需求的導向下,促使原始數據采集質量不斷提高,并為科學研究注入新的活力。
(作者系清研智庫副總經理、大數據研究中心主任)