當前大數(shù)據(jù)應(yīng)用尚處于初級階段,根據(jù)大數(shù)據(jù)分析預(yù)測未來、指導(dǎo)實踐的深層次應(yīng)用將成為發(fā)展重點。
預(yù)計2020年,我國數(shù)據(jù)總量有望占全球數(shù)據(jù)總量的21%,但我國核心技術(shù)薄弱,建議以開源為基礎(chǔ)構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)生態(tài)。
大數(shù)據(jù)應(yīng)用三個層次
按照數(shù)據(jù)開發(fā)應(yīng)用深入程度的不同,可將眾多的大數(shù)據(jù)應(yīng)用分為三個層次。
第一層,描述性分析應(yīng)用,是指從大數(shù)據(jù)中總結(jié)、抽取相關(guān)的信息和知識,幫助人們分析發(fā)生了什么,并呈現(xiàn)事物的發(fā)展歷程。如美國的DOMO公司從其企業(yè)客戶的各個信息系統(tǒng)中抽取、整合數(shù)據(jù),再以統(tǒng)計圖表等可視化形式,將數(shù)據(jù)蘊含的信息推送給不同崗位的業(yè)務(wù)人員和管理者,幫助其更好地了解企業(yè)現(xiàn)狀,進而做出判斷和決策。
第二層,預(yù)測性分析應(yīng)用,是指從大數(shù)據(jù)中分析事物之間的關(guān)聯(lián)關(guān)系、發(fā)展模式等,并據(jù)此對事物發(fā)展的趨勢進行預(yù)測。如微軟公司紐約研究院研究員David Rothschild通過收集和分析賭博市場、好萊塢證券交易所、社交媒體用戶發(fā)布的帖子等大量公開數(shù)據(jù),建立預(yù)測模型,對多屆奧斯卡獎項的歸屬進行預(yù)測。在2014年和2015年,均準確預(yù)測了奧斯卡共24個獎項中的21個,準確率達87.5%。
第三層,指導(dǎo)性分析應(yīng)用,是指在前兩個層次的基礎(chǔ)上,分析不同決策將導(dǎo)致的后果,并對決策進行指導(dǎo)和優(yōu)化。如無人駕駛汽車分析高精度地圖數(shù)據(jù)和海量的激光雷達、攝像頭等傳感器的實時感知數(shù)據(jù),對車輛不同駕駛行為的后果進行預(yù)判,并據(jù)此指導(dǎo)車輛的自動駕駛。
大數(shù)據(jù)應(yīng)用未來發(fā)展方向
當前,在大數(shù)據(jù)應(yīng)用的實踐中,描述性、預(yù)測性分析應(yīng)用多,決策指導(dǎo)性等更深層次分析應(yīng)用偏少。
一般而言,人們做出決策的流程通常包括:認知現(xiàn)狀、預(yù)測未來和選擇策略這三個基本步驟。這些步驟也對應(yīng)了上述大數(shù)據(jù)分析應(yīng)用的三個不同類型。
不同類型的應(yīng)用意味著人類和計算機在決策流程中不同的分工和協(xié)作。例如,第一層次的描述性分析中,計算機僅負責將與現(xiàn)狀相關(guān)的信息和知識展現(xiàn)給人類專家,而對未來態(tài)勢的判斷及對最優(yōu)策略的選擇仍然由人類專家完成。應(yīng)用層次越深,計算機承擔的任務(wù)越多、越復(fù)雜,效率提升也越大,價值也越大。
然而,隨著研究應(yīng)用的不斷深入,人們逐漸意識到前期在大數(shù)據(jù)分析應(yīng)用中大放異彩的深度神經(jīng)網(wǎng)絡(luò)尚存在基礎(chǔ)理論不完善、模型不具可解釋性、魯棒性較差等問題。
因此,雖然應(yīng)用層次最深的決策指導(dǎo)性應(yīng)用,當前已在人機博弈等非關(guān)鍵性領(lǐng)域取得較好應(yīng)用效果。但是,在自動駕駛、政府決策、軍事指揮、醫(yī)療健康等應(yīng)用價值更高,且與人類生命、財產(chǎn)、發(fā)展和安全緊密關(guān)聯(lián)的領(lǐng)域。要真正獲得有效應(yīng)用,仍面臨一系列待解決的重大基礎(chǔ)理論和核心技術(shù)挑戰(zhàn)。
在此之前,人們還不敢、也不能放手將更多的任務(wù)交由計算機大數(shù)據(jù)分析系統(tǒng)來完成。這也意味著,雖然已有很多成功的大數(shù)據(jù)應(yīng)用案例,但還遠未達到我們的預(yù)期,大數(shù)據(jù)應(yīng)用仍處于初級階段。
未來,隨著應(yīng)用領(lǐng)域的拓展、技術(shù)的提升、數(shù)據(jù)共享開放機制的完善,以及產(chǎn)業(yè)生態(tài)的成熟,具有更大潛在價值的預(yù)測性和指導(dǎo)性應(yīng)用將是發(fā)展的重點。
大數(shù)據(jù)技術(shù)仍存諸多短板
作為人口大國和制造大國,我國數(shù)據(jù)產(chǎn)生能力巨大,大數(shù)據(jù)資源極為豐富。預(yù)計到2020年,我國數(shù)據(jù)總量有望達到8000EB,占全球數(shù)據(jù)總量的21%,將成為名列前茅的數(shù)據(jù)資源大國和全球數(shù)據(jù)中心。然而,我們也必須清醒地認識到我國在大數(shù)據(jù)方面仍存在一系列亟待補上的短板。
其中較為突出的是核心技術(shù)薄弱,基礎(chǔ)理論與核心技術(shù)的落后導(dǎo)致我國信息技術(shù)長期存在“空心化”和“低端化 ”問題,大數(shù)據(jù)時代需避免此問題在新一輪發(fā)展中再次出現(xiàn)。
近年來,我國在大數(shù)據(jù)應(yīng)用領(lǐng)域取得較大進展,但是基礎(chǔ)理論、核心器件和算法、軟件等層面,較之美國等技術(shù)發(fā)達國家仍明顯落后。
在大數(shù)據(jù)管理、處理系統(tǒng)與工具方面,我國主要依賴國外開源社區(qū)的開源軟件,然而,由于我國對國際開源社區(qū)的影響力較弱,導(dǎo)致對大數(shù)據(jù)技術(shù)生態(tài)缺乏自主可控能力,成為制約我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展和國際化運營的重大隱患。因此,我們應(yīng)該采用“參與融入、蓄勢引領(lǐng) ”的開源推進策略,一方面鼓勵我國企業(yè)積極““參與融入”國際成熟的開源社區(qū),爭取話語權(quán);另一方面,也要在建設(shè)基于中文的開源社區(qū)方面加大投入,匯聚國內(nèi)軟硬件資源和開源人才,打造自主可控開源生態(tài),在學習實踐中逐漸成長壯大,伺機實現(xiàn)引領(lǐng)發(fā)展。此外,融合應(yīng)用有待深化。我國大數(shù)據(jù)與實體經(jīng)濟融合不夠深入,主要問題表現(xiàn)在:基礎(chǔ)設(shè)施配置不到位,數(shù)據(jù)采集難度大;缺乏有效引導(dǎo)與支撐,實體經(jīng)濟數(shù)字化轉(zhuǎn)型緩慢;缺乏自主可控的數(shù)據(jù)互聯(lián)共享平臺等。
當前,工業(yè)互聯(lián)網(wǎng)成為互聯(lián)網(wǎng)發(fā)展的新領(lǐng)域,然而仍存在不少問題:政府熱、企業(yè)冷,政府時有““項目式 ”、 ““運動式”推進,而企業(yè)由于沒看到直接、快捷的好處,接受度低;設(shè)備設(shè)施的數(shù)字化率和聯(lián)網(wǎng)率偏低;大多數(shù)大企業(yè)仍然傾向打造難以與外部系統(tǒng)交互數(shù)據(jù)的封閉系統(tǒng),而眾多中小企業(yè)數(shù)字化轉(zhuǎn)型的動力和能力嚴重不足;國外廠商的設(shè)備在我國具有壟斷地位,這些企業(yè)紛紛推出相應(yīng)的工業(yè)互聯(lián)網(wǎng)平臺,搶占工業(yè)領(lǐng)域的大數(shù)據(jù)基礎(chǔ)服務(wù)市場。
以制造業(yè)為例,麥肯錫研究報告稱,制造企業(yè)在利用大數(shù)據(jù)技術(shù)后,其生產(chǎn)成本能夠降低10%—15%。而大數(shù)據(jù)技術(shù)對制造業(yè)的影響遠非成本這一個方面。利用源于產(chǎn)品生命周期中市場、設(shè)計、制造、服務(wù)、再利用等各個環(huán)節(jié)數(shù)據(jù),制造業(yè)企業(yè)可以更加精細、個性化地了解客戶需求;建立更加精益化、柔性化、智能化的生產(chǎn)系統(tǒng);創(chuàng)造包括銷售產(chǎn)品、服務(wù)、價值等多樣的商業(yè)模式;并實現(xiàn)從應(yīng)激式到預(yù)防式的工業(yè)系統(tǒng)運轉(zhuǎn)管理模式的轉(zhuǎn)變。
構(gòu)建大數(shù)據(jù)治理體系
要解決這些問題,需要構(gòu)建一個大數(shù)據(jù)的治理體系。大數(shù)據(jù)治理體系必須要跳出單個組織的邊界,從營造國家大數(shù)據(jù)產(chǎn)業(yè)發(fā)展環(huán)境的視角來進行全面和系統(tǒng)化的考慮。
主要包括四個方面內(nèi)容,一是數(shù)據(jù)資產(chǎn)地位的確立;二是數(shù)據(jù)的管理體制和機制;三是促進數(shù)據(jù)共享和開放;四是要保障數(shù)據(jù)的安全 ,還有對隱私的保護。
這四大方面內(nèi)容涉及每一個組織層面,更多要上升到國家層面,是一個多層級的事情,具體的手段可以通過制度的建立、法律法規(guī)的制定,標準規(guī)范包含數(shù)據(jù)標準、技術(shù)標準,還有大量的應(yīng)用實踐,等等。
另外,在國家或者政府層次需要制定大數(shù)據(jù)上位法來指導(dǎo)和監(jiān)管行業(yè)和組織層面的大數(shù)據(jù)治理。行業(yè)層次通過行業(yè)自治模式,作為國家和企業(yè)的溝通橋梁,在自愿原則下形成行業(yè)聯(lián)盟,在國家法規(guī)政策指導(dǎo)下,制定行規(guī)行約,以及各類標準,監(jiān)管企業(yè)行為,同時也積極地向政府傳達行業(yè)的共同需求。每一個單位和每一個企業(yè)要在國家和行業(yè)框架下確立自己的目標,優(yōu)化對大數(shù)據(jù)資源管理,使大數(shù)據(jù)獲得的利益最大化,并為行業(yè)和國家大數(shù)據(jù)發(fā)展不斷貢獻自己的成功案例,這三個環(huán)節(jié)是相互依存,互相促進的,這是一個治理體系不可或缺的三個層次。
(本文根據(jù)梅宏院士公開演講整理而成,未經(jīng)本人確認。)