魏 凱
中國信息通信研究院 北京 100191
對大數(shù)據(jù)國家戰(zhàn)略的幾點考慮
魏 凱
中國信息通信研究院 北京 100191
大數(shù)據(jù)是國家發(fā)展的重要資源。對大數(shù)據(jù)資源的掌控與分析能力將成為未來國家競爭力的基礎(chǔ)。我國大數(shù)據(jù)的發(fā)展及研究已有了良好開端,但也存在大數(shù)據(jù)資源活性不足、行業(yè)應(yīng)用有待深化、關(guān)鍵核心技術(shù)亟待突破、產(chǎn)業(yè)基礎(chǔ)薄弱、網(wǎng)絡(luò)信息安全存在潛在隱患等問題。當前,制定國家大數(shù)據(jù)戰(zhàn)略成為各界人士的共同呼聲。國家層面的大數(shù)據(jù)戰(zhàn)略究竟應(yīng)該堅持什么思路,有哪些要素需要考慮,成為產(chǎn)業(yè)界和政府部門熱議的話題。基于此,結(jié)合國外實踐和國內(nèi)問題,提出一些初步思考。
大數(shù)據(jù);國家戰(zhàn)略;法律規(guī)范
大數(shù)據(jù)(big data)一詞最早由美國航空航天局研究人員在1997年提出1http://www. foreignpolicy.com/ articles/2012/10/ 08/big_data,直到2011年麥肯錫公司發(fā)布報告《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿》,才開始引起社會各界的廣泛關(guān)注。
到目前為止,大數(shù)據(jù)仍然沒有權(quán)威統(tǒng)一的定義,筆者認為需要從狹義和廣義兩個尺度認識大數(shù)據(jù)。狹義理解:大數(shù)據(jù)就是在數(shù)據(jù)采集技術(shù)快速提升、成本急劇下降的背景下,在互聯(lián)網(wǎng)和各種信息系統(tǒng)上形成的體量大、格式多、速度快的數(shù)據(jù)資源,即“數(shù)據(jù)大”。廣義理解:大數(shù)據(jù)不僅是“數(shù)據(jù)大”,還代表了一種新的認識世界的工具,更重要的是蘊含了一種“數(shù)據(jù)化”思維方式的變革。通過對大數(shù)據(jù)的分析,可以從中獲得對現(xiàn)實世界的立體化的認識,這給人類提供了全新的工具,影響廣泛而深遠,因此有人也把大數(shù)據(jù)與火、電、計算機、互聯(lián)網(wǎng)等并列,稱為“通用目的技術(shù)”。筆者認為,當前大數(shù)據(jù)熱的興起,最重要的成果是一場“用數(shù)據(jù)說話”的思維洗禮。
就技術(shù)和應(yīng)用而言,大數(shù)據(jù)是在互聯(lián)網(wǎng)快速發(fā)展中誕生的。這個起點可追溯到2000年前后。隨著全球網(wǎng)頁規(guī)模的暴增,推動搜索引擎背后的存儲和分析技術(shù)出現(xiàn)突變,一系列分布式技術(shù)隨之出現(xiàn),是今天大數(shù)據(jù)技術(shù)的源頭。隨后幾年,海量數(shù)據(jù)驅(qū)動的業(yè)務(wù)模式及技術(shù)深入互聯(lián)網(wǎng)營銷、廣告、電商等核心應(yīng)用,取得巨大的商業(yè)成功,引發(fā)全社會對大數(shù)據(jù)的空前重視。
當前,大數(shù)據(jù)的技術(shù)、工具和思維理念正在從互聯(lián)網(wǎng)向各個領(lǐng)域快速擴散。Gartner的調(diào)查顯示,業(yè)界對大數(shù)據(jù)技術(shù)的投資不斷擴大,73%的受訪者已經(jīng)投資或者計劃在未來24個月內(nèi)投資大數(shù)據(jù)。綜合IDC、Wikibon等公司的報告,僅大數(shù)據(jù)相關(guān)的數(shù)據(jù)存儲、處理、分析相關(guān)的軟硬件和服務(wù),2013年產(chǎn)值就已達150~180百億美元量級,未來3年還將維持30%~50%的增長。在直接的產(chǎn)業(yè)規(guī)模之外,大家更看中大數(shù)據(jù)給各個行業(yè)帶來的間接價值。大數(shù)據(jù)技術(shù)幾乎可以應(yīng)用到各個行業(yè)的價值創(chuàng)造和分配的全過程,通過降低交易成本,提高市場透明度,精確細分客戶群,優(yōu)化決策機制,催生新產(chǎn)品、新服務(wù)和新產(chǎn)業(yè)等方式間接創(chuàng)造價值巨大2http://www. drc.gov.cn/n/ 20140219/1-224-2878793.htm。大數(shù)據(jù)不光有經(jīng)濟價值,還塑造了新的“數(shù)據(jù)空間”,已經(jīng)成為繼陸權(quán)、海權(quán)、空權(quán)、天權(quán)安全之后,另一個國家主權(quán)不可分割的組成部分[1]。
2.1 美國在推動大數(shù)據(jù)發(fā)展上最為積極,力圖確立領(lǐng)先地位
美國依托其互聯(lián)網(wǎng)和IT產(chǎn)業(yè)的領(lǐng)先地位,占據(jù)大數(shù)據(jù)技術(shù)發(fā)展先機,已形成明顯的先發(fā)優(yōu)勢。Google、Facebook、Yahoo等公司的超大規(guī)模數(shù)據(jù)存儲、分布式計算、深度機器學習等多項大數(shù)據(jù)關(guān)鍵技術(shù)已領(lǐng)先其他同類技術(shù)平均5~6年。這種技術(shù)領(lǐng)先優(yōu)勢借助開源模式向外擴散,帶動Splunk、Tableau、Cloudera和HortonWorks等一大批專業(yè)化的大數(shù)據(jù)技術(shù)和服務(wù)公司不斷涌現(xiàn)。大數(shù)據(jù)技術(shù)不僅在美國互聯(lián)網(wǎng)搜索、廣告、電子商務(wù)、社交網(wǎng)絡(luò)等得到廣泛應(yīng)用,7成以上傳統(tǒng)行業(yè)企業(yè)也不同程度地應(yīng)用了大數(shù)據(jù)技術(shù),特別是銀行、保險、制造零售等領(lǐng)域已經(jīng)有不少案例,國家安全、醫(yī)療、教育、科研等領(lǐng)域的大數(shù)據(jù)應(yīng)用也在快速深化。依靠機器、算法和大數(shù)據(jù)提供某種程度的智能,從而取得新的增長,正成為美國各行業(yè)信息化演變的主要方向,“第二次機器時代”的轉(zhuǎn)折點正在來臨3美國麻省理工學院 教 授Andrew McAfee和 Erik Brynjolfsson在2014年出版的新書《The Second Machine Age: Work, Progress and Prosperity In a Time of Brilliant Technologies》中提出的概念。。
然而即便在領(lǐng)先的美國,大數(shù)據(jù)的發(fā)展初期,很多問題仍無法完全依靠市場自發(fā)解決,突出表現(xiàn)在以下幾點:首先是技術(shù)問題,數(shù)據(jù)的采集、高效存儲、深度分析等基礎(chǔ)技術(shù)還不能適應(yīng)發(fā)展需求,醫(yī)療、國防、交通、科研等方面的大數(shù)據(jù)技術(shù)水平仍然薄弱;其次是數(shù)據(jù),商業(yè)機構(gòu)往往面臨數(shù)據(jù)短缺,而美國政府掌握的數(shù)據(jù)僅次于制造業(yè),商業(yè)化利用價值非常高,但缺較少開放;再次是法律制度,美國一些隱私保護組織呼吁加強保護,但以互聯(lián)網(wǎng)公司為代表的商業(yè)機構(gòu)則主張寬松對待,雙方在收緊與放松之間展開拉鋸戰(zhàn);最后是人才,麥肯錫的一份報告預(yù)計:到2018年,美國在“具備深入分析能力”的大數(shù)據(jù)專業(yè)人才缺口將達到14萬~18萬人。
美國政府意識到必須有所作為,于是2012年在全球率先推出“大數(shù)據(jù)行動計劃(big data initiative)”,強化頂層設(shè)計,統(tǒng)籌推進技術(shù)研發(fā)、數(shù)據(jù)開放、率先應(yīng)用和負面問題應(yīng)對4http://www. whitehouse.gov/ sites/default/ files/microsites/ ostp/big_data_ press_release_ final_2.pdf。
● 加大技術(shù)研究:資助DARPA、NSF、NASA、NIH等機構(gòu)開展核心技術(shù)研究。例如,在大數(shù)據(jù)計劃資助下,加州大學伯克利分校開發(fā)的開源軟件平臺“伯克利數(shù)據(jù)分析軟件棧(Berkeley data analytics stack),其中的內(nèi)存計算軟件Spark性能比大名鼎鼎的Hadoop提高近百倍,有望取代后者,成為大數(shù)據(jù)技術(shù)平臺的主力5取代而非補充,Spark Summit 2014精彩回顧. http://www. csdn.net/article/ 2014-07-17/ 2820713。
● 數(shù)據(jù)開放方面:在全球較早建立了統(tǒng)一的數(shù)據(jù)門戶(data.gov),已開放37萬個數(shù)據(jù)集和1 209個數(shù)據(jù)工具。奧巴馬在2013年5月進一步要求,政府必須實現(xiàn)新增和經(jīng)處理數(shù)據(jù)的開放和機器可讀,激發(fā)大數(shù)據(jù)創(chuàng)新活力。
● 政府應(yīng)用方面:美國政府是大數(shù)據(jù)的積極使用者。2013年曝光的“棱鏡門事件”顯示出美國國家安全部門大數(shù)據(jù)應(yīng)用的強大實力,其應(yīng)用范圍之廣、水平之高、規(guī)模之大都遠遠超過人們的想象。2012-2013年,美國國家安全局(NSA)、聯(lián)邦調(diào)查局(FBI)及中央情報局(CIA)等聯(lián)邦政府機構(gòu)還大量采購亞馬遜的云服務(wù),以支撐其大數(shù)據(jù)應(yīng)用。
● 關(guān)注負面影響:隨著應(yīng)用的深入,美國政府對大數(shù)據(jù)帶來的負面影響也更加重視,美國白宮2014年5月發(fā)布的《大數(shù)據(jù):抓住機遇,守護價值》報告中提醒,在發(fā)揮正面價值的同時,應(yīng)該警惕大數(shù)據(jù)應(yīng)用對隱私、公平等長遠價值帶來的負面影響。
2.2 英、日、澳、新等國家迅速跟進,努力縮小差距
英國將大數(shù)據(jù)列為戰(zhàn)略性技術(shù),給予高度關(guān)注。英國政府緊隨美國之后,推出一系列支持大數(shù)據(jù)發(fā)展舉措。首先是給予研發(fā)資金支持。2013年1月,英國政府向航天、醫(yī)藥等8類高新技術(shù)領(lǐng)域注資6億英鎊研發(fā),其中大數(shù)據(jù)技術(shù)獲得1.89億英鎊的資金,是獲得資金最多的領(lǐng)域。其次是促進政府和公共領(lǐng)域的大數(shù)據(jù)應(yīng)用。據(jù)測算,通過合理、高效使用大數(shù)據(jù)技術(shù),英國政府每年可節(jié)省約330億英鎊,相當于英國每人每年節(jié)省約500英鎊。為了在醫(yī)療領(lǐng)域更好地應(yīng)用大數(shù)據(jù),2013年5月,英國政府和李嘉誠基金會聯(lián)合投資設(shè)立全球首個綜合運用大數(shù)據(jù)技術(shù)的醫(yī)藥衛(wèi)生科研機構(gòu),將透過高通量生物數(shù)據(jù),與業(yè)界共同界定藥物標靶,處理目前在新藥開發(fā)過程中關(guān)鍵的瓶頸,之后還將匯集遺傳學、流行病學、臨床、化學和計算機科學等領(lǐng)域的頂尖人才,集中分析龐大的醫(yī)療數(shù)據(jù)。
日本政府把大數(shù)據(jù)作為提升日本競爭力的關(guān)鍵。日本政府認為,提升日本競爭力,大數(shù)據(jù)應(yīng)用不可或缺。日本在新一輪IT振興計劃中把發(fā)展大數(shù)據(jù)作為國家戰(zhàn)略的重要內(nèi)容,新的ICT戰(zhàn)略重點關(guān)注大數(shù)據(jù)應(yīng)用技術(shù)。日本總務(wù)省2012年7月推出了新的綜合戰(zhàn)略“活力ICT日本”,將重點關(guān)注大數(shù)據(jù)應(yīng)用,并將其作為2013年6個主要任務(wù)之一,聚焦大數(shù)據(jù)應(yīng)用所需的社會化媒體等智能技術(shù)開發(fā)以及在新醫(yī)療技術(shù)開發(fā)、緩解交通擁堵等公共領(lǐng)域的應(yīng)用。
此外,澳大利亞、新加坡等國也非常重視大數(shù)據(jù)發(fā)展。2013年8月初,澳大利亞出臺公共服務(wù)大數(shù)據(jù)政策,提出了大數(shù)據(jù)分析的實踐指南,希望通過大數(shù)據(jù)分析系統(tǒng)提升公共服務(wù)質(zhì)量,增加服務(wù)種類,為公共服務(wù)提供更好的政策指導(dǎo)。在新加坡,多個國際領(lǐng)先企業(yè)在該國設(shè)立大數(shù)據(jù)技術(shù)研發(fā)中心,加速數(shù)據(jù)分析技術(shù)的商業(yè)應(yīng)用。2014年初,新加坡資訊通信發(fā)展管理局(IDA)還聘請了首任首席數(shù)據(jù)科學家,專門推進政府數(shù)據(jù)的開放和價值開發(fā)。
我國各界高度關(guān)注大數(shù)據(jù)的發(fā)展,積極推進相關(guān)技術(shù)研發(fā)和應(yīng)用。目前,百度、騰訊、阿里巴巴等骨干互聯(lián)網(wǎng)企業(yè)已建立了世界上規(guī)模最大的大數(shù)據(jù)平臺,單集群規(guī)模達到上萬臺,在分布式系統(tǒng)、超大規(guī)模數(shù)據(jù)倉庫、深度學習等關(guān)鍵技術(shù)上有所突破。大數(shù)據(jù)驅(qū)動的互聯(lián)網(wǎng)、金融、流通、新媒體等跨界業(yè)務(wù)創(chuàng)新加速發(fā)展。但相對而言,我國大數(shù)據(jù)發(fā)展的信息化基礎(chǔ)薄弱,大數(shù)據(jù)前沿技術(shù)原創(chuàng)能力不足,關(guān)鍵產(chǎn)品和服務(wù)的供應(yīng)較為落后,大數(shù)據(jù)技術(shù)應(yīng)用的擴散速度較慢,急需推動促進發(fā)展。
對我國來說,數(shù)據(jù)資源不豐富、技術(shù)差距大和法律法規(guī)不完善是當前大數(shù)據(jù)發(fā)展面臨的主要問題[2]。
一是我國數(shù)據(jù)源不夠豐富,數(shù)據(jù)開放程度較低。豐富的高質(zhì)量數(shù)據(jù)資源是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的前提。近幾年在互聯(lián)網(wǎng)產(chǎn)業(yè)及金融、電信信息化快速發(fā)展的帶動下,我國數(shù)據(jù)資源總量有了快速增長,已達到全球的13%,但其他行業(yè)受信息化水平制約,數(shù)據(jù)儲量仍不豐富。已有數(shù)據(jù)資源還存在標準化、準確性、完整性低,利用價值不高的情況。同時,我國政府、企業(yè)和行業(yè)信息化系統(tǒng)建設(shè)中受到各種因素制約,形成了眾多“信息孤島”。再加上體制機制、利益關(guān)系等還沒有理順,數(shù)據(jù)開放程度嚴重滯后于大數(shù)據(jù)發(fā)展需求。
二是我國大數(shù)據(jù)技術(shù)存在水平不高、技術(shù)擴散不暢的問題。我國大數(shù)據(jù)技術(shù)的發(fā)展模式也與全球類似,互聯(lián)網(wǎng)企業(yè)具備快速將國際先進的開源大數(shù)據(jù)技術(shù)整合到自身系統(tǒng)中的能力,并構(gòu)建了單集群上萬節(jié)點的大型系統(tǒng),但仍缺乏原創(chuàng)技術(shù),對開源社區(qū)的貢獻不足,進而對前沿技術(shù)路線的影響比較微弱。同時,由于本土開源社區(qū)等產(chǎn)業(yè)組織發(fā)育滯后,國內(nèi)領(lǐng)先企業(yè)在大數(shù)據(jù)方面的技術(shù)創(chuàng)新也難以向社會擴散。以往我國在數(shù)據(jù)庫技術(shù)上的相對落后局面仍然沒有根本改變,商用大數(shù)據(jù)產(chǎn)品供給能力還比較薄弱,使得依賴供應(yīng)商的傳統(tǒng)行業(yè)大數(shù)據(jù)應(yīng)用水平受到限制。
三是大數(shù)據(jù)相關(guān)的法律法規(guī)有待進一步完善。隨著大數(shù)據(jù)挖掘分析越來越精準、應(yīng)用領(lǐng)域不斷擴展,個人隱私保護和數(shù)據(jù)安全變得非常緊迫。在隱私保護方面,現(xiàn)有的法律體系面臨著兩個方面的挑戰(zhàn):一是法律保護的個人隱私,主要體現(xiàn)為個人可識別信息(personally identifiable information,PII),但隨著技術(shù)的推進,以往并非PII的數(shù)據(jù)也可能會成為PII,使得保護范圍變得模糊;二是以往建立在“目的明確、事先同意、使用限制”等原則之上的個人信息保護制度,在大數(shù)據(jù)場景下變得越來越難以操作。而我國個人信息保護、數(shù)據(jù)跨境流動等方面的法律法規(guī)尚不健全,這成為制約大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展的重要原因之一。需要結(jié)合我國法治建設(shè)的實際情況,探索通過行業(yè)自律等方式彌補法律體系不完善的弊端。
針對大數(shù)據(jù)發(fā)展面臨的問題,需要加強統(tǒng)籌規(guī)劃,圍繞經(jīng)濟社會發(fā)展的實際需求,以市場為導(dǎo)向、以企業(yè)為主體、以加強公共數(shù)據(jù)資源開放共享和推動政府和公共服務(wù)領(lǐng)域的大數(shù)據(jù)應(yīng)用為抓手,保障大數(shù)據(jù)安全,營造發(fā)展環(huán)境,引領(lǐng)大數(shù)據(jù)在關(guān)鍵行業(yè)應(yīng)用,以突破關(guān)鍵技術(shù)為核心,拉動培育自主可控產(chǎn)業(yè)體系,推動大數(shù)據(jù)為經(jīng)濟社會可持續(xù)發(fā)展做出積極貢獻。本著這樣的思路,建議國家大數(shù)據(jù)戰(zhàn)略需要考慮數(shù)據(jù)資源、行業(yè)應(yīng)用、技術(shù)產(chǎn)品、法律法規(guī)和安全保障5個要素。
4.1 促進大數(shù)據(jù)資源開放與流通
首先是加快推動公共數(shù)據(jù)向社會開放。堅持分級、分類、分階段開放的原則,著力推進地理、人口、法人、金融、稅收、醫(yī)療、社保、農(nóng)業(yè)、交通、統(tǒng)計等公共數(shù)據(jù)對外開放力度,提升公共數(shù)據(jù)再利用水平。推進政府數(shù)據(jù)建設(shè),健全政府數(shù)據(jù)管理制度,規(guī)范數(shù)據(jù)采集,保證信息數(shù)據(jù)質(zhì)量。引導(dǎo)企業(yè)應(yīng)用公共數(shù)據(jù),加大對民生類公共數(shù)據(jù)應(yīng)用的政策傾斜和支持力度。鼓勵有條件的地區(qū)開展試點建設(shè),探索開放模式,形成示范效應(yīng)。加強安全保障,保守國家秘密,維護社會倫理,保護個人隱私和商業(yè)秘密。
其次是促進商業(yè)化數(shù)據(jù)流通交易。支持企業(yè)間點對點數(shù)據(jù)交換與共享,探索建立大數(shù)據(jù)交易市場,開展大數(shù)據(jù)交易試點,支持各行業(yè)數(shù)據(jù)的匯聚與交易,通過市場化機制促進數(shù)據(jù)資源的有效流通。依托數(shù)據(jù)流通與交易實踐,引導(dǎo)形成數(shù)據(jù)流通交易規(guī)則體系,建立數(shù)據(jù)流通交易中的安全與隱私保護標準,確保數(shù)據(jù)資源的有序流通。
4.2 深化行業(yè)大數(shù)據(jù)應(yīng)用
在應(yīng)用方面,政府首當其沖,應(yīng)該帶頭利用大數(shù)據(jù)技術(shù)提升政府治理與社會服務(wù)能力。要培育政府部門應(yīng)用大數(shù)據(jù)提升政府治理能力的理念,重點推動政府在國家統(tǒng)計、市場監(jiān)管、輿情監(jiān)測、環(huán)境保護、公共安全、國家安全等方面的大數(shù)據(jù)應(yīng)用,鼓勵政府以外包服務(wù)方式采購大數(shù)據(jù)分析基礎(chǔ)設(shè)施和服務(wù)。支持醫(yī)療衛(wèi)生、食品安全、教育科研、城市交通、社會保障等眾多公共領(lǐng)域的企事業(yè)單位開展大數(shù)據(jù)應(yīng)用,推進各公共服務(wù)領(lǐng)域的大數(shù)據(jù)應(yīng)用示范建設(shè),鼓勵公共領(lǐng)域機構(gòu)開展大數(shù)據(jù)創(chuàng)新,以提升公共服務(wù)能力并惠及民眾生活。
而在商業(yè)化應(yīng)用方面,政府應(yīng)該退后一步,把工作重點放在完善制度、創(chuàng)造環(huán)境方面,支持互聯(lián)網(wǎng)、電信等數(shù)據(jù)資源豐富、IT能力較強的企業(yè)深化內(nèi)部應(yīng)用,穩(wěn)妥有序地將自身數(shù)據(jù)資源和服務(wù)能力對外開放。一是鼓勵互聯(lián)網(wǎng)企業(yè)建設(shè)大數(shù)據(jù)分析平臺,支撐內(nèi)部應(yīng)用,并將大數(shù)據(jù)能力向其他行業(yè)進行輻射,推動互聯(lián)網(wǎng)企業(yè)以在線云服務(wù)方式向傳統(tǒng)行業(yè)企業(yè)開放大數(shù)據(jù)分析平臺能力。二是支持電信企業(yè)在保障數(shù)據(jù)安全和個人隱私的前提下,充分利用電信行業(yè)豐富的數(shù)據(jù)資源,提升電信運營企業(yè)在客戶管理、市場營銷、產(chǎn)品開發(fā)、網(wǎng)絡(luò)優(yōu)化等方面的大數(shù)據(jù)應(yīng)用水平,鼓勵電信企業(yè)對外提供數(shù)據(jù)資源與分析能力,為各類企業(yè)、行業(yè)單位和政府部門提供大數(shù)據(jù)服務(wù),促進社會化大數(shù)據(jù)產(chǎn)業(yè)生態(tài)快速、有序發(fā)展。
4.3 突破大數(shù)據(jù)關(guān)鍵技術(shù)產(chǎn)品
首先,要攻克大數(shù)據(jù)核心關(guān)鍵技術(shù)。搭建國際化的學術(shù)交流和人才流動平臺,產(chǎn)、學、研、用聯(lián)合開展大數(shù)據(jù)理論研究。攻克面向EB級超大規(guī)模數(shù)據(jù)集的新型數(shù)據(jù)存儲、表示、管理和查詢關(guān)鍵技術(shù);面向文本、圖像、視頻大數(shù)據(jù)和物聯(lián)網(wǎng)感知數(shù)據(jù),研發(fā)自然語言分析、信息提取、知識表現(xiàn)、自動化推理、機器學習等核心技術(shù),突破基于超大規(guī)模深度神經(jīng)網(wǎng)絡(luò)的深度學習相關(guān)理論與技術(shù),研發(fā)數(shù)據(jù)安全與隱私保護理論與技術(shù)。
其次,要大力培育自主可控的大數(shù)據(jù)產(chǎn)品與服務(wù)。整合國內(nèi)互聯(lián)網(wǎng)、制造企業(yè)和科研機構(gòu)力量,共同研發(fā)支持超大吞吐量的新一代融合并行分布式計算平臺、支持結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的大規(guī)模數(shù)據(jù)倉庫、基于深度神經(jīng)網(wǎng)絡(luò)的超大規(guī)模數(shù)據(jù)分析引擎等平臺級軟件,培育自主開源軟件社區(qū),構(gòu)造生態(tài)鏈。大力發(fā)展面向垂直領(lǐng)域的數(shù)據(jù)分析、數(shù)據(jù)資產(chǎn)管理、商業(yè)智能應(yīng)用軟件和在線服務(wù)。
4.4 完善大數(shù)據(jù)法律法規(guī)
在個人隱私保護方面,要嚴格保護大數(shù)據(jù)應(yīng)用中的個人信息。落實全國人民代表大會常務(wù)委員會關(guān)于加強網(wǎng)絡(luò)信息保護的決定,探索制定大數(shù)據(jù)環(huán)境下數(shù)據(jù)收集、開放、交換、應(yīng)用等環(huán)節(jié)的個人信息保護指南,明確大數(shù)據(jù)應(yīng)用相關(guān)各方的個人信息保護義務(wù)和責任。
在個人和企業(yè)數(shù)據(jù)資產(chǎn)保護方面,要探索建立數(shù)據(jù)產(chǎn)權(quán)保護制度。探索制定信息資產(chǎn)管理制度,建立信息資源基本權(quán)利體系,明確各類市場主體所積累的信息資產(chǎn)所有權(quán)歸屬,建立規(guī)范化管理和使用機制,保護信息所有者、信息主體及公眾合法利益。
在國家數(shù)據(jù)主權(quán)方面,要建立數(shù)據(jù)跨境流動管理制度。制定跨境數(shù)據(jù)流動分級分類管理制度,涉及國家秘密、國家安全以及經(jīng)濟安全的數(shù)據(jù)嚴格禁止跨境,對政府和公共部門數(shù)據(jù)跨境流動,實施安全風險評估機制。建立外資安全審查機制,強化對外資的數(shù)據(jù)跨境流動管理。
4.5 保障大數(shù)據(jù)安全
首先,要構(gòu)建大數(shù)據(jù)安全管理制度體系。加強大數(shù)據(jù)安全頂層設(shè)計,積極推動數(shù)據(jù)信息保護立法,加快大數(shù)據(jù)安全人才隊伍建設(shè)。探索建立面向政府信息采集和管控、敏感數(shù)據(jù)管理、數(shù)據(jù)交換標準和規(guī)則、個人隱私等領(lǐng)域的大數(shù)據(jù)安全保障制度,明確數(shù)據(jù)采集、使用、開放等環(huán)節(jié)涉及信息安全的范圍、要求和責任,確保國家利益、社會安全、商業(yè)秘密、個人隱私等信息不受侵犯。
其次,加強大數(shù)據(jù)安全保障能力建設(shè)。加強大數(shù)據(jù)安全基礎(chǔ)設(shè)施和軟硬件建設(shè),改變傳統(tǒng)的端級防護、單點布防的安全解決方案,提高針對大數(shù)據(jù)網(wǎng)絡(luò)攻擊、數(shù)據(jù)存儲應(yīng)用系統(tǒng)漏洞等安全防護能力。加強數(shù)據(jù)匿名保護、數(shù)據(jù)水印、數(shù)據(jù)溯源、角色挖掘、風險自適應(yīng)的訪問控制等大數(shù)據(jù)安全保護關(guān)鍵技術(shù)研究,從技術(shù)角度降低大數(shù)據(jù)泄露、濫用的風險,保障大數(shù)據(jù)信息的合法、合理利用。
大數(shù)據(jù)的發(fā)展涉及資源、技術(shù)、產(chǎn)業(yè)、政策和法律等方方面面,不能完全依靠市場,需要政府統(tǒng)籌謀劃,協(xié)同推動。無論是從美、日、歐等國家和地區(qū)的政策實踐看,還是從國內(nèi)發(fā)展需求看,各方都認為有必要盡快出臺我國的大數(shù)據(jù)國家戰(zhàn)略。
種種跡象表明,大數(shù)據(jù)戰(zhàn)略的出臺日益臨近。在2014年《政府工作報告》中就提出“設(shè)立新興產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺,在新一代移動通信、集成電路、大數(shù)據(jù)、先進制造、新能源、新材料等方面趕超先進,引領(lǐng)未來產(chǎn)業(yè)發(fā)展”。2015年《政府工作報告》又提出了“推動移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合”。工業(yè)和信息化部2015年工作重點中提出,要推動出臺大數(shù)據(jù)應(yīng)用與發(fā)展指導(dǎo)性文件6http://www.miit. gov.cn/n11293472/ n11293832/ n11293907/ n11368223/ 16342761.html,并制定工業(yè)大數(shù)據(jù)創(chuàng)新發(fā)展指導(dǎo)意見7http://www.miit. gov.cn/n11293472/ n11293832/ n11293907/ n11368223/ 16342761.html。2015年國家發(fā)展和改革委員會在高技術(shù)工作年度工作會議上,進一步明確提出要啟動“國家大數(shù)據(jù)戰(zhàn)略及行動計劃”8http://www.dqfgw. gov.cn/fgwweb/ WN010018/16681. htm。相信隨著相關(guān)政策的出臺和落地,數(shù)據(jù)割據(jù)、技術(shù)薄弱、法規(guī)缺失等問題將得到改善,大數(shù)據(jù)在我國的應(yīng)用發(fā)展也將邁上新的臺階。
[1] 沈國麟. 大數(shù)據(jù)時代的數(shù)據(jù)主權(quán)和國家數(shù)據(jù)戰(zhàn)略. 南京社會科學, 2014(6): 113~119 Shen G L. Data sovereignty and national strategy in big data era. Nanjing Journal of Social Sciences, 2014(6): 113~119
[2] 工業(yè)和信息化部電信研究院. 大數(shù)據(jù)白皮書(2014). http://www.catr.cn/kxyj/qwfb/ bps/201405/t20140512_1017466.html, 2014 China Academy of Telecommunication Research of MIIT. Big data white paper (2014). http://www.catr.cn/kxyj/qwfb/ bps/201405/t20140512_1017466.html, 2014
Wei K. Some considerations on the China national big data strategy. Big Data Research, 2015010
Some Considerations on the China National Big Data Strategy
Wei Kai
China Academy of Information and Communications Technology, Beijing 100191, China
Big data is a kind of critical development resources. The ability of control and analysis on big data become the foundation of a country’s competitiveness in future. Although China's big data development has a good start, there are a couple of challenges ahead, e.g., the open government and public data are insufficient, big data application is not widespread, core technologies R&D still need to be strengthened, privacy and information security are facing new risks. Currently, developing a national big data strategy is approaching a common agreement. While how to develop the strategy and what should to be considered are hot topics among the industry and government experts. Therefore, some considerations were proposed based on both other countries practice and domestic research.
big data, national strategy, law and regulation
魏凱,男,中國信息通信研究院(原工業(yè)和信息化部電信研究院)通信標準研究所移動與大數(shù)據(jù)研究部副主任、高級工程師,國際電信聯(lián)盟(ITU-T)標準化局第16研究組Q21聯(lián)合報告人,數(shù)據(jù)中心聯(lián)盟大數(shù)據(jù)組組長,中關(guān)村大數(shù)據(jù)交易產(chǎn)業(yè)聯(lián)盟副秘書長。主要從事互聯(lián)網(wǎng)技術(shù)、標準與產(chǎn)業(yè)政策研究工作。主持和參與科學技術(shù)部、國家發(fā)展和改革委員會、工業(yè)和信息化部科研和產(chǎn)業(yè)化項目。近年來參與國務(wù)院《關(guān)于促進云計算創(chuàng)新發(fā)展培育信息產(chǎn)業(yè)新業(yè)態(tài)的意見》、工業(yè)和信息化部等5個部委《關(guān)于數(shù)據(jù)中心建設(shè)布局的指導(dǎo)意見》等重要政策文件的起草。發(fā)表論文30多篇,申請發(fā)明專利1項,主持完成通信行業(yè)標準10多項、ITU-T國際建議書2項,3次獲得省部級科學技術(shù)獎。
2015-05-03;
2015-05-10
魏凱. 對大數(shù)據(jù)國家戰(zhàn)略的幾點考慮. 大數(shù)據(jù), 2015010