CCF大專委2016年大數(shù)據(jù)發(fā)展趨勢(shì)預(yù)測(cè)
——解讀和行動(dòng)建議
Developing trend forecasting of big data in 2016 from CCF TFBD: interpretation and proposals
潘柱廷(1969-),男,啟明星辰首席戰(zhàn)略官。教授級(jí)高級(jí)工程師,長(zhǎng)期從事信息安全技術(shù)和戰(zhàn)略研究工作。中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)常務(wù)理事,CCF大數(shù)據(jù)專家委員會(huì)委員兼副秘書(shū)長(zhǎng),CCF計(jì)算機(jī)安全專家委員會(huì)常務(wù)委員,中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)常務(wù)理事,云安全聯(lián)盟CSA中國(guó)區(qū)理事。網(wǎng)絡(luò)空間安全協(xié)會(huì)——網(wǎng)絡(luò)安全人才與教育工委(籌)召集人。
程學(xué)旗(1971-),男,中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員、所長(zhǎng)助理、副總工程師,中國(guó)科學(xué)院網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室主任,CCF大數(shù)據(jù)專家委員會(huì)秘書(shū)長(zhǎng),國(guó)家杰出青年科學(xué)基金獲得者。先后主持并完成了10余項(xiàng)國(guó)家自然科學(xué)基金、國(guó)家“973”計(jì)劃、國(guó)家“863”計(jì)劃、國(guó)家信息安全重大專項(xiàng)等科研任務(wù)。兩次獲得國(guó)家科技進(jìn)步獎(jiǎng)二等獎(jiǎng),獲得第十二屆中國(guó)青年科技獎(jiǎng)、中國(guó)計(jì)算機(jī)學(xué)會(huì)青年科學(xué)家獎(jiǎng)、中國(guó)科學(xué)院青年科學(xué)家獎(jiǎng)等榮譽(yù)。
袁曉如(1975-),男,北京大學(xué)“百人計(jì)劃”研究員,北京大學(xué)信息科學(xué)技術(shù)學(xué)院博士生導(dǎo)師。主要研究方向包括:高動(dòng)態(tài)范圍視頻、圖像和可視化;大規(guī)模數(shù)據(jù)的高性能繪制和可視化;非真實(shí)性繪制及插圖式可視化;新穎可視化界面與人機(jī)交互研究;高維數(shù)據(jù)可視化。關(guān)于高動(dòng)態(tài)范圍可視化的工作獲得2005年IEEE Visualization大會(huì)的最佳論文獎(jiǎng)。
周濤(1979-),男,博士,北京啟明星辰信息安全技術(shù)有限公司教授級(jí)高工,主要研究方向?yàn)榇髷?shù)據(jù)安全分析、事件關(guān)聯(lián)分析、入侵檢測(cè)等。
靳小龍(1976-),男,中國(guó)科學(xué)院計(jì)算技術(shù)研究所副研究員,博士生導(dǎo)師,中國(guó)科學(xué)院網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室網(wǎng)絡(luò)數(shù)據(jù)科學(xué)研究部負(fù)責(zé)人,CCF大數(shù)據(jù)專家委員會(huì)委員。主要研究興趣包括社會(huì)計(jì)算、社會(huì)網(wǎng)絡(luò)、網(wǎng)絡(luò)數(shù)據(jù)分析、多智能體系統(tǒng)等。
2015中國(guó)大數(shù)據(jù)技術(shù)大會(huì)(BDTC)于2015年12月10日在北京召開(kāi),會(huì)上中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)大數(shù)據(jù)專家委員會(huì)(task force on big data,TFBD,以下簡(jiǎn)稱大專委)發(fā)布了中國(guó)大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展報(bào)告(2015),并對(duì)2016年大數(shù)據(jù)發(fā)展趨勢(shì)進(jìn)行了展望。
自2012年10月CCF大專委成立,在每年12月的大數(shù)據(jù)技術(shù)大會(huì)上都會(huì)發(fā)布對(duì)第二年大數(shù)據(jù)發(fā)展趨勢(shì)的預(yù)測(cè)。從預(yù)測(cè)2013年到預(yù)測(cè)2016年,現(xiàn)在已經(jīng)是第4次年度預(yù)測(cè)。每次預(yù)測(cè)都是基于對(duì)大專委專家委員觀點(diǎn)的收集整理、投票、匯總、解讀,最終形成年度預(yù)測(cè),此預(yù)測(cè)是大專委群體智慧的結(jié)晶。在2015年和2016年的兩次預(yù)測(cè)中,還邀請(qǐng)了中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟的聯(lián)盟成員參加了投票和匯總,也部分反映了產(chǎn)業(yè)聯(lián)盟的趨勢(shì)判斷。
2015年底做出的2016年預(yù)測(cè),參加投票的大專委專家和產(chǎn)業(yè)聯(lián)盟成員是116位。根據(jù)這116位專家投票結(jié)果,匯總形成了對(duì)2016年大數(shù)據(jù)發(fā)展十大趨勢(shì)的預(yù)測(cè),下面對(duì)這十大發(fā)展趨勢(shì)進(jìn)行詳細(xì)介紹。
2.1 趨勢(shì)一:可視化推動(dòng)大數(shù)據(jù)平民化
“可視化”雖然已是連續(xù)第三次入選大數(shù)據(jù)發(fā)展十大趨勢(shì),但今年能占據(jù)第一位,實(shí)在是意料之外的意料之中。
這幾年,大數(shù)據(jù)這一概念迅速深入大眾人心,大眾直接看到的大數(shù)據(jù)更多是以可視化的方式體現(xiàn)。可視化實(shí)際上已經(jīng)極大拉近了大數(shù)據(jù)和普通民眾的距離,即使對(duì)IT技術(shù)不了解的普通民眾和非技術(shù)專業(yè)的常規(guī)決策者也能夠更好地理解大數(shù)據(jù)及其分析的效果和價(jià)值,從而可以從國(guó)計(jì)、民生兩方面都充分發(fā)揮大數(shù)據(jù)的價(jià)值。
可視化是通過(guò)把復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為可以交互的圖形,幫助用戶更好地理解分析數(shù)據(jù)對(duì)象,發(fā)現(xiàn)、洞察其內(nèi)在規(guī)律。數(shù)據(jù)是人類對(duì)于客觀事物的抽象。人類對(duì)于數(shù)據(jù)的理解和掌握是需要經(jīng)過(guò)學(xué)習(xí)訓(xùn)練才能達(dá)到的。理解更為復(fù)雜的數(shù)據(jù),必須要越過(guò)更高的認(rèn)知壁壘,才能對(duì)客觀數(shù)據(jù)對(duì)象建立相應(yīng)的心理圖像,完成認(rèn)知理解過(guò)程。好的可視化就能夠極大地降低這個(gè)認(rèn)知壁壘,將復(fù)雜未知數(shù)據(jù)的交互探索變得可行。
可視化技術(shù)的進(jìn)步和廣泛應(yīng)用對(duì)大數(shù)據(jù)走向平民來(lái)說(shuō),意義是雙向的。一方面,可視化作為人和數(shù)據(jù)之間的界面,結(jié)合其他數(shù)據(jù)分析處理技術(shù),為廣大使用者提供了強(qiáng)大的理解、分析數(shù)據(jù)的能力??梢暬沟么髷?shù)據(jù)能夠被更多人理解、使用。可視化使得大數(shù)據(jù)的使用者從少數(shù)專家擴(kuò)展到更廣泛的大眾。另一方面,可視化也為大眾提供了方便的工具,可以主動(dòng)分析處理與個(gè)人工作、生活、環(huán)境有關(guān)的數(shù)據(jù)。大約在10年前,可視化研究界已經(jīng)開(kāi)始討論為大眾服務(wù)的可視化。在今天的大數(shù)據(jù)背景下,可視化將進(jìn)一步推動(dòng)大數(shù)據(jù)平民化。在這一過(guò)程中,急需更方便且適合大眾使用需要的可視化方法和工具??梢暬矊⑦M(jìn)一步和個(gè)人使用的移動(dòng)通信設(shè)備(手機(jī))結(jié)合。在這一過(guò)程中,將有更多面向大眾的大數(shù)據(jù)可視化公司涌現(xiàn)出來(lái)。
建議在大數(shù)據(jù)相關(guān)的研究、開(kāi)發(fā)和應(yīng)用中,保持相應(yīng)的比例用于可視化和可視分析。尤其建議利用產(chǎn)業(yè)生態(tài)中的已有成果。
2.2 趨勢(shì)二:多學(xué)科融合與數(shù)據(jù)科學(xué)的興起
很多與數(shù)據(jù)相關(guān)的專門(mén)實(shí)驗(yàn)室、專項(xiàng)研究院所相繼出現(xiàn),《數(shù)據(jù)學(xué)》等專門(mén)著作也紛紛出版,大家認(rèn)為數(shù)據(jù)科學(xué)的雛形已經(jīng)出現(xiàn)。
如圖1所示,大數(shù)據(jù)并不是簡(jiǎn)單的“大的數(shù)據(jù)”。在近年對(duì)大數(shù)據(jù)的闡述中,至少有兩種典型的對(duì)應(yīng)提法:一種是點(diǎn)出“小數(shù)據(jù)”的重要性;另一種是去掉“大”字而強(qiáng)調(diào)“數(shù)據(jù)”本身,強(qiáng)調(diào)數(shù)據(jù)科學(xué)、數(shù)據(jù)技術(shù)、數(shù)據(jù)治理、數(shù)據(jù)產(chǎn)業(yè)等。
大數(shù)據(jù)技術(shù)是多學(xué)科多技術(shù)領(lǐng)域的融合,數(shù)學(xué)和統(tǒng)計(jì)學(xué)、計(jì)算機(jī)類技術(shù)、管理類等都有涉及,大數(shù)據(jù)應(yīng)用更是與多領(lǐng)域產(chǎn)生交叉。這種多學(xué)科之間的交叉融合,呼喚并催生了專門(mén)的基礎(chǔ)性學(xué)科——數(shù)據(jù)學(xué)科?;A(chǔ)性學(xué)科的夯實(shí),將讓學(xué)科的交叉融合更趨完美。
在大數(shù)據(jù)領(lǐng)域,許多相關(guān)學(xué)科從表面上看,研究的方向大不相同,但是從數(shù)據(jù)的視角看,其實(shí)是相通的。隨著社會(huì)的數(shù)字化程度逐步加深,越來(lái)越多的學(xué)科在數(shù)據(jù)層面趨于一致,可以采用相似的思想進(jìn)行統(tǒng)一研究。從事大數(shù)據(jù)研究的人不僅僅是計(jì)算機(jī)領(lǐng)域的科學(xué)家,也包括數(shù)學(xué)等方面的科學(xué)家。
大專委希望業(yè)界對(duì)于大數(shù)據(jù)的邊界采取一個(gè)更寬泛、更包容的姿態(tài),包容所謂的“小數(shù)據(jù)”,甚至將領(lǐng)域的邊界泛化到“數(shù)據(jù)科學(xué)”所對(duì)應(yīng)的整個(gè)數(shù)據(jù)領(lǐng)域和數(shù)據(jù)產(chǎn)業(yè)。
建議共同支持“數(shù)據(jù)科學(xué)”的基礎(chǔ)研究,并努力將基礎(chǔ)研究的成果導(dǎo)入技術(shù)研究和應(yīng)用的范疇中。
圖1 大數(shù)據(jù)與小數(shù)據(jù)
2.3 趨勢(shì)三:大數(shù)據(jù)安全與隱私令人憂慮
安全和隱私每次調(diào)研都會(huì)出現(xiàn)在十大趨勢(shì)中,這表示大家對(duì)于大數(shù)據(jù)所帶來(lái)問(wèn)題的深刻憂慮,這樣的憂慮至少包括以下3個(gè)方面。
第一,大數(shù)據(jù)所受到的威脅也就是常說(shuō)的安全問(wèn)題。這里并不是指利用大數(shù)據(jù)進(jìn)行安全分析的“安全大數(shù)據(jù)”應(yīng)用,而是指當(dāng)大數(shù)據(jù)技術(shù)、系統(tǒng)和應(yīng)用聚集了大量?jī)r(jià)值的時(shí)候,必將成為被攻擊的目標(biāo)。雖然,現(xiàn)在影響巨大的針對(duì)大數(shù)據(jù)的攻擊還沒(méi)有出現(xiàn),但是可以預(yù)見(jiàn)這樣的攻擊必將發(fā)生。
第二,大數(shù)據(jù)的過(guò)度濫用所帶來(lái)的問(wèn)題和副作用,比較典型的就是個(gè)人隱私泄露。在傳統(tǒng)采集分析模式下,很多可以保護(hù)的隱私在大數(shù)據(jù)分析能力下變成了裸奔。類似的問(wèn)題還包括大數(shù)據(jù)分析能力帶來(lái)的商業(yè)秘密泄露和國(guó)家機(jī)密泄露。
第三,心智和意識(shí)上的安全問(wèn)題。這包括兩個(gè)極端:一個(gè)極端是忽視安全問(wèn)題的盲目樂(lè)觀;另一個(gè)極端是過(guò)度擔(dān)憂所帶來(lái)的對(duì)于大數(shù)據(jù)應(yīng)用發(fā)展的掣肘。比如,大數(shù)據(jù)分析對(duì)于隱私保護(hù)的副作用,促使大家必須對(duì)于隱私保護(hù)的接受程度有一個(gè)新的認(rèn)識(shí)和調(diào)整。
對(duì)大數(shù)據(jù)的威脅、大數(shù)據(jù)的副作用、對(duì)大數(shù)據(jù)的極端心智都會(huì)阻礙和破壞大數(shù)據(jù)的發(fā)展。
如圖2所示,大數(shù)據(jù)技術(shù)分別作用在業(yè)務(wù)、威脅、保障措施3個(gè)要素之上,帶來(lái)保護(hù)大數(shù)據(jù)、對(duì)抗大數(shù)據(jù)級(jí)威脅、大數(shù)據(jù)用于安全3方面的安全發(fā)展空間。
建議在大數(shù)據(jù)相關(guān)的研究和開(kāi)發(fā)中,必須保持一個(gè)基礎(chǔ)的比例用于相對(duì)應(yīng)的安全研究,而讓安全方面產(chǎn)生實(shí)質(zhì)性進(jìn)步的驅(qū)動(dòng)力可能是對(duì)于大數(shù)據(jù)的攻擊和濫用的“負(fù)面”研究。
圖2 大數(shù)據(jù)技術(shù)作用于業(yè)務(wù)、威脅、保障措施之上
2.4 趨勢(shì)四:新熱點(diǎn)融入大數(shù)據(jù)多樣化處理模式
大數(shù)據(jù)的處理模式更加多樣化,Hadoop不再成為構(gòu)建大數(shù)據(jù)平臺(tái)的必然選擇。在應(yīng)用模式上,大數(shù)據(jù)處理模式持續(xù)豐富,批量處理、流式計(jì)算、交互式計(jì)算等技術(shù)面向不同的需求場(chǎng)景,將持續(xù)豐富和發(fā)展;在實(shí)現(xiàn)技術(shù)上,內(nèi)存計(jì)算將繼續(xù)成為提高大數(shù)據(jù)處理性能的主要手段,相對(duì)傳統(tǒng)的硬盤(pán)處理方式,在性能上有了顯著提升。特別是開(kāi)源項(xiàng)目Spark,目前已經(jīng)被大規(guī)模應(yīng)用于實(shí)際業(yè)務(wù)環(huán)境中,并發(fā)展成為大數(shù)據(jù)領(lǐng)域最大的開(kāi)源社區(qū)。Spark擁有流計(jì)算、交互查詢、機(jī)器學(xué)習(xí)、圖計(jì)算等多種計(jì)算框架,支持Java、Scala、Python、R等語(yǔ)言接口,使得數(shù)據(jù)使用效率大大提高,吸引了眾多開(kāi)發(fā)者和應(yīng)用廠商的關(guān)注。值得說(shuō)明的是,Spark系統(tǒng)可以基于Hadoop平臺(tái)構(gòu)建,也可以不依賴Hadoop平臺(tái)獨(dú)立運(yùn)行。
很多新的技術(shù)熱點(diǎn)持續(xù)地融入大數(shù)據(jù)的多樣化模式中,目前不會(huì)有一個(gè)一統(tǒng)天下的唯一模式。從2015年中國(guó)大數(shù)據(jù)技術(shù)大會(huì)眾多技術(shù)論壇的安排也可以看到這樣的多樣化態(tài)勢(shì)。技術(shù)各有千秋,形成一個(gè)更加多樣、平衡的發(fā)展路徑,也滿足大數(shù)據(jù)的多樣化需求。大專委的專家們認(rèn)為,這樣的態(tài)勢(shì)還會(huì)持續(xù)下去。
建議將自己機(jī)構(gòu)的大數(shù)據(jù)研究和開(kāi)發(fā),有意識(shí)地鏈接和融入大數(shù)據(jù)技術(shù)生態(tài)中,或者利用技術(shù)生態(tài)的成果,或者回饋技術(shù)生態(tài)。
2.5 趨勢(shì)五:大數(shù)據(jù)提升社會(huì)治理和民生領(lǐng)域應(yīng)用
基于大數(shù)據(jù)的社會(huì)治理成為業(yè)界關(guān)注熱點(diǎn),涉及智慧城市、應(yīng)急、稅收、反恐、農(nóng)業(yè)等多個(gè)民生領(lǐng)域。
大數(shù)據(jù)從來(lái)都是應(yīng)用驅(qū)動(dòng),技術(shù)發(fā)力。在最易獲得大數(shù)據(jù)應(yīng)用成果的互聯(lián)網(wǎng)環(huán)境之后,大數(shù)據(jù)走進(jìn)國(guó)計(jì)民生成為必然。而在2016年,與民生有關(guān)的應(yīng)用將成為熱點(diǎn)。國(guó)計(jì)與民生并不互斥,涉及民生的國(guó)計(jì)將是快速發(fā)展熱點(diǎn)中的熱點(diǎn)。比如,反恐、醫(yī)療健康等都與老百姓密切相關(guān),同時(shí)也是國(guó)家大計(jì)。
由于更易獲得關(guān)注并對(duì)接真實(shí)需求,建議優(yōu)先投入社會(huì)治理和民生方面的大數(shù)據(jù)工作。
2.6 趨勢(shì)六:《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》驅(qū)動(dòng)產(chǎn)業(yè)生態(tài)
國(guó)務(wù)院在2015年8月31日印發(fā)了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》。綱要明確指出了大數(shù)據(jù)的重要意義,大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力、重塑?chē)?guó)家競(jìng)爭(zhēng)優(yōu)勢(shì)的新機(jī)遇、提升政府治理能力的新途徑。綱要還清晰地提出了大數(shù)據(jù)發(fā)展的主要任務(wù):加快政府?dāng)?shù)據(jù)開(kāi)放共享,推動(dòng)資源整合,提升治理能力;推動(dòng)產(chǎn)業(yè)創(chuàng)新發(fā)展,培育新興業(yè)態(tài),助力經(jīng)濟(jì)轉(zhuǎn)型;強(qiáng)化安全保障,提高管理水平,促進(jìn)健康發(fā)展。綱要還提出了組織、法規(guī)、市場(chǎng)、標(biāo)準(zhǔn)、財(cái)政、人才、國(guó)際交流等幾方面的政策機(jī)制要求。
綱要將對(duì)大數(shù)據(jù)的發(fā)展起到重大的推動(dòng)作用,成為一個(gè)產(chǎn)業(yè)快速發(fā)展的催化劑和政策標(biāo)桿。而各個(gè)地方政府一定會(huì)出臺(tái)類似配套的政策。在中央和地方的政策推動(dòng)下,政府的大數(shù)據(jù)專項(xiàng)扶植政策和一些相關(guān)政策(如大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新的雙創(chuàng)政策)集中出臺(tái)。
政府牽引產(chǎn)業(yè)生態(tài),帶動(dòng)數(shù)據(jù)共享交換。政府帶動(dòng)的數(shù)據(jù)共享將成為數(shù)據(jù)流轉(zhuǎn)的源動(dòng)力,讓數(shù)據(jù)開(kāi)放共享、交換交易成為產(chǎn)業(yè)生態(tài)的新態(tài)勢(shì),政策讓數(shù)據(jù)流轉(zhuǎn)動(dòng)起來(lái)。國(guó)有和民間資本的集中注入,大數(shù)據(jù)相關(guān)的基礎(chǔ)設(shè)施建設(shè)的采購(gòu)和投入,使政策和市場(chǎng)雙重發(fā)力,讓資金流轉(zhuǎn)動(dòng)起來(lái)。政府牽引的產(chǎn)業(yè)生態(tài)發(fā)展成為大數(shù)據(jù)發(fā)展歷程在2016年的突出特點(diǎn)。
建議應(yīng)及時(shí)關(guān)注和跟蹤大數(shù)據(jù)相關(guān)的政策。有實(shí)力的機(jī)構(gòu)應(yīng)投入一定的北向1北向:指戰(zhàn)略、政策法規(guī)、產(chǎn)業(yè)環(huán)境、規(guī)劃、架構(gòu)、治理和管理等方面的非工程、非基礎(chǔ)技術(shù)方面的工作和領(lǐng)域。資源,主動(dòng)影響和引導(dǎo)各級(jí)政府的政策和落實(shí)細(xì)則。
2.7 趨勢(shì)七:深度分析推動(dòng)大數(shù)據(jù)智能應(yīng)用
在學(xué)術(shù)技術(shù)方面,深度分析會(huì)繼續(xù)成為一個(gè)代表,推動(dòng)整個(gè)大數(shù)據(jù)智能的應(yīng)用。這里談到的智能,尤其強(qiáng)調(diào)是涉及人的相關(guān)能力延伸,比如決策預(yù)測(cè)、精準(zhǔn)推薦等。這些涉及人的思維、影響、理解的延展,都將成為大數(shù)據(jù)深度分析的關(guān)鍵應(yīng)用方向。
相比于傳統(tǒng)機(jī)器學(xué)習(xí)算法,深度學(xué)習(xí)提出了一種讓計(jì)算機(jī)自動(dòng)學(xué)習(xí)產(chǎn)生特征的方法,并將特征學(xué)習(xí)融入建立模型的過(guò)程中,從而減少了人為設(shè)計(jì)特征引發(fā)的不完備。深度學(xué)習(xí)借助深層次神經(jīng)網(wǎng)絡(luò)模型,能夠更加智能地提取數(shù)據(jù)不同層次的特征,對(duì)數(shù)據(jù)進(jìn)行更加準(zhǔn)確、有效的表達(dá)。而且訓(xùn)練樣本數(shù)量越大,深度學(xué)習(xí)算法相對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)算法就越有優(yōu)勢(shì)。
目前,深度學(xué)習(xí)已經(jīng)在容易積累訓(xùn)練樣本數(shù)據(jù)的領(lǐng)域,如圖像分類、語(yǔ)音識(shí)別、問(wèn)答系統(tǒng)等應(yīng)用中獲得了重大突破,并取得了成功的商業(yè)應(yīng)用。預(yù)測(cè)隨著越來(lái)越多的行業(yè)和領(lǐng)域逐步完善數(shù)據(jù)的采集和存儲(chǔ),深度學(xué)習(xí)的應(yīng)用會(huì)更加廣泛。當(dāng)然,在分析領(lǐng)域,也并不會(huì)是深度學(xué)習(xí)一統(tǒng)天下的局面。由于大數(shù)據(jù)應(yīng)用的復(fù)雜性,多種方法的融合將是一個(gè)持續(xù)的常態(tài)。
建議保持對(duì)于智能技術(shù)發(fā)展的持續(xù)關(guān)注。在各自的分析領(lǐng)域(如在策劃階段、技術(shù)層面、實(shí)踐環(huán)節(jié)等)嘗試一下深度學(xué)習(xí)還是值得的。
2.8 趨勢(shì)八:數(shù)據(jù)權(quán)屬與數(shù)據(jù)主權(quán)備受關(guān)注
數(shù)據(jù)權(quán)屬與數(shù)據(jù)主權(quán)被高度關(guān)注,在個(gè)人和一般機(jī)構(gòu)看是數(shù)據(jù)權(quán)屬問(wèn)題,從國(guó)家層面看是數(shù)據(jù)主權(quán)問(wèn)題。
大數(shù)據(jù)凸顯了數(shù)據(jù)的巨大價(jià)值。而數(shù)據(jù)的權(quán)屬問(wèn)題并不是傳統(tǒng)的財(cái)產(chǎn)權(quán)、知識(shí)產(chǎn)權(quán)等可以涵蓋的權(quán)屬問(wèn)題。數(shù)據(jù)成為國(guó)家之間爭(zhēng)奪的資源,數(shù)據(jù)主權(quán)成為網(wǎng)絡(luò)空間主權(quán)的重要形態(tài)。
數(shù)據(jù)成為重要的戰(zhàn)略資源。人口紅利、地大物博、經(jīng)濟(jì)實(shí)力、文化優(yōu)勢(shì)等都紛紛體現(xiàn)為數(shù)據(jù)資源儲(chǔ)備和數(shù)據(jù)服務(wù)影響力。
而數(shù)據(jù)資源化、價(jià)值化是數(shù)據(jù)權(quán)屬問(wèn)題和數(shù)據(jù)主權(quán)問(wèn)題的根源。
過(guò)度關(guān)注數(shù)據(jù)權(quán)屬,并仿照財(cái)產(chǎn)權(quán)或知識(shí)產(chǎn)權(quán)模式對(duì)數(shù)據(jù)增加過(guò)多的限制,不利于大數(shù)據(jù)的發(fā)展。在商業(yè)層面和科研層面,現(xiàn)階段應(yīng)當(dāng)看淡一些數(shù)據(jù)權(quán)屬問(wèn)題。而在國(guó)家層面,應(yīng)當(dāng)積極推行數(shù)據(jù)主權(quán)認(rèn)識(shí),并且鼓勵(lì)數(shù)據(jù)進(jìn)口,適當(dāng)限制數(shù)據(jù)出口。
表1 2013-2016年最令人矚目的應(yīng)用領(lǐng)域投票結(jié)果(按照票數(shù)多少?gòu)纳系较屡判颍?/p>
表2 將取得應(yīng)用和技術(shù)突破的數(shù)據(jù)類型投票結(jié)果(按照票數(shù)多少?gòu)纳系较屡判颍?/p>
2.9 趨勢(shì)九:互聯(lián)網(wǎng)、金融、健康保持熱度,智慧城市、企業(yè)數(shù)據(jù)化、工業(yè)大數(shù)據(jù)是新增長(zhǎng)點(diǎn)
我國(guó)大數(shù)據(jù)應(yīng)用領(lǐng)域最早獲得成果的就是互聯(lián)網(wǎng)應(yīng)用(包括電商等),而持續(xù)受到高度關(guān)注的應(yīng)用領(lǐng)域還包括金融和健康,互聯(lián)網(wǎng)、金融、健康可稱為大數(shù)據(jù)應(yīng)用領(lǐng)域的老三樣。而智慧城市、企業(yè)數(shù)據(jù)化、工業(yè)大數(shù)據(jù)則成為新的增長(zhǎng)點(diǎn),這新三樣就是城市、企業(yè)、工業(yè)的數(shù)據(jù)化,或者說(shuō)是城市生活、企業(yè)貿(mào)易和管理、工業(yè)生產(chǎn)過(guò)程的數(shù)據(jù)化和大數(shù)據(jù)應(yīng)用。新三樣是一種更廣泛的應(yīng)用領(lǐng)域覆蓋。表1和表2分別為2013-2016年最令人矚目的應(yīng)用領(lǐng)域投票結(jié)果和2015-2016年將取得應(yīng)用和技術(shù)突破的數(shù)據(jù)類型投票結(jié)果。
從表1和表2可以看出,“最令人矚目的應(yīng)用領(lǐng)域”和“將取得應(yīng)用和技術(shù)突破的數(shù)據(jù)類型”這兩項(xiàng)調(diào)研投票的結(jié)果印證了老三樣和新三樣的判斷。
建議順應(yīng)潮流,這樣更易獲得資源支持。
2.10 趨勢(shì)十:開(kāi)源、測(cè)評(píng)、大賽催生良性人才與技術(shù)生態(tài)
大數(shù)據(jù)是應(yīng)用驅(qū)動(dòng),技術(shù)發(fā)力,技術(shù)與應(yīng)用一樣至關(guān)重要。決定技術(shù)的是人才及其技術(shù)生產(chǎn)方式。
開(kāi)源系統(tǒng)將成為大數(shù)據(jù)領(lǐng)域的主流技術(shù)和系統(tǒng)選擇。以Hadoop為代表的開(kāi)源技術(shù)拉開(kāi)了大數(shù)據(jù)技術(shù)的序幕,大數(shù)據(jù)應(yīng)用的發(fā)展又促進(jìn)了開(kāi)源技術(shù)的進(jìn)一步發(fā)展。開(kāi)源技術(shù)的發(fā)展降低了數(shù)據(jù)處理的成本,引領(lǐng)了大數(shù)據(jù)生態(tài)系統(tǒng)的蓬勃發(fā)展,同時(shí)也給傳統(tǒng)數(shù)據(jù)庫(kù)廠商帶來(lái)了挑戰(zhàn)。新的替代性技術(shù),都是新技術(shù)生態(tài)對(duì)于舊技術(shù)生態(tài)的侵蝕、拓展和進(jìn)化。
對(duì)數(shù)據(jù)處理的能力、性能等進(jìn)行測(cè)試、評(píng)估、標(biāo)桿比對(duì)的第三方形態(tài)出現(xiàn),并逐步成為熱點(diǎn)。相對(duì)公正的技術(shù)評(píng)價(jià)有利于優(yōu)秀技術(shù)占領(lǐng)市場(chǎng),驅(qū)動(dòng)優(yōu)秀技術(shù)的研發(fā)生態(tài)。
各類創(chuàng)業(yè)創(chuàng)新大賽紛紛舉辦,大賽為人才的培養(yǎng)和選拔提供了新模式。各類創(chuàng)業(yè)創(chuàng)新大賽完善人才生態(tài)。
大數(shù)據(jù)技術(shù)生態(tài)是一個(gè)復(fù)雜環(huán)境。在2016年,“開(kāi)源”會(huì)一如既往占據(jù)主流,而測(cè)評(píng)和大賽將形成突破性發(fā)展。
建議不要閉門(mén)搞大數(shù)據(jù)技術(shù)和系統(tǒng),要開(kāi)門(mén)融入世界性的技術(shù)生態(tài)中。
2016年大數(shù)據(jù)產(chǎn)業(yè)技術(shù)發(fā)展的十大趨勢(shì)預(yù)測(cè)可以簡(jiǎn)單解讀為4個(gè)關(guān)鍵詞:一是“民生”,在眾多的大數(shù)據(jù)相關(guān)應(yīng)用中,相對(duì)來(lái)說(shuō),與民生相關(guān)的大數(shù)據(jù)可能會(huì)得到更快的發(fā)展,比如:健康醫(yī)療、社會(huì)治安、環(huán)境保護(hù)等;二是“多樣性和融合性”,包括技術(shù)模式融合、產(chǎn)業(yè)融合等各方面的融合;三是“政策拉動(dòng)”;四是“生態(tài)”,產(chǎn)業(yè)生態(tài)、技術(shù)生態(tài)等生態(tài)的構(gòu)建是發(fā)展的大環(huán)境。
2013-2016年對(duì)大數(shù)據(jù)發(fā)展的十大趨勢(shì)預(yù)測(cè)結(jié)果見(jiàn)表3。
表3 2013-2016年對(duì)大數(shù)據(jù)發(fā)展的十大趨勢(shì)預(yù)測(cè)
3.1 與大數(shù)據(jù)最匹配的概念
大數(shù)據(jù)本身具有很強(qiáng)的概念性,不可否認(rèn)大數(shù)據(jù)有它的泡沫(甚至炒作的成分),但是不能因?yàn)槠【粕厦嬗信菽艞壍紫孪銤獾钠【啤4髮N槍?duì)時(shí)下流行的重大概念進(jìn)行調(diào)研,在眾多流行的概念中,專家們認(rèn)為和大數(shù)據(jù)最匹配的概念是“互聯(lián)網(wǎng)+、云計(jì)算和智慧城市”,而其他選項(xiàng)(物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、大眾創(chuàng)業(yè)萬(wàn)眾創(chuàng)新、工業(yè)互聯(lián)網(wǎng)(工業(yè)4.0)、智能生活設(shè)備、一帶一路)則具有數(shù)量級(jí)的落差。
建議讓自己的大數(shù)據(jù)工作,同時(shí)再掛上1~2個(gè)業(yè)界熱點(diǎn)概念。這是有益而無(wú)害的,只要不僅僅停留在概念炒作。
3.2 我國(guó)大數(shù)據(jù)發(fā)展最主要的推動(dòng)者
表4為2015-2016年我國(guó)大數(shù)據(jù)發(fā)展最主要推動(dòng)者的調(diào)研結(jié)果,可以看出,目前最主要的推動(dòng)者是大型互聯(lián)網(wǎng)公司、政府機(jī)構(gòu)和創(chuàng)業(yè)公司。
從表4可以看出大型互聯(lián)網(wǎng)公司的慣性優(yōu)勢(shì),2016年以綱要為代表的政策性支持、雙創(chuàng)政策對(duì)于創(chuàng)業(yè)激情的拉動(dòng),將是大數(shù)據(jù)發(fā)展的主要推動(dòng)力,而科研和公共服務(wù)的影響則相對(duì)弱化了。
建議讓自己的機(jī)構(gòu)變成推動(dòng)者或者與這3類推動(dòng)者建立合作。
表4 2015-2016年我國(guó)大數(shù)據(jù)發(fā)展最主要推動(dòng)者的調(diào)研結(jié)果
3.3 數(shù)據(jù)資源流轉(zhuǎn)并不樂(lè)觀
在大專委即將發(fā)布的第三本《中國(guó)大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展年度報(bào)告》中,重點(diǎn)闡述了大數(shù)據(jù)開(kāi)放共享的問(wèn)題。今年的趨勢(shì)調(diào)研也專門(mén)設(shè)立了這樣一項(xiàng)調(diào)研:2016年,100多位專家和他的機(jī)構(gòu)對(duì)數(shù)據(jù)的態(tài)度是什么,對(duì)數(shù)據(jù)流轉(zhuǎn)的態(tài)度是什么。從調(diào)研結(jié)果中看到,大家都想自己收集數(shù)據(jù),希望能夠利用收集的數(shù)據(jù)進(jìn)行數(shù)據(jù)服務(wù),希望能夠買(mǎi)到數(shù)據(jù)集,而準(zhǔn)備賣(mài)數(shù)據(jù)集的機(jī)構(gòu)非常少。整個(gè)數(shù)據(jù)流轉(zhuǎn)上是需求大于供給的狀態(tài),數(shù)據(jù)確實(shí)奇貨可居。而考慮數(shù)據(jù)國(guó)際交換和賣(mài)數(shù)據(jù)的投票者更是屈指可數(shù)。整個(gè)數(shù)據(jù)流轉(zhuǎn)的態(tài)勢(shì)不容樂(lè)觀。希望通過(guò)政府開(kāi)放共享拉動(dòng)數(shù)據(jù)交流和交換。
在現(xiàn)有的生態(tài)環(huán)境下,想要免費(fèi)或者低價(jià)獲得高品質(zhì)的數(shù)據(jù)是有困難的,要降低這種期望值。在數(shù)據(jù)需求大于供給的大環(huán)境下,數(shù)據(jù)采集和儲(chǔ)藏是一個(gè)很合算的投入方向,如果再結(jié)合輕度的數(shù)據(jù)冶煉,可以讓自己的機(jī)構(gòu)進(jìn)入搶手的數(shù)據(jù)提供者行列。
表5 對(duì)大數(shù)據(jù)發(fā)展階段的判斷
3.4 對(duì)大數(shù)據(jù)發(fā)展階段的判斷體現(xiàn)出對(duì)于成長(zhǎng)性的極為樂(lè)觀
表5為對(duì)大數(shù)據(jù)發(fā)展階段的判斷結(jié)果。大專委的專家對(duì)當(dāng)前中國(guó)大數(shù)據(jù)所處的階段進(jìn)行選擇(單選)。從2015年和2016年的調(diào)研結(jié)果對(duì)比可以看出,專家們具有明顯的樂(lè)觀態(tài)度,2016年預(yù)測(cè)上升的人數(shù)增加,而預(yù)測(cè)下降的人數(shù)屈指可數(shù)。而且選擇“極為初級(jí)”和“即將快速擴(kuò)張”兩個(gè)階段的專家超過(guò)70%,也就是認(rèn)為大數(shù)據(jù)的峰頂還遠(yuǎn)沒(méi)有看到,是極為樂(lè)觀的發(fā)展預(yù)期。在政策、市場(chǎng)、技術(shù)的多重推動(dòng)下,大數(shù)據(jù)將有非常美好的前景。
建議投入、投入、投入!投入資源到大數(shù)據(jù)領(lǐng)域,贏的概率很大。
3.5 群體智慧和“黑天鵝”
上述是對(duì)大專委專家們觀點(diǎn)的統(tǒng)計(jì)性結(jié)果和解讀分析,難以涵蓋專家們的獨(dú)特觀點(diǎn)和“黑天鵝判斷”。不過(guò),這樣的群體性預(yù)測(cè),仍具有很高的參考價(jià)值。2016年大數(shù)據(jù)領(lǐng)域是否會(huì)出現(xiàn)重大“黑天鵝事件”的投票結(jié)果顯示,42%的專家認(rèn)為會(huì)出現(xiàn),而58%的專家認(rèn)為不會(huì)。
大數(shù)據(jù)領(lǐng)域的“黑天鵝”絕對(duì)是機(jī)遇大于威脅。積極地為“黑天鵝”做好準(zhǔn)備,也就是讓自己的機(jī)構(gòu)有能力根據(jù)突發(fā)的“黑天鵝”而調(diào)動(dòng)(或者撬動(dòng))10%以上的資源。
TP399
A
10.11959/j.issn.2096-0271.2016012