陳宇
摘要:搜索2013年全球熱議詞匯,大數(shù)據(jù)必然名列其中,不論是作為當(dāng)今世界最發(fā)達(dá)國(guó)家的美國(guó),還是最大發(fā)展中國(guó)家的中國(guó)都將“大數(shù)據(jù)”上升到國(guó)家發(fā)展的戰(zhàn)略,并視之為決戰(zhàn)未來(lái)國(guó)家競(jìng)爭(zhēng)力的不二選擇利器,數(shù)據(jù)作為最有價(jià)值的資產(chǎn),掌握了數(shù)據(jù)便可站在信息不對(duì)稱(chēng)的高點(diǎn)贏得先機(jī)。當(dāng)今時(shí)代正處在一個(gè)數(shù)據(jù)爆炸式增長(zhǎng)的“大數(shù)據(jù)”時(shí)代,各行各業(yè)都離不開(kāi)數(shù)據(jù),所以大數(shù)據(jù)也必將在社會(huì)經(jīng)濟(jì)、政治、文化,人們生活等各個(gè)方面對(duì)整個(gè)社會(huì)產(chǎn)生了深遠(yuǎn)影響,同時(shí)我們對(duì)數(shù)據(jù)的駕馭能力也迎來(lái)了新的挑戰(zhàn)和機(jī)遇。
一、大數(shù)據(jù)時(shí)代產(chǎn)生的背景
隨著互聯(lián)網(wǎng)信息化時(shí)代的發(fā)展深化,電子數(shù)據(jù)存儲(chǔ)量呈現(xiàn)爆炸式的增長(zhǎng),全球每秒鐘發(fā)送2.9百萬(wàn)封電子郵件,每天會(huì)有2.88萬(wàn)個(gè)小時(shí)的視頻上傳到Y(jié)outube,亞馬遜每天產(chǎn)生6.3百萬(wàn)筆訂單,Google每天需要處理24PB的數(shù)據(jù),IDC數(shù)據(jù)顯示在2011年這個(gè)數(shù)字已經(jīng)到180萬(wàn)PB,2015年將會(huì)達(dá)到800萬(wàn)PB,并且還將呈數(shù)量級(jí)增長(zhǎng),正是這種天文級(jí)別的數(shù)據(jù)的出現(xiàn),以及如何在如此海量,且結(jié)構(gòu)復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)價(jià)值,宣告著大數(shù)據(jù)時(shí)代的到來(lái)。
大數(shù)據(jù)一般指所涉及到的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)提取、管理、處理并形成價(jià)值信息的咨詢(xún)。這類(lèi)數(shù)據(jù)一般有4V特征,一是體量性,就是數(shù)據(jù)量巨大,傳統(tǒng)數(shù)據(jù)只考慮結(jié)構(gòu)化數(shù)據(jù),大數(shù)據(jù)時(shí)代非結(jié)構(gòu)化數(shù)據(jù)這種比結(jié)構(gòu)化數(shù)據(jù)大的多的數(shù)據(jù)帶來(lái)了存儲(chǔ)量大,計(jì)算量大的新問(wèn)題。二是多樣性,數(shù)據(jù)的來(lái)源不僅僅局限于數(shù)字?jǐn)?shù)據(jù),文本數(shù)據(jù),圖片,語(yǔ)音,視頻等都是數(shù)據(jù)。三是快速性,數(shù)據(jù)量增長(zhǎng)數(shù)據(jù)快,處理速度要求快。四是價(jià)值稀缺性,數(shù)據(jù)量如此復(fù)雜海量,真正有價(jià)值的數(shù)據(jù)卻如浪里陶沙般稀少卻又尼足珍貴。
二、大數(shù)據(jù)時(shí)代的商業(yè)變革
大數(shù)據(jù)如此誘人的原因在于,利用大數(shù)據(jù)技術(shù)可以通過(guò)對(duì)影響實(shí)體的全部數(shù)據(jù)的實(shí)時(shí)采集、處理、分析及時(shí)把控實(shí)體的運(yùn)行,從而以最快的市場(chǎng)反應(yīng)改善實(shí)體自身經(jīng)營(yíng)水平、提升自身經(jīng)營(yíng)效率,優(yōu)化自身結(jié)構(gòu)。這將根本改變企業(yè)因未能“更加了解他的客戶(hù)”以及“市場(chǎng)反應(yīng)過(guò)慢”而引起的衰落。索尼公司的創(chuàng)始人出井伸之解釋索尼衰落的根本原因時(shí),說(shuō)了一段發(fā)人深省的話(huà):“新一代基于互聯(lián)網(wǎng)DNA企業(yè)的核心能力在于利用新模式和新技術(shù)更加貼近消費(fèi)者、深刻理解需求、高效分析信息并做出預(yù)判,所有傳統(tǒng)的產(chǎn)品公司都只能淪為這種新型用戶(hù)平臺(tái)級(jí)公司的附庸,其衰落不是管理能扭轉(zhuǎn)的?!庇纱丝磥?lái),大數(shù)據(jù)欣起之火熱不難理解。也因此可以看到,第一,對(duì)大數(shù)據(jù)不關(guān)心,不了解,必步索尼的后塵;第二,擁有大量的數(shù)據(jù),并善加運(yùn)用的公司,必將贏得未來(lái)。
除了對(duì)傳統(tǒng)企業(yè)的顛覆外,大數(shù)據(jù)對(duì)我們的生活也會(huì)有長(zhǎng)足影響,如政務(wù)信息化、智能交通、智慧醫(yī)療等。
2 . 1大數(shù)據(jù)促進(jìn)政務(wù)信息化
經(jīng)過(guò)十多年的政府信息化建設(shè),各個(gè)部門(mén)的信息化平臺(tái)都是獨(dú)成體系,各部門(mén)的數(shù)據(jù)既沒(méi)有統(tǒng)一的收集標(biāo)準(zhǔn),也沒(méi)有互通互用。比如交通局的和氣象局的、統(tǒng)計(jì)局的和社保局的等等互不通用,更談不上數(shù)據(jù)資源整合。很顯然,“數(shù)據(jù)出多門(mén)”導(dǎo)致了一個(gè)個(gè)“數(shù)據(jù)孤島”。這種狀況嚴(yán)重違背了政府信息化的初衷。
如果用數(shù)據(jù)資源體系的理念輔助信息中心,在領(lǐng)導(dǎo)和業(yè)務(wù)部門(mén)之間構(gòu)造一個(gè)數(shù)據(jù)資源體系,那么由信息中心采集所有業(yè)務(wù)體系所報(bào)送的數(shù)據(jù),通過(guò)同方的數(shù)據(jù)資源體系進(jìn)行加工梳理,把今天的數(shù)據(jù)和歷史數(shù)據(jù)對(duì)接,把現(xiàn)在的數(shù)據(jù)和領(lǐng)導(dǎo)關(guān)心的指標(biāo)關(guān)聯(lián)起來(lái),這樣就形成了非常適合管理和決策使用的數(shù)據(jù)資源體系。
很顯然,大數(shù)據(jù)體系應(yīng)該從各個(gè)部門(mén)的信息中心或者數(shù)據(jù)中心入手,通過(guò)數(shù)據(jù)資源體系支撐過(guò)去在不同行業(yè)中對(duì)管理和決策支持的空白。并且大數(shù)據(jù)技術(shù)把面向業(yè)務(wù)的數(shù)據(jù)轉(zhuǎn)換成了面向管理的數(shù)據(jù)的同時(shí),信息中心的職能也進(jìn)行了很大的提升,大數(shù)據(jù)成為一種有靈性的智能戰(zhàn)略資源。
2 . 2大數(shù)據(jù)讓交通更智能
社會(huì)經(jīng)濟(jì)的快速發(fā)展促使城市機(jī)動(dòng)車(chē)輛的數(shù)量大幅增加。城鎮(zhèn)化的加速打破了城市道路系統(tǒng)的均衡狀態(tài),傳統(tǒng)的交通系統(tǒng)難以滿(mǎn)足當(dāng)前復(fù)雜的交通需求,交通堵塞成為棘手問(wèn)題。用大數(shù)據(jù)技術(shù)可促進(jìn)交通管理模式的變革。大數(shù)據(jù)技術(shù)的主要特點(diǎn)及其對(duì)傳統(tǒng)交通的改變集中在以下方面:
第一,大數(shù)據(jù)的智能性能較好的配置交通資源。傳統(tǒng)的交通管理主要依靠人工的方式進(jìn)行規(guī)劃和管理,難以實(shí)現(xiàn)交通的動(dòng)態(tài)化管理。通過(guò)對(duì)大數(shù)據(jù)的分析處理,可以輔助交通管理制定出較好的統(tǒng)籌與協(xié)調(diào)解決方案。
第二,大數(shù)據(jù)的快速性和可預(yù)測(cè)性能提升交通預(yù)測(cè)的水平,提高交通運(yùn)行效率。利用大數(shù)據(jù)來(lái)減少交通擁堵時(shí)間,提高運(yùn)轉(zhuǎn)效率。當(dāng)車(chē)輛即將進(jìn)入擁堵地段,傳感器可告知駕駛員最佳解決方案,這大大減少了行車(chē)的經(jīng)濟(jì)成本。大數(shù)據(jù)的實(shí)時(shí)性,使處于靜態(tài)閑置的數(shù)據(jù)被處理和需要利用時(shí),即可被智能化利用,使交通運(yùn)行的更加合理。
2 . 3大數(shù)據(jù)讓醫(yī)療更科學(xué)
在中國(guó),2010年,國(guó)家公布的“十二五”規(guī)劃中指出要重點(diǎn)建設(shè)國(guó)家級(jí)、省級(jí)和地市級(jí)三級(jí)衛(wèi)生信息平臺(tái),建設(shè)電子檔案和電子病歷兩個(gè)基礎(chǔ)數(shù)據(jù)庫(kù)等諸項(xiàng)目標(biāo),也就是推進(jìn)醫(yī)療信息化的“3521”工程,通過(guò)開(kāi)放新的具有醫(yī)療價(jià)值的信息源,提高診斷準(zhǔn)確性和速度,預(yù)測(cè)疾病和健康形態(tài),以及取得生命科學(xué)創(chuàng)新的不同見(jiàn)解。美國(guó)管理咨詢(xún)公司麥肯錫全球研究院(MGI)預(yù)測(cè),如果美國(guó)的醫(yī)療行業(yè)能夠有效利用不斷增長(zhǎng)的大數(shù)據(jù)來(lái)提高效率和質(zhì)量,那么每年可創(chuàng)造超過(guò) 3000億美元的額外價(jià)值。而且,在歐洲的發(fā)達(dá)國(guó)家中,僅在提高運(yùn)行效率一項(xiàng)上,政府行政管理部門(mén)就可以利用大數(shù)據(jù)節(jié)省1000億歐元以上的費(fèi)用。
對(duì)于大多數(shù)成功的醫(yī)療機(jī)構(gòu)來(lái)說(shuō),利用大數(shù)據(jù)已經(jīng)成為提高生產(chǎn)力、改進(jìn)護(hù)理水平、增強(qiáng)競(jìng)爭(zhēng)力、加快增長(zhǎng)和創(chuàng)新的關(guān)鍵策略。通過(guò)對(duì)結(jié)構(gòu)性數(shù)據(jù)和非結(jié)構(gòu)性數(shù)據(jù)在內(nèi)的所有醫(yī)療大數(shù)據(jù)進(jìn)行集成,實(shí)現(xiàn)集中管理和更好的資源配置。為了整合醫(yī)院不同部門(mén)或不同生命科學(xué)系統(tǒng)的大數(shù)據(jù),實(shí)現(xiàn)最充分的信息搜索和共享。
在當(dāng)前大數(shù)據(jù)時(shí)代,數(shù)據(jù)充斥所帶來(lái)的影響遠(yuǎn)遠(yuǎn)超出了企業(yè)領(lǐng)域,其不僅能帶來(lái)商業(yè)價(jià)值,亦能產(chǎn)生社會(huì)價(jià)值。但是,大數(shù)據(jù)技術(shù)在智能交通應(yīng)用領(lǐng)域同樣面臨著巨大挑戰(zhàn),包括隱私,數(shù)據(jù)處理硬件設(shè)施、數(shù)據(jù)不完備性、模型有效性等領(lǐng)域,這些都是未來(lái)繼續(xù)需要探討和解決的問(wèn)題。