今天,什么樣的數(shù)據(jù)在產(chǎn)生?傳統(tǒng)的數(shù)據(jù)大家都知道,比如在一個(gè)企業(yè)內(nèi)部,有大量的數(shù)據(jù),它們基本上是格式化的,像CRM、ERP等,還有在整個(gè)運(yùn)行當(dāng)中的處理企業(yè)內(nèi)部的數(shù)據(jù)。此外,社交網(wǎng)絡(luò)給我們帶來大量人類的一些數(shù)據(jù),你可以看到各方面的數(shù)字:每天3億的用戶,大量的微博、微信等等。但是不要忘記人類其實(shí)產(chǎn)生了很多的機(jī)器,這些感應(yīng)器產(chǎn)生的數(shù)字更大,它每天都在產(chǎn)生。
大數(shù)據(jù):記錄人類歷史
大數(shù)據(jù)對(duì)人們有什么作用?大數(shù)據(jù)正在記錄著我們?nèi)祟惏l(fā)生的歷史。也許往前追溯1000年、2000年,甚至3000年,我們并不是很知道人類在干些什么,而是通過考古去挖掘,去發(fā)現(xiàn)以前文獻(xiàn)里的一些蛛絲馬跡。但是試想1000年、2000年之后的人類看我們今天,有如此大量的信息,他便可以重現(xiàn),到了這種程度,他可以重新模仿和重現(xiàn)今天的世界。通過定位我們每個(gè)人使用的手機(jī),一生的軌跡都可以重現(xiàn)。所以在網(wǎng)上所說的話和所做的事情,不知不覺當(dāng)中就成為數(shù)字足跡,都已經(jīng)被記錄下來。大數(shù)據(jù)對(duì)商業(yè)來說有巨大的價(jià)值,它可以被形容成是一個(gè)自然的資源,取之不盡,不像石油挖了之后沒有了。
回顧一下大數(shù)據(jù)的“4個(gè)V”:Volume(大量)、Variety(多樣)、Velocity(高速)、Veracity(精確)。首先是大量,第二是多樣性,比如各種各樣的語音、非結(jié)構(gòu)的數(shù)據(jù)、圖像等,第三個(gè)是速度,大數(shù)據(jù)產(chǎn)生的速度非??臁W詈笠粋€(gè)并不是很多人注意的,是不精確性,并不是說每個(gè)數(shù)據(jù)都相當(dāng)精確,有很多的含糊性和矛盾的。其實(shí)矛盾是一件好事,往往說信息量大是什么意思?不精準(zhǔn),挖掘出來才是有價(jià)值的,大家都知道的就不是消息了,就不是新聞了。
大數(shù)據(jù)要跟應(yīng)用相結(jié)合,就像我們講云計(jì)算一樣,云計(jì)算的關(guān)鍵并不在于技術(shù),而主要是應(yīng)用。大數(shù)據(jù)只有通過分析才真正可以找到它的應(yīng)用,跟應(yīng)用相結(jié)合,行動(dòng)是挖掘和采集大數(shù)據(jù)的根本原因,并不是為了記錄而記錄。
大數(shù)據(jù)的商業(yè)價(jià)值體現(xiàn)在幾個(gè)方面,比如制造業(yè)中新產(chǎn)品的開發(fā)過程。2006年我曾與馬云交流,探討淘寶真正的競爭實(shí)力是什么?我認(rèn)為真正的競爭實(shí)力是C2B,就是小米的模式。淘寶手上拿著大量的用戶,它的每一個(gè)產(chǎn)品都可以讓這些消費(fèi)者進(jìn)行決策,這些決策當(dāng)中有很多的數(shù)據(jù)可以挖掘,然后根據(jù)消費(fèi)者的喜好,創(chuàng)造新的產(chǎn)品。
此外,還有反洗錢、資產(chǎn)的管理優(yōu)化,對(duì)客戶的洞察等方面的應(yīng)用。所有這些都需要有一個(gè)非常好的平臺(tái),云計(jì)算是大數(shù)據(jù)能夠運(yùn)算的基礎(chǔ)。一方面它是大數(shù)據(jù)的平臺(tái),有信息的整合和治理的過程;另一方面是一個(gè)分析平臺(tái),大數(shù)據(jù)離開分析平臺(tái)是無法進(jìn)行挖掘的。再有就是解決方案,所謂應(yīng)用為王,就是進(jìn)行實(shí)施、服務(wù)。
從球場到商場 應(yīng)用無處不在
這里面有幾個(gè)比較關(guān)鍵的技術(shù),第一是存儲(chǔ)級(jí)的內(nèi)存;第二是流計(jì)算,因?yàn)樗乃俣认喈?dāng)快;第三是硬軟件的結(jié)合;最后是創(chuàng)新的算法來進(jìn)行大數(shù)據(jù)的分析。給大家舉一個(gè)例子,前不久中國的網(wǎng)球公開賽,我們就運(yùn)用了大數(shù)據(jù)進(jìn)行分析。我們進(jìn)行大量的數(shù)據(jù)采集,這個(gè)軟件在法網(wǎng)、澳網(wǎng)等一些大賽當(dāng)中,已經(jīng)應(yīng)用了十幾年。它抓取了大量數(shù)據(jù),有些數(shù)據(jù)我們有可能認(rèn)為是沒什么用的,比如一個(gè)球打完之后,周邊的人的吶喊聲或者鼓掌聲,這些都是數(shù)據(jù)。但是在這種數(shù)據(jù)當(dāng)中其實(shí)體現(xiàn)了很多的信息,是人們對(duì)它的一種熱情呢?還是說氛圍、氣場好呢?我們都說不清楚。但是所有的數(shù)據(jù)放在一起之后,你可以精確地判斷出這場球球沒打完之前誰可以贏,試想我們對(duì)一個(gè)球賽可以做到如此,商業(yè)就像戰(zhàn)場一樣,你怎么樣勝過你的對(duì)手,你的企業(yè)哪些是弱點(diǎn),哪些是強(qiáng)處?都可以來計(jì)算。在醫(yī)學(xué)上面我們有很多應(yīng)用,在一個(gè)新生兒剛剛出生的時(shí)候,這時(shí)生命剛剛開始,如果對(duì)這段時(shí)間所有的醫(yī)療數(shù)據(jù)監(jiān)控并且進(jìn)行處理,你可以看到很多規(guī)律,并且可以預(yù)測(cè)這個(gè)新生兒會(huì)不會(huì)出現(xiàn)問題。
零售業(yè)中有很多大數(shù)據(jù)的應(yīng)用,比較知名的是一個(gè)父親通過一家百貨店寄來的商品促銷廣告,知道了女兒懷孕的事。女性在懷孕過程中會(huì)有一些行為習(xí)慣的改變,比如不喜歡買有味道的商品,如果一個(gè)人以前都是買某一種潤膚膏,突然買了一個(gè)沒有味道的潤膚膏,種種的蛛絲馬跡加在一起,從大數(shù)據(jù)的運(yùn)算當(dāng)中就可以推測(cè)出這位女性懷孕了。
大數(shù)據(jù)對(duì)電力行業(yè)也有相當(dāng)多的幫助,特別是智能電表,放在一些場所,可以及時(shí)地計(jì)算電量,可以為電網(wǎng)部署帶來很大的幫助。在金融方面,反洗錢、反欺詐等,金融當(dāng)中有相當(dāng)多的領(lǐng)域可以用大數(shù)據(jù)進(jìn)行幫助。
IBM推出智慧地球,智慧地球的落地是在智慧城市和智慧的行業(yè)和企業(yè)。智慧城市當(dāng)中有一點(diǎn)大家都是比較熟悉的就是交通,現(xiàn)在世界上某一個(gè)城市,正在應(yīng)用IBM的技術(shù),當(dāng)一個(gè)交通事故剛剛發(fā)生的時(shí)候,交警已經(jīng)到達(dá)現(xiàn)場,救護(hù)車也到達(dá)現(xiàn)場。就好像是它們已經(jīng)知道在這個(gè)地方交通事故會(huì)發(fā)生,而救護(hù)車早到一分鐘和晚到一分鐘對(duì)他的生命,對(duì)他的救護(hù)都是至關(guān)重要的。我們?cè)趺茨軌蜃龅竭@一點(diǎn)?其實(shí)人類很多的行為和行動(dòng)是可預(yù)知的,在以往的大量的交通數(shù)據(jù),包括時(shí)間、路況和行車速度,再加上別的一些因素,可以分析出,有90%的概率在這個(gè)點(diǎn)可能會(huì)發(fā)生交通事故。那么,能不能避免這個(gè)交通事故的發(fā)生?也是可以的。我們只要加上一些參數(shù),比如說用交通車控制它,使得流量慢慢減弱,或者把燈光打得更加亮一些,使當(dāng)?shù)剀嚵鞯拿恳粋€(gè)駕駛員都得到警示等,這些措施可以使得交通事故的發(fā)生率降低,使得一個(gè)交通事故不容易發(fā)生。這就是大數(shù)據(jù)對(duì)我們?nèi)祟愃鶐淼氖虑?,給我們每個(gè)企業(yè)和每一個(gè)人的生活所帶來的便利。