文|青鋒
小荷已露尖尖角
——悄然來臨的大數(shù)據(jù)時(shí)代
文|青鋒
“我們每個(gè)月向經(jīng)銷商推薦大約150個(gè)目標(biāo)客戶,因?yàn)樗麄兿胙?qǐng)潛在客戶來訪問他們的經(jīng)銷點(diǎn),但同時(shí)他們又不愿將營(yíng)銷資金浪費(fèi)在根本沒有購(gòu)買意圖的用戶身上。通過基于像年齡、性別、地理位置、財(cái)務(wù)信息、售后體驗(yàn)及購(gòu)買歷史記錄等10~15個(gè)變量來定義預(yù)測(cè)模型,我們可以告訴經(jīng)銷商:這100個(gè)人是在這個(gè)地區(qū)極有可能購(gòu)買新車的客戶,而那100個(gè)人的購(gòu)買可能性較低?!?/p>
這是菲亞特汽車公司客戶智能及宣傳經(jīng)理Giovanni Lux的一段話,他所談到的數(shù)據(jù)信息來自于菲亞特的客戶關(guān)系及體驗(yàn)分析數(shù)據(jù)庫(kù),它包含了超過6400萬個(gè)客戶及6400萬輛汽車的歷史信息。
菲亞特在這里所用到的數(shù)據(jù)庫(kù)便是當(dāng)前日益引人關(guān)注的大數(shù)據(jù),所謂大數(shù)據(jù),指的是超過傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)處理能力的數(shù)據(jù),它具有四個(gè)顯著的特點(diǎn):第一,數(shù)據(jù)體量巨大,從傳統(tǒng)的TB級(jí)別躍升到PB級(jí)別;第二,數(shù)據(jù)類型繁多,數(shù)據(jù)信息涵蓋網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等;第三,價(jià)值密度低,以視頻為例,在連續(xù)不間斷的龐大數(shù)據(jù)中,可能有用的數(shù)據(jù)僅僅有一兩秒;第四,對(duì)數(shù)據(jù)的處理要求高,即1秒定律。
圖1 大數(shù)據(jù)時(shí)代悄然來臨
隨著人類信息化步伐的加快,特別是云計(jì)算的大范圍運(yùn)用,大數(shù)據(jù)正在成為一大熱門話題,正如VMware公司全球高級(jí)副總裁范承工所說:“你發(fā)的一個(gè)微博、上傳的一段視頻,都是大數(shù)據(jù)。”大數(shù)據(jù)之所以被人們所重視,是因?yàn)橄鄬?duì)于傳統(tǒng)意義上的數(shù)據(jù),大數(shù)據(jù)承載的內(nèi)容更豐富、更細(xì)致,幾乎無所不含。但與之相對(duì)應(yīng)的是,對(duì)大數(shù)據(jù)中有用數(shù)據(jù)的整理也更為困難,而一旦能夠?qū)Υ髷?shù)據(jù)進(jìn)行有效的整理,其價(jià)值又遠(yuǎn)遠(yuǎn)大于傳統(tǒng)數(shù)據(jù)。
其實(shí)無論我們的主觀意識(shí)如何,在人類進(jìn)入信息化時(shí)代后,大數(shù)據(jù)便已在客觀上悄然產(chǎn)生,在不經(jīng)意間逐漸累積,只是在過去很長(zhǎng)一段時(shí)間里,我們尚沒有能力掌控大數(shù)據(jù),在技術(shù)層面無法對(duì)大數(shù)據(jù)進(jìn)行甄選,從中挖掘出可供我們使用的有效內(nèi)容。今天,隨著IT設(shè)備的長(zhǎng)足發(fā)展,隨著網(wǎng)絡(luò)條件的成熟,隨著云計(jì)算從實(shí)驗(yàn)室走向市場(chǎng),我們終于具備了在浩瀚的大數(shù)據(jù)中“掘金”的條件,開始向著這片蘊(yùn)藏著豐厚寶藏的海洋進(jìn)軍。
云計(jì)算的應(yīng)用使數(shù)據(jù)庫(kù)提升到了一個(gè)新的層級(jí),更大的存儲(chǔ)空間、更迅速的響應(yīng)時(shí)間、更豐富的信息來源,云數(shù)據(jù)庫(kù)引發(fā)了新一輪的信息數(shù)據(jù)“大爆炸”。云計(jì)算使我們對(duì)信息的收集前所未有的豐富和快捷,為大數(shù)據(jù)的分析奠定了堅(jiān)實(shí)的基礎(chǔ)。面對(duì)數(shù)據(jù)庫(kù)中琳瑯滿目的各式各樣的數(shù)據(jù),不對(duì)其進(jìn)行分析,不從這些堆積如山的資源中挖掘出有價(jià)值的信息,不在這豐厚的寶藏中產(chǎn)生出利益,顯然不符合人類的知識(shí)需求。于是,在云計(jì)算進(jìn)入市場(chǎng)應(yīng)用后的短短時(shí)間里,大數(shù)據(jù)的開發(fā)便開始被人們所關(guān)注,并正在付諸各類實(shí)驗(yàn)性的應(yīng)用。
“雖然大數(shù)據(jù)本身是以數(shù)據(jù)形式存在,但大數(shù)據(jù)時(shí)代真正的到來離不開云計(jì)算的促進(jìn)作用。以前我們都談虛擬化、云計(jì)算,當(dāng)虛擬化進(jìn)入到各種各樣的商務(wù)應(yīng)用的時(shí)候,對(duì)虛擬化或者對(duì)云計(jì)算的框架最核心的沖擊便是對(duì)大數(shù)據(jù)應(yīng)用的需求,所以如何在虛擬架構(gòu)上優(yōu)化大數(shù)據(jù)應(yīng)用是很自然的一步。”VMware公司全球副總裁、中國(guó)研發(fā)中心總經(jīng)理李嚴(yán)冰精準(zhǔn)地描述了大數(shù)據(jù)與云計(jì)算的關(guān)系。
但一個(gè)顯而易見的問題是,對(duì)大數(shù)據(jù)的收集僅僅是“萬里長(zhǎng)征走完了第一步”,當(dāng)云計(jì)算“輕而易舉”地完成著對(duì)大數(shù)據(jù)的收集工作時(shí),該如何對(duì)這些龐大的數(shù)據(jù)信息進(jìn)行整理、分類、分析,成為擺在人們面前的一道難題。而一旦無法進(jìn)行以上的工作,原始的數(shù)據(jù)便只是一堆“素材”,無法轉(zhuǎn)變?yōu)橛袃r(jià)值的內(nèi)容,當(dāng)然更不能直接為我們帶來經(jīng)濟(jì)回報(bào)。
前文列舉的菲亞特汽車公司的案例中,他們最后的分析結(jié)果來源于IBM提供的IBM SPSS解決方案?!癐BM SPSS Statistics和IBM SPSS Modeler幫助我們?cè)诂F(xiàn)有的和潛在的菲亞特汽車車主中識(shí)別出特定的目標(biāo),使經(jīng)銷商可以用最高效的方式分配其營(yíng)銷預(yù)算。第二,我們調(diào)查已購(gòu)買新車或使用過菲亞特維修店的客戶。然后我們使用IBM SPSS Statistics分析這些數(shù)據(jù)以提供有價(jià)值的洞察,了解客戶對(duì)我們的經(jīng)銷商及維修中心的滿意度?!狈苼喬仄嚬究蛻糁悄芗靶麄鹘?jīng)理Giovanni Lux這樣解釋這套在IBM訂制的解決方案的用途。
顯然,針對(duì)大數(shù)據(jù)進(jìn)行相應(yīng)的產(chǎn)品開發(fā),為大數(shù)據(jù)的歸類和分析提供成套解決方案,已經(jīng)成為相關(guān)企業(yè)一項(xiàng)新的業(yè)務(wù)發(fā)展規(guī)劃?!巴ǔ5腍adoop只針對(duì)物理機(jī)進(jìn)行了優(yōu)化,類似于物理機(jī),我們把同樣的技術(shù)直接搬到虛擬機(jī)上,針對(duì)虛擬機(jī)運(yùn)行環(huán)境對(duì)Hadoop開源技術(shù)專門進(jìn)行一些優(yōu)化,同時(shí)我們這一技術(shù)也直接貢獻(xiàn)給Hadoop社區(qū)。”李嚴(yán)冰描繪出一幅具體的發(fā)展藍(lán)圖,“這個(gè)項(xiàng)目歷經(jīng)了兩年研發(fā),現(xiàn)在我們覺得大數(shù)據(jù)處理的商機(jī)比較成熟了,通過幾個(gè)月的時(shí)間就把它進(jìn)入了一個(gè)項(xiàng)目化、產(chǎn)品化的階段?!?/p>
當(dāng)這一產(chǎn)業(yè)鏈逐步成型之后,越來越多的企業(yè)會(huì)感受到大數(shù)據(jù)分析所帶來的益處,也會(huì)對(duì)大數(shù)據(jù)的收集日益重視。目前通用汽車的安吉星服務(wù)每年管理的數(shù)據(jù)量已多達(dá)3PB,該服務(wù)為車主提供遠(yuǎn)程車輛診斷服務(wù)、應(yīng)對(duì)突發(fā)事件,這些數(shù)據(jù)無疑就是一筆金礦。利用這筆豐富的信息資源,通用公司正千方百計(jì)對(duì)其進(jìn)行多層面的分析,轉(zhuǎn)而為客戶提供一系列有針對(duì)性的服務(wù),使其成為一種市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)。
中國(guó)聯(lián)通也正在通過采用基于至強(qiáng)平臺(tái)及英特爾發(fā)行版Hadoop的大數(shù)據(jù)解決方案來構(gòu)建移動(dòng)通信用戶上網(wǎng)記錄集中查詢與分析支撐系統(tǒng)?!斑@一系統(tǒng)可為我們的客戶服務(wù)人員提供客戶上網(wǎng)記錄的快速查詢服務(wù),也可為客戶本人提供高效的異常大流量的上網(wǎng)記錄自助查詢服務(wù),這將有助于解決流量投訴問題。”中國(guó)聯(lián)通研究院副院長(zhǎng)黃文良表示,2012年10月將結(jié)束整個(gè)項(xiàng)目的建設(shè),屆時(shí)除了為客戶服務(wù)人員提供服務(wù)外,系統(tǒng)還可以為中國(guó)聯(lián)通的業(yè)務(wù)部門提供分析、決策服務(wù),未來該系統(tǒng)還有望幫助中國(guó)聯(lián)通更為準(zhǔn)確地把握用戶偏好,從而讓中國(guó)聯(lián)通能更有效地制定市場(chǎng)策略和開發(fā)新業(yè)務(wù)。
圖2 大數(shù)據(jù)解決方案正在步入市場(chǎng)
雖然大數(shù)據(jù)目前在國(guó)內(nèi)還處于初級(jí)階段,但是商業(yè)價(jià)值已經(jīng)顯現(xiàn)。首先,手中握有數(shù)據(jù)的公司如同站在“金礦”上,基于數(shù)據(jù)交易即可產(chǎn)生很好的效益;其次,基于數(shù)據(jù)挖掘會(huì)有很多商業(yè)模式誕生,定位角度不同,或側(cè)重?cái)?shù)據(jù)分析。比如幫企業(yè)做內(nèi)部數(shù)據(jù)挖掘,或側(cè)重優(yōu)化,幫企業(yè)更精準(zhǔn)找到用戶,降低營(yíng)銷成本,提高企業(yè)銷售率,增加利潤(rùn)。據(jù)統(tǒng)計(jì),目前大數(shù)據(jù)所形成的市場(chǎng)規(guī)模在51億美元左右,而到2017年,此數(shù)據(jù)預(yù)計(jì)會(huì)上漲到530億美元。
大數(shù)據(jù)是一個(gè)很好的視角和工具,從資本角度來看,什么樣的公司有價(jià)值,什么樣的公司沒有價(jià)值,從其擁有的數(shù)據(jù)規(guī)模、數(shù)據(jù)的活性和這家公司能運(yùn)用、解釋數(shù)據(jù)的能力,就可以看出這家公司的核心競(jìng)爭(zhēng)力,而這幾個(gè)能力正是資本關(guān)注的點(diǎn)。移動(dòng)互聯(lián)網(wǎng)與社交網(wǎng)絡(luò)的興起將大數(shù)據(jù)帶入新的征程,互聯(lián)網(wǎng)營(yíng)銷將在行為分析的基礎(chǔ)上向個(gè)性化時(shí)代過渡。對(duì)大數(shù)據(jù)進(jìn)行整理和分析后,可以準(zhǔn)確地告訴廣告商什么是正確的時(shí)間,誰是正確的用戶,什么是應(yīng)該發(fā)表的正確內(nèi)容等,這正好切中了廣告商的需求。
一場(chǎng)圍繞大數(shù)據(jù)的新業(yè)務(wù)正在展現(xiàn)出其勃勃的市場(chǎng)生機(jī)。