文 本刊記者 張貝貝
IBM: 企業(yè)級數(shù)據(jù)分析大不同
找準(zhǔn)企業(yè)級數(shù)據(jù)分析的特點,提升企業(yè)數(shù)據(jù)分析能力,才能將大數(shù)據(jù)應(yīng)用落到實處,使得大數(shù)據(jù)分析方案真正做到“為客戶所用”。
“我們在大數(shù)據(jù)領(lǐng)域的定位不是擁有數(shù)據(jù),而是讓企業(yè)的數(shù)據(jù)‘唯您所用’。近年來IBM在全球通過戰(zhàn)略收購、研發(fā)等舉措大幅投資于CAMS等戰(zhàn)略新興領(lǐng)域,包括大數(shù)據(jù)、云計算、移動互聯(lián)、社交、信息安全等,通過這些舉措將IBM在未來不斷地打造成更新的公司。隨著在中國的客戶需要創(chuàng)新的速度不斷發(fā)生改變 ,IBM的戰(zhàn)略也發(fā)生了很大改變,從為中國制造‘Made for China’變成‘Made with China’與中國一起創(chuàng)新?!痹诮张e辦的IBM Insight 2015大數(shù)據(jù)分析峰會上,IBM大中華區(qū)首席執(zhí)行總裁錢大群傳遞著IBM的不斷轉(zhuǎn)變。
環(huán)境保護是關(guān)系國家、政府、社會民生的重要議題,特別是人們對霧霾的關(guān)注程度已經(jīng)到了一個前所未有的高度,如何防治霧霾,讓每個人呼吸新鮮的空氣已經(jīng)成為一個必須解決的問題,那么科技如何為霧霾的治理提供幫助呢?2014年,IBM推出了一個長達十年的計劃——“綠色地平線”(Green Horizon) ,這項計劃的主要目標(biāo)是利用IBM的大數(shù)據(jù)分析和認知計算科技,提升對于霧霾的預(yù)估能力,進行北京地區(qū)的霧霾預(yù)報和應(yīng)對建議。
據(jù)錢大群介紹,目前這個項目已經(jīng)將霧霾的預(yù)報時間從之前的24小時提升到72小時,精度從之前的100平方公里提升到1平方公里,將能夠為首都地區(qū)最終應(yīng)對霧霾挑戰(zhàn)提供重要支持。這里面將收集到的不同數(shù)據(jù)進行整合,包括監(jiān)控單位的數(shù)據(jù)、衛(wèi)星的數(shù)據(jù),再通過不同數(shù)學(xué)模型及IBM的認知能力,使得不同的模型能夠達到最優(yōu)組合,這一過程也使得人們慢慢對霧霾的認知、預(yù)估、應(yīng)對能力不斷加強?!霸接泻玫念A(yù)估能力,對任何的判斷和決定就將更有效,而任何事情判斷和決定事實上都是很大的社會成本,IBM希望做到幫助客戶、企業(yè)或者個人能夠擁有這種能力?!卞X大群說道。
關(guān)于具體的細節(jié),IBM研究院資深研發(fā)總監(jiān)張盟給出了詳細的說明:“為了改善重大會議期間的空氣質(zhì)量,IBM協(xié)助相關(guān)機構(gòu)為京津冀地區(qū)搭建了高精度三維網(wǎng)格模型,這一模型可以清晰呈現(xiàn)未來三天的空氣質(zhì)量狀況,每半徑一公里的單元都會生成自己的空氣指標(biāo)讀數(shù)?!边@個平臺背后是海量數(shù)據(jù)的分析。舉例來說,這些數(shù)據(jù)包括了地面?zhèn)鞲衅魇占臄?shù)據(jù),涵蓋北京市及周邊省份,河北、山東、山西、內(nèi)蒙,可以反映出污染源來自于哪里,到哪里去。而污染還包括了輸送的監(jiān)測,在輸送過程中,風(fēng)往哪里吹?會不會下雨?這都會對污染產(chǎn)生很大影響。“而IBM提供的是,通過大數(shù)據(jù)分析把這些數(shù)據(jù)都收集起來。另外,通過認知計算把我們對這些數(shù)據(jù)的模型模擬結(jié)果,或者一些歷史結(jié)果收集起來,為政府或者企業(yè)管理者提供決策支持?!睆埫朔治龅?。
IBM對準(zhǔn)的企業(yè)級用戶的大數(shù)據(jù)分析與針對個體的大數(shù)據(jù)分析又有哪些不同呢?對此,IBM中國開發(fā)中心信息管理總經(jīng)理朱輝認為,企業(yè)里對于數(shù)據(jù)的留存都是有頂層設(shè)計的,在企業(yè)的數(shù)據(jù)倉庫存放數(shù)據(jù)與在Hadoop里面存放數(shù)據(jù)有很大的不同,數(shù)據(jù)倉庫是先把房間建好,格子先放好,放好之后標(biāo)明每個格子都存放哪些數(shù)據(jù),剩下的工作就是往格子里面放數(shù)據(jù),這個頂層設(shè)計的好處就是你處理存儲的數(shù)據(jù)就只存你有用的東西,在處理數(shù)據(jù)上面也會顯得更高效,因為不需要處理那么多的數(shù)據(jù)。在企業(yè)里面有一句話叫no data is garbage,我要存下來的都是已經(jīng)預(yù)先想好的。
相比于企業(yè)在系統(tǒng)內(nèi)部分析數(shù)據(jù),互聯(lián)網(wǎng)上的大數(shù)據(jù)分析都是跨界分析,比如淘寶上根據(jù)購物客戶的年齡、消費習(xí)慣、購買的物品,會推測這個人最近的動態(tài),可能是在裝修,可能是在準(zhǔn)備結(jié)婚,由此分析來做針對性的精準(zhǔn)營銷。但是企業(yè)級大數(shù)據(jù)分析的關(guān)鍵點更多的體現(xiàn)在:技術(shù)上、流程上、頂層設(shè)計上,如何能夠充分地打破數(shù)據(jù)壁壘做到整合分析,這方面的創(chuàng)新性思維現(xiàn)在企業(yè)還是比較欠缺的,其中有一個很重要的原因是,企業(yè)里并沒有這么一個人,能夠站在一個超脫的高度,統(tǒng)籌地來看企業(yè)內(nèi)部的數(shù)據(jù)資源,然后思考這些資源整合在一起做分析的話會帶來什么新的價值。
對此,上海寶信軟件股份有限公司研發(fā)部總經(jīng)理董文生表示十分贊同:目前企業(yè)里的數(shù)據(jù)往往都是預(yù)先結(jié)構(gòu)化設(shè)計好的,這帶來的問題是如果想做新的嘗試和改變,卻沒有數(shù)據(jù)來支撐你來做這件事情。這也是很多企業(yè)遇到的實際問題,也就是現(xiàn)在數(shù)據(jù)量很大,但單體數(shù)據(jù)價值很小,如果合起來做一些挖掘和分析之后,它的價值才能釋放出來,而這個也是企業(yè)需要不斷去適應(yīng)和接受的思路,對于企業(yè)來說也確實要有一個過程。
通過大數(shù)據(jù)的引領(lǐng),落實“與中國一起創(chuàng)新”的戰(zhàn)略成為IBM開年的首發(fā)選擇,這是因為IBM認為目前的市場已經(jīng)清楚的在傳遞一個信息:即數(shù)據(jù)對一個國家、一個企業(yè)、一個行業(yè)或者個人都已經(jīng)變成很重要的資產(chǎn)。IBM的定位是協(xié)助企業(yè)或行業(yè)更好地利用這些數(shù)據(jù)并透過科技轉(zhuǎn)型的能力,提升客戶的數(shù)據(jù)分析能力,使得數(shù)據(jù)變成Insight(洞察)唯客戶所用。
IBM通過調(diào)研發(fā)現(xiàn),目前使用數(shù)據(jù)變成最有競爭力、最成功的企業(yè)為“D世代企業(yè)”。也就是說如果把企業(yè)分四種的話,第一種是用傳統(tǒng)的手段處理企業(yè)級的數(shù)據(jù),比如生成一些基于結(jié)構(gòu)化數(shù)據(jù)的報表等;第二種企業(yè)不只是對企業(yè)里面來自ERP、CRM這樣的業(yè)務(wù)數(shù)據(jù)進行處理,還了解如何把社交媒體的數(shù)據(jù)引如企業(yè)進行分析,但是處理數(shù)據(jù)的能力并沒有走到最前端;第三種的企業(yè)是對企業(yè)級外面的數(shù)據(jù),包括社交媒體、移動終端的數(shù)據(jù)能夠比較好的掌控和分析,但是對于企業(yè)級數(shù)據(jù)的預(yù)估能力、判斷能力并沒有很好的技術(shù)手段;真正成功的企業(yè)是“D世代企業(yè)”,這類企業(yè)不僅能處理分析好企業(yè)內(nèi)部數(shù)據(jù),還能把社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)等其它外部收集的數(shù)據(jù)聯(lián)合使用,調(diào)研也顯示這些企業(yè)的平均市場份額、成長速度、獲利能力,以及客戶的滿意度比前三種更高。
然而想成為第四種企業(yè),必須具備更多的行業(yè)轉(zhuǎn)型和數(shù)據(jù)的分析能力,對此,IBM全球Analytics Platform副總裁Scott Sampson表示,“從IBM的分析來講,我們有能力為行業(yè)提供轉(zhuǎn)型的能力,而且這些轉(zhuǎn)型正在發(fā)生,如電信行業(yè)、銀行業(yè)、汽車行業(yè),所以IBM不只是分析市場的參與者,IBM正在塑造這個市場,并通過自己的創(chuàng)新來推動?!?/p>
他進一步強調(diào)到:首先IBM在過去兩年內(nèi),收購了30家具有最好技術(shù)能力的企業(yè),并把他們組合起來幫助IBM推出最好的分析產(chǎn)品來適合市場以及客戶的需要。其次,可支持不同的職位,無論是分析師,還是IT專業(yè)人士或商務(wù)人士,IBM都可以讓客戶有這種能力,并在工作的每個階段都能實現(xiàn)這種能力;最后,IBM正在推動使用數(shù)據(jù)的轉(zhuǎn)型,這些數(shù)據(jù),有來自社交媒體的數(shù)據(jù)、也有來自核心業(yè)務(wù)的數(shù)據(jù),如何使用和集成這些數(shù)據(jù)得到最好的業(yè)務(wù)成果,這是IBM所做的事情。