本刊記者 | 魯義軒
整合與分析:發(fā)揮大數(shù)據(jù)價值的兩大關(guān)鍵
本刊記者 | 魯義軒
Q&A:中興通訊有線經(jīng)營部服務(wù)產(chǎn)品總監(jiān) 湯太軍
Q 近期美國AT&T開始向需要的公司銷售客戶使用數(shù)據(jù),被視為利用大數(shù)據(jù)資源盈利的一種嘗試。此前許多電信運營商的很多數(shù)據(jù)都是通過專有網(wǎng)絡(luò)引擎以及高度專業(yè)化的CRM及計費軟件收集的,但如何于挖掘這些數(shù)據(jù)的價值并為己所用,似乎沒有太強的能力。在您看來,這樣的現(xiàn)狀需要通過哪些方式解決?
湯太軍:運營商現(xiàn)在主要的問題不在于沒有數(shù)據(jù)或是數(shù)據(jù)量不足,而是在于其有效識別和組合分析數(shù)據(jù)并將其轉(zhuǎn)變成知識的能力相對較弱,AT&T對外銷售的是經(jīng)過分析處理的數(shù)據(jù)資產(chǎn),這需要具備大數(shù)據(jù)的分析處理能力,而不是原始數(shù)據(jù)的簡單銷售。運營商首先要能把自己業(yè)務(wù)系統(tǒng)中產(chǎn)生的各類數(shù)據(jù)整合起來,比如CRM系統(tǒng)、計費系統(tǒng)、信令系統(tǒng)、資源系統(tǒng)等,找到數(shù)據(jù)間的相關(guān)性,識別真正有用的數(shù)據(jù),排除數(shù)據(jù)廢氣的干擾,同時還要考慮用戶隱私保護問題,經(jīng)過一系列科學化處理以后的數(shù)據(jù)才能真正稱之為大數(shù)據(jù)資產(chǎn)。運營商目前迫切需要的正是這樣一個大數(shù)據(jù)的前期處理平臺,能整合來自不同業(yè)務(wù)運營部門分散的數(shù)據(jù)庫,統(tǒng)一數(shù)據(jù)存儲,完成數(shù)據(jù)清洗和轉(zhuǎn)換,轉(zhuǎn)變成可進行多維度分析的數(shù)據(jù)元組保存下來,進而不斷利用或者交易它們。所以運營商要解決大數(shù)據(jù)資源的盈利問題第一步需要建立一個適應大數(shù)據(jù)的集成平臺,第二步是基于平臺開展數(shù)據(jù)整合工作。運營商可以通過采購成熟的大數(shù)據(jù)系統(tǒng)和數(shù)據(jù)分析服務(wù)來快速獲得這種能力,也可以通過戰(zhàn)略合作的模式逐步打造培養(yǎng)自身的大數(shù)據(jù)資源和人才隊伍。
Q 在挖掘大數(shù)據(jù)價值并轉(zhuǎn)變?yōu)樯虡I(yè)價值的同時,運營商該綜合哪些因素的考慮,利用哪些技術(shù)搭建起一個平臺,使其發(fā)揮數(shù)據(jù)分析的作用?
湯太軍:電信運營商的數(shù)據(jù)特征較為鮮明,一類是海量但實時性要求不高的數(shù)據(jù),如后付費計費消息、信令消息、性能統(tǒng)計數(shù)據(jù)等,另一類是實時性高的流數(shù)據(jù),如流量統(tǒng)計、位置信息、實時賬單等,因此在構(gòu)建大數(shù)據(jù)平臺時必須兼顧這兩類數(shù)據(jù)的處理。
運營商以往的數(shù)據(jù)庫系統(tǒng)比較適合格式化、批處理、非實時性的數(shù)據(jù),而在流數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)處理方面存在不足。構(gòu)建大數(shù)據(jù)的平臺并不需要拋棄運營商已有的關(guān)系數(shù)據(jù)庫系統(tǒng),相反可以繼續(xù)利用關(guān)系數(shù)據(jù)庫系統(tǒng)在處理結(jié)構(gòu)化數(shù)據(jù)方面的效率優(yōu)勢,在此基礎(chǔ)上疊加針對非結(jié)構(gòu)化數(shù)據(jù)和流數(shù)據(jù)的系統(tǒng),從而實現(xiàn)最低成本的大數(shù)據(jù)平臺演進。
毫無疑問,在非結(jié)構(gòu)化數(shù)據(jù)批量處理方面,Hadoop已經(jīng)是事實上的標準,主流的數(shù)據(jù)庫廠商也都采用了這一技術(shù),運營商也不例外,但由于Hadoop是開源技術(shù),同時對使用者的技術(shù)要求比較高,因此我們建議運營商選擇經(jīng)過商用化處理的Hadoop內(nèi)核方案,在易用性和可擴展性方面都好于純粹的開源產(chǎn)品。而對于流數(shù)據(jù)的處理,業(yè)界已有比較成熟的解決方案,基于復雜事務(wù)處理的流處理技術(shù)已經(jīng)有較多的應用,可以選擇商用化的系統(tǒng)進行部署。
當然要實現(xiàn)數(shù)據(jù)的高效利用,還需要在數(shù)據(jù)的輸入部分和輸出部分做一些定制化的處理,使得數(shù)據(jù)輸入環(huán)節(jié)能識別和區(qū)分不同的數(shù)據(jù)處理需求,將合適的數(shù)據(jù)分發(fā)給合適的系統(tǒng)進行處理,而數(shù)據(jù)輸出環(huán)節(jié)則充分利用可視化技術(shù)以更加友好的方式來呈現(xiàn)結(jié)果。
在搭建大數(shù)據(jù)的價值轉(zhuǎn)化平臺過程中運營商應該綜合考慮技術(shù)、成本和資源的因素,還要考慮與現(xiàn)有數(shù)據(jù)處理系統(tǒng)的兼容性問題。
Q 國際上有哪些運營商已經(jīng)開始利用大數(shù)據(jù)提供服務(wù)獲得先期經(jīng)驗?
湯太軍:Verizon在美國推出的“Precision Market Insights”服務(wù),已經(jīng)開始向第三方售賣Verizon手上的用戶數(shù)據(jù),對商場、體育館、廣告牌業(yè)主等出售特定場所手機用戶的活動和背景信息。
2012年西班牙電信公司成立了一個新部門——西班牙電信數(shù)字洞察(Telefonica Digital Insights),目的就是為企業(yè)及公共部門提供基于用戶匿名位置數(shù)據(jù)的“分析洞察”,其第一款產(chǎn)品是智能步伐(Smart Steps)已為零售商和其他機構(gòu)提供手機用戶全天活動的位置“熱點地圖”(heat maps)。
德國電信和Vodafone在利用大數(shù)據(jù)為自身業(yè)務(wù)服務(wù)之余,已向商業(yè)模式跨出了一步。主要嘗試是通過開放API,向數(shù)據(jù)挖掘公司等合作方提供部分用戶匿名地理位置數(shù)據(jù),以掌握人群出行規(guī)律,有效地與一些LBS應用服務(wù)對接。
從國外運營商的先期經(jīng)驗來看,大數(shù)據(jù)服務(wù)尚處于初級摸索階段,運營商更多的是扮演大數(shù)據(jù)資產(chǎn)擁有者的角色,并沒用通過大數(shù)據(jù)的洞察和利用來獲得更多的價值。西班牙電信公司成立單獨的公司運作大數(shù)據(jù)應用,通過獨立公司或控股合作公司專門開展大數(shù)據(jù)服務(wù)不失為一種好的發(fā)展模式,可供國內(nèi)的運營商借鑒。
Q 此前運營商談的較多的是流量經(jīng)營,通過分析不同的業(yè)務(wù)等級提供不同級別的服務(wù)從而獲得差異化經(jīng)營,大數(shù)據(jù)的數(shù)據(jù)分析以及商業(yè)轉(zhuǎn)型似乎和流量經(jīng)營有同樣的方向,大數(shù)據(jù)服務(wù)如何融入到流量經(jīng)營策略中?
湯太軍:流量經(jīng)營的一個核心是要能對流量進行高效的識別和分析,要實現(xiàn)基于流量的精細化運營更要求系統(tǒng)能對大流量數(shù)據(jù)實現(xiàn)實時化的分析處理,從而為流量管控提供真實可靠的參考信息,因此流量經(jīng)營一定程度上可以說是大數(shù)據(jù)在大流量數(shù)據(jù)實時分析處理方面的一個典型應用。
但大數(shù)據(jù)的一個最重要的優(yōu)勢就是數(shù)據(jù)可以通過再利用發(fā)揮更大的價值,需要不斷發(fā)現(xiàn)新的價值模式。以流量經(jīng)營為例,通過對實時流量數(shù)據(jù)的分析可以實現(xiàn)流量的及時管控和流量疏導均衡,這些實時的流量數(shù)據(jù)是否過時就沒用呢?不是的,通過對一段時間歷史流量數(shù)據(jù)的批量分析,運營商又可以發(fā)現(xiàn)整個網(wǎng)絡(luò)的流量分布特征,這可以指導運營商調(diào)整網(wǎng)絡(luò)的規(guī)劃布局,發(fā)掘新的流量增長點。通過對特定人群的流量數(shù)據(jù)分析,可以推出個性化的流量套餐,進一步提升套餐價值。需要說明的是,流量數(shù)據(jù)僅僅是大數(shù)據(jù)中的一種類型,通過把流量數(shù)據(jù)與其它的業(yè)務(wù)經(jīng)營數(shù)據(jù)結(jié)合進行相關(guān)性分析,還能獲得更多的商業(yè)機會,流量經(jīng)營僅僅是運營商結(jié)合大數(shù)據(jù)分析拓展收入的一個方向而不是惟一方向。