?
基于大數(shù)據(jù)平臺的企業(yè)級經(jīng)營分析系統(tǒng)建設(shè)探討
孫淳曄
(中國移動通信集團(tuán)設(shè)計院有限公司河北分公司, 石家莊 050021)
摘 要針對現(xiàn)有經(jīng)營分析系統(tǒng)(BASS)存在的短板,整合企業(yè)各域數(shù)據(jù),優(yōu)化系統(tǒng)架構(gòu),采用大數(shù)據(jù)技術(shù)構(gòu)建企業(yè)級經(jīng)分系統(tǒng),提高資源利用率,并通過逐步解耦數(shù)據(jù)及應(yīng)用,逐步開放能力平臺,充分發(fā)揮數(shù)據(jù)價值,支撐公司全面發(fā)展運營。
關(guān)鍵詞經(jīng)營分析;大數(shù)據(jù);系統(tǒng)架構(gòu);數(shù)據(jù)價值
隨著云時代的來臨,大數(shù)據(jù)(big data)吸引了越來越多的關(guān)注,數(shù)據(jù)已成為一種資源,企業(yè)內(nèi)部的經(jīng)營交易信息、互聯(lián)網(wǎng)世界中的商品物流信息、人人交互信息、位置信息、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)等產(chǎn)生的信息無時無刻不在產(chǎn)生著大量數(shù)據(jù),其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)的承載能力。尤其對于運營商來說,其系統(tǒng)中存在海量的數(shù)據(jù),且無時無刻不在產(chǎn)生著新的數(shù)據(jù),如何盤活這些數(shù)據(jù)資產(chǎn),充分體現(xiàn)價值優(yōu)勢,將是運營商未來發(fā)展的關(guān)鍵,也將決定運營商在信息舞臺上的地位。
大數(shù)據(jù)(big data)具有5V特點[1]:Volume(海量的數(shù)據(jù)規(guī)模)、Velocity(快速的數(shù)據(jù)流轉(zhuǎn))、Variety(多樣的數(shù)據(jù)類型)、Value(巨大的數(shù)據(jù)價值)、Vitality(動態(tài)的數(shù)據(jù)體系)?!皵?shù)據(jù),已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來[2]”。無論運營商“云、管、端”如何全面發(fā)展,最終將轉(zhuǎn)化為數(shù)據(jù)流量,大數(shù)據(jù)的累積效應(yīng)正給整個IT業(yè)帶來變革。特別是云概念和4G的深入發(fā)展,日均數(shù)十TB級的數(shù)據(jù)量對運營商數(shù)據(jù)壓力與日俱增,而IDC的大規(guī)模建設(shè)更是加劇了這一趨勢。所以,運營商擁有了其他行業(yè)無可比擬的資源優(yōu)勢——數(shù)據(jù)資源,可以說運營商已經(jīng)具備了大數(shù)據(jù)的基礎(chǔ),把握住大數(shù)據(jù)的發(fā)展將會是運營商的一次重大機(jī)遇。而淘寶、Google[3]等互聯(lián)網(wǎng)企業(yè)對于大數(shù)據(jù)應(yīng)用的成功案例也給予了我們啟發(fā)。
經(jīng)營分析系統(tǒng)作為中國移動IT支撐系統(tǒng)的決策支持系統(tǒng),幫助企業(yè)決策層了解企業(yè)經(jīng)營現(xiàn)狀,發(fā)現(xiàn)企業(yè)運營的優(yōu)劣勢,預(yù)測未來趨勢;幫助細(xì)分市場和客戶,指導(dǎo)營銷、客服部門進(jìn)行有針對性的營銷和高效的客戶關(guān)系管理。然而傳統(tǒng)的經(jīng)分系統(tǒng)局限于業(yè)務(wù)支撐域,數(shù)據(jù)維度并不完整,質(zhì)量有待提高,仍處于運營驅(qū)動數(shù)據(jù)的被動服務(wù)模式。
拿某省運營商經(jīng)營分析(BASS)系統(tǒng)為例,該系統(tǒng)多為小型機(jī)+傳統(tǒng)盤陣+關(guān)系型數(shù)據(jù)庫的IOE架構(gòu):
(2)維護(hù)費用偏高:不能滿足大數(shù)據(jù)時代的低成本要求,傳統(tǒng)的小型機(jī)盤陣架構(gòu)所占用的機(jī)房空間,耗電量,散熱量及每年高額的維保費用較高,與綠色節(jié)能減排的宗旨相違背。
(3)架構(gòu)層面不夠靈活:擴(kuò)展性不足,設(shè)備性能的提升依賴于設(shè)備硬件的擴(kuò)容及軟件的升級,小型機(jī)的單機(jī)擴(kuò)展能力有限,當(dāng)應(yīng)用資源需求超越小型機(jī)的極限時,小型機(jī)就變得無能為力。另外小型機(jī)的部件都是專有部件,價格比較昂貴,導(dǎo)致小型機(jī)的性價比較差,多套主機(jī)共用一套存儲的集中處理模式對于系統(tǒng)的運行、I/O口讀寫速率都造成極大的負(fù)荷。
數(shù)據(jù)庫技術(shù):經(jīng)分系統(tǒng)目前已能提取網(wǎng)管側(cè)如Gb、Gn等接口的部分信令數(shù)據(jù),通過爬蟲系統(tǒng)提取互聯(lián)網(wǎng)URL數(shù)據(jù),這些數(shù)據(jù)中存在大量非結(jié)構(gòu)化數(shù)據(jù),而目前存在的數(shù)據(jù)庫大多為如Oracle,DB2類的關(guān)系型數(shù)據(jù)庫,非關(guān)系型數(shù)據(jù)庫技術(shù)并未被得到深化應(yīng)用。
(4)應(yīng)用層缺乏實時性:目前上層應(yīng)用多為事后處理或準(zhǔn)實時,影響用戶感知,支撐服務(wù)對象較少。
從以上分析可看出,現(xiàn)有的經(jīng)分系統(tǒng)的發(fā)展并不能與未來企業(yè)信息化發(fā)展的腳步同步,而經(jīng)分系統(tǒng)的大數(shù)據(jù)特點決定其與大數(shù)據(jù)技術(shù)的完美契合。因此逐步完善經(jīng)分系統(tǒng),構(gòu)建全網(wǎng)數(shù)據(jù)融合的企業(yè)級經(jīng)分成為今后發(fā)展的趨勢。
基于大數(shù)據(jù)構(gòu)建企業(yè)級經(jīng)分系統(tǒng)是在現(xiàn)有經(jīng)分系統(tǒng)上進(jìn)行補(bǔ)充完善,滿足系統(tǒng)建設(shè)的平滑過渡,包括架構(gòu)的調(diào)整,數(shù)據(jù)源的擴(kuò)充、整合、統(tǒng)一及平臺的對外開放等。
傳統(tǒng)經(jīng)營分析與基于大數(shù)據(jù)的經(jīng)分系統(tǒng)的差異性如表1、表2所示。
基于大數(shù)據(jù)平臺的經(jīng)分系統(tǒng)(如圖1)建設(shè)并不是對原有經(jīng)分的否定,而是對現(xiàn)存系統(tǒng)的補(bǔ)充,使之更多的面向市場、面向管理、面向生產(chǎn)乃至面向開放。
模板支設(shè)完成在外框架四角吊錘,每次混凝土澆筑前,應(yīng)先測量吊錘下放后錘線距離墩身混凝土面的距離和上方垂線距離內(nèi)襯模的距離,以檢測整個輥模架體的偏移及扭轉(zhuǎn),并做及時調(diào)整。
針對現(xiàn)網(wǎng)經(jīng)分系統(tǒng)各層逐步演進(jìn)如圖2所示。
(1)擴(kuò)充數(shù)據(jù)源,沉淀企業(yè)數(shù)據(jù)資產(chǎn)。逐步打通B、M、O三域壁壘,構(gòu)建IT共享資源池,具體可采用大二層技術(shù)來擴(kuò)展二層網(wǎng)絡(luò),逐步將三域納入同一個大二層范圍內(nèi),一方面擴(kuò)大經(jīng)分?jǐn)?shù)據(jù)源,另一方面更有利于同一個大二層下的云化實施;此外為用戶增加基礎(chǔ)屬性數(shù)據(jù),實現(xiàn)運營商多維全量的用戶數(shù)據(jù),包括:基礎(chǔ)屬性、位置信息、用戶喜好等標(biāo)簽,實施精準(zhǔn)營銷,提高用戶黏性,延長用戶生命周期。
表1 兩類經(jīng)分系統(tǒng)異性分析表
(2)采用云ETL替代原ETL,構(gòu)建企業(yè)級的采集平臺。ETL指對數(shù)據(jù)源進(jìn)行提?。‥xtract)、轉(zhuǎn)置(Transform)、加載(Load)。在經(jīng)分系統(tǒng)中原有ETL只能實現(xiàn)對業(yè)務(wù)支撐單域數(shù)據(jù)的采集處理,為實現(xiàn)對全域數(shù)據(jù)的采集,構(gòu)建企業(yè)級的ETL采集層。
(3)加大經(jīng)分系統(tǒng)的x86占比,逐步實現(xiàn)由小型機(jī)向x86服務(wù)器的遷移。為經(jīng)分系統(tǒng)的不同部分定義不同的重要級別,例如可按照等級由高到低的順序?qū)?shù)據(jù)庫、采集、重要應(yīng)用、一般應(yīng)用等來逐步實施。由于數(shù)據(jù)庫體量龐大,對設(shè)備性能要求較高且業(yè)界并無針對數(shù)據(jù)庫x86化的專有成熟技術(shù),需謹(jǐn)慎考慮數(shù)據(jù)庫的x86化。目前階段建議采用混搭、多架構(gòu)并存的模式:對于不同的數(shù)據(jù)類型部署不同架構(gòu),除傳統(tǒng)基礎(chǔ)數(shù)據(jù)倉庫外,搭建適配各類數(shù)據(jù)的專有數(shù)據(jù)倉庫。針對關(guān)系型數(shù)據(jù)庫盡量部署MPP架構(gòu),以優(yōu)化架構(gòu),針對非結(jié)構(gòu)化數(shù)據(jù)實施Hadoop技術(shù),短期內(nèi)實現(xiàn)多架構(gòu)的并存,具體如圖3所示。
事務(wù)處理類數(shù)據(jù):數(shù)據(jù)類型為關(guān)系型數(shù)據(jù),為保持系統(tǒng)的平滑過渡,可維持原有關(guān)系型數(shù)據(jù)庫,保持原有架構(gòu)。
互聯(lián)網(wǎng),信令類數(shù)據(jù):由于其隨機(jī)性較大,關(guān)聯(lián)性較小,采用非結(jié)構(gòu)化數(shù)據(jù)庫技術(shù),如Hadoop技術(shù)。
分析挖掘類數(shù)據(jù):如經(jīng)分歷史庫,為非實時性數(shù)據(jù),需充分進(jìn)行數(shù)據(jù)挖掘,關(guān)聯(lián)匯總,需調(diào)整原有架構(gòu),盡量部署MPP架構(gòu)。
圖1 基于大數(shù)據(jù)的企業(yè)級經(jīng)分系統(tǒng)
圖2 針對現(xiàn)網(wǎng)經(jīng)分系統(tǒng)各層逐步演進(jìn)圖
(1)開放數(shù)據(jù)總線能力,按需進(jìn)行組件分裝,創(chuàng)造商業(yè)價值。
(2)實現(xiàn)事后分析向?qū)崟r分析的轉(zhuǎn)變,以支撐業(yè)務(wù)運營,達(dá)到向數(shù)據(jù)驅(qū)動運營的最終目的。
基于大數(shù)據(jù)技術(shù)的企業(yè)級經(jīng)分系統(tǒng)建設(shè)涉及范圍廣,影響意義深遠(yuǎn),并非短期可以實現(xiàn)。結(jié)合公司IT現(xiàn)狀來看,還有很長的路要走,需要合理規(guī)劃,逐步演進(jìn)最終達(dá)到目的。
大數(shù)據(jù)時代已經(jīng)到來,正促進(jìn)著信息技術(shù)與各行業(yè)的深度融合,運營商擁有管道中的龐大數(shù)據(jù)這一優(yōu)勢,決定其將是未來大數(shù)據(jù)時代最強(qiáng)勢的競爭者。文章首先分析了現(xiàn)網(wǎng)經(jīng)分系統(tǒng)的局限性,針對現(xiàn)有的短板提出對應(yīng)的解決措施以及今后的建設(shè)思路。對運營商來說,構(gòu)建基于大數(shù)據(jù)技術(shù)的企業(yè)級經(jīng)分系統(tǒng),利用和深挖自己的潛在優(yōu)勢,把握機(jī)遇,迎接挑戰(zhàn),釋放出數(shù)據(jù)的巨大能量,將是運營商未來經(jīng)營的重中之重,無疑將會成為未來大數(shù)據(jù)時代的主角。
參考文獻(xiàn)
[1]張超. 云計算和大數(shù)據(jù)給運營商帶來的機(jī)遇和挑戰(zhàn)[J]. 電信技術(shù), 2013(9).
[2]武延軍. 大數(shù)據(jù)時代已經(jīng)來臨——人機(jī)物融合的大數(shù)據(jù)時代[J]. 高科技與產(chǎn)業(yè)化, 2013(5).
[3]孫健,賈曉菁. Google云計算平臺的技術(shù)架構(gòu)及對其成本的影響研究[J]. 電信科學(xué), 2010(1).,
表2 兩類經(jīng)分系統(tǒng)共性分析表
圖3 數(shù)據(jù)處理架構(gòu)變革
Discussion of enterprise-level business analysis support system building based on big data platform
SUN Chun-ye
(China Mobile Group Design Institute Co., Ltd. Hebei Branch, Shijiazhuang 050021, China)
AbstractFor short board exists in business analysis support system, the paper proposed a method that to build the enterprise-level business analysis support system based on big data skill through integrating the data from all the areas and optimizing the system architecture, then it can improve the resource utilization and lastly to reach the goal of taking advantage of the role of data value and supporting the company's overall development operations by decoupling the data and applications and opening the capability of the system platform progressively.
Keywordsbusiness analysis support; big data; system architecture; data value
收稿日期:2014-07-18
文章編號1008-5599(2015)01-0078-04
文獻(xiàn)標(biāo)識碼A
中圖分類號TN915