摘要:結合全球多個實際案例,提出了一個電信大數(shù)據(jù)的精簡方案架構。方案結合運營商的實際應用場景,挑選合適的組件進行組合,摒棄了通用化的大平臺。大數(shù)據(jù)的發(fā)展,一要通過大數(shù)據(jù)應用提升運營效率,二要通過數(shù)據(jù)即服務(DAAS)拓展新的服務內容,提供對外服務。在業(yè)務實施設過程中,抓取、管理和挖掘電信運營商的核心數(shù)據(jù)是基礎,運營商大數(shù)據(jù)的快速部署和應用是最終目標,兩者需要在效率、成本和時間上取得平衡。
關鍵詞: 大數(shù)據(jù);電信網絡;精簡架構;數(shù)據(jù)即服務
Abstract: In this paper, we discuss a number of domestic and international big-data telecommunications architectures and propose our own lean big-data architecture. This new architecture combines the practical application scenarios of operators, and the universal large platform is abandoned. There are two directions in big-data development: improving business efficiency and providing data as a service (DaaS). Capturing, managing, and mining core data of a telecom operator is the basis for service implementation. Rapid deployment and application of big data is the final target. A balance also needs to be struck between in efficiency, cost and time when deploying a big-data architecture.
Key words: big data; telecommunications network; lean architecture; data as a service
中圖分類號:TN915.03; TP393.03 文獻標志碼:A 文章編號:1009-6868 (2013) 04-0039-003
1 電信運營商建設大數(shù)據(jù)
思路及關鍵技術
運營商的網絡和用戶是運營商的核心資產,而其中流動的數(shù)據(jù)(包括用戶配置基礎數(shù)據(jù)、網絡信令數(shù)據(jù)、網管/日志數(shù)據(jù)、用戶位置數(shù)據(jù)、終端信息)是運營商的核心數(shù)據(jù)資產。對于運營商來說,最有價值的數(shù)據(jù)來自基礎電信網絡本身,對于基礎管道數(shù)據(jù)的挖掘和分析是運營商大數(shù)據(jù)挖掘的最重要方向。抓取、管理和挖掘這些數(shù)據(jù)是運營商的當務之急[1-2]。運營商基于核心數(shù)據(jù)的大數(shù)據(jù)應用可從兩個方面入手:
(1)通過大數(shù)據(jù)應用提升自身運營效率。比較典型的應用包括:信令多維分析、網絡綜合管理及分析、業(yè)務和運營支撐系統(tǒng)(BOSS)經營綜合分析、精準營銷等。
(2)通過數(shù)據(jù)即服務(DAAS)拓展新的服務內容,提供對外服務。包括個體及群體的位置信息以及用戶行為分析等,對于第三方公司(比如零售業(yè)或者咨詢公司、政府等)都是非常有價值的信息。運營商可以基于這些數(shù)據(jù)提供對外DAAS服務,拓展市場空間。
為了構建電信運營的大數(shù)據(jù)應用,從技術能力的角度可以分為數(shù)據(jù)收集與存儲、信息檢索匯聚、知識發(fā)現(xiàn)以及智慧4個層面。電信大數(shù)據(jù)技術層面如圖1所示。自下而上數(shù)據(jù)挖掘深度增加,難度加大,對于系統(tǒng)的智能需求提升。其中關鍵的技術包括抽取轉換裝載(ETL)、并行計算框架、分布式數(shù)據(jù)庫、分布式文件系統(tǒng)和數(shù)據(jù)挖掘、機器學習等。
面對海量的大數(shù)據(jù),如何有效進行數(shù)據(jù)處理是需要解決的迫切問題,分布式并行處理是有效手段。傳統(tǒng)關系型數(shù)據(jù)庫多采用共享磁盤(Sharing-disk)架構,當數(shù)據(jù)量達到一定程度,將面臨處理的“瓶頸”以及擴展的困難,同時成本也偏高。當前有效的做法是采用分布式文件系統(tǒng)/分布式數(shù)據(jù)庫結合做分布并行處理。目前基于開源的Hadoop平臺是業(yè)界采用較廣泛的一個實現(xiàn)方案。Hadoop[3]的核心思想是基于Hadoop分布式文件系統(tǒng)(HDFS)存儲文件或者基于HBase數(shù)據(jù)庫(也是基于HDFS),使用分布式并行計算框架MapReduce來并行執(zhí)行分發(fā)Map操作以及Reduce歸約操作。在Hadoop的計算模型中,計算節(jié)點與存儲節(jié)點合一。存儲數(shù)據(jù)的普通PC服務器可以執(zhí)行MapReduce的任務。而在Sharing-disk模型中,存儲節(jié)點與計算節(jié)點是分離的,存儲的數(shù)據(jù)需要傳送到計算節(jié)點做計算。Hadoop計算模型適合離線批處理的場景,比如Log日志分析、文檔統(tǒng)計分析等。它是關系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS)的有益補充。
在私有技術上實現(xiàn)分布式存儲和并行處理,在調用接口上與Hadoop兼容,這是一個可行的技術方案。這種方案可以避免上述Hadoop的缺點,同時在性能上做更多的優(yōu)化。有效的手段包括增加數(shù)據(jù)本地性(Data Locality)特性,在多次迭代的計算過程減少數(shù)據(jù)在不同節(jié)點之間的傳送;使用索引和緩存加快數(shù)據(jù)的處理速度。結合存儲和計算硬件進行調優(yōu)也是有效的手段,可以使用數(shù)據(jù)的分層存儲,將數(shù)據(jù)分布在內存、固態(tài)硬盤(SSD)、硬盤等不同介質上[4],使得與計算資源達到很好的平衡。
面對海量數(shù)據(jù)實時性的要求,比較有效的方式是采用復雜事件處理(CEP)[5]。實時流處理采用事件觸發(fā)機制,對于輸入的事件在內存中及時處理。同時對于多個事件能合成一個事件[6]。實時流處理需要支持規(guī)則以滿足靈活的事件處理要求。實時流處理可以使用分布式內存數(shù)據(jù)庫、消息總線等機制來實現(xiàn)快速實時響應。目前商用的CEP產品有不少,但是在功能、性能以及適用范圍上有較大差異,選擇成熟度高以及合適的產品是關鍵。
針對大數(shù)據(jù)中大量的半結構化或者非結構數(shù)據(jù),NoSQL數(shù)據(jù)庫應運而生。NoSQL數(shù)據(jù)庫放棄關系模型,弱化事務,支持海量存儲、高可擴展性、高可用及高并發(fā)需求。NoSQL數(shù)據(jù)庫在特定應用場景下有很高的優(yōu)勢,是傳統(tǒng)數(shù)據(jù)庫的有效補充。按照數(shù)據(jù)模型,NoSQL主要有四大類:鍵-值(Key-Value)型、列存儲型、文檔型、圖型,它們對應不同的應用場景。比如Key-Value型適合簡單鍵-值對的高效查詢,而圖型適合社交關系的存儲和高效查詢。
針對大數(shù)據(jù)挖掘分析、搜索以及機器自適應學習等技術在企業(yè)系統(tǒng)中逐步應用。相關的算法種類很多,當前需求較多的是分布式挖掘和分布式搜索。
由于數(shù)據(jù)類型以及數(shù)據(jù)處理方式的改變,傳統(tǒng)ETL已經不適用。運營商需要根據(jù)應用場景做不同的規(guī)劃。目前來說,由于運營商應用系統(tǒng)差別較大,尚未有一種統(tǒng)一的處理模式。比較可行的一種方法是依據(jù)數(shù)據(jù)的功用以及特性做分層處理,比如大量的數(shù)據(jù)源首先做初篩,初篩完之后有部分數(shù)據(jù)進入數(shù)據(jù)倉庫或者RDBMS或者其他應用。初篩可以使用Hadoop或者CEP或者定制的方式來完成。
針對運營商的不同應用場景,需要采用不同的技術或者技術組合。比如用戶實時詳單查詢,數(shù)據(jù)量巨大,但是它的數(shù)據(jù)類型簡單,數(shù)據(jù)以讀為主,不需要復雜的Join操作,數(shù)據(jù)的分布性好。相比傳統(tǒng)的RDBMS,使用Hadoop可以大大提升查詢性能,降低處理成本。更多的應用可能需要多種技術的組合。比如信令采集及多維分析,信令數(shù)據(jù)特別是分組域(PS)信令數(shù)據(jù)量大且實時性要求高,有效解決海量數(shù)據(jù)處理與實時性要求是它的關鍵,需要CEP與Hadoop的組合。在當前階段,不同的技術成熟度不一,由于業(yè)界大數(shù)據(jù)應用進展較快,我們認為當前針對不同應用的精簡方案是最合適的,也就是依據(jù)應用場景,挑選最合適的組件做組合,摒棄通用化的大平臺。
2 中興通訊大數(shù)據(jù)實踐
中興通訊依托在云計算等領域的長期積累,針對大數(shù)據(jù)形成了一套完整的技術體系架構。ZTE大數(shù)據(jù)技術體系架構如圖2所示。架構依據(jù)運營商的不同的應用需求,注重采用組件搭建的方式,形成端到端的精簡方案。下面以兩個具體的案例進行說明。
(1)用戶實時位置信息服務系統(tǒng)
該系統(tǒng)實時采集蜂窩網絡用戶的動態(tài)位置信息,并通過規(guī)范接口提供DAAS服務。實際工程中,當期接入的用戶數(shù)達兩千多萬,每天用戶位置更新數(shù)據(jù)可達40多億條,高峰期更新達到每秒幾十萬次。除了采集的位置,還可以結合其他數(shù)據(jù)源比如用戶年齡等屬性做分析,以應用編程接口(API)開放給上層應用。此外該系統(tǒng)需要有良好的可擴展性,后續(xù)可以接入其他區(qū)域的數(shù)據(jù)源。另外這套系統(tǒng)需要有良好的性價比,成本可控,時間可控。依據(jù)這些需求,我們在成熟的組件K-V NoSQL 數(shù)據(jù)庫的基礎上搭建了系統(tǒng)。用戶實時位置信息服務系統(tǒng)如圖3所示。
用戶實時位置信息服務系統(tǒng)是一個典型的精簡方案,它基于分布式Key-Value NoSQL數(shù)據(jù)庫的分布式緩存(DCache),組裝了對位置流事件實時處理的系統(tǒng)。DCache既是消息總線,也是內存數(shù)據(jù)庫,能很好地滿足實時性的要求。同時DCache基于x86刀片服務器,采用分布式架構,系統(tǒng)的擴展性很好,成本較低。該系統(tǒng)性能優(yōu)越,穩(wěn)定可靠,取得良好的效果。
(2)信令監(jiān)測多維分析系統(tǒng)
隨著運營商數(shù)據(jù)業(yè)務快速增長,運營商對于網絡質量提升、網絡運營效率有著更大的壓力。通過采集網絡Gn接口、Mc接口信令并加以處理分析,可以獲得網絡運行的完整視圖,基于信令的相關專題分析,比如網絡質量分析、流量效率分析、多網協(xié)同分析、客戶投訴及服務分析等對于運營商網絡運營有極大的價值。
信令監(jiān)測多維分析的難點在于信令流量大且數(shù)據(jù)量大,比如某運營商省公司Gn接口峰值流量可以達到4 Gb/s,每天信令數(shù)據(jù)可達1 TB。需要采集信令并做多種分析以服務于不同的部門。
信令監(jiān)測多維分析系統(tǒng)采用分層的架構,便于數(shù)據(jù)共享及和應用的擴展。信令監(jiān)測多維分析系統(tǒng)如圖4所示。使用實時流處理滿足實時性高的數(shù)據(jù)分析要求,對于會話或事務詳單(XDR)初步處理完的數(shù)據(jù)采用傳統(tǒng)RDBMS存儲供后續(xù)分析查詢使用。對于數(shù)據(jù)量龐大的XDR采用Hadoop HBase存儲并查詢,原始信令采用分布式文件系統(tǒng)存放在本地。
在這個方案中,數(shù)據(jù)根據(jù)它的使用特性采用不同的方式存儲和處理,突破RDBMS處理“瓶頸”和擴展性的“瓶頸”,達到了很好的效果。在測試中,4節(jié)點PC服務器可以全部承擔某運營商省公司PS域XDR的存儲,入庫性能可達50 Mb/s,針對上百億條記錄查詢,可以在10 s內返回。取得了很好的實踐效果。
3 結束語
電信運營商面臨大數(shù)據(jù)發(fā)展的機遇,都在積極推動大數(shù)據(jù)的試點和商用。在當前大數(shù)據(jù)技術快速發(fā)展的形勢下,根據(jù)需求和應用場景搭建精簡方案,可以幫助運營商在當前激烈競爭環(huán)境中快速獲得競爭優(yōu)勢,在效率、成本和時間上取得最佳平衡。
參考文獻
[1] Cisco Systems. Cisco visual networking index global mobile data traffic forecast update, 2011 - 2016 [EB/OL]. [2013-03-25]. http://www.cisco.com.
[2] MANYIKA J, CHUI M, BROWN B, et al. Big data: The next frontier for innovation, competition, and productivity [R]. McKinsey Global Institute, 2011.
[3] WHITE T. Hadoop權威指南 [M]. 2版. 周敏奇, 王曉玲, 金澈清, 譯. 北京:清華大學出版社, 2011.
[4] SNIA. 2012 SNIA Sprint Tutorials-NextGen Infrastructure for Big Data [EB/OL]. [2013-02-15]. http://www.snia.org
[5] NEUMEYER L, ROBBINS B, NAIR A, et al. S4: Distributed stream computing platform [C]//Proceedings of the IEEE International Conference on Data Mining Workshops (ICDMW’10), Dec 14-17,2010, Sydney, Australia .Los Alamitos, CA, USA: IEEE Computer Society, 2010:170-177.
[6] SHARON G, ETZION O. Event-processing network model and implementation [J]. IBM Systems Journal, 2008,47(2):321-334.
作者簡介
李秋靜,中科院計算所工學博士畢業(yè);現(xiàn)工作于中興通訊股份有限公司運營商部;主要研究領域為大數(shù)據(jù)、物聯(lián)網、云計算等;已發(fā)表學術論文8篇。
葉云,中興通訊股份有限公司運營商部方案總工、高級工程師;長期從事業(yè)務軟件產品的技術預研、產品方案規(guī)劃及標準化工作,先后主持和參加了中興通訊IMS、云計算、物聯(lián)網、智能管道、大數(shù)據(jù)等多個重點綜合方案的設計;已發(fā)表學術論文50余篇。