中國(guó)聯(lián)通研究院 北京 100032
隨著第三代(3G)和第四代(4G)移動(dòng)通信技術(shù)的快速發(fā)展和網(wǎng)絡(luò)更廣范圍的覆蓋,以及智能終端設(shè)備能力的提升和價(jià)格的快速下降,移動(dòng)互聯(lián)網(wǎng)在中國(guó)和全球迅速發(fā)展。表現(xiàn)之一為大量的用戶通過(guò)移動(dòng)設(shè)備接入互聯(lián)網(wǎng)。根據(jù)中國(guó)互聯(lián)網(wǎng)信息中心(CNNIC)《第36次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》提供的數(shù)據(jù),截至2015年6月,中國(guó)手機(jī)網(wǎng)民達(dá)到5.94億戶,網(wǎng)民中使用手機(jī)上網(wǎng)的人群占比由2014年12月的85.8%提升至88.9%(如圖1所示)。與此相比,通過(guò)臺(tái)式電腦和筆記本電腦接入互聯(lián)網(wǎng)的比例較2014年底分別下降了2.4和0.7個(gè)百分點(diǎn),電腦端向手機(jī)端遷移的趨勢(shì)明顯[1]。
移動(dòng)互聯(lián)網(wǎng)迅速發(fā)展的表現(xiàn)之二為大量的互聯(lián)網(wǎng)應(yīng)用正快速向移動(dòng)終端側(cè)轉(zhuǎn)移,互聯(lián)網(wǎng)應(yīng)用從面向PC到同時(shí)面向PC和移動(dòng)終端用戶轉(zhuǎn)變,甚至出現(xiàn)了大量主要面向移動(dòng)終端用戶的應(yīng)用。對(duì)CNNIC《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》提供的數(shù)據(jù)進(jìn)行研究不難發(fā)現(xiàn),用戶通過(guò)手機(jī)終端使用各類互聯(lián)網(wǎng)應(yīng)用的增長(zhǎng)率遠(yuǎn)高于所有互聯(lián)網(wǎng)用戶使用應(yīng)用的增長(zhǎng)率[1]。
作為移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)的承載網(wǎng)絡(luò),對(duì)移動(dòng)網(wǎng)絡(luò),上述表現(xiàn)直接體現(xiàn)在承載數(shù)據(jù)流量的迅速攀升。圖2為2014年10月至2015年9月中國(guó)聯(lián)通移動(dòng)網(wǎng)絡(luò)流量的統(tǒng)計(jì)情況(注:2014年10月,流經(jīng)中國(guó)聯(lián)通移動(dòng)網(wǎng)絡(luò)的總流量約為37.98PB,2015年9月約為60.01PB,月均增長(zhǎng)5.15%。同期,2014年10月中國(guó)聯(lián)通移動(dòng)用戶數(shù)為2.97747億戶,2015年8月下降989萬(wàn)戶至2.87858億戶)。隨著國(guó)家積極推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃,移動(dòng)通信網(wǎng)絡(luò)作為國(guó)家新一代信息基礎(chǔ)設(shè)施,在國(guó)家經(jīng)濟(jì)發(fā)展和產(chǎn)業(yè)轉(zhuǎn)型中的地位變得日益重要,如何建設(shè)一個(gè)能夠有效支撐“互聯(lián)網(wǎng)+”產(chǎn)業(yè)發(fā)展的優(yōu)質(zhì)移動(dòng)通信網(wǎng)絡(luò)成為運(yùn)營(yíng)商面臨的重要課題。
圖1 中國(guó)手機(jī)網(wǎng)民規(guī)模及其占網(wǎng)民比例(資料來(lái)源:CNNIC)
圖2 中國(guó)聯(lián)通移動(dòng)網(wǎng)絡(luò)流量
當(dāng)前運(yùn)營(yíng)商移動(dòng)網(wǎng)絡(luò)建設(shè)面臨著以下主要問(wèn)題:
1)移動(dòng)網(wǎng)絡(luò)資源整體過(guò)剩但局部不足,網(wǎng)絡(luò)質(zhì)量與移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)需要存在差距。網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)與實(shí)際移動(dòng)互聯(lián)網(wǎng)用戶和業(yè)務(wù)分布特征并不能準(zhǔn)確契合,網(wǎng)絡(luò)建設(shè)精準(zhǔn)性和投資有效性亟需提高。
移動(dòng)網(wǎng)絡(luò)規(guī)劃的核心是無(wú)線網(wǎng)絡(luò)規(guī)劃。無(wú)線網(wǎng)絡(luò)規(guī)劃需要設(shè)定覆蓋區(qū)域、業(yè)務(wù)量(容量)和業(yè)務(wù)質(zhì)量目標(biāo)。如何確定指定覆蓋區(qū)域的業(yè)務(wù)量?這涉及到覆蓋區(qū)域內(nèi)的用戶數(shù)和每個(gè)用戶所需要的業(yè)務(wù)量[2]。用戶數(shù)是一個(gè)變化量,跟給定區(qū)域內(nèi)的居住人口、工作人口和流動(dòng)人口密切相關(guān)。而每用戶所需要的業(yè)務(wù)量則決定于業(yè)務(wù)種類和使用的頻繁程度。不同于以往相對(duì)靜態(tài)的話務(wù)模型,移動(dòng)互聯(lián)網(wǎng)是業(yè)務(wù)創(chuàng)新最為活躍的領(lǐng)域,業(yè)務(wù)類型更加多樣,變化更加頻繁,業(yè)務(wù)受眾更加個(gè)性化,影響用戶使用習(xí)慣的因素眾多,使用頻度更加難以預(yù)測(cè)。對(duì)于業(yè)務(wù)質(zhì)量,不同業(yè)務(wù)的要求也各不相同。面對(duì)這樣一個(gè)復(fù)雜多變的業(yè)務(wù)環(huán)境,就需要我們對(duì)網(wǎng)絡(luò)的業(yè)務(wù)情況有更加細(xì)分和精確化的了解,并以此為基礎(chǔ)做最優(yōu)化的資源配置,而不是僅依靠傳統(tǒng)模型做相對(duì)靜態(tài)的預(yù)測(cè)。
2)以往移動(dòng)網(wǎng)絡(luò)規(guī)劃及優(yōu)化建設(shè)更多是以網(wǎng)絡(luò)自身的指標(biāo)為核心,而非以用戶體驗(yàn)為核心。例如,在覆蓋指標(biāo)上,主要考慮覆蓋區(qū)域內(nèi)的參考信號(hào)接收功率(RSRP)、接收信號(hào)強(qiáng)度指示(RSSI)、參考信號(hào)接收質(zhì)量(RSRQ)、參考信號(hào)信噪比(RS-SINR)等指標(biāo),并設(shè)定相應(yīng)的目標(biāo)值;在業(yè)務(wù)質(zhì)量指標(biāo)上,在用戶占用一定網(wǎng)絡(luò)資源的條件下,設(shè)定無(wú)線接通率、掉線率、系統(tǒng)內(nèi)切換成功率、可接入率、塊差錯(cuò)率等目標(biāo)值;在容量指標(biāo)上考慮小區(qū)吞吐量、邊緣速率等指標(biāo)[3]。
問(wèn)題是,這些指標(biāo)只反映了用戶接入無(wú)線網(wǎng)絡(luò)的質(zhì)量情況,并不能完全反映用戶使用業(yè)務(wù)的真實(shí)感知。如圖3所示,當(dāng)一個(gè)用戶在位置A使用業(yè)務(wù)時(shí),他的業(yè)務(wù)訪問(wèn)路徑是1,當(dāng)用戶在位置B時(shí),他訪問(wèn)相同業(yè)務(wù)的路徑是2。用戶在位置A和位置B使用業(yè)務(wù)的感知是否有差異?是否滿足用戶的業(yè)務(wù)體驗(yàn)要求?如果我們將業(yè)務(wù)的CDN節(jié)點(diǎn)擴(kuò)展到數(shù)據(jù)中心N,使用戶在位置B訪問(wèn)業(yè)務(wù)通過(guò)路徑3,是否會(huì)顯著提升用戶的體驗(yàn)?顯然,單靠網(wǎng)絡(luò)接入指標(biāo)是不能反映用戶使用業(yè)務(wù)的真實(shí)情況,因?yàn)槎说蕉薎P通路的質(zhì)量并不包含在上述指標(biāo)中。
圖3 一個(gè)用戶使用移動(dòng)業(yè)務(wù)的典型場(chǎng)景
如果我們考察用戶使用業(yè)務(wù)過(guò)程中位置發(fā)生移動(dòng)的場(chǎng)景,例如用戶從位置A移動(dòng)到位置B,那么在其中又伴隨著大量的小區(qū)和基站間切換。我們雖然掌握某個(gè)設(shè)備(基站、小區(qū)、MME/S-GW)下的無(wú)線網(wǎng)絡(luò)質(zhì)量情況,但并沒(méi)有系統(tǒng)完整告訴我們某個(gè)用戶使用業(yè)務(wù)的整個(gè)時(shí)間和空間內(nèi)發(fā)生了什么,用戶的業(yè)務(wù)感知如何。
3)難以精確掌握網(wǎng)絡(luò)運(yùn)行的整體情況,難以呈現(xiàn)網(wǎng)絡(luò)運(yùn)行情況的整體視圖。目前運(yùn)營(yíng)商移動(dòng)網(wǎng)絡(luò)管理系統(tǒng)依然存在條塊分割、管理手段分散的情況。條塊分割表現(xiàn)為:針對(duì)無(wú)線接入網(wǎng)、核心網(wǎng)、傳輸網(wǎng)等,都有各自的專業(yè)網(wǎng)管系統(tǒng);管理手段分散表現(xiàn)為:在對(duì)網(wǎng)元設(shè)備的管理上,不同廠商針對(duì)自身設(shè)備有各自的網(wǎng)管系統(tǒng),雖然在省分公司和集團(tuán)公司總部層面建設(shè)了綜合網(wǎng)管系統(tǒng),以期實(shí)現(xiàn)“集中管理、集中監(jiān)控、集中維護(hù)”,但這樣的“綜合”系統(tǒng)也有幾百套之多,而廠商網(wǎng)管系統(tǒng)則多達(dá)千套。在此情況下,不僅缺乏端到端的集中監(jiān)控和集中故障管理能力,并且無(wú)法及時(shí)和準(zhǔn)確掌握網(wǎng)絡(luò)運(yùn)行的整體情況。
要解決上述問(wèn)題,就需要我們擺脫網(wǎng)絡(luò)規(guī)劃建設(shè)及網(wǎng)絡(luò)管理的既有模式,實(shí)現(xiàn)變革。
顯然,移動(dòng)網(wǎng)絡(luò)智能化建設(shè)離不開(kāi)數(shù)據(jù)的支持。首先,我們需要分析移動(dòng)網(wǎng)絡(luò)中有哪些數(shù)據(jù)。
圖4描述了運(yùn)營(yíng)商現(xiàn)有移動(dòng)網(wǎng)絡(luò)的架構(gòu)示意[4]。以往,我們從移動(dòng)網(wǎng)絡(luò)中獲取的數(shù)據(jù)通常有兩個(gè)特點(diǎn):1)來(lái)源于網(wǎng)元設(shè)備,如基站、無(wú)線網(wǎng)絡(luò)控制器、電路域和分組域核心網(wǎng)設(shè)備等;2)網(wǎng)元生成的數(shù)據(jù)一般是結(jié)果數(shù)據(jù),如用戶計(jì)費(fèi)話單數(shù)據(jù)(Calling Detailed Record,CDR)、網(wǎng)元性能統(tǒng)計(jì)數(shù)據(jù)、測(cè)量數(shù)據(jù)等,而這些數(shù)據(jù)對(duì)網(wǎng)絡(luò)智能化建設(shè)遠(yuǎn)遠(yuǎn)不夠。
圖4 移動(dòng)網(wǎng)絡(luò)架構(gòu)
以數(shù)據(jù)業(yè)務(wù)為例,網(wǎng)元生成的用戶流量話單如:話單類型、用戶的MSISDN、用戶的IMSI、用戶設(shè)備的IMEI、接入點(diǎn)名稱(APN)、P-GW/GGSN IP地址、S-GW/SGSN IP地址、流量大小、記錄開(kāi)始時(shí)間、持續(xù)時(shí)長(zhǎng)、計(jì)費(fèi)標(biāo)識(shí)、用戶位置信息、無(wú)線接入類型(RAT Type),等等。
這些信息在相關(guān)網(wǎng)元設(shè)備上按照一定的規(guī)則被記錄。對(duì)數(shù)據(jù)業(yè)務(wù)而言,通常是用戶的流量積累到一定門限(如5M),或者累計(jì)到一定時(shí)長(zhǎng)(例如30分鐘),生成一條話單。但是用戶在發(fā)生這些流量時(shí)的業(yè)務(wù)體驗(yàn)如何,上述信息并不能告訴我們?nèi)魏未鸢?。例如,用戶在發(fā)起業(yè)務(wù)請(qǐng)求時(shí),初始上下文建立過(guò)程中的延時(shí)如何?無(wú)線接入承載(RAB)建立和變更過(guò)程中的時(shí)延如何?如果業(yè)務(wù)是網(wǎng)絡(luò)發(fā)起的,網(wǎng)絡(luò)尋呼用戶終端花費(fèi)了多少時(shí)長(zhǎng)?用戶使用業(yè)務(wù)期間的上網(wǎng)速率如何?IP層的丟包率如何?TCP的建立時(shí)延如何?等等。而這些恰恰是反映用戶業(yè)務(wù)體驗(yàn)的重要指標(biāo)。
更重要的,對(duì)于網(wǎng)絡(luò)建設(shè)而言,我們更關(guān)心那些并沒(méi)有成功發(fā)起的呼叫和業(yè)務(wù)請(qǐng)求。而這些在現(xiàn)有網(wǎng)元上僅有統(tǒng)計(jì)信息,而沒(méi)有針對(duì)具體用戶的記錄信息。例如,一個(gè)用戶訪問(wèn)數(shù)據(jù)業(yè)務(wù)失敗,是因?yàn)橛脩羲诘氐木W(wǎng)絡(luò)質(zhì)量問(wèn)題,以至于無(wú)線資源鏈路無(wú)法建立?還是是因?yàn)镸O(Mobile Originated,移動(dòng)臺(tái)發(fā)起)過(guò)程中RAB指派失???亦或是MT(Mobile Terminated,移動(dòng)臺(tái)終止)過(guò)程中被叫終端未被尋呼到?等等。準(zhǔn)確發(fā)現(xiàn)和掌握這些問(wèn)題,并解決這些問(wèn)題,是網(wǎng)絡(luò)智能化建設(shè)的優(yōu)先課題。
上述這些數(shù)據(jù)都是用戶在接入網(wǎng)絡(luò)和使用業(yè)務(wù)中的“過(guò)程”數(shù)據(jù)。在大數(shù)據(jù)時(shí)代,我們不僅需要知道事情的結(jié)果,而且更在意事情發(fā)生的過(guò)程,我們需要了解用戶和網(wǎng)絡(luò)發(fā)生的一切,并記錄下來(lái)。
對(duì)應(yīng)上面數(shù)據(jù)業(yè)務(wù)的例子,為了了解用戶的網(wǎng)絡(luò)及業(yè)務(wù)體驗(yàn),我們可能需要如下過(guò)程數(shù)據(jù):附著/去附著過(guò)程數(shù)據(jù)、業(yè)務(wù)請(qǐng)求過(guò)程數(shù)據(jù)、尋呼過(guò)程數(shù)據(jù)、承載資源建立/修改和釋放過(guò)程數(shù)據(jù)、用戶訪問(wèn)移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)應(yīng)用的過(guò)程數(shù)據(jù)(訪問(wèn)的網(wǎng)址、速率、時(shí)延等)。
對(duì)于“過(guò)程”數(shù)據(jù),我們需要回答如下幾個(gè)問(wèn)題。哪些數(shù)據(jù)需要被記錄?如何獲取并記錄這些數(shù)據(jù)?如何存儲(chǔ)和處理這些數(shù)據(jù)?
移動(dòng)通信網(wǎng)絡(luò)在服務(wù)用戶的過(guò)程中產(chǎn)生兩種過(guò)程數(shù)據(jù),一種是用戶面數(shù)據(jù),一種是信令面數(shù)據(jù)。用戶面數(shù)據(jù)包括用戶的語(yǔ)音通話數(shù)據(jù)和上網(wǎng)流量數(shù)據(jù)。信令面數(shù)據(jù)是為了保證用戶面數(shù)據(jù)通信而在用戶終端設(shè)備與基站之間,以及網(wǎng)絡(luò)網(wǎng)元設(shè)備之間發(fā)送的控制信號(hào)。
顯然,用戶面數(shù)據(jù)是用戶通信的隱私數(shù)據(jù),通信數(shù)據(jù)本身并不是我們需要的。對(duì)于用戶面數(shù)據(jù),我們只需要一個(gè)概要,即為了分析網(wǎng)絡(luò)流量行為,我們僅需要知道用戶何時(shí)、何地、使用什么終端、訪問(wèn)了哪些應(yīng)用[5],并且在訪問(wèn)應(yīng)用的過(guò)程中,網(wǎng)絡(luò)速率、延遲和抖動(dòng)等指標(biāo)如何。而信令面數(shù)據(jù)則完整描述了用戶從接入網(wǎng)絡(luò),與網(wǎng)絡(luò)保持連接到使用業(yè)務(wù)過(guò)程中發(fā)生的與網(wǎng)絡(luò)交互的一切,這是我們更加需要的過(guò)程數(shù)據(jù)。在獲取上述過(guò)程數(shù)據(jù)后,我們就可以更好地發(fā)現(xiàn)網(wǎng)絡(luò)中存在的問(wèn)題,實(shí)現(xiàn)網(wǎng)絡(luò)建設(shè)和優(yōu)化設(shè)計(jì)的智能化。
一個(gè)衍生的問(wèn)題是,信令面數(shù)據(jù)涉及的接口眾多,如圖4所示。例如,在2G網(wǎng)絡(luò)中就包含空中接口(空口)、Abis、A、Gb、D、Mc等接口;3G網(wǎng)絡(luò)中包含空口、Iubis、Iu-CS、Iu-PS、Gn、Gr等接口;4G網(wǎng)絡(luò)中包含空口、X2、S1-MME、S1-U、S11、S6a、SGs等接口。雖然我們希望采集“所有”的過(guò)程數(shù)據(jù),但在現(xiàn)實(shí)環(huán)境中,因?yàn)閷?shí)施難度等問(wèn)題,我們需要根據(jù)應(yīng)用的需求進(jìn)行折中,例如采集部分接口。
這些過(guò)程數(shù)據(jù)存在于哪里呢?它們流經(jīng)了將用戶終端設(shè)備與移動(dòng)通信網(wǎng)絡(luò)連接起來(lái)的無(wú)線接入網(wǎng),流經(jīng)了移動(dòng)通信網(wǎng)絡(luò)各網(wǎng)元之間的接口。這些數(shù)據(jù)被相關(guān)網(wǎng)元處理,但除了少量的加工后的結(jié)果數(shù)據(jù)和統(tǒng)計(jì)數(shù)據(jù),絕大部分過(guò)程數(shù)據(jù)都并沒(méi)有被記錄。那些結(jié)果數(shù)據(jù)和統(tǒng)計(jì)數(shù)據(jù)被計(jì)費(fèi)系統(tǒng)和網(wǎng)管網(wǎng)優(yōu)系統(tǒng)所采集。
要記錄上述“過(guò)程”數(shù)據(jù)并不是一件簡(jiǎn)單的事情,表現(xiàn)為以下4點(diǎn):1)流程眾多。例如在4G網(wǎng)絡(luò)中,無(wú)線網(wǎng)基本信令流程包括隨機(jī)接入、尋呼、RRC連接建立、重配置、重建立、釋放、測(cè)量等;端到端業(yè)務(wù)建立和釋放流程包括附著、去附著、業(yè)務(wù)請(qǐng)求、專用承載建立、修改和釋放流程等;移動(dòng)性管理包括跟蹤區(qū)更新、小區(qū)切換、小區(qū)重選等。而每一個(gè)流程中又根據(jù)用戶和業(yè)務(wù)的不同狀態(tài)包含眾多子流程。2)每一個(gè)流程都涉及諸多網(wǎng)元和接口。例如一次附著,就涉及eNodeB、MME、HSS、S-GW、P-GW等網(wǎng)元以及Uu、S1-MME、S6a、S11、S1-U等多種接口。3)這些過(guò)程頻繁發(fā)生,包括用戶使用業(yè)務(wù)期間和未使用業(yè)務(wù)期間。例如用戶終端在空閑狀態(tài)下,就會(huì)發(fā)生包括小區(qū)重選、跟蹤區(qū)更新等流程。4)用戶一次業(yè)務(wù)使用是眾多流程的組合。例如,用戶發(fā)起一次分組域業(yè)務(wù)訪問(wèn),就可能包含隨機(jī)接入、RRC連接建立、RRC重配置、初始上下文建立、創(chuàng)建會(huì)話、專用承載建立等流程。
要獲取上述過(guò)程數(shù)據(jù),需要考慮以下問(wèn)題。
1)依托現(xiàn)有網(wǎng)元設(shè)備獲取過(guò)程數(shù)據(jù)難以做到。首先網(wǎng)元設(shè)備的核心功能是處理來(lái)自接口的服務(wù)請(qǐng)求,實(shí)現(xiàn)業(yè)務(wù)邏輯處理,并保存必要的與一個(gè)流程相關(guān)的會(huì)話信息,以便處理后續(xù)的應(yīng)答和服務(wù)請(qǐng)求。記錄日志雖然很重要,但這本是它的“附屬”功能。如果需要將網(wǎng)元處理的所有輸入和輸出的過(guò)程數(shù)據(jù)都記錄下來(lái),顯然會(huì)極大增加現(xiàn)有網(wǎng)元的工作負(fù)擔(dān),顯著降低它的處理性能。其次,每個(gè)網(wǎng)元設(shè)備看到的只是一個(gè)局部過(guò)程。例如,對(duì)MME而言,它并不知道RRC建立過(guò)程中發(fā)生了什么,同樣eNodeB也無(wú)從知曉S-GW和P-GW之間發(fā)生了什么。因此,要重現(xiàn)一個(gè)過(guò)程,就需要對(duì)多個(gè)網(wǎng)元之間的數(shù)據(jù)進(jìn)行關(guān)聯(lián)。顯然,這也不是現(xiàn)有網(wǎng)元能夠做到的。再次,這些過(guò)程數(shù)據(jù)規(guī)模巨大。以當(dāng)前中國(guó)聯(lián)通移動(dòng)網(wǎng)絡(luò)為例,這些過(guò)程數(shù)據(jù)每日將有380TB之多。
一個(gè)好的方法是,我們可以直接在網(wǎng)元間鏈路上進(jìn)行采集,獲取全部網(wǎng)元間流經(jīng)的數(shù)據(jù),并通過(guò)深度報(bào)文檢測(cè)(Deep Packet Inspection,DPI)技術(shù)摘取信令面和用戶面數(shù)據(jù)中包含的信息。通過(guò)一個(gè)集中的設(shè)備獲取上述信息,并進(jìn)行數(shù)據(jù)之間的關(guān)聯(lián)轉(zhuǎn)換,生成最終的記錄話單。對(duì)于信令面數(shù)據(jù)記錄,我們稱之為SDR(Signal Detail Record);對(duì)于用戶面數(shù)據(jù)記錄,我們稱之為FDR(Flow Detail Record)。
但DPI不能解決所有問(wèn)題。有些接口鏈路過(guò)于分散,例如Iubis等,通過(guò)DPI方式采集實(shí)際難以實(shí)施。因此,現(xiàn)實(shí)的方案也從網(wǎng)元采集必要的數(shù)據(jù),例如在eNodeB上采集Uu口的跟蹤信令數(shù)據(jù)。當(dāng)然這種采集,根據(jù)范圍的不同會(huì)增加網(wǎng)元的處理負(fù)擔(dān)。
2)應(yīng)該盡量選擇鏈路收斂的地方進(jìn)行數(shù)據(jù)采集。收斂點(diǎn)可以是網(wǎng)元和物理鏈路。對(duì)于用戶面數(shù)據(jù),合理的采集點(diǎn)是Gn接口和S1-U接口,因?yàn)檫@里鏈路最為收斂。對(duì)于核心網(wǎng)信令面數(shù)據(jù),語(yǔ)音電路域信令數(shù)據(jù)可以選擇Mc接口,相比Iu-CS和A接口,更為收斂,分組域數(shù)據(jù)可以選擇Iu-PS、Gb、S1-MME、S11等。對(duì)于無(wú)線側(cè)信令面數(shù)據(jù)采集,較為合理的采集點(diǎn)如上文所說(shuō),是BSC、RNC和eNodeB等網(wǎng)元設(shè)備。
3)信令數(shù)據(jù)關(guān)聯(lián)是核心問(wèn)題。關(guān)聯(lián)表現(xiàn)為需要將同一個(gè)接口或者不同接口上傳遞的信令以“會(huì)話”的形式集結(jié)起來(lái),并找出它們的時(shí)序關(guān)系。通常關(guān)聯(lián)是圍繞用戶的會(huì)話進(jìn)行。由于移動(dòng)網(wǎng)絡(luò)不同接口上協(xié)議類型的豐富性和多層級(jí),這種關(guān)聯(lián)很多時(shí)候會(huì)變得復(fù)雜。另外,不同接口對(duì)用戶的標(biāo)識(shí)有所不同,例如,在用戶終端設(shè)備和無(wú)線接入網(wǎng)(Radio Access Network,RAN)之間,通常用RNTI(Radio Network Temporary Identity,無(wú)線網(wǎng)絡(luò)臨時(shí)標(biāo)識(shí))來(lái)標(biāo)識(shí)用戶,而在用戶終端設(shè)備和核心網(wǎng)設(shè)備之間,通常用TMSI、P-TMSI、GUTI等標(biāo)識(shí)用戶,而在核心網(wǎng)網(wǎng)元之間則用IMSI、MSISDN等標(biāo)識(shí)用戶。因此,準(zhǔn)確維護(hù)上述標(biāo)識(shí)之間的關(guān)系,是數(shù)據(jù)關(guān)聯(lián)所必須的。
過(guò)程數(shù)據(jù)量非常巨大,根據(jù)采集范圍、采集方式的不同,每日有數(shù)千億至數(shù)萬(wàn)億條記錄之多,與此相對(duì)應(yīng),每日的數(shù)據(jù)量有數(shù)十TB至數(shù)百TB。處理和存儲(chǔ)這些數(shù)據(jù),顯然是大數(shù)據(jù)系統(tǒng)的范疇。
圖5描述了數(shù)據(jù)采集及預(yù)處理的過(guò)程。在需要采集的接口鏈路上進(jìn)行分光和部署DPI探針,獲取信令和流量信息,從OMC(Operation and Maintenance Center,操作維護(hù)中心)設(shè)備上獲取性能管理、配置管理、信令跟蹤數(shù)據(jù)。獲取下來(lái)的數(shù)據(jù)通過(guò)抽取、轉(zhuǎn)換和數(shù)據(jù)關(guān)聯(lián)(ETL),最終生成信令面數(shù)據(jù)記錄SDR、用戶面數(shù)據(jù)記錄FDR和統(tǒng)計(jì)數(shù)據(jù)記錄。上述過(guò)程在貼近網(wǎng)絡(luò)的地點(diǎn)進(jìn)行。生成后的這些數(shù)據(jù)被送往集中的數(shù)據(jù)中心。
圖5 數(shù)據(jù)采集和預(yù)處理
圖6 數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)處理
在數(shù)據(jù)中心,如圖6所示,上述數(shù)據(jù)通過(guò)流式計(jì)算技術(shù)(如Storm、Spark Streaming等)被即時(shí)處理,以便生成實(shí)時(shí)類結(jié)果數(shù)據(jù),應(yīng)用于監(jiān)控類、實(shí)時(shí)處理類應(yīng)用。同時(shí),上述數(shù)據(jù)也通常被持久化存儲(chǔ),如以文件方式存儲(chǔ)于HDFS(Hadoop Distributed File System)之上,或者存儲(chǔ)于HBase等分布式數(shù)據(jù)庫(kù)中。對(duì)于持久化存儲(chǔ)的數(shù)據(jù),可以通過(guò)運(yùn)行MapReduce或者其他計(jì)算任務(wù)的方式,進(jìn)行數(shù)據(jù)的批量處理,生成結(jié)果數(shù)據(jù)。這些結(jié)果數(shù)據(jù)通常最終被存儲(chǔ)于數(shù)據(jù)庫(kù)之中,我們稱之為“服務(wù)數(shù)據(jù)庫(kù)”。服務(wù)數(shù)據(jù)庫(kù)一般選擇關(guān)系型數(shù)據(jù)庫(kù),如Oracle,MySQL等,以便應(yīng)用通過(guò)SQL語(yǔ)句進(jìn)行交互式查詢或者進(jìn)一步處理。對(duì)于某些特定應(yīng)用場(chǎng)景,也可以對(duì)原始記錄數(shù)據(jù)進(jìn)行查詢檢索。
第2章描述了移動(dòng)網(wǎng)絡(luò)中的大數(shù)據(jù),以及采集、存儲(chǔ)和處理這些大數(shù)據(jù)的過(guò)程。圖7是一個(gè)實(shí)際系統(tǒng)的例子。在該系統(tǒng)中,從網(wǎng)絡(luò)中采集獲取了電路域呼叫控制信令數(shù)據(jù)、分組域會(huì)話管理類信令數(shù)據(jù)、無(wú)線接入網(wǎng)切換和承載管理類信令數(shù)據(jù)及測(cè)量報(bào)告數(shù)據(jù)、移動(dòng)網(wǎng)絡(luò)移動(dòng)性管理信令數(shù)據(jù)、基于基站小區(qū)的話務(wù)統(tǒng)計(jì)數(shù)據(jù)、用戶面基于流量類型的業(yè)務(wù)質(zhì)量及用戶行為數(shù)據(jù)等。以此為基礎(chǔ),依托大數(shù)據(jù)技術(shù),構(gòu)建集中化的數(shù)據(jù)處理分析系統(tǒng)。
圖7 移動(dòng)網(wǎng)絡(luò)智能化建設(shè)系統(tǒng)
基于該系統(tǒng),可以實(shí)現(xiàn)如下三大目標(biāo)。
1)網(wǎng)絡(luò)可視化。網(wǎng)絡(luò)可視化表現(xiàn)為構(gòu)建統(tǒng)一的網(wǎng)絡(luò)視圖,以便對(duì)網(wǎng)絡(luò)的服務(wù)質(zhì)量有更加清晰化、數(shù)據(jù)化的洞察。用戶可以從多個(gè)維度,多個(gè)視角(全局和局部)觀察網(wǎng)絡(luò)。主要內(nèi)容包括以下3點(diǎn)。
①網(wǎng)絡(luò)質(zhì)量分析。實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)整體質(zhì)量的評(píng)估與分析,包括資源優(yōu)化分析、地理化信息分析、移動(dòng)性分析與優(yōu)化、無(wú)線與核心網(wǎng)聯(lián)合分析與優(yōu)化、無(wú)線網(wǎng)絡(luò)覆蓋評(píng)估、無(wú)線網(wǎng)絡(luò)干擾評(píng)估、上下不均衡小區(qū)評(píng)估、核心網(wǎng)EPC接入質(zhì)量分析、保持質(zhì)量分析、核心網(wǎng)3G/4G互操作分析、核心網(wǎng)CSFB(Circuit Switched Fallback,電路域回落)分析等。
②業(yè)務(wù)質(zhì)量分析。對(duì)影響用戶業(yè)務(wù)體驗(yàn)感知的關(guān)鍵指標(biāo)進(jìn)行評(píng)估與分析,包括TCP連接建立分析、用戶面DNS解析分析、頁(yè)面瀏覽指標(biāo)分析、流媒體業(yè)務(wù)指標(biāo)分析、Email業(yè)務(wù)指標(biāo)分析、下載類業(yè)務(wù)指標(biāo)分析、即時(shí)通信類業(yè)務(wù)指標(biāo)分析、業(yè)務(wù)占比分析等。
③網(wǎng)絡(luò)質(zhì)量監(jiān)控。實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)質(zhì)量的實(shí)時(shí)和非實(shí)時(shí)監(jiān)控,包括無(wú)線網(wǎng)絡(luò)質(zhì)量監(jiān)控、核心網(wǎng)質(zhì)量監(jiān)控等。指標(biāo)包括接入性能,保持性能、運(yùn)行性能等,維度包括成功率、時(shí)延、速率指標(biāo)等。
2)網(wǎng)絡(luò)規(guī)劃優(yōu)化。網(wǎng)絡(luò)可視化的一個(gè)重要目的就是發(fā)現(xiàn)網(wǎng)絡(luò)覆蓋和服務(wù)中的問(wèn)題,從而提升網(wǎng)絡(luò)規(guī)劃優(yōu)化的科學(xué)性。網(wǎng)絡(luò)規(guī)劃優(yōu)化的核心是無(wú)線接入網(wǎng)絡(luò),包括以下4點(diǎn)。
①網(wǎng)絡(luò)簡(jiǎn)單擴(kuò)容。結(jié)合無(wú)線資源利用率、用戶數(shù)、用戶體驗(yàn)速率等,根據(jù)簡(jiǎn)單擴(kuò)容模型預(yù)測(cè)并計(jì)算各個(gè)小區(qū)擴(kuò)容的系數(shù),通過(guò)對(duì)擴(kuò)容系數(shù)進(jìn)行多個(gè)維度的排名,綜合推薦各個(gè)區(qū)域需要擴(kuò)容的小區(qū)。
②網(wǎng)絡(luò)精準(zhǔn)擴(kuò)容。根據(jù)信令面和用戶面數(shù)據(jù)記錄,以及用戶測(cè)量數(shù)據(jù),計(jì)算精確的覆蓋地圖、用戶地圖和業(yè)務(wù)地圖,從多維度對(duì)區(qū)域進(jìn)行柵格級(jí)評(píng)估,計(jì)算需要進(jìn)行擴(kuò)容的基站小區(qū),并對(duì)新建站的站址選擇提出建議。
③網(wǎng)絡(luò)優(yōu)化。根據(jù)網(wǎng)絡(luò)質(zhì)量和業(yè)務(wù)質(zhì)量分析以及監(jiān)控結(jié)果,對(duì)包括無(wú)線接入網(wǎng)、核心網(wǎng)、IP承載網(wǎng)、公眾寬帶網(wǎng)以及內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)等進(jìn)行端到端優(yōu)化,使網(wǎng)絡(luò)性能達(dá)到最佳平衡。
④建設(shè)后評(píng)估。可以根據(jù)新建或者擴(kuò)容小區(qū)基站的運(yùn)行狀況、業(yè)務(wù)量統(tǒng)計(jì)、網(wǎng)絡(luò)服務(wù)質(zhì)量、區(qū)域用戶體驗(yàn)指標(biāo)提升等多維度精確實(shí)現(xiàn)網(wǎng)絡(luò)規(guī)劃建設(shè)的后評(píng)估。
3)智能業(yè)務(wù)經(jīng)營(yíng)。隨著用戶業(yè)務(wù)從語(yǔ)音業(yè)務(wù)為中心轉(zhuǎn)向以流量業(yè)務(wù)為中心,如何實(shí)現(xiàn)智能化的流量業(yè)務(wù)經(jīng)營(yíng)就成為運(yùn)營(yíng)商關(guān)注的重點(diǎn)課題。信令面和用戶面數(shù)據(jù)記錄的采集和分析處理,可以讓我們更加精準(zhǔn)地對(duì)用戶軌跡、業(yè)務(wù)偏好、時(shí)間偏好、位置偏好進(jìn)行分析預(yù)測(cè),并精準(zhǔn)刻畫用戶畫像。此外,還可以從終端、價(jià)值區(qū)域等維度進(jìn)行分析挖掘。分析的結(jié)果除了進(jìn)行智能業(yè)務(wù)經(jīng)營(yíng),還可以作為網(wǎng)絡(luò)規(guī)劃優(yōu)化的輸入,以及用于更加廣泛的公益類及行業(yè)類大數(shù)據(jù)應(yīng)用。
我們正在進(jìn)入一個(gè)移動(dòng)互聯(lián)的時(shí)代。移動(dòng)通信網(wǎng)絡(luò)作為移動(dòng)互聯(lián)網(wǎng)的基礎(chǔ)接入和承載網(wǎng)絡(luò),作為國(guó)家新一代信息基礎(chǔ)設(shè)施的重要組成部分,在國(guó)家經(jīng)濟(jì)發(fā)展和產(chǎn)業(yè)轉(zhuǎn)型升級(jí)中變得日益重要。
移動(dòng)網(wǎng)絡(luò)建設(shè)必須擺脫以往粗放的建設(shè)模式,更多地轉(zhuǎn)向“以用戶體驗(yàn)為中心”,實(shí)現(xiàn)網(wǎng)絡(luò)建設(shè)的智能化。“智能”來(lái)自“模型”,更來(lái)自“數(shù)據(jù)”。移動(dòng)網(wǎng)絡(luò)蘊(yùn)含著豐富的數(shù)據(jù)資源,這些數(shù)據(jù)資源不僅包括以往以網(wǎng)管和計(jì)費(fèi)為中心的結(jié)果數(shù)據(jù),更包括用戶接入網(wǎng)絡(luò)和使用業(yè)務(wù)過(guò)程中的“過(guò)程”數(shù)據(jù)。過(guò)程數(shù)據(jù)的獲取和分析挖掘在網(wǎng)絡(luò)智能化建設(shè)中的作用更加重要。
過(guò)程數(shù)據(jù)是大數(shù)據(jù),并且是超大規(guī)模數(shù)據(jù)。通過(guò)對(duì)這些超大規(guī)模數(shù)據(jù)進(jìn)行處理和分析,我們可以實(shí)現(xiàn)網(wǎng)絡(luò)從全局到局部的可視化,可以實(shí)現(xiàn)更加精準(zhǔn)的面向用戶和面向業(yè)務(wù)的網(wǎng)絡(luò)規(guī)劃和優(yōu)化建設(shè)。更多地,上述數(shù)據(jù)是一個(gè)蘊(yùn)含黃金的寶庫(kù)。利用它,不僅可以服務(wù)于運(yùn)營(yíng)商的生產(chǎn)經(jīng)營(yíng),還可以構(gòu)建開(kāi)放生態(tài)環(huán)境的方式,服務(wù)從政府到行業(yè)的各種應(yīng)用[6],以實(shí)現(xiàn)科學(xué)評(píng)估、科學(xué)預(yù)測(cè)和更加個(gè)性化的服務(wù)。
參考文獻(xiàn)
[1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(C N N I C).第3 6次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[R/OL].[2016-01-10].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201507/20150722_52624.htm
[2]張傳福,吳偉陵.第三代移動(dòng)通信系統(tǒng)的網(wǎng)絡(luò)規(guī)劃[J].電子技術(shù)應(yīng)用,2000,(6):4-6
[3]楊春蘭. LTE FDD無(wú)線網(wǎng)絡(luò)規(guī)劃研究[D].南京郵電大學(xué),2014
[4]The 3rd Generation Partnership Project (3GPP). 3GPP TS 23.002 V13.2.0: Technical Specification Group Services and System Aspects; Network architecture(Release 13) [S/OL].[2016-01-10].http://www.3gpp.org/DynaReport/23002.htm
[5]王志軍,黃文良.大數(shù)據(jù)在移動(dòng)用戶上網(wǎng)記錄查詢中的應(yīng)用研究[J].信息通信技術(shù),2013,7(6):29-34
[6]王志軍,黃文良.面向移動(dòng)互聯(lián)網(wǎng)的業(yè)務(wù)創(chuàng)新生態(tài)環(huán)境研究[J].電信科學(xué),2012(3):1-8