黃海,周靈
(1.廣東第二師范學(xué)院,廣州510000;2.佛山科學(xué)技術(shù)學(xué)院計算機系,佛山528000)
基于曲線擬合的分組域業(yè)務(wù)分析模型及算法實現(xiàn)
黃海1,周靈2
(1.廣東第二師范學(xué)院,廣州510000;2.佛山科學(xué)技術(shù)學(xué)院計算機系,佛山528000)
對電信移動網(wǎng)絡(luò)而言,分組域業(yè)務(wù)分析模型及算法研究是一個嶄新的領(lǐng)域?;谇€擬合研究分組域業(yè)務(wù)分析預(yù)測模型;并進(jìn)行算法設(shè)計與實現(xiàn)。同時,利用移動分組域監(jiān)控系統(tǒng)的實時測量數(shù)據(jù),實現(xiàn)分組域業(yè)務(wù)分析預(yù)測原型,進(jìn)行3G用戶激活附著比、Gn口流量統(tǒng)計的分析和預(yù)測。結(jié)果表明,利用曲線擬合進(jìn)行移動分組域的業(yè)務(wù)分析正確且有效。
分組域;曲線擬合;業(yè)務(wù)分析;實驗測量;算法模型
隨著移動通信新業(yè)務(wù)和IP技術(shù)的迅猛發(fā)展,數(shù)據(jù)通信和多媒業(yè)務(wù)在GSM移動通信中日益增多,甚至超過傳統(tǒng)的語音話務(wù)量而成為移動通信網(wǎng)的主要承載業(yè)務(wù)。因此,國際通信標(biāo)準(zhǔn)化組織對電信移動通信網(wǎng)進(jìn)行了擴展,在傳統(tǒng)電路域(Circuit Switch,CS)的基礎(chǔ)上引入了GPRS、EPC分組域(Packet Switch,PS)。相對CS域而言,GPRS分組交換實現(xiàn)了同一信道由幾個用戶共享,極大地提高了無線資源的利用率,數(shù)據(jù)通信可以實時在線并按流量計費;EPC系統(tǒng)則以GPRS分組交換技術(shù)為基礎(chǔ)進(jìn)一步演化而來,定位于構(gòu)建高速率、低延遲、數(shù)據(jù)PS化、可移植、支持多種無線接入技術(shù)的3G移動通信系統(tǒng)新標(biāo)準(zhǔn)[1]。就體系結(jié)構(gòu)而言,移動通信PS域包括2G/3G/4G分組域和EPC(LTE核心網(wǎng))兩個部分;其中,2G/3G/4G分組域網(wǎng)元包括:服務(wù)GPRS支持節(jié)點SGSN、網(wǎng)關(guān)GPRS支持節(jié)點GGSN、HLR、CG;EPC分組域的網(wǎng)元包括:MME、SAE-GW、PCRF、CG等。
傳統(tǒng)GSM通信系統(tǒng)的業(yè)務(wù)分析離不開話務(wù)模型,設(shè)立話務(wù)模型的目的是統(tǒng)計、分析并預(yù)測話務(wù)量的現(xiàn)狀和發(fā)展,進(jìn)而進(jìn)行相關(guān)容量等網(wǎng)絡(luò)參數(shù)規(guī)劃。PS域分組交換技術(shù)引入通信系統(tǒng)之后,“話務(wù)模型”概念改成“業(yè)務(wù)模型”概念,無法使用傳統(tǒng)的經(jīng)驗公式或者愛爾蘭查表法來確定PS域的業(yè)務(wù)量、設(shè)備容量和通信業(yè)務(wù)QoS之間的關(guān)系[2]?,F(xiàn)有PS域業(yè)務(wù)模型的建模與規(guī)劃,主要是通過實驗室數(shù)據(jù),并結(jié)合國內(nèi)外運營商經(jīng)驗,確定用戶業(yè)務(wù)模型關(guān)鍵參數(shù),基本上是基于用戶的模型,主要包括用戶附著激活比、同時使用業(yè)務(wù)用戶比例、每使用業(yè)務(wù)用戶平均流量、用戶平均數(shù)據(jù)包長等;與設(shè)備性能和接口流量無關(guān)。因此,分組域業(yè)務(wù)分析模型的建立與算法實現(xiàn)屬于嶄新的研究領(lǐng)域,沒有成熟的方法和模式,這些新情況、新問題尚待研究。
本文基于曲線擬合研究了PS域業(yè)務(wù)分析預(yù)測模型;并進(jìn)行算法設(shè)計和軟件系統(tǒng)開發(fā);同時,利用移動PS域監(jiān)控系統(tǒng)的實時測量數(shù)據(jù),實現(xiàn)PS域業(yè)務(wù)分析預(yù)測系統(tǒng)的原型;并對特定網(wǎng)元的3G用戶激活附著比、Gn口流量統(tǒng)計進(jìn)行了分析預(yù)測。
業(yè)務(wù)分析是PS域網(wǎng)絡(luò)分析的重要組成部分。數(shù)學(xué)方面的分析預(yù)測方法有很多,進(jìn)行數(shù)據(jù)分析預(yù)測應(yīng)該根據(jù)應(yīng)用的不同領(lǐng)域,還要根據(jù)當(dāng)時的實際情況和不同的分析預(yù)測要求,在合理分析的基礎(chǔ)上選擇合適的分析預(yù)測模型;同時,還有充分考慮各種外圍因素對預(yù)測效果的影響。曲線擬合通過建立一個自變量(例如預(yù)測對象)與相關(guān)隨機變量(例如時間變量)的回歸分析模型,來分析預(yù)測相關(guān)隨機變量的未來值。如根據(jù)歷史數(shù)據(jù)的觀察與初步分析,尋求某兩個變量之間的合理關(guān)系,進(jìn)而對未來的趨勢和數(shù)據(jù)進(jìn)行預(yù)測[3]。
定義1給定數(shù)據(jù)點(xi,yi)(i=0,1,2,3,…,m),存在函數(shù)(φ為多項式函數(shù)類),使得:
則函數(shù)Pn(x)為擬合函數(shù)。當(dāng)擬合函數(shù)為多項式時,稱為多項式曲線擬合。
下面,我們將曲線擬合引入到移動PS域業(yè)務(wù)分析預(yù)測模型中,并進(jìn)行業(yè)務(wù)數(shù)據(jù)預(yù)測。假設(shè)有實驗數(shù)據(jù)系列(xi,yi),計算曲線擬合多項式函數(shù)時,可以先寫出正規(guī)方程組,再求解多項式系數(shù)序列(a1,a2,…,an),從而得出多項式函數(shù)。正規(guī)方程組可以用矩陣形式表示如下:
根據(jù)移動PS域監(jiān)控系統(tǒng)的實時測量數(shù)據(jù),可以從后臺的網(wǎng)管系統(tǒng)中獲取一段時間內(nèi)(例如1×24小時、7×24小時、1個月甚至1年內(nèi))的實驗測量數(shù)據(jù),記為:(xi,yi)(i=1,2,3,…,m),xi、yi表示任意一次的實驗數(shù)據(jù),m為實驗次數(shù),即樣本容量。利用這些數(shù)據(jù),根據(jù)曲線擬合的多項式最優(yōu)解原理,可以計算擬合多項式的系數(shù)序列(a0,a1,a2,…,an)。
例如,假設(shè)一次擬合函數(shù)如下:
其中Y是預(yù)測對象,x是主要影響因素,a0、a1為回歸常數(shù),ε為回歸余項,ε∝N(0,σ2);對矩陣正規(guī)方程進(jìn)行化簡,得到兩個以a0、a1為參數(shù)的方程:
求解這個方程組可得系數(shù)a0、a1,表示如下:
下面給出算法設(shè)計與實現(xiàn)的主要內(nèi)容,包括數(shù)據(jù)輸入、輸出、算法主要步驟以及算法實現(xiàn)的數(shù)據(jù)結(jié)構(gòu)等關(guān)鍵問題。
輸入:實驗數(shù)據(jù)(xi,yi)(i=1,2,3,…,m),指定時間xi+1,xi+2,xi+3等;
輸出:根據(jù)指定的時間值輸出對應(yīng)的預(yù)測數(shù)據(jù)yi+1,yi+2,yi+3等。
主要步驟如下:
步驟1:采集網(wǎng)絡(luò)測量數(shù)據(jù)。包括附著用戶數(shù)、激活用戶數(shù)、Gn/Gi/GB/IuPS口流量、防火墻會話數(shù)等分組域系統(tǒng)運行的關(guān)鍵參數(shù),以小時為粒度,從后臺網(wǎng)管系統(tǒng)進(jìn)行數(shù)據(jù)采集;
步驟2:數(shù)據(jù)預(yù)處理。將步驟1提取出的各關(guān)鍵參數(shù)對應(yīng)的統(tǒng)計數(shù)據(jù)分別按時間先后順序分別組成n個時間序列,并對時間序列進(jìn)行異常數(shù)據(jù)、噪聲點識別消除;
步驟3:獲取預(yù)測所需的測量數(shù)據(jù)。從預(yù)處理后的數(shù)據(jù)表中獲取預(yù)測所需的歷史測量數(shù)據(jù):(xi,yi)(i= 1,2,3,…,m);
步驟5:求解系數(shù)系列(a1,a2,…,an)。相對一次擬合而言,即求解a0、a1:
步驟6:計算確定擬合函數(shù)。根據(jù)步驟5計算的a0、a1,確定擬合函數(shù)Y=a0+a1x;
步驟7:進(jìn)行數(shù)據(jù)預(yù)測。根據(jù)指定的xi+1,xi+2,xi+3等計算對應(yīng)的預(yù)測值yi+1,yi+2,yi+3等。
步驟8:進(jìn)行網(wǎng)絡(luò)容量預(yù)測,并分析網(wǎng)絡(luò)壓力點。若達(dá)到網(wǎng)絡(luò)壓力點,啟動相應(yīng)設(shè)備擴容。
算法的實現(xiàn)涉及到一些軟件系統(tǒng)設(shè)計與工程方面的問題,有的是軟件系統(tǒng)開發(fā)方面的共性問題,在此不討論;有一些是本PS域業(yè)務(wù)分析和預(yù)測算法設(shè)計特有的問題,主要有三個方面。
關(guān)于網(wǎng)絡(luò)測量數(shù)據(jù)的處理。獲取的歷史測量數(shù)據(jù)為原始的網(wǎng)管數(shù)據(jù)集,導(dǎo)入到數(shù)據(jù)庫中,按照系統(tǒng)功能需求,設(shè)計多個表,保存在數(shù)據(jù)庫表中。不用按大小排序,只需按時間順序保存即可,并進(jìn)行數(shù)據(jù)預(yù)處理。
關(guān)于數(shù)據(jù)分析和預(yù)測的呈現(xiàn)方式,有兩種情況。一是每天只預(yù)測業(yè)務(wù)量忙時的最大值;另一種是按照樣本數(shù)據(jù)每小時進(jìn)行一次預(yù)測,按照相同時間點的數(shù)據(jù)系列進(jìn)行預(yù)測,數(shù)據(jù)誤差相對較小。再從數(shù)據(jù)庫或者變量中讀取數(shù)據(jù),在坐標(biāo)區(qū)域用曲線標(biāo)示[4]。
從移動分組網(wǎng)監(jiān)控系統(tǒng)獲得的PS域業(yè)務(wù)數(shù)據(jù),因為個體數(shù)據(jù)的敏感性,只獲取兩天的統(tǒng)計數(shù)據(jù),且僅供本PS域網(wǎng)絡(luò)分析預(yù)測研究使用[5]。從網(wǎng)管系統(tǒng)獲得的歷史數(shù)據(jù)內(nèi)容和存儲方式比較繁雜,經(jīng)處理后主要包括:測量時間、網(wǎng)元名稱、3G用戶附著數(shù)、3G用戶激活數(shù)、Gn口流量、GB口流量等。
以Java為開發(fā)語言,使用SQL Server作為后臺數(shù)據(jù)庫,實現(xiàn)了曲線擬合業(yè)務(wù)模型和算法。利用這個原型系統(tǒng)對PS域業(yè)務(wù)進(jìn)行分析預(yù)測,主要進(jìn)行了SGSN網(wǎng)元的3G用戶激活附著比、Gn口流量統(tǒng)計兩個方面的分析,具體實驗結(jié)果如圖1、圖2所示。繪制的曲線圖是PS域3天的網(wǎng)絡(luò)分析數(shù)據(jù)(用紅色虛線分開表示),橫坐標(biāo)的前兩天(2×24小時)為歷史數(shù)據(jù)分析,第三天(1×24小時)為未來數(shù)據(jù)預(yù)測。
從圖1可以看出,3G用戶激活附著比符合移動網(wǎng)絡(luò)PS域的歷史實際情況。在每天的凌晨3-5時為最小值,白天10-18時比較穩(wěn)定,為全天的最大值;函數(shù)值全天在0.25-0.4之間變化,忙閑時規(guī)律明顯,并根據(jù)前兩天的歷史測量數(shù)據(jù)預(yù)測了的第三天的3G用戶激活附著比業(yè)務(wù)量。對于Gn口的流量統(tǒng)計,可以從圖2進(jìn)行類似分析。
圖1 3G用戶激活附著比圖
圖2 Gn口流量統(tǒng)計圖
本文研究了基于曲線擬合的PS域業(yè)務(wù)分析及預(yù)測模型;并進(jìn)行了算法設(shè)計和軟件系統(tǒng)開發(fā)。同時,利用移動PS域監(jiān)控系統(tǒng)的實時測量數(shù)據(jù),實現(xiàn)了PS域業(yè)務(wù)分析預(yù)測系統(tǒng)的原型,進(jìn)行了3G用戶激活附著比、Gn口流量統(tǒng)計的分析和預(yù)測。結(jié)果表明,利用曲線擬合進(jìn)行PS域移動通信業(yè)務(wù)的分析與預(yù)測是有效的,應(yīng)該進(jìn)一步研究和在線實驗測試。
[1]TS 23.401.General Packet Group Service(GPRS)Enhancements for Evolved Universal Terrestrial Radio Access Network(E-UTRAN)Access[S],LTE,2009,06.
[2]劉增基,鮑民權(quán),邱智亮編著.交換原理與技術(shù)[M].人民郵電出版社,2014.8.
[3]袁野,孫迪科,張榮.網(wǎng)絡(luò)融合背景下的移動分組域網(wǎng)絡(luò)負(fù)荷指標(biāo)關(guān)聯(lián)模型研究[J].移動通信,2015.1.
[4]Ling Zhou,De-feng Zhang.Least Energy-Consumption Real-Time Routing Algorithm Based on Event Sensitive Node Set[J].Journal of Communications,2014,07.
[5]中國移動通信有限公司.2G/3G/4G融合核心網(wǎng)統(tǒng)一標(biāo)準(zhǔn)模型[S],2014.12.
Model and Algorithm for Capacity Analysis in Packet Switch Based on Curve Fitting
HUANG Hai1,ZHOU Ling2
(1.Guangdong University of Education,Guangzhou 510000;2.Department of Computer Science and Technology,F(xiàn)oshan University,F(xiàn)oshan 528000)
To the mobile telecommunications networks,capacity model and algorithm design for packet switch is a new research field.Studies the capacity analysis model for packet switch based on curve fitting and develops its prediction algorithm.At the same time,the prototype system for capacity analysis and data prediction is achieved by using real-time measuring data from monitoring and control system of mobile telecommunications networks.Analysis and prediction experiments are done about 3G subscriber ratio and rate of flow in Gn port. The experiment results show that it is correct and efficient to use curve fitting to design capacity model and algorithm for packet switch in mobile telecommunications networks.
Packet Switch;Curve Fitting;Capacity Analysis;Experiment;Algorithm Model
廣東省教育廳青年創(chuàng)新人才資助項目(No.2015KQNCX109)
1007-1423(2016)23-0016-04DOI:10.3969/j.issn.1007-1423.2016.23.004