曾雨桐,錢學榮
(南京郵電大學 通信與信息工程學院, 江蘇 南京 210003)
基于支持向量機的多因素話務量預測研究
曾雨桐,錢學榮
(南京郵電大學 通信與信息工程學院, 江蘇 南京 210003)
提高移動通信話務量的預測精度對提高網絡性能、增進用戶體驗具有重要意義。由于多種因素會影響到移動通信話務量的準確預測,故選擇多因素灰色話務量預測模型來預測話務量。先對數據進行預處理,用關聯分析法找到影響話務量預測的主要因素。但此模型對波動較大的數據預測精度較低,用支持向量機的模型來改善預測結果,選取擁有較強的斂散性和全局尋優(yōu)能力的復高斯小波核函數優(yōu)化向量機。從仿真結果可以看出該模型有更好的收斂作用和較為理想的預測效果。
復高斯小波核函數;支持向量機;多因素;話務量預測
話務量預測,是指以歷史話務量數據為基礎,從一定的規(guī)律性與特點出發(fā),通過統(tǒng)計調查,運用科學有效的建模方法對未來某一時段的話務量進行預測。通過對預測結果的分析,可以清楚地知道哪些網絡需要擴容,哪些網絡需要優(yōu)化壓縮。通常情況下預測話務量所采用的方法有線性自回歸移動平均模型(ARIMA)[1]、人工神經網絡(ANN)[2]、支持向量機(SVM)[3]等。其中線性自回歸移動平均模型[4]要求訓練數據的時間序列應具有正態(tài)分布、全局平穩(wěn)等特征,但在實際應用中,話務量的時間序列往往是不規(guī)則、非平穩(wěn)且非線性的。人工神經網絡[5]相比線性自回歸移動平均模型有較好的非線性預測能力,但要求訓練樣本數據量較大,且易于陷入局部極值,會導致最終的預測效果不穩(wěn)定。普通的預測模型大多數是根據過去的話務量去預測未來的話務量,但并沒有將相關因素考慮在內,如果沒有考慮影響因子,預測結果就會有一定的失真。為了能夠準確地預測未來話務量的變化趨勢,本文從多因素的角度,提出了一種改進的復高斯小波核函數優(yōu)化支持向量機的多因素灰色預測模型[6]。根據收集到的話務量數據和影響因素,用灰色關聯分析法計算出對話務量影響較大的因素有系統(tǒng)接通率、忙時用戶數、開機用戶數、小區(qū)切換次數。使用MATLAB進行仿真,將預測結果與粒子群優(yōu)化支持向量機的多因素灰色模型、多因素灰色模型、真實值比較,本文算法的預測結果與真實值更接近。
1.1 數據的選擇及預處理
分析往年的話務量數據可以發(fā)現,話務量會隨著時間和季節(jié)的改變而明顯發(fā)生變化,比如白天的話務量比夜晚高,節(jié)假日的話務量明顯高于平時。假如將話務量看做一個時間序列,那它具有季節(jié)性和周期性。
由于收集到的話務量數據有限,本文將側重于傳統(tǒng)節(jié)假日忙時話務量的預測。收集了安慶移動2011年~2015年每年五一之前20天的話務量數據以及影響因素的資料。在此基礎上,對其在五一的忙時數據進行仿真實驗,預測忙時話務量數據。首先將實際數據進行歸一化,將歸一化后的數據通過灰色關聯分析后得出結果數據,再用提出的改進模型進行預測。
1.2 灰色關聯分析
由于話務量受多種因素的影響,本文采用灰色關聯分析法[7]來判斷話務量與多種影響因素間的相關度大小,選擇與話務量相關性較大的因素。
灰色關聯分析的主要原理是根據序列曲線幾何形狀的相似程度來判別其聯系是否緊密。通過計算數據間相關度的大小來判別話務量與各因素相關性的大小。
(1)設系統(tǒng)特征序列X1,相關因素序列Xk:
(1)
(2)對各數據序列進行處理:
Yk=Xk/xk(1)=(yk(1),yk(2),...yk(m))
k=1,2,...,m
(2)
(3)計算相關系數:
(3)
(4)根據各數據序列關聯系數的大小,計算關聯度的值:
(4)
對話務量影響較大的因素與話務量間的關聯度結果如表1所示。
表1 影響話務量較大的因素與關聯度
1.3 多因素灰色模型
多因素灰色模型MGM(1,n)[8]是利用n元一階常微分方程組來描述n元相關聯變量的狀態(tài),并進行未知狀態(tài)預測。核心思想是先進行數據預處理,使得新生成的數列具有單調性,再對新生成的序列構建n個一元微分方程組,優(yōu)化目標函數,找到相對誤差最小的模型參數,最終可以實現預測未來的話務量。算法步驟如下:
假設某個系統(tǒng)經過灰色關聯分析后有n個影響因子,每個影響因子有m個數據:
(1)輸入原始序列,進行累加:
(5)
(2)多變量灰色模型MGM(1,n)對累加后的數據建立n元一階微分方程組,簡寫為:
(6)
(7)
令D=(A,B)T=[ai1ai2…ainbi]T,i=(1,2,…,n),若LTL可逆,則可得D的辨識值:
D′=(A′,B′)T=(LTL)-1LTY,i=1,2,...,n
(8)
計算模型參數的估計值,由式(8)得到A、B的辨識值A′、B′:
(9)
(3)計算模型的擬合值或預測值。由式(6)可得到預測值:
(10)
最終的預測值為:
(11)
通過以上多因素灰色模型的計算公式,可計算出時間序列的模擬值。但對于波動較大的時間序列,計算出的模擬值誤差較大。把安慶移動2011年~2015年每年“五一”之前20天的話務量數據及表1中相關因素的數據作為MGM(1,4)模型的輸入變量進行預測,可得到2015年“五一”話務量的預測趨勢,預測結果如圖1。
圖1 基于多因素灰色模型2015年5月1日的話務量預測值
1.4 基于復高斯小波核函數優(yōu)化的向量機
支持向量機預測模型[9]的預測精度,主要受到兩個參數的影響:懲罰因子和核函數。由于復高斯小波核函數[10]擁有較強的斂散性和全局尋優(yōu)能力,為了進一步提高預測精度,提出了基于復高斯小波核函數的支持向量機預測模型對殘差序列進行預測[11]。殘差序列是由原始的真實序列與上一步多變量灰色模型得到的模擬值對應相減得到。
設有樣本集{(xi,yi),i=1,2,...,n},其中xi∈Rd為輸入樣本,yi為輸出,不敏感損失函數ε的定義是:
|y-f(x)|ε=
(12)
回歸函數的表達式為:
f(x)=[ω·φ(x)]+b
(13)
其中φ(x)是從低維到高維的映射函數,ω表示權值參數,b表示偏差參數。
回歸函數的優(yōu)化目標函數為:
(14)
目標函數的約束條件為:
構造拉格朗日函數,將帶約束條件的目標函數轉變?yōu)闊o條件下的目標規(guī)劃問題。
(15)
對上式中的參數分別求導,并令偏導為零:
(16)
由庫恩-塔克條件,下列等式組成立:
(17)
上式中,α,α*中至少有一個為零,α≠0對應的樣本點xi被定義為支持向量,根據支持向量進行求解,便可得到支持向量機的預測函數表達式:
(18)
K(xi, x)為支持向量機預測函數表達式中的核函數, 采用的是復高斯小波核函數[12]。
使用安慶移動2011~2014四年的“五一”前20天的數據以及2015年“五一”數據的殘差序列作為已知數據來訓練預測模型,仿真結果如圖2所示。
圖2 復高斯小波核函數優(yōu)化支持向量機的五一殘差預測值
1.5 本文算法主要思想
(1)用灰色關聯分析法計算出特征序列與各相關因素序列之間相關度的大小,根據相關度的大小,找出影響話務量較大的因素。
(2)將對話務量影響較大的因素作為MGM(1,n)模型的輸入,實現對話務量基本規(guī)律的預測,并得到預測的殘差序列。
(3)利用復高斯小波核函數優(yōu)化的支持向量機模型建立殘差序列預測模型,從而實現對殘差序列的預測。
(4)將MGM(1,n)的預測結果與殘差序列預測結果疊加,實現對話務量的預測。
為了驗證本文所提算法的預測結果,選取了粒子群[13]優(yōu)化的支持向量機的多因素灰色模型、多因素灰色模型作為比較模型。其中粒子群算法的基本參數為:粒子群種群規(guī)模m=100,最大迭代次數為1 000,學習因子c1=c2=2,慣性權重ω=0.9,松弛因子ε=0.54,粒子的初始化速度為0,最小適應值ξ=0.01,通過粒子群優(yōu)化算法確定C=0.616 0,g=10.983 6。對2015年“五一”的忙時話務量進行預測,仿真結果如圖3所示。
圖3 幾種模型的預測值及與真實值的對比圖
通過對話務量的仿真分析,證明了該模型相較傳統(tǒng)的多因素灰色模型預測精度高,對波動較大的數據預測比較準確。采用相對誤差的方法對預測結果進行分析,計算結果如表2所示。
表2 幾種預測方法的相對誤差比較
本文選擇預測精度較高的預測模型對話務量進行預測,話務量的預測精度越高,對移動網絡通信的指導意義就越大,越能及時應對網絡可能出現的擁塞情況。在研究了國內外預測領域的最新進展后,針對話務量的預測,本文提出了基于復高斯小波核函數改進支持向量機的多因素灰色預測模型。在進行預測之前,搜集了大量話務量的歷史數據和相關因素數據,對2015年“五一”的忙時話務量進行了預測。
由于話務量受多種因素的影響,選擇多因素灰色話務量預測模型。此模型適合由多種因素影響的話務量的預測,而且算法比較簡單。但是當數據波動較大時,多因素灰色預測模型預測精確度較低,針對這種情況,本文提出用支持向量機的模型來修正灰色模型的預測結果。
核函數與支持向量機的預測精度相關,通過改進核函數,可提高預測精度。復高斯小波核函數擁有較強的斂散性和全局尋優(yōu)的能力,通過實驗仿真,得出改進的模型相比多因素灰色模型、粒子群優(yōu)化支持向量機補償的多因素灰色模型有更好的收斂效果和較為理想的預測結果。
[1] 彭宇,雷苗,郭嘉,等.基于先驗知識的移動通信話務量預測[J].電子學報,2011,39(1):190-194.
[2] 張一農,劉伯龍,王文婷.基于神經網絡的客服中心話務量預測模型[J].吉林大學學報(信息科學版),2011,29(2):97-101.
[3] Chen Dianbo, Xu Fucang, Wu Min. Traffic based on clustering and support vector machine forcasting model [J]. Journal of Control Engineering, 2009, 16(2):195-198.
[4] 張偉, 張新波. 移動GSM網話務量的ARIMA模型的建立及其預測[J].數學理論與應用,2008(2):70-74.
[5] 吳永明,吳晟. 改進的遺傳算法在神經網絡結構優(yōu)化中的應用[J]. 微型機與應用,2011,30(3):79-81,85.
[6] Pai Pingfeng,LIN C. A hybrid ARIMA and support vector machines model in stock price forecasting[J].Omega,2005,33(6):497-505.
[7] 李鵬,劉思峰.基于灰色關聯分析和D—S證據理論的區(qū)間直覺模糊決策方法[J].自動化學報, 2011, 37(8): 993-998.
[8] LUO Y. Non-equidistant MGM(1,n) based on vector continued factions theory and its application[J]. Information Technology Journal, 2014,13(6) ,1186-1191.
[9] 陳電波,徐福倉,吳敏. 基于聚類和支持向量機向量機的話務量預測模型[J]. 控制工程, 2009, 16( 2) : 195-199.
[10] 陳中杰,蔡勇,蔣剛.基于復高斯小波核函數的支持向量機的研究[J].計算機應用研究,2012, 29(9):3263-3265.
[11] 侯偉真,潘美芹. 高斯核支持向量機最優(yōu)模型參數選擇搜索算法[C]. 中國運籌學會第八屆學術交流會論文集. 2006:716-722.
[12] 林繼鵬, 劉君華. 基于小波的支持向量機算法研究[J]. 西安交通大學學報, 2005,39(8):816-819.
[13] WANG F S, CHEN L H. Particle swarm optimization(PSO)[J]. Encyclopedia of Systems Biology, 2013,12(8):1649-1650.
Research on multi factor traffic forecasting based on support vector machine
Zeng Yutong, Qian Xuerong
(College of Telecommunication and Information Engineering, Nanjing University of Posts and Telecommunications, Nanjing 210003, China)
It is very important to improve the network performance and user experience by forecasting mobile communication traffic volume accurately. According to the characteristics of traffic load, the multi factor grey model for traffic forecast is put forward. It needs to find main factors which affect the traffic volume forecast by using correlation analysis method firstly. Due to the low prediction accuracy of data fluctuation,so it selects complex Gaussian wavelet kernel function which has strong convergence and divergence and global optimization ability to optimize the vector machine. The simulation results show that the model has better convergence effect and prediction results.
complex Gaussian wavelet kernel function; Support Vector Machine; multi factor; traffic forecast
TN929.5
A
1674-7720(2016)01-0063-04
曾雨桐,錢學榮.基于支持向量機的多因素話務量預測研究[J].微型機與應用,2016,35(1):63-66.
2015-08-24)
曾雨桐(1990-),女,碩士研究生,主要研究方向:無線通信與移動計算。
錢學榮(1956-),男,博士,教授,主要研究方向:通信與信號處理、信源與信道編碼、寬帶移動通信與移動計算網絡技術。
____________________