亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        LIBSVM回歸算法在話務(wù)預(yù)測中的應(yīng)用

        2014-02-10 01:29:44
        關(guān)鍵詞:話務(wù)量特征向量向量

        (福建省郵電規(guī)劃設(shè)計院有限公司,福州 350001)

        LIBSVM回歸算法在話務(wù)預(yù)測中的應(yīng)用

        鐘壇旺,林昭語

        (福建省郵電規(guī)劃設(shè)計院有限公司,福州 350001)

        話務(wù)量預(yù)測在工程規(guī)劃建設(shè)中有重要的意義,但常用的預(yù)測方法總體準(zhǔn)確率不高,而LIBSVM算法在解決回歸問題上表現(xiàn)出優(yōu)良的性能。本文以H市連續(xù)587天早忙時話務(wù)量樣本作為LIBSVM模型訓(xùn)練,之后用60個樣本點作為測試數(shù)據(jù),驗證LIBSVM模型的預(yù)測性能,并對結(jié)果進(jìn)行均方誤差和平均相對誤差的指標(biāo)評價分析。

        話務(wù)量預(yù)測;LIBSVM;模型訓(xùn)練;樣本集

        在工程規(guī)劃與建設(shè)中需要根據(jù)對目標(biāo)期的話務(wù)量預(yù)測來確定目標(biāo)無線網(wǎng)絡(luò)容量、擴容需要的設(shè)備類型和數(shù)量等,話務(wù)預(yù)測結(jié)果的準(zhǔn)確與否直接關(guān)系到目標(biāo)無線網(wǎng)絡(luò)利用率、投資效益等企業(yè)發(fā)展的關(guān)鍵指標(biāo),因此以相對準(zhǔn)確的話務(wù)量預(yù)測來指導(dǎo)運營商網(wǎng)絡(luò)建設(shè),能成功應(yīng)對用戶行為的變化及其趨勢,為移動網(wǎng)絡(luò)長久、穩(wěn)定的運行奠定基礎(chǔ)。在通信網(wǎng)絡(luò)的規(guī)劃和設(shè)計中,常用的預(yù)測方法主要有趨勢外推法、回歸預(yù)測法、業(yè)務(wù)模型法、市場調(diào)查法等,常用的預(yù)測方法在網(wǎng)絡(luò)快速工程建設(shè)中,起到一定的積極作用,但總體準(zhǔn)確率不高。

        支持向量機(SVM,Support Vector Machine)是近年來出現(xiàn)的一種機器學(xué)習(xí)方法,在解決分類和回歸問題方面都表現(xiàn)出優(yōu)良的性能。借助于支持向量機方法,通過使用LIBSVM工具箱對話務(wù)量的特征向量進(jìn)行學(xué)習(xí)訓(xùn)練,經(jīng)過交叉驗證確定了回歸機的最優(yōu)參數(shù)組合,經(jīng)實驗驗證預(yù)測效果較理想,針對話務(wù)量的預(yù)測提供了一種新思路。

        1 SVM 綜述

        SVM是建立在統(tǒng)計學(xué)的VC維理論和結(jié)構(gòu)風(fēng)險最小化原則基礎(chǔ)上的機器學(xué)習(xí)方法,它能夠根據(jù)有限樣本信息,在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,是SLT的一種成功實現(xiàn)。

        當(dāng)SVM用于回歸估計時,稱為SVM回歸機。假設(shè)訓(xùn)練樣本為(xi,yi),(i=1,…,l)。最簡單的SVM回歸機使用線性函數(shù)對樣本點進(jìn)行擬合。對于無法用線性函數(shù)擬合的問題,則將樣本映射到高維特征空間,在高維特征空間中建立線性模型,其中是將樣本點映射到高維空間的非線性變換,SVM回歸機可以表示為

        滿足以下約束條件:

        式(1)中,‖ω‖2代表與模型復(fù)雜度相關(guān)的因素;C>0為懲罰系數(shù),它控制對超出誤差的樣本的懲罰程度;ε為不敏感損失函數(shù),其取值大小影響支持向量的數(shù)目;為松弛變量,表示樣本偏離ε不敏感區(qū)域的程度。

        對于式(1),通常通過求解上述模型的Lagrange對偶問題獲得原問題的最優(yōu)解

        其中,K(xi+xj)稱為核函數(shù),滿足Mercer條件且K(xi+xj)=φ(xi)φ(xj)。徑向基核(radial basis function,RBF)是普適的核函數(shù),K(x+x')=exp(-‖x+x'‖2/σ2) =exp(-γ‖x+x'‖2),其中σ>0是核寬度系數(shù),γ=1/σ2。懲罰系數(shù)C、不敏感系數(shù)ε、核函數(shù)及相關(guān)參數(shù)的選擇,對SVM的效果有顯著影響。

        LIBSVM是國立臺灣大學(xué)林智仁博士等開發(fā)設(shè)計的通用SVM軟件包,可以解決分類問題(包括C-SVC、v-SVC)、回歸問題(包括SVR、v-SVR)以及分布估計(one-class-SVM)等問題,提供了線性、多項式、徑向基和S形函數(shù)4種常用的核函數(shù)供選擇,可以有效地解決多類問題、交叉驗證選擇參數(shù)、對不平衡樣本加權(quán)、多類問題的概率估計等。

        2 基于LIBSVM的話務(wù)量預(yù)測方法

        采用支持向量機求解回歸問題,關(guān)鍵是核函數(shù)與參數(shù)的選擇,通過對LIBSVM軟件包中核函數(shù)類型及其相關(guān)參數(shù)的對比分析,以找到最適合本預(yù)測方法的模型?;贚IBSVM的話務(wù)量預(yù)測方法流程如圖1所示。

        圖1 基于LIBSVM的話務(wù)量預(yù)測方法流程圖

        2.1 數(shù)據(jù)樣本采集、構(gòu)造特征向量、預(yù)處理

        2.1.1 數(shù)據(jù)樣本采集、構(gòu)造特征向量

        話務(wù)量是一種動態(tài)的、隨機的時間序列,受政策因素、經(jīng)濟發(fā)展、人口數(shù)量、季節(jié)及其它自然因素等的影響,這些因素均與預(yù)測目標(biāo)值有一定的關(guān)聯(lián),但較難完全量化為回歸模型的輸入向量,而歷史話務(wù)量數(shù)據(jù)在時間序列上一定程度的反映了某些因素的影響;因此選取容易量化的時間序列與歷史的話務(wù)量相結(jié)合,構(gòu)造一個多元回歸預(yù)測特征向量如下。

        式中:year(d),mon(d),day(d)為數(shù)據(jù)樣本的對應(yīng)年月日,體現(xiàn)出話務(wù)數(shù)據(jù)與時間序列的對應(yīng)關(guān)系。

        user(d)為數(shù)據(jù)樣本的對應(yīng)日期的VLR登記用戶數(shù),用戶規(guī)模的發(fā)展趨勢與話務(wù)量的發(fā)展密切相關(guān),加入該維度用來表達(dá)話務(wù)量與用戶數(shù)量間的關(guān)聯(lián)性。

        x(d-1),x(d-2),x(d-3)為數(shù)據(jù)樣本對應(yīng)前3天的話務(wù)量實際值,加入該維度體現(xiàn)相鄰時段話務(wù)量的相關(guān)性。平均話務(wù)量,體現(xiàn)相鄰時段話務(wù)量的相關(guān)性及一定時段內(nèi)的發(fā)展趨勢,同時弱化短期內(nèi)不合理的話務(wù)波動。

        預(yù)測過程就是通過LIBSVM算法,以獲取能反映上述特征向量模型的最優(yōu)函數(shù)關(guān)系f。本文中取H市連續(xù)647天早忙時的話務(wù)量,按以上的特征向量模型建立樣本集,其中用587個樣本點進(jìn)行模型訓(xùn)練,之后用60個樣本點作為測試數(shù)據(jù)。

        2.1.2 樣本集預(yù)處理

        將樣本數(shù)據(jù)按LIBSVM要求的數(shù)據(jù)格式進(jìn)行整理,具體格式為(1abel>[index1]: [value1] [index2]:[value2]……

        其中:label是訓(xùn)練數(shù)據(jù)集的目標(biāo)值,index是從l開始的整數(shù),表示特征的序號;value是用來訓(xùn)練或預(yù)測的數(shù)據(jù),即預(yù)測模型的相關(guān)輸入維度,部分樣本集實例如表1所示。

        表1 部分樣本集實例

        為了避免輸入向量中各變量數(shù)量級相差過大影響訓(xùn)練效果,調(diào)用scale工具對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行歸一化處理,歸一化區(qū)間設(shè)為[-1,1]。

        2.2 樣本集訓(xùn)練建模及預(yù)測

        2.2.1 樣本集訓(xùn)練建模

        LIBSVM回歸算法關(guān)鍵步驟之一,就是選取最合適的參數(shù),以達(dá)到最佳的預(yù)測效果,而進(jìn)行人工試驗工作量大且較難實現(xiàn)最優(yōu)化。因此本文中直接調(diào)用gridregression.py函數(shù)進(jìn)行自動尋優(yōu),通過設(shè)定SVM類型、核函數(shù)、10分交叉驗證方式等,得到模型訓(xùn)練中所需的最優(yōu)參數(shù)為c=1 024,g=0.25,p=128。

        應(yīng)用e -SVR與RBF函數(shù),并結(jié)合以上的參數(shù)進(jìn)行模型訓(xùn)練,得到預(yù)測模型顯示為

        #iter=1 368(為迭代次數(shù));

        nu=0.658 622(n-SVC、one-class-SVM與 n-SVR中參數(shù));

        obj=-150 064 894.68(SVM文件轉(zhuǎn)換為的二次規(guī)劃求解得到的最小值);

        rho=-7 462.401(為判決函數(shù)的常數(shù)項b);

        nSV=407(為支持向量個數(shù));

        nBSV=369(為邊界上的支持向量個數(shù))。

        2.2.2 預(yù)測

        根據(jù)得到的預(yù)測模型對測試樣本進(jìn)行預(yù)測,輸出結(jié)果包括均方誤差(Mean Squared Error)=251 743;相關(guān)系數(shù)(Squared Correlation Coefficient)=0.692 042,同時輸出預(yù)測的話務(wù)量數(shù)據(jù),擬合的效果如圖2所示。

        圖2 LIBSVM模型話務(wù)量預(yù)測擬合的效果

        從圖2中可以看出預(yù)測數(shù)據(jù)曲線與真實數(shù)據(jù)曲線的趨勢基本吻合,預(yù)測曲線更為平緩,當(dāng)實際值波動較大時,預(yù)測結(jié)果出現(xiàn)較大偏差。

        2.3 預(yù)測結(jié)果評價

        本次的評價過程是將LIBSVM模型預(yù)測結(jié)果與趨勢外推法的預(yù)測結(jié)果進(jìn)行指標(biāo)對比。

        2.3.1 評價指標(biāo)定義

        對不同的預(yù)測結(jié)果進(jìn)行均方誤差和平均相對誤差這兩個指標(biāo)的評價,這兩個指標(biāo)定義如下:

        式中:mse為均方誤差,n為樣本總個數(shù),yi表示實際值,表示預(yù)測值。

        式中:E為平均相對誤差,n為樣本總個數(shù),yi表示實際值,表示預(yù)測值。

        2.3.2 趨勢外推法的預(yù)測結(jié)果

        將587天的忙時話務(wù)量樣本模型進(jìn)行指數(shù)、線性、對數(shù)、冪、移動平均、二次曲線和三次曲線等的擬合,選擇擬合度最高的三次曲線建立趨勢模型,如圖3所示。

        圖3 話務(wù)量增長趨勢擬合曲線

        根據(jù)圖3中的趨勢模型y=-3E-05x3+0.0183x2+9.456x+4500.9,計算得到的60個測試樣本的預(yù)測值與實際擬合的效果如圖4所示。

        2.3.3 評價指標(biāo)對比

        兩種預(yù)測方法的均方誤差和平均相對誤差指標(biāo)對比如表2所示。

        從以上評價指標(biāo)可以看出,LIBSVM回歸方法通過時間序列和活躍用戶數(shù)刻畫趨勢量、相鄰時段的相關(guān)維度輸入等,并利用SVM突出的高維識別能力進(jìn)行擬合,預(yù)測數(shù)據(jù)曲線與真實數(shù)據(jù)曲線發(fā)展趨勢基本吻合,與趨勢外推法相比預(yù)測精度有較大的提高。

        表2 兩種預(yù)測方法指標(biāo)對比

        圖4 趨勢外推法話務(wù)量預(yù)測擬合的效果

        3 結(jié)論

        LIBSVM回歸算法通過分析建立合適的輸入樣本集、通過參數(shù)選優(yōu)確定最優(yōu)參數(shù),并利用SVM突出的高維識別能力進(jìn)行擬合,能實現(xiàn)與目前常用預(yù)測方法相比誤差更小的預(yù)測,體現(xiàn)LIBSVM回歸算法的優(yōu)越性。在無線網(wǎng)絡(luò)工程規(guī)劃建設(shè)中,應(yīng)用本算法對規(guī)劃期的目標(biāo)預(yù)測值進(jìn)行必要的修正,在設(shè)備配置合理化等方面將會起到積極的作用。

        Application of LIBSVM regression algorithm in traffic prediction

        ZHONG Tan-wang,LIN Zhao-yu
        (Fujian Posts and Telecommunications Planning and Design Institute Co., Ltd., Fuzhou 350001, China)

        Traffic prediction has an important significance in the project, overall accuracy is not high by some common methods, but the LIBSVM algorithm shows good performance quality in solving the regression problems. This paper takes the samples as LIBSVM model training ,basing on the early busy traff c of H city for 587 consecutive days, and verify the predicted performance of LIBSVM model by testing data for following 60 samples. Finally, analyzes the results by the methods of evaluation error and average relative error.

        traff c prediction; LIBSVM; model training; sample set

        TN929.5

        A

        1008-5599(2014)09-0080-04

        2014-07-08

        猜你喜歡
        話務(wù)量特征向量向量
        二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計——以特征值和特征向量為例
        向量的分解
        克羅內(nèi)克積的特征向量
        聚焦“向量與三角”創(chuàng)新題
        基于時間序列模型的異常話務(wù)量分塊建模和預(yù)測
        一類特殊矩陣特征向量的求法
        EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應(yīng)用
        S1240交換機實時話務(wù)量統(tǒng)計的分析與實現(xiàn)研究
        向量垂直在解析幾何中的應(yīng)用
        向量五種“變身” 玩轉(zhuǎn)圓錐曲線
        开心婷婷五月激情综合社区| 后入丝袜美腿在线观看| 无码av中文一区二区三区桃花岛 | 亚洲综合自拍偷拍一区| 性色av免费网站| 国产精品一区二区久久| 国产av大片在线观看| 美女免费观看一区二区三区| 亚洲va欧美va日韩va成人网| 亚洲色自偷自拍另类小说| 国产精品毛片99久久久久| 国产一级一区二区三区在线播放| 中文字幕亚洲精品无码| 亚洲另类自拍丝袜第五页| 亚洲无码美韩综合| 国产日产桃色精品久久久| 亚洲av无码专区亚洲av伊甸园| 国产福利免费看| 亚洲av色香蕉一区二区三区蜜桃| 丁香花五月六月综合激情| 成人毛片一区二区 | 91精品亚洲一区二区三区| 水蜜桃在线精品视频网| 国产伦理一区二区| 99热最新在线观看| 午夜亚洲精品一区二区| 亚洲综合天堂av网站在线观看 | 福利一区二区三区视频在线| 91久久偷偷做嫩模影院| 欧美性猛交xxxx富婆| 欧美日韩亚洲成色二本道三区| 中文亚洲第一av一区二区| 免费国产线观看免费观看| 日日碰狠狠丁香久燥| 欧美在线Aⅴ性色| 日韩亚洲无吗av一区二区| 国产午夜无码片在线观看影院| 中文AV怡红院| 国产午夜精品视频观看| 美丽人妻在夫前被黑人| 色欲国产精品一区成人精品|