唐賓徽 陳睿 周振興
摘? 要: 由于移動通信網(wǎng)和無線傳感網(wǎng)各有特點,且各自的網(wǎng)絡結(jié)構(gòu)和協(xié)議棧差別較大,兩網(wǎng)異構(gòu)融合產(chǎn)生的多業(yè)務數(shù)據(jù)流量將同時具備局部性、周期性、隨機性、突發(fā)性等多重特點,結(jié)構(gòu)復雜,對網(wǎng)絡運營能力及安全監(jiān)測帶來了技術(shù)難題。文中針對多業(yè)務流的場景,分析各類業(yè)務流模型的特點,提出一種基于異構(gòu)網(wǎng)的融合業(yè)務流模型,并對業(yè)務流量通過預測算法進行預測。仿真結(jié)果表明,該模型算法的預測精度較高,為異構(gòu)網(wǎng)的多業(yè)務融合起到了重要的支撐作用。
關(guān)鍵詞: 異構(gòu)網(wǎng); 融合業(yè)務流模型; 預測算法; 無線傳感網(wǎng); 移動通信網(wǎng); 模型分析
中圖分類號: TN92?34? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)05?0014?05
Research on service flow model and prediction algorithm for integration of wireless sensor networks and mobile communication networks
TANG Binhui1, CHEN Rui2, ZHOU Zhenxing3
(1. School of Computer and Software, Jincheng College of Sichuan University, Chengdu 610000, China;
2. School of Humanities, Xihua University, Chengdu 610000, China;
3. A Military Representative Office of PLA Rocket Force, Chengdu 610000, China)
Abstract: Since both the mobile communication networks and the wireless sensor networks have their own characteristics, and their network structures and protocol stacks are quite different, the multi?service data flow generated by the heterogeneous integration of the two networks are of the characteristics of locality, periodicity, randomness and burst property, as well as complex structure, which brings technical problems to network operation capability and security monitoring. In view of the above mentioned, the characteristics of various service flow models are analyzed on the basis of multi?service flow scenarios, and an integrated service flow model based on heterogeneous network is proposed, and the service flow is predicted by the prediction algorithm. The simulation results show that the prediction accuracy of the model algorithm is high, which plays an important supporting role for multi?service integration of heterogeneous networks.
Keywords: heterogeneous network; converged service flow model; prediction algorithm; wireless sensor network; mobile communication network; model analysis
0? 引? 言
隨著新一代移動通信網(wǎng)絡技術(shù)和物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,大力推進無線傳感網(wǎng)與移動通信網(wǎng)的異構(gòu)融合已是大勢所趨。無線傳感網(wǎng)通過末端感知可為移動通信網(wǎng)提供有效、可靠且實時的前端數(shù)據(jù);而移動通信網(wǎng)作為信息傳送的承載網(wǎng)可為無線傳感網(wǎng)提供有效的管理、運營和維護。兩網(wǎng)的異構(gòu)融合,不僅有助于海量傳感信息的傳輸、分發(fā)與共享,還可作為一種全新的增值業(yè)務推動移動通信網(wǎng)的發(fā)展,為建立無處不在的泛在網(wǎng)絡[1]奠定基礎(chǔ)。本文主要針對異構(gòu)網(wǎng)融合業(yè)務流的特點,建立與之相適應的業(yè)務流模型,并使用預測算法對其進行流量預測,為異構(gòu)網(wǎng)絡性能評估提供解決方案。
泛在網(wǎng)絡就是將通信服務的對象從人擴展到任何一件物品,通信不只發(fā)生在人和人之間,還發(fā)生在人與物之間、物與物之間,泛在網(wǎng)絡的聯(lián)網(wǎng)設備規(guī)模將比傳統(tǒng)網(wǎng)絡大得多,它們可像互聯(lián)網(wǎng)上的計算機一樣形成機器對機器(Machine to Machine,M2M)的通信方式。無線傳感網(wǎng)與移動通信網(wǎng)融合而成的異構(gòu)網(wǎng),就是為滿足上述需求而采用的最現(xiàn)實和最便捷的通信方案。無線傳感器網(wǎng)絡(WSN)將大量微型、有計算能力的傳感器節(jié)點部署在監(jiān)測區(qū)域內(nèi),以短距離無線低功率的通信方式形成一種多跳自組織網(wǎng)絡系統(tǒng)。在這個系統(tǒng)中,傳感節(jié)點將監(jiān)測到的數(shù)據(jù)按照約定的路由規(guī)則傳輸給匯聚節(jié)點,再將接收到的傳感數(shù)據(jù)發(fā)送給管理節(jié)點,用戶可通過管理節(jié)點對整個傳感網(wǎng)絡進行配置、控制和管理。基于移動通信系統(tǒng)的WSN可以將傳感節(jié)點數(shù)據(jù)通過有限的分層傳輸?shù)絽R聚節(jié)點[2],再通過具有移動終端功能的傳感網(wǎng)關(guān)回傳到移動通信系統(tǒng),或者直接由移動基站直連具有移動終端能力的傳感器,此時這些傳感器既是傳感節(jié)點也是網(wǎng)關(guān),可以最大限度地降低傳輸延遲來支持對實時性要求很高的監(jiān)控應用。
1? 融合業(yè)務流量特性與技術(shù)分析
移動通信網(wǎng)與WSN的融合,不僅要考慮基于移動終端的無線傳感節(jié)點的網(wǎng)絡通信以及移動基站與無線傳感節(jié)點的網(wǎng)絡融合問題,還需要從業(yè)務融合角度考慮應用層的開發(fā)、承載雙網(wǎng)的移動傳感設備以及網(wǎng)絡資源分配、業(yè)務流量分析等。該系統(tǒng)在實現(xiàn)有效數(shù)據(jù)傳輸基礎(chǔ)上,對移動傳感終端進行合理分配,監(jiān)視終端的連接狀態(tài)、異常告警和業(yè)務流量預測,為融合網(wǎng)絡的運營、管理和維護奠定堅實基礎(chǔ)。
傳統(tǒng)的業(yè)務流分析模型都是將預測數(shù)值和監(jiān)控數(shù)值與歷史數(shù)據(jù)進行比對分析,業(yè)務流的建模方法主要包括半馬爾柯夫模型、Poisson模型、基于自回歸滑動平均ARMA(Auto Regressive Moving Average)模型及ON/OFF模型等[3?6]。這些方法的特點是將業(yè)務流數(shù)據(jù)理解為一個平穩(wěn)的隨機過程,通過對過往數(shù)據(jù)建模來分析數(shù)據(jù)流量的變化。雖然這些方法運算簡單,也取得了良好的預測效果,但基于移動通信網(wǎng)與WSN這種異構(gòu)網(wǎng)絡融合的業(yè)務數(shù)據(jù)來說,這些方法就過于簡單了。異構(gòu)網(wǎng)的業(yè)務數(shù)據(jù)流具有局部性、周期性、突發(fā)性和隨機性等特點,因此將業(yè)務數(shù)據(jù)簡單理解為平穩(wěn)的隨機過程是不全面的?;诋悩?gòu)網(wǎng)這些特點,國內(nèi)外很多研究者引入了小波多尺度分析以及固態(tài)模函數(shù)分解(Empirical Mode Decomposition,EMD)[7]等手段,將異構(gòu)網(wǎng)絡信號在特定尺度上建立起ARMA模型,使其分解后的業(yè)務流量信號平穩(wěn)或近似平穩(wěn),從而提高模型預測的準確性[8?11]。也有不少研究者基于神經(jīng)網(wǎng)絡、支持向量機及模糊決策等理論,通過非線性擬合近似的方法來分析業(yè)務流量的變化規(guī)律,這些方法為解決業(yè)務流量預測問題提供了參考。但是,小波分析或者EMD等方法在特定尺度上分析業(yè)務數(shù)據(jù)時有可能丟失其他尺度上的信息,通過神經(jīng)網(wǎng)絡來分析則存在過擬合問題,即模型對于擬合使用數(shù)據(jù)的解釋能力強而外展能力差,這是因為基于神經(jīng)網(wǎng)絡這類方法通常會將部分噪聲也當成信號進行擬合,使得模型過度解釋當前的觀測數(shù)據(jù)[12?13]。本文針對異構(gòu)網(wǎng)特點,研究構(gòu)建基于多傳感節(jié)點的融合業(yè)務流模型,并通過多元自適應濾波算法對預測數(shù)值進行平均,對該業(yè)務的數(shù)據(jù)流量精確預測,這一方法相比傳統(tǒng)的ARMA模型,更能準確地預測業(yè)務數(shù)據(jù)流量。
2? 融合業(yè)務流量模型研究
這幾年,隨著物聯(lián)網(wǎng)的發(fā)展,基于移動通信網(wǎng)與WSN融合的多業(yè)務M2M設備將會越來越多。設備里集成的數(shù)據(jù)流差異較大,在設計業(yè)務流量模型時,為了更好地使其在異構(gòu)網(wǎng)狀態(tài)下傳輸,必須對各種不同業(yè)務流量模型的特點進行分析,這種多類型傳感集成將會帶來新的業(yè)務特性。目前常見的數(shù)據(jù)流大多數(shù)是多媒體數(shù)據(jù)流和語音流,這類應用延遲要求相對較低,也可以容忍少量丟包,如遠程視頻監(jiān)控業(yè)務;網(wǎng)絡中也存在對實時性要求較高的控制和報警業(yè)務,這類業(yè)務對時延和可靠性具有苛刻的指標要求。對多業(yè)務M2M終端來說,針對突發(fā)性的業(yè)務分析,可以用指數(shù)分布來表征發(fā)送數(shù)據(jù)的長度和突發(fā)間隔的概率密度:
[f(x;λ)=λe-λx,? ? ? x>00,? ? ?x<0]
式中:[λ=1t],[t]表示傳輸時間。
突發(fā)間隔的均值為:
[EX=1λ]
突發(fā)間隔的均值方差為:
[DX=1λ2]
針對周期性的數(shù)據(jù)流,將[x]設為常數(shù)[d],根據(jù)周期性業(yè)務數(shù)據(jù)構(gòu)成的Poisson分布建模可得概率密度函數(shù)為:
[f(d)=λ1+λ2+…+λne-λ1+λ2+…+λnd,? ? d>0]
間隔均值為:
[Ed=1(λ1+λ2+…+λn)]
間隔方差為:
[Dd=1(λ1+λ2+…+λn)2]
針對長時間連續(xù)發(fā)送的數(shù)據(jù)流量,可以用高斯分布來表征數(shù)據(jù)長度的概率分布:
[f(x)=1(2λσ)2exp-(x-μ)22σ2]
長度均值為[μ],長度方差為[σ2],隨機變量長度落在[(α,β)]內(nèi)的概率函數(shù)為:
[pα 多種不同的業(yè)務數(shù)據(jù)流由多維高斯分布建??傻?,概率密度函數(shù)為: [fl1,l2,…,ln=22πnDσ1σ2…σn?exp-12Di=1nk=1nDik(li-ai)σi(lk-ak)σk] 長度方差為[n]階行列式: [D=r11r12r13…r1nr21r22r23…r2nr31r32r33…r3n?????rn1rn2rn3…rnn=1r12r13…r1nr211r23…r2nr31r321…r3n?????rn1rn2rn3…1] 式中:[rii=1],[rik=rki]。 在任意時刻,管理節(jié)點可收集到傳感器發(fā)送過來的多業(yè)務數(shù)據(jù),這些業(yè)務數(shù)據(jù)在時間序列上的分布是相似的。假定時間序列是平穩(wěn)時間序列,為[X1],[X2],…,[XK],其中,[Y]是預測對象的量測值,[Z]為誤差,則: [YT=β1X1+β2X2+…+βPXP+Z] 作為預測對象,[YT]受到自身變化的影響,其規(guī)律可由下式體現(xiàn): [YT=β1XT-1+β2XT-2+…+βPXT-P+ZT] 誤差項在不同時期具有依存關(guān)系,由下式表示: [ZT=ξT+a1ξT-1+a2ξT-2+…+aqξT-q] 由此,獲得模型表達式如下: [YT=β0+β1YT-1+β2YT-2+…+βPYT-P+ξT+a1ξT-1+a2ξT-2+…+aqξT-q] 從上式可以看出,這個統(tǒng)計模型的主要缺點是丟失了流量序列中重要的周期信息和趨勢信息,異構(gòu)網(wǎng)的數(shù)據(jù)結(jié)構(gòu)復雜,宏觀流量往往多變,業(yè)務流量數(shù)據(jù)中又含有多種周期類波動數(shù)據(jù),針對隨機因素的干擾很難用單一的模型來描述。本文采用多元的自適應模型對異構(gòu)網(wǎng)中的業(yè)務流量使用平均誤差估計原理[14?15]來建模。根據(jù)多個時刻收集到的樣本數(shù)據(jù),對相關(guān)系數(shù)進行回歸計算,該模型建立的前提是管理節(jié)點隨時間推移而收集到的業(yè)務數(shù)據(jù)形成的數(shù)據(jù)序列看作是一個隨機序列,這組隨機變量所具有的依存關(guān)系體現(xiàn)著原始數(shù)據(jù)在時間上的延續(xù)性,假設[f(t)]代表1個測量間隔收集到的樣本流量數(shù)據(jù),[fm(k)]表示[m]個測量間隔收集到的流量數(shù)據(jù)的平均值,如下所示: [fm(k)=1mi=(k-1)m+1kmf(i)] 從上式可得,如果已知[fm(1),fm(2),…,fm(k)],可通過計算前[K]個流量的加權(quán)和來預測下一個測量間隔的業(yè)務流量[fm(k+1)]。本文研究的業(yè)務應用場景中多業(yè)務的M2M節(jié)點在不同時刻可收集到不同類的業(yè)務數(shù)據(jù),這些數(shù)據(jù)之間的表現(xiàn)關(guān)系如下所示: [vT=a1v1+a2v2+…+aqvq] 式中:[v1,v2,vq]是各類傳感器的業(yè)務數(shù)據(jù);[a1,a2,aq]是該任意時刻下各類數(shù)據(jù)的相關(guān)系數(shù)。根據(jù)多個時刻收集到的多個樣本數(shù)據(jù),對相關(guān)系數(shù)進行回歸計算,可求得各類數(shù)據(jù)的損失函數(shù)[af1,af2,…,afn],當對下一個時刻[fm(k+1)]進行預測時,可得: [fm(k+1)]=[af1,af2,…,afn?fm(1)fm(2)?fm(k)] [af0,af1,af2,…,afn=R(n)? ? …? ? R(1)?R(1)…R(n)R(2)…R(n-1)???R(n)…R(1)-1] 式中[R(n)]為時間序列的協(xié)方差函數(shù)。從此過程中不難看出,此模型根據(jù)預測過程中各類數(shù)據(jù)所產(chǎn)生的誤差,運用誤差原理,通過多元的自適應模型來建模,提高流量預測的準確性。 3? 仿真驗證及結(jié)果 用于流量預測的基本方法都普遍采用事先獲取一段時間的正常(異常)流量,少則1天,多則數(shù)月,然后對采集到的歷史流量數(shù)據(jù)進行模式訓練、正常(異常)行為的刻畫或方差分析等,在得到某個間接統(tǒng)計量后再進行流量預測和異常檢測。 具體步驟如下: 1) 獲取[m]個不同時刻的業(yè)務數(shù)據(jù)流量[FX(t)]; 2) 對[FX(t)]選用[m]個不同時間尺度的線性濾波器對網(wǎng)絡流量信號進行多元的低通濾波,每個時刻的窗體點長為[2m],窗體選擇高斯窗,得到[m]個濾波信號,表示為[FXm(t)]; 3) 對[m]個不同的濾波信號按上文提及的業(yè)務流量模型進行預測,從而得到下一個時刻的預測值; 4) 對各個預測值取數(shù)值平均值作為異構(gòu)模型的預測值,并與傳統(tǒng)的ARMA模型的預測值進行對比。 本文使用[σ2]表示[X]時刻以前[M]個原始值和預測值之間的估計誤差的平方和均值,即[σ2=ξ2n(n-1)m],用檢測統(tǒng)計量[τ]表示[n]時刻估計誤差與[σ]的比值,即當[σ>0]時,[σ2=ξ2n(n-1)m,γ=ξ(n+1n)σ],否則,[τ=0]。進行異常檢測時,若當前[τ]值超出容許范圍,則表示異常(為1),否則表示正常(為0)。 為了對算法性能進行評估,本文利用實驗室采集的傳感器數(shù)據(jù)集在Matlab 10.1平臺上進行仿真實驗[16?17],選取區(qū)域集合里1 000個傳感節(jié)點作為ARMA流量預測模型的預測數(shù)據(jù)點,再將這1 000個傳感節(jié)點作為異構(gòu)網(wǎng)業(yè)務模型測試算法性能的預測數(shù)據(jù)點,通過比較兩者之間的誤差值,可以證明后者的算法預測能力更強。本文采用高斯窗,主要考慮其設計簡便,在處理濾波前對原始數(shù)據(jù)進行標準化,[M]取3,得到3個不同間隔時刻的濾波信號,以及各自的預測值,最后取預測值的平均值。 兩種不同模型在3個不同時刻的對照圖如圖1~圖3所示。 ARMA建模數(shù)據(jù)平均后的預測值波形圖和頻譜圖如圖4所示。 異構(gòu)網(wǎng)建模數(shù)據(jù)平均后的預測值波形圖和頻譜圖如圖5所示。 從以上各圖的對比可以看到,相比ARMA模型,異構(gòu)網(wǎng)模型的濾波信號波形圖更多地保留了信號變化的趨勢和特點。通過異構(gòu)網(wǎng)模型進行數(shù)值預測,可以將信號在不同時間與能量上的特點看得更清晰,從而進一步得到準確度較高的預測數(shù)據(jù)。 將異構(gòu)網(wǎng)的預測模型與實測數(shù)據(jù)模型進行對比,可以看出,異構(gòu)網(wǎng)模型的預測數(shù)據(jù)與實測數(shù)據(jù)非常接近,誤差基本控制在±0.050之間,預測誤差在10-3量級。 4? 結(jié)? 語 本文針對異構(gòu)網(wǎng)融合將出現(xiàn)的多業(yè)務集成場景下的數(shù)據(jù)流特點,提出與之相匹配的業(yè)務流量模型以及有效的流量預測算法,通過數(shù)據(jù)仿真比對,證實了其預測精度相比傳統(tǒng)的ARMA模型預測算法更優(yōu),可廣泛應用于異構(gòu)網(wǎng)環(huán)境下的網(wǎng)絡流量預測。下一步,將充分考慮針對多元業(yè)務數(shù)據(jù)的自適應權(quán)重,以期進一步提高流量預測精度。 注:本文通訊作者為陳睿。 參考文獻 [1] 陳智,羅平,岳文靜,等.一種用于無線傳感器網(wǎng)絡絡的能量拓撲控制算法[J].中國傳感器與驅(qū)動器學報,2013,23(3):382?387. [2] 潘立強,高慧君,洪高,等.一種基于空間相關(guān)的無線傳感器網(wǎng)絡絡自適應缺失數(shù)據(jù)估計算法[J].國際無線信息網(wǎng)絡雜志,2014,21(4):280?289. [3] 姚萌.網(wǎng)絡流量組合預測模型的研究[D].無錫:江南大學,2008. [4] LEI Jianjun, XIA Ying, ZHAO Kuo. Energy efficient data collection protocol for wireless sensor net?works [J]. Journal of Chongqing University of Posts and Telecommunications (Natural science edition), 2014, 26(5): 582?586. [5] TIAN Haimei, HUANG Nan. Network traffic prediction based on ACO?LSSVM [J]. Computer engineering and applications, 2014, 50(1): 91?95. [6] 顏若愚,鄭慶華,牛國林.自適應濾波實時網(wǎng)絡流量異常檢測方法[J].西安交通大學學報,2009,43(12):1?5. [7] 鄭若金,韓力群,陳天華.基于小波分析和神經(jīng)網(wǎng)絡的心音信號研究[J].計算機仿真,2010,27(5):170?173. [8] 周強,彭輝.基于自回歸滑動平均的網(wǎng)絡數(shù)據(jù)流量預測模型[J].計算機科學,2014,41(4):75?79. [9] 段文軒,蔣文賢.無線傳感器網(wǎng)絡中一種ARMA流量預測的擁塞控制算法[J].小型微型計算機系統(tǒng),2012,33(5):1098?1103. [10] 劉亮,江漢紅,王潔,等.基于小波分析的ARMA?SVR網(wǎng)絡流量預測方法[J].計算機工程與設計,2015,36(8):2021?2025. [11] 朱苗苗.基于結(jié)構(gòu)方程模型改進ARMA模型參數(shù)估計[[J].軟件導刊,2016,15(9):6?9. [12] 陳文清.一種基于多標簽學習的網(wǎng)絡流量預測算法[J].科學通報,2016,32(4):147?151. [13] LIU Yang, ZHANG Linfeng, GUAN Yong. A distributed data streaming algorithm for network?wide traffic anomaly detection [J]. ACM SIGMETRICS performance evaluation review, 2009, 37(2): 81. [14] 季琳琳,廖軍,宗先鵬.異方差線性測量誤差模型的平均估計[J].系統(tǒng)科學與數(shù)學,2018,38(6):688?701. [15] FENG Feifei, PENG Fenghua, YAN Bo, et al. QoS?based LTE downlink scheduling algorithm for smart grid communication [C]// IEEE 9th International Conference on Communication Software and Networks. Guangzhou, China: IEEE, 2017: 548?552. [16] 溫祥西,孟相如,馬志強,等.小時間尺度網(wǎng)絡流量混沌性分析及趨勢預測[J].電子學報,2012,40(8):1609?1616. [17] 邱婧,夏靖波,吳吉祥.網(wǎng)絡流量預測模型研究進展[J].計算機工程與設計,2012,33(3):865?869.