付鈺++田野++劉立士++池云
DOI:10.16661/j.cnki.1672-3791.2017.22.004
摘 要:大量研究表明,計算機和通信系統(tǒng)都會出現重尾特性。Pareto分布是最具有代表性的重尾分布。許多服從Pareto分布的ON/OFF源疊加以后可以模擬以太網通信量,重尾分布可以用來反映以太網ON/OFF源的真實情況。該文在許多相關研究的基礎之上,進一步探討了關于Pareto分布的一些性質,根據ON/OFF源發(fā)包服從Pareto分布的特性,利用Matlab對自相似流量的產生進行了仿真。
關鍵詞:Pareto分布 自相似流 Matlab仿真
中圖分類號:TP391 文獻標識碼:A 文章編號:1672-3791(2017)08(a)-0004-02
互聯(lián)網業(yè)務流量具有長相關、突發(fā)性、自相似性、包長度和包地址分布不均勻性等主要特性。傳統(tǒng)網絡流量大部分使用自回歸模型、泊松過程來產生業(yè)務流量模型,在這些基礎上產生的網絡流量,通常在時間軸上只呈現出短相關特性,當時間尺度增大到一定的程度時,網絡業(yè)務流量呈現出穩(wěn)定趨勢,Pareto分布由于其良好的性質受到了研究者的重視。另外,建立一種參數可調的具有自相似特性的業(yè)務模型來進行仿真研究是很有必要的,所以,該文采用了一種參數可調的模型利用Matlab對網絡流量的產生進行了仿真,對以后的研究具有一定的積極意義。
1 自相似過程
自相似過程是一種隨機過程,是指時間或空間特性的改變不影響其統(tǒng)計特性的改變。通??梢杂幸韵聨追N定義[1]:嚴格自相似過程、二階自相似過程、廣義的二階平穩(wěn)自相似過程和漸進二階自相似過程。自相似具有伸縮對稱性的特性,即線性或非線性變換下的不變性。對分形對象進行放縮或者剪切等操作時,只能改變其外部的表現形式,而表征自相似特性的參數即分形維度是不會發(fā)生任何改變的。自相似作為分形的基本特征,指的是復雜系統(tǒng)的整體與部分,一部分與其他部分之間在性質上或者精細結構上所具有的自相似性。
自相似過程主要有以下幾個特點[2]。
1.1 長相關性
對于自相似過程,其當前的時間序列與之前的時間序列值有著不可忽視的相關性,即該時間序列是具有長相關特性的。
1.2 聚集方差衰減緩慢
自相似過程的聚集過程方差衰減速度比m-1小,而對于短相關過程,其聚集過程的方差衰減速度與m-1相同。
1.3 赫斯特效應
對于長相關時間序列來說,其自相關性可以使用赫斯特指數來描述。赫斯特指數表示時間序列的平均、回歸或聚集的相關趨勢。若赫斯特指數,則,表示在樣本中出現極端值的時間較長,也就是所謂的持續(xù)性。如果網絡流量的突發(fā)性可以用這種極端值的持續(xù)時間長短來表述,那么就可以用赫斯特指數來描述網絡流量的突發(fā)性強度。并且這種突發(fā)性不會因為聚集而被平滑掉。
1.4 冪指數特性的譜密度
將自相似過程放在頻域上考慮,因為其具有持續(xù)性,所以在低頻處的譜密度較大,在頻率為0的位置附近,其功率譜密度函數服從冪指數函數。
2 Pareto分布的定義與性質
若隨機變量T 的密度函數為:
,(x≥y) (1)
那么將T 稱為是具有Pareto分布特性的隨機變量,記為。其中β代表形狀參數或叫做Pareto指數,代表尺度性能參數或叫做門限參數。
Pareto分布的概率分布函數為[3]:
(2)
其中,α為分布的形狀參數,β稱為分布的位置參數。當時α≤1,服從Pareto分布的隨機變量具有無限均值;當α≤2時,服從Pareto分布的隨機變量具有無限方差;當時,服從Pareto分布的隨機變量具有有限均值以及無窮方差。
Will linger等人的研究表明:許多服從Pareto分布的隨機變量疊加起來的結果就是自相似過程。
3 源包模型
在自相似業(yè)務流的物理模型中,使用最多的是流疊加法[4]。ON/OFF模型就是模擬大量用戶數據源的疊加來產生自相似業(yè)務流的過程。原理為:ON/OFF模型具有嚴格交替的ON周期和OFF周期,并且認為連續(xù)的ON周期和OFF周期獨立同分布,并且互不相關。當處于ON周期時,數據源以恒定的速率發(fā)送數據包;當處于OFF周期時,不發(fā)送任何數據包,那么鏈路實際傳輸的數據包總數就是M個獨立同分布的數據源相疊加而得到的。
4 仿真系統(tǒng)模型建立
該文利用Matlab對通過ON/OFF自相似業(yè)務流量模型產生的網絡流量進行了仿真。仿真模型框圖如圖1所示。Matlab編程思路如下:首先假設有Nn個信源,然后設置仿真實驗中涉及到的一些參數,接下來是信源的發(fā)包過程,處于ON狀態(tài)發(fā)包,發(fā)包速率為R,發(fā)包持續(xù)時間服從Pareto分布,處于OFF狀態(tài)不發(fā)包,所以到達的數據包個數就為處于ON狀態(tài)的信源數與發(fā)包速率和每個信源發(fā)包持續(xù)時間之積。仿真參數設置如下:信源數Nn=500,平均包到達率λ為0.5,其指數分布參數μ=1/λ,Pareto分布函數的參數設置如下:X=0.2,K=1.5,σ=θ=1,發(fā)包速率R=10。到達的數據包個數仿真圖如圖2所示。
從圖2中可以看出,通過Pareto分布模擬出的網絡業(yè)務流量具有突發(fā)性,并且具有長相關特性,而傳統(tǒng)的泊松分布只呈現出短相關特性。其次,我們是通過設置參數來進行仿真的,所以我們可以通過改變參數來觀察網絡流量的變化。
5 結語
該文介紹了Pareto分布的性質以及源包到達模型的建立過程,并采用了基于Pareto分布的ON/OFF源,通過Matlab仿真,模擬了網絡流量的生成過程。其次,該文是建立了一個參數可調的模型來進行仿真,可以通過改變參數來進行仿真實驗,對以后這方面的仿真研究具有一定的積極意義。
參考文獻
[1] 王曉婷,王憶文,李平.一種自相似網絡流量生成器的設計與實現[J].微電子學與計算機,2016(8):54-58.
[2] 褚立文, 陳俊亮.一個新的自相似業(yè)務流在線生成算法[J].北京郵電大學學報,1999,22(1):43-47.
[3] 程紅霞.自相似業(yè)務流的預測研究[D].電子科技大學,2006.
[4] 陳凱.自相似網絡流量仿真與性能分析[D].北京交通大學,2009.endprint