李改河
【摘 要】提出一種IP網(wǎng)絡綜合性能評估模型,結(jié)合網(wǎng)絡健康度和路由器健康度的概念,通過測量收集網(wǎng)絡基本性能數(shù)據(jù),對網(wǎng)絡作出整體評價?;谠撃P烷_發(fā)了NHES系統(tǒng),對中國移動CNGI示范網(wǎng)進行性能測量,實驗數(shù)據(jù)很好地反映了CNGI的運行狀況,為診斷網(wǎng)絡性能問題提供了有用信息。
【關鍵詞】網(wǎng)絡健康度;路由器健康度;綜合性能評估;性能測量
0.概述
隨著 Internet 技術的不斷發(fā)展,人們對其依賴程度也日漸增加。網(wǎng)絡運營商和用戶必須對其性能深入了解,才能保證網(wǎng)絡正常運行。但是Internet的結(jié)構(gòu)日趨復雜,使其性能的可知性越來越低,因此,對網(wǎng)絡性能測量的研究變得越來越重要。
目前,國際上有關性能測量的研究項目主要有:NIMI,AM,CAIDA和Surveyor。IETF也提出了若干RFCs以制定一系列框架指標來規(guī)范對Internet的測量。此外,還有許多其他網(wǎng)絡測量體系,如MOAT, IEPM,NWS,PPNCG等[1]。雖然這些項目在關鍵技術上取得了很大進展,但還存在一些問題:(1)在測量系統(tǒng)模型化方面做的工作比較少,缺乏宏觀的體系結(jié)構(gòu)模型;(2)普遍采用指標體系評價法,雖能從多個角度對事物進行評價,但不利于對事物的綜合評估、統(tǒng)一比較[2]。本文提出的IP網(wǎng)絡綜合性能評估模型采用綜合多指標的評價方法,把反映網(wǎng)絡性能的多個指標信息綜合起來,映射成一個指標,由此來反映網(wǎng)絡整體的性能狀況。通過這一綜合性指標,使網(wǎng)管人員可從宏觀的角度來評測與監(jiān)控網(wǎng)絡。
1.評估模型
節(jié)點是構(gòu)成計算機網(wǎng)絡的基本元素之一,網(wǎng)絡中的任何節(jié)點都會對網(wǎng)絡性能在一定范圍內(nèi)造成影響,這種影響反映在端到端(路徑)性能上,一般認為,計算網(wǎng)絡總體性能指數(shù)只須測量出端到端的性能數(shù)據(jù)加以分析總結(jié)即可[2]。但是,當網(wǎng)絡規(guī)模較大時,對端到端的測量在實現(xiàn)上不可能也沒必要覆蓋網(wǎng)絡中所有的路徑,因此,也不能保證覆蓋所有節(jié)點;另外,對網(wǎng)絡中運行著的各路由器的綜合性能進行評估,對網(wǎng)管人員更全面深入地了解網(wǎng)絡性能情況也很有幫助,例如把路由器綜合性能信息實時呈現(xiàn)在拓撲圖上,可以為網(wǎng)管人員及時準確地定位瓶頸提供輔助信息。因此,在評估模型中加入對節(jié)點的綜合性能評估是非常有用的。
2.路由器綜合性能評估
路由器性能相關指標非常多,其中吞吐量、路由計算能力、路由表能力、系統(tǒng)恢復時間和系統(tǒng)復位時間都是固定型指標,而時延、丟包率、包轉(zhuǎn)發(fā)率、年齡、CPU利用率和內(nèi)存利用率則是動態(tài)型指標。固定型指標即設備固有的靜態(tài)參數(shù),體現(xiàn)其能力能達到什么程度,跟具體網(wǎng)絡環(huán)境無關,可用特定軟硬件設備測出;動態(tài)型指標是實際運行時的量,其變化跟環(huán)境有關,可在實際運行的網(wǎng)絡上實時監(jiān)測得出。
3.端到端綜合性能評估
關于網(wǎng)絡層的端到端性能測量,IETF的IPPM工作組定義了一個指標注冊框架IPPM Metrics Registry[3],給出了管理規(guī)則,注冊指標的模板,用此模板列出了已注冊的全部33個指標,給出每個指標的基本屬性,包括:名字,參數(shù)(測量環(huán)境等),具體定義,單位,測量方法,誤差等。
這些指標可以分為2類:基本指標和衍生指標。基本指標指可以直接測量得出的指標,而衍生指標則是建立在若干基本指標之上,可以是基本指標的采樣序列,也可以是采樣序列的統(tǒng)計特征。最基本的原子性指標有4個:時延(delay),丟包率(loss),重包率(duplication)和重排序率(reordering)[4]。
只知道某個時刻上這些原子指標的值是沒有意義的,普遍的方法論是在這些原子性指標的基礎之上,作時間上的擴展,形成序列,再研究這些序列的統(tǒng)計特征平均值、最小值、中值、百分分布等。
4.網(wǎng)絡綜合性能評估
網(wǎng)絡的綜合性能評估方法與路由器一樣, 用 0~100打分,稱為健康度。網(wǎng)絡健康度與端到端的總體評價系數(shù)和路由器健康度緊密關聯(lián),算法如下:
health=0;
for every path do
health=health+path.eval;
health=round(health×100/ num);
for every router do
if (router.health<60)
health=health×0.9
其中,num 為實際測量的路徑的數(shù)目;round 為取整函數(shù)。
5.實現(xiàn)根據(jù)這個評估模型,開發(fā)出網(wǎng)絡健康度評估工具(Network Health Evaluation System,NHES)
NHES 分為3層:
(1)數(shù)據(jù)采集層。包括路由器數(shù)據(jù)采集和端到端數(shù)據(jù)采集2部分。其中,路由器采集部分利用SNMP 協(xié)議來收集路由器各端口的輸入輸出總包數(shù)、包丟棄數(shù)、入口帶寬、CPU利用率等數(shù)據(jù),由此計算出路由器各指標值;端到端采集部分利用Ping命令收集路徑的雙向延時和雙向丟包率,由此計算出延時的最小值、方差和平均值。
(2)評估層。從數(shù)據(jù)庫中取出采集層輸出的數(shù)據(jù),以其作為輸入,按照上面所述評估模型,逐層計算評估出網(wǎng)絡中各個路由器、各條路經(jīng)以及整個網(wǎng)絡的綜合性能,把評估出的數(shù)據(jù)寫回數(shù)據(jù)庫。
(3)呈現(xiàn)層。負責把評估層輸出的數(shù)據(jù)呈現(xiàn)給用戶,分為實時呈現(xiàn)和歷史呈現(xiàn)。實時呈現(xiàn)是指把路由器健康度和網(wǎng)絡健康度在網(wǎng)絡拓撲圖上實時顯示出來,而歷史呈現(xiàn)則是根據(jù)用戶的需求從數(shù)據(jù)庫里調(diào)出數(shù)據(jù),以報表的形式顯示。在中國移動CNGI示范網(wǎng)上運行NHES,把 NHES部署在與其中一個邊緣路由器相連的主機上,選取其中的3條路徑進行測量,并對所有支持SNMP的路由器進行采集,網(wǎng)管人員在 NHES上輸入各路由器地址、端口、口令、OID、目的端地址等信息,系統(tǒng)即可運行。這些信息被寫入配置文件中,用戶無須每次登錄都輸入。除此之外,路由器指標權值、正常值、采集間隔以及計算健康度的周期等參數(shù)也都可由用戶配置。在拓撲圖上每隔一個健康度評估周期自動更新一次路由器和整個網(wǎng)絡的健康度,路徑的綜合性能則可在歷史記錄中查詢。
在不同時刻采集到的中國移動CNGI示范網(wǎng)的部分路由器性能數(shù)據(jù),以這些數(shù)據(jù)為輸入,根據(jù)模型計算得出網(wǎng)絡綜合性能??梢钥闯?,CNGI示范網(wǎng)在10月26日無論是路由器的表現(xiàn)還是端到端的性能比24日都有所下降:網(wǎng)絡健康度從90下降到71。路由器(H)無論在網(wǎng)絡整體性能較好還是較差的時候其健康度均只有 66,事實上查看歷史記錄可知它在連續(xù)一個星期的測量中整體性能表現(xiàn)一直不佳,健康度在60上下浮動,與其他路由器較佳的平均表現(xiàn)形成鮮明對比,影響了網(wǎng)絡的整體性能。因此,為了提高綜合性能,網(wǎng)管人員應首先考慮替換路由器(H)或?qū)⑵湟浦凛^為不重要的位置。
6.結(jié)束語
本文從當前網(wǎng)絡管理的需求出發(fā),提出路由器健康度和網(wǎng)絡健康度的概念,采用模塊化技術,對已有的一些網(wǎng)絡綜合評估方法進行了比較,建立一種IP 網(wǎng)絡綜合性能評估模型,使網(wǎng)絡管理者無須仔細研究各個指標,即可了解網(wǎng)絡性能表現(xiàn),并且方便了不同節(jié)點、路徑以及網(wǎng)絡之間在時間和空間上的比較。通過中國移動CNGI示范網(wǎng)的的測量評估證明,該模型能夠有效幫助網(wǎng)管人員了解并分析網(wǎng)絡運行狀況,具有較強的實用性。 [科]