李彥華 譚小波 武玉良
[摘 要]衛(wèi)星網(wǎng)絡的最根本的特征和功能是通信,本文針對衛(wèi)星網(wǎng)絡的這個特性,展開了衛(wèi)星網(wǎng)絡故障診斷技術的研究。設計了基于動態(tài)管理域劃分的衛(wèi)星網(wǎng)絡故障診斷模型。設計實現(xiàn)了管理域內(nèi)的衛(wèi)星網(wǎng)絡故障診斷專家系統(tǒng),并對知識獲取與表達、推理規(guī)則設計及系統(tǒng)模型建立等關鍵技術進行了論述。另外,設計了管理域間的協(xié)作故障診斷模型。
[關鍵詞]專家系統(tǒng) 衛(wèi)星網(wǎng)絡 網(wǎng)絡故障診斷 診斷規(guī)則 管理域間協(xié)作診斷
[中國分類號]TP[文獻標識碼]A[文章編號]1007-9416(2009)11-0104-01
1引言
衛(wèi)星網(wǎng)絡是由星際和星地鏈路連接在一起,由不同軌道、種類和性能的衛(wèi)星、星座及相應地面設施組成的互連互通衛(wèi)星群體網(wǎng)絡。衛(wèi)星網(wǎng)絡與地面網(wǎng)絡不同,它具有以下特點:(1)網(wǎng)元節(jié)點種類繁多;(2)網(wǎng)絡結構復雜;(3)節(jié)點的資源有限;(4)網(wǎng)絡通信的傳輸延時較大;(5)節(jié)點運行動態(tài)變化、節(jié)點間無線通信的質(zhì)量受空間環(huán)境影響嚴重等等。要使這樣一個復雜的異構網(wǎng)絡能夠自主、高效的運行,提高網(wǎng)絡的生存效能,就必須要保證網(wǎng)絡管理系統(tǒng)能夠及時、準確的發(fā)現(xiàn)、診斷網(wǎng)絡故障。雖然我國的衛(wèi)星網(wǎng)絡的建設處于起步階段,將網(wǎng)絡故障診斷作為網(wǎng)絡本身的一項內(nèi)在功能來研究,對于衛(wèi)星網(wǎng)絡的健康發(fā)展具有重要意義。
2基于動態(tài)管理域劃分的網(wǎng)絡故障診斷模型
衛(wèi)星網(wǎng)絡管理系統(tǒng)是一種基于動態(tài)分層結構的網(wǎng)絡管理體系。在這樣一個動態(tài)分層的網(wǎng)絡管理體系結構中,為實現(xiàn)對整個網(wǎng)絡的高效管理,設計了基于動態(tài)注冊注銷的管理域劃分機制,使得衛(wèi)星網(wǎng)絡中的被管節(jié)點在某一時刻都歸屬于某個管理分站的管轄范圍,而總控中心負責管理各個管理分站,并通過各個管理分站來實現(xiàn)對整個網(wǎng)絡的管理,從而實現(xiàn)對衛(wèi)星網(wǎng)絡的分層分布式管理。基于該網(wǎng)管體系結構,本文提出了基于動態(tài)管理域劃分的網(wǎng)絡故障診斷體系結構,它包括管理域內(nèi)的網(wǎng)絡故障診斷和管理域間協(xié)作故障診斷。
3 管理域內(nèi)的網(wǎng)絡故障診斷專家系統(tǒng)的設計與實現(xiàn)
衛(wèi)星網(wǎng)絡的節(jié)點成本較高,并且它們具有不可現(xiàn)場維護的特點,因此,對網(wǎng)絡狀態(tài)的監(jiān)控與故障診斷提出了越來越高的要求,它要求建立智能化的故障診斷系統(tǒng),以實現(xiàn)監(jiān)控和診斷的自動化。
衛(wèi)星網(wǎng)絡最根本的特征和功能是通信,從這個意義上來說,所有的網(wǎng)絡故障最終都會集中體現(xiàn)在網(wǎng)絡節(jié)點的通信能力或狀態(tài)上。因此,本文將衛(wèi)星網(wǎng)絡節(jié)點的通信狀態(tài)以及網(wǎng)絡性能水平作為衛(wèi)星網(wǎng)絡故障診斷的內(nèi)容。
衛(wèi)星網(wǎng)絡故障診斷專家系統(tǒng)就是用以實現(xiàn)對網(wǎng)絡主要節(jié)點或設備(路由節(jié)點、交換節(jié)點、主機、網(wǎng)絡打印機等)的狀態(tài)監(jiān)測和故障診斷。本文參照SNMP協(xié)議構造了專家系統(tǒng)的總體結構模型。
該模型由數(shù)據(jù)采集及預處理模塊、知識庫模塊、推理診斷及解釋模塊、學習機制模塊及用戶界面模塊等5部分組成。
(1)數(shù)據(jù)采集及預處理模塊 該模塊主要通過三種方式獲得網(wǎng)絡狀態(tài)信息,它包括:Trap機制、管理站輪詢和代理端本地輪詢(即在MIB庫中加一個polling組)。然后,簡約處理信息以消除這冗余,并生成故障診斷專家系統(tǒng)全局工作內(nèi)存中所需要的事實,以供推理機進行故障的推理診斷。
(2)知識庫模塊 它是整個專家系統(tǒng)的關鍵部分。一個專家系統(tǒng)的好壞與知識庫的建設水平有著密切的關系。根據(jù)衛(wèi)星網(wǎng)絡的特點,本文深入研究了衛(wèi)星網(wǎng)絡的通信方面的故障,以衛(wèi)星通信鏈路故障為例,設計了故障診斷規(guī)則以及基于XML形式的存儲格式。此外,還研究設計了其它類型的網(wǎng)絡故障的診斷規(guī)則。該模塊把設計的這些網(wǎng)絡故障診斷規(guī)則存儲起來,并且還能夠存儲推理過程中生成的中間結論、推理結果以及故障日志等。
(3)推理診斷及解釋模塊 該模塊是專家系統(tǒng)的核心,它根據(jù)數(shù)據(jù)采集及預處理模塊提供的診斷目標和網(wǎng)絡事實數(shù)據(jù),利用知識庫中的知識對目標進行推理,獲得診斷結果。由于本文把重點放在了衛(wèi)星網(wǎng)絡的故障診斷規(guī)則的研究與設計上了,所以該模塊采用了專家外殼系統(tǒng)JESS的推理機制,沒有再設計新的推理機。
(4)學習機制模塊 該模塊提出了基于故障案例發(fā)生頻率的學習機制,并成功應用于該專家系統(tǒng)中,它是指對于經(jīng)常發(fā)生的(即故障發(fā)生頻率高)網(wǎng)絡故障,如果它能夠在故障診斷“快表”里查詢到的話,不再經(jīng)過推理機診斷推理,而是直接返回診斷結果,這大大提高了故障診斷的效率。
(5)用戶界面模塊 主要用于完成人機交互、系統(tǒng)設置、問題描述、診斷結果顯示和系統(tǒng)的總體控制。該模塊允許對原有的專家知識庫進行修正和補充,使其具有良好的可擴展性。
4關鍵技術及其解決方法
(1)快速采集網(wǎng)絡信息,實現(xiàn)快速故障診斷。本文提出了代理端本地輪詢方式,它是指在代理端的MIB庫中加一個polling組,本組中的數(shù)據(jù)經(jīng)過一種運算之后,把結果存入這個polling組中,當該輪詢值超過某個閾值時,再向地面站報告該事件,這就使得代理端與地面站之間的交互次數(shù)大大減少,提高了信息搜集的效率。另外,在管理站定期輪詢過程中,通過建立優(yōu)先級輪詢機制,大大減少了帶寬浪費。
(2)知識表達與存儲:經(jīng)過研究,本文采用產(chǎn)生式與面向?qū)ο笙嘟Y合的方法,把故障診斷規(guī)則表示出來,并以XML的形式存儲在專家系統(tǒng)的知識庫中。
5管理域間的協(xié)作故障診斷模型
當某管理站在診斷網(wǎng)絡故障,需要域間協(xié)作時(可能是該域內(nèi)的節(jié)點無法與其它域內(nèi)的節(jié)點進行通信,那么該類故障可能是節(jié)點間的通信鏈路受到干擾,也有可能是該域內(nèi)的網(wǎng)絡節(jié)點出現(xiàn)了故障或者其它域內(nèi)的網(wǎng)絡節(jié)點出現(xiàn)了故障),它向總控中心發(fā)起域間協(xié)作診斷請求;總控中心收到該請求后,將發(fā)送過來的協(xié)作診斷總體任務進行任務劃分,劃分為若干個子任務,即各個分管理站為實現(xiàn)該協(xié)作所要完成的診斷任務。這些子任務可以同時進行,這樣發(fā)起請求的分管理站與其它分管理站之間建立了協(xié)作關系。總控中心向該分管理站及其它分站分別發(fā)送各自的子任務。當參與協(xié)作的分管理站完成各自任務后,將診斷結果返回給總控中心,總控中心就能夠確定故障源。最后,總控中心把故障診斷結果回送給發(fā)送請求協(xié)作的分管理站,完成該分管理站與其它分管理站之間的協(xié)作故障診斷。
6 結語
本文結合衛(wèi)星網(wǎng)絡的特點,充分利用JAVA語言面向?qū)ο蟮木幊烫匦?在Windows XP平臺上仿真實現(xiàn)了一個基于SNMP協(xié)議的網(wǎng)絡故障診斷診斷專家系統(tǒng)。在故障信息采集過程中,提出了本地輪詢機制,減少了地面站與星上代理的交互次數(shù),這也是與地面網(wǎng)絡故障診斷的不同之處。本文提出的學習機制也加快了網(wǎng)絡故障診斷的效率。但是,該系統(tǒng)還僅是一種仿真實現(xiàn),還有待于未來在衛(wèi)星網(wǎng)絡中加以驗證。
[參考文獻]
[1] 石榮德,趙廷弟,屠慶慈,常文兵.故障診斷專家系統(tǒng).北京航空航天大學學報,1995,21(4).
[2] 蘇利敏,侯朝楨,巍忠健.指揮控制系統(tǒng)的通信網(wǎng)絡故障診斷專家系統(tǒng)。計算機工程,2003,29(13).