張西波
摘要:自動(dòng)轉(zhuǎn)報(bào)系統(tǒng)是空管重要的報(bào)文通信系統(tǒng),其運(yùn)行狀況直接關(guān)系到自動(dòng)轉(zhuǎn)報(bào)業(yè)務(wù)的開(kāi)展,關(guān)系到飛行安全工作的保障。為了提高系統(tǒng)的可靠性,自動(dòng)轉(zhuǎn)報(bào)系統(tǒng)采用雙網(wǎng)結(jié)構(gòu),冗余結(jié)構(gòu)導(dǎo)致在交換機(jī)出現(xiàn)故障時(shí)產(chǎn)生環(huán)路,引起系統(tǒng)癱瘓。該文對(duì)實(shí)際運(yùn)行中出現(xiàn)的兩例不同類型的環(huán)路故障進(jìn)行分析,并提出了有效的解決方法,對(duì)可能面臨同樣問(wèn)題的同行提供一點(diǎn)有益的幫助。
關(guān)鍵詞:自動(dòng)轉(zhuǎn)報(bào);交換機(jī);stp;環(huán)路
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)30-0238-02
1 概述
天津空管分局使用的轉(zhuǎn)報(bào)系統(tǒng)有兩套,一套是2008年建立,使用單網(wǎng)結(jié)構(gòu)。另外一套是2014年建立,使用雙網(wǎng)結(jié)構(gòu)。兩套轉(zhuǎn)報(bào)系統(tǒng)都是北京航管科技有限公司開(kāi)發(fā)的DMHS-M型轉(zhuǎn)報(bào)系統(tǒng),只是軟件版本和系統(tǒng)結(jié)構(gòu)存在差別。雖然有兩套轉(zhuǎn)報(bào)系統(tǒng),但是由于08轉(zhuǎn)報(bào)的異步單元中有電流環(huán)接口,不能直接連到智能線路切換器上,我們就沒(méi)有把08轉(zhuǎn)報(bào)系統(tǒng)作為一套備用系統(tǒng)接入智能線路切換器。兩套系統(tǒng)相對(duì)獨(dú)立,新系統(tǒng)對(duì)外提供服務(wù),舊系統(tǒng)不對(duì)外提供服務(wù)。自動(dòng)轉(zhuǎn)報(bào)網(wǎng)絡(luò)作為民航系統(tǒng)重要的通信基礎(chǔ)設(shè)施之一,基于該網(wǎng)絡(luò)開(kāi)展的平面電報(bào)通信業(yè)務(wù)是保證民用航空飛行正常和安全必不可少的手段。用于全國(guó)各機(jī)場(chǎng)之間的電報(bào)傳輸,傳遞管制、氣象、情報(bào)、航空公司、省局等重要部門(mén)的電報(bào),是機(jī)場(chǎng)的信息樞紐中心,尤其是空中交通管制部門(mén)傳遞航班動(dòng)態(tài)信息的主要手段,在維護(hù)空中交通秩序、保證民用航空安全和飛行正常中起著重要作用。天津自動(dòng)轉(zhuǎn)報(bào)系統(tǒng)結(jié)構(gòu)如下:
圖1 天津自動(dòng)轉(zhuǎn)報(bào)系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)
2 兩例環(huán)路故障
2.1 報(bào)文收電地址錯(cuò)誤引起的環(huán)路及其解決辦法
天津在世界時(shí)01:34 ,用2008轉(zhuǎn)報(bào)系統(tǒng)給北京發(fā)測(cè)試報(bào)的時(shí)候,突然收到大量的同一地址的報(bào)文,報(bào)文內(nèi)容如下:
GG ZBZZNFNX
070134 WRRRYNYX
VAWR0905 WIIF 06070130
其他報(bào)文內(nèi)容省略。
發(fā)電地址都為WRRRYNYX,收電地址都為ZBZZNFNX,報(bào)文都是印尼火山灰,報(bào)文內(nèi)容重復(fù)。在2014轉(zhuǎn)報(bào)系統(tǒng)的BJS也同樣收到,為了解決報(bào)文循環(huán)問(wèn)題,應(yīng)急修改兩套轉(zhuǎn)報(bào)機(jī)的路由表,把收電地址為ZBZZNFNX的報(bào)文自動(dòng)轉(zhuǎn)發(fā)到OIT。事后統(tǒng)計(jì)從01:34到01:48,就收到97份印尼火山灰報(bào)文,平均8秒就收到一份報(bào)文,期間轉(zhuǎn)報(bào)系統(tǒng)處理報(bào)文緩慢。前幾天也收到過(guò)印尼火山灰報(bào)文,因收電地址不是天津情報(bào),出現(xiàn)干線循環(huán)告警(循環(huán)五次自動(dòng)終止),雖然收電地址不是天津,但是報(bào)文是情報(bào)需要的,因此,我們手工轉(zhuǎn)發(fā)到情報(bào)(即OIT),同時(shí)我們也把這種情況向上級(jí)轉(zhuǎn)報(bào)部門(mén)反應(yīng),只是還沒(méi)有解決。
原因分析:兩個(gè)原因?qū)е铝诉@個(gè)故障,第一個(gè)是收電地址錯(cuò)誤,正確的收電地址應(yīng)該是ZBTJOIXX,平時(shí)遇到這種情況,報(bào)文循環(huán)五次后就停止轉(zhuǎn)發(fā)了,與此同時(shí),轉(zhuǎn)報(bào)機(jī)會(huì)有干線循環(huán)告警提示。第二個(gè)原因是天津和北京使用的轉(zhuǎn)報(bào)路不同,天津使用的是BJB,北京使用的BJM,平時(shí)不測(cè)試報(bào)文時(shí),天津BJB和BJM都打開(kāi),北京是只開(kāi)BJM,所以,我們能夠收到北京的報(bào)文,沒(méi)有發(fā)現(xiàn)天津和北京實(shí)際使用的是不同路傳輸。在測(cè)試報(bào)文時(shí)恰巧遇到一個(gè)錯(cuò)誤的收電地址,天津轉(zhuǎn)報(bào)機(jī)的路由表配置,認(rèn)為ZBZZNFNX報(bào)文不是天津的,應(yīng)該通過(guò)BJB轉(zhuǎn)發(fā)到北京,由于08轉(zhuǎn)報(bào)機(jī)不作正式使用,不做測(cè)試時(shí),BJB是關(guān)閉的,這個(gè)問(wèn)題沒(méi)有暴露出來(lái)。測(cè)試報(bào)文時(shí),北京把BJB路給打開(kāi)了,北京轉(zhuǎn)報(bào)機(jī)的路由表認(rèn)為ZBZZNFNX是天津的報(bào)文,又把這份報(bào)文通過(guò)BJM和BJS發(fā)到天津來(lái),這樣報(bào)文就通過(guò)BJB和BJM在天津和北京之間形成了一個(gè)環(huán)路。由于報(bào)文是印尼火山灰,應(yīng)改轉(zhuǎn)發(fā)給情報(bào),收電地址應(yīng)該為ZBTJOIXX,電報(bào)應(yīng)通過(guò)OIT轉(zhuǎn)發(fā)到情報(bào)。我們改不了電報(bào)的收電地址,只能通過(guò)修改路由表,把ZBZZNFNX的報(bào)文轉(zhuǎn)發(fā)到OIT。
2.2 交換機(jī)故障出現(xiàn)的環(huán)路及其解決辦法
2014轉(zhuǎn)報(bào)系統(tǒng)的ip管理終端出現(xiàn)超時(shí)告警,不能通過(guò)遠(yuǎn)程登錄查看轉(zhuǎn)報(bào)主備機(jī)的工作情況。筆記本接入交換機(jī)時(shí),筆記本屏幕上顯示ip地址沖突。筆記本上設(shè)置的ip地址也沒(méi)有與轉(zhuǎn)報(bào)系統(tǒng)中的ip地址相沖突,怎么會(huì)出現(xiàn)ip地址沖突,只能是網(wǎng)絡(luò)中出現(xiàn)了環(huán)路,趕緊拔掉一臺(tái)交換機(jī)的電源,重啟交換機(jī),再次查看轉(zhuǎn)報(bào)系統(tǒng),告警音消失,系統(tǒng)工作正常。
3 系統(tǒng)設(shè)計(jì)形成的環(huán)路及解決方法
3.1 環(huán)路的危害
根據(jù)以太網(wǎng)的原理,當(dāng)以太網(wǎng)交換機(jī)節(jié)點(diǎn)收到一個(gè)廣播幀或未知單播幀時(shí),會(huì)向其他所有端口泛洪該幀。交換機(jī)節(jié)點(diǎn)通過(guò)泛洪的方式,很容易將廣播幀或未知單播幀轉(zhuǎn)發(fā)給目的主機(jī)。但是,當(dāng)網(wǎng)絡(luò)中有環(huán)路存在時(shí),廣播幀會(huì)在環(huán)路的各個(gè)交換機(jī)節(jié)點(diǎn)上依次泛洪和轉(zhuǎn)發(fā),最終回到源交換機(jī)節(jié)點(diǎn),而源交換機(jī)節(jié)點(diǎn)收到該廣播幀后,并不會(huì)丟棄,繼續(xù)按照廣播幀的轉(zhuǎn)發(fā)方式進(jìn)行泛洪,因此廣播幀會(huì)永無(wú)休止地在交換機(jī)的節(jié)點(diǎn)進(jìn)行轉(zhuǎn)發(fā),最終流量越來(lái)越大,耗盡帶寬,網(wǎng)絡(luò)癱瘓。因此,交換機(jī)需要配置stp協(xié)議,解決環(huán)路問(wèn)題。
3.2 交換機(jī)之間的環(huán)路
2014轉(zhuǎn)報(bào)系統(tǒng)為了保證轉(zhuǎn)報(bào)系統(tǒng)不受單個(gè)設(shè)備出現(xiàn)故障影響系統(tǒng)工作,系統(tǒng)對(duì)交換網(wǎng)絡(luò)進(jìn)行冗余設(shè)計(jì):交換機(jī)冗余和網(wǎng)線冗余。兩個(gè)交換機(jī)之間使用雙網(wǎng)線連接,ip管理終端通過(guò)兩個(gè)網(wǎng)口分別連到交換機(jī)A和交換機(jī)B。為了解決兩個(gè)交換機(jī)之間的環(huán)路問(wèn)題,對(duì)兩臺(tái)交換機(jī)進(jìn)行配置,交換機(jī)之間連接的接口使用以太通道,交換機(jī)會(huì)把一組物理端口聯(lián)合起來(lái),作為一個(gè)邏輯的通道,也就是channel-group,這樣交換機(jī)會(huì)認(rèn)為這個(gè)邏輯通道為一個(gè)端口。這么做有三個(gè)好處:增加帶寬,帶寬相當(dāng)于組成組的端口的帶寬總和。 增加冗余,只要組內(nèi)不是所有的端口都down掉,兩個(gè)交換機(jī)之間仍然可以繼續(xù)通信。負(fù)載均衡,可以在組內(nèi)的端口上配置,使流量可以在這些端口上自動(dòng)進(jìn)行負(fù)載均衡。
交換機(jī)之間雙網(wǎng)線接口的配置:
switchport mode trunk
channel-protocol lacp
channel-group 1 mode active
3.3 轉(zhuǎn)報(bào)主備機(jī)同交換機(jī)連接形成的環(huán)路
由于轉(zhuǎn)報(bào)主機(jī)和備機(jī)使用雙網(wǎng)口和交換機(jī)相連,雙網(wǎng)口使用同一個(gè)ip地址,因此,交換機(jī)需要配置stp協(xié)議,有的端口處于blocking狀態(tài),使網(wǎng)絡(luò)中不會(huì)出現(xiàn)環(huán)路。 使用stp的端口啟動(dòng)要經(jīng)過(guò)5個(gè)狀態(tài):disable 、blocking 、listening、 learning 和forwarding 。在STP選舉過(guò)程中,端口是不能轉(zhuǎn)發(fā)用戶數(shù)據(jù)的。端口一開(kāi)始處于阻塞狀態(tài),這個(gè)狀態(tài)只能接收BPDU;一個(gè)接口20秒沒(méi)收到BPDU,也就是到了最大時(shí)間,端口會(huì)進(jìn)入偵聽(tīng)狀態(tài),這時(shí)接口可以接收BPDU,并開(kāi)始發(fā)送BPDU;發(fā)送15秒的BPDU,接口將會(huì)為轉(zhuǎn)發(fā)用戶數(shù)據(jù)做準(zhǔn)備,也開(kāi)始學(xué)習(xí)MAC地址,這個(gè)狀態(tài)叫學(xué)習(xí)狀態(tài);再經(jīng)過(guò)15秒的學(xué)習(xí)后,端口進(jìn)入轉(zhuǎn)發(fā)狀態(tài),轉(zhuǎn)發(fā)狀態(tài)是一個(gè)正常的接口。從disable狀態(tài)到forwarding狀態(tài)轉(zhuǎn)換需要50秒,也就是說(shuō)如果一個(gè)連接到交換機(jī)的終端網(wǎng)線斷開(kāi),重新連接到能夠正常收發(fā)數(shù)據(jù),至少將近1分鐘,才能正常轉(zhuǎn)發(fā)報(bào)文。因此,連接異步單元、超級(jí)終端、轉(zhuǎn)報(bào)主機(jī)和備機(jī)的端口使用portfast端口模式,快速收斂,可以很快地從blocking狀態(tài)轉(zhuǎn)變成forwarding狀態(tài),加快生成樹(shù)收斂時(shí)間。缺點(diǎn)是如果這個(gè)端口接入了網(wǎng)絡(luò)設(shè)備,容易造成二層環(huán)路。
異步單元、超級(jí)終端、轉(zhuǎn)報(bào)主備機(jī)到交換機(jī)連接的配置:
switchport mode access
spanning-tree portfast
3.4 網(wǎng)絡(luò)中出現(xiàn)環(huán)路后的處理
盡管對(duì)交換機(jī)做了配置,利用生成樹(shù)算法、在以太網(wǎng)絡(luò)中,創(chuàng)建一個(gè)以某臺(tái)交換機(jī)的某個(gè)端口為根的生成樹(shù),避免環(huán)路。在以太網(wǎng)絡(luò)拓?fù)浒l(fā)生變化時(shí),通過(guò)生成樹(shù)協(xié)議達(dá)到收斂保護(hù)的目的,解決環(huán)路問(wèn)題,但是還是可能由于協(xié)議運(yùn)行中出現(xiàn)問(wèn)題,出現(xiàn)環(huán)路故障,在這種情況下,我們只能手動(dòng)破壞環(huán)路,使設(shè)備快速恢復(fù)正常。
4 結(jié)束語(yǔ)
環(huán)路故障是我們使用網(wǎng)絡(luò)中可能遇到的一個(gè)問(wèn)題,它能使整個(gè)系統(tǒng)癱瘓,危害性很大,有時(shí)會(huì)使我們誤認(rèn)為是設(shè)備出現(xiàn)故障,其實(shí)有些時(shí)候設(shè)備沒(méi)有出現(xiàn)問(wèn)題,是我們的上層應(yīng)用出現(xiàn)了問(wèn)題,或者是交換機(jī)上運(yùn)行的協(xié)議出現(xiàn)了問(wèn)題。為了快速發(fā)現(xiàn)環(huán)路故障,平時(shí)對(duì)設(shè)備間的連線要做好標(biāo)識(shí),不同類型的接口使用不同顏色的網(wǎng)線。對(duì)交換機(jī)連接設(shè)備的接口做好記錄,當(dāng)出現(xiàn)故障時(shí),根據(jù)故障現(xiàn)象,根據(jù)資料,仔細(xì)認(rèn)真分析,抓住本質(zhì),這樣才能快速解決問(wèn)題。
參考文獻(xiàn):
[1] Evan Marcus,Hal Stern.高可用性系統(tǒng)設(shè)計(jì)[M]. 汪青青,盧祖英,譯.清華大學(xué)出版社,2005.
[2] Radia Perlman. 網(wǎng)絡(luò)互連:網(wǎng)橋·路由器·交換機(jī)和互連協(xié)議[M].機(jī)械工業(yè)出版社,2002.
[3] DMHS-M系統(tǒng)管理員培訓(xùn)教程.endprint