【摘要】介紹了OTN數(shù)字傳輸系統(tǒng)的常見故障類型并通過實(shí)例介紹了傳輸系統(tǒng)出現(xiàn)故障后的分析與處理。
【關(guān)鍵詞】傳輸系統(tǒng)故障分析與處理
OTN數(shù)字傳輸系統(tǒng)的運(yùn)行一般較穩(wěn)定,但仍會(huì)有故障情況出現(xiàn)。出現(xiàn)故障后如何處理,盡快查出故障原因,快速排除故障,恢復(fù)系統(tǒng)的傳輸業(yè)務(wù),是維護(hù)人員的第一要?jiǎng)?wù)。
一、設(shè)備內(nèi)部故障的案例分析與處理
設(shè)備內(nèi)部硬件故障通常在設(shè)備長(zhǎng)時(shí)間連續(xù)運(yùn)作下會(huì)出現(xiàn),作為維護(hù)人員,可以通過OMS告警維護(hù)終端查看,從硬件單板工作狀態(tài)的顯示燈查看到等。通常有:BORA板卡故障、機(jī)柜內(nèi)部電源故障、單件板卡故障、機(jī)框至ODF配線柜接口的光纖連接松動(dòng)等。
實(shí)例分析
故障現(xiàn)象:使用OTN節(jié)點(diǎn)箱進(jìn)行業(yè)務(wù)傳輸?shù)腢PS、高頻開關(guān)電源、廣播等設(shè)備的監(jiān)控通信中斷,無法監(jiān)控以上設(shè)備的運(yùn)行狀態(tài)。
故障分析與處理:首先對(duì)UPS、高頻開關(guān)電源等設(shè)備進(jìn)行檢查,發(fā)現(xiàn)設(shè)備處于正常狀態(tài)。檢查傳輸設(shè)備,發(fā)現(xiàn)OTN節(jié)點(diǎn)箱第三槽位的ET100DAE板卡指示燈異常,由板卡上的指示燈顯示,判斷該ET100DAE板卡無電源供電,板卡不工作。多次復(fù)位ET100DAE板卡后,故障依舊。由此判定板卡不是軟件掛死,而是硬件問題。之后更換該板卡,并進(jìn)行撥碼設(shè)置,插入傳輸機(jī)柜,連接線纜。各指示燈正常閃爍,設(shè)備恢復(fù),各設(shè)備網(wǎng)管維護(hù)終端顯示通信恢復(fù)。
由上可知,板卡上的指示燈信息一定要牢記,這樣利于現(xiàn)場(chǎng)的快速判斷與處理。如上所提到的,ET100DAE板卡有3個(gè)指示燈,每個(gè)端口有兩個(gè)指示燈,故障當(dāng)時(shí)對(duì)應(yīng)含義如下:HW紅燈:板卡無電源供應(yīng);RUN不亮:板卡不可用,CPU不工作;ERR不亮:在板卡正常工作情況下無錯(cuò)誤;LA不亮:無連接;HD不亮:全雙工方式工作。
由此判斷:HW紅燈表示該板卡無電源供應(yīng),板卡未工作,因此其余指示燈全部不亮。在故障處理的時(shí)候要熟悉常規(guī)的故障現(xiàn)象:硬件故障,HW燈亮,此類故障只能更換板卡;軟件卡死故障,顯示某個(gè)業(yè)務(wù)有告警,通常重啟或插拔板卡后恢復(fù)。
二、由其它外接用戶系統(tǒng)引起故障的案例分析與處理
用戶常見的故障現(xiàn)象可以分為個(gè)別用戶故障和大面積用戶故障,這就要求維護(hù)人員能夠識(shí)別用戶系統(tǒng)的所有故障并能夠判斷它所屬的故障類型。
實(shí)例分析
故障現(xiàn)象:在一次雷擊過后,相應(yīng)區(qū)域內(nèi)的信號(hào)系統(tǒng)業(yè)務(wù)中斷。
故障分析與處理:根據(jù)故障報(bào)告記錄,可知在雷擊過后,信號(hào)系統(tǒng)監(jiān)控終端上有關(guān)該區(qū)域內(nèi)的信號(hào)系統(tǒng)業(yè)務(wù)信息全部丟失。到達(dá)設(shè)備房觀察傳輸設(shè)備的運(yùn)行狀態(tài),指示燈顯示正常,無告警,詢問網(wǎng)管得知OTN網(wǎng)管沒有告警。維護(hù)人員在信號(hào)系統(tǒng)使用的傳輸通道上進(jìn)行打環(huán)測(cè)試,發(fā)現(xiàn)信號(hào)系統(tǒng)監(jiān)控終端側(cè)只能發(fā)送數(shù)據(jù),卻接受不到數(shù)據(jù)。根據(jù)以上情況,初步判斷信號(hào)系統(tǒng)業(yè)務(wù)通道故障。檢查本地信號(hào)業(yè)務(wù)在連接OTN的RS422通道前所經(jīng)過的數(shù)據(jù)保安單元,發(fā)現(xiàn)線纜接口處線纜有燒損的跡象,由此判斷由于雨天雷擊造成傳輸設(shè)備的RS422數(shù)據(jù)接口損壞。在更換傳輸系統(tǒng)RSXMM板卡時(shí)發(fā)現(xiàn)RS422接口有一針腳有燒損印跡,板卡更換后,信號(hào)系統(tǒng)故障現(xiàn)象消失,系統(tǒng)恢復(fù)。
RSXMM板卡上配置的業(yè)務(wù)包括信號(hào)、無線、時(shí)鐘3種業(yè)務(wù)。信號(hào)系統(tǒng)監(jiān)控終端顯示區(qū)域內(nèi)業(yè)務(wù)信息全部丟失時(shí),無線、時(shí)鐘系統(tǒng)均沒有告警,RSXMM板上其它業(yè)務(wù)仍能正常工作,說明RSXMM板的RS422數(shù)據(jù)接口上燒糊的針腳正好對(duì)應(yīng)信號(hào)的數(shù)據(jù)通道。假設(shè)本地傳輸設(shè)備接地不好造成雷擊,RSXMM板塊損壞,應(yīng)該同時(shí)影響到時(shí)鐘、無線業(yè)務(wù)。傳輸設(shè)備有機(jī)柜接地和節(jié)點(diǎn)箱接地兩重保護(hù),目前尚未發(fā)現(xiàn)板卡被燒壞的實(shí)例,由此推斷出可能有以下兩種可能原因:一是信號(hào)系統(tǒng)戶外終端設(shè)備或設(shè)備房防雷絕緣不佳,從而造成雷擊電流通過信號(hào)系統(tǒng)數(shù)據(jù)連接線時(shí)造成線纜溫度升高,致使燒焦保安單元和RSXMM板上RS422口的針腳;二是通信傳輸設(shè)備出現(xiàn)防雷問題,導(dǎo)致打雷時(shí)正好只損壞了RSXMM板卡上的信號(hào)系統(tǒng)對(duì)應(yīng)的數(shù)據(jù)接口針腳。
三、總結(jié)
OTN傳輸系統(tǒng)故障的因素是多種多樣的,只有在日常維護(hù)過程中,多動(dòng)手實(shí)踐,勤于思考,善于發(fā)現(xiàn)問題的根本原因并及時(shí)解決才能不斷地提高系統(tǒng)的運(yùn)行質(zhì)量,所以,要求在進(jìn)行故障分析的時(shí)候,一定要從多角度出發(fā)、詳盡地了解故障現(xiàn)象和靈活地運(yùn)用邏輯分析能力,同時(shí)要做好對(duì)各種數(shù)據(jù)的記錄,整理每一次故障分析與處理的全過程用于事后總結(jié)、積累經(jīng)驗(yàn),不斷提高故障處理的能力。