李 芳
(杭州市廣播電視科學(xué)技術(shù)研究所,浙江 杭州 310008)
高度發(fā)展的信息社會促進有線電視向數(shù)字化、綜合化和智能化方向發(fā)展,通過廣播電視網(wǎng)絡(luò)向用戶提供廣播電視及多種多樣業(yè)務(wù)。同步數(shù)字傳輸系列(SDH)傳輸體制是從準同步系列(PDH)發(fā)展進化來的,具有PDH的優(yōu)點。SDH規(guī)范了數(shù)字信號的幀結(jié)構(gòu)、復(fù)用方式、傳輸速率等級、接口碼型等,融光纖技術(shù)、線路傳輸、交換功能于一體,SDH具有協(xié)調(diào)一致的管理、操作和業(yè)務(wù)靈活調(diào)度。憑借傳輸信息量大、網(wǎng)絡(luò)利用率高、抗干擾考輻射強、自愈保護性好等優(yōu)勢,SDH傳輸網(wǎng)在國家、省市級骨干網(wǎng)中得到廣泛應(yīng)用。
SDH設(shè)備作為廣播電視傳輸網(wǎng)的重要組成部分,SDH傳輸系統(tǒng)的日常維護工作直接影響著廣播電視網(wǎng)的安全運行。特別是SDH骨干網(wǎng)的光鏈路的安全,不僅影響整個SDH傳輸網(wǎng)的保護機制,也影響著傳輸業(yè)務(wù)的性能指標,需要引起技術(shù)運維人員的特別重視。
SDH光通信以光波為載體,以光導(dǎo)纖維為傳輸媒質(zhì),因此,光鏈路安全對SDH網(wǎng)絡(luò)安全意義重大。導(dǎo)致SDH光同步數(shù)字傳輸設(shè)備光鏈路出現(xiàn)故障的原因很多,按故障的來源大體可分為以下6類常見故障[1]:
1)光纜尾纖故障。包括光纜尾纖中斷、光纜線路總衰耗過大;尾纖彎曲半徑過小,法蘭盤接頭有灰塵及尾纖頭臟、光纖配線架法蘭接觸不良等。
2)單板故障。包括光線路板、時鐘板、交叉板、主控板、電源板等器件損壞及因環(huán)境、溫濕度等影響機盤正常工作等情況。
3)電源系統(tǒng)故障。包括交流停電、蓄電池放不出電、設(shè)備直流掉電及熔斷器故障等,電壓不穩(wěn)造成光線路板損壞。
4)電纜故障。包括45 Mbit/s中繼電纜中斷,數(shù)據(jù)配線架側(cè)45 Mbit/s輸入/輸出端口脫落或接觸不良等。
5)網(wǎng)管系統(tǒng)故障。包括網(wǎng)管與設(shè)備之間的通信故障或系統(tǒng)異常而造成DCC通道中斷,死機、網(wǎng)元失聯(lián)等。
6)操作不規(guī)范故障。工程人員對網(wǎng)絡(luò)拓撲、光鏈路走向、設(shè)備性能不熟悉,冒然開通或跳光纖;對端光盤未卸下尾纖,冒然使用光時域測試儀,造成對端光盤損壞等。
由此看來,以光路故障對SDH承載業(yè)務(wù)的影響最大,本文著重分析光鏈路故障及相應(yīng)的處理方法。
故障定位的關(guān)鍵是將故障點準確定位到單站、機盤。SDH通信系統(tǒng)的特點是:一條通道中出現(xiàn)任何一個“故障源”,在下游各站設(shè)備上都會出現(xiàn)告警指示。因此設(shè)備發(fā)生告警只是一個現(xiàn)象,處理之前首先要對告警性質(zhì)進行分析,然后再定性處理。故障處理時需要全線協(xié)調(diào)配合工作,盲目從事會造成錯誤判斷,影響故障的及時處理。因此故障定位的關(guān)鍵在于將故障點準確定位到單站、單板。
1)先外部,后傳輸。在定位故障時,應(yīng)先排除外部的可能因素,如光纖斷、電纜或電源問題。
2)先單站,后機盤。在定位故障時,要盡可能準確地將故障定位到單站。
3)先線路,后支路。光群路盤的故障常常會引起支路盤的異常告警。
4)先高級,后低級。在分析告警時,應(yīng)首先分析告警級別高的告警,再分析級別低的告警。
故障定位的常用方法有:一分析;二環(huán)回;三換盤。1)發(fā)生故障時,首先通過對告警事件、性能事件、業(yè)務(wù)流向的分析,初步判斷故障點范圍;
2)通過逐段環(huán)回,排除外部故障,最終將故障點定位到單張,乃至單盤;
3)通過換盤,排除故障點(故障盤寄回廠家修理)。
SDH設(shè)備故障定位和處理的常用方法有:1)網(wǎng)管告警信息分析法;2)環(huán)回法;3)替換法;4)更換配置法;5)儀表測試法;6)經(jīng)驗處理法。
杭州阿爾卡特SDH傳輸網(wǎng),由杭州、余杭、臨安、淳安、建德、桐廬、富陽、蕭山等網(wǎng)元組成,均采用復(fù)用段保護方式,分別向杭州地區(qū)的二五區(qū)縣傳輸數(shù)字電視和模擬電視業(yè)務(wù)(見圖1)。其中,數(shù)字電視傳輸網(wǎng)由阿爾卡特1660SM設(shè)備構(gòu)成,模擬電視傳輸網(wǎng)由阿爾卡特1664SM設(shè)備構(gòu)成。根據(jù)對阿爾卡特SDH傳輸設(shè)備的運維經(jīng)驗,對常見的光鏈路告警分析總結(jié)如下。
阿爾卡特1660SM設(shè)備的告警級別分為:嚴重告警(CRITICAL紅色)、主要告警(MAJOR橙色)、次要告警(MINOR黃色)、提示告警(WARING藍色)和已消失的告警(CLEARED綠色)等。
光路板的端口主要由SPI(SDH物理接口)、RST(再生段終端)、MST(復(fù)用段終端)、MSP(復(fù)用段保護)等幾部分組成(見圖2)。
1)LOS:Los Of Signal,信號丟失。
2)LOF:Loss Of Frame,幀丟失;連續(xù)4幀不能正確接收到幀定位信號,則會產(chǎn)生OOF幀失步告警,當連續(xù)3 ms出現(xiàn)OOF時,會發(fā)出LOF幀丟失告警。
3)URU:Underling Resource Unavailable,在板卡上檢測到設(shè)備失效。4)TD:Transmitter Degrade,發(fā)送端劣化。5)TF:Transmitter Failure,發(fā)送端失效。
1)URU:Underling Resource Unavailable,在板卡上檢測到設(shè)備失效。
2)RS-TIM:再生段蹤跡標識J0字節(jié)失配。
3)CSF:Communication Subsystem Fail,通信子系統(tǒng)故障。
4)PM-AS:Performance Monitoring Alarm Synthesis,性能監(jiān)視綜合告警。
1)DS:Degraded Signal,被降級的信號(BER>1.00×10-6)。
2)RDI:Remote Defect Indication,遠端缺陷指示(相當于FERF)。
3)EBEF:Excessive BER,誤碼率越限(BER>1.00×10-3)。
4)AIS:Alarm Indication Signal告警指示信號。
5)CSF:Communication Subsystem Fail,通信子系統(tǒng)故障。
6)CPE:Communication Protocol Error,通信協(xié)議故障。
7)PM-AS:Performance Monitoring Alarm Synthesis,性能監(jiān)視綜合告警。
1)LOP:Loss Of Pointer,指針丟失。
2)LAPD:Link Access Protocol on D channel,通信協(xié)議故障。
4)DRIFT:頻偏,時鐘故障。
5)FF:Fuse Failure,電源故障。
6)RI:Resource Isolation,設(shè)備與網(wǎng)管失聯(lián)。
判斷故障,需要根據(jù)SDH的層次結(jié)構(gòu)特點來分析。
1)首先判斷故障屬于物理層、再生段、復(fù)用段還是通道層。然后根據(jù)各通道層在系統(tǒng)中的對應(yīng)位置或作用,定位到單盤。
2)根據(jù)路由和時隙查找故障點,分析交叉的時隙規(guī)則,查看故障是否發(fā)生在整個東向、西向,還是某個業(yè)務(wù)板、接口板,或者是某個VC12,VC3,VC4時隙。
3)物理層、再生段、復(fù)用段、通道層的故障及機性能之間的相互影響關(guān)系如圖3所示。其中通道又分為高階通道和低價通道。高階通道為155 Mbit/s以上速率,如155 Mbit/s,622 Mbit/s等,低階通道為155 Mbit/s以下速率,如2 Mbit/s,34 Mbit/s,45 Mbit/s等。
從圖1可以看出,采用杭州廣播電視傳輸網(wǎng),是一個中心站(杭州)向環(huán)上其余站點發(fā)送廣播業(yè)務(wù)。典型的單環(huán)拓撲結(jié)構(gòu)SDH傳輸網(wǎng)絡(luò),適合采用復(fù)用段保護方式。復(fù)用段倒換就是以復(fù)用段為基礎(chǔ)的,(STM-N)/2作為主用工作信道,(STM-N)/2作為備用保護信道。倒換與否根據(jù)環(huán)上傳輸?shù)膹?fù)用段信號的質(zhì)量決定的,倒換是由K1K2字節(jié)做攜帶的APS協(xié)議來啟動,當復(fù)用段出現(xiàn)問題時,工作信道上的業(yè)務(wù)都切換到備用信道上。因此,當光纖中斷了,該復(fù)用段跟著也就斷了,導(dǎo)致復(fù)用段保護倒換。有時光纜沒有中斷,出現(xiàn)誤碼過大、幀丟失、信號劣化等條件也會導(dǎo)致復(fù)用段保護倒換。
所以,SDH光路上出現(xiàn)以下4種告警會導(dǎo)致復(fù)用段倒換,要特別注意:1)Loss Of Signal,信號丟失;2)Excessive BER,誤碼越限;3)Loss Of Frame,幀丟失;4)Degraded Signal,信號劣化。復(fù)用段保護在發(fā)生光纜中斷、光纜割接、光盤故障、監(jiān)控盤故障等故障時,自動發(fā)生復(fù)用段倒換,以保護SDH傳輸?shù)臉I(yè)務(wù)不中斷。
根據(jù)運維實際工作中遇到的典型故障,利用故障判斷的基本方法進行告警分析,故障定位及處理。
故障描述:某日,本端A網(wǎng)元的西向光盤上報“LOS”,“CSF”告警,遠端B網(wǎng)元的東向光盤上報“LOS”,“CSF”告警,發(fā)生復(fù)用段倒換(見圖4)。
告警分析:雙光纖故障問題是SDH的最常見故障。應(yīng)從告警分析入手,關(guān)鍵是判斷故障點在A網(wǎng)元或在B網(wǎng)元,還是在光纜上。
具體分析如下:
1)“LOS”無光告警。當A網(wǎng)元光盤收不到光功率時,或者接收光功率過大或過小,超出過載點或小于接收靈敏度,出現(xiàn)無光告警。同理B網(wǎng)元光盤收不到光功率時,也會上報“LOS”無光告警。
2)“CSF”通信子系統(tǒng)故障。因為光纜中斷會造成本地A網(wǎng)元和遠端B網(wǎng)元之間的通信故障,A,B網(wǎng)元同時上報“CSF”告警。
原因分析:發(fā)生光鏈路雙向故障,主要原因有:1)由于光纜或尾纖同時中斷2根;2)發(fā)送端發(fā)送激光器故障;3)接收端接收光模塊故障;4)接收端接收光功率過大或過小,超出收光模塊指標范圍;5)活動連接器接觸不良或法蘭盤損壞。
處理方法:1)最好先用光功率計測試測量接收端的接收光功率,如在ODF架上,或者直接在光板上測試接收光功率,如果測不到光功率,則可能是光纖斷了,或?qū)Χ税l(fā)送光功率有問題。用這個辦法來查找出現(xiàn)告警的故障點是光纖斷了,還是對端光發(fā)送不好,或者光接頭臟了還是本端的故障。2)如果沒有光功率計,可以用短路光纖在ODF架或者在光盤上做收發(fā)環(huán)回,用此方法來判斷故障是光纖斷了還是光盤故障。3)通過光時域分析儀檢查光纜的斷處。然后根據(jù)實際情況進行處理,排除故障。
處理結(jié)果:排查后確定是過路車輛掛斷SDH骨干網(wǎng)光纜,經(jīng)工程隊搶修后,恢復(fù)正常。
故障描述:A網(wǎng)元的西向光盤上報“LOS”,“EFER”,“DS”,“LOF”,“AIS”,“CSF”告警,B網(wǎng)元的東向光盤上報“FERF”,“RDI”,“CSF”告警,發(fā)生復(fù)用段倒換(見圖5)。
告警分析:單光纖故障問題是常見故障。應(yīng)從告警分析入手,關(guān)鍵是判斷故障點在A網(wǎng)元還是在B網(wǎng)元,或者在光纜上。
具體分析如下:
接收端A:1)“AIS”指示告警,全1,即A網(wǎng)元收不到B網(wǎng)元過來的信號;2)“EBEF”誤碼超出門限值(BER>1.00×10-3),即B點發(fā)信號太弱,或者光路衰減太厲害,造成A點接收端光信號誤碼越限;3)“DS”信號劣化信(BER>1.00×10-6),即B點發(fā)信號太弱,或者光路衰減太厲害,造成A點接收端光信號劣化;4)“LOF”當A點連續(xù)4幀不能正確接收到幀定位信號,會產(chǎn)生R-OOF幀失步告警,當連續(xù)3 ms出現(xiàn)R-OOF時,會發(fā)出R-LOF(再生段-幀丟失)告警;5)“LOS”無光告警。當A點收不到光功率,或者接收光功率過大或過小,超出過載點或小于接收靈敏度,將出現(xiàn)無光告警。
發(fā)送端B:“FERF”,即A網(wǎng)元沒有收到B網(wǎng)元過來的信號,A網(wǎng)元上報“AIS”后,A網(wǎng)元給B網(wǎng)元一個信息“FERF”,通知B網(wǎng)元。B網(wǎng)元上報“FERF”遠端接收失效(或者“RDI”遠端缺陷指示)告警。
另外,由于網(wǎng)管與網(wǎng)元之間通信,是通過光纖傳輸?shù)模灰狝,B之間的光纖中斷,不管是中斷1根還是2根,都會造成本端網(wǎng)元和遠端網(wǎng)元的通信故障,上報“CSF”(通信子系統(tǒng)故障)。
故障原因:發(fā)生光鏈路單向故障,主要原因有:1)光纜或尾纖只斷1根;2)B端發(fā)送激光器故障;3)A端接收光模塊故障;4)B端接收光功率過大或過小,超出收光模塊指標范圍;5)活動連接器接觸不良或法蘭盤損壞。因為單光纖中斷會造成單端網(wǎng)元的通信中斷、獲取的線路時鐘源中斷,因此當出現(xiàn)光線路上“LOS”時,通信協(xié)議跟著出錯,上報“CSF”告警。
處理方法:1)單光纖故障問題和雙光纖故障一樣,最好先用光功率計測試測量本端網(wǎng)元A的接收光功率;2)通過短路光纖在ODF架或者在光盤上做收發(fā)環(huán)回,來判斷故障是光纖斷了還是光盤故障。3)通過光時域分析儀檢查光纜的斷處。然后根據(jù)實際情況進行處理,排除故障。
處理結(jié)果:排查后確定是接收端A的法蘭有故障,更換后,告警消失。
故障描述:某日,發(fā)現(xiàn)模擬電視傳輸網(wǎng):余杭1664SM/17#光盤上報“LOS”告警,杭州1664SM/18#光盤上報“LOS”綠色,“LOF”橙色告警。模擬電視7個區(qū)縣均有信號。數(shù)字電視傳輸網(wǎng):余杭1660SM/28#光盤上報“LOS”告警,杭州1660SM/25#光盤正常,上報告警。數(shù)字電視7個區(qū)縣業(yè)務(wù)全部中斷,復(fù)用段保護沒有倒換。
故障排查:SDH傳輸工程師、區(qū)縣前端技術(shù)人員及工程施工人員一起排查。
模擬電視SDH設(shè)備:1)杭州1664SM/18#光盤用光功率計,測收、發(fā)余杭方向的光功率均正常;2)用OTDR檢查,杭州至余杭的光路,收發(fā)兩纖均為35 km,也正常;3)到余杭站點,將余杭1660SM的杭州方向的2根尾纖都拔去,在杭州網(wǎng)元對應(yīng)光盤上仍然能收到光功率為正常范圍。
數(shù)字電視SDH設(shè)備:1)杭州發(fā)、余杭收,上報“LOS”,拔去杭州光盤上的TX尾纖后,告警沒有變化,復(fù)用段也沒有倒換,說明這根纖有問題;2)余杭發(fā)、杭州收,無報警,拔去杭州光盤上的RX尾纖,余杭上報“LOS”,復(fù)用段發(fā)生倒換,說明這根纖是正常的;3)用OTDR檢查,杭州至余杭的光路,拔去余杭的尾纖,發(fā)現(xiàn)出現(xiàn)“busy”打不出曲線,說明對端有光發(fā)過來,有其他光信號存在。
故障原因:施工隊光纜割接施工時,誤將數(shù)字電視、模擬電視、數(shù)據(jù)寬帶3種不同設(shè)備的光纖混淆,造成業(yè)務(wù)中斷。
為什么利用相同路由光纜承載的數(shù)字電視業(yè)務(wù)出現(xiàn)中斷,而模擬電視業(yè)務(wù)沒有中斷呢?原來是SDH網(wǎng)絡(luò)配置的方向不同,模擬電視主路信號是從杭州到蕭山,最后一站到余杭,不用再往下傳了。所以當余杭和杭州之間光纜出錯時,復(fù)用段不倒換,也不影響其他區(qū)縣的模擬電視業(yè)務(wù)。數(shù)字電視主路是從杭州到余杭,最后一站是蕭山。所以當余杭和杭州之間光纜出錯時,復(fù)用段不倒換,就造成了其他所有區(qū)縣的數(shù)字電視信號中斷。
故障處理:到余杭站點,用1 550 nm光發(fā)機發(fā)射光功率,在杭州中心機房用光功率計測收到的光功率。一根一根地對光纖,待全部光纖對上號以后,將正確的尾纖接入相應(yīng)SDH設(shè)備光盤,故障排除。
SDH傳輸技術(shù)在廣播電視傳輸系統(tǒng)得到廣泛應(yīng)用。SDH光傳輸系統(tǒng)的復(fù)雜性,提高了設(shè)備運維人員的工作要求,增加了故障處理難度。運維工程師需要熟悉SDH基本原理,了解SDH的常用開銷字節(jié)、告警、幀結(jié)構(gòu)、邏輯功能塊、單板硬件等,熟悉SDH的組網(wǎng)拓撲、保護屬性、業(yè)務(wù)分配、運行狀態(tài),同時需要有嚴謹?shù)墓ぷ鲬B(tài)度和高度的責任心,做好現(xiàn)場數(shù)據(jù)采集,熟悉故障定位原則和處理方法,才能快速有效地排除SDH故障。隨著廣播電視數(shù)字化、網(wǎng)絡(luò)化的發(fā)展,做好SDH傳輸系統(tǒng)的技術(shù)保障,必將有力推動廣播電視事業(yè)的迅速發(fā)展。
[1]代紅.淺談SDH系統(tǒng)常見故障處理及維護方法[J].內(nèi)蒙古科技與經(jīng)濟,2007(8):297-298.
[2]王朋.SDH傳輸設(shè)備的維護和故障定位分析[J].中國有線電視,2006(2):196.
[3]呂習(xí)良.SDH傳輸故障處理分析[J].通信世界,2008(9):B25-B26.