樊 睿 馬 力
(南京城市地鐵實業(yè)集團有限公司設備分公司 江蘇 南京 210012)
首先,接入網(wǎng)系統(tǒng)各節(jié)點的配置管理、業(yè)務管理、故障管理以及對用戶線和各功能模塊的測試;其次,對傳輸系統(tǒng)的配置管理、故障管理、鏈路配置和測試、鏈路保護倒換以及誤碼統(tǒng)計,并對接入網(wǎng)系統(tǒng)的版本管理和報表管理;再次,通過訪問控制策略、規(guī)劃等實現(xiàn)安全管理, 以保證接入網(wǎng)管理應用程序和管理信息不被無權(quán)限地訪問和破壞;最后,性能管理,包括監(jiān)測、分析、診斷、優(yōu)化及控制來保證接入網(wǎng)的業(yè)務質(zhì)量,以滿足優(yōu)化要求。
第一,先定外部,后定位傳輸。
第二,在定位故障時,應先排除外部的可能因數(shù),如光纖斷,對接設備故障或電源問題等先網(wǎng)絡,后網(wǎng)元。
第三,先高速后低速。從告警信號流中可以看出,高速信號的告警常常會引起低速信號的告警;因此在故障定位時,應先排除高速信號的告警。
第四,先高級后低級。 在分析告警時,應首先分析高級別的告警,如緊急告警、主要告警,然后再分析低級別的告警。
OPTIX SDH 傳輸系統(tǒng)網(wǎng)管軟件OPTIX -NMS 可實現(xiàn)ITU-T G.784 建議所規(guī)定的五類管理告警管理、性能管理、配置管理、維護管理和安全管理功能,能夠監(jiān)視告警、性能、保護倒換等狀態(tài)。 SDH 光傳輸系統(tǒng)和綜合業(yè)務接入網(wǎng)的故障告警通過網(wǎng)管軟件能夠定位在單板。
IX 155/622H SDH 設備的告警按程度分為嚴重告警、一般告警和事件告警,按告警源分為傳輸告警、設備告警、外部事件告警、性能告警和軟件告警。
第一、傳輸告警。 與STM-N 傳輸信息有關(guān)、包括LOI、LOS、LOF、LOP、FERF、AIS、BER 等;
第二、設備告警。 與構(gòu)成SDH 系統(tǒng)的物理設備有關(guān)、包括板的拔/插、電源故障、時鐘故障等;
第三、外部事件告警。與設備運行環(huán)境有關(guān)、包括機房門開、火災、水災、高溫等;
第四、性能告警。 即性能超值告警,具體內(nèi)容與性能部分有關(guān);
第五、 軟件告警: 主要是NCP 程序檢測到的通信故障和程序錯誤。
3.1.1 光纖故障
光纖故障一般光板上會有R_LOS 告警。 判斷方法如下:一是,使用OTDR 儀表直接測量光纖;二是,測量光纖兩端光板的發(fā)送和接收光功率;三是,測試光板功率正常后,使用尾纖將光板收發(fā)接口自環(huán),若自環(huán)后光板紅燈仍有警告,則說明是光板的問題;若兩端的光板自環(huán)后紅燈都熄滅,則是光纖問題。光纖故障維護比較簡單,直接將壞的光纖直接換掉就可以了。
3.1.2 中繼線纜故障
如果在交換設備側(cè)自環(huán),交換中繼狀態(tài)正常;在傳輸設備的子架接線區(qū)上自環(huán),傳輸測試也正常,則一般為中繼電纜問題。當電纜不通或接觸不良時, 一般可以在對應的支路板通道上看到T_ALOS 告警。在這種情況下,可以采用“對線”方法來判斷電纜的通斷和鏈接正確性,也可通過與其他正常通道互換線纜的方法排除。
3.1.3 供電電源故障
如果某站登入不上,且與該站相連的光板均有R_LOS 告警,則可能是該站的電源故障。 若該站從正常運行中突然進入異常工作狀態(tài),如出現(xiàn)通道倒換或復用段倒換失敗、某些單板工作異常、業(yè)務中斷、登入不正常等情況,則需檢查傳輸設備供電電壓是否過低,或者曾經(jīng)出現(xiàn)過瞬間電壓劇烈波動的情況。
3.1.4 接地問題
如果設備出現(xiàn)被雷擊或?qū)硬簧系膯栴},則檢查接地是否存在問題。 首先,檢查設備接地是否符合規(guī)范,是否有設備不共地的情況;同一個機房中各種設備的接地是否一致;其次,可通過儀表測量接地電阻值和工作地、保護地之間的電壓差是否在允許范圍內(nèi)。
首先,檢查各指示燈狀態(tài),若綠燈運行燈快閃每秒亮滅5 次,則反饋網(wǎng)管維護人員處理,讓其重下配置數(shù)據(jù);觀察線路板紅色告警燈情況,若某站線路板的紅燈亮,表示線路板沒有接收到光信號;檢查各站登錄是否正常,各站光接口板上是否有危急告警。若某站登錄不上,且該站相鄰站點光接口板上有R_LOS 等危急告警, 則可能是該站掉電或與該站相連的光纖或線路板故障。
其次,若光接口板上無告警,卻仍然登錄不上,則可能是由于上報信息量太大導致ECC 通道阻塞,這時可復位相鄰站主控單元,如果仍然無效,則通知設備維護人員檢查、更換本站和相鄰站的SCB 板和線路板來定位、排除故障。更換線路板和重新下發(fā)配置數(shù)據(jù),都會導致業(yè)務瞬間中斷,因此應選在業(yè)務量較少時進行,比如在夜晚進行。
再次,如果在前一步定位不了原因,則需要檢查業(yè)務中斷站點支路板上業(yè)務通道,查看是否有T_ALOS 告警。 若有T_ALOS 告警,則首先考慮是否是交換機故障或中繼電纜故障等設備外部問題。通知單站設備維護人員在DDF 架側(cè)或設備單板側(cè)作電口內(nèi)環(huán)回操作, 從網(wǎng)管上查看告警是否消失,以便定位故障原因是在傳輸設備內(nèi)部還是屬于設備外部問題。 若是外部問題,環(huán)回后告警應消失,查找、排除外部故障就可以解決問題;反之,環(huán)回后告警不會消失。
最后,如果從以上方法定位到問題出在傳輸設備內(nèi)部,按照下面一步進行處理,即逐段環(huán)回。 在業(yè)務中斷通道的一端網(wǎng)元掛表監(jiān)測業(yè)務的通斷。 沿業(yè)務方向?qū)Ω髡揪€路板逐段環(huán)回,觀察測試儀表上業(yè)務的通斷情況。 若環(huán)回后,儀表顯示業(yè)務正常,則說明該段線路沒有問題;若環(huán)回后,儀表仍顯示業(yè)務中斷,則說明該段線路有故障。
通過環(huán)回法定位出故障站點或兩站間的線路故障后,即可通過更換單板的方法進一步確定故障、排除故障。 線路環(huán)回應注意其對ECC通道的影響,不要因為環(huán)回業(yè)務而導致ECC 中斷,否則將不得不到中斷站點通過本地登錄的方式取消環(huán)回,這會大大延長排除故障所需的時間。
3.3.1 SDH 傳輸誤碼常用處理方法
1)告警性能分析法
誤碼越限告警及性能事件檢測位置與作用表
SDH 傳輸出現(xiàn)誤碼時業(yè)務還沒有中斷, 由于自環(huán)法對正常業(yè)務有影響,因此處理誤碼問題時,一般主要通過對誤碼性能事件的仔細分析,定位出故障點。 列出對分析誤碼問題非常重要的性能事件和告警事件。
2)替換法
對于設備器件性能不良或性能劣化的情況,在協(xié)助故障定位和檢驗故障定位準確性時通常使用替換法。其內(nèi)容包括替換光纖、光器件、單板等。
3)逐段環(huán)回法
如果條件允許,可使用環(huán)回法快速定位出故障站點。 使用環(huán)回法處理誤碼問題的步驟,與處理業(yè)務中斷問題相同,可參照操作。
3.3.2 SDH 傳輸誤碼故障處理步驟
第一步:分析線路板誤碼性能事件,排除線路誤碼。
首先排除外部的故障因素,如接地不好、工作溫度過高、線路板接收光功率過低或過高等問題;接著觀察線路板誤碼情況。 若某站所有線路板都有誤碼,則可能是該站時鐘單元問題,更換SCB 板;若只是某塊線路板報誤碼,則可能是本站線路板問題,也可能是對端站或光纖的問題。 定位出故障單板后,可通過更換單板解決。
若條件允許,可使用環(huán)回法定位故障。
第二步:分析支路誤碼性能事件,排除支路誤碼。
若只有支路誤碼, 則可能是本站交叉單元和支路板配合有問題。更換支路板和SCB 板進行故障點確認、排除故障。
[1]李子茜.SDH 光傳輸系統(tǒng)故障分析處理探討[J].信息通信,2011(4).
[2]薛曉燕.對SDH 傳輸維護中故障的定位及處理方法的探討[J].數(shù)字技術(shù)與應用,2011(11).
[3]李艷紅.試論SDH 傳輸維護中故障定位處理技術(shù)[J].中國新通信,2011(20).