唐 思
?
傳輸設備的故障處理思路與方法
唐 思
沈陽鐵路局沈陽通信段網(wǎng)管中心,遼寧 沈陽 110001
眾所周知,SDH技術之所以得到廣泛的應用,除了它具有靈活的分插復用能力和強大的自愈保護功能外,還緣于其強大的網(wǎng)管能力。而SDH技術在鐵路通信中作為最基本的傳輸系統(tǒng),起著至關重要的作用,所以在日常維護中需要掌握更多的故障處理思路和方法。由于產(chǎn)生故障的因素眾多、定位復雜,往往是維護工作的難點。基于此,論述了傳輸設備日常故障產(chǎn)生的原因及基本定位思路和測試方法。
SDH技術;故障原因;故障定位方法
傳輸設備經(jīng)過工程安裝人員的安裝和調試后,都能正常穩(wěn)定地運行。但有時由于多方面的原因,比如受系統(tǒng)外部環(huán)境的影響、部分元器件的老化、損壞、維護過程中的誤操作等,都可能導致設備進入不正常的狀態(tài)。此時,就需要維護人員對設備故障進行正確分析、定位和排除,使系統(tǒng)迅速恢復正常。
1.1 故障定位的基本思路
1.1.1 工程問題
工程問題是指由于工程施工不規(guī)范、工程質量差等原因造成的設備故障。此類問題有的在工程施工期間就能暴露出來,有的可能在設備運行一段時間或某些外因作用下,才暴露出來,為設備的穩(wěn)定運行埋下隱患。因此,嚴格按工程規(guī)范施工安裝,認真細致的按規(guī)范要求進行單點和全網(wǎng)的調試和測試,是阻止此類問題出現(xiàn)的有效手段[1]。
1.1.2 外部原因
外部原因主要包括:供電電源故障,如設備掉電、供電電壓過低等;交換機故障;光纖故障,如光纖性能劣化、損耗過高,或光纖損斷,光纖接頭接觸不良;中繼電纜脫落、損壞或接觸不良;設備接地不良;設備周圍環(huán)境劣化等。
1.1.3 操作不當
此類問題一般都是因為維護人員對設備了解不夠深入所導致,也是在維護工作中最容易出現(xiàn)的情況。
對設備的一些細節(jié)性的性能特點及注意事項,對新老設備的一些特點和差別以及新舊版本的一些特點和差別不是非常清楚的情況下,就冒然開通,往往就會產(chǎn)生一些問題。
此類問題一般在現(xiàn)場改網(wǎng),擴容,新老設備混用,新老版本混用,升級,使用新版本的備板,使用一些未經(jīng)系統(tǒng)聯(lián)調的板件的情況下易出現(xiàn)[2]。
1.1.4 設備對接問題
傳輸設備傳送業(yè)務種類的繁多造成對接設備的復雜,同時,各種業(yè)務對傳輸通道的性能要求也不完全相同,所以在實際使用中有時會存在對接問題。主要表現(xiàn)在線纜連接錯誤;設備接地問題;傳輸、交換網(wǎng)絡之間時鐘同步問題;SDH幀結構中開銷字節(jié)的定義不同等。
1.1.5 設備原因
主要包括設備自然損壞或板件的配合問題。一般在設備運行較長時間后,板件因老化出現(xiàn)的自然損壞。其特點是:設備已使用較長時間,在故障之前設備基本正常,故障只是在個別點、個別板件出現(xiàn),或在一些外因作用下出現(xiàn)[3]。
1.2 故障定位的常見方法
1.2.1 觀察分析法
當系統(tǒng)發(fā)生故障時,在設備和網(wǎng)管上將出現(xiàn)相應的告警信息。通過觀察設備上的告警燈運行情況,可以及時發(fā)現(xiàn)故障;故障發(fā)生時,網(wǎng)管上會記錄非常豐富的告警事件和性能數(shù)據(jù)信息,通過分析這些信息,并結合SDH幀結構中的開銷字節(jié)和SDH告警原理機制,可以初步判斷故障類型和故障點的位置。
通過網(wǎng)管采集告警和性能信息時,必須保證網(wǎng)絡中各網(wǎng)元的當前運行時間設置和網(wǎng)管的時間一致。如果時間設置上有偏差會導致對網(wǎng)元告警、性能信息采集的錯誤和不及時[4]。
1.2.2 測試法
通過觀察分析法不能解決的問題,如組網(wǎng)、業(yè)務以及故障信息相當復雜的情況和無明顯告警和性能信息上報的特殊故障情況。可以利用網(wǎng)管提供的維護功能進行測試,判斷故障點和故障類型。下面以環(huán)回為例進行說明。
環(huán)回操作是定位故障點最有效和常用的方法,要求維護人員熟練掌握。環(huán)回不需要對告警和性能做太深入的分析[5]。
進行環(huán)回操作前,首先必須確定需要環(huán)回的通道、時隙,環(huán)回的單板,環(huán)回的方向。對于同時出問題的業(yè)務,一般都具有一定的相關性,因此對環(huán)回通道進行選擇時應該堅持從多個有故障的網(wǎng)元中選擇一個網(wǎng)元,從所選擇網(wǎng)元的多個有故障的業(yè)務通道中選擇一個業(yè)務通道,對所選擇的業(yè)務通道逐個方向分析的原則[6]。
進行環(huán)回操作時,先將故障業(yè)務通道的業(yè)務流程進行分解,畫出業(yè)務路由圖,將業(yè)務的源和宿,經(jīng)過的網(wǎng)元,所占用的通道和時隙號羅列出來。然后逐段環(huán)回,定位故障網(wǎng)元。故障定位到網(wǎng)元后通過線路側和支路側環(huán)回基本定位出可能存在故障的單板。最后結合其他處理辦法,確認故障單板予以更換排除故障[7]。
1.2.3 拔插法
對最初發(fā)現(xiàn)某種電路板故障時,可以通過插拔一下電路板和外部接口插頭的方法,排除因接觸不良或處理機異常的故障。在插拔過程中,應嚴格遵循單板插拔的操作規(guī)范。插拔單板時,若不按規(guī)范執(zhí)行,還可能導致板件損壞等其他問題的發(fā)生。
1.2.4 替換法
當用拔插法不能解決故障時,可以考慮替換法。替換法就是使用一個工作正常的物件去替換一個被懷疑工作不正常的物件,從而達到定位故障、排除故障的目的。這里的物件,可以是一段線纜、一塊單板或一個設備。
替換法適用于排除傳輸外部設備的問題,如光纖、中繼電纜、交換機、供電設備等;或故障定位到單站后,用于排除單站內單板的問題。如某站光板有告警,我們懷疑收發(fā)光纖接反了,則可將收、發(fā)兩根光纖互換。若互換后,光板告警消失,就說明確實光纖接反。
如支路板某個2 M有“CV性能超值”或者“2 M信號丟失”的告警,我們懷疑是交換機或中繼線的問題,則可與其他正常通道互換一下。若互換后告警發(fā)生了轉移,則說明是外部中繼電纜或交換機的問題,若互換后故障現(xiàn)象不變,則可能是傳輸?shù)膯栴}。
替換法的優(yōu)點在于方法簡單,對維護人員要求不高,是比較實用的方法,但對備件有要求[8]。
1.2.5 配置數(shù)據(jù)分析法
在某些特殊情況下,如外界環(huán)境的突然改變,或由于誤操作,可能會導致設備的配置數(shù)據(jù)遭到破壞或改變,導致業(yè)務中斷等故障的發(fā)生。此時,故障定位到網(wǎng)元單站后,可通過查詢、分析設備當前的配置數(shù)據(jù);對于網(wǎng)管誤操作,還可以通過查看網(wǎng)管的用戶操作日志來進行確認。
顯然,“配置數(shù)據(jù)分析法”也適用于故障定位到網(wǎng)元后,故障的進一步分析,該方法可以查清真正的故障原因[9]。
1.2.6 更改配置法
更改配置法更改的配置內容可以包括時隙配置、板位配置、單板參數(shù)配置等。因此更改配置法適用于故障定位到單個站點后,排除由于配置錯誤導致的故障。更改配置法最典型的應用是排除指針問題。
如懷疑支路板的某些通道或某一塊支路板有問題,可以更改時隙配置將業(yè)務下到另外的通道或另一塊支路板,若懷疑某個槽位有問題,可通過更改板位配置進行排除;若懷疑某一個VC4有問題可以將時隙調整到另一個VC4。
在升級擴容改造中,若懷疑新的配置有錯,可以重新下發(fā)原配置以定位是否是配置問題。
當通過更改時隙配置不能將故障確切地定位到是哪塊單板的問題(線路板、交叉板、支路板、還是后背板問題)時,需進一步通過替換法進行故障定位。因此該方法適用于沒有備板的情況下,初步定位故障類型,并使用其他業(yè)務通道或板位暫時恢復業(yè)務。應用更改配置法在定位指針調整問題時,可以通過更改時鐘的抽取方向以及時鐘源進行定位。
1.2.7 儀表測試法
儀表測試法一般用于排除傳輸設備外部問題以及與其他設備的對接問題。如懷疑電源供電電壓過高或過低,可以用萬用表進行測試;若懷疑傳輸設備與其他設備無法對接是由于接地造成,則可用萬用表測量對接通道發(fā)端和收端的同軸端口屏蔽層之間的電壓值,若電壓值超過500mV,則可認為接地有問題,若懷疑無法對接是由于信號不對,則可通過相應的分析儀表觀察幀信號是否正常,開銷字節(jié)是否正常,是否有異常告警等[10]。
1.2.8 經(jīng)驗處理法
在一些特殊的情況下,如由于瞬間供電異常,低壓或外部強烈的電磁干擾,致使傳輸設備某些單板進入異常工作狀態(tài)。此時的故障現(xiàn)象,如業(yè)務中斷、ECC通信中斷等,可能伴隨相應的告警,也可能沒有任何告警,檢查各單板的配置數(shù)據(jù)可能也是完全正常的。經(jīng)驗證明,在這種情況下,通過復位單板,網(wǎng)元掉電重啟。
重新下發(fā)配置或將業(yè)務倒換到備用通道等手段,可有效地及時排除故障、恢復業(yè)務。
1.3 排除故障的一般思路
機房維護人員維護工作中,不免會遇見設備出現(xiàn)故障,在處理故障時,應該遵循“一查看、二詢問、三思考、四動手”的基本原則。
1.3.1 查看
首先到達現(xiàn)場后查看出現(xiàn)故障的現(xiàn)象,即查看設備的哪一部分出現(xiàn)故障,有何種告警產(chǎn)生,嚴重程度如何,造成多大危害等,才能透過現(xiàn)象看本質。
1.3.2 詢問
觀察完現(xiàn)象后,應詢問各階段現(xiàn)場人員,是何種原因造成了此故障,比如是否有人修改了數(shù)據(jù)、刪除了文件、更換了電路板、停電或雷擊、誤操作等。
1.3.3 思考
問明情況后,透過現(xiàn)象、原因等,根據(jù)自己的知 識作思考、分析,判斷何種原因可能引起該種故障等,作出較為正確的判斷。
1.3.4 動手
根據(jù)前面三個步驟找出故障點,通過修改數(shù)據(jù)、更換電路板及芯片等手段解決、排除故障。
因傳輸設備產(chǎn)生故障的原因眾多,在實際的處理過程中,我們應結合具體情況具體分析。靈活采用多種處理方法及時有效地進行處理,避免系統(tǒng)性能劣化對整個設備造成損傷,從而影響重要業(yè)務。SDH系統(tǒng)作為骨干傳送網(wǎng),是數(shù)據(jù)網(wǎng)、核心網(wǎng)、無線G網(wǎng)等所有業(yè)務網(wǎng)的安全運行基礎,保障其穩(wěn)定運行是運維管理工作的重點。首先分析定位人員須熟悉網(wǎng)絡、掌握SDH系統(tǒng)相關知識,能有序指導相關部門展開定位分析。其次,設備運行環(huán)境不達標會影響系統(tǒng)的穩(wěn)定性,機房溫度、濕度和清潔度需努力整治實現(xiàn)標準化。
[1]云利峰.淺析大唐光傳輸設備常見故障及處理方法[J].內蒙古科技與經(jīng)濟,2016(7):155-159.
[2]呂卓瓊,冷秀敏,欒洋.淺談傳輸網(wǎng)絡及設備的故障定位處理方法[J].科技視界,2015(25):273.
[3]李艷紅.試論SDH傳輸維護中故障定位處理技術[J].中國新通信,2011(20):88-89.
[4]肖瀟,唐艷冰.電力通信系統(tǒng)維護中幾例故障分析與處理[J].中國高新技術企業(yè),2010(15):126-127.
[5]沈劍.SDH同步傳輸系統(tǒng)的故障處理方法[J].電信技術,2001(1):40-41.
[6]郝文娟.SDH系統(tǒng)故障定位及主要故障處理探討[J].硅谷,2014(24):49-50.
[7]張宗亮.SDH設備故障的定位與方法[J].中國電子商情:科技創(chuàng)新,2014(3):117.
[8]李艷紅.SDH傳送網(wǎng)中通道保護倒換問題分析[J].信息通信,2011(5):164-165.
[9]劉欣,葉敏.SDH傳輸網(wǎng)絡故障分析與處理方法[J].科研,2016(5):00047.
[10]王銘.芻議SDH傳輸維護中故障定位以及處理技術[J].華東科技:學術版,2015(12):29.
Troubleshooting ideas and methods of the transmission equipment
Tang Si
Shenyang Railway Administration Center of Shenyang Railway Administration, Liaoning Shenyang 110001
It is well known that SDH technology reason to be widely used, except it has a flexible points in multiplexing capability and strong self-healing protection function, but also due to its strong management capabilities. And SDH technology in railway communication do for the most basic transmission system, plays a vital role, so in the daily maintenance of the need to master more troubleshooting ideas and methods. Because of the many factors that produce fault, the location is complex, it is often difficult to maintain the work. This paper discusses the causes of the daily failure of transmission equipment and the basic orientation and testing methods.
SDH technology; fault reason; fault location method
TN929.11
A
1009-6434(2016)08-0105-03