秦 偉
(山西廣播電視無線管理中心,山西 太原 030000)
目前,微波中繼是傳輸廣播電視信號的一種主要的方式。在微波電路中,經常出現各種各樣的故障導致信號傳輸受到影響,作為數字微波電路的維護管理人員,不僅要在故障發(fā)生時沉著冷靜地進行正確處置,還應當將已經出現過的各類故障總結記錄,以便再次遇到相似故障時能夠快速準確地處理,為確保微波電路的安全可靠運行提供強有力的技術保障。
目前,對于數字微波電路的維護管理工作主要依靠網管軟件,對于網管站來說,網管軟件的功能是必須了解和掌握的,因此在介紹故障案例分析之前,對網管軟件進行介紹是很有必要的。由于山西省內微波干線大多使用的是NEC設備,所采用的軟件是其開發(fā)的PNMTj(PASOLINK NETWORK MANAGEMENT TERMINAL java version)軟件。通過該軟件,可以方便地實現設備配置、測試及日常維護工作。它具有如下功能:通過圖形界面顯示各工作模塊的工作狀態(tài);可以和同一網絡中的其他網元進行通信;可以收集本站和遠端各站點的設備運行情況和告警信息;可以控制管理本站設備和遠端設備;可以分集接入,根據預先定義的級別給使用者分配不同的使用權限;可以對設備上發(fā)生過的歷史事件及歷史告警進行記錄和保存;可以對設備的運行性能進行存儲,以便使用者分析設備長期運行情況;可以設置設備的功能模塊及運行參數;可以對本站設備和遠端設備進行軟件升級;可以對本站及遠端設備完成基本的性能測試。
通過使用PNMTj軟件可以對微波網元(站點)的收發(fā)信電平進行監(jiān)視,還可以對當前或者以往的告警進行顯示和查詢,通過顯示的告警類型及描述,可以快速的定位故障點,為排查故障提供技術支持和依據。它還可以把電平的變化通過圖表的形式直觀地顯示出來,可以從圖表中明顯地看到電平急速變化的時間,因為電平的高低直接關系到整個微波設備的性能,所以電平是我們在維護中最關心的一個指標,可對整個站工作性能有一個較好的反映。還可以通過軟件看到站點的誤碼情況,可以細分到一天內的15分鐘。誤碼率是數字微波電路另一個重要的性能指標,通過誤碼率和電平的結合判斷,可以對臺站周圍的電磁環(huán)境是否存在干擾以及衰落的情況進行判斷。
通過使用PNMTj軟件可以對微波網元(站點)的的工作日志進行記錄,工作日志里面包含了出現過的告警類型,采取的維護操作等相關信息,是維護工作人員判斷故障,分析電路狀況的一種有效的技術手段,同時也是判斷故障,對故障進行定性的依據。
(1)案例一。故障現象:某日,微波網管顯示如下:霍山站對汾陽站方向SYS2的DC-DC CONV(電源盤)黑色,SYS1 TRP盤(系統(tǒng)1的收發(fā)信單元盤)黑色,霍山站系統(tǒng)2業(yè)務中斷,從網管終端上也打不開故障單元盤的下一級菜單,且收發(fā)信測量值為***。
判斷:收發(fā)信測量值為***,表示測不到收發(fā)信的值,可能的原因是收發(fā)信采樣電路故障或者收發(fā)信單元盤出現故障,且同時電源盤也故障,因為收發(fā)信單元盤的供電是由電源盤提供的,所以判斷為電源盤及其控制電路故障,讓霍山站檢查電源盤,發(fā)現為電源盤空開熱敏電阻損壞,導致無法合上空開,致使電源盤無法上電,從而導致收發(fā)信單元盤掉電。
處置:更換備用或者別的系統(tǒng)不用的電源盤空開,故障解決。
(2)案例二。故障現象:某日某時,428站反映山西衛(wèi)視信號中斷。
故障分析:通過查看網管歷史告警,428C-Node顯示端口號為100BT_LAN_PORT2 LINK DOWN告警,此告警影響本地監(jiān)視信號。LINK DOWN告警顯示為設備掉線,可能的原因是解碼器死機或者掉電,也有可能是解碼器與C-Node網線接觸不良導致。
解決辦法:汾陽方向重啟山西衛(wèi)視解碼器,重新拔插C-Node設備山西衛(wèi)視等IP信號的網線或者更換一根新的網線,故障解決。
改革開放40年來,黨的知識分子政策不斷完善,極大地調動了廣大知識分子的積極性,激發(fā)了他們的創(chuàng)造力??疾旎仡?0年來黨的知識分子政策的演進,從中可以得出以下幾條基本經驗:
(3)案例三。故障現象:某日某時,廟前山站對汾陽方向5000S設備CTRL盤、MODEM盤(SYS1、SYS2)、150M接口盤(SYS2)全部變成紅色,顯示出現高低誤碼等告警,收發(fā)信單元盤正常,且收信電平為-50 dBm左右,在正常范圍值之內。此現象出現多次,汾陽及下游臺站反映IP電視信號出現中斷,最長一次為30 s左右。
故障分析:由于兩站的收發(fā)信電平處于正常范圍之內,但出現高低誤碼等告警,因此排除天饋線故障的原因,是外界干擾造成的可能性比較大,于是與廟前山站聯系,反饋太原市電視臺正在廟前山站調整其對壽陽方向45 M小微波的室外天線,此45 M小微波天線與廟前山站對汾陽方向大微波天線位置很近,且天線的方向一致,而且這路小微波的頻率也是L8 GHz,和廟前山站對汾陽方向的頻率相近,因此懷疑是其干擾造成的。
解決辦法:讓廟前山站關閉太原市臺對壽陽方向小微波,此現象不再發(fā)生,因此判斷上述故障是由于干擾造成,建議太原市臺將其小微波的天線進行調整。
(4)案例四。故障現象:臨汾對霍山方向在一段時間內天氣等電磁環(huán)境良好,但收信電平逐步下降,發(fā)信電平值在30 dBm,收信電平穩(wěn)定為-56 dBm,衰落儲備不足,而霍山對臨汾方向發(fā)信電平為26 dBm,收信為-50 dBm。
故障分析:造成上述故障現象的原因可能是饋線進水或者天線稍有偏移,如果天線進水,晚上氣溫低,水汽在饋線處凝結,對收信電平造成明顯影響,日出后,水汽消散,電平又恢復到正常值,因此日出前與日出后的電平值應該有明顯地變化,但臨汾對霍山站早晚電平值無明顯變化,因此天線出現偏移的可能性較大。
解決辦法:讓技術人員上塔進行檢查,發(fā)現臨汾對霍山方向的天線固定螺絲松動,導致天線下沉,造成收信電平下降。重新緊固螺絲后,故障解決。
(5)案例五。故障現象:某日某時,從428(汾陽)方向往南各站收發(fā)信電平均正常,視頻IP業(yè)務出現卡頓、馬賽克等現象,但廣播業(yè)務正常。
故障分析:因為收發(fā)信電平正常,且廣播業(yè)務正常,因此判斷微波電路是正常的,但視頻IP業(yè)務卻出現卡頓,因為IP是雙向的,廣播走的是2M時隙,是單向的,因此判斷是反向網絡擁塞導致視頻業(yè)務中斷。
解決辦法:328(霍山站)是428(汾陽)往南方向的下一站,拔掉428對328方向反向155接口連線,428業(yè)務恢復正常,因此將擁塞點定位在328及其下游臺站。328是樞紐站,其下游臺站還有臨汾、老頂山、稷王山、木孤臺、伊侯山等站,從EMS網管終端上將WAN2(電視業(yè)務)端口對每個站點依次禁止。在將伊侯山禁止掉后,328及其他各站電視業(yè)務恢復正常。因此故障點定位在伊侯山。因伊侯山站將晉城傳送來的電視等IP業(yè)務通過微波反向通道傳送給大尖山發(fā)射站進行發(fā)射,其瞬時的流量超過了端口所設計的流量,導致網絡擁塞。首先將伊侯山站反向傳輸的端口禁止掉,先保證正向主要業(yè)務正常,然后對伊侯山C-Node設備的端口進行限流等配置后,故障解決。
故障分析:七峰山對大同方向SY2高誤碼,且收信電平值明顯偏低,而系統(tǒng)1正常,因此懷疑是SY2的TRP單元模塊出現故障。
解決辦法:重啟七峰山對大同方向TRP單元模塊,故障未消除,更換TRP單元模塊后,故障消除。
(7)案例七。故障現象:某日某時,石嶺關對1125方向3000S設備系統(tǒng)3的TRP顯示UNEQUIPPED告警,其所傳輸業(yè)務倒換至備用波道。
故障分析:UNEQUIPPED告警意為設備沒有裝備,也就是未加電或者沒有裝此模塊。通過現場技術人員觀察發(fā)現DC-DC模塊也就是供電模塊正常,所以判斷為TRP收發(fā)信單元模塊故障。
解決辦法:更換TRP模塊后,故障消除。
(8)案例八。故障現象:某日某時,霍山對老頂山方向5000S設備的3個系統(tǒng)主天線收信電平為-60 dBm,分集天線收信電平為-51 dBm,相差為10 dB。
故障分析:因分集天線收信電平正常,主天線收信電平明顯低,因此判斷主天饋系統(tǒng)故障。
解決辦法:霍山站維護人員檢查天饋系統(tǒng),發(fā)現主天線被大風吹偏,恢復至原位置后,主天線電平恢復正常。
數字微波電路是一個整體,某站出現的故障也不一定就是本站的原因造成的,如案例五,428站及下游臺站出現山西衛(wèi)視等IP業(yè)務中斷,它的故障點就在伊侯山站,離428臺很遠,因此在處置故障的過程中,應有整體的概念,從整體考慮,從全局出發(fā)。而且故障現象相似也不一定是相同的原因,應相同故障不同對待,避免出現經驗主義,如案例一和案例七,它的故障現象都是收信電平無顯示,但故障一是由于電源盤空開故障,而案例七是由于收發(fā)信單元盤故障導致。因此既要有全局的觀念,又要有局部的思維[2]。
數字微波電路故障的判斷需要依靠網管與故障臺站共同進行判斷,而故障最終的判定在網管站,這就對網管站的值守人員提出了高的要求,需要高度的責任心和長期積累的經驗。但更重要的是需要較強的責任心,每當收發(fā)信電平值與往常相比有較大幅度的變化時,就需要及時通知故障臺站,進行分析,是天氣的原因還是天饋系統(tǒng)或者別的故障導致。如有一次,某站的3000S設備某一個系統(tǒng)因惡劣天氣造成高誤碼導致切換至備用系統(tǒng),而當天氣好轉后,沒有切換回主用系統(tǒng),而值班員在抄表時,發(fā)現出現發(fā)生倒換的次要告警,而沒有引起警覺,使得某系統(tǒng)的業(yè)務一直在備用系統(tǒng)進行傳送,假設此時另外一個主用系統(tǒng)發(fā)生故障,將無法倒換至備用系統(tǒng)造成停傳的安全播出事故。正確的處置方法是:當發(fā)現一直占用備用保護系統(tǒng)時,此時天氣已經好轉,造成切換的原因已經恢復正常,及時應將備用系統(tǒng)切換至主用系統(tǒng),避免發(fā)生別的主用系統(tǒng)發(fā)生故障而沒有備用系統(tǒng)進行切換的故障發(fā)生。
因為微波傳輸電路的電磁環(huán)境以及設備老化等原因,微波電路的故障也具有多樣性的特點,故障現象表現相同,但造成故障的原因不一定相同,這就需要進行仔細的甄別判斷分析,而且每次發(fā)生故障處理完成后,都應該形成報告進行總結分析,將故障的現象、故障的分析、故障的判斷以及故障的處理進行詳細的描述,并通過召開專題會議的形式將故障處理的過程及時進行總結,達到廣而告之的目的,使得每名值班人員應知應會,使得下次遇到類似情況時有參考依據。這不是說可以照本宣科,應當從中吸取處理故障的思路,而不是生搬硬套處理的措施。而且臺站也應當制定故障處置的流程,將故障的處置流程進行細化,將每個人的責任和權力進行分配,避免出現故障時手足無措,一個好的故障處置流程能夠極大地縮短停傳時間,縮短故障點的定位時間,可以在遇到故障時能夠有效地應對,再者還應當進行適當的演練,演練可以幫助維護人員熟悉操作方法,熟練處置流程,在條件允許的情況下,可以仿真故障,逼近真實環(huán)境,便于維護人員消除恐懼心理,有序地采取正確的處置手段。因此對于微波臺站來說,在認真做好值守的同時還應當未雨綢繆,做好設備的維護管理工作,備齊備品備件,做好應急預案,并定期組織進行演練,此外還應當組織業(yè)務骨干進行學習培訓,不斷提高設備的維護管理水平和能力。
因為基層臺站沒由網管軟件,所以一旦微波電路出現故障,應第一時間與網管站聯系,依靠網管軟件,逐層一級級地進行排查,服從網管站的統(tǒng)一調配指揮,查到到故障點后,應首先恢復信號的傳輸,再做故障處理。
總之,故障的處理需要上下游臺站之間的相互配合,需要技術維護人員高度的責任心和大量的實踐工作經驗的積累。