黃宏棟,劉中健,詹鵬飛,孔鎮(zhèn)
(1 中國移動通信集團(tuán)廣東有限公司,廣州 510640;2 中國移動通信集團(tuán)公司,北京 100032)
邊緣節(jié)點(diǎn)定義為:子網(wǎng)路徑對接的參考點(diǎn)為邊緣節(jié)點(diǎn)。本文中的子網(wǎng)路徑限定為子網(wǎng)中一個邊界出口到另一個邊界出口的連接(如圖1)。具體到國際電路構(gòu)成中的子網(wǎng)路徑就存在封閉子網(wǎng)路徑、半開子網(wǎng)路徑以及全開子網(wǎng)路徑,所謂封閉子網(wǎng)路徑就是源目出口在同一個子網(wǎng)內(nèi)且能夠在現(xiàn)有網(wǎng)管中進(jìn)行管理,半開子網(wǎng)路徑僅部分能夠在自有網(wǎng)管中進(jìn)行管理(如離境系統(tǒng)),全開子網(wǎng)路徑也即黑匣子路徑,由第三方提供,無法在自有網(wǎng)管對其監(jiān)管。
圖1 子網(wǎng)路徑
基于上面的定義,邊緣節(jié)點(diǎn)根據(jù)電路的不同而不同,可以通過程序自動進(jìn)行判斷,如一般情況下半開子網(wǎng)路徑與封閉子網(wǎng)路徑的對接點(diǎn)為離境系統(tǒng)的邊緣節(jié)點(diǎn),封閉子網(wǎng)路徑與封閉子網(wǎng)路徑的對接點(diǎn)為兩個骨干網(wǎng)的邊緣節(jié)點(diǎn),全開子網(wǎng)路徑與封閉子網(wǎng)絡(luò)經(jīng)的對接點(diǎn)為骨干網(wǎng)與省干或其他租用電路的邊緣節(jié)點(diǎn)。
國際業(yè)務(wù)電路由各運(yùn)營商提供的域內(nèi)電路(下稱運(yùn)營商電路)級聯(lián)構(gòu)成,如一條香港—法蘭克福的電路由中國移動提供的以諸如香港—蒙古國x電路、俄羅斯電信電路以及其他運(yùn)營商提供的運(yùn)營商電路串接而成,最終形成一條從香港到法蘭克福的端到端的國際業(yè)務(wù)傳輸通道。運(yùn)營商電路是由運(yùn)營商或服務(wù)商提供的域內(nèi)電路,其定義為一序列子網(wǎng)路徑聚合組成(如圖2所示)。
路徑由A端出口、Z端出口以及路由組成,路由由直達(dá)通道和交叉連接組成(如圖3所示)。
段即通常所說的再生段和復(fù)用段,本文特指復(fù)用段。
圖2 電路與路徑示例
圖3 路徑
直達(dá)通道即兩個相鄰交叉矩陣之間的ODU通道,如波道為100 Gbit/s帶寬OTN的相鄰兩個OTU4終結(jié)點(diǎn)之間的ODU4通道(未經(jīng)解復(fù)用也未經(jīng)交叉連接)以及ODU4通道解復(fù)用出來的ODU2、ODU1、ODU0子通道(未經(jīng)解復(fù)用也未經(jīng)交叉連接)。
在對華為、中興和烽火OTN告警信號流進(jìn)行分析后總結(jié)得出:在單個子網(wǎng)路徑的情況下,本端支路側(cè)引入的告警,在子網(wǎng)路徑另一端支路側(cè)產(chǎn)生對告或直接下插到客戶設(shè)備,如圖4(1)中A站的client(支路)側(cè)接收到的R_LOS(信號丟失)、R_LOF(幀丟失)、MSAIS(復(fù)用段告警指示信號)在B站client(支路)側(cè)出現(xiàn)REM_SF(遠(yuǎn)端信號失效),相應(yīng)的在B站的客戶設(shè)備上呈現(xiàn)出R_LOF和MS-AIS告警,而A站的client側(cè)接收到誤碼則直接傳送到B站客戶設(shè)備。在子網(wǎng)路徑中間部分檢測到的通道級告警在本子網(wǎng)路徑末端的支路側(cè)不一定會有告警,而支路側(cè)對接的客戶設(shè)備會檢測到告警,通道級性能告警在下游客戶設(shè)備上的體現(xiàn)為檢測到誤碼,在圖4(1)中B站的WDM(波分)側(cè)收到的性能告警DEG(劣化)、EXC(超門限)在B站支路側(cè)沒有告警,但B站客戶設(shè)備上接收到信號誤碼,而B站的WDM(波分)側(cè)收到的通道級故障告警AIS(告警指示信號)、LOM(復(fù)幀丟失)、LOF(幀丟失)、OCI(開放連接指示,一般是缺少交叉連接造成)、LOS(信號丟失)以及LCK(維護(hù)鎖定)在B站支路側(cè)也沒有告警,但B站客戶設(shè)備上接收到R_LOF告警。
國際電路通常由多個子網(wǎng)路徑串聯(lián)組成,上游子網(wǎng)路徑的告警會影響下游子網(wǎng)路徑告警的呈現(xiàn),將電路按照上述模型切分成多條子網(wǎng)路徑進(jìn)行迭代分析。即將圖4(1)中的客戶設(shè)備替換為下游子網(wǎng)路徑進(jìn)行分析,如圖4(2)。從圖4(2)中可以看出,此時子網(wǎng)路徑2的B站支路側(cè)接收到從子網(wǎng)路徑1傳送過來的告警信號,然后子網(wǎng)路徑2按照上述規(guī)則將告警傳送到C站客戶設(shè)備或下游子網(wǎng)路徑的C站支路側(cè)。
根據(jù)上述分析結(jié)論,本算法的核心思想為:通過檢測支路側(cè)告警來定位根源故障所在的子網(wǎng)路徑,找到根源子網(wǎng)路徑后根據(jù)告警信號流確定具體的“段”位置,結(jié)合光層告警信號流關(guān)系,找到真正的故障源。
(1) 當(dāng)告警為OTU 級別以上的告警,設(shè)置該段子通道相關(guān)聯(lián)的電路的通道級級電路級告警予以忽略,進(jìn)行光層根源告警分析;
(2) 根據(jù)告警端口找到關(guān)聯(lián)電路,切分成多個串聯(lián)的子網(wǎng)路徑;
(3) 定位故障所在的子網(wǎng)路徑,具體分析見3.2;
(4) 定位根源告警所在的段;
(5) 分析光層故障(如果是光層故障)位置。
圖4 級聯(lián)子網(wǎng)路徑電路告警信號流迭代分析
路由中每段是否存在支路告警,支路端口關(guān)鍵告警如表1所示。本次研究的對象為國際電路,目前承載在OTN網(wǎng)絡(luò)上的國際專線主要以STM-64、10 GE WAN和10 GE LAN為主,因此本研究以這三大類特征研究為重點(diǎn),關(guān)注的也為常見告警:非OTN信號支路側(cè)信號以及子網(wǎng)通道級的OTUk層告警:OTUk_AIS、OTUk_LOM、OTUk_LOF、OTUk_TIM ODUk_PM_AIS和ODUk層告警:ODUk_PM_OCI、ODUk_PM_LCK、OTUk_DEG、ODUk_PM_DEG。
3.2.1 華為告警信號流規(guī)律總結(jié)
當(dāng)告警發(fā)生在中間通道時(子網(wǎng)路徑中間)時,在下游站支路側(cè)要么沒有告警,要么看不到告警(透傳到下游相鄰子網(wǎng)路徑或客戶設(shè)備),當(dāng)告警從本站支路側(cè)引入時,對端站支路側(cè)沒有告警或者包含告警REM_SF(遠(yuǎn)端信號失效)/REM_SD(遠(yuǎn)端信號劣化),故確定是否支路告警以A站支路側(cè)告警檢測為主,B站支路側(cè)告警用于確認(rèn)和復(fù)核,或在半開路徑中用于確認(rèn)是否為外部引起,如離境電路,可在境內(nèi)落地支路口觀測告警是否存在REM_SF或REM_SD。
表1 支路側(cè)關(guān)鍵告警
3.2.2 中興告警信號流規(guī)律總結(jié)
本站支路側(cè)引入的告警在對端站支路側(cè)體現(xiàn)為OPU_CSF或與本站支路側(cè)一樣,即復(fù)制了本站支路側(cè)告警(如RS_DEG、B1_SD、MS-AIS),如果告警為中間通道引入,在下游站支路側(cè)告警體現(xiàn)為包含ODU_AIS或沒有告警。因此在程序處理時,處理方法與華為區(qū)別不大。
3.2.3 烽火告警信號流規(guī)律總結(jié)
烽火本站支路側(cè)引入告警在末站支路側(cè)告警體現(xiàn)為Port_OPU2告警,且告警體現(xiàn)為FDI、RS_LOF、RS_SD、REM_FAULT;中間通道引入的告警體現(xiàn)為PORT_ODU2(性能類)和PORT_OPU2:PLM(故障類)且在相關(guān)的線路側(cè)有ODU級AIS告警,告警處理方法也與華為類似。
綜上,區(qū)分告警屬于本路徑內(nèi)還是其他路徑引入是可以程序?qū)崿F(xiàn)的,算法偽代碼如圖5。算法的思路為:
(1) 對電路組成中的每條子網(wǎng)路徑,確定子網(wǎng)設(shè)備的提供商,根據(jù)設(shè)備商設(shè)置入支路口特征告警、出支路口特征告警以及通道特征告警。
(2) 檢查子網(wǎng)路徑的類型,設(shè)置子網(wǎng)類型參數(shù)。
(3) 根據(jù)子網(wǎng)類型和特征告警定位根源告警所在的子網(wǎng)。
對封閉類型:如果入支路口有路徑特征告警或出支路口有路徑特征告警,則檢查上游子網(wǎng)路徑,如有通道特征告警或出支路口有通道故障特征告警,在本子網(wǎng)查找根源告警。
對半開類型:如果出支路口有路徑特征告警或前一段子網(wǎng)路徑的入支路口檢查到路徑特征告警,判斷為半開路徑另外一端的問題,如果有通道特征告警或出支路口有通道故障特征告警,在本子網(wǎng)查找根源告警。
圖5 算法偽代碼
對全開路徑,程序發(fā)出提示。
在確定根源告警所在的子網(wǎng)路徑后,就可以通過分析通道告警確定告警的根源位置。
展開本段子網(wǎng)路徑模型形成樹形結(jié)構(gòu),依次為子網(wǎng)路徑、低階ODU通道、高階ODU通道、OTU、OMS、OTS。
根據(jù)通道正向第一個主告警與反方向第一個BDI確定告警的所在的低階直達(dá)ODU通道。
依次往高階通道查找:正向第一個主告警與反方向第一個BDI確定告警的所在的該級直達(dá)ODU通道,直到?jīng)]有更高階的ODU或OTU告警或性能告警。
如果最后確定的告警位置為ODU層級,檢查是否OCI、LCK或TIM,如果是,提示檢查對應(yīng)的交叉連接、鎖定操作以及跟蹤設(shè)置,如果是其他通道告警,提示檢查其他如幀配置等并檢查是否存在硬件故障。
如果前述步驟確定的告警位置為OTU層級,按照OTU→OMS→OTS依次檢查告警或性能。
如果最后確定的告警位置為OTU層級,則建議檢查單波性能和故障,單波性能可通過程序比較性能基線(參考值),看是否存在變動,如性能無變化,提升檢查是否為硬件問題(如OTU4_LOF可能因為NS4板隱性故障引起)。
如最后確定的告警位于OTS段,則檢查是否光纜中斷或性能劣化,性能檢查通過比較基線數(shù)據(jù)(參考值)或比較變動值發(fā)現(xiàn)。
國際傳輸專線組網(wǎng)具有其獨(dú)有的特性,基于其特性,本文定義了便于機(jī)器判斷的邊緣節(jié)點(diǎn)、電路、路徑以及段和直達(dá)通道,在這些基本定義的基礎(chǔ)上,通過迭代分析告警信號流傳遞的規(guī)律,總結(jié)從電路層到路徑層、通道層,然后到光層,依次分析告警或故障的根源因素,給出了機(jī)器可實現(xiàn)的故障定位算法。
[1] 凌海燕,劉志增,王毅,等. 國際傳輸系統(tǒng)的保護(hù)策略與應(yīng)用[J]. 數(shù)字通信世界, 2013(10):60-62.
[2] 劉新宇. 國際SDH傳輸系統(tǒng)的設(shè)計規(guī)劃與網(wǎng)絡(luò)保護(hù)模式的探討[D].北京:北京郵電大學(xué),2010.
[3] 葉胤. 國際傳輸網(wǎng)絡(luò)組網(wǎng)方案探討[J]. 電信工程技術(shù)與標(biāo)準(zhǔn)化, 2008,21(5):47-50.
[4] 沈青,孟凡,王瑋,等. 超高速、超長距傳輸系統(tǒng)性能分析[J].電信工程技術(shù)與標(biāo)準(zhǔn)化, 2017,30(7):78-81.