許文淵
(中國鐵路上海局集團有限公司上海通信段,上海 200434)
SDH網(wǎng)協(xié)議路數(shù)SDH網(wǎng)絡(luò)中的嵌入控制信道(Embedded Control Channel,ECC)是傳送操作、管理和維護(OAMP)信息的邏輯信道。隨著鐵路各類業(yè)務(wù)需求的高速增長、不同鐵路線路的業(yè)務(wù)互聯(lián)互通,作為承載網(wǎng)的傳輸網(wǎng)網(wǎng)元數(shù)已經(jīng)高達(dá)400~500個,SDH網(wǎng)絡(luò)的ECC需要管理的網(wǎng)元越來越多,極易導(dǎo)致巨型ECC網(wǎng)絡(luò)問題影響傳輸系統(tǒng)穩(wěn)定性和業(yè)務(wù)的安全性。通過研究分析ECC原理、巨型ECC網(wǎng)絡(luò)對傳輸網(wǎng)絡(luò)造成的影響,提出巨型ECC網(wǎng)絡(luò)分割方法來解決ECC網(wǎng)絡(luò)風(fēng)暴的問題。
SDH網(wǎng)絡(luò)的操作維護管理(Operation Administration and Maintenance,OAM)功能具有高度自動化水平,能根據(jù)用戶需求利用網(wǎng)管終端完成對管理網(wǎng)元的命令下發(fā)及數(shù)據(jù)查詢工作,完成準(zhǔn)同步數(shù)字體系(PDH)系統(tǒng)所無法完成的業(yè)務(wù)實時調(diào)配、告警故障定位、性能在線測試等功能。鐵路SDH傳輸系統(tǒng)常見的網(wǎng)元管理組網(wǎng)示意如圖1所示。當(dāng)SDH傳輸網(wǎng)管在對網(wǎng)元進行維護時,至少需一個網(wǎng)關(guān)網(wǎng)元(GNE1)與網(wǎng)管服務(wù)器進行通信(網(wǎng)線直連,通過TCP/IP協(xié)議),非網(wǎng)關(guān)網(wǎng)元(NE2-NE4)通過ECC與網(wǎng)關(guān)網(wǎng)元連接,進而實現(xiàn)與網(wǎng)管間的數(shù)據(jù)信息傳輸,從而實現(xiàn)網(wǎng)管對整個網(wǎng)絡(luò)的OAM。
圖1 網(wǎng)管、網(wǎng)關(guān)網(wǎng)元、網(wǎng)元通信關(guān)系管理組網(wǎng)Fig.1 Network management, gateway network element,network element communication relationship management networking
在鐵路傳輸系統(tǒng)中存在大量的區(qū)間點對點業(yè)務(wù),主要為信號CTC、供電SCADA、FAS、應(yīng)急、防災(zāi)等業(yè)務(wù)。目前客專線傳輸系統(tǒng)主流保護方式為二纖雙向復(fù)用段保護環(huán),它不僅最適用于上述分散型業(yè)務(wù)組網(wǎng),同時能有效提高傳輸系統(tǒng)通道利用率、節(jié)約投資,如圖2所示。
圖2 某客專線傳輸系統(tǒng)組網(wǎng)示意圖Fig.2 Schematic diagram of transmission system networking of a passenger dedicated line
1)隨著鐵路傳輸網(wǎng)網(wǎng)絡(luò)規(guī)模的不斷擴大,一個傳輸網(wǎng)絡(luò)內(nèi)ECC互通的傳輸網(wǎng)元數(shù)量多達(dá)400~500多個,隨著更多的網(wǎng)元入網(wǎng),傳輸設(shè)備支持的DCC路數(shù)越來越多,如華為公司的OSN7500可支持達(dá)到160路DCC路數(shù)。無論網(wǎng)絡(luò)多大,ECC都能互通,通過ECC可以支持對更多網(wǎng)元的管理。當(dāng)網(wǎng)關(guān)網(wǎng)元ECC互聯(lián)網(wǎng)超過一定數(shù)量的子網(wǎng)(為保證ECC網(wǎng)絡(luò)的正常性能,通常建議單個ECC子網(wǎng)的網(wǎng)元數(shù)量需不高于50個,保證基本可用需不高于64個),就可以稱為巨型ECC網(wǎng)絡(luò)。
2)由于管理DCN本質(zhì)上是個星形網(wǎng)絡(luò),其帶內(nèi)帶寬最大為768 kbit/s,且不可擴展。當(dāng)某個傳輸系統(tǒng)網(wǎng)元規(guī)模過于龐大,此時網(wǎng)絡(luò)管理DCN的拓?fù)湟矔鄳?yīng)變大,對網(wǎng)絡(luò)的路由計算速度會造成較大影響;同時,因網(wǎng)絡(luò)的變化造成路由廣播信息不停的在全網(wǎng)范圍內(nèi)廣播,使得路由不斷重算,再加上網(wǎng)絡(luò)中每個網(wǎng)元的路由表收斂時間差距,就影響了管理DCN拓?fù)涞姆€(wěn)定性,而且因組網(wǎng)規(guī)模過大,在網(wǎng)絡(luò)故障時因傳輸距離、告警數(shù)量導(dǎo)致管理DCN數(shù)據(jù)流量擴大,進而造成網(wǎng)絡(luò)擁塞。由于在DCN網(wǎng)絡(luò)中傳送的數(shù)據(jù)包是有生命期的(缺省為63),當(dāng)該網(wǎng)絡(luò)路由因故發(fā)生變化時,數(shù)據(jù)包在傳送過程中有可能造成傳輸路徑不斷變化,如由較多網(wǎng)元組成的傳輸環(huán)或鏈型網(wǎng)絡(luò)一旦出現(xiàn)斷纖,相關(guān)數(shù)據(jù)包極有可能因經(jīng)過較長路由使得在達(dá)到目標(biāo)網(wǎng)元前出現(xiàn)丟失。在一個大型網(wǎng)絡(luò)某個網(wǎng)元脫網(wǎng)的路由信息廣播到整個網(wǎng)絡(luò)需經(jīng)過一定時間,但當(dāng)信息傳達(dá)到整個網(wǎng)絡(luò)時,可能該脫網(wǎng)網(wǎng)元又恢復(fù)可達(dá)或者該網(wǎng)絡(luò)其他網(wǎng)元又脫網(wǎng)了,進而造成整個網(wǎng)絡(luò)不停振蕩。
巨型ECC網(wǎng)絡(luò)易導(dǎo)致主機異常復(fù)位。網(wǎng)元主控板的內(nèi)存容量是固定的,當(dāng)網(wǎng)絡(luò)中的網(wǎng)元過多時,ECC網(wǎng)絡(luò)路由表的數(shù)據(jù)流量依然很大,當(dāng)網(wǎng)絡(luò)發(fā)生任何變動時,會導(dǎo)致主控板的短期內(nèi)接收到的待處理網(wǎng)絡(luò)信息達(dá)到峰值,嚴(yán)重時會造成主控板的異常復(fù)位。因為SNCP和TPS的倒換機制在交叉板,因此主控板復(fù)位時,這兩類保護無影響。但對于復(fù)用段保護倒換,由于倒換協(xié)議下發(fā)至交叉板完成,對設(shè)備不影響,但在主控板復(fù)位后會觸發(fā)主控板倒換,將造成網(wǎng)元配置下發(fā)或數(shù)據(jù)下載失敗。
巨型ECC網(wǎng)絡(luò)導(dǎo)致網(wǎng)元脫管。傳輸網(wǎng)管以每分鐘為周期向所有網(wǎng)元發(fā)送監(jiān)視信號,若連續(xù)2次無法收到傳輸設(shè)備的返回值時,邏輯上便認(rèn)定該網(wǎng)元的連接中斷。因此當(dāng)?shù)谝淮芜B接報文通信異常時,第二次的報文有一點時間上的延時,傳輸網(wǎng)管大概率就會做出傳輸設(shè)備脫管的判斷,當(dāng)同一網(wǎng)絡(luò)內(nèi)的ECC過量時,就會容易導(dǎo)致傳輸設(shè)備的脫管現(xiàn)象,直到傳輸設(shè)備再連續(xù)兩次與傳輸網(wǎng)管的通信正常后,脫管故障恢復(fù),因每臺傳輸設(shè)備與網(wǎng)管間的跳接點長度不一,會造成傳輸設(shè)備恢復(fù)的時間和頻率也不一樣。
巨型ECC網(wǎng)絡(luò)的路由穩(wěn)定性差。D1-D3字節(jié)的速率為固定的192 kbit/s,在所有網(wǎng)元開啟性能監(jiān)控已經(jīng)占用部分通信帶寬的情況下,當(dāng)網(wǎng)絡(luò)變化時路由廣播信息需要在網(wǎng)絡(luò)中不斷廣播、不斷反復(fù)計從而算造成ECC路由不穩(wěn)定。在一個大型網(wǎng)絡(luò)某個網(wǎng)元脫網(wǎng)的路由信息廣播到整個網(wǎng)絡(luò)需經(jīng)過一定的時間,但當(dāng)信息傳達(dá)到整個網(wǎng)絡(luò)時可能該脫網(wǎng)網(wǎng)元又恢復(fù)可達(dá)或者該網(wǎng)絡(luò)其他網(wǎng)元又脫網(wǎng)了,進而造成整個網(wǎng)絡(luò)不停的振蕩,期間又增加了網(wǎng)絡(luò)的通信量。針對華為設(shè)備的ECC收斂時間測試結(jié)果如表1所示。
通過對巨型ECC網(wǎng)絡(luò)進行切割優(yōu)化,將一個大的ECC子網(wǎng)絡(luò)(管理網(wǎng)元數(shù)量超過400個及以上)劃分為多個小的ECC子網(wǎng),并且關(guān)閉各個小的ECC子網(wǎng)之間互聯(lián)互通端口的ECC,把路由信息和數(shù)據(jù)限制在某個子網(wǎng)內(nèi)傳播,不會擴散影響到其他網(wǎng)絡(luò)。通過合理規(guī)劃ECC子網(wǎng)組網(wǎng),可有效避免因ECC網(wǎng)絡(luò)過大造成的傳輸網(wǎng)網(wǎng)絡(luò)不能正常監(jiān)控和管理通道堵塞問題。
通過增加SDH網(wǎng)絡(luò)中網(wǎng)關(guān)網(wǎng)元的數(shù)量,將原有的大網(wǎng)劃分成不同的小子網(wǎng),實現(xiàn)巨型ECC網(wǎng)絡(luò)分割。每個子網(wǎng)內(nèi)建議同時設(shè)置主備用兩個網(wǎng)管網(wǎng)元,保障在ECC子網(wǎng)分割后的非網(wǎng)關(guān)網(wǎng)元與網(wǎng)關(guān)網(wǎng)元之間可達(dá)。這樣由于網(wǎng)關(guān)網(wǎng)元數(shù)量的增多,與網(wǎng)管進行DCN連接的帶寬將大大增加,每個子網(wǎng)內(nèi)的網(wǎng)元都有足夠的帶寬與網(wǎng)管直接通信,不僅可以減少網(wǎng)絡(luò)維護開銷,提高整個網(wǎng)絡(luò)的管理水平,還能增強ECC通信網(wǎng)絡(luò)的穩(wěn)定性。
巨型ECC網(wǎng)絡(luò)的分割原則:一是要保證網(wǎng)絡(luò)出現(xiàn)異常情況時,網(wǎng)管仍能和分割前一樣可管理所有傳輸網(wǎng)元,避免影響維護;二是每個ECC子網(wǎng)內(nèi)的傳輸網(wǎng)元數(shù)量不能超過建議的數(shù)量范圍;三是完成ECC子網(wǎng)分割優(yōu)化后,按分層、分域的管理原則,網(wǎng)絡(luò)上任何一處斷纖或其他異常情況,應(yīng)確保數(shù)據(jù)包在到達(dá)目的網(wǎng)元前不被丟棄或消失,確保能夠達(dá)到分割前的ECC路由恢復(fù)(保護)能力。
如圖3所示,SNCP的保護方式為“首端雙發(fā)、末端選收”,正常工作狀態(tài)下,NEA到NEB的業(yè)務(wù)在NEA設(shè)備側(cè)表現(xiàn)為雙發(fā),分別經(jīng)過子網(wǎng)1(工作通道)和子網(wǎng)2(保護通道),同時到達(dá)NEB,NEB優(yōu)先監(jiān)測工作通道是否正常,若正常則從工作通道收取NEA的業(yè)務(wù),即可完成NEA至NEB之間的業(yè)務(wù)通信。如果子網(wǎng)1工作通道發(fā)生中斷,NEB在監(jiān)測到子網(wǎng)1工作通道不通后,NEB倒換從子網(wǎng)2的保護通道收取NEA的業(yè)務(wù),實現(xiàn)正常通信,待子網(wǎng)1工作通道正常后,NEB再次倒換至子網(wǎng)1的工作通道進行通信。通過分析SNCP子網(wǎng)連接的保護方式可知,業(yè)務(wù)倒換的功能實現(xiàn)主要在起始點和終結(jié)點實現(xiàn),與子網(wǎng)內(nèi)的其他網(wǎng)元主要提供業(yè)務(wù)即可,無需參與倒換過程,因此即使將起始點和終結(jié)點分割在不同的ECC子網(wǎng)內(nèi),也不會對SNCP保護造成任何影響。
MSP復(fù)用段環(huán)的保護方式相比SNCP較復(fù)雜一些,但因其多用于分布式業(yè)務(wù),在目前客專線傳輸系統(tǒng)組網(wǎng)中應(yīng)用廣泛,MSP環(huán)的保護方式將兩個網(wǎng)元之間的光纖時隙資源一分為二,前一半時隙為工作,后一半時隙為保護,如圖4所示,NEA至NEC的業(yè)務(wù)經(jīng)過S1工作時隙,經(jīng)過NEB達(dá)到NEC,如果A-B之間光纜中斷,NEA和NEB的保護狀態(tài)由正常狀態(tài)變?yōu)榈箵Q狀態(tài),NED和NEC的保護狀態(tài)由正常狀態(tài)變?yōu)榇┩顟B(tài),相對應(yīng)的NEA至NEC的業(yè)務(wù)將經(jīng)過NED-NEC-NEB后到達(dá)NEC,在經(jīng)過NED-NEC-NEB區(qū)段使用的是后一半的保護時隙,從倒換原理看,業(yè)務(wù)倒換時需要環(huán)內(nèi)的所有網(wǎng)元共同參與才可以完成。而通過APS協(xié)議控制環(huán)內(nèi)的網(wǎng)元在發(fā)生倒換時,需要利用APS協(xié)議,由APS協(xié)議來給一個環(huán)網(wǎng)內(nèi)的各個網(wǎng)元起名字后統(tǒng)一管理,APS協(xié)議信息由K1、K2攜帶,目的節(jié)點標(biāo)識碼(5~8 bit)。由于只有4 bit,因此一個復(fù)用段保護環(huán)上的網(wǎng)元數(shù)最多不能超過16個,環(huán)上網(wǎng)元號最小的節(jié)點編號為0,按照東發(fā)西收方向逐一為1、2、3……14、15,環(huán)網(wǎng)內(nèi)每個網(wǎng)元都有對應(yīng)的數(shù)字編號,當(dāng)發(fā)生倒換時APS協(xié)議將指揮各個網(wǎng)元各司其職。ECC分割需要關(guān)斷網(wǎng)元間的DCC通道,關(guān)閉后兩個網(wǎng)元之間將無法互通,對MSP的保護倒換。
如圖5所示,按照客專線傳輸系統(tǒng)組網(wǎng)情況,將整個系統(tǒng)分割為黃色和紅色兩個ECC子網(wǎng),子網(wǎng)與子網(wǎng)之間不可通信,分別由各自的網(wǎng)關(guān)網(wǎng)元與網(wǎng)管進行通信,此時原環(huán)網(wǎng)B-C-D-E-F因子網(wǎng)劃分,將網(wǎng)元B分離出環(huán)網(wǎng),為了保障D-E之間的光纜中斷后,E-F網(wǎng)元也可與網(wǎng)管正常通信,需要在網(wǎng)元B設(shè)置DCC透傳,實現(xiàn)網(wǎng)元C直接與網(wǎng)元F進行通信。對于B-C-D-E-F環(huán)網(wǎng)來說,由于網(wǎng)元B設(shè)置了DCC穿通,該環(huán)網(wǎng)實際通信可達(dá)的網(wǎng)元變?yōu)镃-D-E-F,網(wǎng)元B將不可達(dá),ECC分割后對MSP環(huán)保護是否會產(chǎn)生影響。
圖4 二纖雙向復(fù)用段保護環(huán)(MSP)連接工作與保護示意圖Fig.4 Schematic diagram of connection and protection of two-fiber bidirectional multiplex section protection ring (MSP)
圖5 ECC分割示意圖Fig.5 ECC segmentation diagram
APS協(xié)議使用的是K1、K2字節(jié),DCC通信使用的是D1-D3字節(jié),K字節(jié)和D字節(jié)雖同屬于復(fù)用段開銷,但D字節(jié)用于網(wǎng)元網(wǎng)管之間、網(wǎng)元和網(wǎng)元之間OAM信息通路,K字節(jié)用于傳送自動保護倒換信令,使網(wǎng)絡(luò)具備自愈功能,相互之間沒有關(guān)聯(lián),是不同的開銷字節(jié),關(guān)閉D字節(jié)不會影響K字節(jié)的功能,反之亦然。因此針對圖5中巨型ECC網(wǎng)絡(luò)分割后,網(wǎng)元B設(shè)置的DCC穿通,雖然會造成同一MSP環(huán)內(nèi)個別網(wǎng)元的DCC通信不可達(dá),但不會影響APS協(xié)議中K字節(jié)的傳送,對MSP環(huán)網(wǎng)的保護沒有影響。
隨著鐵路行業(yè)逐漸發(fā)展,傳輸網(wǎng)絡(luò)的子網(wǎng)將會越來越大,巨型ECC網(wǎng)絡(luò)的影響和對網(wǎng)絡(luò)的危害,迫使需要進行ECC子網(wǎng)分割,劃分成多個小的ECC子網(wǎng),以提高網(wǎng)絡(luò)整體運行安全性,本文對SNCP保護和MSP保護兩種情形的ECC分割方案進行分析,對巨型ECC網(wǎng)絡(luò)執(zhí)行DCC通道關(guān)斷的方式可以實現(xiàn)巨網(wǎng)ECC的分割,以滿足當(dāng)前鐵路客專的組網(wǎng)保護方式。此方案在京滬高鐵上海局管段已實施ECC子網(wǎng)分割,取得了較好效果。