覃 旺
目前,廣州地鐵信號(hào)系統(tǒng)維修維護(hù)模式主要以周期檢修、預(yù)防維修為主,人力成本和材料成本消耗巨大,只能依靠檢修人員以及復(fù)雜的維修管理流程保證設(shè)備維修質(zhì)量。當(dāng)檢修人員或維修管理環(huán)節(jié)出現(xiàn)問(wèn)題時(shí),就會(huì)導(dǎo)致設(shè)備故障。為了提高信號(hào)系統(tǒng)維修水平,降低人力和材料消耗,同時(shí)保證信號(hào)系統(tǒng)安全、可靠運(yùn)行,廣州地鐵、廣州鐵科智控公司聯(lián)合開展了信號(hào)系統(tǒng)智能運(yùn)維平臺(tái)的研究。
智能運(yùn)維平臺(tái)需要采集各線路列車運(yùn)行和關(guān)鍵設(shè)備狀態(tài)等信息,并通過(guò)分布式控制系統(tǒng)DCS 系統(tǒng)傳輸?shù)胶笈_(tái)服務(wù)器,實(shí)現(xiàn)可視化呈現(xiàn);根據(jù)DCS 系統(tǒng)設(shè)計(jì)的四維評(píng)價(jià)法[1-2],可通過(guò)設(shè)備、網(wǎng)絡(luò)拓?fù)涞娜哂?,?shí)現(xiàn)網(wǎng)絡(luò)系統(tǒng)的高可靠保護(hù);同時(shí),部分業(yè)務(wù)系統(tǒng)對(duì)時(shí)延要求敏感,要求網(wǎng)絡(luò)系統(tǒng)在故障切換過(guò)程中,盡可能地縮短切換時(shí)間。本文根據(jù)DCS 系統(tǒng)需求,提出了3 種不同的基于ERPS協(xié)議的環(huán)網(wǎng)架構(gòu),通過(guò)可靠性的分析、計(jì)算和對(duì)比,以及收斂性能的測(cè)試和分析,其結(jié)果可直接用于軌道交通或相關(guān)領(lǐng)域,工程人員可根據(jù)實(shí)際條件來(lái)選擇合適的組網(wǎng)架構(gòu)。
1)接入冗余。服務(wù)器雙歸接入交換機(jī),服務(wù)器啟用雙網(wǎng)卡綁定功能,其中主、備網(wǎng)卡分別接入主交換機(jī)和備交換機(jī),正常時(shí),主網(wǎng)卡處于活躍狀態(tài),備網(wǎng)卡處于靜默狀態(tài)。當(dāng)主網(wǎng)卡出現(xiàn)故障時(shí),服務(wù)器的備網(wǎng)卡立刻激活,代替主網(wǎng)卡工作,實(shí)現(xiàn)環(huán)網(wǎng)保護(hù)。
2)交換機(jī)冗余。在每個(gè)節(jié)點(diǎn)機(jī)柜布置2 臺(tái)交換機(jī),一臺(tái)為主,一臺(tái)為備,兩交換機(jī)之間通過(guò)堆疊線互連,用以傳輸心跳報(bào)文或業(yè)務(wù)數(shù)據(jù)。當(dāng)主交換機(jī)故障時(shí),數(shù)據(jù)切換到備交換機(jī)轉(zhuǎn)發(fā),實(shí)現(xiàn)環(huán)網(wǎng)保護(hù)。
3)線路冗余。節(jié)點(diǎn)之間主交換機(jī)與主交換機(jī)互連,備交換機(jī)與備交換機(jī)互連。配置跨設(shè)備的鏈路聚合,將2 條鏈路劃入同一個(gè)跨設(shè)備Eth-Trunk接口,實(shí)現(xiàn)鏈路間的備份,保證了數(shù)據(jù)流量的可靠傳輸。
4)拓?fù)淙哂?。網(wǎng)絡(luò)拓?fù)錇榄h(huán)型,通過(guò)ERPS協(xié)議避免產(chǎn)生環(huán)路,防止發(fā)生廣播風(fēng)暴;同時(shí)在出現(xiàn)故障時(shí),可快速激活冗余備份鏈路,恢復(fù)網(wǎng)絡(luò)連通性,可達(dá)到電信級(jí)切換要求[3]。
該組網(wǎng)架構(gòu)可以保證環(huán)網(wǎng)中出現(xiàn)二度故障時(shí),業(yè)務(wù)不中斷。全冗余環(huán)網(wǎng)架構(gòu)拓?fù)湟妶D1。
圖1 全冗余環(huán)網(wǎng)架構(gòu)拓?fù)?/p>
1)接入冗余。服務(wù)器2 塊網(wǎng)卡不綁定,每個(gè)網(wǎng)卡均處于活躍狀態(tài)。2 塊網(wǎng)卡分別接到2 個(gè)互相獨(dú)立的環(huán)網(wǎng)1 和環(huán)網(wǎng)2,由服務(wù)器的上層軟件實(shí)現(xiàn)數(shù)據(jù)的“雙發(fā)選收”,進(jìn)行業(yè)務(wù)保護(hù)。
2)交換機(jī)冗余。在每個(gè)節(jié)點(diǎn)機(jī)柜布置2 臺(tái)交換機(jī),不區(qū)分主備,不需要互連,也不需要組成堆疊。2 臺(tái)交換機(jī)分別屬于2 個(gè)獨(dú)立的環(huán)網(wǎng)Ring1 和環(huán)網(wǎng)Ring2,任何1 臺(tái)交換機(jī)故障都只會(huì)影響其中1 個(gè)環(huán)網(wǎng),實(shí)現(xiàn)冗余保護(hù)。
3)線路冗余。節(jié)點(diǎn)之間的2 條鏈路分別屬于不同環(huán)網(wǎng),其中1 條出現(xiàn)故障不影響另一個(gè)環(huán)網(wǎng)的運(yùn)行,實(shí)現(xiàn)線路冗余。
4)拓?fù)淙哂唷? 個(gè)獨(dú)立環(huán)網(wǎng)分別運(yùn)行ERPS 協(xié)議,在環(huán)內(nèi)避免發(fā)生廣播風(fēng)暴,并在故障切換時(shí)進(jìn)行業(yè)務(wù)倒換,實(shí)現(xiàn)環(huán)內(nèi)保護(hù);環(huán)網(wǎng)Ring1 和環(huán)網(wǎng)Ring2 互為備份,進(jìn)一步提高了其可靠性。
該網(wǎng)絡(luò)架構(gòu)同樣可以保證環(huán)網(wǎng)中出現(xiàn)二度故障時(shí),業(yè)務(wù)不中斷。雙環(huán)網(wǎng)架構(gòu)拓?fù)湟妶D2。
圖2 雙環(huán)網(wǎng)架構(gòu)拓?fù)?/p>
單環(huán)網(wǎng)架構(gòu)是雙環(huán)網(wǎng)架構(gòu)的簡(jiǎn)化,即去掉環(huán)網(wǎng)Ring2,只保留1 個(gè)環(huán)網(wǎng)。該架構(gòu)無(wú)接入冗余、線路冗余、交換機(jī)冗余,只存在環(huán)路的拓?fù)淙哂?,可靠性相?duì)較低;但由于其網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,節(jié)省了交換機(jī)資源和光纜(或電纜) 資源,降低了投資成本。單環(huán)網(wǎng)架構(gòu)拓?fù)湟妶D3。
圖3 單環(huán)網(wǎng)架構(gòu)拓?fù)?/p>
網(wǎng)絡(luò)系統(tǒng)的可靠性計(jì)算是當(dāng)前研究的熱門方向,主要有:狀態(tài)枚舉法、因子分解法、最小路(割)集法、不交化方法等精確算法;定界法、圖變換、模擬法等近似算法[4-6]。這些計(jì)算方法都能有效解決網(wǎng)絡(luò)可靠性的計(jì)算問(wèn)題,但均較為復(fù)雜,直接應(yīng)用于工程實(shí)踐存在較大難度。本文提出的3種環(huán)網(wǎng)結(jié)構(gòu),其拓?fù)浣Y(jié)構(gòu)規(guī)則,每條鏈路、每個(gè)交換機(jī)的狀態(tài)相互獨(dú)立,可根據(jù)古典概型直接計(jì)算可靠性,計(jì)算過(guò)程如下。
全冗余環(huán)網(wǎng)拓?fù)淇傻刃橐恍┗靖罴拇⒙?lián)[7],其等效拓?fù)浣Y(jié)構(gòu)如圖4 所示。
圖4 全冗余環(huán)網(wǎng)等效架構(gòu)
假設(shè)任意一條鏈路的可靠性為λ,任意一臺(tái)交換機(jī)的可靠性為P,服務(wù)器發(fā)送端下掛在節(jié)點(diǎn)1,服務(wù)器接收端下掛在節(jié)點(diǎn)k,整個(gè)環(huán)路有n 個(gè)節(jié)點(diǎn),系統(tǒng) 整體可 靠 性 為P1。記u=2λ-λ2,v=[λP(2-λP)],x=(1-P)·(λ+P-λP)·(λP)2,得到:
式中,P(La)為在環(huán)路無(wú)故障時(shí),數(shù)據(jù)流通過(guò)順時(shí)針?lè)较蜴溌稬a傳輸?shù)目煽啃?;P(Lb)為在順時(shí)針鏈路La不通后,數(shù)據(jù)流通過(guò)逆時(shí)針?lè)较蜴溌稬b傳輸?shù)目煽啃?。為了減小計(jì)算P(La)、P(Lb)時(shí)的計(jì)算量,本文做了以下工程化假設(shè)。
1)通過(guò)拓?fù)浞指畛苫ハ嗒?dú)立的子集,主設(shè)備與主鏈路、備設(shè)備與備鏈路各看作一個(gè)基本割集,本節(jié)點(diǎn)內(nèi)只需要保證任意一個(gè)割集聯(lián)通,就認(rèn)為本節(jié)點(diǎn)通向相鄰節(jié)點(diǎn)存在一條有效路徑。此時(shí),有2 種耦合形式會(huì)導(dǎo)致“黑洞路徑”,需要排除?!昂诙绰窂健比鐖D5 紅線所示。
2)主備交換機(jī)之間的堆疊線,其距離近,且布置在有人值守機(jī)柜內(nèi),故障時(shí)可立即替換,維修耗時(shí)接近于0,因此可以忽略其可靠性對(duì)系統(tǒng)整體可靠性的影響,即默認(rèn)可靠性等于1。
根據(jù)上述假設(shè),記:
根據(jù)串并聯(lián)概率計(jì)算方法,計(jì)算通過(guò)鏈路La通信的可靠性:
計(jì)算在La上發(fā)生“黑洞路徑”概率,得到:
圖5 節(jié)點(diǎn)間耦合故障
計(jì)算整條La的可靠性:
同理,可求得在La故障時(shí),數(shù)據(jù)通過(guò)Lb傳輸?shù)目煽啃裕?/p>
將式(2)、(9)、(8)代入式(1)、(3),得:
雙環(huán)網(wǎng)拓?fù)湟嗫傻刃橐恍┗靖罴ㄟ^(guò)串并聯(lián)而成,其等效拓?fù)浣Y(jié)構(gòu)如圖6 所示。
假設(shè)任意一條鏈路可靠性為λ,任意一臺(tái)交換機(jī)可靠性為P,服務(wù)器發(fā)送端下掛在節(jié)點(diǎn)1,服務(wù)器接收端下掛在節(jié)點(diǎn)k,整個(gè)環(huán)路有n 個(gè)節(jié)點(diǎn),系統(tǒng)整體可靠性P2,并記w =P(A網(wǎng))。則有:
圖6 雙環(huán)網(wǎng)等效架構(gòu)圖
將式(14)代入(13),得
將(15)式代入(12),有
單環(huán)網(wǎng)只有1個(gè)ERPS 環(huán),其可靠性即為雙環(huán)網(wǎng)A 網(wǎng)的可靠性。設(shè)單環(huán)網(wǎng)系統(tǒng)整體可靠性為P3,有:
根據(jù)廣州地鐵集團(tuán)公司的光纜、交換機(jī)故障維修記錄,在2004—2016 年的12 年時(shí)間內(nèi),網(wǎng)絡(luò)故障主要來(lái)源于光纖鏈路故障,未發(fā)生過(guò)因?yàn)榻粨Q機(jī)故障而造成的網(wǎng)絡(luò)中斷。
根據(jù)交換機(jī)性能指標(biāo)參數(shù),其MTBF(平均無(wú)故障時(shí)間)=57 年,MTTR(平均修復(fù)時(shí)間)=2h,則根據(jù)可維修系統(tǒng)的可靠性計(jì)算公式[8~9],有
計(jì)算得到交換機(jī)可靠性P=0.99999,為計(jì)算方便,取值P=0.99。
對(duì)于光纜故障,由于其發(fā)生的隨機(jī)性較大,光纜可靠性λ 可視為變量,在0.9~1 變化區(qū)間內(nèi),觀察其對(duì)網(wǎng)絡(luò)可靠性的影響。
根據(jù)上述分析計(jì)算結(jié)果,本文給出不同n(環(huán)網(wǎng)節(jié)點(diǎn)總數(shù))、k(環(huán)網(wǎng)中,服務(wù)器接收端下掛的節(jié)點(diǎn)編號(hào),該變量表示接收端到發(fā)送端的距離)值的可靠性曲線,如圖7 所示。同時(shí),為了直觀看出不同網(wǎng)絡(luò)架構(gòu)的可靠性,給出故障率變化曲線,如圖8 所示。
由圖7、圖8 可看出,全冗余環(huán)網(wǎng)的可靠性最高,雙環(huán)網(wǎng)次之,單環(huán)網(wǎng)的可靠性最低。由于全冗余網(wǎng)絡(luò)架構(gòu)采用心跳線互聯(lián),可提供更多連通路徑。經(jīng)過(guò)分析計(jì)算得出:當(dāng)設(shè)備可靠性、鏈路可靠性均在0.999 以上時(shí),全冗余網(wǎng)絡(luò)架構(gòu)的故障率比雙環(huán)網(wǎng)架構(gòu)的故障率低3個(gè)數(shù)量級(jí)。
圖7 3 種環(huán)網(wǎng)的可靠性對(duì)比
當(dāng)網(wǎng)絡(luò)出現(xiàn)拓?fù)涓淖兓蛘吖收蠒r(shí),觸發(fā)網(wǎng)絡(luò)鏈路切換。在網(wǎng)絡(luò)狀態(tài)收斂過(guò)程中,不同組網(wǎng)方式、不同協(xié)議條件下會(huì)產(chǎn)生不同的故障切換時(shí)間[10-12]。本文針對(duì)3 種組網(wǎng)架構(gòu),采用6 臺(tái)華為S5700 交換機(jī),分別根據(jù)圖1~圖3,在節(jié)點(diǎn)數(shù)n=3 條件下,給出在一度、二度故障條件下的試驗(yàn)結(jié)果,并簡(jiǎn)單分析影響切換時(shí)間的因素。3 種組網(wǎng)方式的性能對(duì)比見表1。
圖8 3 種環(huán)網(wǎng)架構(gòu)的故障率對(duì)比
表1 3 種組網(wǎng)形式性能對(duì)比
續(xù)表
經(jīng)過(guò)測(cè)試結(jié)果對(duì)比分析,可以看到,全冗余網(wǎng)絡(luò)收斂最慢,雙環(huán)網(wǎng)和單環(huán)網(wǎng)收斂性能相當(dāng),但單環(huán)網(wǎng)可靠性低,不能進(jìn)行二度故障保護(hù)。
3 種組網(wǎng)方式各有優(yōu)缺點(diǎn),對(duì)比如表2 所示。
表2 3 種組網(wǎng)方式的優(yōu)缺點(diǎn)對(duì)比
綜上所述,在一些對(duì)可靠性要求極高的場(chǎng)合,全冗余環(huán)網(wǎng)是首選方案,適合在信號(hào)系統(tǒng)部署;在一些對(duì)可靠性、時(shí)延有一定要求,但要求又不是特別高的場(chǎng)合,雙環(huán)網(wǎng)方案是首選,適合在地鐵綜合監(jiān)控系統(tǒng)部署;在一些可靠性要求較低、時(shí)延要求高,且價(jià)格敏感的應(yīng)用場(chǎng)合,如運(yùn)維系統(tǒng)、PIS 系統(tǒng)等,可優(yōu)先考慮單環(huán)網(wǎng)方案[13-18]。目前,3種網(wǎng)絡(luò)架構(gòu)在廣州地鐵舊線運(yùn)維、新線建設(shè)中得到了廣泛應(yīng)用,將來(lái)可在軌道交通其他線路或其他應(yīng)用領(lǐng)域推廣。