李新超,段博,雷亞寧
(1.上海中廣核工程科技有限公司 工程部,上海,200241;2.北京廣利核系統(tǒng)工程有限公司 工程部,北京,100094)
隨著我國碳達峰與碳中和目標(biāo)的提出,新能源產(chǎn)業(yè)快速發(fā)展,風(fēng)力發(fā)電更是重中之重。在實現(xiàn)風(fēng)電智能化、信息化、自動化控制的過程中,網(wǎng)絡(luò)通訊已越來越重要,成為影響風(fēng)電發(fā)展的關(guān)鍵因素,直接影響風(fēng)電機組的安全可靠運行[1]。在眾多網(wǎng)絡(luò)問題中,網(wǎng)絡(luò)風(fēng)暴無疑是對風(fēng)電機組影響最大的一種,其產(chǎn)生原因復(fù)雜,問題定位困難。當(dāng)網(wǎng)絡(luò)風(fēng)暴發(fā)生時,大量報文阻塞網(wǎng)絡(luò),可能會導(dǎo)致死機,響應(yīng)能力變差,甚至出現(xiàn)網(wǎng)絡(luò)癱瘓,進而引起全站風(fēng)電機組通訊中斷。
由于網(wǎng)絡(luò)拓撲的設(shè)計和連接問題,或其他原因?qū)е聫V播在網(wǎng)段內(nèi)大量復(fù)制,傳播數(shù)據(jù)幀導(dǎo)致網(wǎng)絡(luò)性能下降,甚至網(wǎng)絡(luò)癱瘓,這樣的現(xiàn)象就是網(wǎng)絡(luò)風(fēng)暴[2]。
在眾多網(wǎng)絡(luò)風(fēng)暴成因中最為普遍的就是以太網(wǎng)成環(huán)現(xiàn)象,廣播包在環(huán)網(wǎng)中不斷重復(fù)發(fā)送,占用大量帶寬,最終形成網(wǎng)絡(luò)風(fēng)暴。以太網(wǎng)交換機工作時,任何一個端口接收到廣播包后都會向其他端口完整的發(fā)送一份相同的廣播包并不斷傳遞。如圖1 所示,以太網(wǎng)交換機接收到來自1 端口的廣播報文后分別向2,3,4 端口同時發(fā)送一份相同報文。
圖1 交換機工作原理圖
當(dāng)網(wǎng)絡(luò)通訊中出現(xiàn)成環(huán)現(xiàn)象時,就相當(dāng)于同一個交換機的兩個端口直接相連。如圖2 所示,交換機3,4 號端口相連,接收到廣播包的3 端口會通過環(huán)網(wǎng)向4 號端口發(fā)送報文,同時4 號端口會將接收到的報文分別發(fā)送至1,2,3 號端口各一份,如此循環(huán)反復(fù),源源不斷向外界網(wǎng)絡(luò)發(fā)送報文,直至帶寬消耗殆盡造成網(wǎng)絡(luò)癱瘓。
圖2 單個交換機成環(huán)工作原理圖
當(dāng)多個交換機相連時出現(xiàn)同一個廣播包被同一個交換機處理2 次時,就會產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。如圖3 所示,兩臺交換機之間形成一個環(huán)形結(jié)構(gòu),A3-B1-B2-A4 形成一個環(huán)路,廣播包會在環(huán)路中無限轉(zhuǎn)發(fā),從而觸發(fā)網(wǎng)絡(luò)風(fēng)暴。
圖3 多個交換機成環(huán)工作原理圖
現(xiàn)階段風(fēng)電機組通訊問題往往只有在發(fā)生故障時才會被察覺,如通訊丟失,信號閃斷等。因此排查起來會消耗大量時間,處理效率較低,嚴重影響風(fēng)電機組有效運行監(jiān)控。總結(jié)來看,風(fēng)電機組網(wǎng)絡(luò)風(fēng)暴產(chǎn)生原因分為以下幾種。
(1)網(wǎng)絡(luò)設(shè)備
①交換機購買時錯誤購買為智能型Hub,在網(wǎng)絡(luò)繁忙時便會產(chǎn)生卡頓甚至網(wǎng)絡(luò)風(fēng)暴。
②網(wǎng)卡損壞或交換機端口損壞,導(dǎo)致向網(wǎng)絡(luò)中發(fā)送大量報文,不斷轉(zhuǎn)發(fā)形成網(wǎng)絡(luò)風(fēng)暴。
③交換機即插即用,在環(huán)網(wǎng)冗余通訊不一致的情況下容易產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。
(2)網(wǎng)絡(luò)環(huán)路
①網(wǎng)絡(luò)線路設(shè)計凌亂,拓撲結(jié)構(gòu)復(fù)雜,雙絞線的兩端同時接在一臺網(wǎng)絡(luò)設(shè)備中,影響整個網(wǎng)絡(luò)運行環(huán)境。
②斷線修復(fù)時,在連接的一瞬間會讓環(huán)網(wǎng)形成回路,管理交換機無法發(fā)現(xiàn)回路并進行阻塞,易產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。
(3)網(wǎng)絡(luò)配置
①技術(shù)人員對處于調(diào)試階段的風(fēng)電機組核心交換機配置時采用交換機初始配置,未嚴格按照風(fēng)電場狀況進行虛擬局域網(wǎng)設(shè)置,加大網(wǎng)絡(luò)風(fēng)暴的機率。
②更換損壞交換機時未對新交換機進行配置,致使網(wǎng)絡(luò)冗余協(xié)議不匹配,產(chǎn)生數(shù)據(jù)丟包等現(xiàn)象,從而引起網(wǎng)路風(fēng)暴[3]。
(4)網(wǎng)絡(luò)病毒
網(wǎng)絡(luò)病毒的傳播會占據(jù)大量帶寬,引起網(wǎng)絡(luò)阻塞,進而引起網(wǎng)絡(luò)風(fēng)暴。常見的網(wǎng)絡(luò)病毒有Funlove、震蕩波、RPC等[4]。
(5)惡劣環(huán)境
震動、溫度和電磁干擾等對網(wǎng)絡(luò)狀況都會產(chǎn)生一定影響,造成數(shù)據(jù)傳輸錯誤,進而引發(fā)網(wǎng)絡(luò)風(fēng)暴,電磁干擾尤為嚴重。風(fēng)電機組交換機通常處于塔基變頻器中,溫度較高,易發(fā)生數(shù)據(jù)丟失,導(dǎo)致網(wǎng)絡(luò)風(fēng)暴的產(chǎn)生。
風(fēng)電場環(huán)網(wǎng)通訊中為避免網(wǎng)絡(luò)風(fēng)暴的產(chǎn)生通常會采用快速生成樹協(xié)議來抑制,通過冗余鏈路結(jié)構(gòu)提高網(wǎng)絡(luò)通訊的可靠性。其工作機制是通過阻塞端口來消除環(huán)路,在發(fā)生故障時選擇備用鏈路以恢復(fù)網(wǎng)絡(luò)的通訊性。以下是不同故障下RSTP 的拓撲變化:
(1)根橋故障
如圖4 所示,在鏈路通訊中通過設(shè)定優(yōu)先級選定管理型交換機SWA,用來監(jiān)測環(huán)網(wǎng)狀態(tài)。在機組運行時會阻塞一條鏈路作為備用,其他交換機SEB,SWC 會定期收到管理交換機發(fā)送的BPDU 報文,當(dāng)SWA 發(fā)生故障時,超過Max Age 定時器設(shè)定時間便會選舉新的根橋,SWB 與SWC 相互發(fā)送配置BPDU 報文,直至根橋交換機修復(fù)時再重新選取管理交換機進行通訊。
圖4 通訊網(wǎng)絡(luò)根橋故障圖
(2)鏈路故障
如圖5 所示,交換機兩兩相連構(gòu)成冗余環(huán)路,設(shè)定SWA 為管理交換機,并阻塞一條鏈路,當(dāng)通訊鏈路發(fā)生故障時,管理交換機SWA 啟動備用鏈路,防止通訊中斷。在通訊鏈路狀態(tài)修復(fù)后,管理交換機SWA 將再重新選擇備用通路同時進行阻塞防止形成環(huán)路。
圖5 通訊網(wǎng)絡(luò)鏈路故障圖
DRP網(wǎng)絡(luò)為一個物理上通路但邏輯上斷路的環(huán)形網(wǎng)絡(luò),通過若干交換節(jié)點相連,并借此實現(xiàn)網(wǎng)絡(luò)故障檢測與自動恢復(fù)。如圖6 所示。
圖6 組態(tài)完成后的DRP 環(huán)網(wǎng)
在環(huán)網(wǎng)中,首先采用blocking 方式禁用交換機1 和8間的備用路徑,避免整個網(wǎng)絡(luò)中環(huán)網(wǎng)的出現(xiàn),以免數(shù)據(jù)報文在環(huán)網(wǎng)中無限轉(zhuǎn)發(fā)造成網(wǎng)絡(luò)風(fēng)暴。
其次DRP 網(wǎng)絡(luò)采用環(huán)型拓撲結(jié)構(gòu)[5]。相對于星型網(wǎng)絡(luò)冗余等其他連接結(jié)構(gòu)簡化了網(wǎng)絡(luò)復(fù)雜度,利于網(wǎng)絡(luò)管理以及降低網(wǎng)絡(luò)構(gòu)建成本;另一方面,DRP 環(huán)網(wǎng)中管理主設(shè)備一角色由網(wǎng)絡(luò)中每個交換機輪流承擔(dān),分散了主從式方法中高度集中在固定主交換設(shè)備上的網(wǎng)絡(luò)風(fēng)險,保證了整個網(wǎng)絡(luò)的正常運行。
最后,采用DRP 協(xié)議的控制網(wǎng)絡(luò)或交換機能夠快速檢測出物理鏈路和交換機設(shè)備發(fā)生的故障,并解決由單個物理鏈路或交換設(shè)備故障而引發(fā)網(wǎng)絡(luò)通信中斷的問題,快速恢復(fù)網(wǎng)絡(luò)傳輸功能,很好地解決現(xiàn)有工業(yè)以太網(wǎng)網(wǎng)絡(luò)風(fēng)險集中,可用性低的問題。此外DRP 還支持雙環(huán)冗余系統(tǒng),當(dāng)網(wǎng)絡(luò)采用雙環(huán)冗余時,網(wǎng)絡(luò)對故障的容錯性更強,可用性更高。
通過上述方法可以有效的解決環(huán)網(wǎng)通訊中網(wǎng)絡(luò)風(fēng)暴的產(chǎn)生,但由于安裝配置過程中操作處理不當(dāng)也會產(chǎn)生網(wǎng)絡(luò)風(fēng)暴問題,以下是某風(fēng)電場環(huán)網(wǎng)通訊中采用快速生成樹協(xié)議后仍產(chǎn)生網(wǎng)絡(luò)風(fēng)暴的案例分析及處理。
圖7 為某風(fēng)場風(fēng)電機組通訊監(jiān)控網(wǎng)絡(luò)拓撲圖,發(fā)生網(wǎng)絡(luò)風(fēng)暴的為C 回路環(huán)網(wǎng),其采用雙環(huán)網(wǎng)的形式連接,每臺風(fēng)電機組塔基配備一臺管理型交換機,每條環(huán)網(wǎng)線路在升壓站監(jiān)控柜配備1 臺管理型交換機,管理型交換機采用RSTP通訊協(xié)議。
圖7 C 回路網(wǎng)絡(luò)拓撲圖
(1)故障現(xiàn)象
①31#風(fēng)機通訊存在閃斷情況,閃斷持續(xù)數(shù)秒后自動恢復(fù);
②C 回路9 臺機組在凌晨出現(xiàn)通訊全部中斷,其余回路多臺機組出現(xiàn)通訊頻閃,持續(xù)約3 小時后,SCADA 通訊自行恢復(fù)正常;
③C 回路9 臺機組在某天下午出現(xiàn)網(wǎng)絡(luò)風(fēng)暴,導(dǎo)致通訊中斷,現(xiàn)場值班人員在升壓站通過手動斷開C 回路交換機其中一路光纖,使環(huán)網(wǎng)斷開,約1 分鐘后C 回路9 臺機組通訊恢復(fù)正常,網(wǎng)絡(luò)風(fēng)暴消除。
(2)問題排查處理
首先從31#風(fēng)機塔基管理型交換機(IP192.168.10.131)檢查:
①通過升壓站監(jiān)控電腦使用ping 連接31#風(fēng)機交換機,發(fā)現(xiàn)存在數(shù)據(jù)包丟失的情況,丟失率在25%~50%,可以確定31#風(fēng)機通訊閃斷是由于通訊管理機通訊不穩(wěn)定導(dǎo)致。
圖8 ping31 號風(fēng)機交換機
②在塔基直接用網(wǎng)線連接31#風(fēng)機交換機登錄界面查看端口流量情況,發(fā)現(xiàn)8 端口數(shù)據(jù)異常出現(xiàn)CRC 錯誤。
③為定位是否31#風(fēng)機管理型交換機接口硬件故障導(dǎo)致端口數(shù)據(jù)異常CRC 錯誤,采取將8 端口與7 端口光纖對調(diào)進行排查,發(fā)現(xiàn)8 端口數(shù)據(jù)恢復(fù)正常,7 端口數(shù)據(jù)異常CRC 錯誤,可以確定由于外部光纖導(dǎo)致。
④通過測量31#機組原8 端口光纖,并進行排查,發(fā)現(xiàn)31#機組與24#機組之間,24#機組側(cè)光纖接線盒至交換機之間的TX 端口光纖有衰減,因此31#機組無法正常接收7 端口的數(shù)據(jù),導(dǎo)致CRC 錯誤。更換光纖數(shù)據(jù)恢復(fù)正常。
表1 31號風(fēng)機端口流量表
表2 31號風(fēng)機端口流量表
(3)網(wǎng)絡(luò)風(fēng)暴原因分析
該風(fēng)場環(huán)網(wǎng)所使用的交換機采用RSTP(快速生成樹協(xié)議),對網(wǎng)絡(luò)風(fēng)暴的產(chǎn)生有一定防范作用,可以有選擇的阻塞端口避免網(wǎng)絡(luò)環(huán)路的形成,并提供備用鏈路協(xié)議,從而避免報文在環(huán)路的無限循環(huán)。
通過現(xiàn)場查看,19#機組管理型交換機被自動設(shè)置為阻塞狀態(tài)。
表3 19號風(fēng)機管理交換機界面信息表
因此31 號風(fēng)機與升壓站交換機通訊是通過17#→25#→36#→38#→27#→24#→31#鏈路進行。
此前24 號與31 號風(fēng)機之間光纖光功率衰減導(dǎo)致31#、28#風(fēng)機通訊頻閃,由于24 號與31 號風(fēng)機之間的光纖跳纖較短,在安裝過程中存在折彎的情況導(dǎo)致光功率衰減,使得此光纖工作在臨界狀態(tài),通訊時斷時續(xù),網(wǎng)絡(luò)拓撲頻繁變化。當(dāng)主站收不到檢測報文,認為環(huán)網(wǎng)存在斷點,即打開阻塞端口,但交換機數(shù)據(jù)轉(zhuǎn)發(fā)功能正常,此時網(wǎng)絡(luò)邏輯成環(huán),因此產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。
(1)網(wǎng)絡(luò)設(shè)備
①使用高質(zhì)量設(shè)備,保證網(wǎng)絡(luò)通信質(zhì)量從交換機到其他各節(jié)點設(shè)備質(zhì)量過關(guān),從硬件上減少故障發(fā)生的機率。
圖9 C 回路環(huán)網(wǎng)示意圖
②合理選用網(wǎng)絡(luò)傳輸介質(zhì),對雙絞線,光纖的選取應(yīng)根據(jù)應(yīng)用內(nèi)容,應(yīng)用場所以及地區(qū)實際條件進行,保障線路通暢。
③盡量使用同品牌,同型號的交換機和通訊光纖,最大程度確保節(jié)點端口的一致性。
④光纖安裝符合規(guī)范,避免可能造成光纖扭絞的情況,應(yīng)順著光纖自然松弛狀態(tài)進行盤纖。
⑤采用可檢測光功率的交換機,注意日常維護交換機和相應(yīng)光纖,特別注意短跳纖。
(2)網(wǎng)絡(luò)環(huán)路
掌握網(wǎng)絡(luò)拓撲結(jié)構(gòu),網(wǎng)絡(luò)線路設(shè)計清晰化,對備用線路實施統(tǒng)一管理,避免無意間連接構(gòu)成回路。
(3)網(wǎng)絡(luò)配置
①在調(diào)試通訊環(huán)網(wǎng)時,對交換機網(wǎng)絡(luò)冗余實施科學(xué)配置,當(dāng)更換交換機后仍需對新的交換機重新進行配置并校驗,保證通訊網(wǎng)絡(luò)中網(wǎng)絡(luò)冗余協(xié)議始終保持匹配狀態(tài)。
②使用網(wǎng)絡(luò)監(jiān)控設(shè)備,及時發(fā)現(xiàn)并處理。對交換機端口通訊狀態(tài)進行監(jiān)測,報文轉(zhuǎn)發(fā)超過設(shè)定閾值便丟棄此端口所有數(shù)據(jù)并堵塞;低于閾值時,進入正常監(jiān)測狀態(tài)。此過程中可以使用協(xié)議類分析軟件SnifferPRO,圖表形式展現(xiàn)更加直觀,可以達到有效預(yù)防的目的。
③采用VLAN 技術(shù)。通過在交換機上不同的實現(xiàn)方法控制廣播,從而大大減少廣播對網(wǎng)絡(luò)帶寬的占用,提高了帶寬的傳輸效率,有效的避免網(wǎng)絡(luò)風(fēng)暴產(chǎn)生[6]。
(4)網(wǎng)絡(luò)病毒
安裝網(wǎng)絡(luò)版殺毒軟件并及時升級,開啟監(jiān)控功能,卸載不必要的服務(wù),關(guān)閉不必要的端口,以提高系統(tǒng)的安全性和可靠性。
(5)環(huán)境
掌握風(fēng)場網(wǎng)絡(luò)運行條件,對設(shè)備安裝位置進行合理裝配,尤其考慮溫度,磁場等情況。嚴格執(zhí)行接地要求,特別是涉及遠程線路的轉(zhuǎn)接設(shè)備,并且定期對設(shè)備進行保養(yǎng)。
本文針對風(fēng)電場網(wǎng)絡(luò)風(fēng)暴進行研究,闡述了網(wǎng)絡(luò)風(fēng)暴的成因及應(yīng)對策略,介紹了一起采用快速生成樹協(xié)議后仍產(chǎn)生網(wǎng)絡(luò)風(fēng)暴的實例,以網(wǎng)絡(luò)拓撲為基礎(chǔ),逐步介紹網(wǎng)絡(luò)風(fēng)暴發(fā)生、分析和處理的過程,最后提出網(wǎng)絡(luò)風(fēng)暴的預(yù)防辦法,確保了風(fēng)電機組的有效監(jiān)控。