李新超,段博,雷亞寧
(1.上海中廣核工程科技有限公司 工程部,上海,200241;2.北京廣利核系統(tǒng)工程有限公司 工程部,北京,100094)
隨著我國(guó)碳達(dá)峰與碳中和目標(biāo)的提出,新能源產(chǎn)業(yè)快速發(fā)展,風(fēng)力發(fā)電更是重中之重。在實(shí)現(xiàn)風(fēng)電智能化、信息化、自動(dòng)化控制的過(guò)程中,網(wǎng)絡(luò)通訊已越來(lái)越重要,成為影響風(fēng)電發(fā)展的關(guān)鍵因素,直接影響風(fēng)電機(jī)組的安全可靠運(yùn)行[1]。在眾多網(wǎng)絡(luò)問(wèn)題中,網(wǎng)絡(luò)風(fēng)暴無(wú)疑是對(duì)風(fēng)電機(jī)組影響最大的一種,其產(chǎn)生原因復(fù)雜,問(wèn)題定位困難。當(dāng)網(wǎng)絡(luò)風(fēng)暴發(fā)生時(shí),大量報(bào)文阻塞網(wǎng)絡(luò),可能會(huì)導(dǎo)致死機(jī),響應(yīng)能力變差,甚至出現(xiàn)網(wǎng)絡(luò)癱瘓,進(jìn)而引起全站風(fēng)電機(jī)組通訊中斷。
由于網(wǎng)絡(luò)拓?fù)涞脑O(shè)計(jì)和連接問(wèn)題,或其他原因?qū)е聫V播在網(wǎng)段內(nèi)大量復(fù)制,傳播數(shù)據(jù)幀導(dǎo)致網(wǎng)絡(luò)性能下降,甚至網(wǎng)絡(luò)癱瘓,這樣的現(xiàn)象就是網(wǎng)絡(luò)風(fēng)暴[2]。
在眾多網(wǎng)絡(luò)風(fēng)暴成因中最為普遍的就是以太網(wǎng)成環(huán)現(xiàn)象,廣播包在環(huán)網(wǎng)中不斷重復(fù)發(fā)送,占用大量帶寬,最終形成網(wǎng)絡(luò)風(fēng)暴。以太網(wǎng)交換機(jī)工作時(shí),任何一個(gè)端口接收到廣播包后都會(huì)向其他端口完整的發(fā)送一份相同的廣播包并不斷傳遞。如圖1 所示,以太網(wǎng)交換機(jī)接收到來(lái)自1 端口的廣播報(bào)文后分別向2,3,4 端口同時(shí)發(fā)送一份相同報(bào)文。
圖1 交換機(jī)工作原理圖
當(dāng)網(wǎng)絡(luò)通訊中出現(xiàn)成環(huán)現(xiàn)象時(shí),就相當(dāng)于同一個(gè)交換機(jī)的兩個(gè)端口直接相連。如圖2 所示,交換機(jī)3,4 號(hào)端口相連,接收到廣播包的3 端口會(huì)通過(guò)環(huán)網(wǎng)向4 號(hào)端口發(fā)送報(bào)文,同時(shí)4 號(hào)端口會(huì)將接收到的報(bào)文分別發(fā)送至1,2,3 號(hào)端口各一份,如此循環(huán)反復(fù),源源不斷向外界網(wǎng)絡(luò)發(fā)送報(bào)文,直至帶寬消耗殆盡造成網(wǎng)絡(luò)癱瘓。
圖2 單個(gè)交換機(jī)成環(huán)工作原理圖
當(dāng)多個(gè)交換機(jī)相連時(shí)出現(xiàn)同一個(gè)廣播包被同一個(gè)交換機(jī)處理2 次時(shí),就會(huì)產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。如圖3 所示,兩臺(tái)交換機(jī)之間形成一個(gè)環(huán)形結(jié)構(gòu),A3-B1-B2-A4 形成一個(gè)環(huán)路,廣播包會(huì)在環(huán)路中無(wú)限轉(zhuǎn)發(fā),從而觸發(fā)網(wǎng)絡(luò)風(fēng)暴。
圖3 多個(gè)交換機(jī)成環(huán)工作原理圖
現(xiàn)階段風(fēng)電機(jī)組通訊問(wèn)題往往只有在發(fā)生故障時(shí)才會(huì)被察覺(jué),如通訊丟失,信號(hào)閃斷等。因此排查起來(lái)會(huì)消耗大量時(shí)間,處理效率較低,嚴(yán)重影響風(fēng)電機(jī)組有效運(yùn)行監(jiān)控。總結(jié)來(lái)看,風(fēng)電機(jī)組網(wǎng)絡(luò)風(fēng)暴產(chǎn)生原因分為以下幾種。
(1)網(wǎng)絡(luò)設(shè)備
①交換機(jī)購(gòu)買(mǎi)時(shí)錯(cuò)誤購(gòu)買(mǎi)為智能型Hub,在網(wǎng)絡(luò)繁忙時(shí)便會(huì)產(chǎn)生卡頓甚至網(wǎng)絡(luò)風(fēng)暴。
②網(wǎng)卡損壞或交換機(jī)端口損壞,導(dǎo)致向網(wǎng)絡(luò)中發(fā)送大量報(bào)文,不斷轉(zhuǎn)發(fā)形成網(wǎng)絡(luò)風(fēng)暴。
③交換機(jī)即插即用,在環(huán)網(wǎng)冗余通訊不一致的情況下容易產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。
(2)網(wǎng)絡(luò)環(huán)路
①網(wǎng)絡(luò)線路設(shè)計(jì)凌亂,拓?fù)浣Y(jié)構(gòu)復(fù)雜,雙絞線的兩端同時(shí)接在一臺(tái)網(wǎng)絡(luò)設(shè)備中,影響整個(gè)網(wǎng)絡(luò)運(yùn)行環(huán)境。
②斷線修復(fù)時(shí),在連接的一瞬間會(huì)讓環(huán)網(wǎng)形成回路,管理交換機(jī)無(wú)法發(fā)現(xiàn)回路并進(jìn)行阻塞,易產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。
(3)網(wǎng)絡(luò)配置
①技術(shù)人員對(duì)處于調(diào)試階段的風(fēng)電機(jī)組核心交換機(jī)配置時(shí)采用交換機(jī)初始配置,未嚴(yán)格按照風(fēng)電場(chǎng)狀況進(jìn)行虛擬局域網(wǎng)設(shè)置,加大網(wǎng)絡(luò)風(fēng)暴的機(jī)率。
②更換損壞交換機(jī)時(shí)未對(duì)新交換機(jī)進(jìn)行配置,致使網(wǎng)絡(luò)冗余協(xié)議不匹配,產(chǎn)生數(shù)據(jù)丟包等現(xiàn)象,從而引起網(wǎng)路風(fēng)暴[3]。
(4)網(wǎng)絡(luò)病毒
網(wǎng)絡(luò)病毒的傳播會(huì)占據(jù)大量帶寬,引起網(wǎng)絡(luò)阻塞,進(jìn)而引起網(wǎng)絡(luò)風(fēng)暴。常見(jiàn)的網(wǎng)絡(luò)病毒有Funlove、震蕩波、RPC等[4]。
(5)惡劣環(huán)境
震動(dòng)、溫度和電磁干擾等對(duì)網(wǎng)絡(luò)狀況都會(huì)產(chǎn)生一定影響,造成數(shù)據(jù)傳輸錯(cuò)誤,進(jìn)而引發(fā)網(wǎng)絡(luò)風(fēng)暴,電磁干擾尤為嚴(yán)重。風(fēng)電機(jī)組交換機(jī)通常處于塔基變頻器中,溫度較高,易發(fā)生數(shù)據(jù)丟失,導(dǎo)致網(wǎng)絡(luò)風(fēng)暴的產(chǎn)生。
風(fēng)電場(chǎng)環(huán)網(wǎng)通訊中為避免網(wǎng)絡(luò)風(fēng)暴的產(chǎn)生通常會(huì)采用快速生成樹(shù)協(xié)議來(lái)抑制,通過(guò)冗余鏈路結(jié)構(gòu)提高網(wǎng)絡(luò)通訊的可靠性。其工作機(jī)制是通過(guò)阻塞端口來(lái)消除環(huán)路,在發(fā)生故障時(shí)選擇備用鏈路以恢復(fù)網(wǎng)絡(luò)的通訊性。以下是不同故障下RSTP 的拓?fù)渥兓?
(1)根橋故障
如圖4 所示,在鏈路通訊中通過(guò)設(shè)定優(yōu)先級(jí)選定管理型交換機(jī)SWA,用來(lái)監(jiān)測(cè)環(huán)網(wǎng)狀態(tài)。在機(jī)組運(yùn)行時(shí)會(huì)阻塞一條鏈路作為備用,其他交換機(jī)SEB,SWC 會(huì)定期收到管理交換機(jī)發(fā)送的BPDU 報(bào)文,當(dāng)SWA 發(fā)生故障時(shí),超過(guò)Max Age 定時(shí)器設(shè)定時(shí)間便會(huì)選舉新的根橋,SWB 與SWC 相互發(fā)送配置BPDU 報(bào)文,直至根橋交換機(jī)修復(fù)時(shí)再重新選取管理交換機(jī)進(jìn)行通訊。
圖4 通訊網(wǎng)絡(luò)根橋故障圖
(2)鏈路故障
如圖5 所示,交換機(jī)兩兩相連構(gòu)成冗余環(huán)路,設(shè)定SWA 為管理交換機(jī),并阻塞一條鏈路,當(dāng)通訊鏈路發(fā)生故障時(shí),管理交換機(jī)SWA 啟動(dòng)備用鏈路,防止通訊中斷。在通訊鏈路狀態(tài)修復(fù)后,管理交換機(jī)SWA 將再重新選擇備用通路同時(shí)進(jìn)行阻塞防止形成環(huán)路。
圖5 通訊網(wǎng)絡(luò)鏈路故障圖
DRP網(wǎng)絡(luò)為一個(gè)物理上通路但邏輯上斷路的環(huán)形網(wǎng)絡(luò),通過(guò)若干交換節(jié)點(diǎn)相連,并借此實(shí)現(xiàn)網(wǎng)絡(luò)故障檢測(cè)與自動(dòng)恢復(fù)。如圖6 所示。
圖6 組態(tài)完成后的DRP 環(huán)網(wǎng)
在環(huán)網(wǎng)中,首先采用blocking 方式禁用交換機(jī)1 和8間的備用路徑,避免整個(gè)網(wǎng)絡(luò)中環(huán)網(wǎng)的出現(xiàn),以免數(shù)據(jù)報(bào)文在環(huán)網(wǎng)中無(wú)限轉(zhuǎn)發(fā)造成網(wǎng)絡(luò)風(fēng)暴。
其次DRP 網(wǎng)絡(luò)采用環(huán)型拓?fù)浣Y(jié)構(gòu)[5]。相對(duì)于星型網(wǎng)絡(luò)冗余等其他連接結(jié)構(gòu)簡(jiǎn)化了網(wǎng)絡(luò)復(fù)雜度,利于網(wǎng)絡(luò)管理以及降低網(wǎng)絡(luò)構(gòu)建成本;另一方面,DRP 環(huán)網(wǎng)中管理主設(shè)備一角色由網(wǎng)絡(luò)中每個(gè)交換機(jī)輪流承擔(dān),分散了主從式方法中高度集中在固定主交換設(shè)備上的網(wǎng)絡(luò)風(fēng)險(xiǎn),保證了整個(gè)網(wǎng)絡(luò)的正常運(yùn)行。
最后,采用DRP 協(xié)議的控制網(wǎng)絡(luò)或交換機(jī)能夠快速檢測(cè)出物理鏈路和交換機(jī)設(shè)備發(fā)生的故障,并解決由單個(gè)物理鏈路或交換設(shè)備故障而引發(fā)網(wǎng)絡(luò)通信中斷的問(wèn)題,快速恢復(fù)網(wǎng)絡(luò)傳輸功能,很好地解決現(xiàn)有工業(yè)以太網(wǎng)網(wǎng)絡(luò)風(fēng)險(xiǎn)集中,可用性低的問(wèn)題。此外DRP 還支持雙環(huán)冗余系統(tǒng),當(dāng)網(wǎng)絡(luò)采用雙環(huán)冗余時(shí),網(wǎng)絡(luò)對(duì)故障的容錯(cuò)性更強(qiáng),可用性更高。
通過(guò)上述方法可以有效的解決環(huán)網(wǎng)通訊中網(wǎng)絡(luò)風(fēng)暴的產(chǎn)生,但由于安裝配置過(guò)程中操作處理不當(dāng)也會(huì)產(chǎn)生網(wǎng)絡(luò)風(fēng)暴問(wèn)題,以下是某風(fēng)電場(chǎng)環(huán)網(wǎng)通訊中采用快速生成樹(shù)協(xié)議后仍產(chǎn)生網(wǎng)絡(luò)風(fēng)暴的案例分析及處理。
圖7 為某風(fēng)場(chǎng)風(fēng)電機(jī)組通訊監(jiān)控網(wǎng)絡(luò)拓?fù)鋱D,發(fā)生網(wǎng)絡(luò)風(fēng)暴的為C 回路環(huán)網(wǎng),其采用雙環(huán)網(wǎng)的形式連接,每臺(tái)風(fēng)電機(jī)組塔基配備一臺(tái)管理型交換機(jī),每條環(huán)網(wǎng)線路在升壓站監(jiān)控柜配備1 臺(tái)管理型交換機(jī),管理型交換機(jī)采用RSTP通訊協(xié)議。
圖7 C 回路網(wǎng)絡(luò)拓?fù)鋱D
(1)故障現(xiàn)象
①31#風(fēng)機(jī)通訊存在閃斷情況,閃斷持續(xù)數(shù)秒后自動(dòng)恢復(fù);
②C 回路9 臺(tái)機(jī)組在凌晨出現(xiàn)通訊全部中斷,其余回路多臺(tái)機(jī)組出現(xiàn)通訊頻閃,持續(xù)約3 小時(shí)后,SCADA 通訊自行恢復(fù)正常;
③C 回路9 臺(tái)機(jī)組在某天下午出現(xiàn)網(wǎng)絡(luò)風(fēng)暴,導(dǎo)致通訊中斷,現(xiàn)場(chǎng)值班人員在升壓站通過(guò)手動(dòng)斷開(kāi)C 回路交換機(jī)其中一路光纖,使環(huán)網(wǎng)斷開(kāi),約1 分鐘后C 回路9 臺(tái)機(jī)組通訊恢復(fù)正常,網(wǎng)絡(luò)風(fēng)暴消除。
(2)問(wèn)題排查處理
首先從31#風(fēng)機(jī)塔基管理型交換機(jī)(IP192.168.10.131)檢查:
①通過(guò)升壓站監(jiān)控電腦使用ping 連接31#風(fēng)機(jī)交換機(jī),發(fā)現(xiàn)存在數(shù)據(jù)包丟失的情況,丟失率在25%~50%,可以確定31#風(fēng)機(jī)通訊閃斷是由于通訊管理機(jī)通訊不穩(wěn)定導(dǎo)致。
圖8 ping31 號(hào)風(fēng)機(jī)交換機(jī)
②在塔基直接用網(wǎng)線連接31#風(fēng)機(jī)交換機(jī)登錄界面查看端口流量情況,發(fā)現(xiàn)8 端口數(shù)據(jù)異常出現(xiàn)CRC 錯(cuò)誤。
③為定位是否31#風(fēng)機(jī)管理型交換機(jī)接口硬件故障導(dǎo)致端口數(shù)據(jù)異常CRC 錯(cuò)誤,采取將8 端口與7 端口光纖對(duì)調(diào)進(jìn)行排查,發(fā)現(xiàn)8 端口數(shù)據(jù)恢復(fù)正常,7 端口數(shù)據(jù)異常CRC 錯(cuò)誤,可以確定由于外部光纖導(dǎo)致。
④通過(guò)測(cè)量31#機(jī)組原8 端口光纖,并進(jìn)行排查,發(fā)現(xiàn)31#機(jī)組與24#機(jī)組之間,24#機(jī)組側(cè)光纖接線盒至交換機(jī)之間的TX 端口光纖有衰減,因此31#機(jī)組無(wú)法正常接收7 端口的數(shù)據(jù),導(dǎo)致CRC 錯(cuò)誤。更換光纖數(shù)據(jù)恢復(fù)正常。
表1 31號(hào)風(fēng)機(jī)端口流量表
表2 31號(hào)風(fēng)機(jī)端口流量表
(3)網(wǎng)絡(luò)風(fēng)暴原因分析
該風(fēng)場(chǎng)環(huán)網(wǎng)所使用的交換機(jī)采用RSTP(快速生成樹(shù)協(xié)議),對(duì)網(wǎng)絡(luò)風(fēng)暴的產(chǎn)生有一定防范作用,可以有選擇的阻塞端口避免網(wǎng)絡(luò)環(huán)路的形成,并提供備用鏈路協(xié)議,從而避免報(bào)文在環(huán)路的無(wú)限循環(huán)。
通過(guò)現(xiàn)場(chǎng)查看,19#機(jī)組管理型交換機(jī)被自動(dòng)設(shè)置為阻塞狀態(tài)。
表3 19號(hào)風(fēng)機(jī)管理交換機(jī)界面信息表
因此31 號(hào)風(fēng)機(jī)與升壓站交換機(jī)通訊是通過(guò)17#→25#→36#→38#→27#→24#→31#鏈路進(jìn)行。
此前24 號(hào)與31 號(hào)風(fēng)機(jī)之間光纖光功率衰減導(dǎo)致31#、28#風(fēng)機(jī)通訊頻閃,由于24 號(hào)與31 號(hào)風(fēng)機(jī)之間的光纖跳纖較短,在安裝過(guò)程中存在折彎的情況導(dǎo)致光功率衰減,使得此光纖工作在臨界狀態(tài),通訊時(shí)斷時(shí)續(xù),網(wǎng)絡(luò)拓?fù)漕l繁變化。當(dāng)主站收不到檢測(cè)報(bào)文,認(rèn)為環(huán)網(wǎng)存在斷點(diǎn),即打開(kāi)阻塞端口,但交換機(jī)數(shù)據(jù)轉(zhuǎn)發(fā)功能正常,此時(shí)網(wǎng)絡(luò)邏輯成環(huán),因此產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。
(1)網(wǎng)絡(luò)設(shè)備
①使用高質(zhì)量設(shè)備,保證網(wǎng)絡(luò)通信質(zhì)量從交換機(jī)到其他各節(jié)點(diǎn)設(shè)備質(zhì)量過(guò)關(guān),從硬件上減少故障發(fā)生的機(jī)率。
圖9 C 回路環(huán)網(wǎng)示意圖
②合理選用網(wǎng)絡(luò)傳輸介質(zhì),對(duì)雙絞線,光纖的選取應(yīng)根據(jù)應(yīng)用內(nèi)容,應(yīng)用場(chǎng)所以及地區(qū)實(shí)際條件進(jìn)行,保障線路通暢。
③盡量使用同品牌,同型號(hào)的交換機(jī)和通訊光纖,最大程度確保節(jié)點(diǎn)端口的一致性。
④光纖安裝符合規(guī)范,避免可能造成光纖扭絞的情況,應(yīng)順著光纖自然松弛狀態(tài)進(jìn)行盤(pán)纖。
⑤采用可檢測(cè)光功率的交換機(jī),注意日常維護(hù)交換機(jī)和相應(yīng)光纖,特別注意短跳纖。
(2)網(wǎng)絡(luò)環(huán)路
掌握網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),網(wǎng)絡(luò)線路設(shè)計(jì)清晰化,對(duì)備用線路實(shí)施統(tǒng)一管理,避免無(wú)意間連接構(gòu)成回路。
(3)網(wǎng)絡(luò)配置
①在調(diào)試通訊環(huán)網(wǎng)時(shí),對(duì)交換機(jī)網(wǎng)絡(luò)冗余實(shí)施科學(xué)配置,當(dāng)更換交換機(jī)后仍需對(duì)新的交換機(jī)重新進(jìn)行配置并校驗(yàn),保證通訊網(wǎng)絡(luò)中網(wǎng)絡(luò)冗余協(xié)議始終保持匹配狀態(tài)。
②使用網(wǎng)絡(luò)監(jiān)控設(shè)備,及時(shí)發(fā)現(xiàn)并處理。對(duì)交換機(jī)端口通訊狀態(tài)進(jìn)行監(jiān)測(cè),報(bào)文轉(zhuǎn)發(fā)超過(guò)設(shè)定閾值便丟棄此端口所有數(shù)據(jù)并堵塞;低于閾值時(shí),進(jìn)入正常監(jiān)測(cè)狀態(tài)。此過(guò)程中可以使用協(xié)議類(lèi)分析軟件SnifferPRO,圖表形式展現(xiàn)更加直觀,可以達(dá)到有效預(yù)防的目的。
③采用VLAN 技術(shù)。通過(guò)在交換機(jī)上不同的實(shí)現(xiàn)方法控制廣播,從而大大減少?gòu)V播對(duì)網(wǎng)絡(luò)帶寬的占用,提高了帶寬的傳輸效率,有效的避免網(wǎng)絡(luò)風(fēng)暴產(chǎn)生[6]。
(4)網(wǎng)絡(luò)病毒
安裝網(wǎng)絡(luò)版殺毒軟件并及時(shí)升級(jí),開(kāi)啟監(jiān)控功能,卸載不必要的服務(wù),關(guān)閉不必要的端口,以提高系統(tǒng)的安全性和可靠性。
(5)環(huán)境
掌握風(fēng)場(chǎng)網(wǎng)絡(luò)運(yùn)行條件,對(duì)設(shè)備安裝位置進(jìn)行合理裝配,尤其考慮溫度,磁場(chǎng)等情況。嚴(yán)格執(zhí)行接地要求,特別是涉及遠(yuǎn)程線路的轉(zhuǎn)接設(shè)備,并且定期對(duì)設(shè)備進(jìn)行保養(yǎng)。
本文針對(duì)風(fēng)電場(chǎng)網(wǎng)絡(luò)風(fēng)暴進(jìn)行研究,闡述了網(wǎng)絡(luò)風(fēng)暴的成因及應(yīng)對(duì)策略,介紹了一起采用快速生成樹(shù)協(xié)議后仍產(chǎn)生網(wǎng)絡(luò)風(fēng)暴的實(shí)例,以網(wǎng)絡(luò)拓?fù)錇榛A(chǔ),逐步介紹網(wǎng)絡(luò)風(fēng)暴發(fā)生、分析和處理的過(guò)程,最后提出網(wǎng)絡(luò)風(fēng)暴的預(yù)防辦法,確保了風(fēng)電機(jī)組的有效監(jiān)控。