曹海歐,吳 迪,薛 飛,王義波,孫弘毅,楊金龍
(1.國網(wǎng)江蘇省電力有限公司,江蘇南京 210000;2.國網(wǎng)湖北省電力有限公司,湖北武漢 430070;3.國網(wǎng)宿遷供電分公司,江蘇宿遷 223800;4.武漢凱默電氣有限公司,湖北武漢 430223;5.三峽大學(xué)電氣與新能源學(xué)院,湖北宜昌 443000)
隨著我國電力科技的發(fā)展,數(shù)字技術(shù)、通訊技術(shù)和控制技術(shù)等先進(jìn)技術(shù)相融合正推動(dòng)傳統(tǒng)電力系統(tǒng)向高度數(shù)字化、智能化的方向演進(jìn)[1-3]。智能變電站是智能電網(wǎng)的關(guān)鍵組成部分,其二次系統(tǒng)的網(wǎng)絡(luò)化雖然加強(qiáng)了設(shè)備之間的相互聯(lián)系,但也帶來了巨量的系統(tǒng)狀態(tài)信息,導(dǎo)致在發(fā)生故障時(shí),對故障進(jìn)行快速定位及分析變得尤為困難[4-6]。深度學(xué)習(xí)有著卓越的數(shù)據(jù)分析能力,能夠準(zhǔn)確快速定位到二次系統(tǒng)的故障點(diǎn),利用人工智能來實(shí)現(xiàn)對二次設(shè)備故障的精確分析已成為智能電網(wǎng)建設(shè)的一個(gè)重要方向。
在傳統(tǒng)故障分析方面,文獻(xiàn)[7]將數(shù)據(jù)進(jìn)行對比,依據(jù)結(jié)果對設(shè)備的運(yùn)行狀況評(píng)估,提出了趨勢評(píng)估策略,但該方法只適用于歷史數(shù)據(jù)較全的情況,當(dāng)新故障發(fā)生時(shí)所得結(jié)果將出現(xiàn)較大偏差。文獻(xiàn)[8]采用舉證法,利用二次系統(tǒng)通信鏈路特征得到了網(wǎng)絡(luò)發(fā)生故障的范圍,此方法適用性不強(qiáng),無法對故障特征進(jìn)行進(jìn)一步分析。文獻(xiàn)[9]建立了故障樹,以此得到設(shè)備發(fā)生故障時(shí)與告警信號(hào)的聯(lián)系,雖能夠分析更多的故障特征,但當(dāng)告警信號(hào)較多時(shí),無法準(zhǔn)確實(shí)現(xiàn)故障定位。
在人工智能的應(yīng)用方面,文獻(xiàn)[10]分析了不同機(jī)器學(xué)習(xí)算法之間的差異,并將其進(jìn)行綜合,提出了二次設(shè)備狀態(tài)評(píng)估法,該方法雖然獲得了更好的評(píng)估效果,但加大了訓(xùn)練量,過程繁雜。文獻(xiàn)[11]分析了故障特征,同時(shí)利用循環(huán)神經(jīng)網(wǎng)絡(luò),能夠更為準(zhǔn)確地定位故障,同時(shí)增強(qiáng)了容錯(cuò)能力,但會(huì)面臨維度過高導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)過于復(fù)雜以及訓(xùn)練樣本不均衡問題。文獻(xiàn)[12]利用深度置信網(wǎng)絡(luò)對故障狀態(tài)進(jìn)行提取,雖然能實(shí)現(xiàn)故障定位辨識(shí),但其搜索范圍較大,樣本難以獲取完全。
本文提出了1 種基于改進(jìn)蝙蝠算法優(yōu)化概率神經(jīng)網(wǎng)絡(luò)(Bat Algorithm Optimizes Probabilistic Neural Networks,BA-PNN)的智能變電站二次設(shè)備故障定位策略。首先,提出了1 種改進(jìn)蝙蝠算法優(yōu)化概率神經(jīng)網(wǎng)絡(luò)方法來提升PNN 的性能;其次,基于故障特征集搭建BA-PNN 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),搭建了基于BA-PNN 神經(jīng)網(wǎng)絡(luò)的故障定位模型;然后,根據(jù)大量樣本對BA-PNN 進(jìn)行訓(xùn)練,訓(xùn)練成功后,將BAPNN 網(wǎng)絡(luò)保存為模型。最后,以經(jīng)典的智能變電站線路間隔示例,通過不同算法的比較和分析,驗(yàn)證所提方法的有效性和準(zhǔn)確性。
PNN 的實(shí)質(zhì)是1 個(gè)分類器,通過實(shí)現(xiàn)貝葉斯決策,獲得分類的結(jié)果,具體實(shí)現(xiàn)方法為概率密度函數(shù)的無參估計(jì)[13-14]。概率神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)由輸入層、模式層、求和層和輸出層4 部分組成,其結(jié)構(gòu)如圖1 所示。其中,xt為輸入層輸入的特征量,t為特征量的總數(shù),該層神經(jīng)元的個(gè)數(shù)與樣本特征量的數(shù)量相同;xi,j為第i分類中的第j個(gè)樣本,該層神經(jīng)元個(gè)數(shù)與輸入樣本的數(shù)量相同,假設(shè)其獨(dú)立且同分布;Pi(xt)為第i類分類的高斯分布概率分布函數(shù)(Gaussian Distribution Probability Distribution Function,PDF),該層的神經(jīng)元個(gè)數(shù)和PNN 分類模式的數(shù)量相同;D(xt)為輸入層xt的輸出,對求和層Pi(xt)進(jìn)行概率評(píng)估。
圖1 PNN結(jié)構(gòu)圖Fig.1 PNN structure diagram
在PNN 體系結(jié)構(gòu)中,通常用高斯函數(shù)作為計(jì)算單元[15]。求和層神經(jīng)元將從模式層獲得的每個(gè)類別的輸出加起來[16],Pi(xt)可表示為:
式中:d為訓(xùn)練數(shù)據(jù)集的維數(shù);Ni為第i類模式總數(shù);xt為模式層矩陣;xij為樣本層矩陣;σ為平滑參數(shù)。
D(xt)可表示為:
式中:k為模式層分類數(shù)。
蝙蝠算法(Bat Algorithm,BA)是1 種根據(jù)蝙蝠的回聲定位能力和其他相關(guān)行為得到的仿生優(yōu)化算法[17-18]。設(shè)蝙蝠在Pz位置隨機(jī)飛行,速度為Vz,最大聲波脈沖頻率為fmax,最小聲波脈沖頻率為fmin,n為虛擬蝙蝠的數(shù)量。對于給定查詢空間中的位置Pz和速度Vz的變化,每個(gè)時(shí)間步長s內(nèi)估計(jì)的位置和速度的解可以表示為[19]:
式中:fz為個(gè)體蝙蝠聲波脈沖頻率;β為從均勻分布中獲得的隨機(jī)數(shù);P?為從n個(gè)蝙蝠中獲得的當(dāng)前局部最佳位置;和分別為z次迭代中蝙蝠個(gè)體在步長s+1 處飛行的速度和位置。
每個(gè)蝙蝠都是根據(jù)響度和脈沖發(fā)射率參數(shù)的隨機(jī)值分配的,這2 個(gè)參數(shù)控制密集局部搜索。
在局部搜索中選擇最優(yōu)解后,使用隨機(jī)游動(dòng)生成新的解,此時(shí)位置更新可以表示為:
式中:Pold為最優(yōu)蝙蝠個(gè)體的位置;Pnew為隨機(jī)游動(dòng)后的最優(yōu)蝙蝠個(gè)體的位置;ε為變化系數(shù),ε∈[-1,1];Ar為i次迭代中種群的平均響度。
在傳統(tǒng)PNN 中,由于高斯函數(shù)的性質(zhì)與隨機(jī)變量的性質(zhì)相似,通常使用高斯函數(shù)作為計(jì)算單元。為了將PNN 的性能通過合并達(dá)到優(yōu)化,本文選擇使用拉普拉斯分布。拉普拉斯分布具有尖峰和較寬的尾部,有助于獲得非線性決策邊界,提高了模型對異常值的魯棒性。高斯分布和拉普拉斯分布的差異如圖2 所示。此時(shí),第i類求和神經(jīng)元輸出Fi(xt)的表達(dá)式為:
圖2 拉普拉斯分布與高斯分布的差異Fig.2 Difference between Laplacian distribution and Gaussian distribution
式中:Wij為第i分類第j樣本的權(quán)重向量;σij為第i分類第j樣本的平滑參數(shù)。
此外,為了保證分類的準(zhǔn)確性,利用向量的分布差來代替范數(shù)差,在PNN 中第i分類第j樣本的權(quán)重向量Wij可以表示為[20]:
式中:Avg_distancei為范數(shù)距離,表示第i分類中不同樣本距離分類中心的平均值;rij為第i分類第j樣本的距離期望值;μi為第i分類中所有樣本的距離期望值。
PNN 的網(wǎng)絡(luò)性能取決于平滑因子σ,如果平滑因子的選取不當(dāng),算法會(huì)收斂不到合適的解[21]。本文根據(jù)神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性、特異性和靈敏度提出了1 種基于BA 的適應(yīng)度函數(shù)來選取PNN 的平滑因子的方法,改進(jìn)優(yōu)化算法的效果取決于決定解質(zhì)量的適應(yīng)度函數(shù)。
設(shè)神經(jīng)網(wǎng)絡(luò)的靈敏度函數(shù)為A,特異性函數(shù)為B,則A,B可分別表示為:
式中:TP為正樣本識(shí)別個(gè)數(shù);FN為未被識(shí)別的正樣本個(gè)數(shù);TN為負(fù)樣本識(shí)別個(gè)數(shù);FP為未被識(shí)別的負(fù)樣本個(gè)數(shù)。
為了獲得最佳的分類模型,需要獲得盡可能大的靈敏度和特異性,BA-PNN 的適應(yīng)度函數(shù)Minf(A,B)可表示為:
式中:φ為p1和p2達(dá)到平衡時(shí)的熵,表示p1和p2達(dá)到平衡時(shí),式(9)可以取得最值的程度。
適應(yīng)度函數(shù)如圖3 所示。圖3 內(nèi)部點(diǎn)的位置表示σij。利用BA 算法尋找σij的最優(yōu)解,其聲波脈沖頻率f和隨機(jī)數(shù)β需要滿足約束:
圖3 適應(yīng)度函數(shù)Fig.3 Fitness function
BA-PNN 算法分為2 個(gè)階段。在第1 階段,設(shè)計(jì)一種新的適應(yīng)度函數(shù),基于BA 求解模式層中的平滑因子最優(yōu)值σi。在第2 階段,在求和層中將平滑因子σi代入到拉普拉斯分布中計(jì)算每個(gè)樣本輸出的總和。訓(xùn)練流程圖如圖4 所示。
圖4 BA-PNN訓(xùn)練流程Fig.4 BA-PNN training process
當(dāng)二次設(shè)備(合并單元、繼電保護(hù)裝置、測控裝置等)發(fā)生故障時(shí),故障信息以報(bào)文的方式通過站控層和間隔層網(wǎng)絡(luò)發(fā)送給繼電保護(hù)信息系統(tǒng),信息系統(tǒng)的數(shù)據(jù)采集單元采集得到報(bào)文,再由管理單元分析報(bào)文,完成配置、預(yù)整理、過濾等一系列措施后,得到故障信息?;诖罅康亩卧O(shè)備故障歷史信息,分離出與故障元件緊密相關(guān)的故障信息,并通過查閱相關(guān)文獻(xiàn)資料及技術(shù)規(guī)范[22-25],二次設(shè)備常見的故障特征信息如表1 所示,包含二次設(shè)備采樣值(Sampled Value,SV)和二次設(shè)備通用面向?qū)ο蟮淖冸娬臼录℅eneric Object Oriented Substation Event,GOOSE)。
表1 二次設(shè)備常見的故障類型及其特征信息Table 1 Common fault types and characteristics of secondary equipment
對二次設(shè)備故障類型進(jìn)行分類編號(hào),并采集警告信息。采集的數(shù)據(jù)類型為開關(guān)量,當(dāng)收到警告信息時(shí)值為1,無警告信息時(shí)值為0。其運(yùn)行狀態(tài)信息模型如表2 所示。
表2 二次設(shè)備的運(yùn)行狀態(tài)信息模型Table 2 Operating status information model of secondary equipment
當(dāng)故障發(fā)生后,構(gòu)造故障特征集Xs表征故障,第s起故障事故的故障特征集Xs為:
式中:XZTs為二次設(shè)備運(yùn)行狀態(tài)數(shù)據(jù);XSGs為SV/GOOSE 接收狀態(tài)數(shù)據(jù);XCYs為采樣值數(shù)據(jù);N為故障事故的數(shù)量。
二次設(shè)備運(yùn)行狀態(tài)數(shù)據(jù)XZTi主要為智能終端、合并單元和保護(hù)裝置的自檢信息狀態(tài),如式(12)所示:
式中:k,m和u分別為二次系統(tǒng)中智能終端、合并單元和保護(hù)裝置的總數(shù);XML_m,XPL_u和XIT_k為故障時(shí)第m個(gè)合并單元、第u個(gè)保護(hù)裝置和第k個(gè)智能終端的軟硬件自檢信息,包括自檢異常Scan、同步異常Cab、版本錯(cuò)誤Ver、裝置閉鎖Lout、內(nèi)存出錯(cuò)Mer、校驗(yàn)出錯(cuò)Cer等。
SV/GOOSE 鏈路狀態(tài)信息XSGs主要包括二次設(shè)備的SV/GOOSE 鏈路報(bào)文接收狀態(tài)XSs和XGs,如式(13)所示:
式中:XSV_l為第l條SV 鏈路的狀態(tài)信息;XGOOSE_w為第w條GOOSE 鏈路的狀態(tài)信息。
采樣值XCYs為保護(hù)裝置雙通道A,B,C 三相電壓電流采樣值,如式(14)所示。
式中:C1和C2分別為通道1 和通道2 中的三相電壓電流采樣值;I,U為電流和電壓;1,2 為通道1 和通道2。
本文采用深度學(xué)習(xí)的方法構(gòu)建一個(gè)非線性映射模型,將多維度故障特征數(shù)據(jù)映射到故障發(fā)生處。其相應(yīng)映射關(guān)系如圖5 所示。
圖5 故障信息和故障類型的映射關(guān)系Fig.5 Mapping between fault information and fault types
本文故障定位框架流程圖如圖6 所示。
圖6 基于BA-PNN的故障定位流程圖Fig.6 Fault location flowchart based on BA-PNN
1)在特定的故障范圍內(nèi),運(yùn)用故障特征集的方法,選擇歷史故障特征數(shù)據(jù)。
2)構(gòu)建BA-PNN 神經(jīng)網(wǎng)絡(luò)框架,基于拉普拉斯分布和BA 平滑因子σij對輸入的數(shù)據(jù)進(jìn)行分類,輸出故障位置結(jié)果。
3)根據(jù)大量樣本對BA-PNN 進(jìn)行訓(xùn)練,通過對參數(shù)進(jìn)行改進(jìn),來獲得最高的定位準(zhǔn)確度。
4)完成訓(xùn)練,將BA-PNN 網(wǎng)絡(luò)保存為模型。當(dāng)二次系統(tǒng)遇到故障或異常時(shí),只要有斷面故障特征數(shù)據(jù),即可得到故障部分的位置。
為驗(yàn)證所提智能變電站二次設(shè)備系統(tǒng)故障定位方法的有效性,本文以典型智能變電站線路間隔為例,檢驗(yàn)所提的故障定位方法,圖7 為其保護(hù)區(qū)段拓?fù)浣Y(jié)構(gòu)。其中,J1—J12 表示光纖編號(hào)。
圖7 保護(hù)區(qū)段拓?fù)浣Y(jié)構(gòu)Fig.7 Topology of protected section
在該保護(hù)區(qū)段中含12 條鏈路,該間隔的報(bào)文信息流如表3 所示。
表3 報(bào)文間隔信息流Table 3 Packet interval information flow
建立的訓(xùn)練樣本的輸入矩陣如表4 所示,一共選擇7 個(gè)特征量,輸入節(jié)點(diǎn)為7,每1 列為1 個(gè)樣本值。由于篇幅原因,故障分析中故障位置最多為2個(gè),僅展示6 個(gè)樣本的輸入矩陣。
表4 6個(gè)訓(xùn)練樣本的輸入矩陣Table 4 Input matrix of training samples
對6 個(gè)樣本進(jìn)行故障類型編號(hào),并對每個(gè)故障類型進(jìn)行故障定位模擬,其中訓(xùn)練樣本總數(shù)為4 703,測試樣本總數(shù)為1 192。對測試樣本進(jìn)行檢測以得到最終的訓(xùn)練效果,如果檢測的正確率達(dá)到95%以上,訓(xùn)練結(jié)束。BA-PNN 訓(xùn)練結(jié)果如表5 所示。
表5 BA-PNN訓(xùn)練結(jié)果Table 5 Results of BA-PNN training
為了證明算法的穩(wěn)定性,將測試樣本作為模型的輸入,進(jìn)行故障類型預(yù)測,選擇50 個(gè)樣本運(yùn)用到模型中。模型預(yù)測分類結(jié)果如圖8 所示。
圖8 BA-PNN預(yù)測結(jié)果Fig.8 BA-PNN prediction results
在選出的50 個(gè)預(yù)測樣本中,樣本10 和樣本22預(yù)測錯(cuò)誤,BA-PNN 的預(yù)測正確率達(dá)到96%,滿足系統(tǒng)對精確度的要求。
在樣本訓(xùn)練故障定位模型的過程中,選擇平滑因子和訓(xùn)練樣本為自變量,模型準(zhǔn)確率為因變量,對BA-PNN 訓(xùn)練模型的性能進(jìn)行分析,計(jì)及參數(shù)變化對故障定位精度的影響,其結(jié)果如圖9 所示。
圖9 不同參數(shù)下的定位準(zhǔn)確度Fig.9 Positioning accuracy under different parameters
由圖9 可知,訓(xùn)練樣本越多,故障定位的分類準(zhǔn)確率也越來越高。而最初的分類準(zhǔn)確率首先隨著平滑因子σ的增加而增加,然后隨著σ的增加而降低。
平滑因子的選擇對于分類器性能的影響較為明顯。為了找出網(wǎng)絡(luò)內(nèi)最優(yōu)平滑因子σ,設(shè)置不同的平滑因子,輸入數(shù)據(jù)集測試準(zhǔn)確度。使用BAPNN 算法時(shí)不同σ與定位準(zhǔn)確率的關(guān)系如圖10 所示。當(dāng)平滑因子設(shè)置為0.7 時(shí),本文算法定位精度可達(dá)到94.96%。
圖10 準(zhǔn)確度與平滑因子的關(guān)系Fig.10 Relationship between accuracy and smoothing factor
為了更好地說明BA-PNN 算法利用拉普拉斯分布和改進(jìn)權(quán)重系數(shù)后的優(yōu)勢,將BA-PNN 與常規(guī)PNN 算法進(jìn)行比較,分析相同平滑因子下不同算法的精度區(qū)別,兩者方法的測試精度結(jié)果如圖11 所示。與PNN 相比,BA-PNN 在不同σ條件下測試精度均高于PNN 算法。
圖11 不同方法的測試精度對比Fig.11 Comparison of test accuracy with different methods
為了分析本文所提方法的性能,將傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)算法、PNN 算法和BA-PNN 算法進(jìn)行對比。按照神經(jīng)網(wǎng)絡(luò)在故障定位中的分析流程,輸入相同的數(shù)據(jù)樣本進(jìn)行故障定位分析對比。不同方法的準(zhǔn)確性與誤差對比結(jié)果如圖12 所示。
圖12 不同定位方法的性能分析Fig.12 Performance analysis with different positioning methods
對比表明,當(dāng)系統(tǒng)出現(xiàn)故障診斷需求時(shí),BAPNN 算法在準(zhǔn)確率和誤差率兩方面均優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法和PNN 算法,能夠更為精確地對故障進(jìn)行定位和分析,同時(shí)也增強(qiáng)了故障定位分析的魯棒性。
針對概率神經(jīng)網(wǎng)絡(luò)在二次設(shè)備故障定位中訓(xùn)練規(guī)模較大、容易受到平滑因子干擾的問題,本文提出了一種基于BA-PNN 的智能變電站二次設(shè)備故障定位方法。
算例表明,將拉普拉斯分布代替高斯分布提升了數(shù)據(jù)分布量度的準(zhǔn)確性,同時(shí)適應(yīng)度函數(shù)可以在靈敏度和特異性之間保持平衡,提出基于BA-PNN的二次設(shè)備故障定位模型具有準(zhǔn)確處理故障定位的能力,與傳統(tǒng)BP 算法和PNN 算法相比,具有更高的準(zhǔn)確性和更小的誤差。但考慮到不同智能變電站存在結(jié)構(gòu)、規(guī)模以及配置方面的差異本文所提方法仍然存在一定的局限性。在平滑因子的選擇上雖然本文的方法可以迭代出神經(jīng)網(wǎng)絡(luò)的最優(yōu)平滑因子,但面對大規(guī)模故障樣本時(shí),會(huì)加大迭代過程的復(fù)雜性,從而增加人工與時(shí)間成本。