張?zhí)K,郭裕鈞,張血琴,寧曉雁,尹彩琴
(1.國網(wǎng)經(jīng)濟技術(shù)研究院有限公司,北京 102200;2.西南交通大學(xué),四川 成都 611731)
電力系統(tǒng)由發(fā)電廠、變電站、供配電線路以及各類用電負荷組成,涉及發(fā)輸變配用各個環(huán)節(jié),輸電線路作為其中的重要一環(huán),是實現(xiàn)電廠與用戶連接的紐帶。線路故障包括短路故障與斷線故障[1],最為常見的是各種類型的短路,其中單相接地故障的發(fā)生率超過90%,三相短路發(fā)生的概率最低但危害最嚴重。當系統(tǒng)發(fā)生短路時,往往伴隨電流的突增與電壓的驟降,除此之外,還有一些非電氣量的變化。配電網(wǎng)發(fā)生短路故障時,如果由于故障定位不準確而不能及時切除,可能會給供變電設(shè)備帶來不可逆的危害,影響供電穩(wěn)定性[2]。
輸電系統(tǒng)由于長期暴露于野外,受到周圍環(huán)境諸如暴風雨雪、鳥禽以及其他因素的影響,難免遭受電氣故障的侵擾[3]。從故障來源的角度分析,線路故障的成因主要來自線路本身與外界環(huán)境兩個方面。其中,自身因素主要是輸電線路運行過程中由于線路接地、線路短路和超負荷等導(dǎo)致的故障[4];環(huán)境因素則是由于雷電、污蝕、機械傷害以及導(dǎo)線腐蝕等導(dǎo)致的故障[5]。系統(tǒng)發(fā)生故障后,應(yīng)當盡快提取故障特征以確定故障點位置和類型并果斷切除[6]。對故障的精準定位可以極大縮短維修時間與維修成本,縮小停電范圍,盡可能減小對用戶的影響,提高電網(wǎng)供電的可靠性。除此之外,識別故障位置還有利于預(yù)防性的維護,減小運維人員的勞動量等。
諸多學(xué)者對輸電線路的故障診斷進行研究[7-10]。傳統(tǒng)的故障診斷方法有行波法[11-12]和阻抗法[13],行波法隨著新能源大量接入電網(wǎng)適用性降低,而阻抗法在線路結(jié)構(gòu)復(fù)雜時計算效率大大下降。隨著數(shù)據(jù)采集與監(jiān)控系統(tǒng)(Supervisory Control And Data Acquisition,SCADA)應(yīng)用于電網(wǎng),一些智能算法如專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)[14-16]、模糊理論[17-18]、Petri 網(wǎng)、粗糙集理論[19-20]等開始嶄露頭角。專家系統(tǒng)是早期使用且相對成熟的一種診斷方法,其核心在于專家知識庫和推理機的構(gòu)建,在面對復(fù)雜故障時,診斷速度緩慢甚至可能出現(xiàn)錯誤。人工神經(jīng)網(wǎng)絡(luò)雖然在一定程度上可以避免專家知識庫構(gòu)建的難題,更穩(wěn)定地進行故障診斷,但對于電力系統(tǒng)的規(guī)模有要求,難以滿足大規(guī)模的電力系統(tǒng)的使用需求。模糊集理論通常會與其他診斷方法一起使用,對系統(tǒng)中不確定的故障信息有一定辨識能力,但診斷系統(tǒng)的結(jié)構(gòu)相對固定,一旦發(fā)生變化,就需要對診斷規(guī)則做出改變,維護性能差。Petri 網(wǎng)診斷方法以網(wǎng)絡(luò)理論為基礎(chǔ),注重事件時序,對于大規(guī)模復(fù)雜電網(wǎng)的診斷能力較差,無法正確識別錯誤和警告信息。粗糙集理論只適用于中小型電力系統(tǒng),對于大規(guī)模復(fù)雜電網(wǎng)的故障無法正確診斷,但在信息殘缺問題的處理上有一定優(yōu)勢。上述方法雖然有較多的應(yīng)用,但仍具有局限性,除了這些算法外,還有一些相對研究較少的智能算法諸如免疫算法、布谷鳥算法[21]和蝙蝠算法等,在計算的準確性和容錯性方面都有所改善。另外,由于單一的智能方法進行故障診斷仍然存在較大的局限性,且尋優(yōu)過程可能無法達到理想效果。因此近幾年診斷算法的混合優(yōu)化成為了研究的熱點,將不同算法不同優(yōu)勢進行結(jié)合,揚長避短,在解決大規(guī)模、結(jié)構(gòu)復(fù)雜的故障問題方面具有優(yōu)越性。中國地質(zhì)大學(xué)的吳笑民[22]等人考慮到支持向量機模型參數(shù)的問題,利用遺傳算法對其進行優(yōu)化并通過D-S 證據(jù)理論融合方不同支持向量機模型的診斷結(jié)果,使得診斷準確率穩(wěn)定達到97%,還有學(xué)者將模糊邏輯[23]、小波分析[24]與支持向量機(Support Vector Machine,SVM)結(jié)合對輸電線路故障進行診斷分類,均具有較好的效果。
通過搭建配電線路的四分支仿真模型,分析線路不同位置在正常運行以及發(fā)生不對稱故障(單相接地、相間故障)時的電氣量變化,將支持向量機與隨機森林二者相互結(jié)合,對線路故障類型進行診斷與辨識。結(jié)果表明,通過測量故障前后電流與電壓參量的變化可用于推敲故障點位置以及故障類型,該方法能夠?qū)崿F(xiàn)線路故障的快速定位與及時切除。
算法是目前學(xué)術(shù)界公認的,在機器學(xué)習(xí)、模式識別及神經(jīng)網(wǎng)絡(luò)最有影響力的成就之一[25]。SVM 基于數(shù)理統(tǒng)計中較全新的理論,兼顧訓(xùn)練誤差與泛化能力,無須依賴數(shù)據(jù)且不存在局部極小值問題,其核心思想在于求解出能正確劃分樣本數(shù)據(jù)集,且滿足幾何間隔最大的分離超平面。該理論能實現(xiàn)對二維數(shù)據(jù)的線性和非線性可分。其原理如圖1所示[26]。
圖1 SVM原理
圖1 中,分別使用實心圈和空心圈代表待分類的兩類樣本數(shù)據(jù),實線用來表示分類的超平面;兩條虛線指的是能夠準確區(qū)分兩類樣本數(shù)據(jù)且與超平面距離最短的兩個平面,這兩個平面之間的距離表示分類間隔,兩條虛線附近紅色的圈代表待分類的支持向量機,w表示超平面的法向量。
假定訓(xùn)練樣本為Di=(xi,yi),i=1,2,…,n,yi={1,-1},其中,xi表示源數(shù)據(jù),yi表示類別值,超平面為w·X+b=0,定義超平面與樣本點的幾何間隔為δi=,需要滿足的約束條件是在準確區(qū)分樣本數(shù)據(jù)的基礎(chǔ)上使得間隔最大,因此可將該分類問題轉(zhuǎn)化為求解帶約束條件表達式的最小值問題:
SVM 算法的數(shù)學(xué)本質(zhì)是求解二次優(yōu)化問題,最終結(jié)果為無解或只有一個極值。若低維樣本空間難以進行線性處理可將其上升至高維空間轉(zhuǎn)化成線性問題再運算,比如很多二維不可分的問題在轉(zhuǎn)換至三維空間卻能線性可分。SVM 分類模型構(gòu)建的基本步驟如圖2所示[27]。
圖2 SVM分類步驟
目前,常規(guī)的SVM算法只能用于二分類,對于數(shù)據(jù)缺失情況容易出現(xiàn)分類錯誤。因此,常將SVM算法和其他算法融合使用,取長補短,提高算法的正確性。如劉永梅等人[28]將SVM 和神經(jīng)網(wǎng)絡(luò)融合進行觸電電流檢測;葉遠波等人[29]將麻雀搜索算法(Sparrow Search Algorithm,SSA)和SVM 結(jié)合用于評估繼電保護裝置狀態(tài);方科等人[30]將SVM 和自適應(yīng)粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法融合用于變壓器絕緣故障診斷。融合算法的使用大大提升了評估、檢測以及故障診斷的準確性。
在故障診斷研究中,單一的分類算法均具有各自的缺陷,而集成的分類器通過將單一的分類器進行結(jié)合能夠提高分類效果,具有較高的準確率[31],比如隨機森林(Randon Forest,RF)。隨機森林的核心主要體現(xiàn)在“隨機”和“森林”兩個方面,“隨機”是指在構(gòu)建決策樹和環(huán)節(jié)中,采用有放回的抽樣方式,故所產(chǎn)生的每棵決策樹均具有隨機性;“森林”是指所產(chǎn)生的諸多決策樹彼此之間相互獨立,也正因如此,這些互不相關(guān)的決策樹才會產(chǎn)生涵蓋所有可能結(jié)果的預(yù)測值,不同預(yù)測值對最終結(jié)果的影響有差別,這之中少數(shù)較優(yōu)的預(yù)測結(jié)果會“脫穎而出”,最終投票的結(jié)果具有較好的可解釋性[32]。目前隨機森林算法被廣泛應(yīng)用于輸電線路的故障檢測環(huán)節(jié),且得到了不錯的應(yīng)用效果。楊杰和李旭明等人[33-34]均是采用隨機森林的模型對輸電線路進行故障診斷,且診斷的特征量均是電流量,檢測結(jié)果均具有較高的準確性。
隨機森林不僅能夠?qū)斎氲母呔S特征樣本進行重要性評估,而且對于缺省值問題有很好的預(yù)測效果。美中不足的是,在某些干擾較大的分類和回歸問題上,隨機森林容易出現(xiàn)過擬合現(xiàn)象,而且不同屬性值所占比例也可能會影響最終分類或回歸結(jié)果。
因此,通??梢钥紤]改進隨機森林算法或?qū)⑵渑c其他算法融合使用,主要體現(xiàn)為兩方面:一是對構(gòu)建決策樹算法進行改進和優(yōu)化,二是對樣本數(shù)據(jù)進行預(yù)處理,使其具有更好的適配性。本文主要是考慮將SVM 算法用于隨機森林決策樹的構(gòu)建,以此達到提升故障診斷正確率的目的。
1.3.1 SVM-RF模型框架
SVM-RF模型主要由核函數(shù)選擇、決策樹構(gòu)建和分類器三部分組成。在模型訓(xùn)練前,需要先對樣本數(shù)據(jù)進行預(yù)處理,再選擇最優(yōu)的核函數(shù),進而利用SVM對其進行模型訓(xùn)練[35];隨后利用SVM 有放回地抽取數(shù)據(jù)使之構(gòu)成決策樹,多個互不相關(guān)的決策樹構(gòu)建成完整的隨機森林模型,最后使用這個模型進行電力線路故障類型診斷。模型的總體框架如圖3所示。
圖3 SVM-RF模型框架
第一部分是核函數(shù)選擇。當要對輸入空間的樣本進行非線性分類時,由于目標函數(shù)和分類決策函數(shù)都只涉及實例和實例之間的內(nèi)積,通常利用核函數(shù)代替當中的內(nèi)積。常用的核函數(shù)有:高斯核函數(shù)、S型核函數(shù)、h度多項式核函數(shù)等。文章對比常用的幾種核函數(shù)使用時SVM 算法的正確率,并通過交叉驗證選擇出最佳參數(shù)C和g。
第二部分是決策樹構(gòu)建?;谇笆霾煌撕瘮?shù)的情況,有放回地進行抽樣,構(gòu)建多個互不相關(guān)的SVM決策樹。
第三部分是分類器。將第二部分構(gòu)建的多個互不相關(guān)的SVM 決策樹用于構(gòu)建隨機森林分類器,最終形成SVM-RF 分類模型,以此實現(xiàn)樣本數(shù)據(jù)的分類預(yù)測功能。
1.3.2 SVM-RF算法流程
基于SVM-RF 的電力線路故障診斷的基本步驟為:
步驟1)每次有放回地從數(shù)據(jù)集中抽取n個數(shù)據(jù),形成新的訓(xùn)練集,共計形成K個訓(xùn)練集。
步驟2)為將數(shù)據(jù)樣本成功區(qū)分單相故障、相間故障及三相故障,可先分離出三相故障,再對單相故障和相間故障進行分類。因此決策樹形成的過程中共計有2 個節(jié)點。選取基于高斯徑向基的核函數(shù),通過交叉驗證選取最佳參數(shù)C和g值,構(gòu)建初始SVM決策模型。
步驟3)利用抽取的K個訓(xùn)練集,輸入SVM 決策模型,訓(xùn)練得到K個決策子模型。
步驟4)眾多決策樹構(gòu)成了隨機森林,每棵決策樹都會有一個投票結(jié)果,最終投票結(jié)果最多的類別,就是最終的模型預(yù)測結(jié)果。
配電網(wǎng)多分支線路的顯著特點是分支數(shù)量多且網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,西安交通大學(xué)王開等人[36]提出一種多分支配電線路故障定位方法,通過推導(dǎo)傳輸線沿線的電壓與線路端點電壓、電流的關(guān)系,根據(jù)沿線電壓的唯一性來求取故障點位置,能夠取得較高的測量精度。
文章基于MATLAB/Simulink 仿真軟件,并參考文獻[37]所述,對四分支配電線路進行建模,正常情況下,在主線路M、N 兩端與分支線路P1、P2、P3、P4終端安裝故障監(jiān)測裝置,線路模型如圖4 所示,其中,EM、EN為主線路首末兩端電源;E1、E2、E3、E4為分支電源,并獲取其在正常運行以及多個不同位置發(fā)生不對稱故障(A、B 相單相接地故障,AB 相間故障以及三相故障)時的電壓、電流特征數(shù)據(jù)。線路采用分布參數(shù)模型,M 端電源電壓為110 kV,頻率為50 Hz,輸電線路具體參數(shù)設(shè)置如表1 所示。仿真的故障時間設(shè)置為0~0.3 s,采樣步長為0.001 s,仿真算法為ode23tb,仿真時長取0.35 s,以此獲得配電系統(tǒng)在不同故障類型時各相的電壓和電流數(shù)據(jù)。
圖4 四分支110 kV輸電線路模型
表1 輸電線路參數(shù)
鑒于獲得的樣本數(shù)據(jù)具有不穩(wěn)定性與冗余性,故在數(shù)據(jù)預(yù)處理階段,需要依據(jù)不同故障類型的電壓電流特點,對數(shù)據(jù)集進行特征選擇和去除冗余操作,各類故障發(fā)生時的電壓、電流波形變化如圖5 所示,圖5分別展示了A相接地故障、AB相間故障及三相故障時各相的電壓及電流情況。
圖5 不同故障時電壓、電流波形變化情況
單相故障時,故障相電壓大幅下降,電流幅值增大且與非故障相反向;兩相相間故障時,故障相電壓出現(xiàn)明顯降低,電流反而呈現(xiàn)增大的態(tài)勢;三相故障時,三相的電壓驟降,電流增大。
3.2.1 故障信息不同完整程度的診斷檢測率
選用輸電線路發(fā)生故障前后的電氣量(主要指電流、電壓)變化進行隨機森林分類模型訓(xùn)練,分別測試故障信息完整和缺失兩種情況下各類故障診斷的準確率,其診斷結(jié)果如表2 所示。由表2 可得,在故障信息完整時,對于3 種不同類型故障的診斷正確率均達到95%以上;當故障信息出現(xiàn)缺失后,對各類型的故障診斷誤差均變大,正確率明顯降低,其中單相接地故障診斷的正確率降低30%多,而三相故障診斷的正確率降低最少,但正確率仍高于95%。綜合來看,信息缺失對于不同故障類型診斷的影響程度不同,后續(xù)還可對算法進行改進,以使其即使在各類型故障信息缺失時仍能具有較優(yōu)的準確率。
表2 不同故障類型診斷正確率 單位:%
3.2.2 故障信息缺失時不同診斷方法的正確率
對比分析在故障信息部分殘缺情況下,SVM 算法、RF 算法以及SVM-RF 算法對不同故障類型的診斷情況,結(jié)果如圖6 所示。圖6 中縱坐標中僅整數(shù)值有含義,標簽1表示單相故障,標簽2表示兩相故障,標簽3表示三相故障。
圖6 不同算法的故障診斷正確率
圖6 中,對于單相故障,三種診斷算法均更易將其誤判為兩相故障;對于兩相故障,RF 算法更易誤判為單相故障,SVM-RF 更易誤判為三相故障,而SVM 算法的誤判概率最高;對于三相故障,SVM-RF算法相較于單一的SVM或者RF算法誤判大大降低,診斷正確率大幅度提高。但整體而言,SVM-RF 算法對于三種故障類型的診斷正確率最好,單一SVM 算法的診斷正確率最差,RF 算法的診斷正確率介于兩者之間。這主要是因為常規(guī)的SVM 算法自身不適用于解決多分類問題,而取值劃分比較多的特征影響RF 的決策,從而影響擬合的模型的效果,但使用融合算法時,能夠在一定程度上彌補單一算法的缺陷。
輸電線路是故障頻發(fā)的區(qū)域,對其進行準確的故障辨識尤為重要。針對輸電線路故障數(shù)據(jù)集的特點,提出了一種SVM-RF 的線路故障診斷算法,并進行仿真分析。
SVM-RF 是SVM 與RF 以及相關(guān)理論的有機結(jié)合,融合了兩種獨立算法的優(yōu)勢,相較于單一的算法具有更高的故障診斷準確率。
通過仿真驗證了SVM-RF 算法的可行性,在故障信息完整時,對于單相接地故障、相間故障、三相故障的診斷正確率分別為95.43%、100%、100%;而在故障信息缺失時,對于三者的診斷正確率出現(xiàn)明顯降低,分別為62.5%、83.33%、95.8%。
故障信息的缺失對于不同類型故障的影響程度不同,從而導(dǎo)致對故障診斷準確率的不一致。
故障準確率依賴于故障信息的完整度,在缺失故障信息時仍能保證對故障類型較高的準確率,這將是未來研究工作的主要內(nèi)容。