楊冰雪,姚修遠(yuǎn),蘇宇,丁玉劍*
(1.華北電力大學(xué),北京 昌平 102206;2.中國電力科學(xué)研究院有限公司,北京 海淀100192)
特高壓輸變電工程的高壓電氣設(shè)備外絕緣介質(zhì)大多由空氣充當(dāng),長空氣間隙的擊穿特性是高壓電氣設(shè)備外絕緣設(shè)計的重要依據(jù),而間隙結(jié)構(gòu)和氣象條件的改變都會對其造成較大的影響[1-3]。作為典型電極結(jié)構(gòu)之一,棒-棒空氣間隙擊穿電壓有效計算方法的提出對空氣間隙放電特性研究具有重要意義。
數(shù)十年來,國內(nèi)外學(xué)者開展了大量空氣間隙放電真型試驗(yàn),積累了一些實(shí)用的經(jīng)驗(yàn)公式,但這些經(jīng)驗(yàn)公式大多是基于統(tǒng)計回歸的單參數(shù)模型,不能給出不同大氣條件下空氣間隙的擊穿電壓數(shù)值[4-8]。空氣間隙的擊穿電壓與間隙結(jié)構(gòu)、電壓波形、大氣條件等多種因素之間存在復(fù)雜的多維非線性關(guān)系,傳統(tǒng)回歸分析和統(tǒng)計方法難以對其進(jìn)行有效的分析[9]。而神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、支持向量機(jī)(SVM)等機(jī)器學(xué)習(xí)算法能夠很好地處理這種多維非線性關(guān)系[10-11],利用合適的機(jī)器學(xué)習(xí)算法建立不同氣象條件下不同距離棒-棒長空氣間隙擊穿電壓預(yù)測模型可以有效解決傳統(tǒng)計算方法存在的不足。
早期研究者主要應(yīng)用BP神經(jīng)網(wǎng)絡(luò)、自組織神經(jīng)網(wǎng)絡(luò)等人工神經(jīng)網(wǎng)絡(luò)算法構(gòu)建空氣間隙擊穿電壓預(yù)測模型,并在小范圍測試集上取得了較好的預(yù)測效果[12-14]。然而,神經(jīng)網(wǎng)絡(luò)的參數(shù)較多,訓(xùn)練一個準(zhǔn)確率高的神經(jīng)網(wǎng)絡(luò)往往需要較多的數(shù)據(jù)量和訓(xùn)練時間,其在小樣本數(shù)據(jù)上的表現(xiàn)往往不如SVM[15]。支持向量機(jī)基于結(jié)構(gòu)風(fēng)險最小化原則訓(xùn)練模型,通過引入正則項(xiàng)可以有效避免過擬合現(xiàn)象,其在高維、非線性、小樣本數(shù)據(jù)的分類和回歸上表現(xiàn)良好[16]。近年來,基于SVM的空氣間隙擊穿電壓預(yù)測方法越來越多地被提出[3,17-18]。由于空氣間隙放電真型試驗(yàn)成本較高,研究者們往往只能得到少量放電數(shù)據(jù),所以空氣間隙放電數(shù)據(jù)是多維非線性的小樣本數(shù)據(jù),而SVM可以針對這樣的數(shù)據(jù)建立精度較高的預(yù)測模型。目前空氣間隙的智能計算模型大多都是針對較短間隙,而實(shí)際工程應(yīng)用中長空氣間隙才是常用的絕緣形式。對長空氣間隙的擊穿電壓預(yù)測研究也大多只針對棒-板間隙,其他典型電極結(jié)構(gòu)間隙則很少被涉及。
中國電力科學(xué)研究院在國家電網(wǎng)特高壓直流試驗(yàn)基地的不同氣象條件下得到了71組棒-棒長空氣間隙操作沖擊試驗(yàn)數(shù)據(jù)。本文選取棒-棒間隙距離、氣壓、干溫和絕對濕度4個特征作為建模的輸入變量,以棒-棒長空氣間隙正極性操作沖擊擊穿電壓作為輸出,首先將數(shù)據(jù)歸一化,以排除各變量數(shù)量級和量綱不同的影響,然后對4個變量進(jìn)行灰色關(guān)聯(lián)分析,計算出4個輸入變量與擊穿電壓之間的灰關(guān)聯(lián)度,定量分析其對棒-棒長間隙放電的影響。然后基于去量綱處理后的樣本建立基于BOA-SVR的棒-棒長空氣間隙正極性操作沖擊擊穿電壓預(yù)測模型,在測試集上測試該模型的預(yù)測精度,驗(yàn)證這種計算方法的可行性。最后,利用該預(yù)測模型對特高壓直流試驗(yàn)基地極端溫濕度下的棒-棒間隙擊穿電壓進(jìn)行了計算。
灰色關(guān)聯(lián)分析是一種通過系統(tǒng)各因素變化曲線幾何形狀的相似程度確定因素之間關(guān)聯(lián)性的算法,以灰色關(guān)聯(lián)度定量刻畫不同因素間的關(guān)聯(lián)性[19-20]。其基本步驟如下:
第一步,將原始數(shù)據(jù)進(jìn)行歸一化(或標(biāo)準(zhǔn)化等)。
第二步,確定參考序列:x0={x0(k)|k=1,2,…,n};比較序列:xi={xi(k)|k=1,2,…,n}(i=1,2,…,m)。
第三步,計算參考序列與比較序列每個對應(yīng)點(diǎn)的點(diǎn)關(guān)聯(lián)系數(shù):
第四步,計算參考序列與比較序列的灰色關(guān)聯(lián)度γ(x0,xi):
SVR是一種監(jiān)督式學(xué)習(xí)的方法,其主要思想是通過核函數(shù)將輸入變量映射到高維空間,然后在這個高維特征空間中進(jìn)行簡單的多元線性回歸[21]。
給定訓(xùn)練樣本(x1,y1),(x2,y2),…,(xn,yn),希望學(xué)得一個超平面使得f(x)與y盡可能接近:
式中:ω為回歸系數(shù),b為偏值項(xiàng);給定一個小的正數(shù)λ,若有:
則可以認(rèn)為f(xi)對yi的回歸是無損的,即,支持向量回歸允許有一定偏差,當(dāng)偏差小于等于λ時可以忽略,反之則要計算損失。則SVR問題可形式化為
式中:C為正則化常數(shù);lε為ε-不敏感損失函數(shù):
引入非負(fù)松弛變量ζi、ζi和拉格朗日乘子
對ω、b、ζi和ζi'求偏導(dǎo),令其等于0,將原問題轉(zhuǎn)化為其對偶問題,然后引入核函數(shù),將其原始數(shù)據(jù)映射到一個高維平面,求解后得到超平面表達(dá)式:
核函數(shù)的作用是避開高維空間中向量內(nèi)積計算困難的問題,選擇適當(dāng)?shù)暮撕瘮?shù)使構(gòu)造一個高性能SVR模型的關(guān)鍵之一。常用的核函數(shù)有線性核、多項(xiàng)式核、徑向基核函數(shù)(RBF)等,其中RBF是應(yīng)用最廣的一個。RBF是一種局部性強(qiáng)的核函數(shù),在大樣本和小樣本數(shù)據(jù)上都有較好的性能,且參數(shù)較少,對噪聲有較強(qiáng)的抗干擾能力。因此本文選取RBF作為SVR的核函數(shù):
從上文的推導(dǎo)中不難發(fā)現(xiàn)有3個參數(shù)的值不能直接通過樣本得到,需要人為選取,即:損失函數(shù)參數(shù)ε,正則化常數(shù)C和核函數(shù)參數(shù)γ。其中,ε影響著支持向量的數(shù)目,ε越小則支持向量越多,同時也能在訓(xùn)練樣本上取得更高的回歸精度,但會一定程度降低模型泛化能力。因此ε不能太小,一般取0.01較為合適,故本文選取ε=0.01,而C和γ的選取則通過參數(shù)尋優(yōu)算法實(shí)現(xiàn)。正則化常數(shù)C反映了算法對超出軟間隔的樣本懲罰程度,若C過小會導(dǎo)致訓(xùn)練誤差較大,過大則會導(dǎo)致泛化能力較差。而核函數(shù)參數(shù)γ反映了支持向量間的相關(guān)程度,γ過小會導(dǎo)致支持向量間相關(guān)度較低,泛化能力較差,而過大時會導(dǎo)致支持向量間的相關(guān)度較高,使得訓(xùn)練誤差較大。因此C和γ都不宜取得過大或過小,本文設(shè)置其尋優(yōu)范圍為[0,50]。
常見的參數(shù)尋優(yōu)方法包括網(wǎng)格搜索、隨機(jī)搜索和貝葉斯優(yōu)化3大類。其中,網(wǎng)格搜索算法通過窮舉的方式在一定范圍內(nèi)按照給定步長將待定超參數(shù)進(jìn)行排列組合,然后計算比較不同組合訓(xùn)練的模型損失從而選取最優(yōu)組[22]。這種方法的計算開銷大,而SVR算法本身計算復(fù)雜度較高,使用網(wǎng)格搜索算法尋優(yōu)效率較低。近年來,以一系列群智能優(yōu)化算法為代表的隨機(jī)搜索方法被廣泛應(yīng)用與機(jī)器學(xué)習(xí)模型的超參數(shù)選擇中,然而,隨機(jī)搜索算法往往容易陷入局部極小值,缺乏較強(qiáng)的全局搜索能力[23]。而貝葉斯優(yōu)化(Bayesian optimization algorithm,BOA)是一種十分有效的全局優(yōu)化算法,能夠充分利用之前觀測到的先驗(yàn)信息進(jìn)行下一次優(yōu)化,極大提高了搜索效率與全局搜索能力[24]。因此,本文將5折交叉驗(yàn)證的SVR均方誤差作為優(yōu)化目標(biāo),采用貝葉斯優(yōu)化算法尋找最優(yōu)的C和γ。
貝葉斯優(yōu)化使用代理函數(shù)代替目標(biāo)函數(shù),在采集點(diǎn)的過程中不斷擬合更新該代理函數(shù),使之逐漸逼近真實(shí)目標(biāo)函數(shù),根據(jù)擬合結(jié)果主動選擇最有潛力的評估點(diǎn)進(jìn)行評估,避免不必要的采樣[25]。其基本流程如下:
(1)選取一個數(shù)據(jù)點(diǎn)x使得采集函數(shù)最大;
(2)將x輸入目標(biāo)函數(shù)得到其對應(yīng)的目標(biāo)值y;
(3)使用新數(shù)據(jù)(x,y)更新代理函數(shù);
(4)重復(fù)上述3個步驟直至達(dá)到迭代停止條件。
本文中,代理函數(shù)為TPE(tree parzer estimator),采集函數(shù)根據(jù)代理函數(shù)的后驗(yàn)概率分布構(gòu)造而來[26]。
本文采取以下兩種指標(biāo)分析模型在測試集上的誤差。
絕對誤差百分比(absolute percentage error,APE)
平均絕對誤差百分比(mean absolute percentage error,MAPE)
式中:Ut和Up分別為樣本的試驗(yàn)值和預(yù)測值,N為預(yù)測樣本個數(shù)。
基于貝葉斯優(yōu)化支持向量回歸算法,本文提出的棒-棒長空氣間隙擊穿電壓預(yù)測方法流程圖如圖1所示。
圖1 基于BOA-SVR算法的擊穿電壓預(yù)測流程
本文以不同氣象條件下的71組棒-棒長空氣間隙操作沖擊試驗(yàn)數(shù)據(jù)作為樣本,選取棒-棒間隙距離d(m)、干溫t(℃)、氣壓p(kPa)和絕對濕度h(g/m3)4個特征作為建模的輸入變量,構(gòu)建基于BOA-SVR的棒-棒長空氣間隙正極性操作沖擊擊穿電壓預(yù)測模型?;谠囼?yàn)數(shù)據(jù)的樣本分布情況,選取涵蓋2~7.24 m間隙距離的15組數(shù)據(jù)作為測試集,其余數(shù)據(jù)作為訓(xùn)練集。訓(xùn)練集和測試集的特征取值范圍如表1、表2所示。
表1 訓(xùn)練數(shù)據(jù)輸入特征范圍
表2 測試數(shù)據(jù)輸入特征范圍
首先,對歸一化后的全部樣本進(jìn)行灰色關(guān)聯(lián)分析,取參數(shù)ζ=0.5,得到4個特征與擊穿電壓的灰關(guān)聯(lián)度如圖2所示。
由圖2可知,上述4個灰關(guān)聯(lián)值均大于0.55,表明4個因素均對棒-棒間隙放電有不可忽視的影響,選取它們作為擊穿電壓預(yù)測模型的輸入變量是合理的。其對放電的影響力由高到低排序?yàn)椋洪g隙距離、氣壓、溫度、絕對濕度。其中間隙距離與擊穿電壓的灰關(guān)聯(lián)度顯著高于氣象因素,而氣象因素中氣壓的影響力高于溫濕度。
圖2 4個影響因素與棒-棒間隙擊穿電壓的關(guān)聯(lián)度
將5折交叉驗(yàn)證的均方誤差作為適應(yīng)度函數(shù),通過貝葉斯優(yōu)化算法搜索SVR的最優(yōu)參數(shù)。BOA的參數(shù)設(shè)置為:迭代次數(shù)=1000,代理函數(shù)為TPE,C和γ的尋參范圍為[0,50]。輸入訓(xùn)練集,得到最優(yōu)參數(shù):C=38.38,γ=0.09。尋優(yōu)過程中,模型損失隨兩參數(shù)變化的情況如圖3、圖4所示。
圖3 模型損失隨懲罰系數(shù)變化情況
圖4 模型損失隨核函數(shù)系數(shù)變化情況
在得到的最優(yōu)模型下,測試集的預(yù)測結(jié)果如表3所示。結(jié)果表明:測試樣本的最大絕對誤差百分比為8.5%,平均絕對百分比誤差為3.2%。15個測試樣本中,模型預(yù)測的絕對誤差百分比在5.5%以下的有13個,表明該模型預(yù)測效果良好。將預(yù)測與試驗(yàn)結(jié)果繪制到同一張圖上,并使用冪函數(shù)擬合試驗(yàn)數(shù)據(jù)得到相應(yīng)曲線,如圖5所示。由圖5可知模型預(yù)測結(jié)果與試驗(yàn)值相近,且預(yù)測值更接近擬合的曲線,驗(yàn)證了本文所提出的棒-棒長空氣間隙擊穿電壓智能計算模型的有效性。
圖5 測試集試驗(yàn)值和預(yù)測值對比
表3 BOA-SVR模型預(yù)測結(jié)果
綜合考慮北京市氣象參數(shù)的變化范圍和棒-棒間隙50%擊穿電壓預(yù)測模型中訓(xùn)練數(shù)據(jù)的氣象參數(shù)變化范圍,由于訓(xùn)練模型中缺少高溫干燥條件的數(shù)據(jù),所以本文選取了高溫高濕、低溫高濕、低溫干燥3種極端氣象條件下的氣象參數(shù)如表4所示。對表4中的3種極端溫濕度條件下的棒-棒間隙50%擊穿電壓進(jìn)行計算,計算結(jié)果如圖6所示。通過對3種極端溫濕度條件下的棒-棒間隙50%擊穿電壓計算結(jié)果進(jìn)行分析,發(fā)現(xiàn):高溫高濕條件下的棒-棒間隙50%擊穿電壓最小,而低溫干燥和低溫潮濕下的棒-棒間隙50%擊穿電壓差距不大,可能是因?yàn)檫@兩種條件下的絕對濕度相差僅有1.8 g/m3,而模型代表濕度的輸入是絕對濕度而不是相對濕度,因此導(dǎo)致這兩種情況的預(yù)測值極為相似。另外,在間隙距離為2 m時,不同氣象的擊穿電壓最高相差22.0%,而在10 m時,不同氣象的擊穿電壓最高相差降為9.1%,表明隨著間隙距離的增大,氣象因素對放電的影響占比更小,這正與試驗(yàn)得到的結(jié)論相符。
表4 不同極端環(huán)境的參數(shù)選擇
圖6 極端環(huán)境下的棒-棒間隙放電特性曲線預(yù)測
本文以棒-棒間隙距離、氣壓、干溫、絕對濕度作為輸入變量,構(gòu)建了基于BOA-SVR算法的棒-棒長空氣間隙50%擊穿電壓預(yù)測模型,得到如下結(jié)論。
棒-棒間隙50%擊穿電壓的影響因素與其的灰關(guān)聯(lián)度排序從高到低依次為:間隙距離、氣壓、空氣溫度、濕度。
構(gòu)建了基于BOA-SVR算法的棒-棒長空氣間隙50%擊穿電壓預(yù)測模型,模型在測試集上的最大絕對誤差百分比為8.5%,平均絕對百分比誤差為3.2%。15個測試樣本中,模型預(yù)測的絕對誤差百分比在5.5%以下的有13個,驗(yàn)證了本文算法的有效性。
基于構(gòu)建好的棒-棒長空氣間隙50%擊穿電壓預(yù)測模型,對高溫高濕、低溫干燥、低溫高濕3種極端溫濕度條件下的棒-棒間隙50%擊穿電壓進(jìn)行計算,結(jié)果與試驗(yàn)得到的規(guī)律基本一致。