劉維功,王昊展,時(shí)振堂,黎德初,胡學(xué)良,李勁松
(1. 中國石油化工股份有限公司大連石油化工研究院,遼寧 大連 116045; 2. 大連理工大學(xué) 電氣工程學(xué)院,遼寧 大連 116024; 3. 中國石油化工股份有限公司廣州分公司,廣州 510726)
交聯(lián)聚乙烯(XLPE)電纜作為電能傳輸?shù)暮诵脑O(shè)備,其絕緣性能的優(yōu)劣將直接影響電能傳輸過程的穩(wěn)定性及電能質(zhì)量。局部放電是XLPE電纜早期絕緣缺陷的主要表現(xiàn)形式,其不僅導(dǎo)致XLPE電纜絕緣故障的主要原因,也是衡量XLPE電纜絕緣性能的重要指標(biāo)[1-2],因此對(duì)XLPE電纜進(jìn)行局部放電檢測(cè)能夠有效判斷其絕緣缺陷情況[3]。在對(duì)局部放電檢測(cè)的基礎(chǔ)上,為了進(jìn)一步確定造成局部放電的原因及局部放電發(fā)生位置,因此需要對(duì)局放數(shù)據(jù)進(jìn)行有效分析確定局部放電缺陷類型,及時(shí)發(fā)現(xiàn)并解決相應(yīng)的故障隱患,確保XLPE電纜長(zhǎng)期穩(wěn)定運(yùn)行[4]。
目前,國內(nèi)外學(xué)者對(duì)于局部放電的模式識(shí)別已經(jīng)展開了深入研究,部分學(xué)者提出了基于人工智能算法的局部放電模式識(shí)別方法,如專家系統(tǒng)[5-6]、決策樹[7-8]、隨機(jī)森林[9-11]、支持向量機(jī)[12-14]、反向傳播神經(jīng)網(wǎng)絡(luò)[15-17]、聚類算法[18]等。對(duì)于專家系統(tǒng),其需要大量專家技術(shù)經(jīng)驗(yàn),在實(shí)際應(yīng)用中實(shí)施較為困難;決策樹模型可讀性好,效率高,但對(duì)中間值缺失敏感,易產(chǎn)生過擬合問題;隨機(jī)森林算法易出現(xiàn)過擬合現(xiàn)象,計(jì)算成本較高,同時(shí)受取值劃分較多的屬性影響較大;支持向量機(jī)算法本質(zhì)上是二分類算法,局放模式識(shí)別為多分類問題,面對(duì)多分類問題,參數(shù)設(shè)置繁瑣,構(gòu)造分類器過程繁瑣;BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率較慢,同時(shí)極易陷入局部最優(yōu)解;聚類算法在解決高特征維度問題時(shí),計(jì)算量會(huì)顯著增加。
基于上述分析,文章采用參數(shù)調(diào)優(yōu)XGBoost算法作為局部放電模式識(shí)別分類器。XGBoost算法具有正則化、并行處理運(yùn)算、內(nèi)置交叉驗(yàn)證和高度的算法靈活性等優(yōu)勢(shì)[19],能夠有效解決上述算法存在的過擬合、陷入局部最優(yōu)解等問題,該算法在電力負(fù)荷預(yù)測(cè)領(lǐng)域應(yīng)用較為廣泛并取得一定成果,其在局部放電模式識(shí)別領(lǐng)域也具有良好的應(yīng)用潛力。文中搭建35 kV XLPE電纜局放試驗(yàn)平臺(tái),制作四種典型的電纜局部放電模型來模擬常見的電纜絕緣缺陷,進(jìn)而獲取原始數(shù)據(jù),并將原始數(shù)據(jù)導(dǎo)入MATLAB計(jì)算統(tǒng)計(jì)特征參數(shù),以特征參數(shù)為輸入量,放電類型預(yù)測(cè)結(jié)果為輸出量,通過學(xué)習(xí)曲線調(diào)試確定最優(yōu)參數(shù),將參數(shù)調(diào)優(yōu)后的XGBoost算法與決策樹、支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)分類算法進(jìn)行了比較,結(jié)果表明參數(shù)調(diào)優(yōu)XGBoost算法在識(shí)別準(zhǔn)確率上有較大提高,驗(yàn)證了該方法的有效性。
XGBoost算法也稱極端梯度提升算法,其是在梯度提升機(jī)器算法基礎(chǔ)上進(jìn)行了擴(kuò)展,實(shí)現(xiàn)方式是通過集成多個(gè)不同弱分類器以增強(qiáng)分類效果。通過將其損失函數(shù)進(jìn)行二階泰勒展開,能夠?qū)崿F(xiàn)對(duì)高維稀疏特征進(jìn)行分布式處理,算法主要優(yōu)勢(shì)在于具備高準(zhǔn)確度,不易過擬合及可擴(kuò)展性強(qiáng)等[20]。XGBoost模型基本流程圖如圖1所示。
圖1 XGBoost模型基本流程圖
XGBoost算法原理為:
設(shè)D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R)。其中,n代表不同局部放電類型樣本數(shù)量,m代表每個(gè)局部放電樣本對(duì)應(yīng)的特征參數(shù)數(shù)量,xi代表第i個(gè)樣本特征取值,yi代表第i個(gè)樣本對(duì)應(yīng)局部放電類型。這個(gè)樹集成模型得到終值的方式是通過持續(xù)添加新的決策樹,利用殘差多次迭代擬合,對(duì)應(yīng)公式如式(1)所示:
(1)
圖2 單個(gè)fK樹模型結(jié)構(gòu)示意圖
XGBoost算法目標(biāo)函數(shù)主要包括兩部分內(nèi)容,一部分代表損失函數(shù)項(xiàng),另一部分代表正則懲罰項(xiàng),將損失函數(shù)與正則懲罰項(xiàng)相結(jié)合即可實(shí)現(xiàn)對(duì)其整體最優(yōu)解的尋找,求解出的整體最優(yōu)解即可滿足對(duì)損失函數(shù)的下降和模型的復(fù)雜度的權(quán)衡[22]。XGBoost目標(biāo)函數(shù)具體公式如式(2)所示。
(2)
(3)
(4)
式中 參數(shù)gi(損失函數(shù)一階導(dǎo)數(shù))對(duì)應(yīng)公式為:
(5)
參數(shù)hi(損失函數(shù)二階導(dǎo)數(shù))對(duì)應(yīng)公式為:
(6)
去掉常數(shù)項(xiàng)得到簡(jiǎn)化的目標(biāo)函數(shù):
(7)
定義Ij={i∣q(xi) =j}作為葉子節(jié)點(diǎn)j的樣本數(shù)集,根據(jù)公式(7)可得:
(8)
(9)
為了確保分割效果最佳,因此需要計(jì)算得到目標(biāo)函數(shù)數(shù)值即分支后增益數(shù)值[24]。假定IL和IR代表劃分后左右子樹(樹模型如圖2所示)葉子節(jié)點(diǎn)樣本集合,即I=IL∪IR,則劃分后增益如式(10)所示。
(10)
上述公式可以分解為:(1)新左葉葉子節(jié)點(diǎn)最優(yōu)權(quán)重;(2)新右葉葉子節(jié)點(diǎn)最優(yōu)權(quán)重;(3)原始葉葉子節(jié)點(diǎn)最優(yōu)權(quán)重;(4)葉子數(shù)目正則化參數(shù)。若分支后增益數(shù)值大于0,則說明添加對(duì)應(yīng)分支有助于優(yōu)化模型,提高模型識(shí)別準(zhǔn)確率,反之則應(yīng)對(duì)其進(jìn)行修剪。后續(xù)通過學(xué)習(xí)曲線等方式獲取最優(yōu)參數(shù)的修枝策略即基于此原理進(jìn)行。
試驗(yàn)選取實(shí)際海上石油電力系統(tǒng)平臺(tái)應(yīng)用的35 kV交聯(lián)聚乙烯(XLPE)三芯電纜進(jìn)行局部放電測(cè)試。交聯(lián)聚乙烯電纜如圖3所示。
圖3 XLPE電纜示意圖
通過查閱電纜局部放電絕緣缺陷構(gòu)建相關(guān)文獻(xiàn)[25-29],常見的電纜絕緣缺陷有內(nèi)部氣隙放電、外部電暈放電以及絕緣劃傷等類型,因此實(shí)驗(yàn)采用無絕緣缺陷電纜構(gòu)建以下四種電纜絕緣缺陷如圖4所示。
圖4 XLPE電纜絕緣缺陷模擬構(gòu)建示意圖
四種類型絕緣缺陷具體構(gòu)建方式為:
(1)電纜絕緣缺陷類型1:電纜絕緣層內(nèi)部氣隙放電:利用鉆孔設(shè)備在模型電纜XLPE表面制造若干個(gè)微孔,使少量空氣進(jìn)入絕緣內(nèi)部,并向其中注入少量環(huán)氧樹脂并均勻涂抹于孔口周圍將孔口密封;
(2)電纜絕緣缺陷類型2:電纜本體劃傷絕緣缺陷放電:為了模擬電纜本體劃傷絕緣缺陷放電,采用對(duì)電纜絕緣層進(jìn)行人為損傷,通過加壓測(cè)試效果進(jìn)而不斷增加對(duì)絕緣層的破壞深度,直至絕緣缺陷放電現(xiàn)象較為明顯時(shí)停止破壞;
(3)電纜絕緣缺陷類型3:電纜外部尖刺電暈放電:首先選取直徑為0.5 mm,長(zhǎng)度為10 cm的鋼釘,通過錘子敲打從電纜端頭嵌入導(dǎo)體內(nèi)部,將鋼釘大部分尖端外露與空氣直接接觸,進(jìn)而模擬電纜外部電暈放電;
(4)電纜絕緣缺陷類型4:外半導(dǎo)體層爬電:在對(duì)模型電纜處理過程中,對(duì)外半導(dǎo)體層進(jìn)行剝除操作,一端留有寬10 mm、長(zhǎng)30 mm的外半導(dǎo)體層不完全剝除干凈。
實(shí)驗(yàn)采用HD-iPD局放特高頻檢測(cè)系統(tǒng)(包括局放狀態(tài)檢測(cè)儀和一臺(tái)工業(yè)電腦),結(jié)合高頻電流傳感器HFCT進(jìn)行局放實(shí)驗(yàn),實(shí)驗(yàn)系統(tǒng)結(jié)構(gòu)示意圖如圖5所示。
圖5 實(shí)驗(yàn)系統(tǒng)結(jié)構(gòu)示意圖
實(shí)驗(yàn)所用相關(guān)儀器設(shè)備及部分缺陷模型制作如圖6所示。
圖6 實(shí)驗(yàn)儀器設(shè)備及部分缺陷模型制作
電纜試品參數(shù)為26/35 kV,單芯導(dǎo)體直徑13 mm,絕緣厚度10.5 mm,鉛套厚度1.9 mm,PE層厚度1.8 mm,鎧裝鋼絲直徑5.0 mm。
根據(jù)IEC60270局部放電試驗(yàn)國家標(biāo)準(zhǔn)[30],實(shí)驗(yàn)電壓從零先升至2U0,在2U0等級(jí)保持10 s后,再降至1.73U0,隨后以1 kV為步長(zhǎng)逐步減小試驗(yàn)電壓,直至局放現(xiàn)象消失。原始數(shù)據(jù)格式為幅值-相位-時(shí)間戳的Excel表格,實(shí)驗(yàn)共采集四種局放類型原始數(shù)據(jù)累計(jì)約1 300組。HD-iPD局放檢測(cè)系統(tǒng)以幅值-相位二維強(qiáng)度散點(diǎn)圖形式顯示局放圖譜,四種局放類型的局放圖譜如圖7所示。
圖7 4種局放類型幅值-相位二維強(qiáng)度圖譜
在局部放電圖譜相應(yīng)特征參數(shù)中,正負(fù)半周偏斜度Sk能夠表征與正態(tài)分布相比,圖譜的非對(duì)稱情況,與幅值-相位以及放電頻次-相位分布圖的對(duì)稱性具有密切的相關(guān)性,當(dāng)圖譜對(duì)稱分布時(shí)其偏斜度為零,呈斜線上升時(shí)偏斜度為負(fù)值,反之為正值。Ku能夠表征圖譜峰值尖銳度,該特征參數(shù)對(duì)內(nèi)部氣隙放電和外部電暈放電類缺陷具有良好的識(shí)別效果,例如,介質(zhì)中含有多個(gè)氣隙或?yàn)殡姇灧烹姡瑒t其陡峭度為負(fù)值;介質(zhì)中含有單個(gè)氣隙放電現(xiàn)象,則其陡峭度為正值。m能夠表征局放圖譜在正負(fù)半周內(nèi)起始放電相位的差異性,例如內(nèi)部氣隙放電與本體劃傷絕緣缺陷放電類型相比,正負(fù)半周起始放電相位相差較大,提取該特征參數(shù)能夠有效區(qū)分不同放電類型。因此文中利用原始數(shù)據(jù)分別提取幅值,放電頻次兩種相位分布圖譜上述統(tǒng)計(jì)特征參數(shù)[31]。特征參數(shù)具體計(jì)算公式如下:
(11)
(12)
式中 Δx代表劃分的單位相窗寬度;xi代表第i個(gè)相窗對(duì)應(yīng)相位;W代表工頻狀態(tài)下半周內(nèi)包含相窗個(gè)數(shù);pi、u和σ代表以相位為隨機(jī)變量時(shí),第i個(gè)相窗內(nèi)事件發(fā)生的概率、均值以及標(biāo)準(zhǔn)差[32]。概率計(jì)算公式為:
(13)
式中yi表示相位分布圖譜對(duì)應(yīng)的縱坐標(biāo)。
均值u和標(biāo)準(zhǔn)差σ計(jì)算公式為:
(14)
(15)
相位不對(duì)稱度m能夠反映局放圖譜在正負(fù)半周內(nèi)起始放電相位的差別[33],具體公式為:
(16)
根據(jù)特征參數(shù)計(jì)算公式,利用MATLAB軟件編程批量處理局部放電原始數(shù)據(jù),計(jì)算得到幅值-相位二維圖譜及放電頻次-相位二維圖譜的統(tǒng)計(jì)特征參數(shù),兩類相位圖譜均可計(jì)算出正負(fù)半周偏斜度、正負(fù)半周陡峭度以及相位不對(duì)稱度,因此可分別提取5個(gè)統(tǒng)計(jì)特征參數(shù),共計(jì)10個(gè)統(tǒng)計(jì)特征參數(shù),將10個(gè)特征參數(shù)作為輸入量代入模型進(jìn)行模式分類識(shí)別,提取的特征參數(shù)如表1所示。
表1 局部放電特征描述
通過實(shí)驗(yàn)?zāi)M四種XLPE電纜局部放電類型,分別為內(nèi)部氣隙放電、本體劃傷絕緣缺陷放電、外部尖刺電暈放電、外半導(dǎo)體層爬電。對(duì)局部放電類型進(jìn)行ont_hot編碼,如表2所示。
表2 局部放電模式one_hot編碼
圖8 XLPE電纜局部放電模式識(shí)別流程
取各類樣本的80%組成訓(xùn)練樣本集,各類樣本的20%組成測(cè)試樣本集,從訓(xùn)練集中取10%作為驗(yàn)證集,然后對(duì)于訓(xùn)練集和驗(yàn)證集采用交叉驗(yàn)證方式,選取出最優(yōu)的超參數(shù),把訓(xùn)練集和驗(yàn)證集一起訓(xùn)練出最終的模型。訓(xùn)練樣本(含10%驗(yàn)證集樣本)總數(shù)為1 044組,測(cè)試總樣本數(shù)為261組。各運(yùn)行狀態(tài)下訓(xùn)練樣本及測(cè)試樣本組成如表3所示。
表3 四種局放類型樣本統(tǒng)計(jì)
首先是選擇進(jìn)行訓(xùn)練的弱評(píng)估器(Booster),主要有g(shù)btree,gblinear,dart三種,用默認(rèn)參數(shù)將特征參數(shù)輸入量代入三種弱評(píng)估器構(gòu)建的XGBoost算法模型,進(jìn)而考量三種弱評(píng)估三種對(duì)應(yīng)模型效果得分如圖9所示。
圖9 XGBoost弱評(píng)估器選擇
通過訓(xùn)練可得到三種弱評(píng)估器對(duì)應(yīng)模型得分分別為gbtree(96.93%),gblinear(83.52%),dart(91.95%)。說明gbtree對(duì)實(shí)驗(yàn)局放特征參數(shù)有更加良好的識(shí)別準(zhǔn)確性,因此XGBoost模型選用gbtree作為本模型弱評(píng)估器。
參數(shù)objective代表目標(biāo)函數(shù)的選擇,常用選擇有二分類使用的‘binary:logistic’以及‘binary:hinge’,而對(duì)于多分類問題則使用‘multi:softmax’,由于文中對(duì)不同類型局放模式識(shí)別屬于多分類問題,因此XGBoost算法選用softmax目標(biāo)函數(shù)做多分類,此時(shí)需要設(shè)置參數(shù)num_class(類別個(gè)數(shù)),由于本模型所要識(shí)別的局放類型共有四種,故num_class取值為4。
在完成對(duì)弱評(píng)估器及目標(biāo)函數(shù)的選取后,開始對(duì)弱評(píng)估器內(nèi)部參數(shù)進(jìn)行優(yōu)化。首先是對(duì)n_estimators(迭代次數(shù))的調(diào)試,利用交叉驗(yàn)證繪制模型得分-迭代次數(shù)學(xué)習(xí)曲線,選擇最優(yōu)迭代次數(shù),學(xué)習(xí)曲線如圖10所示。由迭代次數(shù)學(xué)習(xí)曲線可知,XGBoost中迭代次數(shù)決定了模型學(xué)習(xí)能力,當(dāng)n_estimators取值為130時(shí),模型學(xué)習(xí)能力最佳,對(duì)應(yīng)模型訓(xùn)練分?jǐn)?shù)為0.982 7。
圖10 迭代次數(shù)學(xué)習(xí)曲線
學(xué)習(xí)率(Learning_rate)主要作用是防止過擬合,實(shí)現(xiàn)方式是在更新中收縮步長(zhǎng),而提升模型效果會(huì)更多考慮從樹本身參數(shù)出發(fā)而不會(huì)選擇調(diào)整學(xué)習(xí)率,因此學(xué)習(xí)率(Learning rate)默認(rèn)設(shè)置為0.3。
再對(duì)Subsample參數(shù)進(jìn)行調(diào)優(yōu),其作用是控制對(duì)于每個(gè)弱評(píng)估器隨機(jī)采樣的比例,利用交叉驗(yàn)證得到的調(diào)優(yōu)學(xué)習(xí)曲線如圖11所示。
圖11 Subsample調(diào)試學(xué)習(xí)曲線
Subsample取值范圍為[0,1],由調(diào)參學(xué)習(xí)曲線結(jié)果可知,當(dāng)subsample取值為0.368 42時(shí),模型效果最佳,此時(shí)模型訓(xùn)練分?jǐn)?shù)為0.984 67。
最后再對(duì)max_depth(樹的最大深度)參數(shù)進(jìn)行調(diào)節(jié),其作用是避免模型過擬合,調(diào)參優(yōu)化目標(biāo)是在確保準(zhǔn)確率的前提下讓訓(xùn)練集和測(cè)試集的結(jié)果盡可能接近。通過對(duì)max_depth參數(shù)進(jìn)行調(diào)試可以發(fā)現(xiàn),當(dāng)max_depth取值為6時(shí)模型準(zhǔn)確率最佳,因此max_depth取值為6。max_depth不同取值對(duì)比如圖12所示。
圖12 max_depth參數(shù)調(diào)優(yōu)對(duì)比
為了測(cè)試改進(jìn)后XGBoost算法模型的識(shí)別性能,分別采用決策樹、隨機(jī)森林、支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)、XGBoost模型(默認(rèn)參數(shù))對(duì)相同的數(shù)據(jù)集進(jìn)行訓(xùn)練和故障診斷。決策樹算法和隨機(jī)森林算法均設(shè)置為默認(rèn)參數(shù);支持向量機(jī)核函數(shù)選用rbf,核函數(shù)參數(shù)設(shè)置為0.1,規(guī)則化稀疏設(shè)置為200;BP神經(jīng)網(wǎng)絡(luò)輸入層為10個(gè)神經(jīng)元,隱藏層為58個(gè)神經(jīng)元,輸出層為4個(gè)神經(jīng)元,輸出層加softmax分類器。4種局放類型測(cè)試樣本共計(jì)261個(gè),各故障識(shí)別結(jié)果如表4所示,混淆矩陣的結(jié)果如圖13所示,其中各個(gè)子圖分別為各模型在局放特征參數(shù)數(shù)據(jù)集上的混淆矩陣結(jié)果,圖中色塊顏色深淺僅代表數(shù)值大小。
圖13 各模型在電纜局放數(shù)據(jù)集上的混淆矩陣
由圖13和表4結(jié)果可知:
(1)通過觀察表格及各個(gè)模型在局放特征參數(shù)數(shù)據(jù)集上的混淆矩陣可以發(fā)現(xiàn),不同的算法模型對(duì)局部放電模式識(shí)別準(zhǔn)確率均在80%以上,說明結(jié)合圖譜與原始數(shù)據(jù)計(jì)算得出的特征參數(shù)能夠很好地表征不同局放類型的特性;
(2)比較發(fā)現(xiàn),模型對(duì)四種局部放電類型辨識(shí)效果不盡相同,其主要原因是局部放電具有一定隨機(jī)性,如外部電暈放電和絕緣缺陷放電存在一些相似特征等;
(3)XGBoost模型參數(shù)調(diào)優(yōu),避免了模型過擬合,增加了模型的泛化能力,使得經(jīng)過參數(shù)調(diào)優(yōu)的XGBoost算法模型識(shí)別準(zhǔn)確率較未經(jīng)調(diào)參的XGBoost算法模型在識(shí)別準(zhǔn)確率上有了一定提高。
表4 不同方法識(shí)別結(jié)果
文章分析了XGBoost算法模型結(jié)構(gòu)和原理,提出了基于參數(shù)調(diào)優(yōu)的XGBoost算法模型,通過搭建35 kV XLPE海纜局部放電實(shí)驗(yàn)平臺(tái),模擬XLPE電纜局放缺陷模型獲取原始數(shù)據(jù)及局放圖譜,進(jìn)而通過公式計(jì)算獲取特征參數(shù)。利用計(jì)算得到的特征參數(shù)作為輸入量,局放類型識(shí)別結(jié)果作為輸出量,經(jīng)過訓(xùn)練得到了XLPE電纜局部放電模式識(shí)別方法。得到結(jié)論如下:
(1)與傳統(tǒng)的決策樹、SVM、隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法相比,XGBoost算法模型對(duì)局放模式識(shí)別準(zhǔn)確率更高;
(2)通過對(duì)XGBoost算法中booster(弱評(píng)估器)、n_estimators(迭代次數(shù))、subsample(采樣比例)、max_depth(樹的最大深度)等參數(shù)調(diào)節(jié)優(yōu)化,使得經(jīng)過改進(jìn)的XGBoost算法模型在原有基礎(chǔ)上識(shí)別準(zhǔn)確率提高了6.5%左右。
識(shí)別模型評(píng)價(jià)指標(biāo)除準(zhǔn)確性外,還需考慮模型的穩(wěn)定性,對(duì)于穩(wěn)定性問題文中并未考慮,后續(xù)需進(jìn)一步對(duì)所提XLPE電纜局部放電模式識(shí)別算法模型的穩(wěn)定性進(jìn)行研究。