馬吉科,尹 飛,祝永晉,豆龍龍,李 劍
(江蘇方天電力技術(shù)有限公司,江蘇 南京 210096)
隨著電力用戶的日益增多,電能表計(jì)量的準(zhǔn)確性涉及廣大用戶的切身利益。計(jì)量裝置出廠前經(jīng)過了計(jì)量檢定,但在使用過程中可能因?yàn)槟承┰驎?huì)出現(xiàn)異?,F(xiàn)象,影響了計(jì)量的準(zhǔn)確性,因此,加強(qiáng)計(jì)量裝置異常運(yùn)行狀態(tài)的監(jiān)測非常重要。目前計(jì)量裝置對異常運(yùn)行狀態(tài)進(jìn)行分析、檢查和診斷大多通過用電信息采集系統(tǒng)中相關(guān)功能進(jìn)行,這有效避免了人工現(xiàn)場操作帶來的麻煩,但是其分析過程中數(shù)據(jù)量較大,對數(shù)據(jù)的結(jié)果篩查是一項(xiàng)繁瑣而艱巨的工作[1-3]。應(yīng)用深度學(xué)習(xí)的人工智能技術(shù)可以有效減免這些弊端,發(fā)揮大電網(wǎng)數(shù)據(jù)量大、處理速度快、數(shù)據(jù)類型多、價(jià)值大、精準(zhǔn)性高的特點(diǎn),主動(dòng)深入地鉆取數(shù)據(jù)特性,通過數(shù)據(jù)關(guān)聯(lián)關(guān)系挖掘數(shù)據(jù)價(jià)值,并且隨著數(shù)據(jù)量的增長,迭代式地進(jìn)行機(jī)器學(xué)習(xí),自動(dòng)優(yōu)化模型參數(shù),修正電能計(jì)量裝置運(yùn)行狀態(tài)判定規(guī)則,高效地鎖定電能計(jì)量裝置運(yùn)行異常用戶,準(zhǔn)確識(shí)別電能計(jì)量裝置運(yùn)行的異常狀況,真正意義上做到讓數(shù)據(jù)說話,從而提高計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)效率[4-7]。
計(jì)量異常指因某種原因引起的計(jì)量裝置所計(jì)量的電能與計(jì)量點(diǎn)實(shí)際流過的電能量值不符,其偏差超出了計(jì)量裝置原本設(shè)置的允許誤差范圍。引起計(jì)量異常的原因主要分為:
1)計(jì)量裝置故障。
電力計(jì)量裝置存在故障,屬于造成電力計(jì)量裝置異常運(yùn)行的主要原因[8]。例如電力計(jì)量裝置經(jīng)常運(yùn)行在低標(biāo)準(zhǔn)的環(huán)境下,或者計(jì)量裝置的配置、生產(chǎn)質(zhì)量不符合相關(guān)規(guī)定,久而久之電力計(jì)量裝置將不能正常運(yùn)行,常見問題主要為PT/CT參數(shù)劣化超差、二次回路斷路、短路、壓降過大、負(fù)載不匹配、計(jì)量儀表故障或誤差超限。一旦計(jì)量裝置不能正常運(yùn)行,將可能造成明顯的誤差,因此對最終的結(jié)算造成巨大影響,還可能埋下其他安全隱患,造成不可預(yù)估的損失。
2)計(jì)量裝置安裝操作失誤。
目前在電力企業(yè)中廣泛應(yīng)用的電能計(jì)量裝置是由電能表、負(fù)荷管理終端、智能計(jì)量終端、集中抄表數(shù)據(jù)采集終端以及計(jì)算柜等構(gòu)成[9-14]?,F(xiàn)在電力計(jì)量裝置安裝的主要問題是施工人員能力不足以及欠缺責(zé)任感,這是最直接的電力計(jì)量裝置施工缺陷,其中主要包括:PT/CT參數(shù)選型和安裝位置不當(dāng)、二次回路接線錯(cuò)誤/連接不到位、檢驗(yàn)后未恢復(fù),導(dǎo)致電能計(jì)量裝置的計(jì)量準(zhǔn)確性受到了極大的影響。
3)計(jì)量裝置被人為破壞。
幾乎所有的竊電用戶的目的是為了少繳甚至不繳電費(fèi),竊電行為的本質(zhì)是人為破壞或者改裝電力計(jì)量裝置使其不能夠正常運(yùn)行,以此讓計(jì)量的電量數(shù)據(jù)低于實(shí)際中使用的電量來降低電費(fèi)[15-18]??萍嫉母屡c發(fā)展催生了更多的竊電手段,常見的人為破壞方式是周期性、長期性、永久性地人為變造或破壞PT/CT、二次回路、計(jì)量儀表。
4)計(jì)量裝置負(fù)荷異常。
特殊的用電設(shè)備其負(fù)荷存在無功、諧波、三相不平衡、越計(jì)量極限(超表額定容量50%)用電等因素,影響計(jì)量裝置的計(jì)量準(zhǔn)確性。
如前所述,計(jì)量異常的主要原因有計(jì)量裝置故障、計(jì)量裝置安裝操作失誤、計(jì)量裝置被人為破壞、計(jì)量裝置負(fù)荷異常。計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)中,可以通過一些計(jì)量數(shù)據(jù)的表現(xiàn)來進(jìn)行辨識(shí),這些計(jì)量數(shù)據(jù)的客觀表現(xiàn)決定了計(jì)量裝置運(yùn)行狀態(tài)是正?;虍惓!2捎檬裁从?jì)量數(shù)據(jù)進(jìn)行計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)是此類方法的關(guān)鍵問題。文獻(xiàn)[4]對采樣電壓和電流信號(hào)進(jìn)行處理并相乘轉(zhuǎn)換成與電能成正比的脈沖,以此作為計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)的輸入特征。文獻(xiàn)[5]從某省用戶的用電信息記錄中抽取某些用戶的檔案信息(用電地址、是否為專變用戶)及每天電量信息,作為計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)的輸入特征。文獻(xiàn)[6]從電信息采集系統(tǒng)采集的數(shù)據(jù)中選取一天中不同時(shí)刻采集的分相電壓、電流、功率因數(shù),作為計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)的輸入特征。本文基于抄表系統(tǒng)持續(xù)、在線遠(yuǎn)程讀取電能表的計(jì)量數(shù)據(jù),從以下5個(gè)方面辨識(shí)計(jì)量異常:
1)電氣參量的物理關(guān)聯(lián)性:檢查電壓、電流、功率、電量之間的邏輯及對應(yīng)的電網(wǎng)運(yùn)行方式。
2)某個(gè)電氣參量的日、周、月、季的歷史周期性變化規(guī)律與常規(guī)行業(yè)分類用戶的生產(chǎn)特性的一致性。
3)比較同行業(yè)同類型生產(chǎn)方式下的用戶用電負(fù)荷規(guī)律一致性。
4)生產(chǎn)運(yùn)營合理性,比較同行業(yè)用戶用電量與平均電價(jià)、需量利用率、容量利用率、變損率等的合理性。
5)閉環(huán)回路的計(jì)量電量平衡檢查,損失電量的相關(guān)性檢查。
將辨識(shí)計(jì)量異常的5個(gè)方面中的12個(gè)變量(電壓、電流、功率、電量、生產(chǎn)特性一致性系數(shù)、周期性變化系數(shù)、同行業(yè)平均電價(jià)、需量利用率、容量利用率、變損率、電量平衡系數(shù)以及損失電量)以及對應(yīng)的日、月、季度、年數(shù)據(jù)共48個(gè)維度構(gòu)成輸入特征。
圖1為基于半監(jiān)督學(xué)習(xí)的計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)模型構(gòu)建方法。其構(gòu)建方法使用了協(xié)同學(xué)習(xí)的半監(jiān)督學(xué)習(xí)思想。
圖1 計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)模型構(gòu)建方法
本文采用的協(xié)同訓(xùn)練(Co-training)算法步驟如下:
Step1對原始數(shù)據(jù)進(jìn)行預(yù)處理,將標(biāo)記數(shù)據(jù)集L劃分為x1和x2;
Step2從未標(biāo)記數(shù)據(jù)集U中隨機(jī)地選取u個(gè)示例,放入集合U′中;
Step3用L的x1部分訓(xùn)練出一個(gè)分類器h1;
Step4用L的x2部分訓(xùn)練出一個(gè)分類器h2;
Step5用h1對U′中所有元素進(jìn)行標(biāo)記,從中選出p個(gè)正標(biāo)記和n個(gè)負(fù)標(biāo)記;
Step6用h2對U′中所有元素進(jìn)行標(biāo)記,從中選出p個(gè)正標(biāo)記和n個(gè)負(fù)標(biāo)記;
Step7將上面選出的2p+2n個(gè)標(biāo)記加入L中;
Step8隨機(jī)從U中選取2p+2n個(gè)數(shù)據(jù)補(bǔ)充到U′中;
Step9重復(fù)Step3~Step8k次。
本文采用主成分分析法來做數(shù)據(jù)降維,在盡可能多地保證原始信息的情況下降低特征數(shù)量,原理[7]如下:
設(shè)x1,x2,…,xD是D維度的原始特征,記作X=(x1,x2,…,xD)T,μ=E(X)=(μ1,μ2,…,μD)T是平均值,σ=(σij)D×D=E[X-μ][X-μ]T是一個(gè)D階半正定的協(xié)方差矩陣。
設(shè)li=(l1i,l2i,…,lDi)T,i=1,2,…,D,為D個(gè)常數(shù)向量,則有:
可得:
其中,Var(yi)是方差,Cov(yi,yj)是協(xié)方差。
以yi替代原式中D個(gè)變量x1,x2,…,xD,即期望Var(yi)盡量大,使用約束:
求l1,使Var(y1)最大。y1稱為x1,x2,…,xD的第一主成分。若第一主成分y1不能表達(dá)D個(gè)變量的原始信息,使用約束:
求li,使Var(yi)最大,yi稱為第i個(gè)主成分。
此外,計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)模型構(gòu)建還需要依靠分類器。分類器h1和h2可以使用的技術(shù)包括:多層感知機(jī)(MLP)[19]、決策樹(DT)、支持向量機(jī)(SVM)[20-21]、k最近鄰法(KNN)[22]和隨機(jī)森林(RFA)。
將辨識(shí)計(jì)量異常的48維特征作為輸入的原始信息,通過貢獻(xiàn)率對48維原始信息降維,結(jié)果見表1。
其中分類器采用SVM,核函數(shù)為高斯核函數(shù)(RBF),即:
K(xi,xj)=exp(-γ‖xi-xj‖2),γ>0
表1 不同PCA特征子集和原始特征集的測試參數(shù)
特征集合βmCγnPCA特征子集0.8010000840.8510001670.9010016100.9510008131.0010000441原始特征———10000448
最佳模型是在訓(xùn)練集上進(jìn)行五折交叉驗(yàn)證與網(wǎng)格搜索后產(chǎn)生的,參數(shù)C作為SVM的懲罰系數(shù),C越高越不能容忍出現(xiàn)誤差,容易過擬合,C越小,容易欠擬合,C的值為:10-1、100、101、102、103、104;γ選擇RBF函數(shù)作為核后,決定了數(shù)據(jù)映射到新的特征空間后的分布,γ越大,支持向量越少,γ越小,支持向量越多,γ的值為:2-1、20、21、23、24、25。η評估平均指標(biāo)的計(jì)算方法為:
表2 主成分分析測試結(jié)果
特征集合βma/%krηPCA特征子集0.8091.320.9130.9640.9300.8592.930.9220.9690.9400.9094.110.9320.9740.9490.9597.150.9510.9810.9681.0097.230.9540.9820.969原始特征———97.230.9540.9820.969
表2是主成分分析測試結(jié)果,a表示測試正確率,k表示卡巴統(tǒng)計(jì)量,r表示曲線下面積。從表1、表2可知,SVM在βm=1的情況下分類能力沒有損失。當(dāng)βm=0.95時(shí),主成分分析將48維降成13維,減少了大量原始特征,且η只減少了0.001。所以將βm=0.95的13維主成分分析特征子集作為計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)模型輸入。
本文采用周期為1年且有計(jì)量裝置運(yùn)行狀態(tài)標(biāo)識(shí)的400戶數(shù)據(jù)作為分類器h1與h2的初始訓(xùn)練數(shù)據(jù),周期為3年且沒有計(jì)量裝置運(yùn)行狀態(tài)標(biāo)識(shí)的4000戶數(shù)據(jù)作為Co-training的訓(xùn)練數(shù)據(jù),周期為1年且有計(jì)量裝置運(yùn)行狀態(tài)標(biāo)識(shí)的400戶數(shù)據(jù)為測試數(shù)據(jù)。以上數(shù)據(jù)均不重復(fù)。將上述13維PCA特征子集作為其他暫態(tài)穩(wěn)定評估模型的輸入,包括MLP、DT、KNN、RFA、SVM評估模型(Co-training使用兩兩組合訓(xùn)練共10種訓(xùn)練組合)。其中多層感知器使用反向傳播訓(xùn)練模型參數(shù),學(xué)習(xí)速率和動(dòng)量因子分別為0.8和0.6;決策樹使用經(jīng)典的C4.5算法,在絕大多數(shù)場合其置信因子的默認(rèn)值為0.25[14]。k最近鄰法中k為3的初始值進(jìn)行訓(xùn)練。這些評估模型執(zhí)行2000次后的測試結(jié)果如表3所示。
表3 Co-training 10組評估模型的測試結(jié)果
評估模型訓(xùn)練輪數(shù)測試準(zhǔn)確率/%MLP+DT200087.61MLP+SVM200084.25MLP+KNN200086.03MLP+RFA200071.25DT+SVM200076.55DT+KNN200081.93DT+RFA200085.62SVM+KNN200091.34SVM+RFA200096.52KNN+RFA200085.40
同樣的評估模型及參數(shù),在不使用Co-training而單獨(dú)訓(xùn)練并測試后的分類性能如表4所示。
表4 單評估模型的測試結(jié)果
評估模型訓(xùn)練輪數(shù)測試準(zhǔn)確率/%MLP200061.33RFA200069.93DT200071.40SVM200063.41KNN200061.24
從表3可觀測到,利用13維整體特征在選用SVM+KNN模型時(shí)描述本文計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)特征時(shí)測試的分類性能比單個(gè)評估模型更好,說明相較單個(gè)模型,組合模型的效果性能更佳。通過對比表3和表4可知,本文提出的計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)模型在較大數(shù)據(jù)量的用電數(shù)據(jù)上分類性能較好,說明這種應(yīng)用半監(jiān)督學(xué)習(xí)的計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)方法可有效地辨識(shí)計(jì)量裝置運(yùn)行狀態(tài)。
本文使用5種計(jì)量異常辨識(shí)方法得到原始特征數(shù)據(jù),然后利用主成分分析法對48維的計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)原始特征進(jìn)行降維。并在4800個(gè)用電用戶學(xué)習(xí)測試上,利用Co-training對機(jī)器學(xué)習(xí)算法進(jìn)行組隊(duì)協(xié)同訓(xùn)練,體現(xiàn)了Co-training的有效性,得到如下結(jié)論:
1)綜合5種計(jì)量異常辨識(shí)模型能有效地辨識(shí)計(jì)量裝置的運(yùn)行狀態(tài)。
2)基于計(jì)量異常辨識(shí)方法的特征子集能代替原始特征有效表征計(jì)量裝置的狀態(tài),有利于簡化計(jì)量異常狀態(tài)的復(fù)雜度。
3)綜合用電用戶在計(jì)量裝置異常數(shù)據(jù)上的體現(xiàn),Co-training半監(jiān)督學(xué)習(xí)比傳統(tǒng)單模型的監(jiān)督學(xué)習(xí)更加有效。