陳伯建,荀超,林超群,肖芬,林可堯,吳翔宇
(1.國網(wǎng)福建省電力有限公司電力科學(xué)研究院,福建 福州 350000;2.國網(wǎng)福建省電力有限公司,福建 福州 350001)
隨著國民經(jīng)濟(jì)的快速發(fā)展,電能需求和供給的規(guī)模不斷擴(kuò)大,發(fā)、用電形式愈發(fā)多樣化,造成了電源和負(fù)荷分布不均衡的現(xiàn)狀愈加明顯[1],實(shí)際表現(xiàn)出的能量損耗波動(dòng)頻繁,能耗比重較大的問題也日益加劇。
電網(wǎng)公司一體化電量與線損管理系統(tǒng)的推行和運(yùn)營極大程度地改善了需求側(cè)自動(dòng)化測(cè)量水平,提高了電網(wǎng)側(cè)節(jié)能降損措施效果,并且可以較為精確地定位電網(wǎng)損耗的薄弱環(huán)節(jié)[2]。但是,基于不同運(yùn)行方式下的多電壓等級(jí)損耗數(shù)據(jù)指標(biāo)依舊無法完全同步,造成了在多時(shí)間尺度下,不同平臺(tái)歸類的損耗理論計(jì)算和統(tǒng)計(jì)計(jì)算的結(jié)果契合度不高[3-4],甚至出現(xiàn)線損為“負(fù)”的異常狀況,且在非正常工況下,線損數(shù)據(jù)參差不齊,必須引入計(jì)量異常辨識(shí)方法進(jìn)行判定。
導(dǎo)致電力系統(tǒng)損耗偏差值過大的原因非常龐雜,其中數(shù)據(jù)誤差和變量缺失是造成統(tǒng)計(jì)損耗數(shù)據(jù)不真實(shí)的主要原因[5],合理地利用先進(jìn)的信息采集系統(tǒng)和大數(shù)據(jù)分析方法,可以有效地提高線損治理成效[6-7]。
針對(duì)損耗異常現(xiàn)象無法準(zhǔn)確識(shí)別和預(yù)判的情況,文獻(xiàn)[8-12]采用基于大數(shù)據(jù)的損耗分析算法,針對(duì)不同臺(tái)區(qū)的特征數(shù)據(jù)進(jìn)行訓(xùn)練,完成損耗樣本的聚類,實(shí)現(xiàn)有效的預(yù)測(cè)。文獻(xiàn)[13-15]針對(duì)同一時(shí)刻供電量和售電量無法精確匹配的問題,引入理論線損計(jì)算值作為參考,采用數(shù)據(jù)異常辨識(shí)的方法,提高了同期線損的可信度。
本文提出利用高斯混合模型[16-17]的特征分類方法,采用期望最大化迭代算法,進(jìn)行各類損耗數(shù)據(jù)的參數(shù)計(jì)算,通過所得的混合分布模型特征參數(shù)的比對(duì),識(shí)別損耗異常現(xiàn)象。
據(jù)某地區(qū)近三年的統(tǒng)計(jì)數(shù)據(jù),除了運(yùn)行設(shè)備造成的損耗以外,基于客觀條件的計(jì)量誤差、測(cè)算方法以及人為非正常用電行為的“跑冒滴漏”現(xiàn)象所造成的損耗一直偏高不下,具體數(shù)據(jù)如表1所示。
表1 損耗統(tǒng)計(jì)數(shù)據(jù)表Tab.1 Table of loss statistics
在一體化電量與線損管理系統(tǒng)的推行和運(yùn)營過程中,由于先進(jìn)的高精度互感器和儀表大規(guī)模推廣使用,由計(jì)量誤差所造成的損耗水平逐年降低。但是,由于測(cè)算方法和人為非正常用電行為因素所造成的損耗水平有同比升高的趨勢(shì),經(jīng)過分析,具體原因如下:
1)由測(cè)算方法所造成的損耗偏差成因主要以運(yùn)行方式的變化為主,由于在不同供電模式下(尤其是以A 類和B 類的環(huán)形接線),當(dāng)運(yùn)行方式發(fā)生改變后(負(fù)荷轉(zhuǎn)供、設(shè)備緊急退運(yùn)等),沒有及時(shí)地更正供售電側(cè)的拓?fù)潢P(guān)系;
2)“跑冒滴漏”現(xiàn)象所造成的損耗屬于人為非正常用電行為,具有相當(dāng)大的不確定性和隱蔽性,從表象來看,通過常規(guī)的方法,難以在正常損耗水平中直觀判定并準(zhǔn)確提取這類信息。
上述兩類異?,F(xiàn)象與正常現(xiàn)象相混合,對(duì)配電網(wǎng)的正常運(yùn)營和健康發(fā)展造成了極大的不利影響?;谏鲜鰡栴}的表象,需要從關(guān)鍵的數(shù)據(jù)挖掘環(huán)節(jié)入手,首先參考損耗歷史數(shù)據(jù),完成理論計(jì)算與統(tǒng)計(jì)計(jì)算結(jié)果的數(shù)據(jù)分布對(duì)應(yīng),采用期望最大化算法計(jì)算特征參數(shù)并形成損耗混合分布,有效降低誤差數(shù)據(jù)的影響,以此判定數(shù)據(jù)的合理性和準(zhǔn)確性,定位損耗的薄弱環(huán)節(jié),并有的放矢地提出可行措施予以降損。
由線損的理論計(jì)算得知:配電網(wǎng)潮流分布的改變可直接反映出運(yùn)行方式的變化,而且潮流又直接決定了網(wǎng)絡(luò)的損耗。根據(jù)這一相互作用關(guān)系,由潮流計(jì)算結(jié)果和網(wǎng)絡(luò)參數(shù)所推導(dǎo)的損耗數(shù)據(jù)可作為某一運(yùn)行方式下分臺(tái)區(qū)、分線的層面上的數(shù)據(jù)參考。假設(shè)某配電網(wǎng)由n條輸電線路和m個(gè)變壓器構(gòu)成,可先按照拓?fù)浣Y(jié)構(gòu),將網(wǎng)絡(luò)細(xì)化為最小單元的接線形式,具體如圖1所示。
圖1 配電網(wǎng)最小單元的接線形式圖Fig.1 Wiring diagram of the smallest unit of distribution network
圖1 中,母線k和母線i之間為變壓器單元;母線i和母線j之間為輸電線路單元;Pj+jQj為母線j后所帶的運(yùn)行負(fù)載。
3 條母線對(duì)應(yīng)的運(yùn)行電壓分別為:uk=Uk∠θk,ui=Ui∠θi和uj=Uj∠θj,可由潮流計(jì)算獲得對(duì)應(yīng)的運(yùn)行數(shù)據(jù),表征運(yùn)行方式的各節(jié)點(diǎn)電壓數(shù)據(jù)可由集合ux={u|u1,u2,… }表示,對(duì)應(yīng)的線路電流iij和線路損耗Ploss,ij可由集合ux與相關(guān)母線之間線路的等效阻抗計(jì)算,具體如下式所示:
其中
Zij=rij+jxij
式中:Zij為母線i和母線j之間線路的等效阻抗。該運(yùn)行方式下分線線損PΣloss,l為n條線路損耗之和,即
同理,可得該運(yùn)行方式下變壓器電流iki以及分臺(tái)區(qū)損耗PΣloss,T(m個(gè)變壓器損耗之和)如下式:則理論線損PΣloss,theory為兩者之和,即
在固定的時(shí)間段內(nèi),根據(jù)電源所發(fā)電量和抄表電量的差量統(tǒng)計(jì)信息,可得統(tǒng)計(jì)線損PΣloss,statistics的具體數(shù)據(jù)。通過前期的工作結(jié)果來看,統(tǒng)計(jì)線損數(shù)據(jù)與理論線損數(shù)據(jù)存在一定的不匹配量ΔPΣloss= |PΣloss,theory- PΣloss,statistics|,其主要原因在于前述損耗的測(cè)量方法和“跑冒滴漏”部分摻雜在整體數(shù)據(jù)當(dāng)中。
對(duì)于一類數(shù)據(jù)整體中含有若干個(gè)“隱含變量”的特征分布曲線,有較為復(fù)雜的波動(dòng)性特性,具體示例如圖2所示。
圖2 復(fù)雜波動(dòng)性特性分布圖Fig.2 Complex volatility characteristics distribution diagram
圖2 中,A,B,C為某一混合分布的3 個(gè)可能極值點(diǎn),一般來講,可能極值點(diǎn)與多個(gè)不同特征數(shù)據(jù)分布的極值點(diǎn)位置相近。與從圖2混合數(shù)據(jù)的分布曲線上來看,可以采用高斯混合模型(Gaussian mixture model,GMM),將其分解為多個(gè)不同特征數(shù)據(jù)分布的線性組合,即觀測(cè)數(shù)據(jù)在總體中的分布規(guī)律一定滿足由k個(gè)子高斯分布組成的線性組合。具體分析過程如下:
設(shè)Xj為第j個(gè)觀測(cè)數(shù)據(jù),j=1,2,3,…;k為混合模型中子高斯分布的數(shù)量,k=1,2,3,…;αk為第k個(gè)子高斯分布的權(quán)重,αk≥0;γjk為第j個(gè)觀測(cè)數(shù)據(jù)屬于第k個(gè)子高斯分布的概率。則對(duì)于一個(gè)在總體分布中含有K個(gè)子分布的混合概率模型,其GMM模型可被表示為
式中:N(X|θk)為第k個(gè)子高斯分布模型的度函數(shù);μk,σk分別為每個(gè)子模型的期望、標(biāo)準(zhǔn)差(或協(xié)方差)。
對(duì)于圖2 中的P(X)曲線,按照上述步驟,可以被分解為G1(X1),G2(X2)和G3(X3)三個(gè)子高斯分布的線性組合,具體如圖3所示。
圖3 線性組合分布圖Fig.3 Linear combination distribution diagram
整個(gè)GMM 模型中的若干隱變量同樣服從高斯分布,在此混合模型中,通常采用Log-Likelihood函數(shù)完成相關(guān)計(jì)算,具體公式如下:
與單高斯分布計(jì)算過程不同,考慮對(duì)于每個(gè)觀測(cè)數(shù)據(jù)點(diǎn)來說,無法完全得知其與某一個(gè)子高斯分布的隸屬關(guān)系,故無法使用最大似然法,通過對(duì)上述Log-Likelihood 函數(shù)求導(dǎo)完成參數(shù)的計(jì)算,需要通過迭代的方法完成具體分布參數(shù)的求解。
期望最大化(expectation-maximization,EM)算法可用于含有隱變量的GMM 中子高斯分布概率模型參數(shù)的最大似然估計(jì)。
每次迭代包含2個(gè)步驟,具體如下:
1)E-step:求各分布的期望。依據(jù)當(dāng)前參數(shù),計(jì)算每個(gè)數(shù)據(jù)j來自子模型k的可能性,即根據(jù)下式求得γjk為
其中
2)M-step:求各參數(shù)的極大值,計(jì)算新一輪迭代的模型參數(shù),如下式:
其中
重復(fù)計(jì)算上述E-step 和M-step,直至收斂條件|θk
i+1-θk i|≤ζ(ζ是一個(gè)小正數(shù))成立,則完成GMM中所需參數(shù)的迭代計(jì)算。
考慮EM 算法的運(yùn)算條件和過程,在迭代的過程中其計(jì)算效果會(huì)受到如下因素的影響:
1)在E-step 過程中,特征分布參數(shù)的計(jì)算次數(shù)依賴于初始值的選擇,且會(huì)影響M-step 過程的迭代精度;
2)EM 算法所具備的收斂性僅是找到全局最大值的必要條件,在某些分布中,僅能收斂于局部最大值。
針對(duì)這一現(xiàn)象,文獻(xiàn)[16-17]的解決方法是初始化幾次不同的參數(shù)或者隨機(jī)初始化模型參數(shù)進(jìn)行迭代,并比對(duì)結(jié)果以完成計(jì)算。本文考慮損耗分布的特性,做如下處理:根據(jù)子高斯分布模型的均值點(diǎn)與各極值點(diǎn)的距離不大的特性,在如圖1 所示的分布曲線上,可以找到若干個(gè)極大值點(diǎn),即A,B和C點(diǎn),利用此分布曲線上所表現(xiàn)出的直觀信息,?。?/p>
XA,XB和XC為整體分布曲線上各極值點(diǎn)的橫坐標(biāo),將其作為EM 算法各子高斯分布模型均值點(diǎn)的初始值,參與首次迭代計(jì)算。
由于EM 算法在計(jì)算時(shí),得到的結(jié)果需要迭代比對(duì),所以還需參考正常情況下的損耗歷史數(shù)據(jù)才能最終完成,同樣需要對(duì)歷史數(shù)據(jù)進(jìn)行GMM模型化并提取特征參數(shù),具體流程如圖4所示。
圖4 整體流程框圖Fig.4 Overall process block diagram
選取某配電網(wǎng)一條10 kV 線路的損耗數(shù)據(jù)正常周和兩個(gè)異常周實(shí)測(cè)數(shù)據(jù)為例,進(jìn)行分析,通過對(duì)前述GMM 模型參數(shù)的計(jì)算以及變化程度判定損耗異常情況的出現(xiàn)。
該配電網(wǎng)一條10 kV 線路的5 d 正常損耗曲線,如圖5所示。
圖5 某配電網(wǎng)10 kV線路5 d損耗正常曲線Fig.5 5 d loss normal curve of 10 kV line in a distribution network
按照前述的算法,該10 kV 線路在此5 d內(nèi)損耗數(shù)據(jù)的GMM曲線如圖6所示。
圖6 10 kV線路損耗正常日GMM分布曲線Fig.6 Normal daily GMM distribution curves of 10 kV line loss
通過式(11)~式(13),完成圖6 中的GMM 模型參數(shù)的計(jì)算,具體結(jié)果如表2所示。
表2 GMM參數(shù)表Tab.2 Parameters table of GMM
此10 kV 線路有2 d 損耗異常,第3 天恢復(fù)正常,具體曲線如圖7所示。
圖7 某配電網(wǎng)10 kV線路2 d損耗異常曲線(案例1)Fig.7 2 d loss abnormal curve of 10 kV line in a distribution network(case 1)
從圖7 中可以看出,此2 d 內(nèi)最大損耗值超出正常日最大損耗值近300 kW,基本都發(fā)生在08∶00—16∶00 這一用電高峰時(shí)間段內(nèi)。按照前述的算法,該10 kV 線路在此2 d 內(nèi)損耗數(shù)據(jù)的GMM 模型同樣由4組高斯分布構(gòu)成,具體參數(shù)如表3所示。
表3 GMM模型參數(shù)表(異常情況1)Tab.3 Parameters table of GMM(abnormal 1)
將這一情況逐級(jí)進(jìn)行梳理,定位損耗異常點(diǎn)于一小工廠內(nèi),經(jīng)現(xiàn)場(chǎng)核查,發(fā)現(xiàn)該工廠新建一套250 kW 的電伴熱裝置,且該裝置未經(jīng)計(jì)量儀表直接連于工廠進(jìn)線上,屬于統(tǒng)計(jì)線損異常所反映的“跑冒滴漏”現(xiàn)象。
隨后的某一周,該10 kV 線路在一天中的14∶00 左右發(fā)生損耗異常,第2 天恢復(fù)正常,第3天同樣在14∶00 左右出現(xiàn)異常,具體曲線如圖8所示。
圖8 某配電網(wǎng)10 kV線路3 d損耗異常曲線(案例2)Fig.8 3 d loss abnormal curves(case 2)
在此3 d內(nèi)損耗數(shù)據(jù)的GMM 模型同樣由4組高斯分布構(gòu)成,第2 天的數(shù)據(jù)與表2 差距不大,第1天和第3天的具體參數(shù)如表4所示。
表4 GMM模型參數(shù)表(異常情況2)Tab.4 Parameters table of GMM(abnormal 2)
通過與檢修部門核對(duì),定位損耗異常點(diǎn)于一干式箱變,經(jīng)現(xiàn)場(chǎng)核查,發(fā)現(xiàn)該干式箱變的絕緣部分污損,導(dǎo)致在出現(xiàn)尖峰電流的時(shí)間段內(nèi),變壓器損耗持續(xù)增大,屬于理論線損異常所反映的設(shè)備老化現(xiàn)象。
文中提出采用GMM 模型,通過EM 算法完成損耗數(shù)據(jù)的參數(shù)計(jì)算,并通過與正常日數(shù)據(jù)的比對(duì),發(fā)現(xiàn)損耗異常點(diǎn),對(duì)降損工作的開展提供有力的依據(jù),具體結(jié)論如下:
1)通過對(duì)一般正常日數(shù)據(jù)進(jìn)行GMM 模型化計(jì)算,可以還原配電網(wǎng)在正常運(yùn)行情況下?lián)p耗的水平;
2)GMM模型參數(shù)的明顯變化,有助于準(zhǔn)確完成損耗異常現(xiàn)象的識(shí)別,并對(duì)管理降損和技術(shù)降損工作提供依據(jù);
3)EM 算法的初始值設(shè)定影響GMM 模型參數(shù)的迭代計(jì)算,且本文算法需要大量歷史數(shù)據(jù)作為支撐完成損耗數(shù)據(jù)的比對(duì)。