陸 雙,彭曙蓉,楊云皓,蘇 盛,劉登港,張 恒,王書龍
(1. 長(zhǎng)沙理工大學(xué)電氣與信息工程學(xué)院,湖南 長(zhǎng)沙 410114;2. 浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310027;3. 武漢大學(xué)電氣與自動(dòng)化學(xué)院,湖北 武漢 430072)
自2013 年3 月國(guó)家電網(wǎng)公司出臺(tái)《關(guān)于做好分布式電源并網(wǎng)服務(wù)工作的意見》以來(lái),新能源發(fā)電產(chǎn)業(yè)不斷興起,大大小小的分布式光伏電站不斷建成并網(wǎng),極大地推進(jìn)了我國(guó)光伏產(chǎn)業(yè)的飛速發(fā)展[1],但也帶來(lái)了不少的問(wèn)題,分布式光伏電站一般僅向電網(wǎng)公司上傳光伏發(fā)電系統(tǒng)的并網(wǎng)狀態(tài)、發(fā)電量等信息,缺乏有效的輔助測(cè)量信息,存在用戶通過(guò)一定的技術(shù)手段進(jìn)行光伏竊電的行為。光伏竊電行為是在光伏發(fā)電系統(tǒng)中注入功率,但是注入的功率并不是來(lái)自光伏電池陣列輸出的功率,而是來(lái)自電網(wǎng)的輸出功率。光伏竊電用戶將這些注入功率偽裝成光伏電池陣列輸出功率流過(guò)光伏電能計(jì)量表,使得光伏電能計(jì)量表虛高,進(jìn)而獲取高額補(bǔ)貼[2-4]。
基于光伏特殊的發(fā)電方式,催生了很多新型的竊電手段,而光伏防竊電與傳統(tǒng)防竊電有所不同。目前關(guān)于防竊電技術(shù)的研究主要針對(duì)傳統(tǒng)竊電方式開展,對(duì)象側(cè)重于電能計(jì)量表本體,每臺(tái)電能計(jì)量表都需安裝防竊電裝置,工程量大且效果不好。文獻(xiàn)[5]建立了分布式光伏并網(wǎng)信號(hào)的數(shù)學(xué)表征式,并基于時(shí)分割乘法器(TDM)電能計(jì)量模型,提出了適應(yīng)分布式光伏動(dòng)態(tài)特性的改進(jìn)電能計(jì)量模型;文獻(xiàn)[6]提出將關(guān)口電表數(shù)據(jù)隨光伏計(jì)量表數(shù)據(jù)變化的斜率作為虛增電量的檢測(cè)指標(biāo),提高了檢測(cè)便捷性。另一方面,對(duì)于光伏竊電現(xiàn)象的識(shí)別主要通過(guò)以下方法實(shí)現(xiàn):基于線損率標(biāo)桿值確定臺(tái)區(qū)光伏竊電的嚴(yán)重程度,將發(fā)電量預(yù)測(cè)理論值與光伏計(jì)量值進(jìn)行比較,再結(jié)合竊電嫌疑判別方法進(jìn)行判定。文獻(xiàn)[7]基于全天空云圖,利用數(shù)字圖像處理技術(shù)提取與輻射相關(guān)的圖像特征,將大氣層外輻射、大氣質(zhì)量、圖像亮度和云量作為輸入因子,較好地解決了云造成的影響;文獻(xiàn)[8]采用歐氏距離對(duì)天氣類型進(jìn)行處理,將不同天氣類型的平均發(fā)電功率之間的倍率關(guān)系映射為一個(gè)天氣類型指數(shù),該模型在各種天氣類型下都有較準(zhǔn)確的預(yù)測(cè)能力和較強(qiáng)的適用性;文獻(xiàn)[9]提出了基于無(wú)監(jiān)督學(xué)習(xí)的異常用電模式檢測(cè)模型,適用于電力用戶數(shù)據(jù)集缺乏訓(xùn)練樣本的情況。但是影響光伏出力的因素眾多[10],預(yù)測(cè)模型難以進(jìn)行全面考慮,導(dǎo)致預(yù)測(cè)精度不高以及識(shí)別準(zhǔn)確率低。
本文針對(duì)現(xiàn)有的光伏竊電識(shí)別方法,發(fā)現(xiàn)電量數(shù)據(jù)相比氣象數(shù)據(jù)更易獲取齊全,且受影響較小,基于此提出了一種通過(guò)計(jì)算光伏用戶的平均影響值MIV(Mean Impact Value)來(lái)表示同一地區(qū)其他光伏用戶與當(dāng)?shù)貥?biāo)桿光伏用戶發(fā)電量之間的關(guān)聯(lián)程度,挖掘異常光伏用戶的方法。MIV 可反映神經(jīng)網(wǎng)絡(luò)中權(quán)重矩陣的變化情況,被認(rèn)為是在神經(jīng)網(wǎng)絡(luò)中評(píng)價(jià)變量之間關(guān)聯(lián)性最好的指標(biāo)之一,可用于確定輸入神經(jīng)元對(duì)輸出神經(jīng)元的影響程度。該方法能夠降低光伏用戶發(fā)電量影響因素的干擾程度,MIV 和前向搜索算法的組合運(yùn)用提高了異常光伏用戶的識(shí)別效率及精度[11-13]。最后基于相關(guān)數(shù)據(jù)進(jìn)行算例仿真,結(jié)果驗(yàn)證了所提識(shí)別方法的有效性。
本文所研究區(qū)域?yàn)楸壤麜r(shí)某一包含11 座光伏電站的區(qū)域,總面積為3.05×104km2,地理位置圖見附錄A 圖A1。圖中,地區(qū)5 與地區(qū)11 之間的直線距離約為220 km,地區(qū)8 與地區(qū)9 之間的直線距離約為140 km。各地區(qū)周邊相鄰基本為陸地(除了地區(qū)5、8 附近),氣候條件大致類似。分析各光伏電站的光伏出力相關(guān)性,根據(jù)相關(guān)性結(jié)果選定最終光伏電站的研究區(qū)域。
為了說(shuō)明本文所提異常光伏用戶識(shí)別方法的可行性,需要考慮該區(qū)域同一時(shí)段內(nèi)不同光伏電站之間的出力相關(guān)性,相關(guān)性反映了同一時(shí)段內(nèi)不同光伏電站出力之間的關(guān)系。對(duì)于包含N座光伏電站的光伏基地而言,一般認(rèn)為電能計(jì)量表會(huì)維持自身相應(yīng)時(shí)間的讀數(shù),每15 min 記錄1 次數(shù)據(jù),那么不考慮延時(shí)的相關(guān)系數(shù)矩陣為:
本文在比利時(shí)區(qū)域選取11 座光伏電站(以地區(qū)編號(hào)標(biāo)記光伏電站編號(hào))進(jìn)行出力相關(guān)性分析,根據(jù)式(2)分別討論11 座光伏電站在小時(shí)時(shí)間尺度和日時(shí)間尺度下的出力相關(guān)性,即分別取n=4 和n=49 計(jì)算各光伏電站兩兩之間的出力相關(guān)系數(shù)矩陣,從而選取地理位置合適的光伏電站。光伏電站小時(shí)時(shí)間尺度、日時(shí)間尺度的出力曲線分別見附錄A 圖A2和圖A3。小時(shí)時(shí)間尺度、日時(shí)間尺度出力相關(guān)性結(jié)果分別如附錄A 表A1 和表A2 所示(表中加粗?jǐn)?shù)據(jù)為相關(guān)系數(shù)小于0.5 的數(shù)據(jù))。由表可知:在日時(shí)間尺度下,本文所研究比利時(shí)區(qū)域的11 座光伏電站之間的出力相關(guān)性都比較高;但在小時(shí)時(shí)間尺度下,光伏電站2、5、11 之間的出力相關(guān)性比較低,故本文最終選取研究其他8 座光伏電站。其他8 座光伏電站之間的出力相關(guān)系數(shù)較接近1,反映了光伏電站之間的出力相關(guān)性較高,為此能夠?qū)@些光伏電站統(tǒng)一進(jìn)行光伏出力異常行為分析,為后文的分析提供可行性依據(jù)。
分布式光伏發(fā)電是指在用戶場(chǎng)地附近建設(shè)的光伏電站,運(yùn)行方式以“用戶側(cè)自發(fā)自用、多余電量上網(wǎng)”為主。由于國(guó)家會(huì)給予光伏用戶高額的補(bǔ)貼,不少用戶利用技術(shù)手段使電能計(jì)量表數(shù)據(jù)虛高。
通過(guò)從電站發(fā)電能力、故障情況、安全文明生產(chǎn)、運(yùn)行管理、班組建設(shè)、設(shè)備運(yùn)行等多方面進(jìn)行綜合評(píng)估后得到標(biāo)桿光伏用戶,其能夠代表該地區(qū)光伏電站的發(fā)電水平。通過(guò)計(jì)算同一地區(qū)其他光伏用戶與當(dāng)?shù)貥?biāo)桿光伏用戶發(fā)電量之間的相關(guān)性,可以挖掘異常光伏用戶,有效識(shí)別光伏竊電行為。
2.2.1 數(shù)據(jù)選取原則
光伏電站的有效發(fā)電時(shí)段為06:00—18:00,在此基礎(chǔ)上獲取比利時(shí)區(qū)域8 座光伏電站連續(xù)多天且時(shí)間間隔為15 min 的發(fā)電數(shù)據(jù),具體天數(shù)需根據(jù)光伏電站的實(shí)際發(fā)電情況而定,本文選取1 個(gè)月的發(fā)電量數(shù)據(jù),且選定地區(qū)3(Flemish_Brabant)用戶為標(biāo)桿光伏用戶。定義該地區(qū)的光伏用戶集合X={X1,X2,…,XN}(N為光伏用戶的數(shù)量;X1為標(biāo)桿光伏用戶;Xi(i=2,3,…,N)為其他光伏用戶),根據(jù)上述數(shù)據(jù)計(jì)算得到光伏用戶Xi(i=1,2,…,N)的日發(fā)電量數(shù)據(jù)序列Xi={xi1,xi2,…,xiT}(xij(j=1,2,…,T)為光伏用戶Xi在第j天的發(fā)電量,T為所選取光伏用戶發(fā)電數(shù)據(jù)的天數(shù)),并根據(jù)式(3)進(jìn)行歸一化處理,得到歸一化發(fā)電量數(shù)據(jù)序列Yi={yi1,yi2,…,yiT}。
2.2.2 BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練
在人工神經(jīng)網(wǎng)絡(luò)中,BP 神經(jīng)網(wǎng)絡(luò)是目前研究最為成熟、應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)模型之一[14-15],因此本文選用BP 神經(jīng)網(wǎng)絡(luò)仿真得到與MIV 相關(guān)的影響變化值(IV)。BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1 所示,其包含輸入層、隱含層、輸出層。在BP 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練過(guò)程中,輸入量為除標(biāo)桿光伏用戶外其他光伏用戶的發(fā)電量數(shù)據(jù),將標(biāo)桿光伏用戶的發(fā)電量數(shù)據(jù)作為網(wǎng)絡(luò)輸出量。BP 神經(jīng)網(wǎng)絡(luò)輸入層、隱含層、輸出層的定義式如式(6)—(8)所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Structure diagram of BP neural network
式中:αh為隱含層的第h個(gè)神經(jīng)元接收到的輸入值;βj為隱含層的第j個(gè)神經(jīng)元輸入輸出層的結(jié)果;y?k為輸出層第k個(gè)神經(jīng)元的輸出值;σ(?)為激活函數(shù),用于增加網(wǎng)絡(luò)非線性擬合能力;vih為輸入層的第i個(gè)神經(jīng)元與第1 個(gè)隱含層的第h個(gè)神經(jīng)元之間的連接權(quán)重;whj為第1個(gè)隱含層的第h個(gè)神經(jīng)元與第2個(gè)隱含層的第j個(gè)神經(jīng)元之間的連接權(quán)重;ujk為第2個(gè)隱含層的第j個(gè)神經(jīng)元與輸出層的第k個(gè)神經(jīng)元之間的連接權(quán)重;D、q、p分別為輸入層、隱含層、輸出層的神經(jīng)元個(gè)數(shù)。
當(dāng)實(shí)際輸出與期望輸出不符時(shí),進(jìn)入誤差的反向傳播階段。誤差通過(guò)輸出層,按誤差梯度下降的方式修正各層權(quán)重值,向隱含層、輸入層逐層反向傳播。周而復(fù)始的信息正向傳播和誤差反向傳播過(guò)程,是各層權(quán)重值不斷調(diào)整的過(guò)程,也是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過(guò)程,重復(fù)該過(guò)程直至網(wǎng)絡(luò)輸出的誤差減少到可以接受的程度。
本文所提異常識(shí)別方法能夠降低光伏用戶發(fā)電量影響因素的干擾程度,通過(guò)計(jì)算MIV 和運(yùn)用啟發(fā)式前向搜索算法,提高了異常光伏用戶的檢測(cè)效率與精度。本文所提異常光伏用戶的識(shí)別流程圖如圖2所示。
圖2 異常光伏用戶的識(shí)別流程圖Fig.2 Flowchart of identifying abnormal photovoltaic users
MIV 可反映BP 神經(jīng)網(wǎng)絡(luò)中權(quán)重矩陣的變化情況,被認(rèn)為是在神經(jīng)網(wǎng)絡(luò)中評(píng)價(jià)變量之間關(guān)聯(lián)性最好的指標(biāo)之一,可用于確定輸入神經(jīng)元對(duì)輸出神經(jīng)元的影響程度,其數(shù)值的正負(fù)性表示自變量對(duì)因變量產(chǎn)生影響的方向。
可以根據(jù)MIV計(jì)算得到當(dāng)?shù)仄渌夥脩襞c標(biāo)桿光伏用戶發(fā)電量之間的相關(guān)性,具體計(jì)算過(guò)程如下:BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練終止后,在原有發(fā)電量數(shù)據(jù)樣本的基礎(chǔ)上構(gòu)建新的訓(xùn)練樣本,將除標(biāo)桿光伏用戶之外的其他光伏用戶的發(fā)電量數(shù)據(jù)在其原始數(shù)據(jù)基礎(chǔ)上增加10%和降低10%構(gòu)成2 組新的訓(xùn)練樣本,分別記為樣本S1和S2;然后將樣本S1和S2分別作為網(wǎng)絡(luò)的輸入仿真樣本,利用已建成的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真,將標(biāo)桿光伏用戶的發(fā)電量作為網(wǎng)絡(luò)輸出,得到2 組仿真結(jié)果,分別記為A1和A2,它們之間的差值就是變動(dòng)原始數(shù)據(jù)后對(duì)網(wǎng)絡(luò)輸出產(chǎn)生的IV;最后將IV 除以天數(shù)T得到光伏用戶與標(biāo)桿光伏用戶之間的MIV,即光伏用戶的MIV 集合M={MMIV2,MMIV3,…,MMIVN}(MMIVi(i=2,3,…,N)為光伏用戶Xi的MIV),MMIVi的絕對(duì)值大小反映了光伏用戶與當(dāng)?shù)貥?biāo)桿光伏用戶發(fā)電量之間的相關(guān)性程度大小。
采用啟發(fā)式前向搜索算法逐個(gè)選取特征,即從空集開始,從當(dāng)前候選光伏用戶的MIV 集合M={MMIV2,MMIV3,…,MMIVN}中選取MIV 最大的光伏用戶放置到已選用戶集合中,并在候選光伏用戶集合中將其剔除,直至已選用戶集合的MIV達(dá)到要求,即所選光伏用戶Xy的MIV為:
MMIVy=argmax{MMIVi}i=2,3,…,N(9)
當(dāng)篩選的光伏用戶集合的評(píng)價(jià)值滿足式(10)所示終止條件時(shí),停止光伏用戶的篩選,判定未被篩選的用戶為異常光伏用戶。
式中:D′為未被篩選的光伏用戶MIV 中的最大值與已篩選光伏用戶MIV 總和的比值,當(dāng)其不大于所設(shè)定的終止閾值0.1時(shí),停止對(duì)光伏用戶的篩選。
上述方法能同時(shí)兼顧計(jì)算效率與選擇效果,實(shí)現(xiàn)了以較小的計(jì)算量得到較好的篩選效果。
本文從比利時(shí)區(qū)域選取8 個(gè)光伏電站用戶(地區(qū)1、3、4、6—10 用戶)連續(xù)1 個(gè)月(5 月份)06:00—18:00以15 min為時(shí)間間隔的發(fā)電量數(shù)據(jù),其中地區(qū)3(Flemish_Brabant)用戶為標(biāo)桿光伏用戶。為了使本文方法的有效性得到充分體現(xiàn),特地人為構(gòu)造了4 組竊電用戶數(shù)據(jù),4 組竊電用戶數(shù)據(jù)的構(gòu)造準(zhǔn)則為:構(gòu)造用戶1,將光伏發(fā)電量等比例放大一定的倍數(shù);構(gòu)造用戶2,在某特定時(shí)段將光伏發(fā)電量放大一定的倍數(shù);構(gòu)造用戶3,在原始數(shù)據(jù)縮放的基礎(chǔ)上隨機(jī)增加某一數(shù)值,但一天中最大值出現(xiàn)時(shí)間點(diǎn)的數(shù)據(jù)保持不變;構(gòu)造用戶4,上述準(zhǔn)則兩兩混合構(gòu)造[16-17]。
按照本文所提方法,采用原始發(fā)電量數(shù)據(jù)訓(xùn)練BP 神經(jīng)網(wǎng)絡(luò),結(jié)合MIV 計(jì)算方法利用已建成的BP神經(jīng)網(wǎng)絡(luò)仿真得到除標(biāo)桿光伏用戶之外其他光伏用戶的MIV,然后利用啟發(fā)式前向搜索算法進(jìn)行篩選,直到滿足終止條件,未被篩選的用戶則為異常光伏用戶。采用MATLAB 進(jìn)行算例仿真,電腦配置為2.6 GHz,8 GB RAM。
在利用原始發(fā)電量數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)時(shí),將標(biāo)桿光伏用戶作為網(wǎng)絡(luò)輸出,其他11 個(gè)光伏用戶作為網(wǎng)絡(luò)輸入;以5 d 為時(shí)間間隔對(duì)1 個(gè)月分6 次進(jìn)行MIV 計(jì)算,這樣可以排除一些非竊電故障因素的影響,減小誤報(bào)率。經(jīng)過(guò)仿真計(jì)算得到各光伏用戶的6次MIV結(jié)果如附錄A表A3所示。然后采用啟發(fā)式前向搜索算法對(duì)光伏用戶進(jìn)行篩選,所得結(jié)果如表1 所示(表中加粗?jǐn)?shù)據(jù)為未被篩選用戶的MIV)。各用戶某一周內(nèi)的光伏發(fā)電量曲線如圖3所示。
圖3 各用戶的發(fā)電量曲線Fig.3 Power generating curve of each user
由表1 可知,人為構(gòu)造的竊電用戶基本上每次都被篩選出來(lái),結(jié)合圖3 所示發(fā)電量數(shù)據(jù)可以驗(yàn)證本文方法的有效性。與標(biāo)桿光伏用戶地區(qū)鄰近的其他地區(qū)光伏用戶被判定為正常用戶,除了地區(qū)9 和地區(qū)10 用戶分別有1 次和2 次未被篩選,有可能是因?yàn)檫@2 個(gè)地區(qū)相較于其他地區(qū)離標(biāo)桿光伏用戶地區(qū)稍遠(yuǎn),超出了適用范圍(140 km),也有可能是因?yàn)楣夥脩粼谀嵌螘r(shí)間內(nèi)某個(gè)部件出現(xiàn)故障現(xiàn)象,此時(shí)先不判定竊電嫌疑,如果后續(xù)又出現(xiàn)未被篩選的情況,則判定其為異常光伏用戶,而且可能是從首次未被篩選時(shí)開始竊電,需要對(duì)其重新進(jìn)行檢查。本文后續(xù)也進(jìn)行了1月份及8月份相關(guān)數(shù)據(jù)的仿真,所得結(jié)果均能很好地識(shí)別竊電嫌疑用戶,驗(yàn)證了所提方法具有較好的普適性。
表1 啟發(fā)式前向搜索算法的篩選結(jié)果Table 1 Filter results of heuristic forward searching algorithm
為了進(jìn)一步體現(xiàn)本文所提方法的有效性,將其與以下2種方法進(jìn)行對(duì)比驗(yàn)證。
1)方法1,利用光伏發(fā)電量容量比及其偏離值分析識(shí)別異常光伏用戶。首先計(jì)算每天各用戶發(fā)電量容量比和地區(qū)光伏用戶總發(fā)電量容量比,然后核查容量比偏離值K(K=(Pav-Pˉtotal,av)/Pˉtotal,av,Pav為光伏用戶發(fā)電量容量比,Pˉtotal,av為全地區(qū)平均發(fā)電量容量比),并計(jì)算30 d 的K值之和Ktotal。若Ktotal>30,則將該用戶列為重點(diǎn)現(xiàn)場(chǎng)排查用戶。上述11 個(gè)光伏用戶的容量比偏離值結(jié)果如表2 所示。由表可知,方法1 只適用于識(shí)別竊電非常嚴(yán)重的用戶,對(duì)于其他情況無(wú)法進(jìn)行有效排查。
表2 各用戶的容量比偏離值Table 2 Deviation values of users’capacity ratio
2)方法2,利用發(fā)電量頻率分布相對(duì)熵進(jìn)行異常光伏用戶識(shí)別。將本文所用仿真數(shù)據(jù)按各自時(shí)段內(nèi)的最大發(fā)電量數(shù)值進(jìn)行標(biāo)準(zhǔn)化,并將其等分為10個(gè)頻率區(qū)間,但由于數(shù)據(jù)量少且輕度異常時(shí)無(wú)明顯頻率特性特征,在頻率特性的基礎(chǔ)上運(yùn)用相對(duì)熵進(jìn)一步識(shí)別異常用戶,但需要設(shè)置合理的時(shí)間窗口和閾值,比較復(fù)雜,該方法的實(shí)現(xiàn)要求較高。
綜上可知,本文所提方法可以降低光伏用戶發(fā)電量影響因素的干擾程度,同時(shí)系統(tǒng)性地提高異常光伏用戶的識(shí)別效率及精度。
本文首次提出采用MIV評(píng)估光伏用戶與區(qū)域內(nèi)標(biāo)桿光伏用戶之間的關(guān)聯(lián)程度,并結(jié)合啟發(fā)式前向搜索算法進(jìn)行光伏用戶MIV 篩選,未被篩選的用戶被判定為異常光伏用戶。本文方法仿真所需數(shù)據(jù)為光伏發(fā)電量數(shù)據(jù),不再受制于氣象數(shù)據(jù)的準(zhǔn)確度以及預(yù)測(cè)的精度。同時(shí)考慮以5 d 為時(shí)間間隔進(jìn)行篩選,很好地排除了光伏出力的故障因素。經(jīng)過(guò)對(duì)比驗(yàn)證可知,本文方法可以降低光伏用戶發(fā)電量影響因素的干擾程度,同時(shí)系統(tǒng)性地提高異常光伏用戶的識(shí)別效率及精度。
附錄見本刊網(wǎng)絡(luò)版(http://www.epae.cn)。