田正其,徐晴,李如意,趙雙雙
(1. 國網(wǎng)江蘇省電力有限公司營銷服務(wù)中心,南京 210019; 2. 國家電網(wǎng)有限公司電能計量重點實驗室,南京 210019; 3. 河南許繼儀表有限公司,河南 許昌 461000)
非侵入式負荷監(jiān)測是推動電網(wǎng)實現(xiàn)智能化的一種重要技術(shù)[1],它只需通過安裝在用戶電力入口處的負荷感知模塊獲取用戶的實時用電信息[2],便可實現(xiàn)負荷能耗分解、啟停時間等信息的提取。相較于傳統(tǒng)的侵入式負荷測量而言,它具有成本低廉,安裝方便,實用性強的優(yōu)點[3]。而且,隨著泛在物聯(lián)網(wǎng)迅猛發(fā)展,非侵入負荷監(jiān)測不僅能為用戶制定智能用電策略、改善用戶用電方式提供依據(jù)[4-5],且有助于電力公司深入分析用戶用電行為,從而加強負荷需求側(cè)管理,優(yōu)化電網(wǎng)結(jié)構(gòu)[6]。
其中,負荷辨識是實現(xiàn)非侵入式監(jiān)測技術(shù)的關(guān)鍵。近年來,計算機科學(xué)和智能量測技術(shù)[7]的快速發(fā)展,為解決負荷辨識問題提供了多樣化的解決方案和思路。文獻[8]將深度翻譯序列引入到非侵入式負荷監(jiān)測的研究中,提出了一種基于深度序列翻譯的非侵入式負荷分解方法。該方法能充分利用負荷功率特征以及負荷運行時間關(guān)聯(lián)關(guān)系,從而實現(xiàn)負荷能耗的有效分解;文獻[9]針對單一設(shè)備特征負荷辨識存在的局限性,提出了一種基于特征融合與深度學(xué)習的非侵入式負荷辨識算法,該方法通過V-I軌跡圖像特征與功率數(shù)值特征的融合,以復(fù)合特征作為設(shè)備新的特征訓(xùn)練反向傳播(BP)神經(jīng)網(wǎng)絡(luò)從而實現(xiàn)非侵入式負荷辨識;文獻[10]提出了一種貝葉斯優(yōu)化的雙向長短期記憶(LSTM)方法用于解決當電器數(shù)量增加時出現(xiàn)的多維性問題,同時還引入了一個非因果模型,用以處理多家電運行的固有特征結(jié)構(gòu),并在此基礎(chǔ)上,引入貝葉斯優(yōu)化框架來選擇回歸模型的最佳參數(shù),從而提高回歸模型的性能。以上方法對負荷類型較少或用戶負荷組成已知的情況具有良好的辨識效果,但在一些家庭場景中仍然存在特征庫建立不全等問題,導(dǎo)致負荷辨識能力不足。
針對用戶負荷特征庫不全的場景以及在負荷種類繁多且有小功率負荷情況下,文中在有功、無功等電氣量特征的基礎(chǔ)上,提出了融合非電氣量特征的負荷辨識方法。該方法首先通過基于負荷事件的Mean-shift聚類算法,初步判定負荷類別數(shù),然后引入負荷運行時長、運行時段等時間特征[11],對大量負荷特征數(shù)據(jù)進行統(tǒng)計分析,訓(xùn)練得到負荷特征數(shù)據(jù)庫,并采用貝葉斯準則[12]進行非侵入式負荷決策辨識。最后,在未知的AMPds公共數(shù)據(jù)集進行實際測試,獲得了較好的辨識結(jié)果。
負荷特征是反映負荷運行狀態(tài)的重要參數(shù)[13],合理地選取負荷特征是進行負荷辨識的首要步驟。通常,負荷特征可分為電氣特征和非電氣特征,常見的電氣特征包括有功功率、無功功率、電流電壓幅值[14]、電流諧波[15]等,而非電氣特征主要有時間特征、天氣、溫度等外界因素[16]。這些特征最終為準確的負荷辨識奠定基礎(chǔ)。
有功功率作為負荷運行時變化最為顯著的電氣特征[17],且能反映負荷的能耗值,是一種高效的負荷辨識特征。而無功功率是表現(xiàn)負荷內(nèi)在性質(zhì)的重要參數(shù),它可將電器類別分為阻性、容性以及感性負荷。因此文中采用有功功率和無功功率作為負荷辨識的電氣特征。
對于負荷種類繁多的復(fù)雜運行環(huán)境,一般而言,僅使用功率等電氣特征不能有效地區(qū)分電氣特征相似的負荷,且過多的電氣特征易造成計算量過大的問題。為此,文中在采用合適的電氣特征的基礎(chǔ)上,引入負荷的時間特性作為負荷辨識的非電氣特征。由于外界因素的不確定性,部分非電氣特征與負荷的關(guān)聯(lián)度都無法準確獲取,因此,文中將負荷的時間特征[18]例如運行時段、運行時長等,作為較穩(wěn)定和可靠的非電氣特征對負荷進行辨識。
1.2.1 功率特征
有功功率P和無功功率Q在數(shù)學(xué)上是針對一個周期內(nèi)的采樣得到的電壓、電流實時數(shù)據(jù)進行統(tǒng)計的,其定義如下:
(1)
(2)
式中T為一個波形周期內(nèi)的采樣點數(shù);V(t)代表電路總?cè)肟谔幓蚋髦穞時刻的電壓值;I(t)為對應(yīng)t時刻的電流值。由此可計算得到負荷的實時功率幅值。這里,為了避免因采集到的功率值變化范圍過大,不利于進行序列統(tǒng)計和訓(xùn)練,文中對其進行數(shù)據(jù)分段[19],將有功功率和無功功率從小到大分別采用m1、m2個等級進行標注,如式(3),式(4)所示:
P={P1,P2,…,Pm1}
(3)
Q={Q1,Q2,…,Qm2}
(4)
進一步地,為能有效區(qū)分不同類型的負荷,尤其是難以辨識的小功率負荷和無功功率變化不明顯的容性負荷或感性負荷,可采用不等間隔分段方式處理,從而進行統(tǒng)計及后續(xù)辨識。
為得到準確的細粒化功率分段間隔,需要對負荷數(shù)據(jù)庫中負荷特征分布進行統(tǒng)計,如圖1所示,建立P-Q二維矩形特征分布圖。其中負荷1~負荷11為AMPds公共數(shù)據(jù)集中選取的11種常見家用負荷,包括燈具、烘干機、洗衣機、冰箱、壁爐等。從圖中可以看出在P∈(0-100) &Q∈(0-20)的范圍內(nèi)負荷分布較為密集,需要對該范圍進行細化分段處理。
圖1 負荷功率特征統(tǒng)計圖
1.2.2 時間特征
家庭用電負荷除了電氣特征之外,其內(nèi)在的時間特征也可作為區(qū)分負荷的一種潛在特征,文中主要將時間特征具體化為負荷運行時長、運行時段、負荷工作周期性及假期與非假期四個特征。
(1)負荷運行時長特征L
對于常見的家庭用戶用電負荷,其運行時長L通常會具有一定的規(guī)律。為驗證這一特征的有效性,文中對負荷數(shù)據(jù)庫中負荷的運行時長進行箱型圖統(tǒng)計,如圖2所示。從圖2中可以看出大部分家用負荷的運行時長都在100 min以內(nèi),也有個別負荷運行時長超過1 400 min,即幾乎全天運行,同時還有部分負荷運行時長分布不固定在一個區(qū)間范圍內(nèi),即存在多個“異常值”。由此可見,不同的用電負荷其運行時長具有一定的特異性,可用作負荷辨識的參考特征。
圖2 負荷運行時長統(tǒng)計圖
根據(jù)統(tǒng)計得到的各負荷運行的時長區(qū)間,將時長特征L分為m3個等級,即:
L={L1,L2,…,Lm3}
(5)
(2)負荷運行時段特征t
根據(jù)常見的作息時間及負荷運行時間,可將負荷運行時間段分為9個部分,其中電器使用高峰期從早上7點到晚上9點共14個小時,每兩個小時為一個時段區(qū)間,從晚上9點到次日早上7點分為兩個時段區(qū)間,包括晚上9點到12點的深夜時間段,以及0點到早上7點的凌晨時間段。即:
t={t1,t2,…,t9}
(6)
(3)負荷工作周期性T
通常,負荷工作規(guī)律可分為周期性和非周期性,文中將運行時間具有規(guī)律性的電器如冰箱等定義為周期性負荷,而非周期性電器的啟停時間不具有確定性、如電視機、洗衣機等。因此,負荷工作周期性可標注為:
T={T1,T2},其中T1為非周期性,T2為周期性。
(4)假期與非假期
由于用戶在不同時間上的用電行為的不一樣,例如假期大多以休閑娛樂為主,常見的如電視機使用時長變長,或者因外出等減少負荷設(shè)備的使用。這也是在時間特性上不可忽視的一個度量。
由此,對不同負荷可根據(jù)各負荷特征進行劃分并統(tǒng)計,構(gòu)建負荷特征數(shù)據(jù)庫,并為后續(xù)貝葉斯分類決策提供訓(xùn)練樣本。
考慮到在負荷類別不確定的家庭場景,文章需要針對該場景下的負荷事件進行一段時間內(nèi)的統(tǒng)計分析,通過相同負荷事件的聚類,實現(xiàn)用電設(shè)備類別數(shù)的判定。同時,針對聚類得到的類別數(shù),進一步統(tǒng)計其時間特征,進而采用決策方法對負荷進行辨識。
Mean-shift均值漂移算法是一種基于核密度估計的非參數(shù)化聚類算法,對一個概率密度函數(shù)f(x),已知d維空間中n個采樣點xi,i=1,…,n,f(x)的核函數(shù)估計為:
(7)
式中ω(xi)>=0是采樣點xi的權(quán)重;h為聚類半徑;K(x)是核函數(shù)。概率密度函數(shù)f(x)的梯度?f(x)估計為:
(8)
(9)
其中第二個方括號中的式子即為Mean-shift向量,其與概率密度梯度成正比。
相比于其他聚類算法,Mean-shift聚類無需預(yù)先設(shè)置聚類中心數(shù),可以通過數(shù)據(jù)分布概率密度自適應(yīng)選取聚類中心數(shù)[20]。通常,聚類半徑的選取是影響Mean-shift算法聚類效果的主要因素。半徑過大會導(dǎo)致小功率負荷無法識別,半徑過小則會使大功率設(shè)備辨識結(jié)果冗余。
文中采用有功功率P和無功功率Q作為聚類的負荷特征,它們作為最常見的負荷特征能體現(xiàn)負荷能耗水平和負荷類型特性,在構(gòu)建二維特征空間進行聚類的過程中具有有效的可區(qū)分性和可適應(yīng)性。然而,由于有功功率與無功功率取值的差異性,會增加聚類半徑選取的難度,針對此問題,文中提出了一種分段歸一化的半徑選取方法。
根據(jù)CUSUM滑動窗方法[21]檢測到負荷事件的有功功率和無功功率特征,聚類半徑H選取如下:
(10)
式中P為負荷有功功率取值;Pmax、Pmin分別為分段歸一化后功率的最大值和最小值,ε為控制聚類半徑選取范圍的參數(shù),對不同的功率段,半徑H的選取隨著P的分布范圍變化而不同。
假設(shè)X為PQ二維特征空間上的n個負荷事件數(shù)據(jù)點組成的集合,那么對于空間中的任意點x的漂移向量基本形式可以表示為:
(11)
式中xi(i=1~n)為n個樣本點;Sh為以x為中心、半徑為h的二維圓圈;K表示n個樣本點中有K個分布在區(qū)域Sh內(nèi)。其中數(shù)據(jù)集X中距離點x小于聚類半徑h的數(shù)據(jù)點集合,Sh可表示為:
(12)
在聚類的過程中通過計算漂移向量j更新圓心x的位置:
(13)
由此可得到基于負荷事件功率特征的概率密度聚類結(jié)果,每一個聚類中心即代表一個負荷類型。采用Mean-shift聚類算法獲取負荷狀態(tài)可降低負荷功率特征在特征空間上交疊的影響,并由此可確定在負荷類別不確定的場景中的負荷類別數(shù),為后續(xù)采用貝葉斯方法辨識負荷提供依據(jù)。
貝葉斯分類器是一種基于貝葉斯最大后驗準則和貝葉斯假設(shè)的決策算法[22],在假定對象的特征空間中每一個維度的特征向量都是相互獨立的前提下,貝葉斯分類算法可描述如下:設(shè)z={a1,a2,…,am}為一個待分類項,而每個a為z的一個特征屬性,有類別集合C={y1,y2,…,yn},計算P(y1|z),P(y2|z),…,P(yn|z)。如果滿足:
P(yk|z)=max{P(y1|z),P(y2|z),…,P(yn|z)}
(14)
則z∈yk。采用貝葉斯分類器進行負荷類型決策辨識需要進行以下步驟:
Step1:對負荷歷史數(shù)據(jù)建立標簽?zāi)P瓦M行訓(xùn)練,生成訓(xùn)練樣本集;
Step2:對每個類型的負荷分別計算P(yi)(i=1~n)。由于不同類型的負荷受到假期等外界因素的影響使用頻次不同,因此可由統(tǒng)計的負荷使用頻次信息作為計算P(yi)的依據(jù);
Step3:對每個負荷特征屬性計算所屬不同類的條件概率,即求P(z|yi);
Step4:對每個類別計算P(z|yi)P(yi)。由于有多個不同負荷特征作為分類屬性,且各特征屬性之間條件獨立,因此對每個類的概率計算拓展如下:
(15)
Step5:以P(z|yi)P(yi)的最大項對應(yīng)的類作為z的所屬類型。由貝葉斯概率公式:
(16)
可知,其中分母P(x)對所有類別為常數(shù),因此將分子最大化即可判定負荷所屬類型。
基于此,針對用戶負荷場景辨識,首先通過Mean-shift算法對采集到的負荷事件特征進行聚類,初步得到負荷類別數(shù),在此基礎(chǔ)上對負荷事件特征進行統(tǒng)計和標注,并運用貝葉斯方法對其概率進行計算,從而判斷出該負荷事件特征對應(yīng)的負荷類型,其具體流程如圖3所示。
圖3 負荷辨識流程圖
文中采用AMPds公開數(shù)據(jù)集對文中的辨識算法進行驗證,該數(shù)據(jù)集記錄了2012年3月~2014年3月,為期兩年的加拿大溫哥華市區(qū)一戶居民用戶的能耗數(shù)據(jù),其中包含了二十余種不同類型用電設(shè)備,以及天氣、溫度等外界因素數(shù)據(jù),可作為代表實際家庭用電場景的數(shù)據(jù)進行測試,數(shù)據(jù)量充足且具有可信度。
文中選取了該數(shù)據(jù)集中十一種具有代表性的常用家庭用電設(shè)備建立負荷數(shù)據(jù)庫,其中包括傳統(tǒng)家庭負荷如臥室電器,洗衣機,電視機等,以及一些現(xiàn)代電子設(shè)備負荷,且包含一些難以辨識的小功率負荷及多狀態(tài)負荷。為便于說明,將這些負荷表示為:{E1, E2, E3, E4, E5, E6, E7, E8, E9, E10, E11}。對負荷的功率特征進行檢測并采用核密度估計方法統(tǒng)計出功率特征的分布范圍,將特征信息記錄在Mysql數(shù)據(jù)庫中,如表1所示。
表1 負荷特征數(shù)據(jù)庫
為了得到更準確的聚類結(jié)果,有功功率與無功功率歸一化系數(shù)滿足以下條件:
(17)
其中α為歸一化參數(shù),為不失一般性,α由PCA算法計算P、Q貢獻率確定,對于文中不同負荷的功率值,計算得α∈(3-30)。
由此針對負荷特征信息,得到將分段歸一化聚類半徑H設(shè)置如下:
(18)
同時,根據(jù)數(shù)據(jù)庫中的負荷功率及時間特征信息,運用文中的負荷建模方法,其中m1=8,m2=7,m3=5,對貝葉斯分類器進行訓(xùn)練如表2所示。
表2 貝葉斯分類標簽
此外,由于不同負荷使用頻次不同,貝葉斯決策模型中的P(yi)的取值由該類負荷的使用頻次決定。文中結(jié)合一周中的工作日和休息日以及考慮假期等因素進行統(tǒng)計,將負荷分為每天運行,除假期外每天運行,以及非每天運行三種,以此度量負荷使用情況的稀疏性,其對應(yīng)的P(yi)的值分別為1/8、1/12、1/16。
為保持外界條件的一致性,文中選用一個季度共三個月的負荷用電數(shù)據(jù),按照表2所示對其五個負荷特征進行標簽標注,代入貝葉斯決策模型進行訓(xùn)練,并選取五組案例對該方法進行測試。在每組測試案例中,每天具體的運行設(shè)備類型和數(shù)量未知,即模擬一般的家庭負荷運行場景,由此驗證方法的負荷辨識能力。
以其中某組數(shù)據(jù)為例,該天的負荷運行情況的功率曲線如圖4所示。
圖4 負荷功率曲線示例圖
首先,為獲取運行負荷類型分布情況,對檢測到的負荷事件功率特征進行Mean-shift聚類,聚類結(jié)果如圖5所示。
從聚類結(jié)果可以看出該日運行的負荷中,在P∈0-30 W的小功率范圍內(nèi)有3種負荷運行,在30 W-100 W的范圍內(nèi)有5種負荷,在100 W-1 000 W的范圍內(nèi)有3種,在1 000 W-2 000 W的范圍內(nèi)有1種。由此可初步獲取該日12種不同類型負荷運行的負荷信息。由于部分負荷存在多狀態(tài),因此該12種類型的聚類結(jié)果代表12種不同的負荷狀態(tài),各狀態(tài)所屬的負荷類型需要進一步進行區(qū)分。
接下來,對負荷聚類的功率特征以及其對應(yīng)的負荷事件的時間特征按照表2進行標簽標注,并代入訓(xùn)練后的貝葉斯決策模型計算概率值,從而最終判斷出負荷事件對應(yīng)的負荷類型。
該日實際運行負荷為E1,E2,E5,E7,E8,E10,E11,從該日負荷事件檢測結(jié)果中選取28個具有不同特征的負荷事件,用文中方法進行辨識,能準確識別出25個負荷事件。
為進一步證明文中方法的有效性,將該方法與單獨用文中的兩種方法對五組測試數(shù)據(jù)進行負荷辨識對比。其中一種方法是:直接用Mean-shift對電氣特征的聚類結(jié)果與數(shù)據(jù)庫進行匹配辨識,另一種方法是直接將負荷事件標簽代入訓(xùn)練過的貝葉斯分類方法進行辨識。對于測試數(shù)據(jù)檢測到的負荷事件,各方法辨識結(jié)果如圖6所示。
圖6 測試辨識結(jié)果圖
從圖6可以看出,由于缺少時間特征,且存在聚類中心受誤差擾動偏移的情況,直接采用Mean-shift聚類算法判斷負荷類型的準確率最低。而由于負荷功率特征分布交疊的問題,對于未通過聚類初步獲取運行負荷狀態(tài)信息的場景,僅采用貝葉斯分類方法進行負荷辨識也有一定的局限性。而文中將Mean-shift聚類算法與貝葉斯分類方法結(jié)合的負荷辨識算法對負荷類別不確定的場景具有較好的辨識效果。
針對家庭負荷使用場景中負荷類別的不確定性以及設(shè)備數(shù)據(jù)庫中的負荷特征不完備導(dǎo)致的負荷辨識問題,文中提出了一種融合時間序列特征的負荷統(tǒng)計辨識方法。首先,通過Mean-shift聚類算法對負荷功率特征進行聚類,得到運行的負荷狀態(tài)所屬的負荷類別。然后,為克服聚類中心偏移導(dǎo)致辨識結(jié)果錯誤,引入負荷的時間特征。同時,對數(shù)據(jù)庫中負荷特征進行統(tǒng)計分析,確定貝葉斯分類模型參數(shù)。最后,將測試數(shù)據(jù)中的負荷特征代入貝葉斯分類模型判斷負荷類型。
文章采用AMPds數(shù)據(jù)集對該方法進行驗證,實驗結(jié)果表明,文中方法對負荷類別不確定的場景具有良好的辨識效果,同時也能有效辨識出小功率和多狀態(tài)負荷。