潘明明,李義民,游元通,唐勇兵
(1.中國電力科學(xué)研究院有限公司,北京 100085;2.國網(wǎng)廈門供電公司,福建 廈門 361004)
隨著國家碳達(dá)峰、碳中和“30·60”戰(zhàn)略的提出,碳核查MRV的監(jiān)測、報告和核查三體系逐步建立,企業(yè)內(nèi)部對碳排放的自我監(jiān)測需要安裝智能化的監(jiān)測系統(tǒng),與此同時,報告、核查所需的文檔規(guī)范性、數(shù)據(jù)安全性也需要建立完整標(biāo)準(zhǔn)體系,這就給負(fù)荷監(jiān)測提供了很多機會。負(fù)荷監(jiān)測主要包括兩類即:侵入式負(fù)荷監(jiān)測(Intrusive Load Monitoring,ILM)與非侵入式負(fù)荷監(jiān)測(Non-Intrusive Load Monitoring,NILM)。人工智能、區(qū)塊鏈等現(xiàn)代信息技術(shù)的應(yīng)用,為非侵入式負(fù)荷監(jiān)測體系構(gòu)建必要的信息基礎(chǔ)單元,通過分析、對比用戶用電曲線,獲得設(shè)備組成和設(shè)備狀態(tài)等用戶模式,可進(jìn)一步深入挖掘抗風(fēng)險、節(jié)能的潛力,從而在減少電費的同時實現(xiàn)用能優(yōu)化,比如削峰填谷、清潔能源占比提升、用電可靠性提高等,促進(jìn)園區(qū)配電網(wǎng)的安全穩(wěn)定高效運行。
相對于侵入式負(fù)荷監(jiān)測需要改變用戶現(xiàn)有電路結(jié)構(gòu),非侵入式負(fù)荷監(jiān)測僅需在電力服務(wù)入口處安裝一個測量裝置獲取端電壓和總電流,然后利用數(shù)據(jù)分析技術(shù)就可以得到內(nèi)部當(dāng)前各用電設(shè)備的工作狀態(tài),更適合于多類型用戶的分項監(jiān)測,可以幫助電網(wǎng)側(cè)挖掘用戶側(cè)的節(jié)能潛力和需求響應(yīng)潛力,從而引導(dǎo)或幫助用戶自行優(yōu)化用能習(xí)慣,以及制定針對性的用能策略。
目前國內(nèi)外已經(jīng)研發(fā)出一些非侵入式負(fù)荷監(jiān)測的產(chǎn)品,例如家庭場景下基于高頻采樣的Sense Home和基于低頻采樣的Chai Energy,樓宇場景下的Energy Wise。工廠場景下可將NILM 用于設(shè)備故障預(yù)報,在學(xué)校場景則可利用NILM 檢測大功率用電設(shè)備,解決大功率用電器引發(fā)火災(zāi)的痛點。以Sense Home為例,在初安裝時需要幾個月的時間搜集數(shù)據(jù),且它的進(jìn)化對人工輸入具有一定的依賴性,當(dāng)識別到未知設(shè)備時,Sense 將其顯示為“未知加熱設(shè)備1”、“電機3”等名稱,此時需要用戶重新命名,或者當(dāng)Sense 的識別出現(xiàn)錯誤時,需要人工糾正。
我國江蘇省關(guān)于負(fù)荷辨識智能電表也展開了試點研究,用戶通過手機APP 和微信公眾號可查詢各用電器的使用詳情,如開通時間段、各區(qū)間耗電量和用電功率等,幫助用戶了解具體的負(fù)荷模式。但上述設(shè)備和試點研究仍然存在一些問題。比如,未關(guān)注多種類型場景的園區(qū)低成本要求,基于深度學(xué)習(xí)的負(fù)荷識別方法雖然識別準(zhǔn)確率達(dá)到了95%以上[1],但是在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時每完成一次前向傳播需要數(shù)億次的運算,這一過程通常在集中式或基于云的服務(wù)器上完成,對于算力較低的嵌入式計算平臺并不適用。
為此,需要一個遠(yuǎn)程智能平臺來集合狀態(tài)監(jiān)測及用戶場景分類,如圖1所示。遠(yuǎn)程智能運維管控平臺中,一方面,單個用戶類型分解模塊通過自動拓?fù)渥R別及用戶提供的供用電資產(chǎn)清單,確定用戶類型區(qū)間,然后反饋至NILM負(fù)荷監(jiān)測模塊,并結(jié)合歷史數(shù)據(jù)形成的用戶數(shù)據(jù)集,通過數(shù)據(jù)分析技術(shù),首先識別出各用電設(shè)備,其次是各用電設(shè)備的主要工作狀態(tài);另一方面,遠(yuǎn)程負(fù)荷監(jiān)測裝置,結(jié)合環(huán)境采集系統(tǒng),將實時曲線與歷史數(shù)據(jù)的比對,判斷出狀態(tài)是否正常,并進(jìn)一步通過故障研判模塊進(jìn)行故障評估,故障響應(yīng)模塊在采集到故障信息后向園區(qū)及電網(wǎng)公司主動告警。同時故障響應(yīng)模塊將故障類型與設(shè)備判定進(jìn)行聯(lián)合,判斷某個用戶出現(xiàn)故障,從而利用設(shè)備GIS平臺快速對故障進(jìn)行定位。
圖1 遠(yuǎn)程智能運維管控平臺Fig.1 Remote intelligent operation and maintenance management and control platform
其中非侵入時負(fù)荷監(jiān)測可以起到用戶級故障判斷及設(shè)備級故障定位的作用,是整個智能運維的關(guān)鍵核心部分。
NILM由Hart[2]首次提出,根據(jù)Hart的算法,NILM包括4個步驟,如圖2所示。
圖2 非侵入式負(fù)荷分解過程Fig.2 Non-intrusive load decomposition process
1)數(shù)據(jù)采集:指獲取用戶總負(fù)荷的穩(wěn)態(tài)或瞬態(tài)電壓和電流數(shù)據(jù),并進(jìn)行去噪、歸一化等預(yù)處理。
2)事件探測:當(dāng)有用電設(shè)備投切時,總負(fù)荷的電氣量發(fā)生突變,利用規(guī)則判斷法或變點檢測法[3]定位用電設(shè)備投切事件發(fā)生的時刻。
3)特征提?。簭氖录l(fā)生前后的波形中提取引發(fā)事件的用電設(shè)備的電流和電壓數(shù)據(jù),并根據(jù)電壓、電流數(shù)據(jù)計算能夠唯一標(biāo)識該設(shè)備的特征,即負(fù)荷特征。
4)負(fù)荷識別:提取用電設(shè)備的特征后,NILM的最后一個步驟為利用數(shù)學(xué)優(yōu)化或機器學(xué)習(xí)算法識別該設(shè)備的所屬類別。
其中的設(shè)備特征也稱電氣指紋,是指用電設(shè)備運行過程中表現(xiàn)出來的具有很大差異性的電氣特征,非侵入式負(fù)荷監(jiān)測辨識的準(zhǔn)確性主要取決于設(shè)備特征和對應(yīng)識別算法的選取。有功和無功功率的變化[1]是NILM首先用到且應(yīng)用最廣的穩(wěn)態(tài)特征,文獻(xiàn)[3-5]以有功功率作為唯一特征進(jìn)行負(fù)荷分解,結(jié)果表明可以識別開/關(guān)二狀態(tài)設(shè)備和大功率設(shè)備如電暖器,而低功耗設(shè)備由于在P-Q空間中重疊較多,僅用功率特征識別難度高。電壓和電流波形的時域和頻域特征是另一應(yīng)用廣泛的負(fù)荷特征,文獻(xiàn)[6-8]以峰值、有效值、相位差和功率因數(shù)唯一地定義用電設(shè)備,文獻(xiàn)[9]對時域特征的有效性也進(jìn)行了實驗驗證,表明有效值比峰值更具有區(qū)分性。文獻(xiàn)[10-13]采用穩(wěn)態(tài)高次電流諧波作為特征,其中,文獻(xiàn)[13]對阻性和開關(guān)負(fù)載的電流時頻特征進(jìn)行對比,證明阻性負(fù)載多具有恒阻抗(Constant Impedance,CI),開關(guān)負(fù)載多具有恒功率(Constant Power,CP),提出一種利用電流頻率信號中CP和CI的比例分解電力信號的方法。這些特征把用電設(shè)備分為阻性、感性和電子負(fù)載三個類別,但是當(dāng)兩種及以上設(shè)備同時運行時,無法進(jìn)行區(qū)分。為了克服這些缺陷,文獻(xiàn)[14]將諧波特征與有功、無功特征結(jié)合起來,當(dāng)用電器并聯(lián)運行時,不同的組合具有唯一的穩(wěn)態(tài)諧波特征,這一方法在已知用電設(shè)備的場景下提高了檢測性能,但在實際的負(fù)荷識別應(yīng)用中,無法獲取未知場景中所有設(shè)備組合的諧波特征集。文獻(xiàn)[15]側(cè)重于對一組用電設(shè)備(如:一個家庭中所有的照明設(shè)備)的總能耗進(jìn)行估算,第一步估計組內(nèi)設(shè)備引起負(fù)荷投切事件的概率,第二步將能量消耗的計算轉(zhuǎn)化為加權(quán)伯努利分布的組合,給出了能耗計算期望值和標(biāo)準(zhǔn)差的解析式。文獻(xiàn)[16]通過附加約束、校正和中值濾波對傳統(tǒng)的整數(shù)規(guī)劃進(jìn)行了改進(jìn),提出輔助線性整數(shù)規(guī)劃方法,該方法只需瞬時負(fù)荷采樣,在低頻數(shù)據(jù)上性能優(yōu)于傳統(tǒng)整數(shù)規(guī)劃。文獻(xiàn)[17]根據(jù)前端電子電路的拓?fù)鋵⒂秒娫O(shè)備分為7類,在此基礎(chǔ)上,文獻(xiàn)[18]提出每個歸類內(nèi)的用電設(shè)備經(jīng)過歸一化之后V-I軌跡具有相似的形狀,而不同歸類的V-I軌跡形狀存在明顯差別,因此V-I軌跡可以用來區(qū)分不同歸類的用電設(shè)備,從而在實際應(yīng)用中識別負(fù)荷。目前NILM的識別算法也多與神經(jīng)網(wǎng)絡(luò)進(jìn)行結(jié)合,文獻(xiàn)[19]提出一種支持向量機和高斯混合模型(Gaussian Mixture Model,GMM)的多用電器識別系統(tǒng),其中GMM用于描述電流波形的分布,支持向量機(Support Vector Machine, SVM)則對提取到的功率特征進(jìn)行分類以識別目標(biāo)負(fù)載。文獻(xiàn)[20]利用了神經(jīng)網(wǎng)絡(luò)可進(jìn)行高級特征提取的特點,實現(xiàn)了V-I軌跡圖像特征與功率數(shù)值特征這兩個具有互補性特征的融合,從而提高了V-I軌跡特征的負(fù)荷識別能力。
基于深度學(xué)習(xí)的負(fù)荷監(jiān)測方法計算量較大,一般只在集中式或基于云的服務(wù)器上完成這一過程,對于一個高復(fù)雜度的園區(qū)來說較難實現(xiàn)[21]。
圖3展示了本文中提出的基于V-I軌跡與幅值特征的負(fù)荷檢測算法的實現(xiàn)過程,主要由數(shù)據(jù)集預(yù)處理和負(fù)荷監(jiān)測兩個階段所構(gòu)成。根據(jù)流程圖3所示,數(shù)據(jù)集預(yù)處理階段:
圖3 基于加權(quán)k最近鄰的負(fù)荷分類算法流程圖Fig.3 Flow chart of load classification algorithm based on weighted k nearest neighbor
Step1,在負(fù)荷電力數(shù)據(jù)中取穩(wěn)態(tài)電流和電壓繪制歸一化V-I軌跡二值圖像[20],同時利用快速傅里葉變換提取基波的有功功率、無功功率、電流幅值和其3、5、7次諧波的電流幅值;
Step2,第1步提取的V-I二值軌跡和幅值構(gòu)成負(fù)荷特征,構(gòu)建負(fù)荷模板,將得到的所有數(shù)據(jù)按3:7的比例劃分成測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù);
Step3,對訓(xùn)練數(shù)據(jù)的V-I軌跡部分進(jìn)行由遺傳算法改進(jìn)的K均值聚類算法,得到各類設(shè)備的V-I軌跡K均值聚類中心;
Step4,對每一個訓(xùn)練樣本,以其到聚類中心的距離為依據(jù),分配相應(yīng)的權(quán)重值;
負(fù)荷監(jiān)測階段:
Step5,計算測試樣本與各類訓(xùn)練樣本的綜合相似度;
Step6,依照kNN判決規(guī)則決斷待測樣本應(yīng)歸屬的類別。
kNN算法在預(yù)測樣本類別歸屬時,一般采用的方法是多數(shù)投票法(majority voting),而此方法對數(shù)據(jù)集中的少數(shù)類很容易發(fā)生誤判。本文對原始kNN算法進(jìn)行改進(jìn),為每個訓(xùn)練樣本賦予不同的權(quán)重,從而減少kNN算法誤判情形的發(fā)生[22]。
一個訓(xùn)練樣本的權(quán)重取決于它對所屬類別的代表能力,由某樣本點與聚類中心的距離表示,此距離越近代表能力越強,也就分配越大的權(quán)重。以d(i,Oc)表示某樣本與其所屬聚類中心的距離,那么此樣本對所屬簇的代表能力就可表示為:
(1)
在分配權(quán)重前,每個類別訓(xùn)練樣本的權(quán)重之和設(shè)置為1,設(shè)某類別的訓(xùn)練樣本包含簇的個數(shù)為Ng,簇中樣本的個數(shù)為Ns,則為樣本i分配的權(quán)重為:
(2)
由于各類別用電器的聚類中心數(shù)目不同且未知,故在分配權(quán)重前,難以使用固定的k值代入k均值算法以找出各類別訓(xùn)練樣本的聚類中心,因此本文結(jié)合遺傳算法與k均值過程,使用變異算子更新k值[10]。具體過程如下:
1)參數(shù)初始化:設(shè)置種群規(guī)模popSize,迭代次數(shù)numIter,選擇率selectRate和變異率variationRate。
2)生成初始種群:隨機生成popSize個[2,10]范圍內(nèi)的隨機整數(shù)作為種群中每個個體的聚類中心數(shù),然后為每個個體隨機選擇樣本作為初始聚類中心。
3)執(zhí)行k均值操作:對于每個樣本個體,將每個訓(xùn)練樣本歸類到與其歐式距離最近的聚類中心,利用樣本的均值更新迭代一次,得到新的聚類中心。
5)執(zhí)行選擇算子:采用輪盤賭選擇算法,每次選擇首個比隨機數(shù)大的累積概率的位置的個體遺傳下去,直到選擇的子代個體數(shù)達(dá)到popSize×selectRate。
6)執(zhí)行變異算子:變異操作能夠用于k值自動學(xué)習(xí)的實現(xiàn),朝k值增大1的方向或朝減小1的方向進(jìn)行變異。若當(dāng)前個體聚類中心數(shù)為[3,9]之間,則k值增大或減小的概率各為50%,當(dāng)k值需要增大1時,新的聚類中心應(yīng)選擇距離聚類中心最遠(yuǎn)的一個樣本,當(dāng)k需要減小1時,將此個體中相距最近的兩個聚類中心隨機選一個刪除。若當(dāng)前個體聚類中心數(shù)等于2,默認(rèn)選擇k值增大1,若當(dāng)前個體聚類中心數(shù)等于10,默認(rèn)選擇k值減小1。
7)生成下一代種群:下一代種群為選擇操作和變異操作后的子代組合。
8)重復(fù)執(zhí)行2)~7),直到迭代次數(shù)達(dá)到預(yù)先規(guī)定好的值,將適應(yīng)度最大的個體設(shè)定為最終結(jié)果。
V-I軌跡形狀與用電設(shè)備的前端電路拓?fù)浣Y(jié)構(gòu)相關(guān),反映出電壓與電流相位差、負(fù)荷非線性度和高次諧波特性等信息,無法體現(xiàn)負(fù)荷的功率特征。在某些工作模式下,風(fēng)扇、空調(diào)等家電與電阻型用電器電燈泡的V-I軌跡幾乎重合,僅以軌跡特征作為分類依據(jù)容易發(fā)生誤判,如圖4所示。這也導(dǎo)致了在含照明負(fù)載情況下的常規(guī)非侵入式負(fù)荷監(jiān)測算法誤判概率較大。
圖4 兩類用電器的V-I軌跡圖示Fig.4 V-I trace diagram of two types of electrical appliances
因此本文在利用kNN算法進(jìn)行類別判決時引入了負(fù)荷的幅值特征,對待測樣本所屬類別進(jìn)行預(yù)測的過程如下:
1)按公式(3)、(4)算出待測樣本與所有訓(xùn)練樣本的V-I軌跡相似度SA與幅值相似度SB,其中的距離為歐氏距離,其中f(~)是歐式距離的倒數(shù);
SA=f(d1)
(3)
SB=f(d2)
(4)
2)按照S1值以降序順序排列,當(dāng)前測試樣本的K最近鄰取前K個相似度最大訓(xùn)練樣本;
3)計算幅值特征與軌跡特征的綜合相似度S,并計算得到待測樣本與K個最近鄰中各類的總相似度,預(yù)測結(jié)果取總相似度最大的類。
S=SA×wi+SB
(5)
由于V-I軌跡的繪制需要用電設(shè)備的高頻電壓和電流數(shù)據(jù),且訓(xùn)練樣本應(yīng)包含盡可能多的設(shè)備類別,國外從事相關(guān)研究的實驗室陸續(xù)發(fā)表了用于負(fù)荷分解的公開數(shù)據(jù)集,如表1所示。
表1 現(xiàn)有公開數(shù)據(jù)集信息列表
本文的算法驗證由PLAID數(shù)據(jù)集進(jìn)行。PLAID數(shù)據(jù)集包含56個用戶11類常用用電器的電流和電壓數(shù)據(jù),采樣頻率為30 kHz,對于同一用電器實體,采集3~6次數(shù)據(jù),最終該數(shù)據(jù)集共有來自235個設(shè)備的1 094組數(shù)據(jù),設(shè)備開啟的暫態(tài)與穩(wěn)定運行的穩(wěn)態(tài)過程均包含在各組數(shù)據(jù)中。訓(xùn)練樣本和測試樣本的數(shù)量按照比例7∶3確定,訓(xùn)練樣本的數(shù)量為764,測試樣本的數(shù)量為330,如表2所示。
表2 各類型用電器數(shù)量
在二分類問題中,常用的評價指標(biāo)為準(zhǔn)確率Acc、精確率P、召回率R和F1-measure[12,18]。
當(dāng)數(shù)據(jù)集平衡時,Acc越大表示模型的性能越好。但實際應(yīng)用中,各類別樣本數(shù)目差距大的現(xiàn)象時常發(fā)生,這時即使把少數(shù)類樣本全部識別為多數(shù)類樣本,該模型的Acc也會很高,因此準(zhǔn)確率無法衡量分類器對每一類樣本的識別效果。本文中的用電器識別為多分類問題,需要能夠評價分類器全局性能的指標(biāo),如宏平均。計算宏平均時,首先為每個類別構(gòu)建如表3所示的混淆矩陣:
表3 單個類別Ci的混淆矩陣
然后獨立計算精確率和召回率(P1,R1),(P2,R2),……, (Pn,Rn)(n為當(dāng)前分類問題的類別數(shù)目),對所有類求算術(shù)平均值M_P和M_R,最后它們的調(diào)和平均即為M_F1。
(6)
圖5 4種算法指標(biāo)對比Fig.5 Comparison of 4 algorithm indicators
算法1:僅考慮軌跡特征的傳統(tǒng)kNN;
算法2:僅考慮軌跡特征的加權(quán)kNN;
算法3:考慮軌跡特征和幅值特征的傳統(tǒng)kNN;
算法4:考慮軌跡特征和幅值特征的加權(quán)kNN。
圖5給出了四類算法近鄰類K的數(shù)量與宏平均的變化關(guān)系。本文中的改進(jìn)算法為算法4,在K≥12后區(qū)域穩(wěn)定,準(zhǔn)確率達(dá)到94%。出于計算成本考慮,在實際園區(qū)負(fù)荷識別中考慮將近鄰數(shù)量設(shè)置為12左右,并根據(jù)實際情況調(diào)試。此外,本文所使用的算法4在宏平均意義下的性能均高于現(xiàn)有的其他三類算法(算法1~算法3),特別是空調(diào)、風(fēng)扇與照明燈泡的誤判率明顯下降。表4比較了本文算法與現(xiàn)有算法,為了保證結(jié)果具有可比性,所選算法均是在PLAID數(shù)據(jù)集上進(jìn)行了驗證,表4中的Acc與M_F1是由文獻(xiàn)中提供的實驗結(jié)果而計算得到的。
表4 本文算法與現(xiàn)有算法的對比
在多類型用戶的園區(qū)應(yīng)用場景下,針對基于深度學(xué)習(xí)的負(fù)荷監(jiān)測方法需要在集中式或基于云的服務(wù)器上實現(xiàn)訓(xùn)練過程,這會產(chǎn)生較高的硬件成本。本文提出了一種基于kNN算法的無需訓(xùn)練過程的負(fù)荷分類方法,取得了較高的分類性能:
1)采用加權(quán)kNN算法和綜合相似度判別方法改進(jìn)原始kNN算法的識別效果;
2)本文提出的基于加權(quán)k最近鄰的負(fù)荷分類模型Macro_F1為94.02%,與現(xiàn)有基于深度學(xué)習(xí)的負(fù)荷分類算法相比也是具有競爭力的;
3)在照明負(fù)載下,加入負(fù)荷的幅值特征分析,可以有效提升空調(diào)、風(fēng)扇的判斷準(zhǔn)確率。