蘇 曉,余 濤,徐偉楓,藍(lán)超凡,史守圓
(華南理工大學(xué)電力學(xué)院,廣東廣州 510640)
非侵入式負(fù)荷監(jiān)測(cè)(non-intrusive load monitoring,NILM)最早由Hart于20世紀(jì)80年代提出[1],作為高級(jí)量測(cè)體系(advanced metering infrastructure,AMI)[2]最重要的組成部分之一,該技術(shù)只在用戶用電入口安裝監(jiān)測(cè)設(shè)備記錄用電數(shù)據(jù),利用監(jiān)測(cè)算法分解負(fù)荷,得到內(nèi)部負(fù)荷的用電狀態(tài)和能耗信息.基于NILM,電網(wǎng)公司能以用戶友好的方式了解負(fù)荷的狀態(tài)和能耗,進(jìn)而利用大數(shù)據(jù)等技術(shù)手段描繪負(fù)荷的用能模式和用戶的用電行為,進(jìn)而實(shí)現(xiàn)需求響應(yīng),優(yōu)化電力資源配置,支撐智能電網(wǎng)的建設(shè)[3].
目前非侵入式負(fù)荷監(jiān)測(cè)技術(shù)發(fā)展迅速,學(xué)者們已提出多種負(fù)荷識(shí)別算法.文獻(xiàn)[4]設(shè)計(jì)了綜合考慮穩(wěn)態(tài)諧波電流和功率特征的正態(tài)分布度量函數(shù),提出了一種基于改進(jìn)雞群算法的負(fù)荷監(jiān)測(cè)方法.文獻(xiàn)[5]構(gòu)建了基于諧波的電流特征表達(dá)并結(jié)合功率作為設(shè)備投切狀態(tài)辨識(shí)的目標(biāo)函數(shù),采用粒子群算法搜索實(shí)現(xiàn)NILM.文獻(xiàn)[6]提出了一種關(guān)聯(lián)循環(huán)神經(jīng)網(wǎng)絡(luò)模型的負(fù)荷辨識(shí)方法,對(duì)歷史輸入特征量進(jìn)行記憶,提高對(duì)負(fù)荷特征辨識(shí)能力.文獻(xiàn)[7]提出一種基于序列到序列和Attention機(jī)制的NILM模型,提升了對(duì)負(fù)荷信息的提取與利用能力.文獻(xiàn)[8-12]均采用了改進(jìn)或拓展的隱馬爾可夫模型(hidden Markov models,HMM),使得算法運(yùn)算速度和電器狀態(tài)識(shí)別準(zhǔn)確率得到較大提升.
以上NILM模型在特征提取或負(fù)荷辨識(shí)上有各自的優(yōu)勢(shì),但是他們都缺乏對(duì)模型泛化能力的考慮.泛化能力是指一個(gè)模型對(duì)未知數(shù)據(jù)的適應(yīng)能力,也可理解成學(xué)習(xí)到隱含在數(shù)據(jù)背后規(guī)律的能力.一個(gè)具備泛化能力的模型不單純對(duì)數(shù)據(jù)集進(jìn)行記憶,而可以挖掘同一問題背景下蘊(yùn)含在數(shù)據(jù)中的共有規(guī)律,進(jìn)而使模型在輸入新鮮數(shù)據(jù)后也能給出合適的輸出.泛化能力的缺失在基于HMM的NILM模型上尤為突出,HMM的觀測(cè)概率和轉(zhuǎn)移概率均通過歷史數(shù)據(jù)進(jìn)行計(jì)算,但過往的數(shù)據(jù)并不能保證負(fù)荷全部工作狀態(tài)被測(cè)量,各狀態(tài)的所有轉(zhuǎn)移信息被確定,上述文獻(xiàn)基于HMM的改進(jìn)都是使其充分利用到已有的負(fù)荷信息,并未能考慮到因外部因素波動(dòng)或自身電氣特性改變引起的負(fù)荷特性變化和模型參數(shù)更新,導(dǎo)致其不具備泛化能力.本文認(rèn)為,對(duì)HMM的泛化性能改進(jìn)思路主要有以下3點(diǎn):1)減小電壓波動(dòng)對(duì)負(fù)荷狀態(tài)確定的影響;2)計(jì)及負(fù)荷的未知觀測(cè)狀態(tài)與新狀態(tài)轉(zhuǎn)移,即認(rèn)為HMM的模型參數(shù)是不斷更新的,來對(duì)負(fù)荷隱含狀態(tài)進(jìn)行預(yù)測(cè)計(jì)算;3)功率分解計(jì)算時(shí)考慮到功率的隨機(jī)波動(dòng)性.
為此,本文提出了一種基于二元參數(shù)隱馬爾科夫模型(binary-parameter Hidden markov models,BPHMM)的非侵入式負(fù)荷監(jiān)測(cè)模型.該模型先基于負(fù)荷有功功率和電流建立BPHMM,采用聚類算法(densitybased spatial clustering of applications with noise,DBSCAN)去除噪聲數(shù)據(jù)并對(duì)負(fù)荷狀態(tài)進(jìn)行聚類;負(fù)荷隱含狀態(tài)序列進(jìn)行編碼后,改進(jìn)維特比算法提高其對(duì)HMM模型參數(shù)更新的適應(yīng)能力,進(jìn)而實(shí)現(xiàn)負(fù)荷狀態(tài)序列最優(yōu)預(yù)測(cè);得到負(fù)荷狀態(tài)預(yù)測(cè)序列后,計(jì)及功率隨機(jī)波動(dòng)性,基于極大似然估計(jì)原理建立功率分解優(yōu)化模型,并根據(jù)負(fù)荷各工作狀態(tài)聚類簇的均值與方差進(jìn)行功率分解計(jì)算,最后通過算例驗(yàn)證了所述方法的準(zhǔn)確性.
本節(jié)首先提出并建立本文所提的二元參數(shù)隱馬爾科夫模型,然后對(duì)其中各個(gè)環(huán)節(jié)特別是泛化性能的改進(jìn)進(jìn)行詳細(xì)的說明.
隱馬爾科夫模型是關(guān)于時(shí)序的概率模型[13].隱馬爾可夫模型中,存在一條值不可測(cè)量的時(shí)間序列和一條值由前述時(shí)間序列決定的可測(cè)量時(shí)間序列.值不可測(cè)量的時(shí)間序列稱為隱含狀態(tài)序列,值可測(cè)量的時(shí)間序列稱為觀測(cè)序列.其模型結(jié)構(gòu)如圖1所示.
圖1 隱馬爾科夫模型結(jié)構(gòu)圖Fig.1 Structure chart of hidden Markov model
一個(gè)HMM模型可由以下參數(shù)描述.
1) 隱含狀態(tài)集合S:
2) 觀測(cè)狀態(tài)集合V:
3) 狀態(tài)轉(zhuǎn)移矩陣AAA:
其中aij=P(qt+1=si |qt=si).
4) 輸出矩陣BBB:
其中bik=P(yt=vk |qt=si).
5) 初始概率矩陣π:
其中πi=P(q1=si).
由上述各式可知:狀態(tài)轉(zhuǎn)移概率矩陣AAA與初始狀態(tài)概率向量π確定了隱含狀態(tài)序列,觀測(cè)概率矩陣BBB確定了如何由隱含狀態(tài)推導(dǎo)出觀測(cè)狀態(tài),結(jié)合狀態(tài)轉(zhuǎn)移概率矩陣AAA就能產(chǎn)生測(cè)量序列,隱含狀態(tài)個(gè)數(shù)N和觀測(cè)狀態(tài)個(gè)數(shù)M實(shí)際上由以上3個(gè)矩陣定義,因此隱馬爾可夫模型可以用λ={AAA,BBB,π}表示.
HMM被用于研究以下3類問題:
1) 概率計(jì)算問題.給定模型λ={AAA,BBB,π}和觀測(cè)序列O={O1,O2,···,OT},計(jì)算P=(O |λ).
2) 學(xué)習(xí)問題.給定觀測(cè)序列
估計(jì)模型λ={AAA,BBB,π}參數(shù),即尋找P=(O |λ)最大值,也就是用極大似然估計(jì)的方法去估計(jì)參數(shù).
3) 解碼問題.已知模型λ={AAA,BBB,π}和觀測(cè)序列O={O1,O2,···,OT},求對(duì)給定觀測(cè)序列條件概率P=(I |O)最大的狀態(tài)序列I={I1,I2,···,IT},即根據(jù)給定觀測(cè)序列預(yù)測(cè)對(duì)應(yīng)的隱含狀態(tài)序列.
在NILM研究中,HMM兩條時(shí)間序列的物理意義是:隱含狀態(tài)序列對(duì)應(yīng)電器序列中各用電器的運(yùn)行狀態(tài)(為方便下稱總狀態(tài)).觀測(cè)序列對(duì)應(yīng)可測(cè)量的電氣量.因此NILM問題就轉(zhuǎn)化為給定HMM模型參數(shù)與測(cè)量序列,求該測(cè)量序列對(duì)應(yīng)的可能性最大的隱含狀態(tài)序列,即解碼問題.
更進(jìn)一步,本文把NILM問題建立成二元參數(shù)隱馬爾科夫模型BPHMM并計(jì)算其參數(shù):
1) 隱含狀態(tài)集合S:在NILM問題中,S表示為總狀態(tài)的集合.該集合是各用電器運(yùn)行狀態(tài)的全排列,集合元素個(gè)數(shù)由各用電器狀態(tài)聚類數(shù)目決定,其值用第3.1.3節(jié)介紹的狀態(tài)編碼方式計(jì)算.
2) 觀測(cè)狀態(tài)集合V:在NILM問題中,V表示用戶用電入口測(cè)量到的用電信息數(shù)據(jù)的集合.特別的是,一般HMM模型集合V的元素是總有功功率,但在本文提出的BPHMM中,集合V中的元素是由總有功功率和總穩(wěn)態(tài)電流構(gòu)成的向量vi=.
3) 狀態(tài)轉(zhuǎn)移矩陣AAA:aij指的是從時(shí)刻t的各用電器的總狀態(tài)qt=si轉(zhuǎn)移到t+1時(shí)刻的總狀態(tài)qt+1=sj的概率.計(jì)算方法:
其中:hij是總狀態(tài)qt=si轉(zhuǎn)移到t+1時(shí)刻的總狀態(tài)qt+1=sj的頻數(shù),N是隱含狀態(tài)總數(shù).
4) 輸出矩陣BBB:表示t時(shí)刻各用電器處于總狀態(tài)qt=si而測(cè)量值為yt=vk的概率.計(jì)算方法:
其中:Oik是t時(shí)刻總狀態(tài)qt=si而測(cè)量值為yt=vk的頻數(shù),M為測(cè)量值總數(shù).
5) 初始概率矩陣π:πi表示初始時(shí)刻,各用電器總狀態(tài)處于si的概率.計(jì)算方法:
其中:d是訓(xùn)練集數(shù)據(jù)總量,di表示訓(xùn)練集中隱含狀態(tài)si出現(xiàn)的頻數(shù).
需要指出的是,針對(duì)多用電器的HMM建模,可以采用因子隱馬爾科夫模型(factorial hidden Markov model,FHMM),FHMM包含了多條隱含狀態(tài)鏈,能分別對(duì)應(yīng)每一個(gè)要研究的電器.但相關(guān)研究表明,FHMM預(yù)測(cè)的狀態(tài)識(shí)別精確度偏低[14].因此本文在經(jīng)典HMM模型基礎(chǔ)上進(jìn)行改進(jìn),配合第3.1.3節(jié)提出的狀態(tài)編碼方式,解決了HMM隱含狀態(tài)難以用向量表示的問題,同時(shí)沒有使各用電器的狀態(tài)轉(zhuǎn)移矩陣解耦,相比FHMM理論上保留了不同電器狀態(tài)轉(zhuǎn)移之間的信息.
負(fù)荷特征的選擇決定了負(fù)荷狀態(tài)的物理描述,而聚類是負(fù)荷狀態(tài)的確定方法,選擇負(fù)荷特征和聚類方法是泛化性能改進(jìn)的第1步.
3.1.1 負(fù)荷特征選取
目前,NILM的研究所選取的負(fù)荷特征大致可分為暫態(tài)與穩(wěn)態(tài)兩種.由于暫態(tài)特征一般為合成數(shù)據(jù),不是由計(jì)量裝置真實(shí)采集的,實(shí)用性不強(qiáng),故本文選取穩(wěn)態(tài)電氣量作為負(fù)荷特征.
穩(wěn)態(tài)電氣量主要包括電壓、電流、有功功率、無功功率和視在功率.有功功率是功率分解計(jì)算的指標(biāo),NILM需要在狀態(tài)預(yù)測(cè)完成后給出負(fù)荷有功功率的分解值,所以有功功率是大多數(shù)NILM研究所采用的特征.然而,穩(wěn)態(tài)功率細(xì)微波動(dòng)較大,穩(wěn)態(tài)電流受電壓波動(dòng)影響更小,計(jì)算得到的負(fù)荷識(shí)別精確度更高[15],這有助于降低因電壓波動(dòng)對(duì)負(fù)荷運(yùn)行狀態(tài)誤分類的可能性,進(jìn)而提高模型的泛化性能.因此本文選取負(fù)荷的有功功率和穩(wěn)態(tài)電流作為負(fù)荷特征.
3.1.2 負(fù)荷狀態(tài)聚類
各類負(fù)荷因自身電氣特性或工作條件不同,其運(yùn)行時(shí)的運(yùn)行狀態(tài)具有差異,從負(fù)荷監(jiān)測(cè)的角度,可依據(jù)運(yùn)行狀態(tài)將電器分為開關(guān)狀態(tài)型電器、有限多狀態(tài)型電器、連續(xù)變狀態(tài)型電器3類[1].前兩種類型電器運(yùn)行狀態(tài)個(gè)數(shù)可數(shù),理論上能獲得其全部運(yùn)行狀態(tài),但連續(xù)變狀態(tài)型電器工作狀態(tài)是連續(xù)變動(dòng)的,需要采用聚類算法對(duì)運(yùn)行狀態(tài)進(jìn)行聚類,使其離散化轉(zhuǎn)變成有限多狀態(tài)型電器繼續(xù)研究.
考慮到歷史數(shù)據(jù)存在噪聲點(diǎn),將干擾模型學(xué)習(xí)數(shù)據(jù)背后的隱含規(guī)律,對(duì)模型泛化性能造成不利影響,本文采用DBSCAN聚類算法對(duì)電器負(fù)荷特征進(jìn)行提取和聚類.DBSCAN算法由Martin Ester等人在1996年提出,是一種經(jīng)典具有代表性的基于密度的聚類方法[16].DBSCAN的核心思想是:從某個(gè)選定的核心點(diǎn)出發(fā),不斷向密度可達(dá)的區(qū)域擴(kuò)張,從而得到一個(gè)包含核心點(diǎn)和邊界點(diǎn)的最大區(qū)域,區(qū)域中任意兩點(diǎn)密度相連.因此,與k-means等常用聚類算法對(duì)比,該算法聚類數(shù)目不需要事先確定,且可以在含有噪聲數(shù)據(jù)的數(shù)據(jù)集中識(shí)別任意數(shù)量和形狀的聚類[17].DBSCAN算法聚類簇示意圖及具體執(zhí)行流程圖如圖2-3所示.
由圖2可知,在DBSCAN算法中,聚類簇參數(shù)由簇半徑ε以及最少樣本數(shù)minpts決定.本文通過手肘法尋找出最優(yōu)的ε和minpts.手肘法是指選用不同的參數(shù)組,并將不同參數(shù)組對(duì)應(yīng)的評(píng)估指標(biāo)結(jié)果畫成折線,此時(shí)將存在一個(gè)拐點(diǎn),將曲線分為急速變化和趨于平穩(wěn)兩部分,就像人的肘部一樣,手肘法認(rèn)為拐點(diǎn)就是參數(shù)的最佳值.本文選擇最常用的輪廓系數(shù)作為手肘法的評(píng)估指標(biāo).
圖2 DBSCAN算法各參數(shù)解釋圖Fig.2 Explanation chart of DBSCAN algorithm parameters
3.1.3 狀態(tài)編碼
在多數(shù)研究中,一般采用向量來表示某時(shí)刻負(fù)荷序列的總狀態(tài),如假設(shè)3個(gè)負(fù)荷的狀態(tài)個(gè)數(shù)分別為2,3,8,該時(shí)刻所處狀態(tài)分別為0,2,5,那么就能用向量s=[0,2,5]來表示該總狀態(tài).然而在HMM應(yīng)用中,隱含狀態(tài)并不能用向量表示.為此,本文提出了一種基于二進(jìn)制的狀態(tài)編碼方式,將各負(fù)荷的隱含狀態(tài)向量編碼為一個(gè)二進(jìn)制狀態(tài)值,結(jié)合上面實(shí)例,具體步驟如下:
1) 分配位數(shù).根據(jù)電器的狀態(tài)數(shù)確定編碼所需要的二進(jìn)制位數(shù).上面3個(gè)電器狀態(tài)個(gè)數(shù)分別為2,3,8,則分配給各個(gè)電器的二進(jìn)制位數(shù)分別為1,2,3.
2) 確定取值.根據(jù)當(dāng)前時(shí)刻電器的十進(jìn)制狀態(tài)值計(jì)算二進(jìn)制狀態(tài)值.當(dāng)前3個(gè)電器十進(jìn)制狀態(tài)值分別為0,2,5,則二進(jìn)制狀態(tài)值分別為0,10,101.
3) 拼接表示.將所得到的二進(jìn)制狀態(tài)值根據(jù)電器排序從高到低拼接,得到最終的結(jié)果.當(dāng)前時(shí)刻狀態(tài)向量經(jīng)拼接表示后的狀態(tài)值為010101.
表1為該編碼方式的其他示例.
表1 部分電器狀態(tài)編碼表示Table 1 State code of some electrical appliances
圖3 DBSCAN算法流程圖Fig.3 Flow chart of DBSCAN algorithm
負(fù)荷序列總狀態(tài)編碼完成后,即可通過維特比算法進(jìn)行最優(yōu)隱含序列的預(yù)測(cè).維特比算法(Viterbi algorithm)由美籍意大利科學(xué)家安德魯·維特比于1967年提出,用于求解最短路徑問題,被廣泛用于解碼和自然語(yǔ)言處理等領(lǐng)域[18].
維特比算法的基本思想是從t=1時(shí)刻開始,遞歸地計(jì)算轉(zhuǎn)移到t時(shí)刻各個(gè)狀態(tài)i的最大概率:
維特比算法是動(dòng)態(tài)規(guī)劃思想在最短路徑問題上的一種具體實(shí)現(xiàn),所以只需要證明維特比算法符合動(dòng)態(tài)規(guī)劃的定義即可,其最優(yōu)性將自然由動(dòng)態(tài)規(guī)劃的性質(zhì)給出.作為一種動(dòng)態(tài)規(guī)劃算法,需要滿足最優(yōu)化原理和無后效性兩個(gè)條件.最優(yōu)性原理是指不論過去狀態(tài)和決策如何,對(duì)前面的決策所形成的狀態(tài)而言,余下的諸決策必須構(gòu)成最優(yōu)策略.簡(jiǎn)而言之,一個(gè)最優(yōu)化策略的子策略總是最優(yōu)的.無后效性是指對(duì)于某個(gè)給定的階段狀態(tài),它以前各階段的狀態(tài)無法直接影響它未來的決策,而只能通過當(dāng)前的這個(gè)狀態(tài).換句話說,每個(gè)狀態(tài)都是過去歷史的一個(gè)完整總結(jié).
維特比算法的最優(yōu)性原理能由反證法得出:若最短路徑P經(jīng)過某點(diǎn)x,那么這條路徑上從起始點(diǎn)s到該點(diǎn)的這段子路徑Q,一定是這兩點(diǎn)之間的最短路徑.否則,用s到x的最短路徑R替代Q,便構(gòu)成一條比P更短的路徑,這顯然是矛盾的.由式(9)可知,維特比算法所求的最短路徑其實(shí)是求一個(gè)從t-1時(shí)刻出發(fā)的,轉(zhuǎn)移到t時(shí)刻狀態(tài)i概率最大的狀態(tài),所謂的路徑最短實(shí)質(zhì)是概率最大,而且概率計(jì)算就是基于馬爾科夫性得到的,即當(dāng)前時(shí)刻的狀態(tài)僅與前一時(shí)刻的狀態(tài)和動(dòng)作有關(guān),與其他時(shí)刻的狀態(tài)和動(dòng)作條件獨(dú)立,滿足無后效性,維特比是動(dòng)態(tài)規(guī)劃算法得證.由動(dòng)態(tài)規(guī)劃性質(zhì)可得,若能將原問題分解成若干個(gè)子問題,則只要求當(dāng)前子問題的最優(yōu)解,最后就能得到原問題的最優(yōu)解.
在NILM問題上應(yīng)用維特比算法需要考慮泛化能力.若以統(tǒng)計(jì)學(xué)的觀點(diǎn)去分析,泛化能力可認(rèn)為是在信息有限的情況下,去找出數(shù)據(jù)所屬的分布,以及該分布的模型參數(shù)的能力.在實(shí)際的NILM應(yīng)用中,歷史數(shù)據(jù)并不能反應(yīng)負(fù)荷所有工作狀態(tài)及狀態(tài)之間的轉(zhuǎn)移關(guān)系,且新測(cè)量到的電氣數(shù)據(jù)也不全與已測(cè)量到的數(shù)據(jù)吻合,換而言之,狀態(tài)的觀測(cè)概率和轉(zhuǎn)移概率并不是完全已知且準(zhǔn)確的.由于經(jīng)典維特比算法實(shí)現(xiàn)的前提是HMM的模型參數(shù)已知,不具備泛化能力,但歷史數(shù)據(jù)又只包含了真實(shí)數(shù)據(jù)分布的部分信息,因此經(jīng)典維特比算法將難以準(zhǔn)確求解NILM場(chǎng)景下最優(yōu)隱含序列的預(yù)測(cè)問題.
針對(duì)上述困難,本文提出了改進(jìn)維特比算法,其主要思路是:若模型只掌握關(guān)于未知分布的部分信息,且符合已知信息的概率分布可能不止一個(gè),那么模型就應(yīng)該基于極大似然估計(jì),選取符合這些信息但概率最大的概率分布.其具體改進(jìn)如下:1)考慮到電器將出現(xiàn)新的觀測(cè)狀態(tài),且該觀測(cè)狀態(tài)可能對(duì)應(yīng)未知運(yùn)行狀態(tài)的問題,本文將輸入的電氣數(shù)據(jù)用k-means算法聚類到已知測(cè)量狀態(tài)中;2)考慮到電器可能存在新的狀態(tài)轉(zhuǎn)移,基于極大似然估計(jì)改變了δ和ψ的計(jì)算方法;3)考慮到狀態(tài)轉(zhuǎn)移矩陣和測(cè)量矩陣的稀疏性,參考文獻(xiàn)[19]提出的稀疏維特比算法,只處理狀態(tài)轉(zhuǎn)移概率及測(cè)量概率均不為0的計(jì)算.
對(duì)于給定觀測(cè)序列Y={y0,y1,···,yT}和隱含狀態(tài)序列Q={q0,q1,···,qT},本文提出的改進(jìn)維特比算法計(jì)算具體步驟如下:
特別地,不妨設(shè)t時(shí)刻的測(cè)量狀態(tài)yt=k,該觀測(cè)狀態(tài)發(fā)生時(shí),根據(jù)極大似然估計(jì)原理,出現(xiàn)概率最大的隱含狀態(tài)應(yīng)該是滿足bik=max(B[:,k])的狀態(tài)i.當(dāng)計(jì)算δ[t,i]和ψ[t,i]時(shí),將以上兩式的計(jì)算改為
該改進(jìn)方法將在考慮到新的狀態(tài)轉(zhuǎn)移上求得最優(yōu)解,數(shù)學(xué)證明如下.
維特比是動(dòng)態(tài)規(guī)劃算法,他只關(guān)注每一步的最優(yōu)解,研究未知但確定是非最優(yōu)的解是不必要的,所以本文只關(guān)注滿足bvk=max(BBB[:,k])的狀態(tài)i所出現(xiàn)的新狀態(tài)轉(zhuǎn)移.轉(zhuǎn)移概率取max(AAA)的原因是為了避免經(jīng)過該點(diǎn)的路徑被算法放棄,若aji不取max(AAA)而取其他合法值,雖然仍然能正確得到ψ[t,i]的結(jié)果,但是會(huì)使δ[t,i]的值變小,進(jìn)而降低未來時(shí)刻最優(yōu)路徑途徑該點(diǎn)的概率.
3) 終止?fàn)顟B(tài)計(jì)算:
4) 最優(yōu)序列回溯:
此時(shí)得到的序列即是預(yù)測(cè)最優(yōu)隱含狀態(tài)序列
得到預(yù)測(cè)狀態(tài)序列后,便可根據(jù)其結(jié)果進(jìn)行負(fù)荷功率分解.負(fù)荷在某一穩(wěn)定運(yùn)行狀態(tài)下的功率存在波動(dòng)性,而這種波動(dòng)性可以認(rèn)為是某一概率分布下的隨機(jī)測(cè)量[20-21].基于上述結(jié)論,本文改進(jìn)模型泛化性能的思路是讓模型意識(shí)到功率數(shù)據(jù)波動(dòng)背后的統(tǒng)計(jì)分布.據(jù)此,本文作出歷史功率數(shù)據(jù)的頻率分布直方圖,繪制密度分布曲線,觀察得出負(fù)荷穩(wěn)定運(yùn)行時(shí)功率數(shù)據(jù)的統(tǒng)計(jì)分布與正態(tài)分布最為相似,并注意到分解后負(fù)荷功率之和等于總功率的這一約束條件,提出一種基于極大似然估計(jì)原理的功率分解優(yōu)化模型,并用于負(fù)荷功率的分解計(jì)算.
本文的功率分解計(jì)算步驟是:1)根據(jù)各負(fù)荷樣本的聚類簇的平均值與方差,建立各負(fù)荷各狀態(tài)的正態(tài)分布概率密度函數(shù);2)基于極大似然估計(jì)建立目標(biāo)函數(shù),即求聯(lián)合概率的最大值,并計(jì)及同一時(shí)刻各負(fù)荷功率監(jiān)測(cè)值之和應(yīng)等于總功率這一約束條件,構(gòu)建功率分解計(jì)算模型如下:
式中:σ[i,j]和μ[i,j]分別指第i個(gè)電器的第j個(gè)聚類簇的標(biāo)準(zhǔn)差和均值,N為電器個(gè)數(shù),P(i)指每個(gè)電器的分解有功功率,PL指總負(fù)荷的有功功率.f[i,j](P(i))指電器i處于j運(yùn)行狀態(tài)時(shí)消耗功率P(i)的概率.上述問題將目標(biāo)函數(shù)兩邊取ln()后就是一個(gè)常見的凸二次規(guī)劃問題.
本文提出的非侵入式負(fù)荷監(jiān)測(cè)方法完整流程如圖4所示.
圖4 基于BPHMM的非侵入式負(fù)荷監(jiān)測(cè)流程圖Fig.4 Flow chart of non-intrusive load monitoring based on BPHMM
由于本文的研究工作最終將面向需求響應(yīng),實(shí)現(xiàn)用戶側(cè)負(fù)荷辨識(shí)與控制功能,因此作為評(píng)估驗(yàn)證的數(shù)據(jù)集應(yīng)滿足需求響應(yīng)下的應(yīng)用特點(diǎn)即分鐘級(jí)采樣頻率,長(zhǎng)采樣時(shí)間、擁有電流和功率采樣數(shù)據(jù)等.綜上所述,本文選取加拿大學(xué)者Stephen Makonin等建立的公共數(shù)據(jù)集AMPds2,以驗(yàn)證本文所述方法[20-21].AMPds2采集的為一戶家庭中用電設(shè)備的真實(shí)電氣數(shù)據(jù),能展現(xiàn)日常使用時(shí)功率和電壓可能遇到的波動(dòng).該數(shù)據(jù)集記錄了包括穩(wěn)態(tài)電流、有功功率等11種電氣特征,采樣頻率為Hz,紀(jì)錄時(shí)長(zhǎng)2年,適合作為算例分析數(shù)據(jù)集.
從數(shù)據(jù)集中選取壁爐(WOE)、衣物烘干機(jī)(CDE)、洗碗機(jī)(DWE)、電視機(jī)(TVE)、洗衣機(jī)(CWE)、熱泵(HPE)6種電器共10天14400個(gè)采樣點(diǎn)的有功功率與穩(wěn)態(tài)電流數(shù)據(jù)并按時(shí)間均分為10組,記為test 1~test 10,進(jìn)行10折交叉驗(yàn)證,每一次實(shí)驗(yàn)依次選取其中9組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),1組作為測(cè)試數(shù)據(jù),最后計(jì)算平均值.
運(yùn)行本文所述算例程序的計(jì)算機(jī)配置為16 GB RAM with Inter(R) Core(TM) i5-8300H @2.30 GHz,程序使用Python語(yǔ)言編寫.
4.2.1 基準(zhǔn)負(fù)荷監(jiān)測(cè)結(jié)果
本文采用基本準(zhǔn)確率ACCstate評(píng)價(jià)負(fù)荷狀態(tài)識(shí)別準(zhǔn)確率,用均方根誤差(root mean square error,RMSE)評(píng)價(jià)負(fù)荷功率監(jiān)測(cè)準(zhǔn)確性:
式中:T為采樣時(shí)段長(zhǎng)度,st和pt為該電器在t時(shí)刻的實(shí)際狀態(tài)和實(shí)際功率值,為預(yù)測(cè)狀態(tài)和分解功率值,I()為指示函數(shù).
測(cè)試集中某一天熱泵和電視機(jī)的分解結(jié)果分別見圖5-6.圖5(上)和6(上)為實(shí)際功率,圖5(下)和6(下)為分解結(jié)果.全部電器的功率分解結(jié)果見附錄A.
圖5 熱泵的功率分解結(jié)果Fig.5 Results of power disaggregation(HPE)
圖6 電視機(jī)的功率分解結(jié)果Fig.6 Results of power disaggregation(TVE)
本文選取文獻(xiàn)[23]所提出的基于遺傳算法(genetic algorithm,GA)的分解方法、文獻(xiàn)[24]基于深度序列翻譯模型(recurrent neural networks,RNN)的分解方法以及經(jīng)典HMM[13]作為對(duì)比,采用相同數(shù)據(jù)分別進(jìn)行10折交叉驗(yàn)證計(jì)算平均值,4種方法的負(fù)荷狀態(tài)識(shí)別平均準(zhǔn)確率,功率分解均方根誤差分別如表2和圖7所示.
表2 狀態(tài)識(shí)別平均準(zhǔn)確率對(duì)比Table 2 Comparison of precision of state recognition
圖7 功率分解均方根誤差對(duì)比Fig.7 Comparison of RMSE of power disaggregation
4.2.2 泛化性能實(shí)驗(yàn)結(jié)果
一般地,機(jī)器學(xué)習(xí)泛化性能指標(biāo)一般是將其他同類數(shù)據(jù)集作為測(cè)試集,測(cè)試模型是否能給出恰當(dāng)?shù)妮敵?但在NILM問題中,要找到另外一個(gè)采樣頻率、采樣電器、采樣電氣特征均相同的公共數(shù)據(jù)集較為困難,因此本文仍采用AMPds2數(shù)據(jù)集,在模型參數(shù)不變的情況下進(jìn)行泛化性能實(shí)驗(yàn).泛化性能實(shí)驗(yàn)結(jié)果已上傳至Google Driver,獲取路徑見附錄B.
1) 缺失負(fù)荷.
取除訓(xùn)練集與測(cè)試集數(shù)據(jù)以外的包含衣物烘干機(jī)(CDE)、電視機(jī)(TVE)、洗衣機(jī)(CWE)、熱泵(HPE)和壁爐(WOE)5種電器的有功功率與穩(wěn)態(tài)電流數(shù)據(jù)共10天作為新的測(cè)試集,以考察模型在面對(duì)新鮮數(shù)據(jù)與電器缺失時(shí)的適應(yīng)能力.上述4種方法的負(fù)荷狀態(tài)識(shí)別平均準(zhǔn)確率,功率分解均方根誤差分別如表3和圖8所示.
圖8 功率分解均方根誤差對(duì)比Fig.8 Comparison of RMSE of power disaggregation
表3 狀態(tài)識(shí)別平均準(zhǔn)確率對(duì)比Table 3 Comparison of average accuracy of state recognition
2) 使用其他負(fù)荷替換已知負(fù)荷.
在模型參數(shù)不變的情況下,將洗碗機(jī)(DWE)替換為冰箱(FGE),其余5種負(fù)荷不變,取除訓(xùn)練集與測(cè)試集數(shù)據(jù)以外10天數(shù)據(jù)作為新的測(cè)試集,以考察模型在面對(duì)新鮮數(shù)據(jù)與未知負(fù)荷時(shí)的適應(yīng)能力.上述4 種方法的負(fù)荷狀態(tài)識(shí)別平均準(zhǔn)確率,功率分解均方根誤差分別如表4和圖9所示.值得指出的是,冰箱是未知負(fù)荷,所以狀態(tài)集合未知,狀態(tài)識(shí)別準(zhǔn)確率無意義,故本文僅給出未被替換的5種已知負(fù)荷的狀態(tài)識(shí)別準(zhǔn)確率,因冰箱功率能被觀測(cè),故功率分解誤差指標(biāo)仍然有效.
表4 狀態(tài)識(shí)別平均準(zhǔn)確率對(duì)比Table 4 Comparison of average accuracy of state recognition
圖9 功率分解均方根誤差對(duì)比Fig.9 Comparison of RMSE of power disaggregation
4.2.3 運(yùn)算速度對(duì)比與結(jié)果分析
從表5可知,由于BPHMM使用了稀疏矩陣運(yùn)算方法,在運(yùn)算速度上對(duì)比經(jīng)典HMM存在一定的優(yōu)越性.同時(shí),由上述結(jié)果可以看出,本文所述方法對(duì)組合電氣特征的利用能使模型提取出更能體現(xiàn)負(fù)荷電器特性的運(yùn)行狀態(tài),且一定程度削弱了因外部環(huán)境帶來的電壓波動(dòng),從而對(duì)NILM問題求解性能指標(biāo)改善有幫助.本文提出的基于極大似然估計(jì)的功率分解優(yōu)化模型,一定程度上考慮并學(xué)習(xí)到了功率數(shù)據(jù)波動(dòng)性的概率分布,保證了各個(gè)電器的監(jiān)測(cè)功率之和等于總負(fù)荷功率,使功率分解準(zhǔn)確率更高.對(duì)比較為前沿的深度學(xué)習(xí)方法,本文所述方法在多工作狀態(tài)電器如電視機(jī)和洗衣機(jī)的狀態(tài)識(shí)別準(zhǔn)確率上優(yōu)于基于深度學(xué)習(xí)的解決方法.在泛化性能實(shí)驗(yàn)中,本文所述模型將HMM與極大似然估計(jì)結(jié)合,讓傳統(tǒng)隱馬爾可夫模型對(duì)新鮮數(shù)據(jù)輸入導(dǎo)致的已知概率分布出現(xiàn)改變這一現(xiàn)象進(jìn)行適應(yīng),初步改善過往的數(shù)據(jù)并不能保證負(fù)荷全部工作狀態(tài)被測(cè)量,各狀態(tài)的所有轉(zhuǎn)移信息被確定的問題,這也表明計(jì)及并提高泛化性能的解決思路對(duì)提高NILM問題求解準(zhǔn)確性有效.
表5 各模型運(yùn)算速度對(duì)比Table 5 Comparison of operation speed of each model
本文提出了一種基于HMM的非侵入式負(fù)荷監(jiān)測(cè)泛化性能改進(jìn)方法.該方法提出并構(gòu)建了二元參數(shù)隱馬爾科夫模型BPHMM,采用DBSCAN聚類算法對(duì)負(fù)荷特征進(jìn)行聚類,提出一種基于二進(jìn)制的編碼方案對(duì)負(fù)荷狀態(tài)組合進(jìn)行編碼,改進(jìn)了維特比算法使其具備對(duì)模型參數(shù)更新的適應(yīng)能力進(jìn)而實(shí)現(xiàn)負(fù)荷狀態(tài)的最優(yōu)預(yù)測(cè),最后建立計(jì)及功率隨機(jī)波動(dòng)性的優(yōu)化模型,根據(jù)電器聚類簇的均值和方差實(shí)現(xiàn)負(fù)荷的功率分解.算例結(jié)果表明,相比基于啟發(fā)式算法,深度學(xué)習(xí)方法以及經(jīng)典HMM的識(shí)別方案,本文所提方法取得了更高的負(fù)荷狀態(tài)識(shí)別準(zhǔn)確率與更低的功率分解誤差.本文針對(duì)NILM模型泛化性能提高所提出的各項(xiàng)措施如對(duì)數(shù)據(jù)進(jìn)行降噪處理、改進(jìn)傳統(tǒng)方法使其提高對(duì)未知數(shù)據(jù)的適應(yīng)能力以及使模型學(xué)習(xí)到數(shù)據(jù)波動(dòng)背后的統(tǒng)計(jì)特性等思路,相信對(duì)NILM的實(shí)用化有參考價(jià)值.本文工作對(duì)泛化性能改進(jìn)的研究還比較初步,也沒有考慮到負(fù)荷運(yùn)行的非電氣特征.下一步研究將關(guān)注如何利用非電氣特征,如負(fù)荷工作時(shí)長(zhǎng)、用戶行為習(xí)慣等;研究新增未知電器的處理,提出更具有實(shí)用性的非侵入式負(fù)荷監(jiān)測(cè)方法.
附錄
A 基準(zhǔn)測(cè)試分解結(jié)果
圖A1 壁爐的功率分解結(jié)果Fig.A1 Results of power disaggregation(WOE)
圖A2 衣物烘干機(jī)的功率分解結(jié)果Fig.A2 Results of power disaggregation(CDE)
圖A3 洗碗機(jī)的功率分解結(jié)果Fig.A3 Results of power disaggregation(DWE)
圖A4 電視的功率分解結(jié)果Fig.A4 Results of power disaggregation(TVE)
圖A5 洗衣機(jī)的功率分解結(jié)果Fig.A5 Results of power disaggregation(CWE)
圖A6 熱泵的功率分解結(jié)果Fig.A6 Results of power disaggregation(HPE)
B 泛化性能測(cè)試分解結(jié)果獲取路徑
https://drive.google.com/drive/folders/1jGwK6bzzHlQlc-VT8LYsdIuVpGiP84DU?usp=sharing