李梓彤, 楊 超
(貴州大學(xué) 電氣工程學(xué)院, 貴陽(yáng) 550025)
隨著現(xiàn)代社會(huì)的快速發(fā)展,智能電網(wǎng)成為一個(gè)被廣泛討論的新概念[1]。 居民用戶對(duì)精準(zhǔn)的用電服務(wù)需求不斷增長(zhǎng),目前電網(wǎng)公司只向用戶提供總電量數(shù)據(jù)。 非侵入式負(fù)荷監(jiān)測(cè)(non-intrusive load monitoring,NILM)技術(shù)最早由Hart 提出[2],具體來說是在電力負(fù)荷總進(jìn)線處獲取負(fù)荷數(shù)據(jù)(電壓、電流、功率等),采用模式識(shí)別算法,通過分析負(fù)荷特征量,實(shí)現(xiàn)用戶側(cè)負(fù)荷類型的辨識(shí)及能耗分解。 與傳統(tǒng)的侵入式負(fù)荷監(jiān)測(cè)方法相比,NILM 具有運(yùn)維簡(jiǎn)便、基礎(chǔ)成本低、信息安全性強(qiáng)、不侵犯用戶隱私等優(yōu)勢(shì)。
NILM 整個(gè)流程分為數(shù)據(jù)的采集和處理、事件檢測(cè)、特征提取、負(fù)荷辨識(shí)等步驟。 近年來,國(guó)內(nèi)外眾多學(xué)者對(duì)NILM 進(jìn)行了大量研究,目前研究重點(diǎn)主要在于負(fù)荷特征的提取以及負(fù)荷識(shí)別算法的優(yōu)化兩個(gè)部分。 其中,特征提取主要分為暫態(tài)特征和穩(wěn)態(tài)特征,并且功率是最常使用的特征,文獻(xiàn)[3]針對(duì)低采樣率下識(shí)別準(zhǔn)確率低的問題提出一種基于極大似然法的負(fù)荷識(shí)別算法,采用整數(shù)規(guī)劃和最大似然法進(jìn)行負(fù)荷識(shí)別,平均識(shí)別準(zhǔn)確率超過85%。 文獻(xiàn)[4]將標(biāo)準(zhǔn)化后的負(fù)荷電壓、電流、V-I 軌跡生成真彩可視化圖像,并將其作為卷積神經(jīng)網(wǎng)絡(luò)(CNN)的輸入進(jìn)行負(fù)荷辨識(shí)。 文獻(xiàn)[5]以穩(wěn)態(tài)電流的時(shí)域和頻域信息作為特征,然后采用隨機(jī)森林進(jìn)行特征選擇得到最優(yōu)特征集,最后使用遺傳算法優(yōu)化極限學(xué)習(xí)進(jìn)行負(fù)荷識(shí)別。 文獻(xiàn)[6]先以有功無功作為特征采用K-Means 聚類進(jìn)行初步分類,然后再使用帶有顏色特征的V-I 軌跡作為AlexNet 神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行精細(xì)化分類。 文獻(xiàn)[7]在低頻采樣下采用支持向量機(jī)進(jìn)行負(fù)荷識(shí)別,對(duì)大功率電器的識(shí)別效果較好,但對(duì)小功率電器識(shí)別效果差。 除了時(shí)域特征外還有很多研究人員采用頻域特征,文獻(xiàn)[8]采用電流諧波幅值作為特征,在此基礎(chǔ)上提出差量特征提取的方法,最后使用模糊聚類進(jìn)行負(fù)荷識(shí)別,但對(duì)功率相近的純電阻電器識(shí)別準(zhǔn)確率不高。 文獻(xiàn)[9]以有功功率、基波功率因數(shù)、電壓電流三次諧波含量差作為特征,采用優(yōu)化后的模糊聚類算法進(jìn)行識(shí)別,實(shí)現(xiàn)了對(duì)低功率用電設(shè)備的辨識(shí)。 針對(duì)負(fù)荷特征相似的電器,文獻(xiàn)[10]以奇次諧波電流為負(fù)荷特征,并使用AdaBoost 算法進(jìn)一步篩選特征,采用K 鄰近與核線性判別方法相結(jié)合進(jìn)行負(fù)荷識(shí)別。 文獻(xiàn)[11]中除了考慮傳統(tǒng)的電氣特征外,還加入了室外溫度、大氣壓強(qiáng)等非電氣特征作為輸入,采用隨機(jī)森林算法進(jìn)行負(fù)荷識(shí)別,對(duì)于電氣特征相似的負(fù)荷具有良好的識(shí)別準(zhǔn)確率。
綜上所述,針對(duì)負(fù)荷識(shí)別算法的研究有很多,但大部分算法涉及的負(fù)荷種類較少,應(yīng)用場(chǎng)景也比較簡(jiǎn)單,且大部分采用的是有功、無功等傳統(tǒng)特征作為輸入。 針對(duì)上述問題,本文在有功、無功功率的基礎(chǔ)上,加入基波功率因數(shù)和諧波特征作為輸入,提出一種基于麻雀搜索算法優(yōu)化支持向量機(jī)的負(fù)荷識(shí)別方法,以提高負(fù)荷識(shí)別的準(zhǔn)確率。
有功功率P和無功功率Q是負(fù)荷監(jiān)測(cè)的重要特征,當(dāng)電氣運(yùn)行狀態(tài)發(fā)生變化時(shí),有功、無功產(chǎn)生相應(yīng)的變化,不同電器穩(wěn)態(tài)運(yùn)行時(shí)有功、無功存在差異,但有功和無功功率不能直接測(cè)量,需要通過電壓電流數(shù)據(jù)進(jìn)一步計(jì)算得到,計(jì)算公式如下:
其中,Uk表示用電設(shè)備第k次電壓諧波的有效值;Ik表示用電設(shè)備第k次電流諧波的有效值;φ為功率因數(shù)角。 有功、無功雖然可以識(shí)別出絕大部分電器,但容易發(fā)生特征重疊現(xiàn)象,因此引入基波功率因數(shù),推得的數(shù)學(xué)公式如下:
其中,P1為基波有功功率,Q1為基波無功功率。
此外,不同種類電器的諧波信息也不盡相同,可以作為用電負(fù)荷特征,通過快速傅里葉變換(fast Fourier transform)可以將穩(wěn)態(tài)電流的時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào),本文采用三次諧波電流幅值作為負(fù)荷特征,F(xiàn)FT 對(duì)穩(wěn)態(tài)電流信號(hào)的諧波分解如下:
其中,c0為直流分量;cm為各次諧波的幅值;mω為各次諧波的角頻率;φm為各次諧波的相位角。
麻雀搜索算法(sparrow search algorithm,SSA)[12]是2020 年提出的一種群體優(yōu)化算法。 該算法通過不斷更新個(gè)體的位置,模擬麻雀的覓食和反捕食行為。 相比傳統(tǒng)的優(yōu)化算法,該算法結(jié)構(gòu)簡(jiǎn)單,控制參數(shù)少,且尋優(yōu)能力強(qiáng),收斂速度快。 在麻雀搜索算法中,將種群分為發(fā)現(xiàn)者、跟隨者和預(yù)警者。 種群具有以下特征:發(fā)現(xiàn)者通常擁有較高的能源儲(chǔ)備,為所有的跟隨者提供覓食方向,只要能找到更好的食物來源,每只麻雀都可以成為發(fā)現(xiàn)者,但發(fā)現(xiàn)者和跟隨者在整個(gè)種群中的比例是固定的。 對(duì)此研究?jī)?nèi)容擬做闡釋分述如下。
(1)初始化麻雀種群位置。 研究給出的數(shù)學(xué)表述如下:
其中,n為麻雀數(shù)量,d表示要優(yōu)化的變量維度。 所有麻雀的適應(yīng)值可由如下公式來描述:
其中,F(xiàn)X中每行表示個(gè)體麻雀的適應(yīng)值。 在SSA 中,適應(yīng)值較好的發(fā)現(xiàn)者在搜索過程中優(yōu)先獲得食物。
(2)種群中發(fā)現(xiàn)者負(fù)責(zé)尋找食物的方向和位置,引導(dǎo)追隨者向食物移動(dòng)。 發(fā)現(xiàn)者位置更新如下:
其中,t表示當(dāng)前迭代次數(shù);表示迭代t次時(shí)第i個(gè)麻雀的第j維值;itermax表示最大迭代次數(shù);α∈(0,1] 是一個(gè)隨機(jī)數(shù);R2∈[0,1] 表示報(bào)警值;ST∈[0.5,1] 表示安全閾值;Q是服從正態(tài)分布的一個(gè)隨機(jī)數(shù);L是1× d維的矩陣,矩陣中的每個(gè)元素都是1。
發(fā)現(xiàn)者位置更新規(guī)則如下:若R2<ST,意味著周圍沒有捕食者,發(fā)現(xiàn)者可以進(jìn)入廣泛搜索模式。若R2≥ST,則意味著有麻雀發(fā)現(xiàn)了捕食者,所有麻雀都需迅速飛往安全區(qū)域。
(3)跟隨者。 會(huì)頻繁地監(jiān)視發(fā)現(xiàn)者,進(jìn)而爭(zhēng)奪食物。 跟隨者的位置更新方式如下:
其中,Xworst表示當(dāng)前全局最差位置;Xp為發(fā)現(xiàn)者占據(jù)的最佳位置;A是1 和-1 的1× d維矩陣,A+=AT(AAT)-1。 當(dāng)時(shí),第i個(gè)跟隨者處于較差位置,需飛往其他區(qū)域進(jìn)行覓食。 當(dāng)時(shí),跟隨者i將在最佳位置Xp附近覓食。
(4)預(yù)警者。 一般占種群的10%~20%,當(dāng)個(gè)體麻雀感知到危險(xiǎn)時(shí),會(huì)迅速向安全區(qū)域移動(dòng),其位置更新如下:
其中,Xbest表示當(dāng)前全局最優(yōu)位置;β為步長(zhǎng)控制參數(shù),服從均值為0、方差為1 的正態(tài)分布;K∈[-1,1] 是一個(gè)隨機(jī)數(shù);ε為常數(shù),用于避免分母為0;fi表示當(dāng)前個(gè)體的適應(yīng)度值,fg、fw分別表示當(dāng)前全局最優(yōu)和最差的適應(yīng)度值。 當(dāng)fi≠fg時(shí),麻雀位于種群的邊緣位置,容易遇到危險(xiǎn),需要向最優(yōu)位置移動(dòng)來獲得更高的適應(yīng)度值。 當(dāng)fi =fg時(shí),麻雀處于種群中心位置,當(dāng)意識(shí)到危險(xiǎn)時(shí),該麻雀向其他同伴靠近,以此遠(yuǎn)離危險(xiǎn)區(qū)域。
支持向量機(jī)(Support Vector Machine,SVM)是一種基于統(tǒng)計(jì)學(xué)理論的監(jiān)督型學(xué)習(xí)算法[13],常用于小樣本的分類。 主要思想是通過核函數(shù)將低維樣本映射到高維空間,從而在高維空間中求出最優(yōu)分類超平面使得樣本線性可分。
當(dāng)樣本集為T= {(xi,yi)|i= 1,2,…,N},xi∈Rd,yi∈Y={1,2,…,M},最優(yōu)分類超平面方程如下:
其中,x為輸入樣本;w為權(quán)重向量;b為偏置量。
目標(biāo)函數(shù)為:
其中,C為懲罰因子;ξi為松弛常量,ξi≥0,i=1,2,…,n。
SVM 的分類模型為:
其中,αi為樣本訓(xùn)練中得到的拉式乘子;K(xi,x) 為核函數(shù);g為核函數(shù)半徑;b為對(duì)應(yīng)的偏差。C和g的選擇決定了SVM 分類效果的好壞,需要對(duì)這2 個(gè)變量進(jìn)行尋優(yōu)來得到更好的模型。
算法流程如圖1 所示。 SSA-SVM 負(fù)荷識(shí)別具體步驟如下。
圖1 NILM 方法流程圖Fig. 1 Non-intrusive load identification process
(1)首先提取負(fù)荷特征作為模型的輸入。 建立訓(xùn)練集和測(cè)試集樣本。
(2)初始化麻雀搜索算法具體參數(shù)。 包括麻雀數(shù)量、最大迭代次數(shù)、發(fā)現(xiàn)者和預(yù)警者麻雀所占比例、SVM 參數(shù)(C,g) 的上邊界和下邊界。
(3)計(jì)算初始所有麻雀的適應(yīng)度值。 根據(jù)適應(yīng)度高低按照比例將麻雀分為發(fā)現(xiàn)者和跟隨者。 確定當(dāng)前最優(yōu)適應(yīng)度值fg和該麻雀對(duì)應(yīng)的最優(yōu)位置Xbest。
(4)根據(jù)預(yù)警值的大小,按照式(7)更新發(fā)現(xiàn)者的位置,根據(jù)式(8)更新跟隨者的位置。
(5)根據(jù)式(9)更新意識(shí)到危險(xiǎn)的的麻雀位置,使其迅速向安全區(qū)域移動(dòng)。
(6)計(jì)算當(dāng)前所有麻雀的適應(yīng)度值,并與之前的最優(yōu)適應(yīng)度值進(jìn)行比較,取全局最優(yōu)的適應(yīng)度值以及對(duì)應(yīng)的麻雀位置。
(7)判斷是否達(dá)到最大迭代次數(shù)。 若滿足條件則輸出最優(yōu)參數(shù),得到最優(yōu)模型;否則轉(zhuǎn)向步驟(3)。
由于SVM 的懲罰因子C和核函數(shù)參數(shù)g的選取對(duì)分類效果影響很大,本文采用麻雀搜索算法對(duì)C和g進(jìn)行尋優(yōu),以得到最優(yōu)的SSA-SVM 分類模型。
本文采用AMPds 數(shù)據(jù)集[14]進(jìn)行識(shí)別效果驗(yàn)證,該數(shù)據(jù)集記錄了2012 年4 月1 日到2014 年3月3 日期間加拿大一戶居民住宅的能耗數(shù)據(jù),其中包含了21 個(gè)電表數(shù)據(jù)、2 個(gè)水表數(shù)據(jù)和2 個(gè)天然氣表數(shù)據(jù)。 用電數(shù)據(jù)包括有功、無功、視在功率、電壓、電流、頻率、基波功率因數(shù)等,采樣頻率為1 min。 本文從中選取5 種常用的用電設(shè)備作為驗(yàn)證,電器類別標(biāo)簽記為1,2,3,4,5。 負(fù)荷信息見表1。
表1 負(fù)荷信息表Tab. 1 Load information table
SSA-SVM 算法的訓(xùn)練集和測(cè)試集包含4 個(gè)負(fù)荷特征,分別是有功功率、無功功率、基波功率因數(shù)和三次諧波電流幅值,形成特征向量:
其中,隨機(jī)選取80%的樣本數(shù)據(jù)作為訓(xùn)練集,20%的樣本數(shù)據(jù)作為測(cè)試集。 SSA-SVM 算法參數(shù)設(shè)定:麻雀數(shù)量為10,發(fā)現(xiàn)者比例為70%,跟隨者比例為30%,預(yù)警麻雀比例為20%,預(yù)警值為0.6。 最大迭代次數(shù)為20,SVM 參數(shù)(C,g) 的下邊界設(shè)置為[0.1,2-5], 上邊界設(shè)置為[10,24]。 以分類預(yù)測(cè)錯(cuò)誤率作為優(yōu)化的目標(biāo)函數(shù)值,SSA 優(yōu)化SVM 后的分類效果及適應(yīng)度曲線如圖2 所示。
圖2 SSA-SVM 適應(yīng)度曲線Fig. 2 SSA-SVM fitness curve
使用Matlab 軟件對(duì)本文提出SSA-SVM 負(fù)荷識(shí)別模型進(jìn)行測(cè)試,經(jīng)SSA 優(yōu)化后得到的最優(yōu)參數(shù)為:C=6.261 1,g=12.604 8。 得到最優(yōu)的分類模型后,用測(cè)試集樣本進(jìn)行驗(yàn)證,結(jié)果如圖3 所示。 為了測(cè)試模型的性能,模型的識(shí)別準(zhǔn)確率計(jì)算公式為:
圖3 SSA-SVM 分類結(jié)果Fig. 3 The classification results of SSA-SVM algorithm
其中,N為測(cè)試集中樣本總數(shù)目;yi為測(cè)試集中樣本的真實(shí)標(biāo)簽值;y^i為模型預(yù)測(cè)的測(cè)試集輸出值。
為了體現(xiàn)SSA-SVM 算法的負(fù)荷識(shí)別效果,使用相同的數(shù)據(jù)集,分別采用傳統(tǒng)的SVM 算法和GASVM 算法進(jìn)行負(fù)荷識(shí)別,其分類結(jié)果如圖4、圖5 所示。 3 種方法的負(fù)荷識(shí)別準(zhǔn)確率見表2。
表2 3 種算法識(shí)別準(zhǔn)確率對(duì)比Tab. 2 Comparison of identification accuracy of three algorithms%
圖4 傳統(tǒng)SVM 分類結(jié)果Fig. 4 The classification results of SVM algorithm
圖5 GA-SVM 分類結(jié)果Fig. 5 The classification results of GA-SVM algorithm
由表2 可以看出,SSA-SVM 算法比其他2 種算法整體上有更高的識(shí)別準(zhǔn)確率,測(cè)試準(zhǔn)確率可達(dá)到98.69%,且對(duì)于多狀態(tài)電器的識(shí)別效果要比傳統(tǒng)SVM 和GA-SVM 好。
針對(duì)負(fù)荷特征相近的電器識(shí)別準(zhǔn)確率不高的問題,本文提出了一種基于SSA-SVM 的負(fù)荷識(shí)別模型,首先在傳統(tǒng)有功、無功功率及基波功率因數(shù)的基礎(chǔ)上引入電流諧波作為特征,然后采用SSA 算法對(duì)SVM 的核心參數(shù)C和g進(jìn)行尋優(yōu),通過SSA-SVM模型實(shí)現(xiàn)負(fù)荷識(shí)別,實(shí)驗(yàn)結(jié)果表明,本文方法在多場(chǎng)景情況下具有較高的識(shí)別準(zhǔn)確率及穩(wěn)定性。