謝偉鴻,姚 磊,李睿欣
(上海理工大學(xué) 機(jī)械工程學(xué)院,上海 200093)
為了應(yīng)對(duì)全球氣候變化挑戰(zhàn)、解決環(huán)境污染危機(jī),我國(guó)在2021 年作出了力爭(zhēng)在2030 年前二氧化碳排放量達(dá)到峰值,努力爭(zhēng)取2060 年前實(shí)現(xiàn)碳中和的承諾[1]。節(jié)能減排不僅是智能電網(wǎng)建設(shè)的戰(zhàn)略目標(biāo),更是整個(gè)社會(huì)的需求。傳統(tǒng)的電能監(jiān)測(cè)體系往往只能給予用電總量的參數(shù)信息[2-3],無(wú)法了解更加細(xì)節(jié)的設(shè)備能耗情況。如果能夠了解各個(gè)家用電器設(shè)備的詳細(xì)能耗情況,那么一個(gè)家庭將會(huì)減少5%~15%的電能消耗[4-5]。
隨著人工智能、物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,非侵入式負(fù)荷監(jiān)測(cè)技術(shù)[2,6-7]逐漸走進(jìn)人們的視野。在傳統(tǒng)侵入式負(fù)荷監(jiān)測(cè)技術(shù)中,若要獲得各個(gè)設(shè)備的具體耗能情況,則需要在各個(gè)設(shè)備處安裝負(fù)荷監(jiān)測(cè)裝置,存在成本高、難以檢修、不便推廣的問(wèn)題[8-10]。非侵入式負(fù)荷監(jiān)測(cè)通過(guò)在用戶入戶處安裝一處負(fù)荷監(jiān)測(cè)裝置,采用非侵入式負(fù)荷識(shí)別算法選取合適的負(fù)荷特征,即可分解出用戶內(nèi)部的各個(gè)用電設(shè)備,進(jìn)而獲得其耗能情況[11-12]。
近年來(lái),學(xué)者們對(duì)于非侵入式負(fù)荷識(shí)別算法進(jìn)行了大量研究。例如,文獻(xiàn)[13]通過(guò)建立負(fù)荷穩(wěn)態(tài)電流波形特征庫(kù),利用DTW(Dynamic Time Warping)算法計(jì)算負(fù)荷穩(wěn)態(tài)電流波形與特征庫(kù)模板的距離進(jìn)行負(fù)荷識(shí)別實(shí)驗(yàn);文獻(xiàn)[14]提出一種基于廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)的非侵入式負(fù)荷識(shí)別模型,采用模擬退火算法計(jì)算光滑因子,進(jìn)而找到全局最優(yōu)解,以負(fù)荷投切過(guò)程中的一些暫態(tài)特征作為神經(jīng)網(wǎng)絡(luò)輸入,進(jìn)行負(fù)荷識(shí)別實(shí)驗(yàn),得到了較好的識(shí)別結(jié)果;文獻(xiàn)[15]利用CUSUM(Cumulative Sum)算法進(jìn)行負(fù)荷投切的事件檢測(cè),在結(jié)合暫態(tài)和穩(wěn)態(tài)特征的基礎(chǔ)上搭建了負(fù)荷識(shí)別模型;文獻(xiàn)[16]提出一種改進(jìn)滑動(dòng)窗的負(fù)荷監(jiān)測(cè)算法,并通過(guò)建立穩(wěn)態(tài)負(fù)荷特征庫(kù),利用Adaboost 算法進(jìn)行負(fù)荷識(shí)別實(shí)驗(yàn);文獻(xiàn)[17]依托粒子群算法優(yōu)化隨機(jī)森林的剪枝閾值、決策樹(shù)顆數(shù)、隨機(jī)屬性個(gè)數(shù)進(jìn)行迭代尋優(yōu),對(duì)每棵決策樹(shù)采用加權(quán)投票的策略,得到了較好的負(fù)荷識(shí)別結(jié)果。
盡管目前已有許多種非侵入負(fù)荷識(shí)別算法,但部分算法存在計(jì)算量大、訓(xùn)練時(shí)間長(zhǎng)、識(shí)別準(zhǔn)確率不高的問(wèn)題。本文選用學(xué)習(xí)效率高、泛化性能好的極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)進(jìn)行負(fù)荷識(shí)別,并采用麻雀搜索算法(Sparrow Search Algorithm,SSA)優(yōu)化ELM 隱含層的輸入權(quán)重和閾值,通過(guò)與ELM 算法和BP 神經(jīng)網(wǎng)絡(luò)算法進(jìn)行比較,發(fā)現(xiàn)基于SSA 優(yōu)化的ELM 算法(SSA-ELM)負(fù)荷識(shí)別性能更優(yōu)。
ELM 是一種典型的單隱層前饋神經(jīng)網(wǎng)絡(luò)算法[18-19],不具有傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度慢、容易陷入局部極小值點(diǎn)、學(xué)習(xí)率選擇敏感等缺點(diǎn)。ELM 算法輸入層與隱含層的權(quán)重系數(shù)和隱含層神經(jīng)元的閾值都是隨機(jī)產(chǎn)生的,且一旦確定就不再變化。在計(jì)算過(guò)程中,只需要選定隱含層神經(jīng)元的個(gè)數(shù),便可以通過(guò)求解逆矩陣的方式得出隱含層與輸出層之間的輸出矩陣,從而獲得唯一最優(yōu)解。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)方法相比,ELM 算法是通過(guò)求解矩陣的逆的形式獲得最優(yōu)解而不是采用迭代方法,因此具有運(yùn)算速度快、泛化性能好等優(yōu)點(diǎn)。ELM的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
Fig.1 Structure diagram of extreme learning machine圖1 ELM 結(jié)構(gòu)示意圖
假設(shè)有N 個(gè)樣本(Xi,Yi),設(shè)隱含層節(jié)點(diǎn)數(shù)為L(zhǎng),那么ELM的輸出為:
式中,h(x)為激活函數(shù),Wi為輸入層與隱含層之間的輸入權(quán)重,βi為隱含層與輸出層之間的輸出權(quán)重,bi為第i個(gè)神經(jīng)元的閾值。為使ELM的輸出與期望輸出的差值i 最小,即存在Wi、βi、bi使得:
引入正則化系數(shù)C,求解可得輸出層權(quán)重β為:
則ELM 網(wǎng)絡(luò)模型的輸出為:
SSA 是近年來(lái)學(xué)者們根據(jù)麻雀群體覓食行為提出的一種群智能優(yōu)化算法[20-21]。覓食過(guò)程中的麻雀種群分為發(fā)現(xiàn)者和加入者,發(fā)現(xiàn)者為整個(gè)種群提供食物的方向和位置,加入者總是靠發(fā)現(xiàn)者找到食物或在發(fā)現(xiàn)者附近覓食,發(fā)現(xiàn)者和加入者的身份是動(dòng)態(tài)變化的,當(dāng)一只加入者找到較好的食物時(shí)會(huì)變成發(fā)現(xiàn)者,此時(shí)便會(huì)有一只發(fā)現(xiàn)者變?yōu)榧尤胝?,發(fā)現(xiàn)者和加入者占種群的整體比例是固定的。種群在覓食過(guò)程中,部分麻雀還要負(fù)責(zé)偵查預(yù)警,如果發(fā)現(xiàn)危險(xiǎn),便會(huì)向種群發(fā)出信號(hào),當(dāng)環(huán)境預(yù)警值超過(guò)臨界值時(shí),整個(gè)群體就會(huì)前往更加安全的區(qū)域覓食。
在SSA 算法中,發(fā)現(xiàn)者的適應(yīng)度值比加入者更好,有著更大的搜索范圍,因此發(fā)現(xiàn)者會(huì)更先找到食物,并為種群提供搜尋食物的方向。每代發(fā)現(xiàn)者的位置更新如下:
式中,表示麻雀種群中第t代第i個(gè)麻雀在第d維的位置,a為[0,1]中的均勻隨機(jī)數(shù),itermax為種群的最大迭代次數(shù),Q 為一個(gè)標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù)。R2表示環(huán)境預(yù)警值,為[0,1]中的均勻隨機(jī)數(shù);ST為警戒閾值,取值范圍為[0.5,1.0]。當(dāng)R2<ST時(shí),代表此時(shí)發(fā)現(xiàn)者的位置較為安全,暫未發(fā)現(xiàn)捕食者,可以進(jìn)行更大范圍的搜索;當(dāng)R2>ST時(shí),表示種群中已經(jīng)有麻雀發(fā)現(xiàn)了捕食者,并向其他麻雀發(fā)出預(yù)警信號(hào),此時(shí)整個(gè)種群的麻雀需要前往更加安全的位置尋找食物。
在覓食過(guò)程中,一些加入者搜索到發(fā)現(xiàn)者找到了更好的食物,它們會(huì)前往發(fā)現(xiàn)者的位置進(jìn)行覓食。如果沒(méi)能獲得食物,加入者的能量就會(huì)變低,其在整個(gè)種群中所處的覓食位置就會(huì)變差,更有可能會(huì)飛往更遠(yuǎn)的地方尋找食物。
加入者位置更新為:
式中,Q為一個(gè)服從正態(tài)分布的隨機(jī)數(shù);分別為此時(shí)發(fā)現(xiàn)者的最優(yōu)位置以及全局最差的位置;A為一個(gè)1行d 列的矩陣,其中每個(gè)元素隨機(jī)取值為1 或-1;A+為偽逆矩陣,A+=AT(AAT)-1。
麻雀種群在覓食的同時(shí),會(huì)隨機(jī)選擇部分麻雀負(fù)責(zé)警戒,當(dāng)環(huán)境預(yù)警值超過(guò)臨界值時(shí),其會(huì)放棄當(dāng)前食物,前往更加安全的區(qū)域覓食,其位置更新為:
式中,β為符合標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù);K為[-1,1]的均勻隨機(jī)數(shù);ε為一個(gè)較小的數(shù),防止分母唯一;fi為當(dāng)前第i個(gè)麻雀的適應(yīng)度值;分別為全局最佳位置和最差位置;fg、fw為此時(shí)全局最佳位置和最差位置的適應(yīng)度值。
家庭電器按照負(fù)荷容量可分為大功率電器和小功率電器兩種;按照負(fù)載類(lèi)型可分為阻性負(fù)載、容性負(fù)載和感性負(fù)載3 種。不同家用電器的電路設(shè)計(jì)不同,產(chǎn)生的諧波亦不相同,因此諧波數(shù)據(jù)中通常包含各個(gè)電器的特征信息。傳統(tǒng)的有功功率和無(wú)功功率無(wú)法區(qū)分功率接近的電器設(shè)備,負(fù)荷識(shí)別準(zhǔn)確率不高。因此,本文在傳統(tǒng)電流有效值(I)、有功功率(P)、無(wú)功功率(Q)、功率因數(shù)(λ)等負(fù)荷特征的基礎(chǔ)上,增加電流3 次、5 次和7 次諧波含有率(HRI3、HRI5、HRI7)作為新的負(fù)荷特征至負(fù)荷識(shí)別實(shí)驗(yàn)中。電流的第h 次諧波含有率表示為第h 次諧波分量的方均根值與基波分量的方均根值之比,不同負(fù)荷的諧波含量有一定差異,表示為:
式中,HRIh為電流的第h次諧波含有率;Ih,rms、I1,rms分別為第h次諧波分量的方均根值與基波分量的方均根值。
ELM 模型隱含層神經(jīng)元的輸入權(quán)重Wi和閾值bi是隨機(jī)確定的,且一經(jīng)確定便不再改變,非常容易導(dǎo)致模型陷入局部最優(yōu),影響分類(lèi)準(zhǔn)確率。SSA 是一種智能優(yōu)化算法,具有搜索能力強(qiáng)、收斂速度快的優(yōu)點(diǎn)。本文采用SSA 算法對(duì)ELM 模型的Wi和bi進(jìn)行參數(shù)尋優(yōu),進(jìn)一步提高了模型分類(lèi)準(zhǔn)確率。經(jīng)過(guò)多次實(shí)驗(yàn)優(yōu)化,SSA 算法參數(shù)設(shè)置見(jiàn)表1。
將總體樣本中錯(cuò)誤識(shí)別數(shù)量的占比作為模型適應(yīng)度函數(shù)f(x),表示為:
式中,PR為總體樣本識(shí)別的正確率。
Table 1 Parameter setting of SSA algorithm表1 SSA 算法參數(shù)設(shè)置
采用SSA 優(yōu)化ELM的隱含層輸入權(quán)重和閾值,不斷迭代以找到最優(yōu)參數(shù),搭建出SSA-ELM 負(fù)荷識(shí)別模型,以各種負(fù)荷特征作為輸入,導(dǎo)入到訓(xùn)練好的模型算法中,輸出負(fù)荷識(shí)別結(jié)果。
SSA-ELM 負(fù)荷識(shí)別模型算法流程為:①采集各個(gè)電器的負(fù)荷特征數(shù)據(jù),并對(duì)其進(jìn)行歸一化處理,建立負(fù)荷特征庫(kù);②打亂負(fù)荷特征庫(kù)中所有數(shù)據(jù)的順序,隨機(jī)選擇其中70%的數(shù)據(jù)作為訓(xùn)練集,剩下30%作為測(cè)試集;③將訓(xùn)練集的負(fù)荷特征作為輸入對(duì)ELM 進(jìn)行訓(xùn)練;④通過(guò)SSA 算法對(duì)ELM 模型隱含層神經(jīng)元的輸入權(quán)重Wi和閾值bi不斷進(jìn)行尋優(yōu),提高模型性能;⑤判斷是否滿足尋優(yōu)的終止條件,將SSA 算法篩選出的參數(shù)導(dǎo)入到ELM 中以建立負(fù)荷識(shí)別模型,否則重復(fù)第④步,直至選出最優(yōu)參數(shù);⑥將測(cè)試集數(shù)據(jù)導(dǎo)入到訓(xùn)練好的SSA-ELM 負(fù)荷識(shí)別模型中,識(shí)別出各種電器負(fù)荷。具體流程如圖2 所示。
Fig.2 SSA-ELM load identification flow圖2 SSA-ELM 負(fù)荷識(shí)別流程
采用實(shí)驗(yàn)室設(shè)計(jì)的負(fù)荷監(jiān)測(cè)裝置,以1KHz的采樣頻率對(duì)6 種常用家用電器(白熾燈、電風(fēng)扇、電吹風(fēng)、熱水壺、打印機(jī)、筆記本電腦)進(jìn)行采樣,每種負(fù)荷采集100 組數(shù)據(jù),共計(jì)600 組。將這些數(shù)據(jù)各自進(jìn)行歸一化處理后分別打上1~6的負(fù)荷標(biāo)簽,隨機(jī)選擇其中500 組數(shù)據(jù)作為訓(xùn)練集,100組作為測(cè)試集。將測(cè)試集數(shù)據(jù)輸入導(dǎo)入到SSA-ELM 負(fù)荷識(shí)別模型中,得到測(cè)試集負(fù)荷識(shí)別結(jié)果的混淆矩陣如圖1所示。
Fig.3 Confusion matrix of test set圖3 測(cè)試集混淆矩陣
選擇識(shí)別準(zhǔn)確率PR 和計(jì)算耗時(shí)T 作為模型評(píng)價(jià)指標(biāo),分別表示為:
式中,PR為該樣本被識(shí)別的正確率,TP表示該樣本中被識(shí)別正確的數(shù)量,F(xiàn)P表示該樣本中被錯(cuò)誤識(shí)別的數(shù)量;T為模型運(yùn)行總耗時(shí),ttr為模型訓(xùn)練所消耗的時(shí)間,tt為模型測(cè)試所消耗的時(shí)間。
將SSA-ELM 算法與傳統(tǒng)ELM 算法和BP 神經(jīng)網(wǎng)絡(luò)算法進(jìn)行比較,得到3 種算法對(duì)各類(lèi)負(fù)荷的識(shí)別準(zhǔn)確率如表2所示。
Table 2 Comparison of load identification accuracy of each algorithm表2 各算法負(fù)荷識(shí)別準(zhǔn)確率比較 (%)
由表2 可知,SSA-ELM 非侵入式負(fù)荷識(shí)別算法對(duì)于單工作狀態(tài)電器的負(fù)荷識(shí)別準(zhǔn)確率較高,對(duì)于多工作狀態(tài)電器的負(fù)荷識(shí)別準(zhǔn)確率明顯高于傳統(tǒng)ELM 算法和BP 神經(jīng)網(wǎng)絡(luò)算法。
經(jīng)統(tǒng)計(jì),SSA-ELM 算法的執(zhí)行時(shí)間為51.7s,而ELM 算法和BP 神經(jīng)網(wǎng)絡(luò)的執(zhí)行時(shí)間分別為33.2s 和69.6s。雖然SSA-ELM 算法比傳統(tǒng)ELM 算法執(zhí)行時(shí)間略有增加,但準(zhǔn)確率明顯提升,與BP 神經(jīng)網(wǎng)絡(luò)相比執(zhí)行時(shí)間和識(shí)別準(zhǔn)確率均得到改善。
本文針對(duì)傳統(tǒng)非侵入負(fù)荷識(shí)別方法速度慢、準(zhǔn)確率低的現(xiàn)狀,提出一種基于SSA-ELM的負(fù)荷識(shí)別算法。通過(guò)對(duì)幾種常用家庭電器進(jìn)行負(fù)荷識(shí)別實(shí)驗(yàn),證實(shí)了采用SSA 算法對(duì)ELM 隱含層的輸入權(quán)重和隱含層神經(jīng)元閾值參數(shù)進(jìn)行優(yōu)化能夠避免模型陷入局部最優(yōu),提高算法識(shí)別準(zhǔn)確率,算法總耗時(shí)亦不會(huì)明顯增加,可用于家庭電器的非侵入負(fù)荷識(shí)別。然而負(fù)荷監(jiān)測(cè)裝置采集到的數(shù)據(jù)存在一定誤差,而且算法對(duì)于多工作狀態(tài)電器負(fù)荷的識(shí)別率有待提升,如何提高算法的自適應(yīng)性和多工作狀態(tài)負(fù)荷的識(shí)別準(zhǔn)確率是后續(xù)研究方向。