劉熙鵬,羅慶全,余 濤,2,藍超凡,蔡清淮,吳毓峰
(1.華南理工大學電力學院,廣東省 廣州市 510640;2.廣東省電網智能量測與先進計量企業(yè)重點實驗室,廣東省 廣州市 510640)
在“雙碳”目標驅動和新型電力系統(tǒng)建設的要求下,構建清潔低碳、安全高效的能源體系成為電網發(fā)展的主題[1]。負荷辨識技術通過對用電負荷的快速識別,能夠有效獲取用戶用電信息,據(jù)此制定針對性的家庭能量管理方案[2-3]和需求響應策略[4],提高需求側電能調度能力,改善電網潮流狀態(tài)[5]。
隨著智能量測體系的逐步完善和人工智能技術的發(fā)展,負荷辨識領域的研究也取得了長足的進展[6]。但是,現(xiàn)有方法在負荷長短期特征利用和模型可解釋性等方面仍存在不足,限制了辨識模型魯棒性、泛化性和可靠性的提升。因此,本文以上述不足為切入點,開展具有較高識別精度和泛化能力的基礎辨識模型的設計研究。
在特征提取方面,國內外研究圍繞負荷的各頻率量測數(shù)據(jù)提取了一系列負荷特征[7-8]。根據(jù)文獻[6],將負荷特征劃分為依賴于高頻量測的短期特征和依賴于中、低頻量測的長期特征。其中,長期特征按照時間尺度的不同又分為啟動特征和運行特征。啟動特征反映了負荷在投切過程中的動態(tài)特性[9],如啟動尖峰[10]、啟動時長[11]。運行特征則反映了負荷的工作模式,如體現(xiàn)運行波動性的功率差分值、功率浪涌[12],體現(xiàn)運行規(guī)律特性的占空比、峰峰值、能量分箱[13-14],以及體現(xiàn)運行時間特性的運行時長、使用時段[15]。短期特征則體現(xiàn)了負荷的電路結構特性,除有功功率、無功功率、諧波等基礎特征[16]和波形不對稱度、尖峰電流比等電流波形特征[17]外,圖像化特征成為近期研究的熱點[18-20],如遞歸圖[18]、電壓-電流(V-I)軌跡[21]。為實現(xiàn)對多種短期特征的綜合利用,也有文獻將傳統(tǒng)短期特征與V-I軌跡圖像結合,形成一系列彩色V-I軌跡特征[22-24]。
同類型電器由于實現(xiàn)電路不同,在短期特征上可能存在差異,而不同類型的電器也可能因工作模式的相似而具有相近的長期特征。因此,充分利用負荷長、短期特征間的互補作用可以提升識別效果。文獻[25]利用shapelet 提取多尺度特征,并采用線性加權實現(xiàn)特征融合;文獻[10,26-27]分別利用時序概率模型、D-S 證據(jù)理論和神經網絡融合長短期特征。但從總體上看,結合長、短期特征進行負荷辨識的研究仍然較少,且存在提取特征表征能力局限、多尺度特征融合能力不足的問題。
在模型可解釋評估方面,現(xiàn)有深度學習模型往往性能強大,卻無法對其決策過程做出有效解釋。由于缺少模型的可解釋過程,使用人員難以完全信任模型結果,也難以通過人機協(xié)同交互實現(xiàn)模型持續(xù)趨優(yōu)。因此,人在回路的混合增強智能[28-29]、代理模型[30]、互信息優(yōu)化[31]等可解釋框架和方法也在電力系統(tǒng)的各個領域得到了初步嘗試。然而,到目前為止,利用人機可解釋交互實現(xiàn)模型改進和可解釋驗證的相關研究仍相當缺乏。
近年來,在特征提取模型方面,雙塔模型在異構特征學習上初步展現(xiàn)有效性[32-33]。其通過不同分支對不同模態(tài)的輸入進行特征提取,自適應地學習特定于負荷的特征表示,如文獻[34]利用雙流神經網絡實現(xiàn)負荷時域和頻域特征圖像的融合與分類。而在特征融合模型方面,能夠自動學習和計算特征重要度的注意力機制近期在自然語言、圖像識別等領域取得了優(yōu)異效果[35-36]。但是,此類方法依賴于較多注意力層的堆疊和對大量樣本的學習,存在模型復雜度高、樣本數(shù)量需求大的問題。而度量學習是一種基于樣本間距離的空間映射方法,可以通過拉近同類型樣本特征距離、推遠不同類型樣本特征距離的方式提高模型學習效率,減少模型訓練的樣本需求量[37-38]。
因此,本文將注意力機制與度量學習訓練方法相結合,提出一種基于多尺度特征融合的負荷辨識方法,并采用梯度加權類激活圖映射(gradientweighted class activation mapping,GradCAM++)的可解釋方法進行模型調優(yōu)和效果驗證[39]。與現(xiàn)有研究工作相比,其主要貢獻如下:
1)針對當前研究存在的多尺度特征提取與融合能力不足的問題,構建負荷多尺度特征體系,設計雙塔特征提取網絡與基于自注意力和交叉注意力的特征融合網絡,實現(xiàn)特征的高效融合與泛化性能的提升。
2)針對負荷特征融合效率低的問題,采用基于度量學習的訓練方法,提升同類負荷的特征相似性與特征融合效果,并增強模型對噪聲樣本的魯棒性。
3)針對現(xiàn)有識別方法可解釋性差、特征融合效果難以驗證和改進的問題,采用GradCAM++方法量化特征重要性,并以此提出自適應的模型調優(yōu)方法。最后,基于可解釋結果證明本文模型的性能提升源于多尺度特征的充分利用。
帶有可解釋反饋環(huán)節(jié)的多尺度特征融合負荷辨識方法的主要流程如圖1 所示。
圖1 負荷辨識方法總體框架Fig.1 General framework of load identification method
1)事件檢測與增量提取。利用滑動窗雙邊有效值累積和(cumulative sum,CUSUM)的方法對總功率數(shù)據(jù)進行負荷投切事件檢測。當檢測到出現(xiàn)事件時,通過增量提取獲取對應負荷的高低頻電氣數(shù)據(jù)。
2)多尺度負荷特征生成。對采集到的負荷高頻波形構建三通道彩色V-I軌跡圖,對負荷低頻數(shù)據(jù)計算相應的啟動特征和運行特征。
3)深層特征提取。利用生成的彩色V-I軌跡圖和長期特征構建負荷數(shù)據(jù)集,將數(shù)據(jù)集樣本按比例劃分為訓練集、驗證集和測試集后,采用度量學習的方式對雙塔神經網絡進行訓練,得到自適應提取的深層特征。
4)特征融合與負荷分類。利用自注意力和交叉注意力機制對輸出的深層特征進行融合,由全連接層實現(xiàn)負荷類別映射。
5)特征增強、模型尋優(yōu)與效果驗證。對識別結果進行可解釋分析,將分析結果結合專家先驗知識指導特征增強和模型優(yōu)化,并對模型的特征利用和融合效果進行驗證,實現(xiàn)人機可解釋交互的閉環(huán)。
為提取目標負荷的用電特征,進而實現(xiàn)負荷類型辨識,首先,需要利用事件檢測方法定位投切事件,并采用增量提取技術分離出目標負荷的用電信息。
本文采取滑動窗雙邊有效值CUSUM 算法[40]進行事件檢測,通過累計信號序列的偏移值,以閾值觸發(fā)的形式確定負荷運行狀態(tài)改變的時刻。
為準確捕捉間續(xù)工作負荷的運行時段,同時忽略投入時間過短和功率過小的負荷,本文還增加了兩個事件發(fā)生的閾值判斷條件:
式中:td為負荷的投切狀態(tài)持續(xù)時間;tthr為負荷狀態(tài)持續(xù)時間的閾值,可依據(jù)負荷辨識下游任務的特點靈活設置;Pdiff為事件前后穩(wěn)態(tài)功率的差值;Pthr為投切事件判定的功率差閾值。Pthr和tthr值可結合負荷辨識目標的功率水平和波動情況靈活設置。為兼顧不同功率范圍和運行時長的電器,本文實驗將tthr值設置為1 min,Pthr值設置為5 W。
對于負荷高頻信息而言,負荷電壓波形等于總線的電壓波形,負荷電流波形可利用如下增量提取的方式獲得:
1)基于電壓過零點對齊電流各周期的相位,提取事件前、后各一個周期內的第t個采樣點時刻電流Ia(t)和Ib(t);
2)事件對應的負荷電流I(t)可以近似為事件后與事件前的電流差值,即I(t)=|Ib(t)-Ia(t)|。
對于負荷低頻信息而言,依據(jù)功率可加性原理可實現(xiàn)負荷有功功率和無功功率的提取。為避免電壓波動的影響,根據(jù)基準電壓Vref對功率進行標準化處理,得到負荷有功、無功功率的提取公式如下:
式中:P(t)和Q(t)分別為分離出的負荷有功功率和無功功率;Pa(t)、分別為投切事件前第t個采樣點時刻的有功功率、電壓有效值、電流有效值;Pb(t)、分別為投切事件后第t個采樣點時刻的有功功率、電壓有效值、電流有效值。
2.3.1 基于波形的短期特征生成
相較于電流波形、電流諧波、穩(wěn)態(tài)功率等負荷特征,V-I軌跡曲線更好地反映了負荷電壓、電流及其之間的變化趨勢。針對V-I軌跡無法體現(xiàn)負荷功率信息的問題,采用彩色編碼方法,在紅綠藍(RGB)三通道中分別融合按波形幅值歸一化的瞬時功率、按負荷水平歸一化的瞬時功率和電壓與電流變化率的比值,構建彩色V-I軌跡。其主要流程如下。
1)假設V-I軌跡圖的分辨率為f×f,則對各負荷電壓、電流波形數(shù)值轉換到0~f范圍后,以電流值為行、電壓值為列,對V-I軌跡圖各通道的相應位置進行填充,本文實驗部分V-I軌跡圖的分辨率設置為32。負荷電壓、電流的轉換公式為:
2)R 通道的填充值是按波形幅值歸一化的瞬時功率,反映了一個周期內功率的變化趨勢。具體計算公式如下:
式中:R(?)為R 通道矩陣第行列位置的值,其中,和?分別為轉換后第g個采樣點的電壓、電流值;Pg為第g個采樣點的瞬時功率;和分別為一個周期內瞬時功率的最大值、最小值。
G 通道的填充值是按負荷水平歸一化的瞬時功率,反映了某負荷在數(shù)據(jù)集中所處的功率水平。具體計算公式與式(6)一致。不同的是,式中和分別為各訓練樣本在該波形采樣點上瞬時功率的最大值、最小值。
B 通道的填充值是電壓與電流變化率的比值,反映了一個周期內電壓、電流的變化趨勢。具體計算公式如下:
3)將RGB 三通道矩陣組合后,即完成對負荷彩色V-I軌跡特征的構建。
附錄A 圖A1 展示了熱水壺等4 類負荷常用品牌生成的彩色V-I軌跡特征??梢钥闯?,各類型電器在曲線軌跡和顏色上具有明顯區(qū)別。熱水壺的電流波形屬于典型正弦波,其V-I軌跡呈直線形態(tài);電吹風屬于半波工作電器,其V-I軌跡呈“?”字型,且在工作部分具有更鮮艷的顏色;充電器、電腦屬于電力電子型負荷,電流波形含有大量諧波,其軌跡也具有更為復雜的形態(tài)。
2.3.2 基于功率的長期特征生成
負荷的長期特征包括啟動特征和運行特征。參考文獻[10-11],提取的啟動特征指標包括:1)啟動尖峰PT-spike,即負荷啟動過程中有功功率的最大值;2)啟動時間Tstart,即負荷從啟動到穩(wěn)定運行過程所用的時間。
參考文獻[12-14,41],提取的運行特征指標包括:
1)有功功率(最大值Pmax、最小值Pmin、平均值Pmean、方差Pvar):負荷運行過程的有功功率特性。
2)無功功率(最大值Qmax、最小值Qmin、平均值Qmean、方差Qvar):負荷運行過程的無功功率特性。
3)功率因數(shù)(最大值φmax、最小值φmin、平均值φmean、方差φvar):負荷運行過程的功率因數(shù)特性。其中,負荷穩(wěn)態(tài)運行功率因數(shù)曲線φ(t)可由負荷穩(wěn)態(tài)有功功率P(t)和穩(wěn)態(tài)無功功率Q(t)計算,如式(8)所示。
4)工作時長Twork:負荷一個工作周期的時長。
5)占空比D:負荷處于運行狀態(tài)的時間Ton與負荷工作時長Twork的比值,如式(9)所示。
式中:n為小波分解層數(shù);為負荷第n層小波細節(jié)系數(shù);L為負荷第n層細節(jié)系數(shù)的長度。
8)功率尖峰數(shù)量Nspike:負荷在運行過程中功率波動大于閾值的次數(shù),如式(11)所示。
式中:ks為波動閾值參數(shù),本文設置為10;δ(·)為指示函數(shù),當括號內的值大于0 時取值為1,否則取值為0。
以訓練效果最優(yōu)和降低特征冗余為原則,在計算小波系數(shù)指標過程中,本文選擇db3 小波作為小波基函數(shù),小波分解的層數(shù)設置為1 層。綜上,本文共提取出25 個長期特征指標用于負荷的識別。
基于多尺度特征融合的負荷辨識模型結構如圖2 所示。圖中:括號內部分表示網絡結構參數(shù),其中卷積層括號內表示(卷積核尺寸,滑動步長,輸出通道數(shù)),池化層括號內表示(池化核尺寸,滑動步長)全連接層括號內表示(輸入維度數(shù),輸出維度數(shù));“⊕”表示特征的橫向拼接操作。本文負荷辨識模型主要由深層特征提取網絡和特征融合與分類網絡兩部分組成。特征提取網絡采用雙塔結構進行深層特征提取,并使用度量損失函數(shù)進行訓練。特征融合與分類網絡采取自注意力與交叉注意力分別在相似樣本之間和多尺度特征之間進行融合,深度挖掘同類負荷的相似性與長短期特征的互補特性。最后,由全連接分類網絡實現(xiàn)負荷類型的映射。
圖2 基于多尺度特征融合的負荷辨識模型Fig.2 Load identification model based on multi-scale feature fusion
考慮到負荷V-I軌跡特征為二維稀疏特征,而長期特征為手工提取的一維指標型特征,二者維度和表征能力各不相同。因此,本文采用雙塔結構的卷積神經網絡(convolutional neural network,CNN)作為特征提取網絡,以保證后續(xù)特征融合和分類的有效性。負荷長、短期特征分別通過二維CNN(2DCNN)和一維CNN(1D-CNN)進行深層特征提取和加工,各分支網絡均是以“卷積層-批歸一化層-激活層-池化層”堆疊后與全連接層相連的形式構成。
本文基于注意力機制[42],設置“自注意力層-交叉注意力層-自注意力層”結構的特征融合網絡。第1 個自注意力層和交叉注意力層采用批注意力的形式在樣本層面實現(xiàn)融合[43],第2 個自注意力層在特征空間層面實現(xiàn)融合。
在第1 個自注意力層中,以樣本高頻特征為例,設Xh∈RN×m1為上一層網絡輸出樣本的高頻特征矩陣,Att(Q,K,V)為本文注意力層網絡函數(shù),其中,N為樣本數(shù)量,m1為高頻特征長度,Q、K、V分別為輸入注意力網絡層的查詢矩陣、鍵矩陣和值矩陣,則第1 個注意力層的融合方式為:
在同類型樣本中,表現(xiàn)負荷信息的特征部分一般具有相似性,而由噪聲產生的特征部分具有差異性,利用自注意力機制可以使模型更關注同類型樣本之間的共有特征,降低噪聲對識別結果的干擾。
在交叉注意力層中,設Xs∈RN×m2為上一層網絡輸出樣本的低頻特征矩陣,其中,m2為低頻特征長度。以樣本高頻特征為例,可以將交叉注意力的融合方式寫為:
當同類型樣本間因型號或噪聲導致某一尺度特征產生較大差異時,交叉注意力層可以根據(jù)樣本在另一尺度特征上的相似性融合同類樣本,有效提高模型對含噪聲樣本和新樣本的識別能力。
第2 個自注意力層的輸入為長、短期特征拼接構成的總體特征,對每個樣本的總體特征進行自注意力融合,其作用是強化更具有負荷類型表達能力的特征、消除冗余特征、提高分類層的分類效果。以輸入樣本i為例,設∈Rm×1為樣本i經過維度擴充處理的輸入特征向量,則樣本i經過第2 個自注意層的輸出向量可以表示為:
本文注意力層內部結構如圖3 所示。圖中:“?”表示矩陣轉置;“?”表示矩陣乘法;“⊕”表示矩陣加法;“Scale”為尺度化操作,表示將輸入的矩陣元素除以K矩陣特征長度的0.5 次方。考慮到同類型負荷樣本特征之間可能存在多種隱含的相似關系,需要模型能夠捕捉不同角度的負荷特征信息。因此,自注意力層與交叉注意力層均采用多頭注意力形式,注意力頭數(shù)為4。計算各注意力頭的均值得到與輸入維度相同的輸出。同時,為避免特征融合可能導致的負荷特征平滑化的情況,各注意力層都加入了殘差連接機制。
圖3 注意力層內部結構Fig.3 Internal structure of attention layer
本文的特征融合與分類網絡可采用分類損失函數(shù)進行訓練,本文的分類損失函數(shù)L1采用交叉熵損失函數(shù):
式中:Nc為樣本類別數(shù)量;lic為0-1 變量,如果樣本i的真實類別與類別c相同則取1,否則為0;pic為樣本i預測為類別c的概率。
特征提取網絡有兩個任務:1)獲得對負荷本體進行充分表征的深層特征;2)將同類型負荷的深層特征映射到盡可能相近的特征空間,以提高后續(xù)負荷融合的準確性。對于第1 個任務,在獲得特征提取網絡輸出的高頻、低頻深層特征后,分別連接一個全連接層,并采用交叉熵損失函數(shù)L2和L3作為高頻和低頻部分的損失函數(shù)。對于第2 個任務,則依據(jù)度量學習的思路實現(xiàn)。度量學習依次選取數(shù)據(jù)集中樣本作為錨樣本,從與錨樣本標簽相同的數(shù)據(jù)中選取正樣本,從與錨樣本標簽不同的數(shù)據(jù)中選取負樣本,通過度量錨樣本與正、負樣本間的距離拉近同類型樣本特征。
本文選取度量損失函數(shù)作為度量損失函數(shù),其通過距離加權采樣的方式[44],依據(jù)輸入樣本數(shù)據(jù)的分布均勻抽取負樣本并計算損失,能夠以低計算量有效挖掘利于訓練的負樣本,同時減少樣本噪聲數(shù)據(jù)的干擾。對于批量中的每個樣本,在采樣得到正、負樣本后,即可計算度量損失Lmargin:
式中:H為錨樣本i的正負樣本數(shù)量;β(i)為針對樣本i的可訓練邊界參數(shù);v為β(i)的正則化超參數(shù);lmargin(i,j)為錨樣本i與樣本j之間的距離度量函數(shù);α為控制樣本分離邊際的變量;yij為符號函數(shù),當樣本i與樣本j類別一致則為1,否則為-1;Dij為樣本i與樣本j特征之間的歐氏距離;(·)+為斜坡函數(shù),當函數(shù)輸入值小于0 時,輸出值為0,否則函數(shù)輸出值與輸入值相同。
相較于傳統(tǒng)的對比損失,度量損失函數(shù)在正負樣本距離的約束上更加寬松,使它能夠在樣本分布不同的負荷數(shù)據(jù)集中起到良好的訓練效果,而相較于三元組損失,它的損失計算更為簡單,能夠以更高的計算效率達到度量的目的。
按照此方式,在特征提取網絡的兩個分支上分別加上度量損失函數(shù)L4和L5。由此,負荷辨識模型的總體損失函數(shù)Ltotal由以上5 個損失函數(shù)加權得到:
式中:wk為第k個損失函數(shù)的權重。
考慮到當前損失函數(shù)較多,各損失函數(shù)的訓練難度不同,利用手工調整權重的方法需要大量時間,且不能保證效果。 因此,本文采用automatic weighted loss 的方式[45],依據(jù)各損失函數(shù)的方差不確定性為損失函數(shù)自動設置權重:
式中:σk為Lk衡量方差不確定性的參數(shù),是一個可學習的變量,損失函數(shù)后半部分的常數(shù)項為正則化項,以避免σk過大。
針對模型缺少可解釋依據(jù)、模型效果難以驗證和改進的問題,本文利用GradCAM++方法進行解釋性分析,可視化模型的識別依據(jù),同時實現(xiàn)輸入特征增強和模型優(yōu)化。
GradCAM++是一種針對神經網絡的可解釋分析方法,它能夠根據(jù)分類的目標輸出相對于任一層網絡輸出特征的梯度計算權重,將模型的分類結果歸因于輸入特征的加權和,以此確定不同特征對于輸出類別的貢獻程度。
針對提取的多尺度特征中可能存在冗余特征和無關特征的問題,利用GradCAM++計算結果對重要特征進行增強。具體方式為:利用專家的先驗知識構建初始特征權重矩陣,與每次訓練利用可解釋方法生成的特征重要度矩陣加權平均得到總特征權重矩陣;再將權重矩陣與各負荷樣本的特征按元素相乘,即根據(jù)模型解釋結果對特征加權,得到更利于模型識別的增強特征。隨著訓練的進行,初始矩陣的權重不斷衰減,模型生成的可解釋矩陣權重增加,逐步形成輸入特征自優(yōu)化的過程。第e次訓練所用的權重矩陣Me的表達式為:
式中:J為元素值全為1 的矩陣;w為特征增強程度;γ為權重衰減因子;M0為初始權重矩陣;為第e-1 次訓練生成的特征重要度矩陣,是訓練集樣本特征重要度矩陣的平均值。
針對模型訓練過程缺乏人機可解釋交互,導致識別結果可解釋性較差的問題,將模型可解釋結果與先驗知識的契合度也作為模型結構調整和超參數(shù)調優(yōu)的目標。具體方式為:從驗證集的各類型負荷中隨機抽取等量樣本,采用專家驗證的方法判斷其特征重要度結果是否與先驗知識相吻合,將符合先驗知識的樣本數(shù)量與驗證樣本數(shù)量的比值作為可解釋率,以可解釋率與驗證集準確率的均值作為評價指標進行模型調優(yōu)。
采用批量訓練方式,將訓練樣本分成若干批次輸入模型進行訓練,同時各批次采用均衡采樣的方法,使每批具有相同數(shù)量的各類型負荷。根據(jù)本文負荷融合策略,模型在訓練過程中需要選擇較大樣本批量,本文實驗部分所用樣本批量大小為128。選擇RMSProp 優(yōu)化器利用梯度下降優(yōu)化模型參數(shù),若模型在驗證集中的損失連續(xù)10 個回合不再下降,則結束訓練。
在模型測試階段,由于注意力模塊在特征融合時考慮了樣本間的相似關系,為提高模型在樣本層面的融合效果,從訓練集中選取典型樣本與測試集樣本一同輸入模型,輔助模型對測試樣本的識別。典型樣本為基于密度的有噪空間聚類(densitybased spatial clustering of applications with noise,DBSCAN)算法,根據(jù)訓練集中的樣本電流波形數(shù)據(jù)和長期特征得到聚類中心。
在實驗階段,基于Python 語言開發(fā)本文模型,采用PyTorch1.8.1 深度學習框架實現(xiàn),在一臺配有4 張GeForce RTX 2080 Ti 顯卡的服務器上進行實驗,并使用圖形處理器(GPU)進行加速。
為量化評價與驗證本文方法相較于其他負荷識別方法的性能和效果,采用識別準確率Pacc和F1分數(shù)作為實驗性能的主要評估指標。各評估指標的具體計算公式如下:
式中:TP為正確識別的正類數(shù)量;TN為正確識別的負類數(shù)量;FP為錯誤識別的負類數(shù)量;FN為錯誤識別的正類數(shù)量;Precall為識別正確的正類比例;Pprecision為實際正類占所有識別為正類的樣本比例。Pacc和F1分數(shù)取值范圍為0~1,且值越大表明識別效果越好。
針對多尺度的數(shù)據(jù)采樣需求,本文選擇Blond公開數(shù)據(jù)集[46]和自采數(shù)據(jù)集相結合的方式形成實驗數(shù)據(jù)集1,以Blued 公開數(shù)據(jù)集作為實驗數(shù)據(jù)集2,對本文所提模型進行訓練和測試。Blond 數(shù)據(jù)集以50 kHz 和250 kHz 的采樣頻率對某辦公環(huán)境中的16 種電器53 個品牌的電壓、電流分別進行213 d和50 d 的連續(xù)測量。自采數(shù)據(jù)集以20 kHz 和1 Hz的采樣頻率,分別對電風扇、熱水壺等4 種電器18 種常用品牌的電壓、電流進行10 min 的連續(xù)測量。Blued 數(shù)據(jù)集[47]以12 kHz 的電壓、電流采樣頻率和60 Hz 的功率采樣頻率對美國某家庭A 相和B 相電路中的電燈、冰箱等10 種電器進行了一周的測量。
考慮到數(shù)據(jù)集情況和實際數(shù)據(jù)需求,實驗數(shù)據(jù)集1 選取Blond 數(shù)據(jù)集2016 年10 月至2017 年3 月的數(shù)據(jù)與自采數(shù)據(jù)集結合,選取顯示屏、熱水壺、手機充電器、筆記本電腦、臺式電腦、電燈、電吹風、電風扇8 種常用電器共37 個品牌、53 種型號作為實驗對象,并通過下采樣將高頻采樣頻率統(tǒng)一為6.4 kHz,低頻采樣頻率統(tǒng)一為1 Hz。實驗所用各電器品牌型號信息見附錄A 表A1。由于Blued 數(shù)據(jù)集中B 相事件標簽存在缺失,實驗數(shù)據(jù)集2 選取Blued 數(shù)據(jù)集中A 相的冰箱、電吹風、空氣壓縮機、電燈和廚房輔助刀5 種電器作為識別對象,其高、低頻頻率保持為12 kHz 和60 Hz 不變。
按照2.1 節(jié)與2.2 節(jié)所述方法,從實驗數(shù)據(jù)集1中檢測出2 732 條負荷投切事件,與手工標注的真實事件位置對比,事件檢測F1值為0.887;從實驗數(shù)據(jù)集2 中檢測出957 條負荷投切事件,事件檢測F1值為0.972,滿足實際應用要求。
為平衡數(shù)據(jù)集中各型號樣本數(shù)量,通過滑動窗過采樣方法,依據(jù)事件從實驗數(shù)據(jù)集1 中提取5 653 條負荷樣本數(shù)據(jù),從實驗數(shù)據(jù)集2 中提取1 830 條負荷數(shù)據(jù),擴充后數(shù)據(jù)集1 情況如表1所示。
表1 實驗數(shù)據(jù)集樣本情況Table 1 Sample situation of experimental data set
然后,按照2.3.1 節(jié)和2.3.2 節(jié)方法生成負荷的高頻和長期特征。對負荷長期特征進行正規(guī)標準化處理,表達式為:
式中:xi和分別為處理前、后第i個樣本的低頻負荷特征;μ和σ分別為所有負荷中該特征的平均值和標準差。
最后,根據(jù)處理后所有負荷的長、短期特征構建負荷特征數(shù)據(jù)集,用于后續(xù)的模型訓練與驗證。
針對本文負荷辨識方法的特點,分別從長期特征識別、短期特征識別和特征融合識別的角度,選擇基于功率曲線特征的Bagging[14]、基于電流波形的自適應加權遞歸圖(adaptive weighted recurrence graph,AWRG)[18]、V-I軌跡特征與功率特征融合的LeNet-5 網絡[27]等現(xiàn)階段先進識別方法作為對比組。此外,本文基于長短期特征結合進行識別的思路,還設計了電流波形與長期特征直接拼接識別的反向傳播(back propagation,BP)網絡、電流波形與長期特征后融合的雙塔1D-CNN 兩種常規(guī)方法加入對比組,驗證本文方法的有效性。
為避免實驗結果的偶然性,本文按照3∶1∶1 的比例將實驗數(shù)據(jù)劃分為訓練集、驗證集和測試集,并以10 次隨機抽樣驗證求均值的方法,計算各方法的識別準確率。在實驗數(shù)據(jù)集1 和實驗數(shù)據(jù)集2 上的識別結果如表2 所示,各類型負荷辨識具體情況如附錄B 表B1 和表B2 所示。依據(jù)識別結果,多尺度特征識別方法比當前單一尺度特征識別的先進方法具有更優(yōu)的識別性能,證明多尺度特征比單尺度特征具有更好的分類能力。而與其他特征融合模型相比,本文模型在幾乎所有負荷類型的識別中都取得了更高的識別準確率,證明本文模型能夠更好地利用多尺度特征實現(xiàn)負荷的分類。
表2 識別準確率的實驗結果Table 2 Experiment results of identification accuracy
以某筆記本電腦樣本為例,利用GradCAM++方法,展示了本文模型對長短期特征的利用程度,并以此對模型特征提取、特征融合網絡的效果進行驗證與評價。圖4(a)熱力圖中,色塊的顏色鮮艷程度反映了該區(qū)域的特征重要程度,顏色越鮮艷的區(qū)域,表明對模型識別為筆記本電腦的貢獻程度越高。由圖4 可見,在短期特征中,本文模型既能夠實現(xiàn)對V-I軌跡曲線的完整捕捉,也能著重關注到與其他類型負荷V-I軌跡的差異部分;在長期特征中,本文模型的識別一方面關注無功功率、功率因數(shù)等充分反映電力電子型負荷特點的特征指標,另一方面也關注有功功率方差、小波系數(shù)、尖峰數(shù)量等反映筆記本電腦與其他電子型負荷運行波動特性差異的特征指標。實驗結果和模型解釋性分析結果表明,本文提出的特征提取和融合網絡對于負荷樣本的短期特征和長期特征都能實現(xiàn)充分利用和挖掘,有效保證了模型的識別性能。
圖4 筆記本電腦樣本特征重要度可視化Fig.4 Feature importance visualization of laptop sample
4.4.1 品牌泛化實驗
泛化性問題一直是負荷辨識領域亟待解決的重要問題,而負荷的跨品牌識別效果又是檢驗辨識模型泛化性能的重要標準??缙放谱R別是指辨識模型在特定品牌的樣本數(shù)據(jù)上完成訓練后,在另一批新品牌的負荷樣本中驗證識別效果。同類型不同品牌的電器由于實現(xiàn)方式的不同,在外特性方面往往具有較大差異;而同品牌生產的功能相近的不同電器,也可能由于工作原理相近,而在負荷特性上呈現(xiàn)出較高的相似性。因此,跨品牌的負荷辨識目前仍存在較大的難度。本文利用不同電器的多種品牌開展泛化性對比實驗。具體實驗方法為:從每類負荷中分別隨機提取一種品牌型號的負荷樣本構成測試集,其余品牌型號樣本作為訓練集和驗證集,訓練集、驗證集劃分比例為4∶1;將以上過程重復10 次,形成10 個不同的實驗數(shù)據(jù)集并依次輸入識別網絡進行訓練和測試;取10 次實驗結果的平均值作為各方法的最終結果??紤]到在實際工程應用中,模型對于未知電器的識別效果應保持穩(wěn)定,增加了測試集方差作為模型穩(wěn)定性的評價指標。模型在測試集上的方差越小,說明模型的穩(wěn)定性越好。由于Blued 數(shù)據(jù)集中各類型負荷基本只有一種型號,不具備泛化性測試條件。因此,只選取數(shù)據(jù)集1 進行實驗,最終得到品牌泛化實驗結果如圖5 所示。
圖5 品牌泛化實驗結果Fig.5 Results of brand generalization experiment
由實驗結果可見,多尺度特征相較于單一尺度特征,泛化識別能力得到了進一步提高。相較于文獻[14]的長期特征識別方法和文獻[27]的短期特征識別方法,本文模型泛化準確率分別提高了9%和13%。而與其他使用了多尺度特征的辨識模型相比,在保持更高的泛化準確率的同時,還具有更低的測試集方差,證明本文提出的特征處理與融合方法在充分利用多尺度特征的互補作用實現(xiàn)負荷辨識的同時,有效地降低了模型的過擬合程度,使得模型在面對未知負荷時也能具有穩(wěn)定的識別效果??缙放品夯瘜嶒灥木唧w分析見附錄C。
4.4.2 用戶泛化實驗
在實際場景中,不同用戶所使用的負荷類型之間往往存在較大區(qū)別,訓練辨識模型所使用的負荷數(shù)據(jù)也可能與實際需要辨識的負荷類型之間存在出入。因此,模型將原有負荷類型的分類性能快速遷移到新類型負荷辨識中的能力,也是模型泛化性能的重要體現(xiàn)。本文參考文獻[48-49],采用小樣本遷移學習的方式開展用戶泛化實驗。具體實驗方式為:利用實驗數(shù)據(jù)集1 中顯示屏、充電器等8 種負荷數(shù)據(jù)對本文模型進行訓練;模型訓練完成后,凍結其中的深層特征提取網絡參數(shù),并從實驗數(shù)據(jù)集2 中冰箱、廚房輔助刀等5 種負荷中隨機抽取少量樣本構成小樣本訓練集,對模型的特征融合與分類網絡參數(shù)進行訓練微調;數(shù)據(jù)集2 中的其余樣本作為測試集,用以驗證微調后模型對新負荷類型的識別效果。本文設置小樣本訓練集中每類負荷樣本抽取個數(shù)分別為5 和10,重復有放回抽取過程10 次,形成10 個不同的數(shù)據(jù)集進行實驗。取10 次實驗結果的平均值作為最終結果,得到用戶泛化對比實驗結果如表3 所示。
表3 用戶泛化性實驗結果Table 3 Results of user generalization experiment
由表3 可見,本文模型相較于其他神經網絡模型普遍具有更高的用戶泛化準確率,能夠基于小樣本數(shù)據(jù)實現(xiàn)負荷辨識能力的快速遷移,具有良好的用戶適應性。同時,本文在用戶泛化上的表現(xiàn)雖然略低于AWRG 模型,但相較于AWRG 模型66 萬個的參數(shù)量和255 萬個單次浮點運算量(floating-point operations,F(xiàn)LOPs),本文的參數(shù)量和單次FLOPs分別僅有14 萬個和227 萬個,具有輕量化、易部署的實用性優(yōu)勢。
為充分驗證本文利用可解釋結果進行特征增強的策略和結合度量學習與注意力機制設計的負荷特征融合網絡在噪聲樣本識別和跨品牌泛化識別中的作用,采取控制變量的思想,設計對照實驗驗證各模塊實驗結果的改進性能。本文按照表4 設置實驗組和對照組,以4.3 節(jié)和4.4 節(jié)所述方法分別開展準確率實驗和泛化性實驗。
表4 消融實驗實驗組、對照組設置Table 4 Setting of experimental group and control group for ablation experiment
在準確率實驗中,為測試本文方法面對噪聲樣本時的識別效果,對測試集樣本的高頻和低頻信號隨機進行以下任一種處理:1)高頻信號加入均值為0、方差為0.1 的高斯噪聲,低頻信號加入均值為0、方差為1 的高斯噪聲,模擬采樣噪聲;2)以不超過樣本原始電氣信號1/2 的數(shù)值疊加其他類型樣本的電氣信號模擬電器干擾時的基底噪聲;3)對樣本隨機加入-10%~10%的抖動模擬電網電壓波動;4)不進行加噪處理。
識別準確率實驗和泛化性實驗結果如圖6 所示。從實驗結果可以看出,本文利用可解釋結果進行特征增強的策略有效強化了利于識別的重要特征,降低了無關特征對識別的影響,提高了模型的識別性能。而特征融合網絡相較于常見的特征拼接方法,也能更好地挖掘和利用多尺度特征,使模型在面對噪聲樣本和跨品牌樣本時具有更高的識別準確率和泛化性能。
圖6 消融實驗結果Fig.6 Results of ablation experiment
以DELL P2210 型號的顯示器樣本為例,該樣本在本文模型中準確識別為顯示器,而在對照組4的模型中卻被識別為USB 充電器。 利用GradCAM++方法將樣本的短期特征重要性可視化,其結果如圖7 所示。由圖7 可見,本文所提負荷融合網絡能夠使模型準確捕捉到同類型負荷整體特征中的相似部分,避免了對照組4 中模型片面關注局部特征的問題,在面對噪聲樣本或新樣本時不會因局部特征的改變而過度影響識別的結果,模型具有更高的魯棒性和泛化性。
圖7 模型對樣本V-I 軌跡特征的利用情況對比Fig.7 Comparison of model utilization of sample V-I trajectory features
使用度量學習訓練可以明顯提升識別性能,其原因是模型訓練中引入度量損失函數(shù)后,特征提取網絡會聚集同類型負荷的樣本特征,同時推遠異類負荷,這也使得注意力層能夠基于特征相似度快速融合更多同類型樣本的信息,提高模型識別的精度。附錄B 圖B1 分別展示了是否使用度量學習訓練的負荷深層特征經主成分分析降維后的二維可視化結果。由圖B1 可見,使用度量學習訓練的特征提取網絡輸出的各類負荷特征分布出現(xiàn)了明顯的界限。
本文針對現(xiàn)有負荷辨識模型魯棒性、泛化性和解釋性不足的問題,提出一種基于多尺度特征融合的負荷辨識及其可解釋交互增強方法。首先,該方法由負荷高頻數(shù)據(jù)生成彩色V-I軌跡特征,由中、低頻數(shù)據(jù)提取負荷啟動特征和運行特征,構建多尺度負荷特征體系。利用由自注意力和交叉注意力模塊組成的特征融合網絡深度挖掘多尺度特征的互補作用,進一步提高模型的泛化性能。然后,采用度量學習的訓練方法,在提高特征融合效率的同時,拉近同類樣本的特征距離,增強模型魯棒性。最后,采用GradCAM++方法對模型識別依據(jù)進行解釋性分析、特征增強和模型調優(yōu),可視化展示和驗證了所提方法的效果。實驗和解釋性分析結果表明,相較于現(xiàn)有先進人工智能識別算法,本文方法具有更高的識別準確率、更強的泛化性能和可解釋交互增強能力。
盡管如此,本文在模型持續(xù)自優(yōu)化更新、低成本邊端部署等方面仍存在不足。后續(xù)研究工作主要包括:1)深入構建多尺度、多類型、多品牌、多場景的負荷數(shù)據(jù)集,進一步驗證、改進所提方法的識別性能;2)研究在嵌入式芯片上最小化性能損失且適應模型的部署優(yōu)化方法,并結合硬件設備進行工程驗證;3)研究基于新場景數(shù)據(jù)更新模型參數(shù)的泛化性提升方法[50-51]。
附錄見本刊網絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網絡全文。