王 毅 ,徐元源 ,李松濃
(1.重慶郵電大學 通信與信息工程學院,重慶 400065;2.國網(wǎng)重慶市電力公司電力科學研究院,重慶 404100)
智能電網(wǎng)建設是以提高生態(tài)可持續(xù)性、供電安全性和經(jīng)濟競爭力為目標[1],表現(xiàn)為提高負荷監(jiān)測技術(shù)、提高終端用戶響應速度、提高需求側(cè)的節(jié)約能效、提供智能控制技術(shù)、分布式能源的自由接入[2]。非侵入式負荷識別作為非侵入式負荷監(jiān)測的核心內(nèi)容,在不改變用戶電路結(jié)構(gòu)的條件下,通過測量總負荷數(shù)據(jù),即可獲得系統(tǒng)內(nèi)具體用電負荷的數(shù)量、類別、運行狀態(tài)信息,安裝和維護成本低,易于推廣。該技術(shù)的實現(xiàn),可為用戶、電力公司以及設備提供參考[3]。用戶端,用戶用電信息得到反饋,提升節(jié)能意識,規(guī)范用電行為。電力公司端,能提高負荷預測的精確度,實現(xiàn)有效的負荷規(guī)劃、電能調(diào)度。對設備制造商來說,可據(jù)此識別出故障或低效設備,加快技術(shù)革新,推動高能效設備研發(fā)。
目前,非侵入式負荷識別技術(shù)在國內(nèi)外均有研究。文獻[4]利用穩(wěn)態(tài)功率信息建立隱馬爾科夫模型優(yōu)化分解方法,對低頻混合功率分解得到單個設備運行狀態(tài),但識別率不高,不能識別負荷投切時刻。文獻[5]利用動態(tài)時間歸整(Dynamic Time Warping,DTW)算法計算實測電流穩(wěn)態(tài)波形和樣本庫穩(wěn)態(tài)波形的相似度來識別家用負荷,但無法識別變頻設備和且小功率設備容易誤識。文獻[6]提取負荷穩(wěn)態(tài)電流諧波并結(jié)合K-近鄰(K-Nearest Neighbor,K-NN)算法進行負荷識別,為提高識別效果融入了核Fisher 判別方法,綜合了K-NN 的簡捷性和核Fisher 的非線性識別能力,但諧波信息易受外界環(huán)境影響,且小功率設備諧波易被大功率設備湮沒。文獻[7]中提取負荷暫態(tài)電流波形特征后,根據(jù)分類與回歸樹(Classification and Regression Trees,CART)算法訓練決策樹算法進行負荷識別,但決策樹結(jié)果不穩(wěn)定,類別太多錯誤率增加會加快。文獻[8]以負荷開關時的獨特暫態(tài)功率波形為特征,計算測試暫態(tài)功率波形與樣本庫波形貼近度實現(xiàn)負荷識別。另外,神經(jīng)網(wǎng)絡[9-10]也是常用的負荷識別方法,但該類方法需要大量的訓練樣本,訓練參數(shù)多,可解釋性差,使用受到限制。由于穩(wěn)態(tài)類方法對軟硬件要求相對較低,目前大多非侵入式負荷識別方法仍然是基于穩(wěn)態(tài)的,但該類方法難以有效識別變頻設備等持續(xù)變化負荷,同時,小功率設備容易被大功率設備湮沒,易受外界環(huán)境干擾。此外,無論是穩(wěn)態(tài)類還是暫態(tài)類方法,大多研究僅對特征差異明顯的設備識別效果好,一旦特征發(fā)生重疊便難以有效識別。
綜上,文中對不同負荷投切時產(chǎn)生的暫態(tài)電流波形并提取合適的特征量進行負荷識別,為避免設備特征重疊造成負荷無法辨識的問題,提出DAG-SVMS 負荷識別模型。為提高分類器識別準確率,采用PSO 算法優(yōu)化分類器參數(shù),同時,提出基于Gini 指數(shù)優(yōu)化模型節(jié)點順序的策略,以減少模型累積誤差。最后,采用公開數(shù)據(jù)集BLUED 進行試驗驗證,結(jié)果表明提出的方法識別準確率高,識別速度快,具有可行性。
將電力系統(tǒng)由一個穩(wěn)定運行狀態(tài)過渡到另一個穩(wěn)定狀態(tài)的過程定義為暫態(tài)事件[11]。不同的用電負荷投入、切除以及運行狀態(tài)發(fā)生改變時,都會伴隨暫態(tài)事件的發(fā)生。文中使用相鄰周期電流強度變化量來檢測負荷暫態(tài)事件,定義第T 個周期的負荷的電流強度為:
式中,K 為一個周期內(nèi)電流的采樣點總數(shù);i(k)為第T 個周期內(nèi)第k 個采樣點的電流值。
當電力系統(tǒng)內(nèi)部各用電負荷穩(wěn)定運行時,總線處相鄰周期的電流強度差值趨近于0;若某一時刻相鄰周期電流強度差值超過δ,則判定系統(tǒng)內(nèi)負荷發(fā)生了暫態(tài)事件,記相鄰周期中第二個周期電流起始時刻為暫態(tài)事件起始時刻。表示為:
式中,ΔIintensity為第T 個周期與T+1 個周期電流強度的差值;δ 為暫態(tài)事件起始判定閾值。
檢測到暫態(tài)事件的產(chǎn)生后,立即執(zhí)行暫態(tài)事件結(jié)束算法,表示為:
式中,ε 為暫態(tài)過程結(jié)束的判定閾值;γ 為電流強度變化小于ε 的最小周期數(shù);T 為電流強度變化小于ε 的周期數(shù)。
上式表達的具體含義為當ΔIintensity小于ε 的周期個數(shù)大于γ 時,則判定為負荷暫態(tài)事件結(jié)束。當前時刻減去γ 個電流信號周期后得到暫態(tài)事件結(jié)束時刻??梢?,負荷暫態(tài)過程持續(xù)時間(暫態(tài)事件結(jié)束時刻與起始時刻的差值)為工頻周期的整數(shù)倍。
檢測到暫態(tài)事件發(fā)生后,電流有效值增大的過程為負荷投入,表現(xiàn)為負荷的開啟或升檔等操作,電流有效值減小的暫態(tài)過程為負荷的切除,表現(xiàn)為負荷關閉或降檔等操作。檢測到暫態(tài)事件后,執(zhí)行如下:
(1)根據(jù)暫態(tài)發(fā)生前后電流強度的變化,判定系統(tǒng)暫態(tài)事件為投入還是切除。若判定為負荷投入,執(zhí)行步驟(2)。若判定為負荷切除,執(zhí)行步驟(3)。
(2)暫態(tài)事件電流波形與相同周期數(shù)量的暫態(tài)前的穩(wěn)態(tài)電流波形作差,去除背景波形。
(3)暫態(tài)事件電流波形與相同周期數(shù)量的暫態(tài)后的穩(wěn)態(tài)電流波形作差,去除背景波形。
示例見圖1。
圖1 暫態(tài)電流波形分離
為盡可能詳細地反映各類暫態(tài)過程的特性,選擇多種特征表征暫態(tài)過程。
(1)暫態(tài)過程持續(xù)時間T:暫態(tài)事件結(jié)束時刻與暫態(tài)事件起始時刻差值;
(2)暫態(tài)波形取絕對最大值Ip:暫態(tài)波形取絕對值后的最大值;
(3)峰峰值Ipp:暫態(tài)電流波形最大值與最小值之差;
(4)平均值Imean:暫態(tài)電流波形各采樣點均值;
(6)電流強度Iintensity:將暫態(tài)電流波形按式(1)計算電流強度,采樣點數(shù)為暫態(tài)事件電流采樣點數(shù);
(7)穩(wěn)態(tài)波形有效值Irms:暫態(tài)事件前后穩(wěn)態(tài)電流強度差值;
(8)峰均比Rpta:峰峰值與電流強度比值(Ipp/Iintensity);
(9)波形因數(shù)Fform:電流強度與絕對平均值比值(Iintensity/I′mean);
(10)波峰因數(shù)Fcrest:暫態(tài)波形取絕對最大值與電流強度比值(Ip/Iintensity);
(11)負荷標志位Iflag:根據(jù)暫態(tài)事件前后電流強度變化判斷負荷投切,負荷投入時為1,負荷切除時為0。
對負荷暫態(tài)電流波形提取11 維特征,構(gòu)建樣本數(shù)據(jù)庫。圖1 特征提取如表1 所示。
表1 特征展示
獲取到樣本庫后,對樣本特征空間進行歸一化處理,將負荷樣本特征壓縮至[0,1]之間,表示為:
式中,i∈[-1,N];j∈[1,11];N為樣本個數(shù);xij為第i個樣本的第j 個特征值;xjmax為樣本中第j 個特征對應的最大值;xjmin為樣本中第j 個特征對應的最小值。
非侵入式負荷識別可依據(jù)的特征多,但在實際應用中能夠獲取的樣本較少,是典型的小樣本高維數(shù)據(jù)問題,且需要快速識別。SVM 是一種建立在統(tǒng)計學基礎之上的分類器,在小樣本、非線性以及高維數(shù)據(jù)的模式識別中表現(xiàn)出十分突出的特性。傳統(tǒng)的SVM 是解決二分類問題的,但實際中大多是多分類問題,因此,需要將二分類擴展至多分類[12]。
假設樣本集合:
式中,xi為樣本數(shù)據(jù);yi為xi類標簽;N 為樣本 個數(shù);n 為樣本維數(shù)。
SVM 基本思想是構(gòu)造最優(yōu)超平面將不同類別的樣本分開,超平面構(gòu)造原則為距離該平面最近的樣本到該平面的間隔最大。得到優(yōu)化問題如下:
式中,W 為超平面法向量;b 為超平面的偏移量;C 為懲罰參數(shù);εi為松弛變量。
構(gòu)建拉格朗日函數(shù):
式中,αi和βi為拉格朗日乘子。
對W、b 和εi求偏導為0,代入式(7),得:
求解式(8)得到分類決策面:
稱αi>0 對應的樣本為支持向量。
數(shù)據(jù)樣本在低維空間不可分時,可通過核函數(shù)映射到高維空間ψ:x→ψ(x),在高維空間中求解最優(yōu)線性分類超平面,將高維空間求解的線性分類超平面轉(zhuǎn)為低維分類超曲面。SVM 通過核函數(shù)巧妙地避免了由低維映射至高維帶來的維數(shù)災難問題,解決了樣本的非線性可分問題。根據(jù)Mercer 定理,核函數(shù)要求滿足:
大量文獻與試驗結(jié)果表明,高斯核函數(shù)在模式識別問題中表現(xiàn)出優(yōu)越性能,因此,選擇高斯徑向基核函數(shù)。
2.2.1 SVM 參數(shù)影響分析
SVM 分類性能主要受誤差懲罰參數(shù)C、核函數(shù)及其參數(shù)的影響[13]。文中SVM 性能主要受誤差懲罰參數(shù)C和高斯徑向基核核參數(shù)g 影響。C 越大表示越不能容忍誤差,分類器更加契合訓練樣本集,易過擬合,泛化性低。C 偏小易出現(xiàn)欠擬合,訓練誤差大,對新樣本分類變差。g 決定數(shù)據(jù)映射到高維空間的新分布,g 過大則支持向量過于緊密,支持向量少,分類器難以獲得優(yōu)質(zhì)分類性能,g 過小則支持向量關系過于松弛,支持向量多,難以保證分類器泛化性能。支持向量的數(shù)量決定了分類器復雜度。
2.2.2 SVM 參數(shù)優(yōu)化
PSO 算法是依據(jù)鳥群覓食行為所研究的群體協(xié)作優(yōu)化算法[14]。首先,隨機初始化M 個粒子,然后,通過迭代的方式獲得最優(yōu)解,每次迭代粒子通過跟隨個體極值pid和全局極值pgd更新速度,根據(jù)速度進一步更新粒子下一次位置位置,并進行適應度評價,以此迭代循環(huán),直至找到最優(yōu)解。粒子速度與位置更新公式如下:
式中,vid為粒子的速度;xid為粒子的位置;w 為慣性權(quán)重;c1、c2為學習因子;r1、r2為均勻分布在[0,1范圍內(nèi)的隨機數(shù)。
SVM 參數(shù)優(yōu)化框圖見圖2。
圖2 PSO 算法優(yōu)化SVM 參數(shù)
假設一個含有N 個類別的數(shù)據(jù)集合,將其中任意兩類樣本構(gòu)建一個分類器得到個分類器,將這些分類器搭建為DAG 圖,將得到N(N-1)/2 分支節(jié)點和N 個葉節(jié)點。DAG-SVMS 采用“排除”的思想,樣本將隨著根節(jié)點從上到下流動直至葉節(jié)點,分支節(jié)點決定樣本具體被分類到左分支還是右分支,最終葉節(jié)點的類別就是該樣本所屬類別,完成一次分類需N-1 個節(jié)點。示例見圖3。
圖3 三分類DAG-SVMS 算法
相對于常用的1-V-1 SVM 多分類算法,DAGSVMS 識別速度更快;相對于1-V-R SVMS 多分類算法,DAG-SVMS 訓練時間短。同時DAG-SVMS 不存在誤分、拒分區(qū)域,分類精度也有所提高。由于DAG-SVM 采取層次結(jié)構(gòu),誤差累計是層次結(jié)構(gòu)不可避免的弊端,即高層節(jié)點對整體樣本的分類準確率影響更大。鑒于此,文中首先根據(jù)負荷標志位,將樣本數(shù)據(jù)分為負荷的投入和切除兩部分,分別訓練DAG-SVMS 模型,以減少DAGSVMS 層數(shù),當系統(tǒng)采集到樣本后根據(jù)標志位判斷樣本屬于投入還是切除,然后將樣本數(shù)據(jù)送入對應DAGSVMS 進行識別。下面提出基于Gini 指數(shù)的節(jié)點順序優(yōu)化策略。
Gini 指數(shù)用于度量樣本數(shù)據(jù)的不純度和不確定性,表示為:
式中,pi為D 中樣本屬于第i 類的概率;D 表示樣本數(shù)據(jù)集。
假設樣本集被節(jié)點劃分為兩個子集合D1、D2,則經(jīng)過該劃分后樣本的Gini 指數(shù)降低為:
經(jīng)過該劃分,產(chǎn)生的Gini 指數(shù)差為:
由于Gini 指數(shù)越小樣本越有序,將劃分后的樣本Gini指數(shù)最小化,即保證劃分前后數(shù)據(jù)的Gini 指數(shù)差值最大,使劃分結(jié)果更加有序。文中對節(jié)點順序的優(yōu)化為:首先使用各個分類器對樣本訓練集進行劃分,選擇Gini 指數(shù)差值最大的節(jié)點作為根節(jié)點,然后將劃分后的樣本集D1、D2分別視為獨立集,在下一層中選擇Gini 指數(shù)差值最大的分類器作為當前節(jié)點,以此類推,搭建DAG-SVMS 結(jié)構(gòu)。
文中算法框圖如圖4 所示,包括:數(shù)據(jù)采集、事件監(jiān)測、特征提取、負荷辨識,分為辨識模型訓練階段和在線識別兩個階段??紤]到實際用戶家庭負荷用電習慣,暫態(tài)事件過程持續(xù)時間極短,文中假設各負荷獨立,不存在多種負荷同時投切這一特殊情況。
圖4 算法流程
采用BLUED[15]數(shù)據(jù)集進行仿真驗證分析,數(shù)據(jù)來源于某家庭電力總線端口處,共采集了8 天,采樣頻率為12 kHz,包括電壓、電流數(shù)據(jù),并配備各用電設備的暫態(tài)事件投切時刻表。軟件平臺使用MATLAB2018a,輔助工具箱Libsvm3.24,硬件平臺使用Intel Core i5-4210U 2.40 GHz,4GB RAM電腦。從數(shù)據(jù)集中選取5種投切次數(shù)較多的用電設備用于實驗驗證,暫態(tài)事件起始判定閾值設定為功率最小負荷浴室頂燈電流強度的1/2,暫態(tài)過程結(jié)束的判定閾值設定為浴室頂燈電流強度1/5,提取11 維特征向量形成樣本數(shù)據(jù)空間。共5 種用電設備的投切,10 類暫態(tài)過程,詳見表2。
表2 樣本數(shù)據(jù)組成
分別從10 類暫態(tài)過程中隨機選擇60%的數(shù)據(jù)樣本用于訓練,剩余40%樣本用于測試,執(zhí)行10 次。評價指標選用準確率:
PSO 算法最大迭代次數(shù)設置為100,搜索空間維數(shù)d=2,初始化個體數(shù)目N=30,學習因子c1=2、c2=2,慣性權(quán)重w=0.65,粒子位置值范圍[-10,10],折疊交叉數(shù)K=5,實驗結(jié)果如表3 所示。
表3 負荷識別正確率
從表3 可以看出,文中方法對各負荷投入識別率均為100%,負荷切除識別率相對偏低,這是因為負荷切除時的暫態(tài)過程持續(xù)時間偏短,外加電力線中噪聲干擾,導致暫態(tài)特征區(qū)分度減弱。算法平均識別率為97.69%。
分別使用1-V-1 SVMS、1-V-R SVMS、傳統(tǒng)DAGSVMS 以及文中優(yōu)化改進的DAG-SVMS 算法進行識別性能對比分析。分類器參數(shù)優(yōu)化前,使用平臺默認參數(shù)結(jié)果如圖5 所示。從圖5 中可以看到,PSO 算法優(yōu)化后,各多分類SVM 算法識別準確率均大大提高,文中DAGSVMS 優(yōu)化前后識別準確率均優(yōu)于傳統(tǒng)SVMS,且波動較小,識別結(jié)果穩(wěn)定。
圖5 多分類SVM 算法測試結(jié)果
多分類SVM 算法訓練、測試結(jié)果如表4 所示,表4中,各項指標由10 次實驗結(jié)果平均得到??梢钥吹?,文中算法平均訓練時間最短,為20.35 s,單樣本平均識別時間最快,為1.53 μs,平均識別率最高,為97.69%,均為最優(yōu)。由于文中算法在訓練模型前,根據(jù)負荷標志位對模型進行了簡化處理,模型結(jié)構(gòu)簡單,訓練時間減少。同時,分類識別時所需分類器判決次數(shù)少,識別時間更快。
表4 多分類SVM 算法訓練、測試結(jié)果
使用目前負荷識別領域常用的BP 神經(jīng)網(wǎng)絡、K-NN算法、CART 算法與文中優(yōu)化改進DAG-SVMS 算法進行性能對比結(jié)果如圖6 所示。
圖6 不同算法的識別結(jié)果
從圖6 中可以看出,文中DAG-SVMS 算法10 次實驗結(jié)果識別準確率均高于其他幾種常用算法,均保持在95%以上。進一步整理實驗結(jié)果,如表5 所示。
表5 不同算法實驗結(jié)果
其中,K-NN 算法K 值為樣本識別準確率最高情況下的對應值,該算法直接計算樣本類別,因此,無訓練時間??梢钥吹剑闹蟹椒▎螛颖咀R別時間仍為最短,僅為BP 神經(jīng)網(wǎng)絡的0.22%、K-NN 算法的0.26%、CART 算法的2.27%。識別準確率上,平均識別率均高于其他幾種算法。從訓練時間角度看,文中算法平均離線訓練時間最長,為20.35 s,但實際應用中,考慮到系統(tǒng)通信模塊、人機交互等,文中算法負荷在線識別速度快,識別準確率高,故適合在線識別。
最后,從表6 中可以看出,文中DAG-SVMS 算法在節(jié)點順序優(yōu)化后,平均識別準確率提高1.04%百分點,反映了節(jié)點順序優(yōu)化方法的有效性。
表6 節(jié)點順序優(yōu)化前后對比
針對穩(wěn)態(tài)類方法識別負荷的不足,文中以暫態(tài)電流為特征,提出了一種基于改進DAG-SVMS 的非侵入式負荷識別方法。包括事件檢測、暫態(tài)波形分離、特征提取,為解決特征類似負荷的識別問題,以SVM 為分類器,搭建DAG-SVMS 負荷識別模型,同時,優(yōu)化模型中的分類器參數(shù)和節(jié)點順序,以進一步提高識別準確率。實驗結(jié)果表明文中算法識別準確率高,識別速度最快,實用性強,適合在線識別。