馬玉鑫
上海電氣集團股份有限公司 中央研究院 上海 200070
在微電網(wǎng)中應(yīng)用現(xiàn)代信息技術(shù)、通信技術(shù)與控制技術(shù),已經(jīng)成為全球化的趨勢。建立微電網(wǎng),使發(fā)電設(shè)備、電網(wǎng)運營和終端設(shè)備互相配合,協(xié)同工作,在保證系統(tǒng)穩(wěn)定性、可靠性的同時,使投資和對環(huán)境的影響最小[1]。負(fù)荷預(yù)測在近年來微電網(wǎng)的發(fā)展中扮演著極其重要的角色。系統(tǒng)規(guī)劃與運行、收益估計、能量交易等都需要精準(zhǔn)的負(fù)荷預(yù)測。根據(jù)預(yù)測的時間間隔,負(fù)荷預(yù)測可以分為超短期負(fù)荷預(yù)測、短期負(fù)荷預(yù)測、中期負(fù)荷預(yù)測和長期負(fù)荷預(yù)測四類,分界線一般默認(rèn)為一天、兩周和三年[2-4]。
由于超短期負(fù)荷預(yù)測間隔時間短,而且對于微電網(wǎng)而言,其負(fù)荷的波動性一般大于區(qū)域大電網(wǎng),因此對預(yù)測算法的精度提出了更高要求。目前,在數(shù)據(jù)積累情況較為理想的條件下,超短期負(fù)荷預(yù)測普遍應(yīng)用人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(SVM),其中SVM因為引入了結(jié)構(gòu)風(fēng)險最小化理論,不會陷入局部極值,所以備受青睞[5-6]。實際應(yīng)用中,為規(guī)避SVM復(fù)雜且耗時的二次規(guī)劃求解問題,通常采用最小二乘支持向量機(LSSVM)。
早期直接應(yīng)用LSSVM,可以有效解決超短期負(fù)荷預(yù)測問題,獲得了比傳統(tǒng)回歸算法更好的預(yù)測結(jié)果[7-10]。眾多學(xué)者為提高LSSVM的預(yù)測精度,在訓(xùn)練模型的輸入矩陣中引入被預(yù)測日相似日的相關(guān)元素,使輸入和輸出矩陣間存在更強的相關(guān)性。隨著微電網(wǎng)系統(tǒng)、數(shù)據(jù)采集和通信技術(shù)的發(fā)展,微電網(wǎng)中可收集的變量種類越來越多,采樣頻率也越來越快,由此對超短期負(fù)荷預(yù)測模型的訓(xùn)練提出了挑戰(zhàn)。而且,在實際工程中,影響模型輸出的因素并非都可以直觀辨識。
可見,僅選取部分相關(guān)性較高的變量用于建模,可能會降低模型的精度。但如果將系統(tǒng)采集到的全部變量都作為輸入用于建模,那么勢必會因維度增加而導(dǎo)致計算成本變大,從而進(jìn)一步影響預(yù)測模型的泛化能力[11]。通過引入主成分分析(PCA)消除變量間的共線性特點,然后利用SVM建模,在電力系統(tǒng)短期負(fù)荷預(yù)測中獲得了比傳統(tǒng)SVM更準(zhǔn)確的預(yù)測結(jié)果[12-14]。
PCA的目標(biāo)是將數(shù)據(jù)方差變化最大的方向保留下來,以此最大限度地展開數(shù)據(jù),對于服從或接近服從高斯分布的數(shù)據(jù)集有較好的應(yīng)用效果。當(dāng)然,負(fù)荷數(shù)據(jù)具有較強的隨機性,并且電壓電流等變量明顯不服從高斯分布,所以PCA在負(fù)荷數(shù)據(jù)的特征提取中會遇到信息丟失較多的問題[15]。局部保持投影(LPP)通過保持局部鄰域結(jié)構(gòu)完整,可以在克服上述問題的同時實現(xiàn)特征提取[16]。
為了解決負(fù)荷數(shù)據(jù)非高斯、高維度的問題,筆者提出一種基于LPP-LSSVM的微電網(wǎng)超短期負(fù)荷預(yù)測算法。算法根據(jù)天氣、溫度等因素選取相似日組成訓(xùn)練數(shù)據(jù)集,利用LPP進(jìn)行特征提取,基于LSSVM訓(xùn)練預(yù)測模型實施負(fù)荷預(yù)測。最終,通過對某公司實際運行負(fù)荷進(jìn)行試驗,驗證算法的有效性和優(yōu)越性。
LPP可以求取一個保持?jǐn)?shù)據(jù)集局部結(jié)構(gòu)的投影矩陣P∈Rm×p(p (1) 構(gòu)建鄰接圖。根據(jù)歐幾里得距離,X中每個數(shù)據(jù)xi,xj∈X(i,j=1,…,n)選擇離其最近的k個數(shù)據(jù)作為鄰居。若數(shù)據(jù)xj屬于數(shù)據(jù)xi的k個近鄰中的一個,則在節(jié)點i與節(jié)點j之間連一條直線,否則不連線。 (2) 計算權(quán)重。W為待求的權(quán)重矩陣,節(jié)點i與節(jié)點j之間權(quán)重為Wij。若節(jié)點之間無連線,則權(quán)重值設(shè)置為0。若節(jié)點之間有連線,則權(quán)重值利用高斯核函數(shù)進(jìn)行設(shè)置: (1) 式中:t為高斯核參數(shù)。 (3) 特征映射。投影矩陣P∈Rm×p(p XTLXα=λXTDXα (2) (3) L=D-W (4) 式中:λ、α分別為特征值和特征向量;D為對角矩陣,元素值為權(quán)重矩陣的列之和。 低維數(shù)據(jù)可以表示為: yi=xiPP=[a1,a2,…,ap] (5) 建立預(yù)測模型使用的技術(shù)手段為LSSVM,其核心內(nèi)容是如何確立模型的輸入和輸出。 SVM的基本思想是Mercer核展開定理,通過非線性映射,將輸入控件的樣本映射到高維的特征空間中,將尋找最優(yōu)線性回歸超平面的算法歸結(jié)為求解約束條件下的二次規(guī)劃問題,并可以求得全局最優(yōu)解。設(shè)樣本為m維向量,給定n個樣本: (x1,y1),(x2,y2),…,(xn,yn)∈RmR 約束于: yi=Φ(xi)ω+b+ξii=1,…,n (6) 式中:xi為樣本輸入;yi為樣本輸出;ω為高維特征空間的權(quán)值向量;b為偏置量;ξi為松弛因子。 用非線性映射Φ(x)將樣本從原空間Rm映射到一個高維特征空間,在此高維特征空間中構(gòu)造最優(yōu)線性決策函數(shù): y(x)=ωTΦ(x)+b (7) 利用結(jié)構(gòu)風(fēng)險最小化原則,確定ω、b等價于求解下面的優(yōu)化問題: (8) 式中:c為懲罰因子,c>0;RE為誤差控制函數(shù),屬于不敏感損失函數(shù)。 LSSVM在優(yōu)化目標(biāo)中的損失函數(shù)J為松弛因子ξi的二次項,故優(yōu)化問題為: 約束于: yi=ωTΦ(xi)+b+ξii=1,…,n (9) 用拉格朗日法求解上述優(yōu)化問題: (10) 式中:αi為拉格朗日乘子。 根據(jù)優(yōu)化條件?L/?ω=0,?L/?b=0,?L/?ξ=0,?L/?α=0,有: 定義核函數(shù)Kij=K(xi,yi)=Φ(xi)Φ(yi)為高維特征內(nèi)積運算,且K(xi,yi)是滿足Mercer條件的對稱函數(shù),則以上優(yōu)化問題轉(zhuǎn)化為求解線性方程: (15) 最后得到LSSVM的函數(shù)估計為: (16) 為了解決負(fù)荷數(shù)據(jù)非高斯、高維度的問題,筆者提出基于LPP-LSSVM的超短期負(fù)荷預(yù)測算法。 (1) 基于被預(yù)測日的季節(jié)類型,第一類包含1月、2月、12月,第二類包含4月、5月、6月,第三類包含7月、8月、9月,第四類包含3月、10月、11月,匹配選取h天歷史數(shù)據(jù)作為總數(shù)據(jù)集。 (2) 確定負(fù)荷預(yù)測的參考?xì)v史樣本點數(shù)L,即為預(yù)測T+1時刻的負(fù)荷功率,需參考T,T-1,…,T-L+1共L個時刻的負(fù)荷功率值。 (3) 構(gòu)造LPP的輸入數(shù)據(jù)集X=[x1,x2,…,xn]T∈Rh(s-L)×(13+L),s為每天收集的樣本數(shù),固定的13列為功率因數(shù)、電網(wǎng)頻率、三相相電流、三相相電壓、三相線電壓、每日最高溫、每日最低溫。 (4) 使用LPP提取特征空間Y=XP,其中投影矩陣P=[a1,a2,…,ap]∈R(13+L)×p。 (5) 將標(biāo)準(zhǔn)化后的特征空間Y和負(fù)荷曲線F∈R(s-L)×(13+L)輸入LSSVM,建立預(yù)測模型F=f(Y)。 (6) 對于被測日數(shù)據(jù)Xt,首先構(gòu)造Yt=XtP,輸入預(yù)測模型,得到T+1時刻被預(yù)測值FpT+1=f(Yt)。 (7) 計算LPP-LSSVM算法結(jié)果的平均絕對誤差百分比MAPE=|FT+1-FpT+1|/FT+1×100%。 試驗數(shù)據(jù)來源于上海某公司微電網(wǎng)示范工程。該工程配置了42 kW光伏和50 kW儲能,負(fù)荷類型主要是辦公樓宇和實驗室,負(fù)荷波動主要來自于幾個實驗室的高功率設(shè)備。為了更好地配合已有的能量算法,調(diào)度儲能,實現(xiàn)削峰填谷,擬采用筆者提出的算法代替?zhèn)鹘y(tǒng)的LSSVM實現(xiàn)超短期負(fù)荷預(yù)測。數(shù)據(jù)來自 2014年7月至2015年6月間,采樣間隔為5 min,其中負(fù)荷數(shù)據(jù)主要根據(jù)各電表獲取,每日最高、最低溫度則參考天氣預(yù)報的信息。 經(jīng)過交叉驗證,選取特征提取維度p為6,LPP近鄰個數(shù)k為30,LSSVM懲罰因子c為10,高斯核函數(shù)參數(shù)為100。LSSVM、PCA-LSSVM、LPP-LSSVM三種算法的MAPE對比見表1。 通過表1可以看出,筆者提出的LPP-LSSVM算法在3月至11月的負(fù)荷預(yù)測中,表現(xiàn)均優(yōu)于LSSVM和PCA-LSSVM算法。在1月、2月、12月的負(fù)荷預(yù)測中,結(jié)果較PCA-LSSVM算法略差,但優(yōu)于LSSVM算法。7月、8月、9月中,三種算法的MAPE均高于其它月份,原因是夏季空調(diào)開啟后負(fù)荷波動比較劇烈,進(jìn)行精準(zhǔn)預(yù)測的難度較大。 圖1所示為2014年10月12日實際負(fù)荷曲線和LSSVM、LPP-LSSVM預(yù)測曲線,可以看出,LPP-LSSVM算法可以更好地反映負(fù)荷的波動情況,更接近實際的負(fù)荷曲線。LPP-LSSVM算法得到的MAPE為18.88%,相比LSSVM減小了2%。 圖1 2014年10月12日負(fù)荷曲線 圖2所示為2015年4月25日實際負(fù)荷曲線的高斯分布擬合結(jié)果,可以看出負(fù)荷數(shù)據(jù)明顯不服從高斯分布。由于PCA自身的局限性,PCA在特征提取時會遺漏部分信息,使特征空間無法完整表達(dá)原始數(shù)據(jù)空間的結(jié)構(gòu)。 圖2 2015年4月25日實際負(fù)荷曲線高斯分布擬合結(jié)果 圖3所示為2015年4月25日PCA-LSSVM、LPP-LSSVM預(yù)測曲線與實際負(fù)荷曲線,可以看出兩種算法都能較好地預(yù)測負(fù)荷波動,但是PCA-LSSVM算法的MAPE只達(dá)到14.15%,而LPP-LSSVM算法克服了數(shù)據(jù)的非高斯和高維度問題,完整表達(dá)了負(fù)荷數(shù)據(jù)的特征,MAPE達(dá)到12.43%。 當(dāng)數(shù)據(jù)集中的某些變量服從非高斯分布時,傳統(tǒng)PCA的相應(yīng)假設(shè)將無法得到滿足,于是其特征提取能力會下降,導(dǎo)致后續(xù)使用LSSVM建立的預(yù)測模型的精度會降低。針對這一問題,筆者提出了一種基于LPP-LSSVM的微電網(wǎng)超短期負(fù)荷預(yù)測算法。LPP的引入,可以保證由特征提取獲得的特征空間信息精度不會因為訓(xùn)練數(shù)據(jù)包含復(fù)雜數(shù)學(xué)分布而受到影響。通過對上海某公司微電網(wǎng)實際負(fù)荷數(shù)據(jù)進(jìn)行仿真試驗,驗證了筆者算法的有效性。 圖3 2015年4月25日負(fù)荷曲線3 LSSVM概述
4 超短期負(fù)荷預(yù)測算法
5 仿真試驗
6 結(jié)論