鄒仕富,李嘉周,毛啟均,宋明軍
(1.國網(wǎng)四川省電力公司,成都 610041; 2.國網(wǎng)四川省電力公司 信息通信公司,成都 610041;3.四川中電啟明星信息技術(shù)有限公司,成都 610041)
隨著智能電網(wǎng)和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,電力負(fù)荷數(shù)據(jù)呈指數(shù)級(jí)增加,數(shù)據(jù)規(guī)模和維度日益復(fù)雜,形成海量電力負(fù)荷。針對短時(shí)電力負(fù)荷預(yù)測,很多學(xué)者進(jìn)行了廣泛研究和探索,提出了很多預(yù)測方法,主要包括線性預(yù)測方法和非線性預(yù)測方法。前者包括多元線性回歸和時(shí)間序列方法[1-2],這些方法只能刻畫描述交通流量的基本變化趨勢,難以對交通流量進(jìn)行精確預(yù)測;后者包括灰色模型、神經(jīng)網(wǎng)絡(luò)、小波模型和支持向量機(jī)等[3-7],尤其最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)實(shí)現(xiàn)SVM的改進(jìn),克服神經(jīng)網(wǎng)絡(luò)的小樣本、過度擬合和“維數(shù)災(zāi)難”等缺點(diǎn),具有很強(qiáng)的泛化預(yù)測能力,因此被廣泛地應(yīng)用于電力負(fù)荷預(yù)測領(lǐng)域。
由于影響電力負(fù)荷的氣象因子較多,導(dǎo)致輸入空間維數(shù)過高以及影響因素之間的相關(guān)性,影響負(fù)荷預(yù)測的計(jì)算效率和預(yù)測精度?;认x優(yōu)化算法[8](Grasshopper Optimization Algorithm,GOA)具有收斂速度快、精度高和計(jì)算簡單等優(yōu)點(diǎn),目前應(yīng)用于參數(shù)優(yōu)化[9]、特征選擇[10]以及振動(dòng)故障識(shí)別[11]等。目前,GOA算法尚未發(fā)現(xiàn)應(yīng)用于短期電力負(fù)荷預(yù)測的文獻(xiàn)。為了提高負(fù)荷預(yù)測精度,消除多氣象因素之間的相關(guān)性和剔除冗余,本文提出一種數(shù)據(jù)降維和特征分析的GOA-LSSVM的負(fù)荷預(yù)測方法。研究結(jié)果表明,與GOA-LSSVM和LSSVM相比,本文算法可以有效提高負(fù)荷預(yù)測精度。
蝗蟲個(gè)體位置的更新由種群交互力、重力和風(fēng)力影響綜合決定,其位置更新公式為[12]:
Xi=Si+Gi+Ai
(1)
式中:Xi表示蝗蟲群體中第i個(gè)蝗蟲的位置;Si表示第i個(gè)蝗蟲受到的與其他蝗蟲的交互力的影響;Gi表示第i個(gè)蝗蟲受到的重力影響;Ai表示第i個(gè)蝗蟲受到的風(fēng)力影響??紤]環(huán)境因素的隨機(jī)影響,式(1)可修正為
Xi=r1Si+r2Gi+r3Ai
(2)
式中:r1、r2、r3分別為處于[0 1]之間的隨機(jī)數(shù);交互力影響
(3)
s(r)=fe-r/l-e-r
(4)
f表示吸引強(qiáng)度;l表示吸引尺度;r表示舒適距離。
(5)
為實(shí)現(xiàn)優(yōu)化問題的求解,Saremi等提出如下數(shù)學(xué)模型:
(6)
(7)
cmax=1,cmin=10-5;t、Tmax分別表示當(dāng)前迭代次數(shù)和最大迭代次數(shù)。
(8)
式中:ω為權(quán)重;C為LSSVM的懲罰參數(shù);ξi為LSSVM的松弛變量;φ(x)為空間映射函數(shù);b為LSSVM的偏差。因此,LSSVM的Lagrange函數(shù)L可表示為[14]:
(9)
式中,ai表示Lagrange乘子。對式(9)求偏導(dǎo):
(10)
消去ω和ξi,可得:
(11)
式中,Q=(1,…,1)T;A=(a1,a2,…,am)T;Y=(y1,y2,…,ym)T,通過求解式(11),LSSVM模型的估計(jì)公式為:
(12)
式中:
K(x,xi)=exp{-||x-xi||2/(2g2)}
數(shù)據(jù)降維和特征表示的主要目的是剔除冗余,提取數(shù)據(jù)的主要特征信息,盡量用最少的信息反映原始數(shù)據(jù)的主要信息,從而提高數(shù)據(jù)挖掘效率。一般地,數(shù)據(jù)特征越多,數(shù)據(jù)包含的信息越多越豐富,然而在某些情況下,這些特征之間可能存在潛在的冗余,因此進(jìn)行數(shù)據(jù)降維和特征表示具有重要意義。目前數(shù)據(jù)約簡和降維的方法有很多[15-17],如主成分分析(Principle Components Analysis,PCA)、離散小波變換(Discrete Wavelet Transform,DWT)、奇異值分解(Singular Value Decomposition,SVD)、流形學(xué)習(xí)(Manifold Learning,ML)等,本文選擇PCA進(jìn)行負(fù)荷影響因素?cái)?shù)據(jù)降維和特征表示。
假設(shè)m×n維數(shù)據(jù)樣本:
當(dāng)n較大時(shí),所研究問題的復(fù)雜程度和計(jì)算難度會(huì)隨著n的增加而增大,PCA具體過程描述如下:
(1)數(shù)據(jù)標(biāo)準(zhǔn)化。數(shù)據(jù)標(biāo)準(zhǔn)化公式為
(13)
(2)建立協(xié)方差矩陣R。計(jì)算特征值L和特征向量A,
(3)確定主元數(shù)。主成分貢獻(xiàn)率和累計(jì)貢獻(xiàn)率分別為:
(16)
(17)
針對LSSVM預(yù)測效果受參數(shù)組合C和g的選擇影響,運(yùn)用GOA算法優(yōu)化選取LSSVM模型的最優(yōu)參數(shù)組合,GOA-LSSVM的目標(biāo)函數(shù)表示為:
(18)
基于PCA和GOA-LSSVM算法的負(fù)荷預(yù)測算法流程具體描述如下:
Step1輸入負(fù)荷影響因素?cái)?shù)據(jù)和負(fù)荷數(shù)據(jù),運(yùn)用PCA提取對負(fù)荷影響因素?cái)?shù)據(jù)進(jìn)行數(shù)據(jù)降維和特征表示,剔除冗余;
Step2GOA算法參數(shù)初始化:蝗群的種群規(guī)模N、最大迭代次數(shù)T、變量維數(shù)d=2以及優(yōu)化變量的取值范圍[LBUB],C和g的取值范圍分別為[10 100]和[0.01 10.00];
Step3隨機(jī)初始化生成蝗群位置;
Step4根據(jù)目標(biāo)函數(shù)式(18)計(jì)算蝗群個(gè)體的適應(yīng)度,同時(shí)找出當(dāng)前全局最優(yōu)解的位置將其作為目標(biāo)位置;
Step5根據(jù)式(1)更新搜索個(gè)體位置;
Step6判斷算法是否達(dá)到終止條件。判斷算法是否達(dá)到最大迭代次數(shù)T,若滿足,則輸出LSSVM最優(yōu)參數(shù)進(jìn)行預(yù)測;反之,返回Step 4。
基于PCA和GOA-LSSVM算法的負(fù)荷預(yù)測流程如圖1所示。
圖1 基于PCA和GOA-LSSVM的負(fù)荷預(yù)測流程圖
為綜合比較不同模型的負(fù)荷預(yù)測性能,選擇平均絕對百分誤差(MAPE)和均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo)。
為了驗(yàn)證本算法進(jìn)行負(fù)荷預(yù)測的有效性,選擇歐洲智能技術(shù)網(wǎng)絡(luò)(European Network on Intelligent Technologies,EUNITE)組織的2018-07-15~2018-07-25的短時(shí)負(fù)荷數(shù)據(jù)為研究對象[18-19],其中1 d間隔1 h采集1點(diǎn)電力負(fù)荷數(shù)據(jù),電力負(fù)荷數(shù)據(jù)如圖2所示。
圖2 電力負(fù)荷圖
影響負(fù)荷的影響因素分別為溫度、濕度、風(fēng)速、降水量、氣壓和SO2濃度,運(yùn)用PCA確定主元數(shù)和特征表示,PCA處理結(jié)果如圖3和圖4所示。
圖4 累計(jì)貢獻(xiàn)率
由圖3和4可知,SO2濃度、降水量和溫度3個(gè)主元貢獻(xiàn)率分別為42%、23%和21%,3個(gè)主元的累計(jì)貢獻(xiàn)率超過85%,因此本文選擇SO2濃度、降水量和溫度作為負(fù)荷預(yù)測輸入。為了證明本文算法GOA-LSSVM進(jìn)行負(fù)荷預(yù)測的優(yōu)越性,將其與GOA-LSSVM和LSSVM進(jìn)行對比,結(jié)果如圖5、6和表1所示。
結(jié)合圖5、6和表1不同算法進(jìn)行負(fù)荷預(yù)測結(jié)果可知,在RMSE和MAPE 2個(gè)評(píng)價(jià)指標(biāo)上,與GOA-LSSVM和LSSVM相比較,PCA+GOA-LSSVM的預(yù)測精度最高;GOA-LSSVM的預(yù)測精度其次;LSSVM的預(yù)測精度最差。通過對比可知,本文提出的算法PCA+GOA-LSSVM可以有效提高短時(shí)負(fù)荷預(yù)測的精度,效果較好,為短時(shí)負(fù)荷預(yù)測提供新的方法。
表1 不同算法結(jié)果對比
為了提高負(fù)荷預(yù)測精度,消除多氣象因素之間的相關(guān)性和剔除冗余,提出一種基于數(shù)據(jù)降維和特征分析的GOA-LSSVM的負(fù)荷預(yù)測方法。通過PCA數(shù)據(jù)降維和特征表示可以消除數(shù)據(jù)冗余和影響因素之間的相關(guān)性,簡化了負(fù)荷預(yù)測模型的復(fù)雜程度,提高了預(yù)測模型的速度。研究結(jié)果表明,與GOA-LSSVM和LSSVM相比,本文算法可以有效提高負(fù)荷預(yù)測精度,有效確定影響負(fù)荷的主要影響因素,效果較好。