胡 益
(華東電力設(shè)計院有限公司,上海 200237)
隨著新能源的不斷開發(fā)和利用,光伏發(fā)電工程呈現(xiàn)出快速增長的趨勢,目前已有多個大型光伏電站建成并投入運(yùn)行。由于并網(wǎng)光伏發(fā)電系統(tǒng)的出力具有間歇性和不可控性等缺點(diǎn),其對電力系統(tǒng)的安全穩(wěn)定運(yùn)行會造成沖擊,因此有必要對未來短期內(nèi)光伏發(fā)電系統(tǒng)的出力進(jìn)行預(yù)測。
針對氣象數(shù)據(jù)和光伏發(fā)電出力數(shù)據(jù)之間存在隨機(jī)性和非線性的特征,本文提出一種基于核偏最小二乘(KPLS)的光伏發(fā)電出力預(yù)測方法。KPLS在過程監(jiān)控和系統(tǒng)建模領(lǐng)域應(yīng)用較多,同時也為光伏發(fā)電出力預(yù)測的實(shí)現(xiàn)提供了一種可行方法。本文首先對氣象數(shù)據(jù)和出力數(shù)據(jù)的特征進(jìn)行分析,然后建立一種基于KPLS的預(yù)測模型,最后通過實(shí)際光伏電站運(yùn)行數(shù)據(jù)進(jìn)行預(yù)測。
在光伏發(fā)電出力預(yù)測中,氣象因素起著重要的作用。下面用統(tǒng)計學(xué)的方法對發(fā)電數(shù)據(jù)和氣象數(shù)據(jù)的相關(guān)性以及輸入輸出之間的非線性關(guān)系進(jìn)行分析。
現(xiàn)以位于澳大利亞東海岸的容量為433 kWp的光伏陣列在2015年3月21日的發(fā)電情況進(jìn)行分析說明,當(dāng)天的氣象信息包括環(huán)境溫度、濕度、輻射值、風(fēng)速、和風(fēng)向五項(xiàng)指標(biāo)數(shù)據(jù)。采用如下的相關(guān)系數(shù)計算公式來計算氣象因素與發(fā)電出力之間的相關(guān)性:
各變量之間的相關(guān)性計算結(jié)果見表1。從表1可以看出,不但各氣象變量與光伏出力之間存在一定的相關(guān)性,而且氣象變量之間也存在著相關(guān)性。其中,光伏發(fā)電功率與太陽的輻射值相關(guān)性最大,為0.923,其次就是與環(huán)境溫度的相關(guān)性也較大,為0.731,它們之間的實(shí)時曲線見圖1、圖2。此外,從表1中還可以看出,發(fā)電功率與環(huán)境濕度成反比,說明環(huán)境濕度越大,發(fā)電功率越小。
表1 氣象因素與發(fā)電功率相關(guān)性分析結(jié)果
圖1 光伏發(fā)電功率與輻射的關(guān)系
圖2 光伏發(fā)電功率與溫度的關(guān)系
在光伏發(fā)電系統(tǒng)中,環(huán)境因素為輸入變量,而發(fā)電功率為輸出變量,建模的目的是為了準(zhǔn)確地描述輸入輸出變量之間的關(guān)系。為了說明發(fā)電功率與環(huán)境變量之間的關(guān)系,圖3中分別畫出了溫度、濕度和輻射與發(fā)電功率的對應(yīng)關(guān)系。如果兩個變量之間是線性關(guān)系,那么圖中所有點(diǎn)將會分布在一條直線上,因此從圖中可以看出,只有輻射與發(fā)電功率的線性關(guān)系較強(qiáng),而溫度和濕度與發(fā)電功率之間的關(guān)系則呈現(xiàn)出較強(qiáng)的非線性。因此,各個環(huán)境變量與發(fā)電功率之間或多或少存在著非線性關(guān)系,為了建立準(zhǔn)確的模型來對發(fā)電出力進(jìn)行預(yù)測,就需要采用非線性的方法來處理此種數(shù)據(jù)。
KPLS方法是一種用來處理非線性問題的非線性PLS方法,它是基于PLS的一種改進(jìn)算法,因此接下來首先對基本的PLS算法作簡單的介紹。
圖3 輸入輸出變量之間的關(guān)系
偏最小二乘(PLS)算法是一種多變量線性回歸算法,它的基本思想是認(rèn)為系統(tǒng)(或過程)是被少量的隱變量所驅(qū)動,通過隱變量的形式來描述輸入變量和輸出變量之間的線性關(guān)系,從而建立系統(tǒng)的內(nèi)部模型。PLS建模的目的是通過隱變量的形式來描述輸入變量和輸出變量之間的線性關(guān)系。假設(shè)輸入數(shù)據(jù)矩陣和輸出數(shù)據(jù)矩陣分別為X∈Rn×m和Y∈Rn×p,其中,n、m和p分別表示樣本數(shù)量、輸入變量個數(shù)和輸出變量個數(shù)。PLS算法通過對X和Y進(jìn)行線性分解建立如下回歸模型:
式中:T=[t1,t2,…,tA]和U=[u1,u2,…,uA]分別是矩陣X和Y的得分矩陣;ti和ui即為隱變量;A表示保留的隱變量的個數(shù);同時P=[p1,p2,…,pA]和Q=[p1,p2,…,pA]分別是X和Y的負(fù)載矩陣;E和F表示分解后的殘差矩陣。
根據(jù)Cover定理,將復(fù)雜的模式分類問題非線性地投射到高維空間比投射到低維空間得到的結(jié)果是線性可分的可能性更大。因此,在高維空間里那些數(shù)據(jù)將會表現(xiàn)出較強(qiáng)的線性關(guān)系。KPLS方法就是基于該定理,通過一個簡單的核函數(shù)將輸入空間非線性地投影到高維特征空間,再在此特征空間構(gòu)造線性PLS模型。
表2 KPLS 算法
根據(jù)KPLS算法,高維數(shù)據(jù)Φ的得分矩陣T可表示為T=[t1,…,tA],輸出數(shù)據(jù)Y的得分矩陣U可表示為U=[u1,…,uA](其中A是保留的隱變量的個數(shù))。
由于光伏出力受外界多個變量影響,具有強(qiáng)非線性和不確定性,難以建立精確的數(shù)學(xué)模型,故本文采用基于KPLS的方法進(jìn)行建模,該方法無須建立光伏發(fā)電系統(tǒng)的內(nèi)在數(shù)學(xué)模型,只要對歷史數(shù)據(jù)進(jìn)行處理,確定輸入輸出變量之間的關(guān)系即可完成光伏出力的預(yù)測。在進(jìn)行光伏發(fā)電出力預(yù)測時,建立預(yù)測模型所采用訓(xùn)練數(shù)據(jù)為光伏監(jiān)控系統(tǒng)數(shù)據(jù)庫中的歷史發(fā)電數(shù)據(jù)和氣象數(shù)據(jù)。在對歷史數(shù)據(jù)進(jìn)行KPLS算法處理后,可以得到訓(xùn)練數(shù)據(jù)的得分矩陣T和U,則對于訓(xùn)練樣本,它的擬合公式為:
而在進(jìn)行預(yù)測時,對于新樣本數(shù)據(jù),它的擬合公式為:
式中:xnew為新采樣的數(shù)據(jù);x為輸入訓(xùn)練數(shù)據(jù);
Y為輸出訓(xùn)練數(shù)據(jù);Kt為新數(shù)據(jù)對應(yīng)的核
矩陣;Yt為預(yù)測結(jié)果。
為了說明不同模型的預(yù)測能力,通常有多種方法來衡量,本文采用均方根誤差(RMSE)來評估模型對于數(shù)據(jù)的平均偏離水平,均方根誤差的表達(dá)式如下:
式中:yi是實(shí)際值;是預(yù)測值;n是樣本數(shù)量。
RMSE值越小,表明預(yù)測值與實(shí)際值越接近,也說明模型有更高的預(yù)測精度。
本文利用位于澳大利亞東海岸的容量為433 kWp的光伏陣列的數(shù)據(jù)來驗(yàn)證模型的有效性,有效光照時間為每天的7∶00~17∶00。本實(shí)驗(yàn)數(shù)據(jù)和信息包括該光伏陣列2015年3月21日、22日和8月13日、14日的氣象數(shù)據(jù)和輸出功率數(shù)據(jù),時間分辨率均為5 min,因此每天的數(shù)據(jù)包含121個樣本點(diǎn)。實(shí)驗(yàn)過程中分別用3月21日和8月13日的數(shù)據(jù)作為訓(xùn)練樣本建立模型,然后分別對3月22日和8月14日的發(fā)電出力進(jìn)行預(yù)測。
為了驗(yàn)證基于KPLS的光伏發(fā)電出力預(yù)測方法的性能,本文將其與基于PLS和基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的方法的預(yù)測結(jié)果進(jìn)行比較。首先用訓(xùn)練樣本集分別建立PLS,KPLS和ANN模型,對于PLS和KPLS算法,通過采用交叉有效性法確定它們所保留的隱變量個數(shù)分別為3和6。此外,對于KPLS算法需要確定建立映射的核函數(shù),本文采用徑向基核函數(shù)作為映射函數(shù),其中c是由系統(tǒng)所決定的系數(shù)。在用三種方法分別針對兩組訓(xùn)練樣本建立6個模型后,用這些模型分別對3月22日和8月14日的測試數(shù)據(jù)進(jìn)行測試,得到的預(yù)測結(jié)果見表3。
表3 不同建模方法實(shí)驗(yàn)結(jié)果對比
從表3中可以看出,不但在訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的采集時間相近的情況下KPLS模型的預(yù)測誤差最小,而且在兩種數(shù)據(jù)的采集時間相差較遠(yuǎn)時KPLS模型也能獲得相對于PLS模型和ANN模型來說更為精確的預(yù)測結(jié)果。用3月21日和8月13日的數(shù)據(jù)分別作為訓(xùn)練數(shù)據(jù)來對3月22日的光伏出力進(jìn)行預(yù)測的結(jié)果見圖4、圖5。從這些圖中也可以看出KPLS模型的預(yù)測結(jié)果更接近實(shí)際光伏發(fā)電功率,而其余兩種方法的預(yù)測曲線與實(shí)際值偏離較大。這些實(shí)驗(yàn)結(jié)果說明了在進(jìn)行光伏出力預(yù)測時,KPLS方法能更好地提取數(shù)據(jù)的特征,建立更加準(zhǔn)確的模型,是一種有效的光伏出力預(yù)測方法。
此外,從表3中的結(jié)果還可以發(fā)現(xiàn),用相近日期的數(shù)據(jù)進(jìn)行建模來對光伏出力進(jìn)行預(yù)測可以獲得更加準(zhǔn)確的結(jié)果,比如,用3月21日的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)來對3月22日的光伏出力進(jìn)行預(yù)測比對8月14日的光伏出力進(jìn)行預(yù)測的結(jié)果更加精確,同時,用8月13日的數(shù)據(jù)建模來對8月14日的光伏出力進(jìn)行預(yù)測的結(jié)果比用3月21日的數(shù)據(jù)建模所得結(jié)果也要精確很多。因此,在實(shí)際應(yīng)用時,可以利用相似日(與預(yù)測日具有相同天氣類型的歷史日)或相鄰日(位于預(yù)測日之前且相連的歷史日)的數(shù)據(jù)進(jìn)行建模,這樣就可以得到更加精確的結(jié)果,但此種方式需要提前建立多個模型,預(yù)測光伏出力時再根據(jù)當(dāng)天的實(shí)際情況選用合適的模型進(jìn)行預(yù)測。
本文通過對光伏電站數(shù)據(jù)及相應(yīng)天氣因素相關(guān)性進(jìn)行分析,針對數(shù)據(jù)之間存在非線性的問題,提出了一種基于KPLS的光伏發(fā)電出力預(yù)測方法。該方法在處理非線性問題時能夠很好地建立起輸入變量與輸出變量之間的非線性關(guān)系,充分提取非線性系統(tǒng)的特征。實(shí)際光伏陣列數(shù)據(jù)的應(yīng)用證明了在進(jìn)行光伏發(fā)電出力預(yù)測時,KPLS有較大的優(yōu)勢,具有很好的預(yù)測精度,因此本文所提出的方法為光伏發(fā)電出力的預(yù)測提供了一種可供選擇的有效方法。但是,對于KPLS算法,由于核函數(shù)及其參數(shù)的選擇將會直接影響到映射后的特征空間,所以如何正確地選擇合適的核函數(shù)和它的參數(shù)也有待進(jìn)一步的研究。
圖4 用3月21日的數(shù)據(jù)作為訓(xùn)練樣本對3月22日的數(shù)據(jù)進(jìn)行測試的結(jié)果
圖5 用8月13日的數(shù)據(jù)作為訓(xùn)練樣本對3月22日的數(shù)據(jù)進(jìn)行測試的結(jié)果
[1] 龔鶯飛,等.光伏功率預(yù)測技術(shù)[J].電力系統(tǒng)自動化,2016,40(4).
[2] 陳志寶,等.地基云圖結(jié)合徑向基函數(shù)人工神經(jīng)網(wǎng)絡(luò)的光伏功率超短期預(yù)測模型[J].中國電機(jī)工程學(xué)報,2015,35(3).
[3] 趙書強(qiáng),等.基于不確定理論的光伏出力預(yù)測研究[J].電工技術(shù)學(xué)報,2015,30(16).
[4] ZHANG,Y. et al.Dynamical process monitoring using dynamical hierarchical kernel partial least squares[J].Chemometrics and Intelligent Laboratory Systems,2012,118(3).
[5] 劉吉臻,等.基于自適應(yīng)多尺度核偏最小二乘的SCR煙氣脫硝系統(tǒng)建模[J].中國電機(jī)工程學(xué)報, 2015,35(23).