嚴(yán)華江,章堅(jiān)民,胡瑛俊,張力行,焦田利,,聞 安
(1.國網(wǎng)浙江省電力有限公司電力科學(xué)研究院,杭州 310014;2.杭州電子科技大學(xué) 自動(dòng)化學(xué)院,杭州 310018;3.國網(wǎng)浙江寧波市鄞州區(qū)供電有限公司,浙江 寧波 315100;4.浙江華云信息科技有限公司,杭州 310012)
大力推進(jìn)分布式光伏應(yīng)用,已成為新能源重點(diǎn)發(fā)展方向之一[1]。分布式光伏電站大規(guī)模并網(wǎng),使配電網(wǎng)面臨電能質(zhì)量、諧波、經(jīng)濟(jì)運(yùn)行等一系列問題[2-3],因此科學(xué)地進(jìn)行分布式光伏出力分析和預(yù)測十分必要。
目前,國內(nèi)外學(xué)者對光伏發(fā)電出力預(yù)測問題已做了很多研究。分布式光伏功率預(yù)測不同于集中式光伏電站[4]:一是位置分布分散且裝機(jī)容量較??;二是無法獲取就地日照和溫度等氣象數(shù)據(jù)。因此分布式光伏出力難以實(shí)現(xiàn)基于氣象數(shù)據(jù)的預(yù)測,只能采取基于歷史數(shù)據(jù)來預(yù)測。
目前光伏出力預(yù)測方法主要分為直接預(yù)測法和間接預(yù)測法:
(1)間接預(yù)測法,是基于相關(guān)氣象數(shù)據(jù)的光伏預(yù)測方法。由于日照幅度與光伏出力具有最強(qiáng)的相關(guān)性[5],文獻(xiàn)[6-8]對云團(tuán)采取分析建模并預(yù)測其演變過程,達(dá)到間接預(yù)測光伏所在地日照幅度的目的,為后續(xù)的功率預(yù)測提供參數(shù)支持。文獻(xiàn)[9-10]基于歷史氣象數(shù)據(jù)和天氣預(yù)報(bào)數(shù)據(jù),分別采用神經(jīng)網(wǎng)絡(luò)算法和多元線性回歸法對輻照度進(jìn)行建模分析,進(jìn)而預(yù)測輸出功率。
(2)直接預(yù)測法,是主要依靠光伏實(shí)際出力數(shù)據(jù)實(shí)現(xiàn)出力預(yù)測的一種方法,如通過“相似日”出力數(shù)據(jù)時(shí)序關(guān)聯(lián)預(yù)測未來出力[11-16],其中關(guān)聯(lián)關(guān)系采取多元線性回歸法[11-12]、灰色理論預(yù)測法[13];文獻(xiàn)[14-16]對相似日數(shù)據(jù)的選擇采用了不同方法,文獻(xiàn)[14]篩選出氣象與出力間呈弱或強(qiáng)相關(guān)的相似日數(shù)據(jù),文獻(xiàn)[15]提出基于粒子群和BP 神經(jīng)網(wǎng)絡(luò)的相似日訓(xùn)練方法,文獻(xiàn)[16]提出基于Kmeans 聚類的相似日分類方法。
氣象作為影響光伏出力的主要因素,在其局部區(qū)域存在相關(guān)性,使該區(qū)域的分布式光伏出力存在空間相關(guān)性[17]。近年來有一系列關(guān)于不同光伏電站相關(guān)性的判定方法研究,如基于不同光伏電站實(shí)測出力時(shí)間序列以及輻照度數(shù)值的相關(guān)性系數(shù)[18],出力時(shí)間序列間的歐氏距離在閾值范圍內(nèi)[19],分布式光伏站點(diǎn)間輻照度的空間相關(guān)KL散度距離[20]??臻g相關(guān)性研究方法主要分為兩類:一類為無氣象數(shù)據(jù)電站建立的與具有氣象數(shù)據(jù)支持電站空間數(shù)據(jù)相關(guān)的“相似電站”,進(jìn)而通過“相似電站”來進(jìn)行無氣象數(shù)據(jù)電站的出力預(yù)測[21];另一類是形成具有相似性的電站群,如文獻(xiàn)[22]取距離待預(yù)測目標(biāo)電站最近的N 個(gè)電站作為相關(guān)性從站加入AR 預(yù)測模型中,結(jié)合自身和周圍具有相關(guān)性電站的出力數(shù)據(jù),從而提高預(yù)測精度。
本文作者在文獻(xiàn)[23]提出了一種基于空間相關(guān)性的大規(guī)模分布式光伏群的劃分方法。首先將氣象對光伏出力的影響程度劃分為大氣候和小氣候2 類:前者為日照或5 類天氣類型影響,其中天氣類型依據(jù)光伏實(shí)際出力占額定出力的比例來劃分,相應(yīng)地將歷史數(shù)據(jù)時(shí)段劃分為5 類天氣類型樣本群;后者為光伏安裝高程、溫度、濕度以及周圍地理環(huán)境等廣義小氣候影響,基于歷史5類天氣類型樣本群,對光伏空間位置進(jìn)行聚類分析,從而劃分分布式光伏區(qū)域。綜合考慮區(qū)域不合群的光伏點(diǎn)數(shù)量和區(qū)塊的氣象一致性來選擇最優(yōu)地域分塊方案,已達(dá)到最少部署氣象站點(diǎn)的目的或?yàn)榇笠?guī)模分布式光伏空間-時(shí)間相關(guān)的功率預(yù)測提供依據(jù)。文獻(xiàn)以具有豐富氣候帶地貌特征的某縣級市遍布全境的2 887 個(gè)分布式用戶光伏群為案例,很好地驗(yàn)證所提的方法。
基于文獻(xiàn)[23],本文提出基于空間相關(guān)性和ARIMA 模型的分布式光伏功率預(yù)測方法,首先利用已提出的大規(guī)模區(qū)域分布式光伏分群方法篩選分群電站中與待預(yù)測電站的出力具有空間相關(guān)性的光伏電站,建立不同天氣類型下的ARIMA模型,并與日天氣預(yù)報(bào)信息匹配,利用相應(yīng)模型實(shí)現(xiàn)光伏功率預(yù)測。
廣義天氣類型的分類方法很多,文獻(xiàn)[24]提出了劃分天氣類型的原則,即典型性和代表性。而日照幅度作為光伏出力的影響要素之一且其影響最大[25],譬如晴天的日照幅度最大,相應(yīng)的光伏出力曲線變化平滑且能取到最大值;雨天因云層的遮擋作用,光伏整體出力和波動(dòng)較小;而多云和陰天時(shí)的光伏出力介于兩者之間,光伏出力變化較大且不穩(wěn)定。圖1 反映了不同天氣類型下的光伏出力水平,研究了不同天氣類型下光伏的出力特征,本文將廣義天氣類型分為4 類,分別為晴天、多云、陰天和雨天。
光伏日平均出力是指光伏在可發(fā)電時(shí)間內(nèi)發(fā)電的平均值。由實(shí)際光伏出力的統(tǒng)計(jì)數(shù)據(jù)可得,在理想條件下光伏出力曲線具有對稱的特點(diǎn),因而光伏日平均出力可反映全天光伏出力水平[26],用公式表示為:
圖1 不同天氣類型的光伏日出力特征曲線
式中:n 為可發(fā)電時(shí)間的長度;Pi為第i 時(shí)刻光伏的出力值,對廣域分布式光伏用戶,為去除不同裝機(jī)容量等量綱對光伏出力造成的差異,應(yīng)首先對Pi標(biāo)幺化處理。光伏日平均出力的大小直接反映了光伏的發(fā)電效率和天氣狀況的關(guān)系,若光伏的發(fā)電效率高,代表其日出力平均值較高,日照幅度較高,天氣晴朗;反之,發(fā)電效率低代表日出力水平較低,則表明日照幅度較低,天氣狀況較差。
ARIMA(自回歸移動(dòng)平均)模型是一類常用的擬合平穩(wěn)時(shí)間序列的模型,體現(xiàn)了系統(tǒng)對歷史自身狀態(tài)和進(jìn)入系統(tǒng)的噪聲的記憶,即序列在t時(shí)刻的取值是關(guān)于前p 個(gè)歷史觀測值和前q 個(gè)隨機(jī)干擾的多元線性函數(shù),記為ARIMA(p,q):
式中:誤差項(xiàng)εt為均值為零的白噪聲序列代表t時(shí)刻的隨機(jī)干擾。而ARIMA(p,d,q)模型是d 階差分和ARIMA(p,q)的組合。在數(shù)據(jù)預(yù)處理時(shí),需對序列首先進(jìn)行平穩(wěn)性檢測,非平穩(wěn)時(shí)間序列可通過有限次的差分形成平穩(wěn)時(shí)間序列再進(jìn)行建模。文獻(xiàn)[27]通過觀察自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì)進(jìn)行模型定階,但這種人為識別的方法具有不確定性,本文使用AIC(赤池信息量準(zhǔn)則)來進(jìn)行定階,選取AIC 值最小時(shí)的p,q 作為模型階數(shù),AIC 計(jì)算公式如下:
模型參數(shù)可通過最小二乘估計(jì)或最大似然估計(jì)、矩估計(jì)確定,對于足夠長時(shí)間序列的訓(xùn)練樣本,3 種方法所得參數(shù)漸進(jìn)相等,因此本文選用最小二乘估計(jì)法,即對目標(biāo)函數(shù):
之后檢驗(yàn)殘差序列{εt}的白噪聲,若殘差序列為白噪聲序列,即表明模型參數(shù)提取正確,為有效參數(shù)模型;若非白噪聲序列,則表明序列中還殘余待提取的有用信息,需重新擬合模型。ARIMA模型建模流程如圖2 所示。
圖2 ARIMA 建模步驟
光伏單站的實(shí)際出力時(shí)間序列按天氣分類后,分別對不同天氣類型的數(shù)據(jù)樣本進(jìn)行ARIMA模型建模,作為預(yù)測參考模型對比本文提出的引入空間相關(guān)性后的光伏出力預(yù)測模型。
廣域分布式光伏電站因其具有較多且長時(shí)間出力序列數(shù)據(jù),歐式距離的計(jì)算量較大,因此本文中使用Spearman 秩相關(guān)系數(shù)來計(jì)算2 個(gè)電站之間的相關(guān)性,公式如下:
提取同一區(qū)域中所有電站同維度的歷史出力數(shù)據(jù),基于不同天氣分類的數(shù)據(jù)樣本,分別計(jì)算其與待預(yù)測電站歷史出力數(shù)據(jù)的Spearman 秩相關(guān)性系數(shù),篩選相關(guān)系數(shù)大于某一設(shè)定閾值的電站或值最高的N 個(gè)光伏電站作為待預(yù)測電站的相關(guān)性從站。本文以其中一個(gè)光伏用戶為例,篩選相關(guān)值大于0.8 的光伏電站作為此用戶的相關(guān)性從站,其地理位置(經(jīng)緯度)及Spearman 秩相關(guān)系數(shù)分布如圖3 所示,其中R 代表待預(yù)測光伏電站,其余為相關(guān)性從站,可得相關(guān)性較高的電站均分布在與待預(yù)測電站地理相近的位置,距離越近相關(guān)性越高,這也驗(yàn)證了局部氣象的一致性。
圖3 相關(guān)性電站的經(jīng)緯度分布
本文改進(jìn)了單一時(shí)間序列的ARIMA 模型,引入多個(gè)相關(guān)性光伏電站實(shí)際出力數(shù)據(jù)建立待預(yù)測電站的ARIMA 模型,進(jìn)而提高了模型的預(yù)測精度。
假設(shè)待預(yù)測電站X 有N 個(gè)相關(guān)性光伏電站,p,q 為ARIMA 模型的階數(shù),其出力預(yù)測模型為:
式中:εt是當(dāng)前時(shí)刻的隨機(jī)干擾;系數(shù)γ=[α0,α(l,x),β(l,x),α(l,i),β(l,i)],1≤i≤N,0≤l≤Ls;可由最小二乘估計(jì)法計(jì)算出:
為避免X 矩陣維度過高而導(dǎo)致模型計(jì)算復(fù)雜,在匹配相關(guān)性電站時(shí)可調(diào)整設(shè)定相關(guān)性系數(shù)的閾值,從而控制相關(guān)性從站數(shù)量,以達(dá)到簡化模型計(jì)算的目的。
數(shù)據(jù)樣本選自某省份地級市具有豐富天氣類型的6—9 月共92 天的分布式光伏實(shí)際出力數(shù)據(jù),截取8:00—18:00 為光伏出力的有效時(shí)間,采用文獻(xiàn)[23]基于空間相關(guān)性的大規(guī)模分布式用戶光伏分群方法得到的具有氣象一致性區(qū)域劃分,如圖4 所示;在此基礎(chǔ)上,以其中1 個(gè)區(qū)域的232 個(gè)光伏用戶為例驗(yàn)證模型的有效性。
圖4 按空間相關(guān)性光伏分群方法得到的具有氣象一致性區(qū)域劃分
首先對每一個(gè)用戶的實(shí)際出力數(shù)據(jù)進(jìn)行標(biāo)幺化,根據(jù)日出力平均水平劃分天氣類型,基于不同天氣類型的光伏出力數(shù)據(jù),計(jì)算待預(yù)測電站與其他電站歷史出力數(shù)據(jù)的秩相關(guān)系數(shù),選取且相關(guān)性最好的5 個(gè)電站為相關(guān)性從站引入基于空間相關(guān)性的ARIMA 模型中,建立不同天氣類型的預(yù)測模型,與氣象部門給出的日預(yù)報(bào)天氣類型對照,選擇相應(yīng)天氣類型的預(yù)測模型進(jìn)行出力預(yù)測。若未匹配到相關(guān)性電站,則利用待預(yù)測電站自身出力數(shù)據(jù)劃分天氣類型進(jìn)行ARIMA 建模。其預(yù)測流程如圖5 所示。
以某區(qū)域某一光伏用戶為例,其歷史最大功率為3.175 9 kW,出力數(shù)據(jù)經(jīng)標(biāo)幺化后,根據(jù)日出力平均水平對其出力數(shù)據(jù)按天氣分類并分別建立只利用本站出力歷史數(shù)據(jù)而建立的ARIMA 模型(參考模型),其不同天氣類型的分類指標(biāo)和模型參數(shù)如表1 所示。
表1 天氣類型和對應(yīng)模型參數(shù)
含本站以及空間相關(guān)電站功率歷史數(shù)據(jù)建立的本站ARIMA 功率預(yù)測模型,稱為基于空間相關(guān)性的預(yù)測模型,并將其與參考模型進(jìn)行對比:圖6(a)給出了某一典型光伏某月31 天實(shí)測和預(yù)測功率曲線,圖6(b)顯示了其中某天的實(shí)測功率和2 條預(yù)測功率,可得引入空間相關(guān)性后,光伏出力預(yù)測精度有了明顯提高。
圖5 基于空間相關(guān)性的ARIMA 模型預(yù)測框架
圖6 某典型電站預(yù)測與實(shí)測功率曲線
從圖6 可得出,某些時(shí)刻的相關(guān)性預(yù)測出力仍存在一定的偏差;而日發(fā)電量是光伏電站發(fā)電有效時(shí)間出力的累計(jì)值,它表征光伏一天的運(yùn)行狀態(tài)和工作效率,因此本文在此基礎(chǔ)上統(tǒng)計(jì)了光伏用戶的日發(fā)電量的預(yù)測結(jié)果,對比曲線如圖7所示,可得在日電量預(yù)測上模型的精度很高,可滿足工程應(yīng)用的需求。
圖7 日發(fā)電量對比曲線
本文研究統(tǒng)計(jì)了區(qū)域中所有光伏電站為期一個(gè)月的出力預(yù)測誤差,并使用預(yù)測模型中常用的誤差指標(biāo)來評估模型對于區(qū)域整體的預(yù)測效果,其計(jì)算公式如下。
均方根誤差為:
平均絕對誤差為:
引用誤差為:
式中:PE為光伏電站的額定功率。
預(yù)測曲線與實(shí)際曲線的相關(guān)性系數(shù)為:
圖8 描述了該區(qū)域232 個(gè)電站連續(xù)滾動(dòng)預(yù)測曲線與實(shí)際曲線的多誤差指標(biāo)按照電站額定功率的對比情況,表2 給出了誤差指標(biāo)均值和離散度,表3 計(jì)算了RMSE 和MAE 2 項(xiàng)指標(biāo)與電站額定功率的關(guān)聯(lián)關(guān)系,結(jié)合圖8、表2 和表3,可得:
(1)RMSE 和MAE 具有很大的關(guān)聯(lián)性。
(2)在為期31 天的預(yù)測里,陰天和多云天氣占比較多,且2 種天氣下光伏的出力波動(dòng)較大,從而導(dǎo)致RMSE 和MAE 波動(dòng)較大。
(3)RMSE 和MAE 隨額定功率增加逐漸增大,且呈現(xiàn)出正相關(guān),因此RMSE 和MAE 作為預(yù)測評價(jià)指標(biāo)較為片面。
(4)引用誤差作為分布式光伏預(yù)測新的評價(jià)方法,很好地規(guī)避了在出力較小時(shí)刻的誤差影響,體現(xiàn)了高功率輸出的預(yù)測精度,因而更為合適。
圖8 區(qū)域內(nèi)所有電站的月預(yù)測誤差統(tǒng)計(jì)
表2 誤差指標(biāo)均值和離散度
表3 誤差指標(biāo)相關(guān)度
通過分析,光伏日出力曲線高功率部分的預(yù)測精度更為關(guān)鍵,因此本文提出采取引用誤差作為預(yù)測模型的評價(jià)計(jì)算方法,且通過與均方根誤差、平均絕對誤差、相關(guān)性系數(shù)進(jìn)行對比,驗(yàn)證了引用誤差的優(yōu)勢。
在分布式光伏預(yù)測方面,本文首先基于作者提出的空間相關(guān)性大規(guī)模分布式用戶光伏分群方法劃分氣象一致性區(qū)域;之后基于不同天氣類型下光伏實(shí)際出力數(shù)據(jù),選取同一區(qū)域中具有空間相關(guān)性的光伏電站,改進(jìn)了ARIMA 模型,并結(jié)合算例分析驗(yàn)證了模型對廣域分布式光伏用戶預(yù)測出力的實(shí)用性和準(zhǔn)確性。