管 霖, 趙 琦, 周保榮, 呂耀棠, 趙文猛, 姚文峰
(1. 華南理工大學電力學院, 廣東省廣州市 510641; 2. 南方電網科學研究院有限責任公司, 廣東省廣州市 510663)
近年來在國家能源發(fā)展戰(zhàn)略[1]的引導下,光伏電源建設迅速發(fā)展。對光伏發(fā)電功率的建模和預測已經成為電網規(guī)劃和調度運行極為關注的問題。
在電網規(guī)劃、可靠性評估、發(fā)電調度、調頻/調壓等電網穩(wěn)態(tài)分析中,一般不需要對光伏電源的動態(tài)特性建模,關注的是光伏輸出有功功率隨時間變化的時間序列特性及其與負荷曲線的相對關系,以下稱之為光伏功率曲線。
光伏電源的日功率曲線同時具有規(guī)律性和強波動性特征。其規(guī)律性源自地球自轉和繞日公轉的規(guī)律。其波動性和間歇性則來源于地表氣象變化和云層運動的影響。目前分布式光伏電站普遍配置了功率和環(huán)境測量與存儲裝置,能記錄光伏功率和輻照度、環(huán)境溫度等重要數(shù)據(jù),所提供的功率錄波時間尺度可以達到秒級。這些大數(shù)據(jù)資源為數(shù)據(jù)驅動的光伏功率特性挖掘、建模和預測應用創(chuàng)造了條件[2]。
國內外學者在光伏功率曲線的建模研究方面已經做了很多探索工作。文獻[3]通過對長期太陽輻照度數(shù)據(jù)的統(tǒng)計分析發(fā)現(xiàn),任一時刻的光伏功率分布呈現(xiàn)明顯的雙峰特性,可以視為兩個單峰分布的組合,適合采用Beta分布建模。文獻[4]采用Weibull分布逼近太陽輻照度概率分布,用最大似然估計進行了分布參數(shù)擬合,結果表明在某些地區(qū)模型擬合效果較好。但是,這些研究均未討論日內24 h光伏功率分布參數(shù)之間的相關性,因而難以抽樣生成合理的日光伏功率曲線。與連續(xù)概率分布建模思路不同,文獻[5-8]對各月每小時的輻照度樣本應用聚類算法,形成有限個聚類中心的離散概率。各文獻對聚類算法進行了改進,但由于沒有建立不同聚類模式與氣象信息的關系,據(jù)此概率逐小時抽樣形成的曲線同樣難以再現(xiàn)各小時光伏功率之間的關聯(lián)性,也很難應用于光伏功率預測。文獻[5-6]將日光伏功率曲線整體作為一個樣本,采用聚類方法生成各種代表性的日光伏曲線模式。文獻[7-8]進一步以風速、風向、溫度、濕度等多種天氣預報數(shù)據(jù)為輸入,建立了神經網絡模型實現(xiàn)氣象預報信息與日光伏曲線模式的匹配和預測。這種方法的不足在于難以適應日內天氣頻繁變化造成的光伏功率曲線模式的多樣化,對不同氣象參數(shù)的影響也缺乏有效的分解。此外,上述基于數(shù)據(jù)挖掘的研究成果與輻照度理論成果之間的對比和集成研究也很缺乏。
前述研究主要針對著眼于規(guī)劃和中長期分析領域的光伏建模需求,其成果多難以應用于日前光伏功率預測。針對短期光伏功率預測的研究更多傾向于采用高精度的天氣狀態(tài)監(jiān)測和預報信息。例如,基于地基云圖監(jiān)測云層移動可以實現(xiàn)高精度的超短期光伏功率預測[9-10],但預測的提前量僅十數(shù)分鐘,且監(jiān)測設備昂貴?;跀?shù)值天氣預報(numerical weather prediction,NWP)系統(tǒng),根據(jù)高時空分辨率的氣象預測結果進行短期光伏功率預測可以將預報的提前量提高到小時級[11-12]。這類方法高度依賴NWP準確度,發(fā)達國家如丹麥有較為成熟的NWP公共服務,中國則剛起步。也有研究基于氣象模式的緩變特點,采用數(shù)據(jù)外推和時間序列建模方法預測太陽輻照度和光伏功率[13-15]。鑒于對次日的天氣預報準確度低、信息量少,上述方法都很難有效解決日前光伏功率預測問題。
綜合來看,對光伏功率曲線的數(shù)據(jù)挖掘和建模研究需要進一步深入?;跀?shù)據(jù)的建模方法應能適應日光伏功率曲線模式的多變性,探索模式變化與天氣狀態(tài)變化的關聯(lián)性,并與輻照度理論模型相互印證。從而不僅可為長期運行分析提供統(tǒng)計模型,也能應用于日前光伏功率預測方面。本文對此進行了探索。
本文將光伏功率曲線分解為小時級波動特性和分鐘級波動特性兩個時間尺度進行挖掘和建模。針對小時級變化規(guī)律,為保留時間特性,按鐘點對各月的輻照度/光伏電站功率樣本進行分組。對每組樣本獨立采用聚類算法提取模式。本文的主要貢獻在于明確建立了聚類中心與天氣狀況的映射關系,進而將聚類結果與氣象理論模型相互印證,并實現(xiàn)了小時尺度模式的解析模型和參數(shù)估計。由此建立的模型可以靈活適應一日內晴、陰、雨天氣頻繁變化造成的模式切換和日功率曲線形態(tài)的多樣性。在此基礎上,本文對分鐘級波動的提取也采取了新的標準化方法,對每小時內各分鐘的樣本以該樣本所屬的小時級聚類中心為基準進行標準化,使分鐘級波動具有了顯著的單峰特性,可以采用概率分布模型提取其統(tǒng)計規(guī)律。最后針對日前光伏功率預測應用測試了所提出的數(shù)據(jù)挖掘和建模方法的有效性。
現(xiàn)階段已投運和在建的光伏電站普遍配備了較好的數(shù)據(jù)采集系統(tǒng),一般能采集到時間分辨率為分鐘級甚至秒級的光伏運行狀態(tài)和環(huán)境數(shù)據(jù),其中光伏功率、太陽輻照度和環(huán)境溫度等是常規(guī)必備采樣量。隨著越來越多的光伏電站采集數(shù)據(jù)集中到電網監(jiān)控系統(tǒng),基于數(shù)據(jù)分析和挖掘的光伏功率曲線建模與預測應用成為研究熱點。
附錄A圖A1給出了某光伏電站某天分別以1 s,1 min,15 min和1 h為采樣步長的實測功率曲線。由圖中可以看出秒級數(shù)據(jù)與分鐘級數(shù)據(jù)相似度較高,可以忽略光伏功率在分鐘內的波動。15 min級和小時級數(shù)據(jù)能基本反映光伏電源的整體變化趨勢,但無法展示光伏功率短期波動過程。如果將光伏功率曲線分解為小時級波動分量與疊加在小時級分量之上的低幅高頻波動分量分別建模,將更容易對光伏功率特性規(guī)律進行挖掘和解析。
附錄A圖A2顯示了從華南地區(qū)多個光伏電站的功率錄波數(shù)據(jù)中篩選出的6種代表性天氣的日功率曲線樣本。該光伏電站容量為50 MW,采樣步長為1 min。
分析光伏功率與氣象的關系,結合附錄A圖A1和圖A2光伏功率的數(shù)據(jù)特點,可以歸納出以下特征:①晴天、陰天和雨天的日光伏功率最大值表現(xiàn)出明顯的差異,每種單一氣象條件下,日光伏功率曲線在小時級尺度上均表現(xiàn)為峰值時段固定的單峰特性;②多云與少云主要影響光伏功率的短時波動頻率,多云氣象下光伏功率短時波動更頻繁;③對于日內氣象變化頻繁的地區(qū)或季節(jié),可能存在一日內多次晴、陰、雨的轉換,從而導致光伏日曲線的形態(tài)變化多樣,使得對日曲線直接進行聚類分析的效果受限;④某種氣象下的光伏功率特性只與當前氣象狀態(tài)有關,與之前的氣象狀態(tài)基本無關。
基于上述分析,本文提出了一種需要氣象數(shù)據(jù)少、通用性好且可解析性強的光伏功率數(shù)據(jù)挖掘和建??蚣?具體如圖1所示。
圖1 光伏發(fā)電多尺度分析及建模研究框架Fig.1 Research framework on multi-scale analysis and modeling of photovoltaic generation
首先分析大尺度光伏功率特性的挖掘和建模。以每天24個時刻點為單位將多年的光伏功率樣本分成24個集合。以10:00為例,所有上午9:30—10:30時段的光伏電站樣本均歸入10:00的樣本集合。進一步,以月為單位將每個樣本集合分割為12個子集以保留季節(jié)特性。對每個子集的樣本進行聚類分析,并設定聚類中心個數(shù)為3,以反映晴天、陰天和雨天3種氣象特征。通過聚類算法提取聚類中心。聚類中心有效濾除了幅值較小的短時功率波動的影響及多云/少云等氣象因素的影響,反映了小時級變化規(guī)律。
對于晴天的太陽輻照度計算,氣象領域已經提出了不少理論模型。這些理論模型與基于聚類獲得的與晴天對應的小時級光伏功率曲線之間可以相互驗證。同時,上述聚類分析獲得的陰天和雨天聚類結果也能彌補理論模型的不足。
在獲得各月各鐘點的光伏功率聚類中心后,可進入短時波動的建模環(huán)節(jié)。計算樣本相對于各自聚類中心的相對偏差,構成新的低幅高頻波動樣本集。這些波動實質上是由云層的運動所造成的,具有很強的隨機性。同時,由于波動量是相對于聚類中心計算的,使得樣本分布具有很好的聚集性,呈明顯的單峰特性,適宜采用常用的分布函數(shù)進行概率建模。
當模型應用于中長期光伏功率建模時,可以輸入當?shù)馗髟虑缣?、陰天、雨天的統(tǒng)計概率,采用概率抽樣方式調用模型生成小時級日光伏功率曲線。當模型應用于日前光伏功率曲線的預測時,輸入次日晴雨預報信息,調用對應的小時級聚類中心模型和短期波動概率模型,即可疊加形成日功率預測曲線。
上節(jié)所述的光伏數(shù)據(jù)挖掘框架既適用于光伏功率特性的分析,也適用于光伏電站的輻照度監(jiān)測數(shù)據(jù)的分析。由于輻照度的理論計算模型相對完整,為便于交互印證,本節(jié)以太陽輻照度數(shù)據(jù)為例說明聚類分析和建模方法。
附錄A圖A3顯示了華南地區(qū)某50 MW光伏電站2016年的部分太陽輻照度監(jiān)測數(shù)據(jù)。數(shù)據(jù)已經按照小時級尺度分析的設計,按時刻點分別組織。為便于觀察,圖中只顯示了部分時刻點、以15 min為步長的全年樣本。
以月為單位進一步劃分樣本子集,從圖中可以比較清晰地看出每個子集內的樣本呈現(xiàn)明顯的聚類特性,存在2~3個清晰的聚類中心。
本文直接采用了MATLAB的k-means函數(shù)對每個子集樣本進行聚類分析。如前文分析,預設聚類中心個數(shù)為3。每月每個時刻點均可得到高、中、低3個聚類中心,分別代表了晴天、陰天和雨天的樣本。
附錄A圖A4顯示了其中4個月度(分屬四季)的24 h的高、中、低3個聚類中心構成的日輻照度分布曲線。其余月份也有相似規(guī)律。
由前文的分析,可認為高、中、低聚類中心形成的日功率曲線與晴、陰、雨天氣相對應。鑒于晴朗少云天氣條件下的地表太陽輻照度已有氣象理論計算模型。本節(jié)首先進行晴天理論模型與聚類結果的對比檢驗,然后基于聚類結果實現(xiàn)陰雨天模型經驗參數(shù)的辨識。
基于氣象領域對太陽輻照度的計算理論[16-17],結合相關工程應用計算公式[18],可采用下面整合的經驗公式計算緯度為φ的地區(qū)m月第d天h時的地表太陽輻照度小時均值R(φ,m,d,h)。
R(φ,m,d,h)=αp(m)Cs(φ,m)·
H0(φ,m,d)Kt(h)
(1)
1)Cs為該地區(qū)晴朗天氣下的日照晴空指數(shù),綜合描述了大氣對太陽輻照度的影響,反映了入射到地表水平面的太陽輻射與地外輻射之比。它與云層運動、大氣成分、臭氧含量、含水量及氣象條件等相關。也需要基于大量歷史觀測數(shù)據(jù)獲取。目前可以方便地通過美國太空總署NASA氣象數(shù)據(jù)庫查得各經緯度下的Cs月平均值。
2)αp(m)為反映天氣變化的衰減系數(shù)。如果將天氣模式分為晴(sunny)、陰(overcast)、雨(rain)3類,則對應晴天的αs=1。對應雨天和陰天的αr和αo滿足0<αr<αo<1,需要根據(jù)當?shù)貧v史數(shù)據(jù)統(tǒng)計獲得,目前無法查到官方提供的數(shù)據(jù)。
3)H0為m月第d天的地外單日太陽輻照總量,其變化規(guī)律受地球公轉影響呈現(xiàn)確定性的時變規(guī)律。理論公式說明如下:用n代表全年中某一天的順序數(shù),例如m=12,d=31對應n=365,則有
(2)
式中:I0為地外太陽輻照度基值;δ為赤緯角;ω為時角,均可由下述經驗公式求得。
(3)
(4)
cosω=-tanφtanδ
(5)
4)Kt反映了地球自轉引起的地表太陽輻照度一日內變化系數(shù)。可以近似采用正弦分布描述如下。
(6)
式中:hsr和hss分別為日出時間和日落時間,均可根據(jù)當?shù)鼐暥韧ㄟ^經驗公式求得。
本節(jié)采用兩種方式交叉印證聚類結果及其與天氣對應關系的正確性。首先采用3.1節(jié)的理論公式計算晴天少云條件下,被研究的光伏電站所在經緯地址的地表太陽輻照度理論值,并與第2節(jié)得出的高值聚類中心結果進行對比。其次,利用第2節(jié)的中、低聚類中心曲線估計式(1)中陰、雨天的衰減系數(shù)αp(m)數(shù)值,衰減系數(shù)的參數(shù)擬合過程如附錄A圖A5所示。
仍以前文光伏電站為例,根據(jù)光伏電站的經緯度(東經108°95′、北緯19°04′)從NASA氣象數(shù)據(jù)庫提取各月的平均Cs值,應用式(1)至式(6)計算出各月15號的晴天地表輻照度日曲線。其中部分月度的晴天輻照度理論值見圖2的黑色虛線。可以看出,理論模型與來源于樣本的聚類中心模型高度吻合,因此兩者可以相互驗證。
圖2 聚類分布與模型擬合情況對比Fig.2 Comparison of cluster distribution and model fitting
然后,根據(jù)附錄A圖A5算法應用第2節(jié)得出的中、低聚類中心樣本,分別對式(1)理論模型中的衰減系數(shù)進行了估計,結果如附錄B表B1所示。
應用衰減系數(shù)估計值得出的陰天和雨天理論輻照度曲線也展示于圖2,在圖中可以觀察到其與聚類曲線的吻合度也非常高。
經過理論與數(shù)據(jù)分析模型的對比,可以驗證第2節(jié)聚類算法及其模型解析的準確性。不僅如此,應用聚類結果可以實現(xiàn)對理論模型中衰減系數(shù)的估計,解決了理論模型難以應用于不同天氣條件的不足。經過完善的理論模型可以推廣應用于缺乏光伏監(jiān)測數(shù)據(jù)的光伏電站功率預測,在規(guī)劃和調度領域均有廣闊的應用前景。
光伏電站的功率具有顯著的短時波動特性,這主要是由于大氣和云層運動引起的,在多云和陰雨天氣波動性尤為顯著。以上述華南地區(qū)某光伏電站的分鐘級和秒級功率錄波數(shù)據(jù)為例,分析光伏功率短時波動的周期和幅度特性。附錄A圖A6分別給出了一個多云天氣的24 h功率序列,其中波動較大的2 h功率序列展開圖,以及隨機抽取的5個具體時刻的60 s功率錄波。
可以看出,由于云層運動速度不快,光伏功率基本沒有秒級波動,其主要的短時波動周期在數(shù)分鐘(2~5 min)至十數(shù)分鐘之間。因此對光伏功率的建模和預測的最小時間尺度取1~5 min即可。
在短時波動建模分析時,為了排除天氣狀況在晴、陰、雨之間轉換的影響,同時保留多云/少云造成的短時波動模式變化,本文采用第2節(jié)的聚類結果,設計了以下短時波動樣本提取和標準化方法:
(7)
經上述標準化處理之后,多云、陰天和雨天3種天氣下的短時波動樣本值絕大多數(shù)集中在[0,1]的數(shù)值區(qū)間。由于小時尺度的功率變化影響已經被變換消除,因此短時波動模式與時刻點基本無關,可以歸并同一氣象條件下不同時刻點的樣本以減少短時波動樣本集個數(shù)。
附錄A圖A8顯示了3種氣象條件代表時段的短時波動樣本時間序列。對多云、陰天和雨天3種天氣的光伏功率短時波動樣本集進行統(tǒng)計分析,3種氣象狀態(tài)下的頻數(shù)圖如圖3所示。
圖3 短時波動樣本概率分布直方圖Fig.3 Probability distribution histogram of short-term fluctuation samples
可以看出,不同天氣條件下的光伏短時波動均表現(xiàn)出較為明顯的單峰特性,可以采用典型概率分布模型及其組合模型進行概率建模,并選出合適的理論模型和參數(shù)。本文采用了較為簡單的模型進行模擬,其分布示于圖3,模型和參數(shù)說明如下。
1)對多云天氣,采用兩個正態(tài)分布的疊加模型(二階高斯分布)。一階正態(tài)分布均值和方差為(0.967,0.040),二階正態(tài)分布均值和方差為(0.393,0.138)。
2)陰天的概率分布采用正態(tài)分布,均值和方差分別為(0.583,0.090)。
3)雨天的概率分布采用正態(tài)分布,均值和方差分別為(0.547,0.034)。
前文提出了基于光伏電站錄波數(shù)據(jù)的特征挖掘和理論建模方法。所建模型既可以用于原電站的日前或超短期功率預測(聚類分布模型),也可以用于其他規(guī)劃電站的功率曲線預測(理論模型)。模型應用于日前功率預測的基本流程如下。
步驟1:輸入日期和經緯度,計算預測日的晴天、陰天和雨天以小時為步長的24 h大尺度功率曲線。這里,既可以采用第2節(jié)得出的聚類中心模式,也可以采用第3節(jié)得出的理論計算模型和擬合參數(shù)。
步驟2:根據(jù)次日天氣預報,確定晴、多云、陰和雨4種天氣狀態(tài)對應的時段。分別對相應時段匹配對應的小時級功率曲線段,拼接形成未計及短期波動的光伏功率基準曲線。其中,多云天氣選擇晴天模型。
步驟3:針對多云、陰、雨3種天氣模式對應的時段分別采用各自的短時波動概率模型進行連續(xù)抽樣,抽樣對應的時間步長可取2~5 min。根據(jù)式(7)逆變換并疊加至原有光伏功率基準曲線即可得出次日以分鐘為單位的光伏功率預測結果。
仍以前文所述光伏電站為例,采用第2、第3節(jié)的算法對2016年的全年光伏錄波數(shù)據(jù)進行挖掘和建模。然后采用2015年的樣本進行光伏功率預測的測試和檢驗。
以下給出了2015年7月某日的預測過程和結果實例。為了觀察誤差范圍,實例采用的是精度相對較低的理論模型預測方式。
首先,根據(jù)經緯度查詢美國太空總署NASA氣象資料庫得到7月光伏電站所在區(qū)域的平均日照晴空指數(shù)為0.68。采用第3節(jié)的輻照度經驗模型和衰減系數(shù)的擬合參數(shù),生成晴、陰、雨3種狀態(tài)大時間尺度的輻照度曲線。然后,采用下式計算光伏功率:
(8)
式中:Ps為光伏電源額定功率;αT為光伏板的功率溫度系數(shù),本文取晶體硅太陽能光伏組件的功率溫度系數(shù)為-0.35%/℃;T為運行光伏組件溫度,本文以天氣預報的預測氣溫代入計算。通過查找歷史氣象預報資料,可得到光伏電站在預測日相關時段的天氣信息如附錄B表B2所示。
按照5.1節(jié)各步驟得出的3種典型功率曲線、拼接形成的預測日基準曲線,以及計及短期波動隨機抽樣后的最終預測光伏功率曲線分別示于圖4(a)和圖4(b)??梢钥闯?,預測曲線與實際功率曲線具有較好的吻合度。
圖4 日前光伏功率預測曲線Fig.4 Day-ahead photovoltaic power forecasting curves
圖5還給出了對2015年2月某周連續(xù)5 d的預測結果與實際光伏功率錄波的對比。選擇該時段是因為這5 d恰好出現(xiàn)了多種天氣狀況,可以更好地展示模型對不同天氣條件的適應性。
圖5 多日光伏出力及其預測曲線對比Fig.5 Comparison of multi-day photovoltaic power and its forecasting curves
采用平均誤差(mean error,ME)和平均百分比誤差(mean percentage error,MPE)評估日前光伏功率預測的誤差水平,計算公式分別如式(9)和式(10)所示。
(9)
(10)
式中:xi為樣本值;x為標準值;n為樣本總數(shù)。
圖5的5 d預測結果的平均絕對誤差僅為1.12 MW,相對于額定功率的標幺值為0.022。平均百分比誤差為11.43%,小于光伏預測的平均百分比誤差要求范圍(20%)。
可以看出,本文的日前光伏功率預測對日前天氣預報的數(shù)據(jù)需求非常少,只要求較準確預測次日的晴、陰、雨走向,無需風速、風向、濕度等信息,大幅降低了天氣預報誤差對光伏功率預測精度的影響。
本文提出了一套完整、有效的光伏錄波數(shù)據(jù)挖掘和功率特性建模方法。采用多尺度分析、聚類算法和概率分布模型實現(xiàn)了對光伏功率快速波動和長時間尺度變化規(guī)律的挖掘和建模。應用所建立的模型,只需要少量常規(guī)的天氣預報數(shù)據(jù)即可實現(xiàn)日前光伏功率曲線的準確預測。論文提出的模型和算法已經采用兩個不同地區(qū)的光伏電站多年錄波數(shù)據(jù)進行了校核。進一步的研究包括更大范圍的應用測試及對相鄰區(qū)域不同光伏電站數(shù)據(jù)挖掘結果和模型參數(shù)的對比,以期挖掘出更豐富的關聯(lián)信息和參數(shù)變化規(guī)律。
附錄見本刊網絡版(http://www.aeps-info.com/aeps/ch/index.aspx)。