夏麗麗, 蘇 華
(1.西南交通大學(xué) 數(shù)學(xué)學(xué)院,成都 610031;2.四川航天長征裝備制造有限公司,成都 610199)
風(fēng)能是清潔的可再生能源,發(fā)展風(fēng)能對于改善能源結(jié)構(gòu)、保護(hù)生態(tài)環(huán)境等方面有及其重要的意義。中國地形分布復(fù)雜,除了沿海地區(qū)、高原地區(qū)存在豐富的風(fēng)能源,山區(qū)的風(fēng)能源也很值得研究,本文對云南山區(qū)的風(fēng)速數(shù)據(jù)進(jìn)行研究。在實際研究中發(fā)現(xiàn),準(zhǔn)確得到風(fēng)速數(shù)據(jù)的概率密度函數(shù)將減少風(fēng)能輸出估算的不確定性?,F(xiàn)在許多概率分布都用于風(fēng)速分布的研究,張盼盼[1]比較了正態(tài)分布和威布爾分布,分析哪種分布函數(shù)模擬風(fēng)速分布的效果比較理想,得到的結(jié)果是兩參數(shù)威布爾分布是擬合風(fēng)速較好的模型;楊曉鵬等[2]通過數(shù)值模擬一年云南風(fēng)速,對云南風(fēng)能資源分布進(jìn)行研究;洪祖蘭等[3]對云南省356個測風(fēng)塔的地理分布以及風(fēng)速風(fēng)況特征進(jìn)行研究;Nage[4]比較了威布爾分布和瑞利分布,從分布的統(tǒng)計分析來看,威布爾分布在擬合概率密度分布方面比瑞利分布更好;Wais[5]提出使用三參數(shù)威布爾分布用于擬合風(fēng)速數(shù)據(jù),結(jié)果表明:對于零風(fēng)速的較高概率,三參數(shù)威布爾分布與雙參數(shù)威布爾分布相比給出了更好的結(jié)果;Kantar等[6]提出擴(kuò)展廣義Lindley分布可替代風(fēng)速分布用于評估風(fēng)能潛力;Morgan等[7]在評估海上風(fēng)電場時,認(rèn)為兩參數(shù)對數(shù)正態(tài)分布在估計極端風(fēng)速方面表現(xiàn)最佳;Pishgar-Komleh等[8]在分析Firouzkooh地區(qū)的風(fēng)速數(shù)據(jù)時,在威布爾和瑞利分布函數(shù)的基礎(chǔ)上很好地得到了風(fēng)速的實際值。
本研究的主要目的是評估各類分布對于云南風(fēng)速的適用性,并確定最適合在云南山區(qū)建模的風(fēng)速數(shù)據(jù)的分布。本文選取了幾種常規(guī)分布,應(yīng)用極大似然方法進(jìn)行參數(shù)估計,選取決定系數(shù)R2、Kolmogorov-Smirnov檢驗、卡方檢驗、均方根誤差(RMSE)和貝葉斯信息準(zhǔn)則(BIC)進(jìn)行擬合優(yōu)度檢驗,在直方圖畫出擬合曲線以及QQ圖進(jìn)行直觀分析,并利用所選分布計算各個站點(diǎn)理論風(fēng)功率密度與實際風(fēng)功率密度比較相對誤差。
最常用的分布有威布爾分布、伽馬分布[9]、對數(shù)正態(tài)分布、正態(tài)分布、瑞利分布[10],它們的概率密度函數(shù)由表1給出。
表1 所選分布的概率密度函數(shù)和風(fēng)功率密度函數(shù)Table 1 Probability density function and wind power density function of selected distribution
常用的參數(shù)估計方法有最大似然估計、矩法估計和最小二乘法[7-9]。考慮數(shù)據(jù)的量比較大,此處選用極大似然估計來進(jìn)行參數(shù)估計。
極大似然方法是常用的分布參數(shù)估計方法之一,在該方法中,通過最大化似然函數(shù)或?qū)?shù)似然函數(shù)來估計參數(shù)。似然函數(shù)是模型參數(shù)的函數(shù),由式(1)給出:
(1)
其中,f(vi;θ)是概率密度函數(shù),vi是第i個風(fēng)速數(shù)據(jù),n是數(shù)據(jù)點(diǎn)的數(shù)量,θ是分布的參數(shù)向量。為了減小計算的復(fù)雜性,通常采用對數(shù)似然函數(shù)來估計概率分布的參數(shù)。對數(shù)似然函數(shù)表示為
(2)
為了評估不同模型在確定風(fēng)速分布方面的準(zhǔn)確性,選擇以下5個指標(biāo):決定系數(shù)R2、卡方統(tǒng)計量χ2、K-S檢驗、RMSE以及BIC準(zhǔn)則進(jìn)行分布的擬合優(yōu)度評估[11]。
(3)
(4)
(5)
(4) 均方根誤差檢驗(RMSE)。均方根誤差檢驗(RMSE)描述了觀測概率與預(yù)測概率之間實際偏差的逐項比較,RMSE值SRMSE越小表示分布擬合越好[1]。均方根誤差檢驗值定義為
(6)
(5) 貝葉斯信息(BIC)準(zhǔn)則。衡量統(tǒng)計模型擬合優(yōu)良性的一種標(biāo)準(zhǔn),BIC值越小,說明模型擬合越好。BIC值定義為
SBIC=-2lnL+klnn
(7)
其中n是數(shù)據(jù)的個數(shù),L是似然函數(shù),k是參數(shù)個數(shù)。
數(shù)據(jù)來自云南山區(qū)的4個氣象站點(diǎn),站點(diǎn)0579位于雙柏縣愛尼山鄉(xiāng)(南),站點(diǎn)8415位于馬龍縣納章鎮(zhèn)瓦古沖村,站點(diǎn)0229曲靖市富源縣墨紅鎮(zhèn),站點(diǎn)8013位于云縣。在本研究中,使用10 m高度的每10 min平均風(fēng)速。這些風(fēng)速數(shù)據(jù)記錄在云南的4個氣象站。高度、記錄周期、經(jīng)緯度以及海拔等信息如表2所示。表3列出了各站點(diǎn)中風(fēng)速數(shù)據(jù)的最大值、平均值、中值、標(biāo)準(zhǔn)差、偏度系數(shù)和峰度系數(shù)等統(tǒng)計數(shù)據(jù),從表3可以看出,所有偏度系數(shù)均大于0,說明風(fēng)速分布均是右偏分布。
表2 研究站點(diǎn)的地理位置Table 2 The geographical location of the research stations
表3 站點(diǎn)風(fēng)速數(shù)據(jù)的描述性統(tǒng)計Table 3 Descriptive statistics of wind speed data at the stations
3.2.1 模型評估
對于每個站點(diǎn),基于不同分布,采用極大似然方法估計每種分布的參數(shù),表4中給出了極大似然理論對于混合分布和威布爾分布的參數(shù)估計值。表5分別給出雙柏縣站點(diǎn)、富源縣站點(diǎn)、云縣站點(diǎn)、馬龍縣站點(diǎn)包含威布爾分布在內(nèi)的5個分布,基于RMSE、卡方統(tǒng)計量χ2、K-S檢驗,決定系數(shù)(R2)以及BIC準(zhǔn)則,通過式(4)—式(7)進(jìn)行擬合優(yōu)度值計算。
表4 所有站點(diǎn)不同分布的參數(shù)估計值Table 4 Estimated values of the parameters of different distributions of all stations
表5 所有站點(diǎn)擬合優(yōu)度檢驗的值Table 5 All stations goodness of fit test value
從表5中可以看出:雙柏縣站點(diǎn)基于R2,SK-S、卡方統(tǒng)計量、SRMSE以及SBIC,威布爾分布表現(xiàn)最好;馬龍縣站點(diǎn)基于上述5個檢驗得出正態(tài)分布表現(xiàn)最好;云縣基于5個檢驗得出威布爾分布和正態(tài)分布表現(xiàn)都好,從數(shù)值上來看差別不大;富源縣站點(diǎn)瑞利分布表現(xiàn)較好,其次是威布爾分布和伽馬分布,三者差別較小。為了準(zhǔn)確判別云南山區(qū)風(fēng)速最合適的頻率分布,考慮引入直方圖和QQ圖進(jìn)行更直觀的比較。
3.2.2 模型直方圖和QQ圖的比較
一般來說,樣本容量越大,頻率分布直方圖就會無限接近總體密度曲線,就越精確地反映總體的分布規(guī)律,即越精確地反映總體在各個范圍內(nèi)取值百分比。在直方圖中畫出擬合分布的密度曲線可以直觀看出擬合曲線與樣本直方圖的擬合程度,從而直觀地判斷分布對于樣本數(shù)據(jù)擬合的優(yōu)良性。除此之外,在統(tǒng)計學(xué)中,QQ(分位數(shù)-分位數(shù))是通過圖形比較兩個概率分布的方法。如果被比較的兩個分布相似,則QQ圖中的點(diǎn)將大致位于線y=x上。此處QQ圖用于比較站點(diǎn)數(shù)據(jù)與理論分布的擬合程度,圖中的點(diǎn)越接近線y=x,則說明該理論分布對數(shù)據(jù)擬合較好。
針對表4得出的結(jié)論,在直方圖中畫出各個理論分布的密度曲線比較擬合結(jié)果。圖1—圖4分別針對各個站點(diǎn)畫出直方圖以及數(shù)據(jù)與理論分布的QQ圖,以進(jìn)行更直觀的比較。
由圖1—圖4可以看出:富源縣站點(diǎn)和雙柏縣站點(diǎn)直方圖和QQ圖顯示威布爾分布更合適在直方圖的擬合密度曲線中表現(xiàn)出最好的結(jié)果。雖然馬龍縣和云縣的威布爾分布密度曲線和正態(tài)分布曲線在直方圖中表現(xiàn)有所差別,但是發(fā)現(xiàn)二者的QQ圖曲線幾乎重合在一起。為了對云南山區(qū)風(fēng)速分布的選擇更加合理,下面從風(fēng)功率密度的角度來分析。
對于觀測區(qū)域的風(fēng)況特征進(jìn)行分析,有助于估算風(fēng)能潛力。風(fēng)功率概率密度函數(shù)在風(fēng)力渦輪機(jī)的設(shè)計過程和潛在場地可用的風(fēng)力資源評估過程中都是有用的。在科學(xué)文獻(xiàn)中,通常使用對應(yīng)于標(biāo)準(zhǔn)條件(海平面,15 ℃)的恒定值空氣密度ρ=1.225 kg/m3。通過葉片掃掠區(qū)域Sw以速度V飛行的風(fēng)力隨著其速度的立方增加,因此每單位面積的風(fēng)流中可用的功率(風(fēng)功率密度)可表示為[12]
(8)
其中:ρ是空氣密度,取決于海拔高度、氣壓和溫度。平均風(fēng)功率密度基于風(fēng)速的分布函數(shù)f(V)定義為
(9)
實際樣本的風(fēng)功率密度計算公式為
(10)
其中:n是觀測樣本的個數(shù)。表6給出了4個站點(diǎn)風(fēng)功率密度值與真實值的比較結(jié)果。
表6 4個站點(diǎn)基于分布的風(fēng)功率密度理論值與實際風(fēng)功率密度及其相對誤差Table 6 Theoretical values of wind power density and actual wind power density values at four stations and their relative errors
使用真實數(shù)據(jù)獲得的結(jié)果與各個分布的解析式獲得的結(jié)果之間的比較是通過相對百分比誤差來評估的,該值顯示了對應(yīng)分布的準(zhǔn)確性,定義為
(11)
從表6中可以看出:威布爾分布下的理論風(fēng)功率密度與實際相對誤差富源縣為0.53,馬龍縣為0.05,雙柏縣為0.09,云縣為0.197,故威布爾分布為4個站點(diǎn)中所選分布對于實際分布擬合最好的分布,對于風(fēng)功率密度的估算最接近實際值。
使用5種常規(guī)分布對云南山區(qū)風(fēng)速做擬合,并給出綜合評價。擬合優(yōu)度從數(shù)值大小的角度看,威布爾分布、正態(tài)分布以及瑞利分布在4個站點(diǎn)呈現(xiàn)較好結(jié)果,但數(shù)值角度的結(jié)果說服力不夠強(qiáng)。為了更加直觀,選取實際數(shù)據(jù)直方圖與分布密度曲線擬合性進(jìn)行比較,發(fā)現(xiàn)威布爾分布在富源縣和雙柏縣站點(diǎn)呈現(xiàn)較好結(jié)果,在馬龍縣和云縣正態(tài)分布和威布爾分布的結(jié)果都比較好。為了仔細(xì)區(qū)分,從實際角度出發(fā),利用標(biāo)準(zhǔn)空氣密度下風(fēng)功率密度來比較,根據(jù)理論分布數(shù)據(jù)和實際數(shù)據(jù)相對誤差圖可以看出威布爾分布的結(jié)果最好。綜合上述比較,威布爾分布最適合云南山區(qū)的風(fēng)速。