李奐其 王天龍 羅婷
(1.華北電力大學(xué)電氣與電子工程學(xué)院,北京 102206;2.北京農(nóng)學(xué)院國際學(xué)院,北京 102206)
海上風(fēng)電功率預(yù)測是做好電力調(diào)度的基本前提,也是確保電力系統(tǒng)安全穩(wěn)定經(jīng)濟(jì)運(yùn)行的重要保障,傳統(tǒng)風(fēng)功率的預(yù)測一般可分為物理模型法[1,2]和統(tǒng)計(jì)模型法[3-5],但是海上風(fēng)電的預(yù)測仍然存在著數(shù)據(jù)量巨大、難以處理等問題,相關(guān)研究人員利用統(tǒng)計(jì)方法對大量海上風(fēng)電數(shù)據(jù)進(jìn)行分類及簡化,閆健[6]通過采用K均值聚類分析尋找相似性樣本的方法,將不同海上風(fēng)場氣候特征進(jìn)行數(shù)據(jù)驅(qū)動分類,采減小了數(shù)據(jù)量。K均值聚類需要提前指定K(即分類數(shù)量)和初始聚類中心,一旦這2個值選擇不好,就有可能無法得到有效的聚類結(jié)果,甚至還可能導(dǎo)致死循環(huán)。
為了解決這一問題,本文提出了一種基于Mean Shift(均值漂移算法)的海上風(fēng)功率預(yù)測方法,主要利用從NWP(Numerical Weather Prediction,即數(shù)值天氣預(yù)報)中獲得的數(shù)據(jù)進(jìn)行Mean Shift聚類,減小數(shù)據(jù)量,然后利用LSTM神經(jīng)網(wǎng)絡(luò)算法建立風(fēng)功率密度的預(yù)測模型,從而對風(fēng)功率密度進(jìn)行預(yù)測。
海上風(fēng)電功率受多種因素的影響,除了機(jī)組自身各種參數(shù)的限制之外也受到許多自然條件的影響,本文選擇風(fēng)速、風(fēng)向、溫度、濕度、大氣壓力等自然因素來進(jìn)行風(fēng)功率的預(yù)測。
本文選取德國Alpha Ventus海上風(fēng)電場2021年1月1日到1月30日的數(shù)據(jù)來進(jìn)行驗(yàn)證,其擁有12臺風(fēng)電機(jī)組,于2010年4月投產(chǎn)。圖1(a)為Alpha Ventus 12臺風(fēng)電機(jī)組的坐標(biāo)圖。圖1(b)是某日24小時之內(nèi)各風(fēng)電機(jī)組處的風(fēng)速變化三維圖。由圖1可知,在同一個風(fēng)電場內(nèi),不同機(jī)組由于距離較近,在讀取大部分的風(fēng)速、風(fēng)向等自然條件數(shù)據(jù)時,可以把Alpha Ventus海上風(fēng)電場看作一個點(diǎn),數(shù)據(jù)采用平均值進(jìn)行分析和預(yù)測。
圖1 Alpha Ventus風(fēng)電機(jī)組的坐標(biāo)圖和風(fēng)速變化三維圖
為了定量描述風(fēng)速、風(fēng)向、氣溫等輸入特征與風(fēng)電輸出功率的相關(guān)程度,本文根據(jù)斯皮爾曼關(guān)系數(shù)(Spearman Correlation Coefficient)對其進(jìn)行可視化處理。將集合x、y中的元素對應(yīng)相減得到一個排行差分集合di,1<=i<=N。
隨機(jī)變量X、Y之間的斯皮爾曼等級相關(guān)系數(shù)可以由x、y或者d計(jì)算得到,其計(jì)算方式如下所示,由排行差分集合d計(jì)算而得:
Mean Shift是一種基于核密度估計(jì)的爬山算法,目前主要被應(yīng)用與聚類、圖像分割、跟蹤等方面。相對于K均值聚類算法,Mean Shift聚類算法不需要預(yù)先設(shè)定簇的個數(shù),和樣本中心點(diǎn)的位置,這些都是通過計(jì)算機(jī)的迭代而得到。同時,該算法也具有較為穩(wěn)定的聚類結(jié)果[7]。
為了能夠更加準(zhǔn)確地預(yù)測風(fēng)電場各時間段內(nèi)的WPD(順時風(fēng)功率密度),本文建立了基于LSTM(長短時記憶神經(jīng)網(wǎng)絡(luò))的預(yù)測模型[8]。
圖2為影響因素相關(guān)系數(shù)矩陣,可以看出海上風(fēng)電的眾多影響因素是相互關(guān)聯(lián)且復(fù)雜多樣的,在實(shí)際機(jī)組風(fēng)電功率密度計(jì)算中還要考慮風(fēng)機(jī)運(yùn)行的尾流效應(yīng)以及風(fēng)向與功率損失之間的關(guān)系,所以我們采用統(tǒng)計(jì)方法,用神經(jīng)網(wǎng)絡(luò)對相關(guān)風(fēng)電功率進(jìn)行預(yù)測。
圖2 斯皮爾曼相關(guān)系數(shù)矩陣圖
通過調(diào)節(jié)不同的搜索半徑r值,改變聚類個數(shù),得到結(jié)果如圖3所示。
圖3 歐式距離之和與聚類情況關(guān)系圖
由上圖3可以看出,分類數(shù)越多,歐氏距離之和就越小,當(dāng)分類個數(shù)超過6時,當(dāng)分類個數(shù)繼續(xù)增加時,而歐氏距離之和減小卻不明顯,本文選擇合適的搜索范圍,使其聚類個數(shù)為6。對Alpha Ventus海上風(fēng)電場2021年1月的數(shù)據(jù)的聚類結(jié)果如表1所示。通過比較各樣本點(diǎn)風(fēng)速曲線和聚類中心風(fēng)速曲線,發(fā)現(xiàn)其形狀有很強(qiáng)的相似性,聚類效果良好。如圖4所示。
表1 對Alpha Ventus海上風(fēng)電場2021年1月的數(shù)據(jù)的聚類結(jié)果
圖4 第三類樣本點(diǎn)與該聚類中心的風(fēng)速曲線
本文采用2021年2月1日的前15h的數(shù)據(jù)來進(jìn)行對預(yù)測數(shù)據(jù)的驗(yàn)證。首先根據(jù)(3)式計(jì)算2月1日數(shù)據(jù)到6個聚類中心的歐氏距離,結(jié)果圖5所示。發(fā)現(xiàn)該點(diǎn)距離第5類聚類中心點(diǎn)的歐氏距離最小,所以,2月1日屬于第5類。用1月24日至27日的風(fēng)向、風(fēng)速、溫度、濕度、大氣壓力等數(shù)據(jù)進(jìn)行LSTM網(wǎng)絡(luò)的訓(xùn)練,再將2月1日的上述數(shù)據(jù)輸入網(wǎng)絡(luò),對該日前15h的WPD進(jìn)行預(yù)測。此外,為了使結(jié)果更加可信,本文還采用3次回歸預(yù)測的方法進(jìn)行對照。預(yù)測結(jié)果如圖6所示。
圖5 2月1日數(shù)據(jù)距離各中心點(diǎn)的歐氏距離
圖6 2月1日前15h的WPD預(yù)測情況
由于WPD的值比較小,本文通過采用SMAPE (Symmetric Mean Absolute Percentage Error,即對稱平均絕對值百分比誤差)來衡量測量結(jié)果的準(zhǔn)確性。SMAPE的范圍為[0,+∞),且該值越小,說明預(yù)測模型的準(zhǔn)確度更高,當(dāng)預(yù)測值和真實(shí)值完全吻合時,SMAPE為0,即該模型為完美模型;當(dāng)SMAPE大于100%時,該模型為劣質(zhì)模型。根據(jù)式(3)進(jìn)行了SMAPE的計(jì)算。
根據(jù)計(jì)算,2月1日前15h的LSTM預(yù)測數(shù)據(jù)的SMAPE為16.58%,而用3次回歸預(yù)測所得數(shù)據(jù)的SMAPE為18.05%??梢娫擃A(yù)測方法的誤差在可以接受的范圍內(nèi),比3次回歸預(yù)測更加準(zhǔn)確,故該模型在一定程度上可以對WPD進(jìn)行預(yù)測。
本文提出一種基于Mean Shift聚類算法的WPD預(yù)測方法,建立了以從NWP獲得的風(fēng)向、風(fēng)速、溫度、濕度、大氣壓力等參數(shù)預(yù)測WPD的預(yù)測模型,并且采用2月1日德國Alpha Ventus海上風(fēng)電場的數(shù)據(jù)進(jìn)行驗(yàn)證得出以下結(jié)論:
(1)由斯皮爾曼關(guān)系數(shù)可知,WPD和風(fēng)速的相關(guān)性最大,而其他自然條件因素與WPD的相關(guān)性不大,因此在建立模型聚類和預(yù)測時,適當(dāng)提高風(fēng)速的權(quán)重,有利于預(yù)測結(jié)果的準(zhǔn)確度的提高。(2)由于每一天的自然條件等都存在著一定的相似性,因此可以采用Mean Shift聚類分析的方法來對數(shù)據(jù)進(jìn)行聚類,再通過歐氏距離計(jì)算預(yù)測日的數(shù)據(jù)屬于哪一類,最后再用該類的數(shù)據(jù)進(jìn)行LSTM網(wǎng)絡(luò)的訓(xùn)練,從而進(jìn)行預(yù)測,有效減少需要處理的數(shù)據(jù)量,大大減少程序運(yùn)行時間,結(jié)果的準(zhǔn)確性也會因此而降低。