陳曉兵, 吳劍鋒, 黃馗, 練椿杰, 江雄烽, 祝云, 張弛
〔1.廣西電網(wǎng)責(zé)任有限公司,廣西 南寧 530023;2. 廣西電力系統(tǒng)最優(yōu)化與節(jié)能技術(shù)重點(diǎn)實(shí)驗(yàn)室(廣西大學(xué)),廣西 南寧 530004〕
水電是世界公認(rèn)的三大可再生清潔能源之一,同時也是我國最主要的可再生能源[1]。截至2018年底,全國小水電站的數(shù)量達(dá)4.6萬多座,總裝機(jī)容量達(dá)8 044萬千瓦,年發(fā)電量接近2 346億千瓦時,分別約占全國水電裝機(jī)總量和年發(fā)電量的23%和19%[2]??梢娦∷娙菏撬姷闹匾M成部分,提高其預(yù)測的精度,使其符合工程應(yīng)用的要求,對電網(wǎng)的安全、經(jīng)濟(jì)運(yùn)行具有重大意義[3]。
關(guān)于小水電發(fā)電量預(yù)測,廣大的學(xué)者進(jìn)行了極具奉獻(xiàn)意義的研究。文獻(xiàn)[4]利用人工神經(jīng)網(wǎng)絡(luò)的方法對水庫的流量進(jìn)行了預(yù)測,并取得了良好的預(yù)測效果,但只是簡單的應(yīng)用人工神經(jīng)網(wǎng)絡(luò),存在抗壞數(shù)據(jù)能力差的問題。文獻(xiàn)[5]將啟發(fā)式人工神經(jīng)網(wǎng)絡(luò)與蝙蝠算法相結(jié)合,提出了一種基于生物啟發(fā)的算法,預(yù)測精度相對于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)具有明顯的優(yōu)勢,但依舊存在數(shù)據(jù)抗差性較差的問題。文獻(xiàn)[6]對現(xiàn)有的小水電發(fā)電量預(yù)測方法進(jìn)行了分析,并得出現(xiàn)有的預(yù)測方法對小水電的功率預(yù)測適應(yīng)性較差,預(yù)測精度難以滿足調(diào)度運(yùn)行的要求,并建議在未來的研究和工程實(shí)踐中,應(yīng)充分考慮歷史數(shù)據(jù)的數(shù)據(jù)質(zhì)量,以提高預(yù)測精度,確保電網(wǎng)的安全運(yùn)行。
不僅如此,極限學(xué)習(xí)機(jī)(extreme learning machines, ELM)算法自誕生以來也得到了巨大的發(fā)展。ELM已經(jīng)被證明是一種十分高效的模式分類和回歸學(xué)習(xí)機(jī)制,特別適合于工業(yè)級的預(yù)測[7]。因此,提出了一種趨勢導(dǎo)向的ELM功率預(yù)測模型(TG-ELM),并將ELM算法首次應(yīng)用至小水電群出力預(yù)測中,以實(shí)例驗(yàn)證了模型的有效性。
ELM是一種基于前饋神經(jīng)網(wǎng)絡(luò)所構(gòu)建的機(jī)器學(xué)習(xí)方法,適用于監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)問題。該算法最早由南洋理工大學(xué)的黃廣斌教授提出,并在2006年被進(jìn)一步豐富后得到了廣泛的關(guān)注。
圖1為ELM的單隱含層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),輸入層與隱含層之間、隱含層與輸出層之間均為神經(jīng)元全連接方式。不同于一般的前饋神經(jīng)網(wǎng)絡(luò)受到慢梯度算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)以及網(wǎng)絡(luò)參數(shù)需要進(jìn)行迭代調(diào)整的影響。ELM具有以下兩個特征:
(1) 輸入層和隱含層的連接權(quán)值、隱含層的閾值可以隨機(jī)設(shè)定,且設(shè)定完后無需再調(diào)整。和BP (back propagation)神經(jīng)網(wǎng)絡(luò)不同,BP神經(jīng)網(wǎng)絡(luò)需要不斷反向去調(diào)整權(quán)值和閾值。因此運(yùn)算量便少了一半。
(2) 隱含層與輸出層之間的連接權(quán)值不需要進(jìn)行迭代調(diào)整,可通過求解方程組的方式一次性確定。
ELM算法的機(jī)理為:對于一個單隱含層神經(jīng)網(wǎng)絡(luò),如圖1所示,x為輸入的特征參數(shù);w為輸入權(quán)重;β為輸出權(quán)重;y為輸出結(jié)果。假設(shè)有N個任意的樣本(Xi,ti),其中:
(1)
對于隱含層有L個節(jié)點(diǎn)的單隱含層神經(jīng)網(wǎng)絡(luò),當(dāng)網(wǎng)絡(luò)的輸出與真實(shí)值的誤差最小時最優(yōu),可表示為:
(2)
式中:g(x)為激活函數(shù);βi,bi和Wi分別為第i個隱層單元的輸出權(quán)重、偏置和輸入權(quán)重矩陣。
可用矩陣表示:Hβ=T,其中H為隱層節(jié)點(diǎn)的輸出,β為輸出權(quán)重,T為期望輸出。具體表示如下:
(3)
(4)
為了讓小水電群的發(fā)電數(shù)據(jù)更真實(shí),更好識別出異常數(shù)據(jù)并修復(fù)異常數(shù)據(jù),提出了一種增強(qiáng)型魯棒局部加權(quán)回歸散點(diǎn)平滑法。算法流程如下:
(1) 選擇適當(dāng)?shù)拇翱趯挾萬,即對于每一個觀測點(diǎn)xi,盡量以xi為中心以選擇窗口寬度。
(2) 定義區(qū)間內(nèi)所有觀測點(diǎn)的權(quán)值,權(quán)值由權(quán)值函數(shù)W(u)來唯一確定,其中,權(quán)值函數(shù)可表示為:
(5)
(3) 確定數(shù)據(jù)區(qū)間,并對該區(qū)間內(nèi)的數(shù)據(jù)進(jìn)行加權(quán)的線性回歸,得出擬合值。
(4) 更新權(quán)重函數(shù)。y′為擬合的數(shù)值,y為真實(shí)值,δ為一個大于0小于1的數(shù),e定義為擬合值的殘差,權(quán)重隨著殘差的增大而減小。得出新的權(quán)重后將該權(quán)重更新至步驟(2)的權(quán)值函數(shù),對權(quán)值函數(shù)進(jìn)行更新,其中,觀測點(diǎn)附近任意一點(diǎn)的權(quán)值可定義為:
(6)
(5) 重復(fù)步驟(3)、(4),以最小二乘法進(jìn)行多階多項式擬合,直到計算出穩(wěn)定的擬合值。
某個小水電站一天24個小時的發(fā)電數(shù)據(jù)的數(shù)據(jù)平滑效果比較如圖2所示。所提的增強(qiáng)型魯棒局部加權(quán)回歸散點(diǎn)平滑法比傳統(tǒng)的魯棒局部加權(quán)回歸散點(diǎn)平滑法更加符合工業(yè)實(shí)際應(yīng)用。該法不僅整體平滑效果好,還能顧及到端點(diǎn)處的數(shù)據(jù),提升了端點(diǎn)處數(shù)據(jù)的平滑效果。
數(shù)據(jù)經(jīng)過平滑處理后,為了有效地提取到數(shù)據(jù)的變化趨勢,定義了小水電群發(fā)電功率的當(dāng)前時刻t與上一時刻t-1的一階差分為當(dāng)前時刻的真實(shí)變化趨勢vt。詳細(xì)步驟為:①取當(dāng)前時刻t到t-n+1時刻的歷史數(shù)據(jù),做一階差分計算;②利用指數(shù)加權(quán)平均法計算步驟①中的數(shù)據(jù)段的加權(quán)平均一階差分vt,即變化趨勢。指數(shù)加權(quán)平均算法可表示為:
vt=γvt-1+(1-γ)ζt
(7)
式中:γ為可調(diào)的權(quán)重超參,且0<γ<1,ζi為t時刻的一階差分。
綜上可知,趨勢的準(zhǔn)確度由所選取的歷史數(shù)據(jù)的個數(shù)n以及可調(diào)的權(quán)重超參γ所決定。而大量的經(jīng)驗(yàn)表明:n=1/(1-γ),即n可由γ所決定。因此只需要確定最優(yōu)的可調(diào)權(quán)重超參γ即可。
增強(qiáng)型魯棒局部加權(quán)回歸散點(diǎn)平滑法的窗口寬度f、指數(shù)加權(quán)平均法計算加權(quán)平均一階差分的權(quán)重γ的選擇對所提取的趨勢的準(zhǔn)確程度有直接的影響。而小水電群的發(fā)電量隨著負(fù)荷側(cè)而動態(tài)變化,也就是說數(shù)據(jù)的變化趨勢也是動態(tài)的,因此f和γ在整個模型的預(yù)測過程中需要動態(tài)進(jìn)行調(diào)整,且每一次的調(diào)整都應(yīng)該是最優(yōu)的。γ與增強(qiáng)型魯棒局部加權(quán)回歸散點(diǎn)平滑法中的權(quán)值函數(shù)中的權(quán)重相關(guān)聯(lián)。如圖3所示,在測試集中,所測試的變化趨勢與實(shí)際的變化趨勢的相關(guān)性系數(shù)越大,表征提取的變化趨勢越符合實(shí)際,而γ和f即為最優(yōu)。由圖可知,當(dāng)相關(guān)因數(shù)達(dá)到最大值0.74的時候,γ和f最優(yōu),此時γ=0.7,f=7。因此f和γ的最優(yōu)初始值為(f0,γ0)=(7,0.7)。
為驗(yàn)證TG-ELM算法的有效性,分別采用小水電群2019年8月的發(fā)電數(shù)據(jù)及整月的發(fā)電數(shù)據(jù)作為測試,將其與BP神經(jīng)網(wǎng)絡(luò)及支持向量機(jī)(support vector machine, SVM)進(jìn)行了比較,如圖4、圖5所示。
由圖4、圖5可知,TG-ELM的預(yù)測曲線與實(shí)際發(fā)電功率曲線更加吻合,且在拐點(diǎn)處的誤差較小,更符合實(shí)際的運(yùn)行狀況。因此,在預(yù)測精度方面,TG-ELM比BP與SVM優(yōu)越。利用平均絕對誤差(MAE)、均方根誤差(RMSE)和最大絕對誤差ΔPmax兩個評價指標(biāo)進(jìn)對上述算法的預(yù)測結(jié)果進(jìn)行更加細(xì)致地分析,如表1所示。
表1 三種算法的誤差分析
由表1可知,以RMSE為指標(biāo),TG-ELM相比于SVM及BP分別降低了28.77%、27.9%。以MAE為指標(biāo),TG-ELM相比于SVM及BP分別降低了21.77%、26.83%。而在最大預(yù)測絕對誤差方面,TG-ELM相比于SVM及BP分別降低了27.54%、2.15%,驗(yàn)證了所提算法模型預(yù)測的高準(zhǔn)確率及其優(yōu)越性。
提出了趨勢導(dǎo)向的極限學(xué)習(xí)機(jī)小水電群出力預(yù)測模型,該模型提取了小水電群發(fā)電功率的變化趨勢,并將該趨勢作為新特征輸入,提高了傳統(tǒng)極限學(xué)習(xí)機(jī)的預(yù)測精度,豐富了傳統(tǒng)極限學(xué)習(xí)機(jī)數(shù)據(jù)輸入端的機(jī)理,同時也解決了小水電群因窩電棄水、自動化水平低而導(dǎo)致發(fā)電數(shù)據(jù)質(zhì)量差,進(jìn)而影響出力預(yù)測精度的問題,為電網(wǎng)對眾多的小水電群進(jìn)行統(tǒng)一調(diào)度、實(shí)現(xiàn)綠色小水電的可持續(xù)發(fā)展提供了強(qiáng)有力的依據(jù)。所提預(yù)測模型滿足工業(yè)應(yīng)用的要求,具有廣泛的應(yīng)用前景。