高 鷺,趙連甲,孔繁苗
(內蒙古科技大學 信息工程學院,內蒙古 包頭014000)
近幾年,風電預測技術取得了長足的發(fā)展,無論是預測精度還是預測時間都得到了很大的提高,能夠精準地預測到風功率的具體數值,對于電力部門的調度和規(guī)劃都能起到很好的指導作用,減少不必要的資源浪費[1-3],避免大量的棄風現象。其中風電預測根據時間尺度來分,常見的是長期預測,短期預測和超短期預測。長期預測能夠有利于調度,短期和超短期預測能夠用來控制。近兩年的論文中對于短期預測研究的比較多,長期和超短期預測研究的論文相對來說要少一些。為了增加對超短期風功率預測的研究,文章用內蒙古的實際數據作為數據集,因為人工智能技術的高速發(fā)展和計算能力的大幅提高,神經網絡方法在預測精度和預測時間上都能夠有很好的表現,所以決定采用神經網絡的建模方法進行超短期功率預測。
循環(huán)神經網絡(recurrent neural network,RNN)[4]對于時間前后相關性強的數據有很強的處理能力,LSTM和GRU都能夠很好地預測風功率數據,朱喬木[5]等人提出了一種基于LSTM網絡的超短期發(fā)電功率預測方法。該方法第一次嘗試使用距離分析法挑選出特征里面對風電功率影響程度最大的,從而能夠減少輸入神經網絡的特征數量,進而減少數據輸入的數量。牛哲文[6]等人使用CNN結合GRU神經網絡進行數據降維和特征提取操作,因為風功率數據波動性和不確定性太強,所以嘗試解決這個問題。韓朋[7]等人用了注意力模型篩選相關性系數最高的兩個特征作為模型輸入,再利用LSTM進行風功率預測。以上幾篇論文都利用深度學習模型取得了良好的預測效果,證明了神經網絡方法的有效性。
本文采用的數據集是內蒙古某風場機組一年的實際測量風電數據,數據特征有風向、風速、功率、溫度、實測槳距角、氣壓等,部分數據情況如表1所示。
表1 部分數據特征
實驗數據集為2014年一年的數據,從一月一號開始,每十分鐘一個數據點,本實驗用的數據是歷史的風功率數據,利用之前的數據進行學習來預測后面的數據,數據采集有的存在缺失值,采用均值插補法對缺失值進行填充。求得數據的平均值進行填充補全數據。
循環(huán)神經網絡RNN開始在手寫識別、語音識別等領域取得了很好的實驗成果,后來學者們將它應用在時間序列的預測上,發(fā)現在時間序列數據上也表現非俗。再之后成功地應用到了風功率預測上,雖然RNN能夠處理時間序列數據,但是如果網絡層數夠深可能會發(fā)生梯度消失和梯度爆炸,GRU和LSTM模型能夠避免RNN梯度消失和梯度爆炸[8-9]的問題,并且循環(huán)神經網絡能夠很好地注意到數據前后的相關性,門控循環(huán)單元的設置能夠記住前面的數據,并且能夠選擇性遺忘數據,從而使得預測更準確和更快速,適用于超短期風功率預測。GRU模型結構如圖1所示。
圖1 GRU結構圖
本次實驗樣本為內蒙古風電場一年的數據,取其中5000條數據來做本次實驗,以4:1的比例劃分訓練測試集。為了去除變量之間量綱的差異所帶來的影響。在補全數據的缺失值之后對于數據做了歸一化操作,將數據歸一到0和1之間,轉換函數為:
其中Xmin和Xmax分別為風功率數據的最小值和最大值。在本實驗中所用編程語言為Python,使用Keras和TensorFlow完成實驗部分,所用模型參數設置為:
BP神經網絡:三層的網絡結構,神經元數量分別為80.100.80,激活函數用的是Sigmoid和Relu,優(yōu)化器是Adam。epochs=200,batch_size=20。
LSTM:兩層,神經元都為300,激活函數用的是Relu,優(yōu)化器是Adam,Dropout取值為0.3。epochs=100,batch_size=32。GRU模型參數設置同LSTM。
RNN:兩層,神經元都為200,激活函數用的是Sigmoid,優(yōu)化器是Adam,Dropout取值為0.3。epochs=100,batch_size=64。
橫坐標為測試集的1000個數據點,橫坐標為數據歸一化之后的值,四個模型預測結果匯總如圖2所示。
由圖2我們可以看出,以上神經網絡對于數據的預測效果都很不錯,無論是對于波動強烈和平穩(wěn)的數據都能有很好的預測效果。為了評價各個模型的擬合程度,我們選取了用標準均方根誤差(RMSE)和平均絕對誤差(MAE)來評價各個模型對于本實驗數據的效果。數值越小實驗效果越好,具體公式如下所示:
圖2 模型預測結果匯總
其中yi是預測值,另一個是測試值,n是數據的個數,i表示從1開始。四個神經網絡在內蒙古風場預測的誤差如表2所示。
從表2分析得出:以上算法誤差都在10%以內,預測精度都達到了超短期風功率預測對于精準度的要求,GRU在本實驗數據的表現最優(yōu),但是各個神經網絡的誤差相差不大。這與實驗匯總圖的圖像總體走向基本一致。
表2 實驗誤差
本文使用了四個神經網絡來預測風功率的實際數值,經過前期的大量調參工作,對于數據進行預處理,包括缺失值填充和數據歸一化,取得了良好的預測效果。從結果來看,本實驗選取的模型預測精度都在92%以上?;灸芘c真實數據相擬合,尤其是在數據有波動的情況下,對于一段時間內數據波動不大的情況擬合效果有待提高,后續(xù)工作會對這類數據進行分析,保證以上幾種模型在各種情況的數據中都能取得很好的效果。