陳偉,吳布托,裴喜平,王懿喆
(蘭州理工大學電氣工程與信息工程學院,甘肅蘭州 730050)
改進Bayesian后驗比的異常風速值檢測方法
陳偉,吳布托,裴喜平,王懿喆
(蘭州理工大學電氣工程與信息工程學院,甘肅蘭州 730050)
風電場運行數(shù)據(jù)中含有異常風速值,為了優(yōu)化風電數(shù)據(jù)的質量,提出了組合預測與Bayesian后驗比的異常值檢測方法。為了降低預測誤差,先對風速序列建立Adaboost-BP網絡和EMD-LV-SVM的組合預測模型,利用預測值與測量值的偏差得到含有粗大誤差的殘差序列;為了提高檢測方法的可靠性,采用Bayesian后驗比的檢驗方法識別殘差序列中粗大
異常風速值檢測;組合預測模型;殘差分析;Bayesian后驗比
風電場運行數(shù)據(jù)中的風速值是分析監(jiān)測風機運行狀態(tài)和預測風機出力情況的重要依據(jù)。因傳感器故障和傳輸信道噪聲產生的異常疊加在監(jiān)控終端的數(shù)據(jù)中,由于風速特有的間歇性和不確定性[1],造成異常值在風速序列特征信息不明顯,使得異常值辨識困難。
在諸多風速功率預測方法中,如人工神經網絡[2-4]、支持向量機[5]、卡爾曼濾波[6]和時間序列分析法[7-8]都直接采用測量數(shù)據(jù)進行分析計算,對含有異常值的數(shù)據(jù)建模分析勢必會影響預測精度。因此,分析數(shù)據(jù)前需要對異常數(shù)據(jù)識別與修正。在異常數(shù)據(jù)檢測方面,文獻[9]最早提出了運用統(tǒng)計學的思想檢測異常值,根據(jù)歷史數(shù)據(jù)設定一個概率模型,如果數(shù)據(jù)服從同一分布則判定為正常值,反之則為異常數(shù)據(jù)點,該方法的統(tǒng)計量計算復雜且統(tǒng)計參數(shù)對辨識異常值異常敏感。文獻[10]是基于距離的方法檢測異常值,需要計算每個點之間的距離,通過相似度檢測異常距離,因計算量過大,不適處理大量的風速時間序列。文獻[11]提出了小波模極大值的方法辨識異常風速值,該方法通過采用閾值和Lipschitz指數(shù)聯(lián)合判定異常風速值,由于小波方法不能兼顧時間分辨率和頻率分辨率,易產生漏檢現(xiàn)象。文獻[12]提出了采用Gibbs抽樣算法估計Bayesian參數(shù)并通過閾值檢測異常值,該方法只適用于線性系統(tǒng)不適用于多變的風速序列。文獻[13]提出了利用支持向量機的回歸估計值與實測值之間的殘差來識別測量數(shù)據(jù)中的異常數(shù),由于擬合殘差的方差異常敏感,方差值決定著辨識粗大誤差的準確性。
基于以上分析,結合傳統(tǒng)殘差分析和Bayesian參數(shù)估計方法,本文提出了組合預測模型和邊緣化后驗比的方法檢測異常風速值。首先分別建立Adaboost-BP網絡和EMD-LS-SVM的單一預測模型,通過計算每個模型的方差確定組合預測模型的最優(yōu)權重系數(shù),使得到的殘差序列更準確。為了降低Bayesian后驗概率的未知參數(shù)的數(shù)目,對其參數(shù)邊緣化處理可簡化計算方法,并剔除后驗比值小于檢測閾值的異常風速值。最后采用ARIMA方法修正異常風速點,從而優(yōu)化了風速數(shù)據(jù)的質量。通過對仿真數(shù)據(jù)異常點的檢測結果驗證了本文方法的可行性,并對甘肅酒泉風電場的實測運行風速序列進行異常檢測和修正,預測結果表明對風速數(shù)據(jù)處理后可提高預測精度。
由于異常風速值在風速序列中表征不明顯,用現(xiàn)有的異常檢測方法不易檢測出[14-17],為了凸顯異常風速值的特征信息,本文通過建立風速預測模型計算出預測值,比較預測值與測量值之間的差值,得到異常特征明顯的殘差序列。殘差序列是由隨機誤差、系統(tǒng)誤差和粗大誤差構成,而系統(tǒng)誤差受風速傳感器測量精度和風速預測精度的影響,系統(tǒng)誤差幅值波動穩(wěn)定,誤差的絕對值小于等于3σ[18],且服從高斯分布。而粗大誤差是由傳感器故障和數(shù)據(jù)存儲故障產生,具有隨機性和幅值波動大的特點[19],其誤差絕對值大于3σ。針對這種特點,本文利用邊緣化后驗比的方法檢測識別粗大誤差點,從而間接地檢測出風速序列的異常值。
1.1 預測模型的選取
常見的風速預測模型包括:持續(xù)法[20]、ARMA預測法、神經網絡預測法和支持向量機預測法。由于風速的隨機性和間歇性,造成單一預測模型精度不高,預測模型的系統(tǒng)誤差較大,不利于準確識別殘差序列中的粗大誤差值。因此,本文選取基于自方差優(yōu)選的組合預測方法提高預測精度,盡可能地使系統(tǒng)誤差達到最小,盡可能地接近真實風速時間序列。
1.1.1 Adaboost-BP模型
在BP網絡建立過程中存在過擬合、泛化能力弱和易陷入局部最優(yōu)的問題,本文引入Adaboost迭代算法改進BP算法[21-22],使其將訓練集中不同的弱學習器結合起來搭建成一個穩(wěn)健的強學習器。Adaboost迭代算法的基本思想是在訓練過程中重視預測誤差大的樣本和性能好的弱學習器,從而提高了BP網絡的泛化能力和預測精度。
建立Adaboost-BP模型的過程如下:
1)對訓練集進行數(shù)據(jù)歸一化處理,然后將數(shù)據(jù)分成N組,每組數(shù)據(jù)中含有n個訓練值和m個預測數(shù)據(jù)。
2)隨機選取一組數(shù)據(jù),建立結構為3-6-1的BP網絡,其中NN(tx)表示第t次構建的BP網絡。在該網絡下計算每組數(shù)據(jù)的預測誤差εi和N組數(shù)據(jù)的平均
3)更新樣本權重Dt其中βt=εt/的歸一化因子,D0(i)=1/N。根據(jù)βt可得到弱學習器的權重為
4)重復步驟2)和3),直到迭代的次數(shù)T>10或者預測平均誤差εt<10-5跳出循環(huán)。
5)最終得到強學習器的Adaboost-BP預測模型表達式為
1.1.2 EMD-LS-SVM模型
風速序列是一組隨機性較強的非線性、非穩(wěn)態(tài)的時間序列,單一的模型存在預測精度低、泛化能力弱的問題。經驗模態(tài)分解[23]EMD常用于處理非線性、非穩(wěn)態(tài)的信號,把信號分解成不同頻率的序列,降低了信號中的不同頻率之間的相互影響。針對不同頻率的分解量固有模態(tài)函數(shù)(IMF)和趨勢量(Res)分別建立LV-SVM回歸模型[24-25]。最后對不同分量進行合成重構得到預測結果。
建立EMD-LS-SVM模型的步驟:
1)輸入訓練集數(shù)據(jù),采用EMD方法對風速序列進行分解得到多個IMF分量和Res分量的代數(shù)和,即:
式中:M為IMF分量的個數(shù);IMFi(t)為風速時間序列的第i個固有模態(tài)函數(shù);Res(t)為分解后的趨勢分量。
2)分別對分量IMFi(t)和Res(t)建立LV-SVM回歸模型,構造的拉格朗日函數(shù)計算方法算法如下:
式中:c為容錯懲罰系數(shù),c>0;ξi為松弛因子,ξi≥0;w為權向量;b為常數(shù);αi(i=1,2,…,l)為拉格朗日乘子。本文參考文獻[20]的方法確定超參數(shù),選取c= 30,σ2=0.22。
通過式(4)計算出LS-SVM回歸函數(shù)表示為
式中:高斯核函數(shù)K(x,xi)=e-‖x-xi‖2/(2σ2)。
3)利用式(4)建立各個分量的模型,并預測出每個分量的值,對分量結果進行合成重構,得到最終的預測值y2(x)。
1.1.3 建立風速組合預測模型
方差優(yōu)選風速組合預測模型的風速輸出y(t/ t-1)為
式中:λ1為在t時刻Adaboost-BP網絡預測模型的權重值;λ2為在t時刻EMD-LS-SVM預測模型的權重值,且λ1+λ2=1。y(1t/t-1)為t時刻Adaboost-BP網絡預測模型的預測值;y(2t/t-1)為t時刻EMD-LS-SVM預測模型的預測值。
求取最優(yōu)權重的過程等同為如下優(yōu)化問題:
采用構造拉格朗日函數(shù)的方法求解式(7),可以解得:
通過式(10)得到的殘差序列是由預測模型產生的系統(tǒng)誤差(誤差較小接近于0)和異常風速值產生的粗大誤差的代數(shù)和構成。隨后通過識別粗大誤差來確定風速值的異常情況。
1.2 Bayesian后驗比檢測準則
由于殘差序列服從高斯分布[26],因此根據(jù)Bayesian后驗的思想,ALARCON-AQUINO V[27]等人建立檢測窗口和學習窗口,其中學習窗口中的數(shù)據(jù)用于建立高斯分布,檢測窗口中的數(shù)據(jù)用于檢測該數(shù)據(jù)的異常情況。通過分析2個窗口的殘差序列是否服從同一高斯分布的方法檢測異常數(shù)據(jù)。如果檢測窗口服從學習窗口的高斯分布,判為正常(系統(tǒng)誤差)數(shù)據(jù),反之,則判為異常(粗大誤差)數(shù)據(jù)。
隨著檢測數(shù)據(jù)的不斷增加,學習窗口中堆積了大量數(shù)據(jù)使得統(tǒng)計分析復雜。本文結合風速殘差序列中粗大誤差的分布特點,通過固定學習窗口中數(shù)據(jù)的長度L保持不變,并保持檢測窗口只含有一個待檢測的數(shù)據(jù),利用學習窗口和檢測窗口同步滑動實現(xiàn)殘差序列中粗大誤差的檢測與識別。
根據(jù)學習窗口中L個數(shù)據(jù)的分布情況得到高斯分布N(0,δ2),讀取檢測窗口t時刻的殘差值et。當et服從N(0,δ2)時,則et判為系統(tǒng)誤差數(shù)據(jù)(正常風速點);當et不服從N(0,δ2)時,則et判為粗大誤差數(shù)據(jù)(異常風速點)。從粗大誤差數(shù)據(jù)得到2個假設,分別為H0:t時刻的殘差et為正常值;H1:t時刻的殘差et為異常值。
在2個假設條件下,L+1個殘差數(shù)據(jù)的似然分別為
根據(jù)Bayesian原理[28]得到2個假設的后驗概率分別為
式中:假設H0和H1的先驗概率分別為p(H0)和p(H1);p(e)表示風速預測殘差ei的先驗概率i=t-L,…,t;后驗概率p(H0|e)和p(H1|e)表示在取當前殘差值e(ii=t-L,…,t)時,假設H0和H1成立的概率,可用統(tǒng)計量后驗概率直接描述檢測窗口殘差值的異常情況。因此可以利用2個假設的后驗概率的大小關系判斷哪個假設成立,具體實施采用后驗概率對數(shù)比作為異常判斷準則:
根據(jù)式(14)可知,如果et為粗大誤差數(shù)據(jù)(v(t)為異常風速值),則異常假設的后驗概率p(H1|遠大于正常假設后驗概率p(H0|e),即φ(t)小于η;如果et為系統(tǒng)誤差(v(t)為正常風速值),則φ(t)大于η。本文選取檢測閾值η=0.95,即異常值識別水平的可信度為0.95:
對于式(11)和式(12),如果計算假設H0和H1的似然函數(shù),需要依據(jù)歷史數(shù)據(jù)擬合概率密度函數(shù)求取高斯分布的方差δ2和δ,由于受到擬合精度的影響,計算出的方差精度不高,方差值的準確性直接關乎到檢測異常值的合理性。為了避免因方差估計不準確造成的檢測異常值不理想,本文引入邊緣化處理的方法[29],對方差δ2和用積分運算的方式估計出式(11)和式(12)的后驗概率。所以式(13)可換成以下2個公式:
對式(13)采用邊緣化處理后,式(16)和式(17)出現(xiàn)了2個未知分布即方差的先驗密度p(δ2)和p(),引入Jeffreys提出的先驗分布函數(shù)來計算p(δ)2和p(),根據(jù)文獻[30]給出了在高斯分布條件下的先驗計算方法p(t)=1/t,0<t<∞,將Jeffreys先驗代入假設H0的式(16)可得:
式(18)中的被積函數(shù)正好為逆Wishart分布的密度函數(shù),即。文獻[28]給出了積分項逆Wishart分布的證明過程。因此式(18)化簡為
同理對式(17)采用同樣的推導過程可得出:
推導出的式(19)和式(20)可直接用于計算假設H0和H1的后驗概率,再根據(jù)異常值判斷準則式(14)計算出φ(t),通過比較φ(t)和η的大小進行檢測殘差序列中的粗大誤差點。
利用邊緣化后驗比的檢測方法辨識擬合殘差序列中的t時刻的粗大誤差點,同時對該時刻的異常風速值剔除。為了進一步提高風速序列的連續(xù)性和可利用性,需要分兩步對數(shù)據(jù)處理。第一步對異常風速序列二階差分處理使其平穩(wěn)化,第二步采用ARMA模型修正異常值。ARIMA算法[31-32]是依據(jù)風速序列的時序性和自相關性建立的,對異常風速值修正精度高。其中ARMA模型可以表示為
式中:α1,α2,…,αp為AR模型系數(shù);β1,β2,…,βq為MA模型系數(shù);εi為獨立同分布的隨機變量序列。
由于風速序列是非平穩(wěn)序列,需要對其進行二階差分平穩(wěn)化,平穩(wěn)化后的風速序列采用式(21)的方法建立ARMA模型,修正被剔除異常風速值。
本文通過組合預測方法與邊緣化后驗比方法相結合建立了風電場異常風速檢測算法,對采集到的運行風速值優(yōu)化處理,從而提高數(shù)據(jù)分析的精度。檢測并修正風電場運行風速值的流程如圖1所示,具體步驟如下所述。
圖1 異常風速值檢測流程Fig.1 Flow chart of anomaly w ind speed detection algorithm
1)輸入待檢測的風電場運行風速數(shù)據(jù)(含有異常風速值)。
2)建立單一預測模型。運用運行風速數(shù)據(jù)分別建立Adaboost-BP網絡預測模型和EMD-LS-SVM預測模型,并計算出每個單一預測模型的預測誤差e1和e2。
3)建立組合預測模型。采用拉格朗日的方法求取組合預測模型的最優(yōu)權重系數(shù)λ1和λ2,得到組合模型的預測值y(t/t-1),并計算出含有粗大誤差信息的殘差序列e(t)。
4)計算后驗比φ(t)。針對學習窗口中L個殘差序列得到殘差分布,并計算出檢測窗口的殘差值et服從2個假設H0和H1的后驗概率,利用式(14)計算出后驗比φ(t)。
5)判定異常風速值。比較后驗比φ(t)與檢測閾值η,當t時刻的后驗比φ(t)小于η時,t時刻的殘差為粗大誤差,即t時刻的風速值異常;反之則為正常值。判定后同時滑動學習窗口和檢測窗口,重復步驟4),檢測t+1時刻的異常情況,直至檢測完成。
6)修正異常風速值。采用ARIMA修正模型對步驟5)檢測出的異常數(shù)據(jù)點進行修正,從而得到正常的風速值。
4.1 案例一
為了驗證本文所提出的組合預測和邊緣化后驗比算法識別異常值的有效性,采用本文所提方法檢測余弦信號中的異常值,選取長度3 000的余弦信號,為了進一步驗證檢測算法的可靠性,在余弦信號再加入信噪比為10 dB的高斯噪聲。前2 000個數(shù)據(jù)用組合預測模型的建立,后1 000個數(shù)據(jù)中隨機加入10個異常點。用于異常檢測的余弦信號如圖2所示。
圖2 含有異常值的仿真信號Fig.2 Simulation signalw ith abnormal value
用前2 000個數(shù)據(jù)點得到的組合預測模型對后1 000個數(shù)據(jù)進行預測,得到的殘差序列如圖3所示。從圖3中可以看出,由預測系統(tǒng)造成的系統(tǒng)誤差接近0,在殘差序列中10個異常值以粗大誤差的形式全部顯示出。
圖3 仿真信號的殘差序列Fig.3 Residual series of simulation signal
分別建立學習窗口和檢測窗口,其中學習窗口的長度L為100,檢測窗口為1,取p(H0)=0.95[14]。采用式(14)計算后驗概率比。從圖4中可以看出,殘差序列中的粗大誤差點的后驗對數(shù)比值φ(t)顯然遠遠小于其他時刻的比值。當φ(t)小于η時,判為異常點;否則殘差序列正常。采用組合預測模型和后驗概率比的方法全部檢測出10個異常點的位置,證明了本文所提方法的可行性。
圖4 仿真信號數(shù)據(jù)的檢測結果Fig.4 Detection result of simulation signal
4.2 案例二
對甘肅酒泉風電場實際采集的數(shù)據(jù)進行異常風速檢測,選取2010年5月15日—5月22日中的7 000個風速數(shù)據(jù),其中將含有異常值的4 000個數(shù)據(jù)用于單一和組合模型的搭建,3 000個風速數(shù)據(jù)用于預測并得到殘差序列。
從圖6可以看出粗大誤差點在600~1 000和2 100~2 400之間出現(xiàn)的頻率比較高,而在圖5中該段異常風速點很難被觀察識別。組合預測的方法能有效地凸顯異常風速點,為下一步的準確檢測異常值提供了保障。
圖5 酒泉風電場實測風速序列Fig.5 M easured w ind speed series from Jiuquan w ind farm s
圖6 酒泉風電場的風速殘差序列Fig.6 Residual series ofwind speed from Jiuquan wind farms
對殘差序列采用學習窗口和檢測窗口滑動的方式檢測粗大誤差點,固定學習窗口的長度L=100,統(tǒng)計學習窗口內的誤差分布參數(shù),并借助后驗概率的方法在2個假設H0和H1的條件下計算出學習窗口t時刻的后驗對數(shù)比。對比圖6和7,發(fā)現(xiàn)殘差序列中的較大粗大誤差對應的后驗對數(shù)比值明顯小于檢測閾值η。
圖7 酒泉風速數(shù)據(jù)的檢測結果Fig.7 Detection result of w ind speed from Jiuquan w ind farm s
采用ARIMA方法修正粗大誤差點所對應的異常風速值,使其得到正常的風速序列,為進一步的分析應用提供可靠的數(shù)據(jù)質量。
為驗證本文識別剔除異常風速值的有效性,采用(RBF)神經網絡預測算法[15-16]對修正后的2 900個風速序列進行預測。其中選取2 000個數(shù)據(jù)用于RBF模型的訓練,900個數(shù)據(jù)用于預測結果的測試。選用平均絕對誤差(MAE)、平均絕對百分誤差(MAPE)、均方根誤差(RMSE)作為預測結果評價指標。
從表1中的RBF預測結果發(fā)現(xiàn),修正后的風速序列與含有異常值的風速序列相比,3項預測指標都有不同程度的提升,因此采用修正異常值后的風速序列進行風速預測可提高預測精度,為風電場風速序列的研究提供了可靠保障。
表1 酒泉風電場預測誤差分析Tab.1 Prediction error analysis from Jiuquan w ind farms
由于風電場測量風速數(shù)據(jù)中存在一些異常風速值,不經預處理直接對其進行預測分析嚴重影響預測精度,本文提出了Adaboost-BP與EMD-LVSVM的組合預測和邊緣化后驗比的檢測算法。為了避免殘差序列中的系統(tǒng)誤差與粗大誤差的混疊現(xiàn)象,使系統(tǒng)誤差降低到最低,本文將含有異常值的數(shù)據(jù)采用組合預測方法獲得訓練模型,并得到殘差序列。由于殘差序列中的系統(tǒng)誤差服從高斯分布,因此選用后驗概率對數(shù)比的方法辨識系統(tǒng)誤差與粗大誤差。為了提高估計參數(shù)的魯棒性,對估計參數(shù)邊緣化處理,從而提高了檢測算法的可行性。仿真結果表明,本文方法能合理地檢測風電場異常風速值,可為短期風速預測提供可靠的數(shù)據(jù)質量。本文方法局限性有以下2點:第一,誤差的大小取決于所建立的預測模型的精度,在以后的研究中需進一步探索合理的預測方法以降低系統(tǒng)誤差;第二,本文的后驗比檢測方法是建立在誤差服從高斯分布的假設下,但異常數(shù)據(jù)很難用服從一種單一的分布,今后需探索適用范圍更廣泛的檢測異常值的方法。
[1]王勃,馮雙磊,劉純.考慮預報風速與功率曲線因素的風電功率預測不確定性估計[J].電網技術,2014,38(2): 463-468. WANG Bo,F(xiàn)ENG Shuanglei,LIU Chun.Uncertainty estimation of wind power forecasting considering wind speed and power curve factor[J].Power Grid Technology,2014,38(2):463-468(in Chinese).
[2]劉興杰,岑添云,鄭文書,等.基于模糊粗糙集與改進聚類的神經網絡風速預測[J].中國電機工程學報,2014,34(19):3162-3169. LIUXingjie,CEN Tianyun,ZHENGWenshu,etal.Neural network wind speed forecasting based on fuzzy rough set and improved clustering[J].Journal of Chinese Electrical Engineering Science,2014,34(19):3162-3169(in Chinese).
[3]艾格林,孫永輝,衛(wèi)志農.基于MEA_Elman神經網絡的光伏發(fā)電功率短期預測[J].電網與清潔能源,2016,32(4):119-124. AIGelin,SUN Yonghui,WEIZhinong.Short-term photovolataic power forecasting based on MEA and elman neural network[J].Power System and Clean Energy,2016,32(4):119-124(in Chinese).
[4]于群,樸在林,胡博.基于EEMD和BP神經網絡的短期光伏功率預測模型[J].電網與清潔能源,2016,32(7): 132-137. YU Qun,PIAO Zailin,HU Bo.A hybridmodel for shortterm photovoltaic power forecasting based on EEMD-BP combined method[J].Power System and Clean Energy,2016,32(7):132-137(in Chinese).
[5]陳偉,郭建鵬,裴喜平,等.風電場短期風速變化區(qū)間與變化趨勢預測算法[J].電力系統(tǒng)及其自動化學報,2015,27(9):47-52. CHENWei,GUO Jianpeng,PEIXiping,et al.Short term wind speed variation range and variation trend prediction algorithm for wind farm[J].Proceedings of the CSU-EPSA,2015,27(9):47-52(in Chinese).
[6]修春波,任曉,李艷晴,等.基于卡爾曼濾波的風速序列短期預測方法[J].電工技術學報,2014,29(2):253-259. XIU Chunbo,REN Xiao,LI Yanqing,et al.Short term forecasting method of wind speed series based on calman filter[J].Transactions of China Electrotechnical Society,2014,29(2):253-259(in Chinese).
[7]陳道君,李幕,楊楠,等.基于最優(yōu)權系數(shù)的風電功率組合預測方法[J].電網與清潔能源,2016,32(4):99-105. CHEN Daojun,LIMu,YANG Nan,et al.Combination forecastingmethod of wind power based on optimal weight coefficient[J].Power System and Clean Energy,2016,32(4):99-105(in Chinese).
[8]田波,樸在林,王慧.基于時間序列建模在風力發(fā)電功率短期預測中的研究[J].電網與清潔能源,2016,32(3):115-119. TIAN Bo,PIAO Zailin,WANG Hui.Short term prodiction of wind power based on time series modeling[J].Power System and Clean Energy,2016,32(3):115-119(in Chinese).
[9]BARNET V,LEWIS T.Outlier in statistical data[M]. Chichester:John Wiley and Sons,1994.
[10]ZHENG Le,MIN Yong.Raw wind data preprocessing:A data-mining approach[J].IEEE Transactions on Sustainable Energy,2015,6(1):11-19.
[11]李麗,葉林.風速數(shù)據(jù)奇異點辨識研究[J].電力系統(tǒng)保護與控制,2011,39(21):92-97. LILi,YE Lin.Research on singular point identification of wind speed data[J].Power System Protection and Control,2011,39(21):92-97(in Chinese).
[12]尚華,馮牧,張貝貝.基于Bayesian方法的參數(shù)估計和異常值檢測[J].重慶郵電大學學報(自然科學版),2016,28(1):138-142. SHANG Hua,F(xiàn)ENG Mu,ZHANG Beibei.Parameter estimation and outlier detection based on bayesian method[J].Journal of Chongqing University of Posts and Telecommunications,2016,28(1):138-142(in Chinese).
[13]王雷,張瑞青,盛偉,等.基于支持向量機的回歸預測和異常數(shù)據(jù)檢測[J].中國電機工程學報,2009,29(8): 92-96. WANG Lei,ZHANG Ruiqing,SHENG Wei,et al. Regression prediction and anomaly data detection based on support vector machine[J].Proceedings of the CSEE,2009,29(8):92-96(in Chinese).
[14]張鋒利,陳文獻,賈海英.支持向量機和BP神經網絡在水輪發(fā)電機軸承故障診斷中的應用[J].電網與清潔能源,2013,29(4):62-66. ZHANG Fengli,CHENWenxian,JIA Haiying.Application of support vectormachines and BP neural network in the rolling bearing of hydraulic turbine generator fault diagnosis[J].Power System and Clean Energy,2013,29(4):62-66(in Chinese).
[15]張宇航,蘭生.基于廣義神經網絡與模糊聚類的變壓器故障診斷[J].高壓電器,2016,52(5):116-120. ZHANG Yuhang,LAN Sheng.Transformer fault diagnosis based on GRNN and FCM[J].High Voltage Apparatus,2016,52(5):116-120(in Chinese).
[16]苗長新,申坤,鐘世華,等.基于優(yōu)化神經網絡和DGA的變壓器故障診斷[J].高壓電器,2016,52(11):163-167. MIAO Changxin,SHEN Kun,ZHONG Shihua,et al. Power transformer fault diagnosis based on improved neutral network and DGA[J].High Voltage Apparatus,2016,52(11):163-167(in Chinese).
[17]劉太洪,趙永雷.動態(tài)加權模糊聚類在變壓器故障診斷中的應用研究[J].電網與清潔能源,2016,32(4):89-92. LIU Taihong,ZHAO Yonglei.Application of dynamic weighted fuzzy clustering algorithm to fault diagnosis of transformer[J].Power System and Clean Energy,2016,32(4):89-92(in Chinese).
[18]劉輝舟,周開樂,胡小建.基于模糊負荷聚類的不良負荷數(shù)據(jù)辨識與修正[J].中國電力,2013,46(10):29-34. LIU Huizhou,ZHOU Kaile,HU Xiaojian.Identification and correction of bad load data based on fuzzy load clustering[J].Electric Power,2013,46(10):29-34(in Chinese).
[19]BRETASN G,BRETAS A S,PIERETIS A.Innovation concept for measurement gross error detection and identification in power system state estimation[J].IETGeneration,Transmission&Distribution,2011,5(6):603-608.
[20]李麗,葉林.基于改進持續(xù)法的短期風電功率預測[J].農業(yè)工程學報,2010,26(12):182-187. LILi,YE Lin.Short term wind power prediction based on improved continuation method[J].Transactions of the Chinese Society of Agricultural Engineering,2010,26(12):182-187(in Chinese).
[21]劉亞南,范立新,徐鋼,等.基于非負矩陣分解與改進極端學習機的變壓器油中溶解氣體濃度預測模型[J].高壓電器,2016,52(1):162-169. LIU Yanan,F(xiàn)AN Lixin,XU Gang,et al.Concentration prediction model of dissolved gases in transformer oil based on NMF and improved ELM[J].High Voltage Apparatus,2016,52(1):162-169(in Chinese).
[22]柳玉,郭虎全.基于AdaBoost與BP神經網絡的風速預測研究[J].電網與清潔能源,2012,28(2):80-83. LIU Yu,GUO Huquan.Wind speed prediction based on AdaBoost and BP neural networks[J].Power System and Clean Energy,2012,28(2):80-83(in Chinese).
[23]呂帥,張靠社.基于小波變換去噪預處理的EMD諧波檢測方法[J].電網與清潔能源,2016,32(6):59-61. Lü Shuai,ZHANG Kaoshe.EMD harmonic detection method of denoising preprocessing based on wavelet transform[J].Power System and Clean Energy,2016,32(6):59-61(in Chinese).
[24]鄭港,鄢小虎,謝齊家,等.一種基于螢火蟲支持向量機的油色譜在線數(shù)據(jù)校正方法[J].高壓電器,2013,49(9):23-27. ZHENGGang,YAN Xiaohu,XIEQijia,etal.Method for the oil chromatographic on-line data reconciliation based on GSO and SVM[J].High Voltage Apparatus,2013,49(9):23-27(in Chinese).
[25]曾杰,張華.基于最小二乘支持向量機的風速預測模型[J].電網技術,2009,33(18):144-147. ZENG Jie,ZHANG Hua.Wind speed forecasting model based on least square support vector machine[J].Power System Technology,2009,33(18):144-147(in Chinese).
[26]葉林,任成,趙永寧,等.超短期風電功率預測誤差數(shù)值特性分層分析方法[J].中國電機工程報,2016,36(3):692-700. YE Lin,REN Cheng,ZHAO Yongning,etal.Super short term wind power prediction error numerical characteristic analysismethod[J].Journal of Chinese Electrical Engineering Science,2016,36(3):692-700(in Chinese).
[27]ALARCON-AQUINO V,BARRIA JA.Anomaly detection in communications[J].IET Journals&Magaines,2001,148(6):355-362.
[28]GUSTAFSSON F.The marginalized likelihood ratio test for detecting abrupt changes[J].IEEE Transactions on Automatic Control,1996,41(1):355-362.
[29]蘇衛(wèi)星,朱云龍,胡琨元,等.基于模型的過程工業(yè)時間序列異常值檢測方法[J].儀器儀表報,2012(9):2080-2087. SUWeixing,ZHU Yunlong,HU Kunyuan,et al.Method for detecting outliers in process industry time series based on model[J].Instrument and Meter,2012(9):2080-2087(in Chinese).
[30]BERNARDO JM,SMITH A F M.Bayesian theory[M].
New York:Wiley,1994.
[31]GONG Shuhong,GAO Yifeng,SHI Houbao,et al.A practical MGA-ARIMA model for forecasting real-time dynamic rain-induced attenuation[J].IEEE Transactions on Radio Science,2013,48(3):208-225.
[32]YUNUS K,THIRINGER T,CHEN Peiyuan.ARIMA-based frequency-decomposedmodeling ofwind speed time series[J].IEEE Transactions on Power Systems,2016,31(4):2546-2556.
Anomaly W ind Speed Detection M ethod w ith Im proved Bayesian Posterior Ratio
CHENWei,WU Butuo,PEIXiping,WANG Yizhe
(Institute of Electrical Engineering and Information Engineering,Lanzhou University of Technology,Lanzhou 730050,Gansu,China)
As wind speed data contains abnormal values from wind farms,in order to optimize the quality ofwind power data,this paper proposes an outlier detection method with the improved Bayesian posterior ratio.To reduce the prediction error,the paper establishes a combination forecasting model based on BP network and least square support vectormachine. The residual error sequence is obtained by calculating the deviation between the predicted value and themeasured value. The gross errors in the residual series are identified by the test method of Bayesian posterior ratio,and this approach can improve the reliability and determine the location of the abnormal value.Finally,we use the ARIMA method to correct the abnormal wind speed.RBF prediction results show that the proposed method can accurately identify outliers,thus improving the forecasting accuracy ofwind speed.
anomaly wind speed detection method;combined forecasting model;residual analysis;Bayesian posterior ratio
2016-08-15。
陳 偉(1976—),男,博士,教授,博導,主要研究方向為電能質量分析和控制、新能源發(fā)電技術;
(編輯 馮露)
國家重點研發(fā)計劃(2016YFB0601600);國家自然科學基金項目(51267012);甘肅省科技支撐工業(yè)計劃項目(1504GKCA033)。
Project Supported by National Key Research and Development Program(2016YFB060 1600);the National Natural Science Foundation of China(51267012);Science and Technology Support Industry Program of Gansu Province(1504GKCA033).
1674-3814(2017)02-0104-08
TM614
A
誤差,從而確定異常風速值的位置,并利用ARIMA方法修正異常風速值。RBF預測結果表明,所提方法能準確識別異常值,從而提高了風電場短期風速預測精度。
吳布托(1988—),男,碩士研究生,主要研究方向為新能源發(fā)電技術。