陳映瓊, 顧軍民, 姜 勝, 陳思函
(1.國電浙江北侖第一發(fā)電有限公司, 浙江 寧波 315800; 2.國電寧波風電開發(fā)有限公司, 浙江 寧波 315043;3.國網湖北省電力有限公司, 湖北 武漢 430079; 4.華北電力大學, 河北 保定 071003)
近年來,風電機組裝機容量在世界范圍內快速增加。根據最新統(tǒng)計數據,2019年全球新增風電裝機容量60.4 GW,其中我國新增裝機容量達到2.3 GW,創(chuàng)下歷史新高。雖然風電事業(yè)發(fā)展迅速,但風電項目搶裝潮過后的“風電機組質?!崩Ь謪s沒有得到足夠關注,同時風電場地處偏遠,環(huán)境惡劣,導致維修成本居高不下,對風電場運行維護影響巨大[1]。
風電機組靠風驅動,承受著巨大的隨機沖擊力,因此會產生多種類型的故障[2]。齒輪箱作為風電機組傳動系統(tǒng)中的關鍵設備,影響整個機組的運行。若其故障未能及時維修,會產生重大經濟損失,因此對齒輪箱的運行狀態(tài)進行實時監(jiān)測至關重要。
目前,大部分風電場都已安裝數據采集與監(jiān)控(Supervisory Control and Data Acquisition,SCADA)系統(tǒng)來實時監(jiān)測風電機組各個系統(tǒng)的運行狀態(tài)參數。文獻[3]使用加權主成分分析法建立正常工況下的發(fā)電機溫度模型,利用所建模型對其余時間段運行數據進行溫度故障檢測。文獻[4]結合SCADA數據采用相關性分析確定與有功功率強相關性的溫度參數建立風電機組異常識別模型,采用滑動窗口進行在線監(jiān)測。文獻[5]提出了改進的線性回歸徑向基神經網絡方法,建立正常運行狀態(tài)下軸承的溫度預測。文獻[6]提出一種基于果蠅算法優(yōu)化極限學習機的方法對風機齒輪箱進行狀態(tài)檢測,并預測齒輪箱剩余使用壽命。文獻[7]提出D-S(Dempster-Shafer)證據理論對風電機組SCADA報警數據進行故障分析。上述文獻都是基于相關特征參數建立優(yōu)化的模型來提高預測精度,使機組的在線監(jiān)測更加精準。但風電機組的建模不僅依賴合理的特征參數和建模方法,還應包括建模所需運行數據的選取。在這方面,上述文獻涉及較少。
針對這一問題,本文提出一種基于異常數據清洗和動態(tài)神經網絡的齒輪箱油溫建模方法,將現場采集的SCADA數據進行有效清洗,同時選擇合理的模型輸入參數,使清洗后數據所建模型精度更高,預測效果更好。繼而引用統(tǒng)計過程控制方法實時監(jiān)控齒輪箱油溫趨勢,并用實例驗證該方法可有效監(jiān)測異常狀況,達到預警效果。
本文選取的SCADA數據來自河北省某風電場,配備遠景1.5 MW雙饋式風力發(fā)電機,切入風速為3 m/s,額定風速為12 m/s,切出風速為25 m/s。該SCADA系統(tǒng)每分鐘記錄一次監(jiān)測數據,監(jiān)測參數包括有功功率、發(fā)電機轉速、風速、主軸承溫度、風向、槳距角、偏航角等共97個,每臺機組一年可記錄近400 000個數據項。
為了更好地將SCADA系統(tǒng)數據進行預處理,需要建立標準風速-功率曲線。標準的風速-功率曲線是結合當地空氣密度由廠家提供的,已知該風電場標準空氣密度為1.01 kg/m3。標準風速-功率曲線如圖1所示。
圖1 標準風速功率曲線
由圖1可知:當風速小于切入風速時,風機不發(fā)電處于待機狀態(tài);當風速達到切入風速時,風機開始轉動產生輸出功率,功率隨風速的增加逐漸增加[8];當風速達到額定風速時,機組功率達到額定功率1.5 MW;當風速超過額定風速時,風機通過變槳系統(tǒng)調節(jié)槳距角使功率維持在額定功率附近;當風速超過切出風速時,風機制動停機。
1.3.1 異常數據分布
由于棄風限電以及傳感器自身精度誤差等原因,實際風電場采集的SCADA數據存在大量異常數據,這些異常數據的存在會直接影響到模型的預測精度[9]。按照標準風速-功率曲線的分布特征,異常數據大致可分為以下幾類:第1類為曲線底部堆積型數據,表現為風速很大但功率為零的數據;第2類為曲線中部堆積型數據,表現為風速很大但功率維持在小于額定功率的某個恒定功率,即限功率數據;第3類為曲線四周分布的散點型數據,表現為風速很小但功率很大或風速很大但功率很小的散點數據。這里選取該風場2017年連續(xù)12個月的數據分布如圖2所示。
圖2 機組異常數據分布
1.3.2 bin算法擬合風速-功率曲線
為有效避免風速-功率曲線在額定功率時出現擬合不準的現象,采用bin算法進行擬合[10]。根據風機運行原理,首先剔除風速小于切入風速和大于切出風速的數據。然后,將運行范圍內的風速劃分為兩個大區(qū)間即[切入風速,額定風速]和[額定風速,切出風速]。每個大區(qū)間再把風速等間隔劃分,稱為風速bin[11]。為方便擬合取每0.5 m/s風速為一個bin,分別求得每一個bin中的風速、功率平均值,得到所對應點(vi,pi),通過所得的點擬合即可得到擬合的風速-功率曲線。
(1)
(2)
式中:vi,vij——第i個bin區(qū)間的平均風速,第i個bin區(qū)間內第j個實際風速;
pi,pij——第i個bin區(qū)間的平均功率,第i個bin區(qū)間內第j個實際功率;
mi——第i個bin區(qū)間的總數據數。
1.3.3 異常數據清洗
bin算法可對風速-功率曲線進行有效的擬合,且所得曲線平滑誤差較小[12]。數據清洗步驟如下:計算風速對應的擬合曲線功率與實際功率的歐氏距離,實際運行功率越接近擬合功率,距離值就越小。根據數據統(tǒng)計距離值分布的標準差σ。標準差可以反映一個數據集的離散程度,位于σ內的數據為正常數據,否則為異常數據,剔除標準差大于σ的數據,從而達到清洗原始數據的目的[13]。數據清洗后結果如圖3所示。
圖3 數據清洗后的風速功率曲線
風機在運行過程中各個子系統(tǒng)相互作用、緊密聯(lián)系,所以齒輪箱油池溫度模型特征參數的選取不僅包括齒輪箱系統(tǒng)中的參數,還包括其他系統(tǒng)的參數。由于不同參數對齒輪箱油池溫度影響不盡相同,因此合理選擇特征參數至關重要?;バ畔⒎捎嬎銉蓚€變量之間的相關性,因此可采用該方法確定與齒輪箱油池溫度密切相關的特征參數。兩個隨機變量X和Y的互信息計算公式如下
(3)
式中:p(x,y)——X和Y的聯(lián)合概率分布函數;
p(x),p(y)——X和Y的邊緣概率分布函數。
選取2017年5月1日至7日的數據,計算各個參數與油池溫度的相關性,選擇閾值大于0.6的參數為模型輸入參數。最終確定模型輸入參數為發(fā)電機功率、風速、主軸轉速、液壓站預充壓力、齒輪箱驅動端軸承溫度和齒輪箱非驅動端軸承溫度,模型的輸出參數為齒輪箱油池溫度。
NARX(Nonlinear Autoregressive with Exogenous Inputs)神經網絡是帶有外部輸入且具有反饋的動態(tài)神經網絡,網絡的輸入不僅與當前的輸入有關,而且與過去的輸出有關[14]。齒輪箱油池溫度不但有較強的自相關性,還與風速、功率等外部相關變量具有相關性。本文引入NARX動態(tài)神經網絡對風機齒輪箱油池溫度進行建模。該模型能夠將輸出信號反饋到輸入端從而將輸出信號參與到下一次的迭代訓練中,具有記憶功能,因此可以更好地描述具有復雜映射關系的時變系統(tǒng)的特性[15]。NARX神經網絡結構如圖4所示。其中,d表示延時階數,W為聯(lián)接權值,b為閾值,f1,f2分別為隱含層和輸出層函數。采用萊文伯格-馬夸特(Levenberg-Marquardt,LM)算法進行權值迭代。該算法具有收斂時間短等特點[16]。齒輪箱油池溫度預測值定義如下
y(t+1)=f[y(t),y(t-1),…,y(t-ny),
x(t),x(t-1),…,x(t-nx)]
(4)
式中:y(t),y(t-1),…,y(t-ny)——齒輪箱油池溫度的時間序列;
x(t),x(t-1),…,x(t-nx)——外部輸入參數序列。
圖4 NARX神經網絡結構
選取上節(jié)的數據對齒輪箱油池溫度進行建模。選擇15%的數據用于模型訓練,15%的數據用于模型驗證,70%的數據用于模型測試。使用較多的數據進行模型預測,可使精度達到更高要求。同時NARX神經網絡的延時階數與隱含層個數也影響著模型的預測精度。經過反復多次實驗最終確定NARX神經網絡的延時階數d為3,隱含層個數m為10。
NARX神經網絡輸入誤差相關性結果如圖5所示。輸入誤差自相關性反映數據之間的相關性,由圖5(a)可知,除零延遲外,其余基本落在95%的置信區(qū)間內,表明網絡具有較強的預測能力。輸入誤差互相關性表示輸入與誤差之間的相關性,由圖5(b)可知,該指標同樣在95%的置信區(qū)間內,表明網絡性能較優(yōu)。
圖5 NARX神經網絡輸入誤差相關性結果
網絡預測值和實際值對比如圖6所示,預測曲線基本接近實際曲線,誤差范圍也相對較小。
圖6 NARX神經網絡齒輪箱油池溫度預測曲線
為了更好地判定模型的預測結果,采用均方差(Mean Squared Error,MSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)值來評價模型精度,并與BP、ELMAN神經網絡進行對比。MSE、MAE、MAPE等誤差指標越小,模型的預測精度越高,其中MSE描述了誤差的偏離程度,反映了模型的穩(wěn)定性,其值越小,則系統(tǒng)越穩(wěn)定[17]。性能對比結果如表1所示。
表1 NARX模型和其他模型的性能指標對比結果
本文將統(tǒng)計過程控制(Statistical Process Control,SPC)方法引用到風電機組齒輪箱的殘差監(jiān)測中,通過監(jiān)測齒輪箱實際油溫與模型預測油溫的殘差分布狀況來實現齒輪箱運行狀態(tài)在線監(jiān)測行為[18]。
如果殘差變量X服從正態(tài)分布,即X~N(μ,σ2),則p(μ-3σ (5) (6) 式中:μ——殘差均值; n——監(jiān)測的總數據數; ei——每個監(jiān)測油溫實際值與預測值的差值; σ——標準差。 齒輪箱油池正常溫度范圍基本維持在55~62 ℃。當油池溫度高于70 ℃時,機組發(fā)生報警故障。正常運行狀態(tài)下的殘差分布基本呈正態(tài)分布,符合SPC預警方法。根據式(5)和式(6)可求得μ和σ,即Xe~N(0.6,0.42)。計算閾值上限(UCL)為1.650 6,閾值下限(LCL)為-1.673 8,正常運行狀態(tài)下齒輪箱油池溫度殘差在閾值線范圍內波動,具體如圖7所示。 圖7 齒輪箱油池溫度正常狀態(tài)下殘差波動曲線 已知該機組2017年10月28日15:23:00發(fā)生“齒輪箱油池溫度高于上限值”故障。實驗選取2017年10月28日03:30:00至2017年10月28日15:22:00的數據段進行監(jiān)測。齒輪箱油池溫度監(jiān)測結果如圖8所示。當齒輪箱油池溫度出現異常狀況時,殘差逐漸上升直至超過閾值上限。殘差第一次超過閾值上限時間點為04:16:00,但之后殘差又回到正常范圍,這是由于監(jiān)測系統(tǒng)存在一定概率的誤報警,誤報警階段誤差曲線也會超過閾值,因此不能直接認定這是預警時間點。從04:43:00時刻開始殘差再次超過閾值,且呈直線上升趨勢,表明溫差偏離正常范圍,可認為該點為首次報警點,即預警時間為2017年10月28日04:43:00,比故障發(fā)生時間提前約10.5 h提出預警。 圖8 齒輪箱油池溫度殘差監(jiān)測曲線 本文結合風電場SCADA系統(tǒng)采集的數據,提出了一種基于bin算法擬合風速-功率曲線與標準差數據清洗方法,有效剔除了異常數據,提高了風電機組齒輪箱模型精度。通過互信息法選擇合理的特征參數,采用NARX動態(tài)神經網絡建立齒輪箱油池溫度模型,并與BP和ELMAN神經網絡進行對比,通過模型評價指標分析得到NARX動態(tài)神經網絡所建模型各指標均優(yōu)于對比模型。最后,采用統(tǒng)計過程控制方法確定預警上下閾值線,對齒輪箱油池溫度進行實時監(jiān)測。通過實例證明,該方法可對齒輪箱油池溫度異常狀況提前預警,對風電機組的運行維護具有重大意義。3.2 實例分析
4 結 語