國(guó)電電力河北新能源開發(fā)有限公司 孫立志 王 健 趙 鵬 馬亞楠
由于風(fēng)力發(fā)電可以做到節(jié)能減排,因此世界各國(guó)出臺(tái)了許多風(fēng)電相關(guān)政策,風(fēng)場(chǎng)效益每年的增幅維持在20%左右,同時(shí)越來(lái)越注重海上風(fēng)電的發(fā)展,能源供給不足與環(huán)境破壞嚴(yán)重是我國(guó)目前較為嚴(yán)重的問題,風(fēng)力發(fā)電清潔環(huán)保,資源豐富可以長(zhǎng)期使用,大力發(fā)展風(fēng)力發(fā)電可以解決上述問題[1-2]。隨著風(fēng)電場(chǎng)的規(guī)模和風(fēng)機(jī)的數(shù)量均不斷增大,部分裝機(jī)時(shí)間較早的風(fēng)機(jī),不斷增加的故障次數(shù),也造成了發(fā)電效率的下降,如何采用采集到的多元數(shù)據(jù)對(duì)機(jī)組故障進(jìn)行故障預(yù)警和判斷具有十分重要的現(xiàn)實(shí)意義和價(jià)值。
近年來(lái)我國(guó)對(duì)風(fēng)電發(fā)展的期望值越來(lái)越高,2013~2020年中國(guó)風(fēng)電裝機(jī)容量(萬(wàn)千瓦)分別為7652/9657/13075/14747/16400/18426/20070/2 3585,全球風(fēng)電裝機(jī)容量(吉瓦)分別為312/362/421/473/522/568/612/674。風(fēng)電系統(tǒng)工作人員通過(guò)SCADA 系統(tǒng)獲得關(guān)于風(fēng)機(jī)故障的多元數(shù)據(jù)可以反映出風(fēng)機(jī)的發(fā)電性能和運(yùn)行狀態(tài),對(duì)多元數(shù)據(jù)進(jìn)行發(fā)掘并加入人工智能等手段對(duì)風(fēng)機(jī)進(jìn)行故障預(yù)警與發(fā)電性能評(píng)估勢(shì)在必行。
發(fā)電機(jī)組運(yùn)行工況惡劣,風(fēng)機(jī)長(zhǎng)時(shí)間工作在這種環(huán)境下其各個(gè)部件性能會(huì)之間下降,當(dāng)下降到一定程度時(shí)風(fēng)機(jī)便會(huì)出現(xiàn)故障,隨之影響到風(fēng)機(jī)發(fā)電效率。使風(fēng)機(jī)運(yùn)行的關(guān)鍵部位有輪轂,漿距系統(tǒng),齒輪箱,發(fā)電機(jī),偏航系統(tǒng)等,其中漿距系統(tǒng)與偏航系統(tǒng)主要使風(fēng)機(jī)能最大化的獲取風(fēng)能,從而提升發(fā)電性能,制動(dòng)系統(tǒng),傳動(dòng)系統(tǒng),齒輪箱與發(fā)電機(jī)主要可以將風(fēng)產(chǎn)生的機(jī)械能轉(zhuǎn)化為電能,從而輸入電網(wǎng),塔架的主要作用是撐葉片和機(jī)艙。
基于已有的風(fēng)機(jī)全息化狀態(tài)監(jiān)測(cè)系統(tǒng)和SCADA記錄,針對(duì)風(fēng)機(jī)運(yùn)行技術(shù)數(shù)據(jù)量大,在故障診斷時(shí)有一定困難,在此提出了一種基于ReliefF、主成分分析(PCA)與深度神經(jīng)網(wǎng)絡(luò)(DNN)的風(fēng)機(jī)故障診斷方法。首先,對(duì)故障相關(guān)特征進(jìn)行提取,使用ReliefF 方法選擇與故障相關(guān)的特征,降低數(shù)據(jù)維度;并使用PCA 算法進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行降維,降低數(shù)據(jù)間的冗余性,提高故障診斷的準(zhǔn)確性;最后使用優(yōu)化后的DNN 建立多故障診斷模型。風(fēng)機(jī)故障診斷流程為:數(shù)據(jù)預(yù)處理;數(shù)據(jù)降維;故障診斷。
SCADA 系統(tǒng)記錄并存儲(chǔ)的大量風(fēng)機(jī)數(shù)據(jù),如不對(duì)數(shù)據(jù)進(jìn)行處理,則會(huì)產(chǎn)生故障判斷時(shí)間長(zhǎng)且準(zhǔn)確率低的問題,因此需要進(jìn)行數(shù)據(jù)挖掘,提取故障數(shù)據(jù)的敏感特征。主成分分析(PCA)是一種較為常見的特征降維算法,主成分分析(PCA)是一種較為常見的特征降維算法,通過(guò)PCA 可以降低特征集的維數(shù),并且仍包含數(shù)據(jù)的原始信息。
算法流程如下:將矩陣x 集中起來(lái)(去掉每個(gè)維度的平均數(shù)):C=VTx,計(jì)算樣本的協(xié)方差矩陣:,把協(xié)方差矩陣的特征值分解,選取前n 個(gè)最大的特征值對(duì)應(yīng)的的特征向量構(gòu)成特征向量矩陣W。其中:x 為特征向量;V 為去平均化向量;C 為降維矩陣;S 為樣本數(shù);Ψ 為特征矩陣中數(shù)值每列平均值后的新矩陣;ψ 的協(xié)方差矩陣定義為B。
PCA 保留了原始數(shù)據(jù)中較為重要的內(nèi)容并且讓數(shù)據(jù)的維度降低,并且數(shù)據(jù)映射到新空間中使坐標(biāo)系發(fā)生變換,減少了數(shù)據(jù)間的相關(guān)性。ReliefFPCA 算法具體流程為:第一步使用ReliefF 算法對(duì)原始SCADA 數(shù)據(jù)進(jìn)行特征選擇,第二步將數(shù)據(jù)帶入初始化后的ReliefF 算法,第三步將數(shù)據(jù)輸入到PCA 算法中進(jìn)行特征降維,將90%以上主成分的數(shù)據(jù)最為最終的輸入數(shù)據(jù)。將隱層數(shù)量多的神經(jīng)網(wǎng)絡(luò)稱之為深度神經(jīng)網(wǎng)絡(luò)(DNN),將神經(jīng)網(wǎng)絡(luò)的輸入得到權(quán)重求和后輸入到激活函數(shù)中,通過(guò)激活函數(shù)得到下一層的輸出。目前在學(xué)術(shù)界與工程上使用最為廣泛的激活函數(shù)有sigmoid、tanh、ReLU。
DNN 故障診斷模型搭建具體流程為:
第一步根據(jù)數(shù)據(jù)的來(lái)源風(fēng)機(jī)情況,將通過(guò)ReliefF-PCA 降維后的數(shù)據(jù)賦予標(biāo)簽,構(gòu)建出故障診斷數(shù)據(jù)集,以6:1:3的比例劃分為訓(xùn)練集、測(cè)試集、驗(yàn)證集,使用訓(xùn)練集完成對(duì)模型的訓(xùn)練,通過(guò)測(cè)試集調(diào)整模型超參數(shù),最后使用驗(yàn)證集驗(yàn)證模型性能;第二步初始化模型參數(shù),包括隱藏層層數(shù)、隱藏層神經(jīng)元個(gè)數(shù)、激活函數(shù)、優(yōu)化函數(shù)、指定輸入輸出的神經(jīng)元個(gè)數(shù)等。
第三步通過(guò)訓(xùn)練集訓(xùn)練模型,當(dāng)達(dá)到迭代次數(shù)后模型訓(xùn)練完成,此時(shí)神經(jīng)元之間的權(quán)重固定,通過(guò)分類器softmax 輸出結(jié)果,權(quán)重最大的就屬于哪一類,分類器softmax 的loss 函數(shù)如為L(zhǎng)oss=∑yilnai;第四步通過(guò)測(cè)試集的loss 曲線進(jìn)行參數(shù)調(diào)整,調(diào)整到效果最佳后使用驗(yàn)證集驗(yàn)證模型效果。
數(shù)據(jù)來(lái)源:試驗(yàn)數(shù)據(jù)均采用某風(fēng)場(chǎng)場(chǎng)數(shù)據(jù),數(shù)據(jù)間隔為10秒鐘記錄一次,風(fēng)機(jī)選擇5臺(tái)風(fēng)機(jī),2018年11月其故障次數(shù)分別為98/207/296/517/172,發(fā)生故障時(shí)風(fēng)機(jī)狀態(tài)由0變?yōu)?,將故障最少的2號(hào)風(fēng)機(jī)作為正常風(fēng)機(jī),剔除故障時(shí)間段后的數(shù)據(jù)為正常數(shù)據(jù)。本文主要對(duì)風(fēng)機(jī)幾種常見故障進(jìn)行診斷,分為5種狀態(tài):正常狀態(tài)、齒輪箱油溫超溫故障、齒輪箱NDE 端軸承溫度超溫故障、主軸剎車抱閘故障、機(jī)艙溫度故障。
特征降維與優(yōu)化:原始數(shù)據(jù)量龐大,各參數(shù)之間相關(guān)性高,對(duì)原始數(shù)據(jù)進(jìn)行特征降維就變的十分必要。對(duì)閾值大小進(jìn)行討論,分為平均值、中位數(shù)與標(biāo)準(zhǔn)差。將A1稱為平均數(shù)為閾值進(jìn)特征選擇后的特征,A2稱為中位數(shù)為閾值進(jìn)行特征選擇后的特征,A3稱為標(biāo)準(zhǔn)差為閾值進(jìn)行特征選擇后的特征,對(duì)應(yīng)于不同閾值的所選特征數(shù)量如表1所示。
表1 對(duì)應(yīng)于不同閾值的所選特征數(shù)量
DNN 優(yōu)化算法選擇:在DNN 中參數(shù)的更新算法一定程度影響著網(wǎng)絡(luò)的訓(xùn)練速度以及診斷準(zhǔn)確率,對(duì)于這個(gè)缺點(diǎn),提出了許多較為新穎的優(yōu)化器:RMSProp 優(yōu)化器、Adagrad 優(yōu)化器、Adadelta優(yōu)化器,Adam 優(yōu)化器。優(yōu)化算法訓(xùn)練誤差中,Adagrad 優(yōu)化算法收斂速度最慢,并且收斂后誤差較大;SGD 優(yōu)化算法與Adadelta 優(yōu)化算法收斂速度較慢,收斂后誤差波動(dòng)較大;RMSProp 優(yōu)化算法與Adam 優(yōu)化算法在收斂速度上較為接近,但Adam優(yōu)化算法收斂后誤差最小,最為平穩(wěn),因此選擇Adam 優(yōu)化算法作為模型的優(yōu)化算法。
模型仿真情況對(duì)比:為了驗(yàn)證ReliefF-PCA 降維算法對(duì)故障診斷準(zhǔn)確率與泛化性,與其他降維算法進(jìn)行對(duì)比驗(yàn)證,各降維算法故障診斷準(zhǔn)確率如表2所示。其次,ReliefF-DNN 模型和Pearson-DNN 模型由于對(duì)多故障或多風(fēng)機(jī)的泛化能力差,不能有效診斷故障?;赑earson 相關(guān)系數(shù)的模型具有良好的降維效果,當(dāng)只有一個(gè)風(fēng)機(jī)齒輪箱油溫超標(biāo)時(shí),相關(guān)參數(shù)較少。當(dāng)風(fēng)機(jī)數(shù)量增加時(shí),降維效果會(huì)變差。
表2 各降維算法故障診斷準(zhǔn)確率(%)