傅曉駿 孫海龍 章珈寧
摘?要:發(fā)電風機葉片結冰故障診斷在國際上現(xiàn)在依舊在研發(fā)過程,大多數(shù)風力發(fā)電廠都是葉片結冰影響運行后進停止發(fā)電,用各種方法去冰。針對這一現(xiàn)象,本文設想了一種采用數(shù)據(jù)驅動型的結冰檢測方法,通過分析SCADA系統(tǒng)采集現(xiàn)場數(shù)據(jù),建立結冰預測模型。首先根據(jù)工業(yè)大數(shù)據(jù)的特點,在預處理環(huán)節(jié),進行剔除奇異值等操作;再通過機理分析,選擇合適特征;最后將特征數(shù)據(jù)帶入使用粒子群算法優(yōu)化參數(shù)的支持向量機中。實驗表明對葉片結冰預測取得了顯著成果,這可能成為風機葉片結冰狀態(tài)預測的新方法。
關鍵詞:風機故障診斷;風力發(fā)電;工業(yè)大數(shù)據(jù);支持向量機
葉片結冰是風電領域的一個全球范圍難題。目前對風力機結冰問題研究上集中在及時發(fā)現(xiàn)葉片的結冰情況并在產(chǎn)生影響前除去冰,如果能對葉片結冰進行早期預測,也是防止葉片結冰對風力發(fā)電產(chǎn)生影響的重要手段,現(xiàn)在也有通過紅外線檢測葉片溫度數(shù)據(jù)預測結冰狀態(tài)。然而上述這些方法,都需要對葉片進行改造,裝設額外設備,降低了風力發(fā)電效率。
SCADA系統(tǒng)在風電行業(yè)已廣泛使用,系統(tǒng)每天產(chǎn)生大量的監(jiān)測數(shù)據(jù),而葉片結冰的信息往往蘊含其中,本文設想通過數(shù)據(jù)驅動角度,對SCADA系統(tǒng)監(jiān)視數(shù)據(jù)進行處理,以實現(xiàn)對葉片結冰狀態(tài)的檢測和判斷,從過去被動維護轉變?yōu)橹鲃泳S護,且不過分依賴于專業(yè)知識。
1 數(shù)據(jù)預處理
首先刪去訓練集中的已知的無效樣本。
然后采用箱型圖方法可以剔除部分奇異點:
(1)樣本被從小到大排列,按照某個變量;
(2)計算該變量的上四分位數(shù)Q2,下四分位數(shù)Q1,中位數(shù);
(3)計算上下限:
式中:Δ=Q2-Q1,k為控制限,但k=1.5時得到的奇異值是溫和的,當k=3時得到的奇異值是極端的,這里我們需要極端奇異值;
(4)該變量奇異點所在的樣本被全部刪除;
(5)繼續(xù)以上方法計算,直到檢驗完畢所有變量。
2 平衡數(shù)據(jù)集
通過一般的學習算法所獲得的分類效果經(jīng)常不夠理想。因此我們嘗試通過在數(shù)據(jù)層面和算法層面進行創(chuàng)新改進來提升效果。數(shù)據(jù)層面主要是重采樣技術,比如EasyEnsemble和BalanceCascade兩種知情欠采樣方式,合成少類過采樣技術(SMOTE)技術等等。在算法層面的方法有基于代價敏感(Cost-Sensitive)、基于單類學習(One-Class)、基于主動學習(Active Learning)、基于集成分類算法等幾個方法。
大樣本定長欠采樣和小樣本Smote算法過采樣方法都在本文中被使用,從大數(shù)據(jù)中摘取有效數(shù)據(jù),把結冰和未結冰的樣本數(shù)據(jù)控制在20000以內,且基本相等。由于從大數(shù)據(jù)欠采樣到2萬組,任何采樣方法失去很多有價值的樣本,本文結合風力發(fā)電機運行實際情況,總結出幾條規(guī)則,可以將樣本中明顯不結冰的數(shù)據(jù)先剔除。
經(jīng)過上述方法篩選后,去除了約5萬條正常數(shù)據(jù)的樣本,14萬樣本數(shù)量依舊太過龐大,進一步分析,許多樣本之間的表征信息幾乎一致,下一步刪除冗余部分,該過程算法為:
具體過程為:
(1)原始樣本標準化,計算δ值;
(2)計算$x_{i}$和$x_{j}$(j>i)的相似度$R_{ij}$;
(3)定義一合適閾值ε,如果$R_{ij}>\\varepsilon$,刪去樣本$x_{j}$;
(4)重復以上步驟,直到所有樣本檢查完畢。
經(jīng)過上述步驟后,最后摘取到約2萬組正常有效的樣本。
接下來處理非正常樣本,即我們得到的約1萬結冰樣本數(shù)據(jù),為使樣本量增加一倍,我們采用了Smote算法。為達到平衡樣本的目的,在一些位置接近的數(shù)量較少的樣本中插入新樣本即是Smote算法的中心思想,以上方法不同于隨機過采樣的將樣本數(shù)據(jù)簡單復制,而是為避免分類器的過度擬合,通過增加創(chuàng)造出來的樣例。
經(jīng)過上述一系列操作,訓練集兩類數(shù)據(jù)一共約4萬組樣本,且數(shù)量相等。
3 選擇特征
運行中的風力發(fā)電機葉片表面結冰,這是復雜的過程,這一過程受到許多環(huán)境因素影響的,想要建立精準的預測風機葉片結冰狀態(tài)的數(shù)學模型具有很大難度,而采用數(shù)據(jù)驅動的方法,數(shù)量眾多的樣本還有檢測變量,都會使得運算過程十分復雜,并且不能快速確定葉片的結冰狀態(tài)。所以,結合風力發(fā)電原理以及葉片表面凍結過程,對風機結冰整個過程的特征狀態(tài)進行分析,并與機器學習的能力相結合,方可進行有效預測。
所謂風力發(fā)電,即風力推動葉片轉動,葉片帶動發(fā)電機轉動,利用電磁感應現(xiàn)象產(chǎn)生電能。但是葉片結冰后會改變運動特性,降低風能到電能的轉化效率,雖然電能的產(chǎn)生效率不全依賴風速,但風能與電能的轉化效率在一定程度上可以反映葉片的結冰狀態(tài),結合正常情況和異常結冰數(shù)據(jù)功率散點和通過數(shù)據(jù)擬合正常數(shù)據(jù)獲得理論功率曲線,將該理論功率曲線作為葉片未凍結的理論曲線,把風力發(fā)電機實際輸出功率與理論功率的殘差作為特征,通過分析,若兩者的殘差非常大,或者殘差不穩(wěn)定,表示葉片很大可能已出現(xiàn)結冰故障,需要處理。
從另一方面講,運行中的風機葉片表面出現(xiàn)凍結故障勢必會對風能與電能的轉化效率造成不利影響,以上述方法,第二特征選擇擬合正常轉速曲線計算出的每組數(shù)據(jù)的轉速殘差。
另外,周圍溫度肯定也是十分重要的因素,溫度這一變量要被著重考慮,通過分析外部溫度與風機內部溫度的差別,我們發(fā)現(xiàn)這一差別與風機葉片的是否結冰有著很大的關聯(lián)。
通過主成分分析技術,我們可以分析樣本在主成分和非主成分方向的投影,通過這一技術可以進一步構造敏感特征的方法,分析風速和實際功率在非主成分方向的投影。
最終經(jīng)過分析,把外部溫度,外部溫度,風速,實際功率以及4個衍生變量作為選擇特征。
4 分類器構建及參數(shù)優(yōu)化
本文采用機器學習模型為支持向量機,同時為了尋找最優(yōu)參數(shù),又引入粒子群算法,借以提高故障識別的性能。以下是計算過程:
在統(tǒng)計學中提出的機器學習方法即是SVM算法,這一算法的基礎是VC維理論和結構最小化原理,通過超強的學習能力克服復雜的數(shù)學模型,為有效的解決線性不可分的這一難題引入核函數(shù),這一方法的效果非常顯著。過程可簡單描述為:
我們按照要求取w,b的值。這一過程使該超平面到兩類支持向量的幾何間隔最大,從而目標函數(shù)及約束條件寫作:
核函數(shù)類型確定之后,結合粒子群算法進行參數(shù)C和g尋優(yōu)。
5 結語
數(shù)據(jù)驅動學習方法在工業(yè)領域有廣泛的應用前景,本文在發(fā)電風機葉片結冰領域,針對過去單純依靠機理分析或監(jiān)控可視化等手段,使用機器學習的方法,首先對現(xiàn)場實際數(shù)據(jù)進行預處理,然后結合機理分析進行特征提取,最后通過粒子群支持向量機模型實現(xiàn)對葉片結冰的預測。
參考文獻:
[1]田鵬輝,羅衡強,湯亞男.風力機組葉片防覆冰技術發(fā)展現(xiàn)狀[J].電器工業(yè),2013,14(5):62-65.
[2]東喬天,金哲巖,楊志剛.風力機結冰問題研究綜述[J].機械設計與制造,2014,52(10):269-272.
[3]梁穎,方瑞明.基于SCADA和支持向量回歸的風電機組狀態(tài)在線評估方法[J].電力系統(tǒng)自動化,2013,37(14):7-12.
[4]劉強,秦泗釗.過程工業(yè)大數(shù)據(jù)建模研究展望[J].自動化學報,2016,42(2):161-171.
作者簡介:傅曉駿(1990—?),男,漢族,浙江桐廬人,本科,中級工程師,研究方向:自動化。