亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SCADA數(shù)據(jù)和單分類簡化核極限學(xué)習(xí)機的風(fēng)電機組發(fā)電機狀態(tài)監(jiān)測

        2022-09-05 06:35:00金曉航泮恒拓許壯偉劉偉江
        計算機集成制造系統(tǒng) 2022年8期
        關(guān)鍵詞:發(fā)電機模型

        金曉航 ,泮恒拓 ,許壯偉 ,孫 毅 ,劉偉江

        (1.浙江工業(yè)大學(xué) 特種裝備制造與先進加工技術(shù)教育部重點實驗室,浙江 杭州 310023;2.浙江工業(yè)大學(xué) 機械工程學(xué)院,浙江 杭州 310023;3. 浙江運達風(fēng)電股份有限公司,浙江 杭州 310012)

        0 引言

        為應(yīng)對環(huán)境污染和能源危機等問題,世界各國正在大力發(fā)展風(fēng)電產(chǎn)業(yè),風(fēng)電機組累積裝機容量不斷增長。截止2019年底,全球風(fēng)電機組裝機容量達到了651 GW,數(shù)十萬臺風(fēng)電機組正在并網(wǎng)運行[1]。風(fēng)電場通常坐落于偏遠山區(qū)、草原、戈壁灘、沿海灘涂或近海等區(qū)域,風(fēng)電機組機艙位于近百米塔筒的上端。當機組傳動系統(tǒng)的一些部件(如主軸承、齒輪箱、發(fā)電機等)出現(xiàn)故障時,通常需要準備專用的吊裝機構(gòu),在風(fēng)電場天氣情況較好時進行修護作業(yè)。因此,風(fēng)電機組傳動系統(tǒng)故障往往會造成較長時間的停機,較大的發(fā)電量損失,同時也給風(fēng)電場業(yè)主帶來了高昂的維修費用[1-2]。發(fā)電機是風(fēng)電機組中的核心部件,其長時間處于變工況運行狀態(tài),頻繁受到復(fù)雜多變的沖擊載荷,是風(fēng)電機組中故障率較高的部件之一[3]。若能及時發(fā)現(xiàn)發(fā)電機工作異常并采取相應(yīng)的防控措施,就能有效降低機組的運行維護成本。

        目前,有較多的風(fēng)電機組狀態(tài)監(jiān)測方法,如振動監(jiān)測、油液監(jiān)測以及數(shù)據(jù)采集與監(jiān)控系統(tǒng)(Supervisory Control and Data Acquisition,SCADA)數(shù)據(jù)驅(qū)動的狀態(tài)監(jiān)測等。其中,振動監(jiān)測或油液監(jiān)測等狀態(tài)監(jiān)測方法需要安裝額外的傳感器,屬于侵入式的狀態(tài)監(jiān)測方法;而利用SCADA數(shù)據(jù)的分析來識別機組的健康狀態(tài)通常不會帶來額外的硬件成本[4]。因此,如何從SCADA數(shù)據(jù)中挖掘出有用信息,實現(xiàn)機組健康狀態(tài)監(jiān)測的研究引起了眾多學(xué)者和業(yè)內(nèi)人士的關(guān)注。SCADA數(shù)據(jù)分析方法可分為趨勢分析、聚類以及正常行為建模等[5]。其中,趨勢分析方法難以實現(xiàn)風(fēng)電機組狀態(tài)的自動監(jiān)測;聚類方法需要大量的歷史故障數(shù)據(jù),但實際工程中與機組故障相關(guān)的數(shù)據(jù)很難被有效收集;而由于機組的正常行為數(shù)據(jù)容易獲取,正常行為建模方法一直是利用SCADA數(shù)據(jù)進行風(fēng)電機組狀態(tài)監(jiān)測研究的熱點。如文獻[6]利用多項式回歸來分析SCADA特征參數(shù)之間的相關(guān)性,并通過評估歷史健康數(shù)據(jù)與實時數(shù)據(jù)回歸曲線的差異來診斷風(fēng)電機組是否故障;文獻[7]提出一種基于高斯過程模型的風(fēng)電機組狀態(tài)監(jiān)測方法,通過分析風(fēng)速功率曲線擬合殘差來識別機組的異常狀態(tài);文獻[8]對風(fēng)電機組齒輪箱的振動信號進行降噪,利用核主成分分析對多組振動信號進行融合分析并構(gòu)建相應(yīng)的評估指標;文獻[9]利用歷史正常行為的SCADA數(shù)據(jù)建立風(fēng)電機組發(fā)電機溫度監(jiān)測模型,以同一風(fēng)場不同機組的數(shù)據(jù)作參考對發(fā)電機的運行狀態(tài)進行了評估。上述工作都可歸類為基于回歸分析的正常行為建模方法,在該類方法中,輸入與輸出變量之間通常要有較強的相關(guān)性,若輸入變量與輸出變量間相關(guān)性較低,則在實際的監(jiān)測分析中這些變量所隱含的信息容易被忽略,以至于與這些變量密切關(guān)聯(lián)的異常狀態(tài)難以被檢測到[10]。為避免上述問題,另一種行之有效的方法是基于單分類(One-Class Classification, OCC)的正常行為建模。

        單分類或新奇檢測(novelty detection)是判斷新樣本是否與訓(xùn)練樣本屬于相同類別的方法,僅需要一類樣本用作訓(xùn)練[11-12]。 這樣的方法通??煞譃?種:密度估計方法、數(shù)據(jù)重構(gòu)方法、邊界識別方法[13-14],常見的有:自動編碼器(Auto-Encoder, AE)、單分類主成分分析(One-Class Principal Component Analysis, OC-PCA)[15]、單分類支持向量機(One-Class Support Vector Machine, OC-SVM)[16]等。目前,僅有少數(shù)學(xué)者利用單分類模型對風(fēng)電機組的狀態(tài)監(jiān)測進行了研究。如文獻[17]采用長短時記憶神經(jīng)單元與自編碼網(wǎng)絡(luò)構(gòu)建風(fēng)電機組性能評估模型,并通過構(gòu)建自適應(yīng)閾值來實現(xiàn)機組的異常預(yù)警;文獻[18]從振動數(shù)據(jù)中提取特征作為OC-SVM的輸入來訓(xùn)練模型,實現(xiàn)了風(fēng)電機組發(fā)電機軸承故障信號的檢測和識別。

        極限學(xué)習(xí)機(Extreme Learning Machine, ELM)是前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中一種全新的訓(xùn)練框架,憑借其學(xué)習(xí)速度快、人為干預(yù)少等優(yōu)點在各方面得到了廣泛的應(yīng)用[19]。其中,有學(xué)者探究了其在單分類問題中的應(yīng)用,提出了單分類極限學(xué)習(xí)機(One-Class ELM, OC-ELM)算法[20]。但由于ELM隱層參數(shù)通常采取隨機賦值的方式,模型的泛化能力和穩(wěn)定性較差,為此,本文結(jié)合核方法在簡化核極限學(xué)習(xí)機(Reduced Kernel ELM, RKELM)[21]基礎(chǔ)上設(shè)計了一種新的支持向量選取方法,并利用改進的單分類簡化核極限學(xué)習(xí)機(One-Class RKELM, OC-RKELM)算法來實現(xiàn)風(fēng)電機組發(fā)電機的狀態(tài)監(jiān)測。首先,對風(fēng)電機組發(fā)電機正常狀態(tài)下的SCADA數(shù)據(jù)進行清洗,得到一個高質(zhì)量的健康數(shù)據(jù)訓(xùn)練集。其次,利用OC-RKELM學(xué)習(xí)清洗后數(shù)據(jù)中隱含的發(fā)電機行為規(guī)律,構(gòu)建風(fēng)電機組發(fā)電機的在線健康狀態(tài)監(jiān)測模型,并基于該模型對監(jiān)測的實時行為數(shù)據(jù)進行分析,在線識別發(fā)電機的健康狀態(tài)。最后,利用所提方法對某臺1.5 MW的風(fēng)電機組發(fā)電機進行了健康狀態(tài)監(jiān)測研究,通過與其他單分類模型狀態(tài)監(jiān)測結(jié)果的對比分析以及結(jié)合可視化技術(shù),對所提方法的性能進行了驗證和評估。

        1 風(fēng)電機組發(fā)電機狀態(tài)監(jiān)測方法

        單分類模型通過訓(xùn)練找到裝備正常行為數(shù)據(jù)的邊界,并將其視為決策邊界來區(qū)分正常和異常的數(shù)據(jù)。需要指出的是,裝備(特別是機電裝備)的性能退化是一個連續(xù)的過程,裝備的正常與異常數(shù)據(jù)之間有時并沒有明確的區(qū)分邊界,因此,漏報(將異常數(shù)據(jù)歸為正常一類)和誤報(將正常數(shù)據(jù)歸為異常一類)是不可避免的。而且,漏報與誤報之間呈現(xiàn)出負相關(guān)的關(guān)系,因此狀態(tài)監(jiān)測時對決策邊界的確定需要權(quán)衡利弊得失。根據(jù)風(fēng)電機組實際的運維需求,當監(jiān)測傾向于較少的漏報時,應(yīng)執(zhí)行嚴格的監(jiān)測策略;當監(jiān)測傾向于較少的誤報時,寬松的監(jiān)測策略則更為合適。

        基于單分類模型的風(fēng)電機組發(fā)電機狀態(tài)監(jiān)測方法的具體思路如圖1所示。首先,從風(fēng)電機組的SCADA數(shù)據(jù)庫中提取出機組歷史正常行為數(shù)據(jù),并選取出與發(fā)電機健康狀態(tài)密切相關(guān)的特征數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集。其次,為了消除SCADA數(shù)據(jù)中的噪聲信號,使得構(gòu)建的OC-RKELM模型具有緊密平滑的決策邊界,需要對數(shù)據(jù)進行清洗工作,這部分工作主要有:①參照風(fēng)電機組發(fā)電機的工作特性對SCADA數(shù)據(jù)進行清洗,即在對發(fā)電機的狀態(tài)進行監(jiān)測時,發(fā)電機工作時的數(shù)據(jù)更值得被關(guān)注,而其他時刻(如機組調(diào)試測試、停機)的數(shù)據(jù)需要被清洗;②清除SCADA數(shù)據(jù)中的離群數(shù)據(jù),由于受風(fēng)向、風(fēng)力大小、氣溫等環(huán)境因素和傳感器測量誤差等的影響,SCADA系統(tǒng)采集的數(shù)據(jù)中存在一些離群數(shù)據(jù),可利用離群點檢測算法對SCADA數(shù)據(jù)中的離群數(shù)據(jù)進行有效地清洗。經(jīng)過上述數(shù)據(jù)清洗工作之后,SCADA數(shù)據(jù)中與發(fā)電機工作狀態(tài)無關(guān)的數(shù)據(jù)以及離群數(shù)據(jù)可以被有效清除,獲得發(fā)電機正常工作時的一類健康數(shù)據(jù)用于訓(xùn)練構(gòu)建OC-RKELM模型。隨后,以模型預(yù)測輸出和實際輸出之間的殘差作為反映發(fā)電機健康狀態(tài)的監(jiān)測值,在訓(xùn)練數(shù)據(jù)分析的基礎(chǔ)上選取合適的閾值用于在線監(jiān)測。

        在線監(jiān)測風(fēng)電機組發(fā)電機的健康狀態(tài)時,針對訓(xùn)練時選定的發(fā)電機特征參數(shù),對發(fā)電機工作時產(chǎn)生的實時行為數(shù)據(jù)進行分析,通過已構(gòu)建好的狀態(tài)監(jiān)測模型在線評估發(fā)電機的工作狀態(tài)。當評估得到的監(jiān)測值沒有超出健康閾值時,認為發(fā)電機處于正常的工作狀態(tài);當監(jiān)測值大于閾值時,認為發(fā)電機的行為數(shù)據(jù)異常??紤]到風(fēng)電機組的工況復(fù)雜多變,發(fā)電機行為數(shù)據(jù)出現(xiàn)異常的原因較多。其中,由于發(fā)電機本身狀態(tài)異常導(dǎo)致的異常數(shù)據(jù)往往是連續(xù)出現(xiàn)的,而由于其他原因(如環(huán)境的變化、傳感器的測量誤差)導(dǎo)致的異常數(shù)據(jù)往往是離散的。因此,為了避免出現(xiàn)誤報,提高預(yù)警結(jié)果的可靠性,以連續(xù)出現(xiàn)多個異常數(shù)據(jù)作為異常預(yù)警的準則[18],即當方法連續(xù)監(jiān)測到3個異常數(shù)據(jù)時,認為發(fā)電機已處于異常運行狀態(tài)。

        2 算法原理介紹

        2.1 極限學(xué)習(xí)機

        極限學(xué)習(xí)機(ELM)是由HUANG等[22]提出的一個基于前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neuron Network, FNN)構(gòu)建的機器學(xué)習(xí)方法。相比于前饋神經(jīng)網(wǎng)絡(luò)和支持向量機等算法,ELM具有更高的可擴展性和更低的計算復(fù)雜度[23]。ELM通常使用單層前饋神經(jīng)網(wǎng)絡(luò)(Single Layer Feedforward Neuron network, SLFN)結(jié)構(gòu),如圖2所示。SLFN的組成具體包括輸入層、隱含層和輸出層。

        (1)

        在ELM模型中,隱層的節(jié)點參數(shù)隨機初始化或人為給定,僅需求解輸出權(quán)重。因此,ELM模型求解的回歸問題可描述為:

        (2)

        通過引入L2正則化來平衡訓(xùn)練誤差和輸出權(quán)重,式(2)可重寫為:

        (3)

        s.t.

        h(xi)β=ri-ζi,i=1,…,N。

        式中:ξi為訓(xùn)練誤差;λ為正則化系數(shù)。引入Lagrangian函數(shù)對式(3)進行求解:

        (4)

        根據(jù)卡羅需-庫恩-塔克(Karush-Kuhn-Tucker, KKT)條件,求得輸出權(quán)重的解為:

        (5)

        式中:I為單位矩陣;H為隱層的輸出矩陣,

        (6)

        2.2 單分類極限學(xué)習(xí)機

        極限學(xué)習(xí)機最初被用于回歸問題和兩個及多個類別的分類問題,但同樣適用于單分類問題[20]。當用作訓(xùn)練的數(shù)據(jù)樣本屬于同一個類別時,目標輸出向量可以表示為R=[1,…,1],樣本到目標類的距離可以定義為:

        d(x)=|h(x)β-1|。

        (7)

        樣本到目標類的距離越大,則樣本偏離目標類越遠。

        OC-ELM以設(shè)置污染率的方式來剔除訓(xùn)練樣本中偏離目標類最遠的樣本[20]。將訓(xùn)練樣本到目標類的距離按降序排列,得到序列d, 則分類的閾值表示為:

        thres=dfloor(η·N+1)。

        (8)

        式中:thres為分類的閾值;0≤η<1為污染率,表示剔除的訓(xùn)練樣本數(shù)量占總訓(xùn)練樣本數(shù)量的比例;floor(·)為地板函數(shù),表示向下取整;dfloor(η·N+1)表示序列d中第floor(η·N+1)個值。當η=0時,模型接收所有訓(xùn)練樣本,并以距離的最大值作為分類的閾值;當η>0時,模型剔除floor(η·N)個離群的訓(xùn)練樣本,以接收樣本距離的最大值作為分類的閾值。分類函數(shù)可表示為:

        (9)

        式中Sign(·)為符號函數(shù)。當距離小于等于閾值時,認為被測樣本屬于目標類;當距離大于閾值時,認為被測樣本和訓(xùn)練樣本屬于不同的類別。

        2.3 單分類簡化核極限學(xué)習(xí)機與支持向量的選取

        ELM隱層的特征映射既可以是顯式映射,也可以是隱式映射。隱式映射巧妙地利用了核方法得到特征向量之間的內(nèi)積,而不需要顯式地定義特征空間和映射函數(shù),基于該方法的ELM被稱為核極限學(xué)習(xí)機(Kernel ELM, KELM)。KELM用核映射代替隨機映射,能夠有效改善隱層神經(jīng)元隨機賦值帶來的泛化能力和模型穩(wěn)定性下降問題[19]。

        然而,在處理大樣本數(shù)據(jù)時,KELM存在時間和空間復(fù)雜度過高的問題,為避免這一現(xiàn)象,DENG等[21]提出一種快速簡化核極限學(xué)習(xí)機(RKELM),其研究結(jié)果表明:隨機選擇訓(xùn)練樣本集的子集作為支持向量,可以在保證計算快速的同時獲得足夠好的泛化性能。

        RKELM輸出的形式為:

        (10)

        (11)

        式中KN×L=K(X,XL)為簡化的核矩陣。

        本文選取徑向基函數(shù)作為核映射函數(shù),其形式如下:

        K(x,xs)=exp(-||x-xs||2/σ)。

        (12)

        式中:σ為超參數(shù);xs為支持向量。

        將RKELM應(yīng)用到單分類任務(wù)中,提出OC-RKELM算法。但由于OC-RKELM中支持向量的選取仍然具有隨機性,為進一步提升模型的泛化能力和穩(wěn)定性,在OC-RKELM的基礎(chǔ)上結(jié)合系統(tǒng)抽樣和分層抽樣方法以及對風(fēng)電機組數(shù)據(jù)的理解,設(shè)計了從風(fēng)電機組訓(xùn)練數(shù)據(jù)集中選取合適的樣本子集作為支持向量的策略,目標樣本子集應(yīng)盡可能涵蓋風(fēng)電機組不同工況下的樣本:

        (1) 將訓(xùn)練數(shù)據(jù)集按時間順序劃分成20份數(shù)量相等的子數(shù)據(jù)集。

        (2) 將風(fēng)電機組輸出功率劃分成長度相同的10個區(qū)間,并將子數(shù)據(jù)集中的數(shù)據(jù)按照功率區(qū)間分配到不同的子數(shù)據(jù)集中,得到200個子數(shù)據(jù)集。

        (3) 選取每個子數(shù)據(jù)集中的第一個樣本作為一個新的支持向量。

        根據(jù)上述策略,共選取到訓(xùn)練樣本集中具有代表性的200個樣本組成支持向量集合。

        2.4 局部異常因子

        局部異常因子(Local Outlier Factor,LOF)是由BREUNIG等[24]提出的一種基于密度的離群點檢測算法,適用于高維非均勻分布數(shù)據(jù)的離群點檢測。由于LOF算法在計算過程中需要存儲大量的數(shù)據(jù),具有較高的時間和空間復(fù)雜度,不適合在線監(jiān)測風(fēng)電機組狀態(tài),而適合對SCADA數(shù)據(jù)進行預(yù)清洗的工作。

        LOF算法中,有如下一些定義:

        (1)k-距離

        對于數(shù)據(jù)集D中某一對象p,定義p的k-距離為p和對象o∈D之間的距離k-dist(p)=d(p,o),對象o滿足以下兩個條件:①至少有k個對象o′∈D{p},滿足d(p,o′)≤d(p,o);②最多有k-1個對象o′∈D{p},滿足d(p,o′)

        (2)k-距離鄰域

        對象p的k-距離鄰域Nk(p),定義為D中與p的距離不超過p的k-距離的所有對象:

        Nk(p)={q∈D{p}|d(p,q)≤k-dist(p)}。

        (13)

        (3) 可達距離

        對象o到對象p可達距離reach-distk(p,o)定義為:

        reach-distk(p,o)=max{k-dist(o),d(p,o)},

        (14)

        即為對象p與對象ok-距離中的較大值。

        (4) 局部可達密度

        對象p的局部可達密度lrdk(p)定義為:

        (15)

        表示對象p的k-距離鄰域內(nèi)的對象與對象p可達距離的比值。

        (5) 局部異常因子

        對象p的局部異常因子定義為:

        (16)

        表示p的k-距離鄰域內(nèi)的對象的局部可達密度與p的局部可達密度之比的平均數(shù)。

        局部異常因子可以描述對象p的離群程度,當局部異常因子小于或等于1時,則p位于數(shù)據(jù)密集區(qū)域內(nèi);當局部異常因子大于1時,則p可能遠離數(shù)據(jù)密集區(qū)域,值越大,p離群的程度越高。

        3 風(fēng)電機組發(fā)電機實例分析

        某風(fēng)場一臺1.5 MW的雙饋式風(fēng)電機組在2017年2月5日11點20分由SCADA系統(tǒng)發(fā)出異常報警后停機。通過風(fēng)電場運維工作人員的現(xiàn)場檢修后發(fā)現(xiàn):此次報警是由于風(fēng)電機組的發(fā)電機軸承溫度過高引起的。拆卸發(fā)電機后發(fā)現(xiàn)其軸承發(fā)生了跑圈故障進而導(dǎo)致軸承溫度過高。因此,風(fēng)電場業(yè)主和風(fēng)電機組供應(yīng)商收集了該臺風(fēng)電機組發(fā)電機軸承故障前14個月(2016年1月~2017年2月)的SCADA數(shù)據(jù),希望通過對這些SCADA數(shù)據(jù)的分析能夠提早發(fā)現(xiàn)風(fēng)電機組工作異常的情況,進而可以優(yōu)化制定相應(yīng)的運維方案、降低故障維修成本和減少風(fēng)電機組的停機時間。

        SCADA系統(tǒng)每隔5 min采集一次風(fēng)電機組各個子系統(tǒng)或部件(變槳、偏航、傳動、塔架等)上的100多個特征參量的狀態(tài)數(shù)據(jù),14個月期間共采集122 400多個樣本數(shù)據(jù)點。提取風(fēng)電機組2016年1月~2016年3月(該期間機組正常運行)的SCADA數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),構(gòu)建OC-RKELM模型后用于分析機組在隨后時間采集到的SCADA數(shù)據(jù),進而判斷機組工作是否正常。

        3.1 風(fēng)電機組SCADA數(shù)據(jù)預(yù)處理分析

        3.1.1 特征選擇

        針對發(fā)電機這一具體部件,結(jié)合風(fēng)電機組制造商的建議,從SCADA數(shù)據(jù)中選取的特征數(shù)據(jù)有:風(fēng)速、偏航角度、有功功率、發(fā)電機轉(zhuǎn)速和溫度等,如表1所示。考慮到發(fā)電機位于機艙內(nèi)部,發(fā)電機溫度特征容易受到機艙溫度變化的影響,而機艙溫度又與外部環(huán)境溫度密切相關(guān)。因此,為了消除環(huán)境溫度波動的影響,以溫差(如發(fā)電機繞組與機艙的溫度差等)作為一類特征進行分析[25]。同時,為消除不同量綱的影響,對表1中的特征數(shù)據(jù)進行歸一化處理。

        表1 SCADA數(shù)據(jù)中與發(fā)電機健康狀態(tài)相關(guān)的特征參數(shù)

        3.1.2 數(shù)據(jù)清洗

        (1)基于風(fēng)電機組工作特性的數(shù)據(jù)清洗

        根據(jù)風(fēng)速的大小,將風(fēng)電機組的運行狀態(tài)分為3個階段:

        1)當風(fēng)速小于切入風(fēng)速時,機組處于待機階段,風(fēng)輪自由旋轉(zhuǎn),一般不作控制。

        2)當風(fēng)速大于切入風(fēng)速小于切出風(fēng)速時,機組處于并網(wǎng)發(fā)電階段,系統(tǒng)會根據(jù)風(fēng)速的大小、電網(wǎng)發(fā)電量的指令等信息控制發(fā)電機轉(zhuǎn)速恒定或保持最佳葉尖速比;其中,葉尖速比是指風(fēng)輪葉片尖端線速度與風(fēng)速之比,是表示風(fēng)電機組性能的重要參數(shù)[26],當前風(fēng)速下最大風(fēng)能捕獲率相對應(yīng)的葉尖速比稱為最佳葉尖速比。

        3)當風(fēng)速大于切出風(fēng)速時,風(fēng)電機組制動停機。

        風(fēng)電機組的工作特性決定了其數(shù)據(jù)分布的形式。如圖3所示為風(fēng)電機組在2016年1月~3月期間風(fēng)速與葉尖速比的散點圖。圖3a中左下方相對無序的數(shù)據(jù)點是風(fēng)電機組待機階段的數(shù)據(jù),此時發(fā)電機轉(zhuǎn)速小于并網(wǎng)發(fā)電的最低轉(zhuǎn)速;圖3a中左上方的數(shù)據(jù)點是發(fā)電機轉(zhuǎn)速剛到達并網(wǎng)發(fā)電最低轉(zhuǎn)速且輸出有功功率為零時的數(shù)據(jù);圖3a中右下方的數(shù)據(jù)是發(fā)電機轉(zhuǎn)速為零或者趨于零的數(shù)據(jù)點,是風(fēng)電機組停機階段的數(shù)據(jù)。風(fēng)電機組處于待機或停機階段時,受風(fēng)速影響,數(shù)據(jù)較多地呈現(xiàn)出一種離散的、相對無序的狀態(tài);而機組并網(wǎng)發(fā)電時,發(fā)電機正常工作,此時的數(shù)據(jù)呈現(xiàn)出一定的規(guī)律性,如圖3b所示。從機組狀態(tài)監(jiān)測的角度來看,發(fā)電機的故障征兆往往出現(xiàn)在其工作期間,具體表現(xiàn)為特征參數(shù)間的規(guī)律性受到了一定程度的破壞;從模型學(xué)習(xí)的角度來分析,離散無序的數(shù)據(jù)不利于模型訓(xùn)練學(xué)習(xí)出一個緊密的邊界。為此,在建模分析時有必要清洗掉風(fēng)電機組待機和停機階段的數(shù)據(jù),即功率輸出為零的數(shù)據(jù)。參照上述分析對SCADA數(shù)據(jù)進行了清洗,清洗后的數(shù)據(jù)如圖3b所示,可以發(fā)現(xiàn)數(shù)據(jù)更加集中且呈現(xiàn)出一定的規(guī)律,也更容易得到其數(shù)據(jù)的決策邊界。

        (2)基于離群點檢測的數(shù)據(jù)清洗

        風(fēng)電機組正常工作時,由于風(fēng)速、風(fēng)向等的變化會使機組的SCADA數(shù)據(jù)存在少量離群的樣本數(shù)據(jù)。圖4呈現(xiàn)了風(fēng)電機組在2016年1月~3月期間風(fēng)速與功率的散點分布圖,其中用虛線的圓圈標注出了離群的樣本數(shù)據(jù)點。離群的數(shù)據(jù)不利于OC-RKELM模型的訓(xùn)練,因此,對數(shù)據(jù)進行清洗以得到更高質(zhì)量的訓(xùn)練數(shù)據(jù)集,進而避免離群數(shù)據(jù)對模型構(gòu)建的影響。

        由于風(fēng)速功率曲線體現(xiàn)了整個機組的輸入輸出關(guān)系,是考核風(fēng)電機組性能的一個重要指標。因此,可以將風(fēng)速和功率散點分布作為評判數(shù)據(jù)清洗效果的標準。利用網(wǎng)格搜索法在k=[20, 30]和C=[0.05%, 0.1%]范圍內(nèi)確定LOF算法中k-距離鄰域和訓(xùn)練數(shù)據(jù)中異常數(shù)據(jù)的所占的比例C兩個參數(shù)的具體值(如圖5)。研究發(fā)現(xiàn):參數(shù)k的設(shè)置對極端離群數(shù)據(jù)的清洗無顯著影響,如圖5a、5c所示;而參數(shù)C的設(shè)置對數(shù)據(jù)的清洗影響較大,當C設(shè)為0.1%時離群數(shù)據(jù)得到了有效的清除,且數(shù)據(jù)清洗結(jié)果基本一致,如圖5b、5d所示。因此,通過上述的分析確定鄰域距離k和異常數(shù)據(jù)比例C兩個參數(shù)的取值分別為20和0.1%。

        考慮到風(fēng)電場地處偏遠,誤報的運維成本較高,選擇了寬松的監(jiān)測策略,將訓(xùn)練數(shù)據(jù)監(jiān)測值的最大值視為健康閾值。如圖6所示為離群數(shù)據(jù)清洗前后紅色閾值虛線的變化情況。清洗后的閾值更能反映訓(xùn)練數(shù)據(jù)監(jiān)測值的正常波動范圍,也意味著模型得到的決策邊界更加緊密,更符合實際監(jiān)測的需求。

        3.2 基于OC-RKELM的發(fā)電機狀態(tài)監(jiān)測

        訓(xùn)練數(shù)據(jù)在高維特征空間中到目標類超平面距離的均值越小,則模型訓(xùn)練得越好。利用這一特點,通過網(wǎng)格搜索法在λ=[1e2,1e6]和σ=[1,9]范圍內(nèi)尋找合適的參數(shù),尋優(yōu)結(jié)果為:λ=1e6、σ=7。 之后建立狀態(tài)監(jiān)測模型,再利用構(gòu)建好的模型分析風(fēng)電機組在2016年3月之后的SCADA數(shù)據(jù),得到的監(jiān)測結(jié)果如圖7所示。

        本文所提方法在2017年1月27日22點35分時首次出現(xiàn)了3個連續(xù)的異常點(22點35分時的數(shù)據(jù)點及前兩個時刻的數(shù)據(jù)點),滿足了異常預(yù)警條件。而參照風(fēng)電機組運維的記錄,SCADA系統(tǒng)的報警時間為2017年2月5日11點20分,OC-RKELM模型的預(yù)警時間相較于SCADA系統(tǒng)的報警時間提前了8天多的時間。從圖7中也可以看到,盡管在監(jiān)測上已經(jīng)采取寬松的策略,在發(fā)電機正常工作的時段(如2016年5月、12月等),仍然有少量樣本點超出閾值。查閱風(fēng)電機組原始數(shù)據(jù)后發(fā)現(xiàn):這些異常樣本點的出現(xiàn)通常是由于風(fēng)速或風(fēng)向突然變化導(dǎo)致的單個或多個特征參數(shù)的數(shù)值出現(xiàn)異常。

        3.3 不同方法在發(fā)電機狀態(tài)預(yù)警上的比較分析

        在盡量避免誤報的前提下,利用不同的單分類模型對SCADA數(shù)據(jù)進行分析,通過不同模型間性能的對比來評估OC-RKELM模型在發(fā)電機狀態(tài)監(jiān)測性能上的優(yōu)劣。考慮到不同的單分類模型采用不同的監(jiān)測值和閾值,為了方便對比分析,對監(jiān)測結(jié)果進行了如下的標準化處理:

        (17)

        式中:e為監(jiān)測值;emax,emin分別為監(jiān)測的最大值和最小值;thres為監(jiān)測的閾值;p為標準化后統(tǒng)一的閾值0.2;er為標準化后的監(jiān)測值。通過上述標準化處理,將基于不同模型的監(jiān)測值限定在[0,1]的區(qū)間內(nèi)。

        圖8給出了不同單分類模型的監(jiān)測結(jié)果。從圖8a中可以看到,OC-SVM、OC-ELM、AE三個模型都在1月28日前后監(jiān)測到了發(fā)電機的異常狀態(tài)。從局部放大圖8b中可以看出,1月27日22點35分發(fā)電機出現(xiàn)了一個的異常征兆,OC-RKELM模型成功捕捉到了這一信號,并進行了異常預(yù)警;而其他模型均未發(fā)現(xiàn)該異常信號。上述4個模型的監(jiān)測值都呈現(xiàn)出類似的上升趨勢,表明上述模型都能反映出發(fā)電機趨于異常的趨勢,其中基于核方法的模型OC-RKELM和OC-SVM表現(xiàn)出了更好的性能。OC-ELM和AE模型在1月28日3點20分最晚檢測出發(fā)電機的異常。因此,將該時刻之后檢測出的異常樣本定義為有效的異常樣本。不同模型具體的預(yù)警時間和檢測出的異常樣本數(shù)如表2所示。OC-RKELM模型共檢測出了1 053個有效的異常樣本,遠超過其他模型檢測出的有效異常樣本的數(shù)量,表明該模型具有更好的故障預(yù)警性能。

        表2 不同方法的監(jiān)測結(jié)果對比

        3.4 風(fēng)電機組數(shù)據(jù)的可視化驗證分析

        由于缺乏詳實的運維記錄以及缺少有效的檢測手段,風(fēng)電機組異常數(shù)據(jù)的標定是困難的,這就導(dǎo)致基于OC-RKELM模型發(fā)電機狀態(tài)監(jiān)測結(jié)果的驗證缺乏有效方法。鑒于與故障相關(guān)的異常數(shù)據(jù)通常具備以下兩種特性:①從數(shù)據(jù)在空間中的分布來看,異常數(shù)據(jù)應(yīng)該偏離正常數(shù)據(jù)的集群,表現(xiàn)出離群的性質(zhì);②從時間維度上來看,越接近故障發(fā)生的時刻,異常數(shù)據(jù)越密集。因此,提出利用t-分布隨機鄰域嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)[27]算法將SCADA數(shù)據(jù)降至二維可視化空間,結(jié)合數(shù)據(jù)樣本的時間屬性來驗證分析OC-RKELM模型監(jiān)測結(jié)果是否可靠。

        可視化分析的具體步驟如下:取SCADA系統(tǒng)故障報警前3個月(2016年11月5日~2017年2月5日)的數(shù)據(jù),利用t-SNE算法對風(fēng)電機組發(fā)電機的特征數(shù)據(jù)降至兩維后,進行可視化,如圖9所示。為了便于分辨可視化后數(shù)據(jù)分布與時間的關(guān)系,將機組數(shù)據(jù)以2017年1月27日為界限,1月27日之前的數(shù)據(jù)用綠色顯示,時間越往前的數(shù)據(jù)顏色越深;1月27日之后的數(shù)據(jù)用紅色顯示,時間越往后的數(shù)據(jù)顏色越深??梢暬Y(jié)果如圖9a所示,可以看到,發(fā)電機在2017年1月27日發(fā)生異常后所對應(yīng)的數(shù)據(jù)樣本(圖中用虛線圈出的紅色數(shù)據(jù)點)和其他數(shù)據(jù)點區(qū)分明顯。因此,可以認為虛線圈內(nèi)的區(qū)域是異常區(qū)域,發(fā)電機正常工作時的數(shù)據(jù)點(綠色數(shù)據(jù)點)分布的區(qū)域是正常區(qū)域。

        分別對截止至2017年1月26日、27日和28日的風(fēng)電機組SCADA數(shù)據(jù)利用t-SNE算法降維可視化分析發(fā)現(xiàn):在2017年1月26日之前,風(fēng)電機組大部分的SCADA數(shù)據(jù)分布在正常區(qū)域內(nèi),個別數(shù)據(jù)樣本點出現(xiàn)在異常區(qū)域,發(fā)電機處于正常狀態(tài),如圖9b所示;1月27日22點25分時開始有少量異常數(shù)據(jù)點逐漸出現(xiàn)在異常區(qū)域內(nèi),表明發(fā)電機的狀態(tài)開始出現(xiàn)異常變化的情況,如圖9c所示;1月28日,在異常區(qū)域內(nèi)集聚了相當數(shù)量的異常數(shù)據(jù)點,如圖9d所示。綜上所述,SCADA數(shù)據(jù)的可視化分析驗證了OC-RKELM模型預(yù)警時間是可靠的、有效的,所報告的異常情況與發(fā)電機的故障有著密切的關(guān)聯(lián)。結(jié)合原始SCADA數(shù)據(jù)進一步分析發(fā)現(xiàn),正常區(qū)域內(nèi)的大部分紅色數(shù)據(jù)點所對應(yīng)的功率較低,而異常區(qū)域內(nèi)的紅色數(shù)據(jù)點通常有著較高的功率輸出,說明故障的征兆容易在發(fā)電機較高負荷(即高功率輸出階段)時顯現(xiàn)出來。

        4 結(jié)束語

        針對風(fēng)電機組正常和異常數(shù)據(jù)不平衡的問題,基于單分類簡化核極限學(xué)習(xí)機提出新的數(shù)據(jù)分析方法,本文研究如下:

        (1)提出了一種由SCADA數(shù)據(jù)驅(qū)動的基于OC-RKELM模型的風(fēng)電機組發(fā)電機狀態(tài)監(jiān)測方法,該方法不依賴于風(fēng)電機組故障時的異常數(shù)據(jù),僅需風(fēng)電機組正常運行狀態(tài)下的SCADA數(shù)據(jù)集用于模型的訓(xùn)練。

        (2)結(jié)合風(fēng)電機組發(fā)電機工作特性和利用LOF算法對SCADA數(shù)據(jù)中與發(fā)電機運行狀態(tài)無關(guān)的數(shù)據(jù)和離群數(shù)據(jù)進行了清洗,由此得到發(fā)電機正常工作狀態(tài)下的數(shù)據(jù)樣本。

        (3)通過對某風(fēng)場一臺1.5 MW雙饋式風(fēng)電機組14個月的SCADA數(shù)據(jù)分析表明,所提方法能夠?qū)︼L(fēng)電機組發(fā)電機的狀態(tài)進行有效監(jiān)測,且比SCADA系統(tǒng)本身更早發(fā)現(xiàn)發(fā)電機異常。

        (4)利用t-SNE算法對SCADA數(shù)據(jù)進行了可視化分析,結(jié)合數(shù)據(jù)樣本中的時間屬性,比較新穎的從數(shù)據(jù)可視化角度驗證了基于OC-RKELM模型在風(fēng)電機組發(fā)電機狀態(tài)監(jiān)測結(jié)果的有效性。上述工作對風(fēng)電機組異常數(shù)據(jù)的標定具有一定的借鑒意義。

        通過對風(fēng)電機組大量正常數(shù)據(jù)的信息挖掘可掌握機組正常的行為規(guī)律與知識,如何將這些信息用于新安裝機組的行為分析或標簽缺失的機組運行狀態(tài)的識別是未來值得研究的問題。

        猜你喜歡
        發(fā)電機模型
        一半模型
        笑聲發(fā)電機
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        大型發(fā)電機勵磁用旋轉(zhuǎn)變換器的開發(fā)和應(yīng)用
        3D打印中的模型分割與打包
        隨身攜帶的小發(fā)電機
        軍事文摘(2016年16期)2016-09-13 06:15:49
        柴油發(fā)電機負荷計算
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        基于PCS-985B的發(fā)電機定子接地保護應(yīng)用及整定
        亚洲精品不卡av在线免费| 国产思思99re99在线观看| av天堂精品久久久久| 亚洲日韩AV秘 无码一区二区| 久久成人黄色免费网站| 中文天堂一区二区三区| 国产性感丝袜在线观看| 天天狠天天添日日拍| 色欲av自慰一区二区三区| 国产免费av片在线观看播放| 亚洲区一区二区三区四| 色呦呦九九七七国产精品| 国产精品久久久久9999| 日本黄网站三级三级三级| 91久久青青草原线免费| 人妻中出精品久久久一区二| 女优免费中文字幕在线| 偷拍美女上厕所一区二区三区| 人妻少妇中文字幕乱码| 国产精品免费久久久久影院仙踪林| 亚洲综合无码| 爆乳午夜福利视频精品| 日韩美女av一区二区三区四区| 欧美日韩在线视频一区| 人妻无码人妻有码中文字幕| 亚洲一区二区自拍偷拍| 亚洲国产一区二区视频| 观看在线人视频| a级毛片无码免费真人| 91福利国产在线观一区二区| 免费看草逼操爽视频网站| 精品国品一二三产品区别在线观看 | 亚洲一区二区女搞男| 久久青青草原亚洲av无码麻豆| 久久久久久久综合狠狠综合| 亚洲av午夜成人片精品| 中文字幕手机在线精品| 人妻少妇精品中文字幕专区| 久久久亚洲欧洲日产国码αv| 欧美激情αv一区二区三区| 少妇高潮无码自拍|