張恒遠(yuǎn) 畢肇駿 柴耀軍 章正傳
摘 ? 要:汽輪機(jī)異常檢測(cè)對(duì)于其可靠和經(jīng)濟(jì)的運(yùn)行具有重要的意義??紤]到異常數(shù)據(jù)和檢測(cè)模型的敏感性和魯棒性,本文提出了一種基于序列符號(hào)的異常檢測(cè)方法,并將其應(yīng)用于汽輪機(jī)回?zé)崞鞯漠惓z測(cè)。本文采用有限狀態(tài)機(jī)評(píng)估回?zé)崞鳟a(chǎn)生符號(hào)序列的后驗(yàn)概率,然后基于概率估計(jì)的模型用于檢測(cè)異常。實(shí)驗(yàn)結(jié)果表明,模型具有理想的性能,并且基于估計(jì)的模型具有較強(qiáng)的魯棒性。因此,本文所提出的方法可以很好地促進(jìn)現(xiàn)有的基于符號(hào)動(dòng)態(tài)分析的異常檢測(cè)方法,特別是在汽輪機(jī)異常檢測(cè)領(lǐng)域。
關(guān)鍵詞:有限狀態(tài)機(jī) ?異常檢測(cè) ?汽輪機(jī)狀態(tài)監(jiān)測(cè)
中圖分類(lèi)號(hào):TK262 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào):1674-098X(2019)02(b)-0075-02
汽輪機(jī)作為工業(yè)級(jí)是最復(fù)雜的裝置,在工業(yè)制造中扮演重要角色。然而,汽輪機(jī)的日常的維護(hù)對(duì)于檢測(cè)異常和消除故障來(lái)說(shuō)是一個(gè)巨大的挑戰(zhàn)。自從Urban[1]首次涉及EHM研究以來(lái),許多技術(shù)和方法在這個(gè)領(lǐng)域得到了很好的應(yīng)用。以往的工作主要集中在2種方法,基于模型的異常檢測(cè)和基于數(shù)據(jù)驅(qū)動(dòng)的異常檢測(cè)。汽輪機(jī)異常的檢測(cè)模型既需要靈敏度又要求魯棒性。與主成分分析(PCA),人工神經(jīng)網(wǎng)絡(luò)(ANN)和貝葉斯方法[2]等其他方法相比,符號(hào)動(dòng)態(tài)濾波(SDF)[3]在異常檢測(cè)領(lǐng)域都有較好的靈敏度和魯棒性。
本文結(jié)合汽輪機(jī)運(yùn)行的實(shí)際情況,建立基于SDA的符號(hào)化異常檢測(cè)模型,用于檢測(cè)汽輪機(jī)高壓缸效率異常。本文的結(jié)構(gòu)如下,在第2節(jié)中,給出了關(guān)于動(dòng)態(tài)符號(hào)分析的初步數(shù)學(xué)理論和數(shù)據(jù)的符號(hào)分區(qū)方法。第3節(jié)提出了有限狀態(tài)機(jī)訓(xùn)練和異常檢測(cè)模型。因此,第4節(jié)對(duì)實(shí)驗(yàn)結(jié)果和分析進(jìn)行了闡述,第5節(jié)簡(jiǎn)要進(jìn)行了討論。
1 ?有限狀態(tài)機(jī)模型和數(shù)據(jù)符號(hào)化方法
1.1 有限狀態(tài)機(jī)模型
假設(shè)在當(dāng)前t時(shí)刻,一個(gè)系統(tǒng)的狀態(tài)為,同時(shí)該系統(tǒng)產(chǎn)生了一個(gè)可觀測(cè)的符號(hào)。其中系統(tǒng)的狀態(tài)不可見(jiàn)而符號(hào)可見(jiàn),因此一個(gè)給定長(zhǎng)度的隱狀態(tài)序列也會(huì)產(chǎn)生一個(gè)可見(jiàn)的觀測(cè)序列。我們稱(chēng)這種模型為有限狀態(tài)機(jī)(Finite State Machine)。
1.2 數(shù)據(jù)符號(hào)化
在汽輪機(jī)狀態(tài)監(jiān)測(cè)中,傳感器觀測(cè)到的所有運(yùn)行數(shù)據(jù)都是連續(xù)的,無(wú)法自動(dòng)獲取多個(gè)離散符號(hào)的條件。因此在本節(jié)中,我們將重點(diǎn)放在可以分散表示不同負(fù)荷條件的符號(hào)提取上。在本文中,數(shù)據(jù)資源來(lái)自某330MW亞臨界機(jī)組,實(shí)時(shí)參數(shù)取自SIS系統(tǒng)。在FSM中,隱藏狀態(tài)和可見(jiàn)符號(hào)的數(shù)量都是有限的,所以我們將一種聚類(lèi)方法應(yīng)用于符號(hào)提?。篕均值聚類(lèi)。本文中,有7個(gè)集群對(duì)應(yīng)7種不同的負(fù)荷條件。因此在這里,KM模型的k=7。
2 ?有限狀態(tài)機(jī)建模和異常檢測(cè)方法
在汽輪機(jī)性能異常檢測(cè)中建立序列符號(hào)模型的主要任務(wù)是構(gòu)建一個(gè)有限狀態(tài)機(jī)來(lái)估計(jì)出現(xiàn)異常序列的概率,建立檢測(cè)模型來(lái)定義序列是否異常。
本文建立了一個(gè)估計(jì)模型來(lái)計(jì)算FSM產(chǎn)生一個(gè)符號(hào)序列的概率。在這種情況下,通過(guò)排除異常樣本的訓(xùn)練數(shù)據(jù)構(gòu)建有限狀態(tài)機(jī)模型,在計(jì)算得到測(cè)試數(shù)據(jù)中包含的異常序列的概率就會(huì)很低。異常檢測(cè)的流程是:首先,將數(shù)據(jù)按長(zhǎng)度為T(mén)的初始滑動(dòng)窗口分割成時(shí)間序,然后將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)兩部分。訓(xùn)練數(shù)據(jù)被用來(lái)構(gòu)造FSM,估計(jì)未知狀態(tài)和可見(jiàn)符號(hào)的傳輸和激活概率,測(cè)試數(shù)據(jù)被用來(lái)評(píng)估FSM的性能。對(duì)FSM進(jìn)行建模后,將通過(guò)異常檢測(cè)策略對(duì)性能進(jìn)行測(cè)試。通過(guò)不斷更新長(zhǎng)度T直到模型達(dá)到最佳性能。
2.1 有限狀態(tài)機(jī)訓(xùn)練
訓(xùn)練有限狀態(tài)機(jī)的主要任務(wù)是確定隱狀態(tài)之間的轉(zhuǎn)移概率aij和隱狀態(tài)向外發(fā)出可見(jiàn)符號(hào)的激活概率bjk。本文采用Baum-Welch算法來(lái)進(jìn)行概率估計(jì)。定義一個(gè)前向遞歸概率,如式(3)所示。
2.2 基于有限狀態(tài)機(jī)的異常檢測(cè)模型
通過(guò)A部分利用訓(xùn)練數(shù)據(jù)中的正常樣本建立的有限狀態(tài)機(jī)模型,就可以用該模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行異常檢測(cè)。測(cè)試數(shù)據(jù)中包含異常樣本和正常樣本,當(dāng)模型計(jì)算正常樣本的可見(jiàn)符號(hào)的序列時(shí),概率值會(huì)比估計(jì)異常樣本的概率要高得多,通過(guò)合理確定分類(lèi)閾值即可實(shí)現(xiàn)異常檢測(cè)。
首先,設(shè)定分類(lèi)閾值θ,當(dāng)一個(gè)測(cè)試序列送入模型時(shí),逐一計(jì)算序列中每個(gè)可見(jiàn)符號(hào)的概率乘積,得到最終的概率。當(dāng)時(shí),則表示系統(tǒng)處于正常狀態(tài),反而,說(shuō)明系統(tǒng)處于異常狀態(tài)。需要指出的是,這種異常檢測(cè)方法的性能不僅取決于有限狀態(tài)機(jī)的訓(xùn)練效果,還取決于分類(lèi)閾值的選取。因此,為了得到最佳性能,我們遍歷θ的取值,直到達(dá)到最佳效果。
3 ?實(shí)驗(yàn)設(shè)計(jì)和結(jié)果分析
3.1 模型評(píng)價(jià)指標(biāo)
在模型的訓(xùn)練與測(cè)試中,假設(shè)正常的樣本被標(biāo)記為“正類(lèi)(Positive)”,異常的樣本被標(biāo)記為“負(fù)類(lèi)(Negative)”。當(dāng)一個(gè)正類(lèi)樣本被正確地識(shí)別時(shí),這個(gè)樣本就被稱(chēng)為“正確的正類(lèi)(True Positive)”,當(dāng)一個(gè)負(fù)類(lèi)樣本被錯(cuò)誤的識(shí)別成正類(lèi)時(shí),這個(gè)樣本就被稱(chēng)為“錯(cuò)誤的正類(lèi)(False Positive)”。同理,當(dāng)一個(gè)負(fù)類(lèi)樣本被正確地識(shí)別時(shí),稱(chēng)為“正確的負(fù)類(lèi)(True Negative)”,當(dāng)一個(gè)正類(lèi)樣本被錯(cuò)誤地分為負(fù)類(lèi)時(shí),稱(chēng)“錯(cuò)誤的負(fù)類(lèi)(False Negative)”,因此每個(gè)樣本都有四種可能的標(biāo)記。
3.2 實(shí)驗(yàn)案例和結(jié)果
首先本文給出了兩個(gè)典型的檢測(cè)樣本的序列:一個(gè)是正??常的序列,另一個(gè)是異常的序列。所選擇的序列長(zhǎng)度為T(mén)= 0,即10min采樣間隔,共100min。表1給出了交叉驗(yàn)證中每個(gè)數(shù)據(jù)組的模型性能,模型的TPrate=0.9192,TNrate=8661。可以得出結(jié)論,在T=10,θ=0.00743的條件下,該估計(jì)模型很好地檢測(cè)汽輪機(jī)高壓缸效率異常。但是,正如前面所分析的,分類(lèi)閾值的選取會(huì)嚴(yán)重影響檢測(cè)性能。 因此,需要進(jìn)一步討論閾值對(duì)分類(lèi)模型效果的影響。
4 ?結(jié)語(yǔ)
異常檢測(cè)的基本任務(wù)是從大量看似正常的數(shù)據(jù)中發(fā)現(xiàn)異常。許多傳統(tǒng)的點(diǎn)異常的檢測(cè)方法大都建立在連續(xù)的實(shí)時(shí)傳感器觀測(cè)上。尤其對(duì)于汽輪機(jī)這種大型設(shè)備。噪聲、工況波動(dòng)或環(huán)境條件的變化都包含在原始數(shù)據(jù)中,大量的擾動(dòng)淹沒(méi)了異常數(shù)據(jù)的特征。然而異常特征往往隱藏在反映設(shè)備運(yùn)行狀態(tài)的各種結(jié)構(gòu)化的數(shù)據(jù)中。汽輪機(jī)由于其結(jié)構(gòu)復(fù)雜,工作環(huán)境惡劣,導(dǎo)致設(shè)備的異常檢測(cè)非常困難,尤其是實(shí)現(xiàn)早期的異常檢測(cè)。本文提出了基于符號(hào)分析學(xué)的異常檢測(cè)辦法,通過(guò)構(gòu)建馬爾科夫概率模型分析符號(hào)化序列的后驗(yàn)概率,能夠很大程度上消除由于各種干擾因素導(dǎo)致的異常檢測(cè)結(jié)果的偏離。這種方法在大型設(shè)備的異常檢測(cè)中具有很好的指導(dǎo)意義。
參考文獻(xiàn)
[1] Urban, Louis A. Gas Path Analysis Applied to Turbine Engine Condition Monitoring.[J].Journal of Aircraft 1973,10(7):400-406.
[2] Rao, Chinmay, et al. Review and comparative evaluation of symbolic dynamic filtering for detection of anomaly patterns. Signal, Image and Video Processing,2009,3(2):101-114.
[3] Ray, A. Symbolic dynamic analysis of complex systems for anomaly detection[J].Signal Processing,2004,84(7):1115-1130.