景亞杰, 董鴻霖, 韋志康, 楊 旭
(1. 江蘇方天電力技術(shù)有限公司, 南京 211102; 2. 東南大學(xué) 能源與環(huán)境學(xué)院, 南京 210096)
由于熱工過程數(shù)據(jù)具有高維度、高噪聲、高時滯性、多擾動的特點,目前熱工過程數(shù)學(xué)模型的故障檢測方法常用于穩(wěn)態(tài)熱工過程的故障檢測及診斷,對于動態(tài)過程沒有特別好的檢測效果。對熱工過程的故障檢測及診斷一般采用基于數(shù)據(jù)驅(qū)動的算法。主成分分析(PCA)法是一種簡單高效的多元統(tǒng)計方法,并被廣泛應(yīng)用于工業(yè)過程的過程監(jiān)控和故障診斷中。KU W F等[1]考慮到傳統(tǒng)PCA法往往難以滿足熱工過程的動態(tài)特性影響,提出了動態(tài)主成分分析(DPCA)法,通過用帶有時滯性的變量構(gòu)造出動態(tài)數(shù)據(jù)矩陣后,利用PCA技術(shù)提取相關(guān)主成分及殘差的方法以提高故障診斷及檢測的精確度。
在PCA法中,大量的非零元素出現(xiàn)在主成分向量及殘差向量中,不利于特征值的解釋和提取,并且熱工數(shù)據(jù)中噪聲的影響也較難剔除。雖然DPCA法能夠捕捉熱工過程的動態(tài)特性,但是其通過構(gòu)造出高維矩陣,進一步增加了主成分向量中噪聲的影響,降低了故障診斷及檢測的精確度。稀疏主成分分析(SPCA)法是在PCA法的基礎(chǔ)上,通過稀疏化PCA的主成分向量降低噪聲的影響,并增加主成分的可解釋性,從而提高故障的檢測正確率。
筆者結(jié)合DPCA法的動態(tài)優(yōu)點和SPCA法的降噪特性,提出一種基于動態(tài)稀疏主成分分析(DSPCA)的熱工過程故障檢測方法。DSPCA法先通過計算動態(tài)熱工數(shù)據(jù)的滯后因子,構(gòu)造其增廣矩陣,再通過彈性網(wǎng)懲罰函數(shù)獲取稀疏主成分。筆者通過建立檢驗統(tǒng)計量進行故障診斷及檢測,對仿真數(shù)據(jù)和現(xiàn)場數(shù)據(jù)進行驗證。
PEARSON K[2]于1901年提出PCA的概念,其基本思想是以有限長度的多維變量時間序列構(gòu)成的數(shù)據(jù)矩陣為基礎(chǔ),進行矩陣運算后確定若干正交向量,歷史數(shù)據(jù)在正交向量上的投影反映數(shù)據(jù)變化最大的若干方向,舍去變化較小的幾個方向,便可將高維數(shù)據(jù)降維表示。采集正常工況下的過程數(shù)據(jù)組成的矩陣X為:
(1)
式中:xij為第j個樣本的第i次測量,i=1,2,…,n(n為測量次數(shù)),j=1,2,…,m(m為樣本數(shù))。
對X進行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化矩陣Xs為:
(2)
xav=(xav,1,xav,2,…,xav,m)
式中:xav,j為第j個樣本的測量平均值;sj為xav,j對應(yīng)的標(biāo)準(zhǔn)差。
計算系數(shù)矩陣R為:
(3)
求出X的m個特征值,并將特征值按照從大到小的順序排列為λ1,λ2,…,λm,得到排列后的特征值矩陣Λm為:
Λm=diag(λ1,λ2,…,λm)
(4)
根據(jù)特征值可以求出特征值對應(yīng)的特征向量。在實際應(yīng)用中,根據(jù)方差的累積貢獻率來選取主成分?jǐn)?shù)。
對Xs進行分解得到:
Xs=T×PT+Es
(5)
T=X×P
式中:P為主成分子空間負(fù)荷矩陣;T為得分矩陣;Es為殘差矩陣。
動態(tài)系統(tǒng)的狀態(tài)變量是時間函數(shù),系統(tǒng)狀態(tài)由其狀態(tài)變量隨時間變化的信息來描述,狀態(tài)變量具有持續(xù)性。但是,熱工過程的大部分?jǐn)?shù)據(jù)是動態(tài)或準(zhǔn)穩(wěn)態(tài)的,DPCA法可彌補PCA法在捕捉動態(tài)數(shù)據(jù)關(guān)系上的不足。DPCA法將采樣數(shù)據(jù)的變量作為新的增廣矩陣的變量,然后用PCA法降維,以減弱變量間的相關(guān)性。
將X的m維降為t維后,可得到降維后的矩陣Xt為:
(6)
將Xt擴展為滯后因子為h的增廣矩陣Xt-h,得到:
(7)
通過假設(shè)求出的靜態(tài)關(guān)系數(shù)為:
(8)
式中:r(·)為靜態(tài)關(guān)系數(shù);rnew(·)為更新后的靜態(tài)關(guān)系數(shù);a為迭代計算次數(shù)。直到rnew(h)≤0,對應(yīng)的h即為所選擇的滯后因子。
ZOU H等[3]將主成分的求解問題轉(zhuǎn)化為Lasso回歸問題,并引入彈性網(wǎng)作為其懲罰結(jié)構(gòu),并提出了SPCA法。SPCA法在傳統(tǒng)的PCA法的基礎(chǔ)上進一步稀疏化載荷矩陣,在準(zhǔn)確提取數(shù)據(jù)信息的前提下使主成分向量每一列中非零元素最少。目前,共有3種主流的SPCA法模型[4],即基于嶺回歸的SPCA法模型,基于彈性網(wǎng)回歸的SPCA法模型和基于Lasso回歸的SPCA法模型。
基于彈性網(wǎng)回歸的SPCA法模型比基于Lasso回歸和嶺回歸的SPCA法模型具有更好的性能,其稀疏主成分具有唯一解,不會陷入到局部最小,提高了模型的精度,同時收斂速度快,易于實現(xiàn)在線監(jiān)測,所以筆者使用基于彈性網(wǎng)回歸的SPCA法模型,具體算法可參考文獻[4]。
關(guān)于SPCA法中每個主成分向量的非零元素的確定,目前多數(shù)研究者認(rèn)為當(dāng)SPCA法與PCA法計算出的每個主成分的解釋方差相近時,非零元素可以在此基礎(chǔ)上適當(dāng)增加以最大化稀疏主成分,筆者選擇了GAJJAR S等[5]提出的前向選擇算法來確定每個主成分向量的非零元素的數(shù)目。
在進行工業(yè)過程監(jiān)測時,T2統(tǒng)計量、Q統(tǒng)計量及綜合指標(biāo)f常被用于故障檢測,T2統(tǒng)計量衡量樣本向量在主空間投影的變化,Q統(tǒng)計量衡量樣本向量在殘差子空間投影的變化,綜合指標(biāo)是T2統(tǒng)計量和Q統(tǒng)計量的綜合體現(xiàn),具體計算公式為:
(9)
Λ=diag(λ1,λ2,…,λk)
(10)
ei=xsi-PPTxsi
式中:QSPE,i為數(shù)據(jù)集第i次的Q統(tǒng)計量構(gòu)成的矩陣;ei為觀測向量的殘差向量。
(11)
綜合指標(biāo)的控制限fucl為:
(12)
式中:Kα為卡方分布在置信度為α下的閾值;I為m行m列的單位矩陣。
結(jié)合DPCA法的動態(tài)優(yōu)點和SPCA法的降噪特性,提出一種基于DSPCA的熱工過程故障診斷及檢測方法,該方法先通過計算動態(tài)熱工數(shù)據(jù)的滯后因子,構(gòu)造其增廣矩陣,再通過基于彈性網(wǎng)回歸的SPCA法獲取稀疏主成分,通過Q統(tǒng)計量、T2統(tǒng)計量及綜合指標(biāo)對測試數(shù)據(jù)進行故障診斷及檢測。DSPCA法步驟為:
(1) 對X進行標(biāo)準(zhǔn)化處理得到Xs,按列對其進行零均值和標(biāo)準(zhǔn)方差處理。
(2) 求滯后因子,得到Xs的增廣矩陣。
(3) 計算增廣矩陣的協(xié)方差矩陣。
(4) 計算協(xié)方差矩陣的特征向量和特征值。
(5) 根據(jù)方差的累積貢獻率計算其主成分?jǐn)?shù),一般選擇方差的累積貢獻率為85%(有時也取80%和90%,視實際情況而定)。
(6) 根據(jù)基于彈性網(wǎng)回歸的SPCA法以及前向選擇算法算出P。
(7) 求出Q統(tǒng)計量、T2統(tǒng)計量及綜合指標(biāo),即可得到DSPCA法的故障檢測模型。
仿真數(shù)據(jù)采用文獻[1]中的模型,系統(tǒng)輸入變量為:(1)均值為0、方差為1的白噪聲;(2)均值為0、方差為0.1的白噪聲。輸入矩陣和輸出矩陣均為可測二維變量矩陣。采集模型在正常情況下的100個樣本用于建模。在測試數(shù)據(jù)的第11個數(shù)據(jù)引入故障,故障1為在輸入矩陣的第1行添加1個單位階躍,故障2為在輸入矩陣的第2行添加1個幅度為3的階躍。數(shù)據(jù)的測試結(jié)果見圖1,曲線U1和U2代表輸入矩陣的第1行和第2行數(shù)據(jù),曲線Y1和Y2代表輸出矩陣的第1行和第2行數(shù)據(jù)。第1~100個測試數(shù)據(jù)為正常情況下的數(shù)據(jù),第101~200個測試數(shù)據(jù)對應(yīng)故障1的作用范圍,第201~300個測試數(shù)據(jù)對應(yīng)故障2的作用范圍。
圖1 數(shù)據(jù)的測試結(jié)果
取方差的累積方差貢獻率為85%,得到主成分?jǐn)?shù)為3,分別使用PCA法、DPCA法和SPCA法對測試數(shù)據(jù)進行故障檢測,具體結(jié)果見圖2(虛線為檢測的控制限,下同)和表1。
圖2 PCA法、DPCA法和SPCA法的檢測結(jié)果
表1 PCA法、DPCA法和SPCA法的檢測正確率對比
由表1可得:SPCA法的Q統(tǒng)計量和綜合指標(biāo)的檢測正確率相較于PCA法和DPCA法大大提高。為進一步捕捉數(shù)據(jù)動態(tài)特性,最后使用DSPCA法進行檢測,結(jié)果見圖3和表2。
圖3 DSPCA法的故障檢測結(jié)果
表2 DSPCA法的檢測正確率
從表1和表2可以看出:與PCA法、DPCA法和SPCA法相比,DSPCA法更進一步提高了故障檢測正確率,對于動態(tài)數(shù)據(jù)的故障檢測具有最優(yōu)的效果。
高壓加熱器位于給水泵和省煤器之間,是回?zé)崾狡啓C最重要的組成之一。利用汽輪機的部分抽汽對給水進行加熱,可提高汽輪機組運行效率。高壓加熱器發(fā)生故障會導(dǎo)致回?zé)嵯到y(tǒng)傳熱效率下降,嚴(yán)重時會對機組安全運行造成影響。為了保障機組運行的經(jīng)濟性和安全性,需要時刻對高壓加熱器運行狀態(tài)進行監(jiān)視,當(dāng)高壓加熱器發(fā)生故障時能及時發(fā)現(xiàn)并進行有效的檢測,防止損失擴大。目前,高壓加熱器最常見的故障為高壓加熱器管系泄漏及高壓加熱器管結(jié)垢堵塞。筆者針對發(fā)生率更高、危害更大的高壓加熱器管系泄漏故障進行研究。
采用某電廠600 MW機組高壓加熱器運行過程中的相關(guān)數(shù)據(jù)[6]進行仿真建模,并用發(fā)生泄漏前后的數(shù)據(jù)對模型準(zhǔn)確性進行驗證。以某級高壓加熱器為例,相關(guān)測點參數(shù)包括:鍋爐給水流量,該級高壓加熱器的進口給水的溫度、壓力及出口給水的溫度、壓力,該級高壓加熱器對應(yīng)的抽汽壓力和抽汽溫度,該級高壓加熱器液位高度,上一級高壓加熱器的疏水溫度和疏水流量,汽輪機功率。
高壓加熱器泄漏分為凝結(jié)段泄漏、疏水冷卻段泄漏和蒸汽冷卻段泄漏,高壓加熱器發(fā)生泄漏后,都會導(dǎo)致疏水流量顯著增大。該機組的3號高壓加熱器曾發(fā)生泄漏,檢修后發(fā)現(xiàn)有6根管道泄漏,隨后對其進行了封堵。從廠級監(jiān)控信息系統(tǒng)(SIS)數(shù)據(jù)庫中提取在3號高壓加熱器泄漏前,相關(guān)測點在5日內(nèi)的數(shù)據(jù),采樣時間間隔是5 min。采樣時間間隔太短,會增加運營成本,采樣時間間隔太長,無法準(zhǔn)確提取到每個時刻傳感器所測變量的狀態(tài),所以采樣時間間隔應(yīng)該綜合考慮經(jīng)濟性和測量有效性后進行選取。對于600 MW機組,合適的采樣時間間隔一般為5 min。經(jīng)過動態(tài)判定后獲得部分連續(xù)數(shù)據(jù),共有300組,對其進行建模,以發(fā)生故障當(dāng)天的數(shù)據(jù)作為故障樣本,基于DSPCA對模型進行驗證,該案例模型的滯后因子為1、主成分?jǐn)?shù)為3,得到的故障檢測結(jié)果見圖4。
圖4 現(xiàn)場試驗基于DSPCA的故障檢測結(jié)果
由圖4可得:在電廠檢測到高壓加熱器泄漏并對其進行切除檢修之前,該模型就已經(jīng)檢測到了較為明顯的故障,即在電廠檢測到該故障發(fā)生6 h前就檢測到了該故障,表明筆者所建立的故障檢測模型具有較強的故障敏感性和準(zhǔn)確性,能夠在早期檢測出高壓加熱器管系泄漏。
筆者提出了基于DSPCA的熱工過程故障檢測方法,最大程度降低噪聲的影響,提取出歷史數(shù)據(jù)中最有用的信息。仿真算例結(jié)果表明:該方法對熱工過程數(shù)據(jù)具有較強的針對性,針對高壓給水加熱器常見的管系泄漏故障有較高的檢測正確率。