趙明,梁俊宇,李孟陽,杜景琦
(1.云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,昆明 650217;2. 云南電力試驗(yàn)研究院(集團(tuán))有限公司,昆明 650217)
云南省水電裝機(jī)占比大,承擔(dān)電網(wǎng)基本負(fù)荷,電網(wǎng)的安全運(yùn)行與水輪機(jī)組運(yùn)行狀態(tài)的好壞直接相關(guān)。水輪機(jī)組導(dǎo)軸承作為水輪發(fā)電機(jī)組的承力部件, 是轉(zhuǎn)動體和固定體的接觸分界面,當(dāng)軸系失中、軸系振動、軸承制造缺陷、潤滑不暢、異物進(jìn)入等。會由于摩擦等原因產(chǎn)生大量熱量,引起軸溫快速升高,嚴(yán)重時可能會造成熱損壞,導(dǎo)致安全事故以及重大的經(jīng)濟(jì)損失[1]。因此監(jiān)測導(dǎo)軸承的運(yùn)行狀態(tài),并對其進(jìn)行狀態(tài)預(yù)警,對機(jī)組的安全可靠性至關(guān)重要。
目前已有的異常診斷方法是將其看作分類問題,采用分類算法進(jìn)行樣本訓(xùn)練并進(jìn)行異常類的識別,做出設(shè)備狀態(tài)異常狀態(tài)的判斷[2][3]。然而由于大型軸承軸瓦數(shù)量多,軸承溫度測點(diǎn)數(shù)量多,如此眾多的測點(diǎn)進(jìn)入異常診斷算法會造成“維度災(zāi)難[4]”問題,嚴(yán)重影響軸承溫度異常診斷的效果。
本文基于主元分析方法(PCA),提出了一種水電機(jī)組軸承溫度異常診斷方法。該方法是一種特征信號提取方法,具有消除數(shù)據(jù)相關(guān)性、降低數(shù)據(jù)維數(shù)等優(yōu)良性能[5-9]。該方法利用軸承不同位置軸承溫度相關(guān)性較高的特性,有效克服軸溫多測點(diǎn)帶來的“維度災(zāi)難”問題,當(dāng)軸承工作異常時,測點(diǎn)溫度會偏離正常的溫度范圍,進(jìn)而導(dǎo)致模型殘差分布發(fā)生變化,當(dāng)殘差超出通過歷史數(shù)據(jù)訓(xùn)練的閾值時,提供運(yùn)行人員異常信息,并檢查水輪機(jī)組導(dǎo)軸承的工作狀態(tài)。
主元分析(Prinipal Component Analysis,PCA),是一種得到廣泛使用的多元統(tǒng)計(jì)分析法,可用于對多維數(shù)據(jù)的降維操作,有效提取多維數(shù)據(jù)中主要的信息,應(yīng)用于圖像處理、故障診斷和模式識別領(lǐng)域。
PCA 方法首先采集處于正常操作條件下的過程數(shù)據(jù),對其進(jìn)行標(biāo)準(zhǔn)化處理,得到均值為0,方差為1 的數(shù)據(jù)矩陣X∈RN×m(N為樣本采樣點(diǎn)數(shù),m為測量變量數(shù)),其主元模型為
式中,P∈Rm×k,T∈RN×k分別為載荷(投影)矩陣和主元得分矩陣,k表示選取主元的個數(shù),k≤m。P~∈Rm×(m-k),T~∈RN×(m-k)分 別 為 殘差的載荷矩陣和得分矩陣,E∈RN×m為預(yù)測殘差矩陣。
其中,pi為單位特征向量,λi是特征值,i=1,2,...,m,λ1≥λ2≥...≥λm。 選 取 前k個 特 征向量作為PCA 中的負(fù)荷向量,構(gòu)成負(fù)荷矩陣,P=[p1,p2,...,pk]。
通常,主元個數(shù)k通過累積百分比方法確定,即前k個主元的累積方差貢獻(xiàn)率,通過前k個特征值的和除以所有特征值的和得到,表示這k個主元所能夠代表數(shù)據(jù)方差的比例,即:
通常,α可以選取為85%、90%、95%,表示主元代表了數(shù)據(jù)矩陣85%、90%、95% 的信息,即選取的前k個主元代表了數(shù)據(jù)矩陣X的大部分信息,能夠代表元數(shù)據(jù)矩陣,構(gòu)成了主元子空間。未被選取的m-k個主元夠成了殘差子空間,包含了數(shù)據(jù)矩陣X的剩余信息。當(dāng)使用PCA 進(jìn)行異常檢測時,常采用T2和SPE 統(tǒng)計(jì)量進(jìn)行過程檢測。SPE 統(tǒng)計(jì)量和T2統(tǒng)計(jì)量分別定義在殘差子空間和主元子空間,SPE 指標(biāo)衡量樣本向量在殘差空間的投影的變化:
式中,
是協(xié)方差矩陣的特征值;
Cα為在置信度為α下標(biāo)準(zhǔn)正態(tài)分布的閾值。
T2統(tǒng)計(jì)量是用來衡量樣本向量在主元空間上的變化:
式中,F(xiàn)k,n-k;α是帶有k和n-k個自由度、置信度為α的F 分布值。
對任一組新的測量數(shù)據(jù),通過歸一化和PCA 計(jì)算后,得到的上述兩個統(tǒng)計(jì)值超過了相應(yīng)的閾值,則認(rèn)為過程中出現(xiàn)了異常,即可實(shí)現(xiàn)異常的檢測。
當(dāng)過程發(fā)生異常時,SPE 可以檢測出異常是否發(fā)生但是不能指出是哪個變量發(fā)生了異常。貢獻(xiàn)圖是一種非常有用的異常辨識方法[10],它是基于如下理論假設(shè):對異常檢測指標(biāo)貢獻(xiàn)最大的變量是最有可能發(fā)生異常的變量。貢獻(xiàn)圖通過貢獻(xiàn)值表征每個變量對SPE 的影響。貢獻(xiàn)值實(shí)際上是異常在觀測變量上的影響,不需要任何有關(guān)異常的先驗(yàn)知識就可以產(chǎn)生。
SPE 的貢獻(xiàn)圖定義如下:
隨著水輪發(fā)電機(jī)組單機(jī)容量的不斷增大,大型混流式水輪機(jī)組的導(dǎo)軸承體積也不斷增大、軸瓦數(shù)量不斷增多,導(dǎo)軸承一般布置多個傳感器,用于監(jiān)測軸承不同軸瓦的溫度,當(dāng)某塊軸瓦發(fā)生損壞后,該軸瓦的溫度會出現(xiàn)升高,因此需要對每個溫度測點(diǎn)進(jìn)行監(jiān)視,但傳統(tǒng)的異常診斷方法難以監(jiān)測如此多個參數(shù),因此考慮通過PCA 統(tǒng)計(jì)建模方法對其進(jìn)行異常診斷,首先對正常歷史數(shù)據(jù)通過PCA 方法消除數(shù)據(jù)相關(guān)性、降低數(shù)據(jù)維數(shù),并得到其得到模型殘差分布特性,作為閾值;其次對實(shí)時運(yùn)行數(shù)據(jù)進(jìn)行PCA 操作,得到模型殘差分布并與閾值比較,如果超出則進(jìn)行異常報警,并基于SPE 貢獻(xiàn)圖對異常測點(diǎn)進(jìn)行診斷。
其異常診斷的具體步驟如下:
步驟一:選擇監(jiān)控變量,提取正常工況下的軸溫典型樣本。從海量的歷史運(yùn)行數(shù)據(jù)中篩選出典型數(shù)據(jù)樣本集。典型數(shù)據(jù)樣本集要求:
1)訓(xùn)練數(shù)據(jù)中所覆蓋的狀態(tài)必須包含系統(tǒng)正常運(yùn)行狀態(tài)下所有監(jiān)測參數(shù)動態(tài)變化過程,即機(jī)組各個典型負(fù)荷狀態(tài)下的監(jiān)測參數(shù)變化過程;
2)訓(xùn)練數(shù)據(jù)中的狀態(tài)不能包含異常狀態(tài),必須全部為能夠表征系統(tǒng)正常運(yùn)行狀態(tài)的參數(shù)。
步驟二:數(shù)據(jù)歸一化。對于經(jīng)過上述步驟處理的數(shù)據(jù)集X*∈RN×m,用下式將各變量值域標(biāo)準(zhǔn)化至[0,1]:
步驟三:對于步驟二中的正常典型樣本數(shù)據(jù)集,建立PCA 主元模型。包括以下步驟:
3)計(jì)算前k個主要元素的累積方差貢獻(xiàn)率
4)對典型樣本數(shù)據(jù)集做PCA 分解,獲得主元子空間和殘差子空間。
步驟四:計(jì)算典型樣本數(shù)據(jù)集PCA 模型的統(tǒng)計(jì)量及相應(yīng)的閾值。包括SPE 統(tǒng)計(jì)量與T2統(tǒng)計(jì)量;
步驟五:基于標(biāo)準(zhǔn)典型樣本數(shù)據(jù)集的PCA模型的在線異常檢測與診斷。包括以下步驟:
1)在線采集電廠實(shí)際運(yùn)行數(shù)據(jù),獲得新的數(shù)據(jù)集,并進(jìn)行與步驟二同樣的標(biāo)準(zhǔn)化。
2)對標(biāo)準(zhǔn)化后的數(shù)據(jù),通過PCA 分解計(jì)算T2和SPE 統(tǒng)計(jì)量,監(jiān)控其數(shù)據(jù)是否超過正常狀態(tài)的閾值。若沒有超限,則軸溫正常;若超限,則計(jì)算每個過程變量對殘差T2和SPE 統(tǒng)計(jì)量的貢獻(xiàn)率,貢獻(xiàn)率最大的變量就是可能引起異常的變量。
該方法的具體步驟如下圖:
圖1 基于PCA方法的主軸溫度異常診斷
以云南省某水輪機(jī)組的上導(dǎo)軸承溫度為例,該設(shè)備具有30 個溫度測點(diǎn),將該機(jī)組四個月的歷史運(yùn)行數(shù)據(jù)作為訓(xùn)練樣本集,經(jīng)過數(shù)據(jù)預(yù)處理以及樣本選擇過程,提取1500 條樣本數(shù)據(jù),構(gòu)成矩陣規(guī)模為1500*30 的訓(xùn)練矩陣。并為此該典型樣本數(shù)據(jù)集建立PCA 主元模型。
首先,對標(biāo)準(zhǔn)典型樣本數(shù)據(jù)集執(zhí)行協(xié)方差分解以計(jì)算特征值矩陣,并選擇主元的數(shù)量。本例中要求累積方差貢獻(xiàn)率達(dá)到99%,最終求得主元個數(shù)為8。計(jì)算標(biāo)準(zhǔn)典型樣本數(shù)據(jù)集的PCA 模型的統(tǒng)計(jì)量及相應(yīng)的閾值。包括SPE 統(tǒng)計(jì)量與T2統(tǒng)計(jì)量,本例中計(jì)算的SPE 閾值以及閾值分別為0.012 與23.5。
采用測試數(shù)據(jù)進(jìn)行模型的測試,由于采集的測試數(shù)據(jù)集都是正常數(shù)據(jù),SPE 統(tǒng)計(jì)量幾乎始終未超限(僅有一處誤報),為正常狀態(tài)。T2統(tǒng)計(jì)量有少數(shù)超限但持續(xù)時間很短,可以認(rèn)為是誤報,設(shè)備仍可認(rèn)為是正常狀態(tài)。最終計(jì)算的貢獻(xiàn)圖見附圖未發(fā)現(xiàn)有明顯異常的測點(diǎn),如圖2~3。
圖2 正常數(shù)據(jù)的 SPE統(tǒng)計(jì)量
圖3 正常數(shù)據(jù)的T2統(tǒng)計(jì)量
圖4 異常數(shù)據(jù) SPE統(tǒng)計(jì)量圖
圖5 異常數(shù)據(jù)T2統(tǒng)計(jì)量圖
圖6 異常數(shù)據(jù)測點(diǎn)貢獻(xiàn)圖
為對算法有效性進(jìn)行驗(yàn)證,假定第二傳感器測點(diǎn)位置的軸瓦發(fā)生異常,造成溫度升高,對在1251~1500 時刻第二傳感器測點(diǎn)的溫度,在實(shí)際值基礎(chǔ)上線性提升5℃。
最終結(jié)果見下圖。從下圖可以看出,在1~1250 時刻SPE 統(tǒng)計(jì)量始終未超限,為正常狀態(tài)。在異常段1251~1500 時刻,SPE 統(tǒng)計(jì)值與T2統(tǒng)計(jì)量顯著上升,最終SPE 統(tǒng)計(jì)量1294 時刻超限報警,在1321 時刻T2統(tǒng)計(jì)值發(fā)生超限,此時異常溫升大概在1℃左右。最終計(jì)算的貢獻(xiàn)圖見圖6,測點(diǎn)2 的貢獻(xiàn)量遠(yuǎn)大于其它,可見PCA 正確的識別了發(fā)生異常的測點(diǎn)位置。
與傳統(tǒng)的軸承溫度異常診斷方法相比,該方法具有如下優(yōu)點(diǎn):
1)算法流程簡單實(shí)用,條件容易滿足,效率較高;
2)由于軸溫傳感器測點(diǎn)之間的強(qiáng)線性關(guān)系,不會產(chǎn)生維度災(zāi)難,即使測點(diǎn)很多的情況下也可以充分挖掘歷史數(shù)據(jù)當(dāng)中的信息,錯報誤報率小,具有更加合理的參考意義;
3)易于軟件實(shí)現(xiàn),可以較為方便地融入水電廠設(shè)備在線監(jiān)測系統(tǒng)。