王云會,楊 杰,楊佳琳
(京能集團(tuán)北京京西燃?xì)鉄犭娪邢薰?,北?100041)
自動控制水平的提高對生產(chǎn)系統(tǒng)的故障診斷技術(shù)提出了更高的要求。傳感器故障是致使系統(tǒng)異常的常見因素之一,而故障信息的特征提取是診斷識別的關(guān)鍵技術(shù)。本研究將類均值核主元分析應(yīng)用到故障診斷中,分析不同核函數(shù)的選取對判斷結(jié)果的影響。類均值核主元分析脫胎于周東華等[1-2]的豐富研究。主元分析是把相關(guān)變量數(shù)據(jù)轉(zhuǎn)換成部分無關(guān)變量數(shù)據(jù)的分析方法,但是不能解決非線性問題。因此,Scholkopf等[3]提出了核主元分析,不僅能處理非線性數(shù)據(jù),而且其計算復(fù)雜度由輸入數(shù)據(jù)空間的維數(shù)決定。彭紅星等[4]提出了基于核的主成分分析(Kernel Principal Component Analysis,KPCA)的非線性過程的監(jiān)控方法,成功應(yīng)用于廢水處理過程的檢測,然而,該方法存在損失部分?jǐn)?shù)據(jù)樣本信息的缺點。因而,針對這一問題,一種被叫作類均值核主元分析的新方法被提出[5],它在原始數(shù)據(jù)非線性映射到高維空間后,先求出映射數(shù)據(jù)的類均值矢量,再進(jìn)行核主元分析,構(gòu)建類均值核主元,使之包含了數(shù)據(jù)樣本的全部信息,降低數(shù)據(jù)維度的同時實現(xiàn)無損。類均值核主元分析已在故障診斷研究中有所應(yīng)用[6-8],本文的目的在于探究不同核函數(shù)對故障診斷結(jié)果的影響,分別從故障識別和故障判斷角度進(jìn)行實驗,即將類均值核主元分析與BP神經(jīng)網(wǎng)絡(luò)結(jié)合[9-10],對比不同核函數(shù)下特征提取對故障識別率的作用。此外,計算T2和SPE統(tǒng)計量,比較故障判斷的準(zhǔn)確性和即時性。文章闡述了類均值核主元分析的基本原理,并在此基礎(chǔ)上介紹核參數(shù)優(yōu)化方法和實踐步驟,對不同核函數(shù)進(jìn)行仿真實踐,通過總結(jié)分析發(fā)現(xiàn),經(jīng)粒子群優(yōu)化后的混合模型在準(zhǔn)確性和即時性方面更為優(yōu)越。
設(shè)C的特征值μ對應(yīng)特征向量為v,則有:
其中,D表示類均值核矩陣,且D為對稱矩陣。將矩陣D代入式(5),化簡得:
若類均值矢量均值不等于零,則需要對其進(jìn)行中心化處理得到Dˉ,則有:
1.2.1 核函數(shù)選取和優(yōu)化
分析類均值核主元的步驟可知,核函數(shù)的選取決定核主元的最終形式,不需要對數(shù)據(jù)進(jìn)行非線性映射操作,只需要選擇滿足條件的核函數(shù)即可。常用的核函數(shù)包括:多項式核函數(shù)、高斯徑向基核函數(shù)、神經(jīng)網(wǎng)絡(luò)核函數(shù)等。本文中采用多項式核函數(shù)、高斯徑向基核函數(shù)及其混合核函數(shù)作比較,分析優(yōu)越性。
多項式核函數(shù):
高斯徑向基核函數(shù):
混合核函數(shù):
在核參數(shù)的應(yīng)用中,分別存在d,σ,ρ3個未知參數(shù),人為經(jīng)驗的設(shè)定對最終的判斷結(jié)果存在巨大的影響,本文通過粒子群優(yōu)化算法(Particle Swarm Optimization,PSO,PSO)尋找各個核函數(shù)在類均值核主元分析中的最優(yōu)參數(shù)設(shè)置,其算法流程如下:(1)初始化種群。(2)計算各個粒子的種群適應(yīng)度,求出個體極值和全體極值。(3)更新速度和位置。(4)判別結(jié)束條件,若不滿足,返回上一步繼續(xù)執(zhí)行。
1.2.2 故障類型識別方法
本文采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行故障類型識別的分類方法。BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播訓(xùn)練的多層前饋網(wǎng)絡(luò),其算法稱為BP算法,基本思想是采用梯度下降法,使網(wǎng)絡(luò)的實際輸出值和期望輸出值的誤差均方差最小。結(jié)構(gòu)如圖1所示。
由于基于跨境電商平臺能實現(xiàn)了單個企業(yè)之間或單個企業(yè)與單個消費者之間的交易,所以它已然成為外貿(mào)企業(yè)的轉(zhuǎn)型的創(chuàng)新途徑(任志新、李婉香,2014)。同時,聶林海(2014)也指出電子商務(wù)一方面可以帶動傳統(tǒng)企業(yè)加快轉(zhuǎn)型升級,也能為中小企業(yè)進(jìn)入大市場提供更好助力,并為其創(chuàng)造更多的貿(mào)易機會和發(fā)展空間;另一方面,它也能成為企業(yè)開拓海外市場的利器?;ヂ?lián)網(wǎng)市場和實體市場協(xié)同融合發(fā)展將成為世紀(jì)經(jīng)濟(jì)發(fā)展的必然趨勢。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
BP神經(jīng)網(wǎng)絡(luò)擁有很強的非線性映射能力、自學(xué)習(xí)和自適應(yīng)能力,實質(zhì)上實現(xiàn)了一個從輸入到輸出的高維映射功能,正好映射了類均值核主元分析法中的高維映射過程。具有3層及以上的BP神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近任何非線性連續(xù)函數(shù)。BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時,能夠通過不斷地更新并自動提取輸出、輸出數(shù)據(jù)間的“合理規(guī)則”,自適應(yīng)地通過網(wǎng)絡(luò)的權(quán)值調(diào)整來逼近期望結(jié)果。上述兩點能保證其作為類均值核主元分析法中故障類型識別方法的合理性。
1.2.3 算法步驟
在進(jìn)行故障診斷時,一方面,利用類均值核主元分析處理實驗數(shù)據(jù),實現(xiàn)無損降維;另一方面,通過前者提取出的主元特征映射得到新數(shù)據(jù)集,采用BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練優(yōu)化,得到診斷模型。整個步驟中,變參數(shù)是作為核心的核函數(shù)被選取的,改變核函數(shù)的種類并通過PSO優(yōu)化得到最佳參數(shù),進(jìn)行實驗對比,具體步驟如下:
(1)對數(shù)據(jù)樣本進(jìn)行去噪、平滑、標(biāo)準(zhǔn)化處理。
(2)應(yīng)用PSO算法優(yōu)化3種核參數(shù),分別就不同核參數(shù)進(jìn)行類均值核主元分析,計算類均值矩陣,并對其進(jìn)行中心化處理。
(3)計算中心化后的核矩陣的特征值和特征向量,并計算特征向量在特征空間上的投影,得到降維后的樣本數(shù)據(jù)集Q=H×X,其中,X為處理后的數(shù)據(jù)集,H為由核主元組成的特征矢量。
(4)確定網(wǎng)絡(luò)的輸入,將被檢測的故障狀態(tài)進(jìn)行編碼和樣本訓(xùn)練,計算各神經(jīng)元之間的權(quán)值。
(5)用訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行故障識別。
以圖2中上下水箱液位以及相關(guān)的控制器、執(zhí)行器輸出指令作為檢測變量,模擬各故障狀況,獲取實驗數(shù)據(jù)。取各故障的前1 000組數(shù)據(jù)作為訓(xùn)練樣本,剩下的500組數(shù)據(jù)作為測試樣本,并對故障類型進(jìn)行獨熱編碼,輸出節(jié)點如表1所示。
圖2 實驗平臺
表1 故障診斷網(wǎng)絡(luò)訓(xùn)練樣本目標(biāo)輸出編碼
續(xù)表1
通過粒子群優(yōu)化算法尋找各個核函數(shù)在類均值核主元分析中的最優(yōu)參數(shù)設(shè)置,所優(yōu)化核參數(shù)如表2所示。
表2 核參數(shù)優(yōu)化結(jié)果
針對上述3種核函數(shù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果(即故障識別對比結(jié)果)如圖3所示。
圖3 3種核函數(shù)的故障識別對比結(jié)果
可以直觀看到,當(dāng)傳感器發(fā)生漂移、超限、恒增益、恒偏差、失效和斷線故障6種故障時,上述3種核函數(shù)經(jīng)粒子群算法優(yōu)化核參數(shù)后都能以不低于90%的識別率準(zhǔn)確診斷出故障類型。高斯徑向基核函數(shù)在漂移、超限和恒偏差故障的特征提取中有優(yōu)勢,多項式核函數(shù)在其余3種故障的診斷中有優(yōu)勢。而混合核函數(shù)則結(jié)合二者的優(yōu)點,其診斷結(jié)果明顯優(yōu)于單一一種核函數(shù)的結(jié)果。
為進(jìn)一步驗證混合核函數(shù)的優(yōu)越性,分別計算T2和SPE統(tǒng)計量,判別故障的發(fā)生的原因。其中,T2統(tǒng)計量反映了每個主成分在變化趨勢和幅值上偏離模型的程度,是對模型內(nèi)部化的一種度量,可以用來對多個主元同時進(jìn)行監(jiān)測;SPE統(tǒng)計量刻畫了輸入變量的測量值對主元模型的偏離程度,是對模型外部變化的一種度量。結(jié)果如表3所示。
表3 故障診斷結(jié)果
表3中數(shù)據(jù)表示,在采集正常情況下的數(shù)據(jù)點800個(訓(xùn)練分類器用)之后,開始模擬6種故障的發(fā)生。表3中數(shù)值即為通過兩個統(tǒng)計量指標(biāo)檢測出當(dāng)前正確顯示故障原因的時刻,顯然,數(shù)值越靠近800表示越能及時發(fā)現(xiàn)故障。
通過對比表3中數(shù)據(jù)可以看出,采用混合核函數(shù)時,對漂移故障、恒增益故障以及恒偏差故障的檢測及時性明顯快于其他兩種核函數(shù),分別提高了32次、35次和44次(和相對好的一種結(jié)果相比)。
本文針對工業(yè)工程中常見的傳感器故障類型(超限、失效、斷線、漂移、恒增益和恒偏差故障),利用類均值核主元分析法對其進(jìn)行診斷。分別利用3種核函數(shù)不同的故障類型是否發(fā)生進(jìn)行診斷。結(jié)果顯示,3種核函數(shù)對超限故障、失效故障和斷線故障具備相近的檢測能力,而對于漂移故障、恒增益故障和恒偏差故障,混合核函數(shù)的應(yīng)用具有更高的準(zhǔn)確性和及時性。進(jìn)而通過與BP神經(jīng)網(wǎng)絡(luò)結(jié)合證明故障識別的準(zhǔn)確性,通過T2和SPE統(tǒng)計量證明故障診斷的及時性。