亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于核熵獨立成分分析的故障檢測方法

        2022-09-13 07:58:34郭金玉王哲李元
        化工學報 2022年8期
        關鍵詞:高斯矩陣樣本

        郭金玉,王哲,李元

        (沈陽化工大學信息工程學院,遼寧 沈陽 110142)

        引 言

        隨著機器學習和大數(shù)據(jù)分析的不斷發(fā)展,尋求一種用于復雜工業(yè)系統(tǒng)的有效的故障檢測和診斷方法一直是一個熱門的研究課題。然而,由于化工過程數(shù)據(jù)具有高維、非線性和動態(tài)時序等特點,傳統(tǒng)的基于數(shù)據(jù)驅(qū)動的故障診斷方法很難應用在復雜的工業(yè)過程中[1]。國內(nèi)外研究人員仍在廣泛嘗試,不斷將前沿的機器學習算法應用到工業(yè)過程中,以求得更好的檢測效果[2]。但目前還沒有得到一個具體可靠的框架來對故障數(shù)據(jù)進行有效識別和分類。因此,故障診斷方法的探索具有重大研究價值。

        主成分分析(principal component analysis,PCA)[3-4]是最早也是最為經(jīng)典的故障檢測方法,它的實現(xiàn)步驟簡潔且處理速度快,可以處理高維、嘈雜和高度相關的數(shù)據(jù)。PCA 構造以馬氏距離和歐幾里得距離為代表的兩個統(tǒng)計量,用于檢測模型主成分空間和殘差空間中的過程變化。然而,當PCA 應用于具有非高斯和非線性特征的工業(yè)過程數(shù)據(jù)時,由于使用二階統(tǒng)計量和線性假設,其表現(xiàn)不佳。近年來,作為一種新的非線性PCA 技術,核主成分分析(kernel principal component analysis, KPCA)[5-8]發(fā)展非常迅速。KPCA 并沒有像傳統(tǒng)PCA 那樣直接計算輸入數(shù)據(jù)的主成分,而是先通過非線性映射將輸入空間映射到特征空間,在高維空間進行運算。KPCA 通過引入核函數(shù)避免非線性映射和內(nèi)積計算,在監(jiān)控統(tǒng)計量方面與傳統(tǒng)PCA類似,構造了SPE和T2兩個統(tǒng)計量,分別監(jiān)控主成分空間和殘差空間。核技術的優(yōu)化使得KPCA 在處理非線性數(shù)據(jù)時有所提升,但是在現(xiàn)實的工業(yè)過程中,數(shù)據(jù)往往同時具有高斯分布和非高斯分布,而KPCA 在選取主成分的過程中只利用過程變量的方差信息,因此缺乏有效處理非高斯數(shù)據(jù)的能力。在此情況下,Jenssen[9]提出一種新型的故障檢測方法,即核熵成分分析(kernel entropy component analysis,KECA)。這種故障檢測方法放寬了傳統(tǒng)PCA 和KPCA 方法中的高斯假設。相比于只考慮二階統(tǒng)計量方差的KPCA,KECA[10-14]試圖最大程度保留原始數(shù)據(jù)的熵值,根據(jù)熵值選取核主成分。這種對于熵的保留能夠有效地提取數(shù)據(jù)中的高階統(tǒng)計量。因此,KECA可以提取數(shù)據(jù)中的非高斯信息。這種方法對于某些故障的檢測卓有成效,但檢測某些故障的時候相比傳統(tǒng)的多元統(tǒng)計分析方法還是相對弱勢。齊詠生等[15]改進傳統(tǒng)的KECA 方法,提出一種新的CS(Cauchy-Schwarz)統(tǒng)計量。該方法在微小故障的檢測方面表現(xiàn)突出,優(yōu)于之前的傳統(tǒng)方法。然而CS統(tǒng)計量是對檢測指標的改進,對于非高斯非線性過程的檢測存在局限性。

        與KPCA 通過將數(shù)據(jù)投影在高維空間以解決PCA 方法在檢測非線性數(shù)據(jù)時的缺陷不同,獨立成分分析(independent component analysis,ICA)[16-18]將觀測數(shù)據(jù)分解為獨立成分的線性組合。這種方法涉及高階統(tǒng)計,即不僅對數(shù)據(jù)進行去相關,而且盡可能減少數(shù)據(jù)的高階統(tǒng)計依賴,使投影數(shù)據(jù)的分布更為獨立,從而從觀測數(shù)據(jù)中提取更多有用的信息。然而,基于ICA 的線性投影也不足以表示具有非線性結構的數(shù)據(jù)。Lee 等[19]提出一種基于核技術與ICA相結合的非線性過程監(jiān)控技術——核獨立成分 分 析(kernel independent component analysis,KICA)方法。KICA[20-23]是一種非線性特征提取技術,它在內(nèi)核特征空間中進行獨立成分分析。KICA 的基本思想是將數(shù)據(jù)通過非線性函數(shù)映射到特征空間中,提取有用信息,并在特征空間中執(zhí)行ICA。該方法由兩個步驟組成:KPCA 部分的核中心化和ICA 的過程。這種方法改善之前的方法在非線性非高斯數(shù)據(jù)檢測中的弊端。但是它完全復制KPCA 選取核主成分的方式,使降維后的數(shù)據(jù)并不能很好地代表原數(shù)據(jù)的信息熵特征,因此還有很大的優(yōu)化空間。

        傳統(tǒng)KICA 依據(jù)特征值的大小進行降維,但是特征值大并不一定取得的信息熵貢獻度也是最大的。針對這個問題,本文提出一種新的基于核熵獨立成分分析(kernel entropy independent component analysis,KEICA)的故障檢測方法。該方法根據(jù)信息熵值選取核主成分以盡可能保留原始數(shù)據(jù)的高階信息,然后再執(zhí)行ICA的過程,增強數(shù)據(jù)樣本的獨立性。最后,將KEICA應用于非線性數(shù)值例子和TE過程的監(jiān)測中以驗證其有效性。

        1 基于核熵獨立成分分析的故障檢測

        1.1 核熵獨立成分分析

        對于輸入數(shù)據(jù)集D:x1,x2,…,xN,給定一個核函數(shù)φ(·),定義從輸入空間到核特征空間的映射為xi→φ(xi) (i= 1,…,N),因此核特征空間的數(shù)據(jù)集可以表示為Φ= [φ(x1),φ(x2),…,φ(xN)]。本文選用高斯核函數(shù)將樣本數(shù)據(jù)映射至高維空間,高斯核函數(shù)對于數(shù)據(jù)中的噪聲有著較好的抗干擾能力,其參數(shù)決定了函數(shù)的作用范圍,超過這個范圍,數(shù)據(jù)的作用就“基本消失”,通常是通過交叉驗證獲得有效的核參數(shù)。Φ的協(xié)方差矩陣[24]為

        對于數(shù)據(jù)集D:x1,…,xN,假設p(x)是它的概率密度函數(shù),則Rényi 熵[25](Rényi entropy)可以表示為H(p) = -log∫p2(x)dx。由于對數(shù)是單調(diào)函數(shù),因此應將注意力集中在V(p) =∫p2(x)dx。使用樣本均值來近似估計V(p),得到

        式中,I是一個每個元素都等于1 的N×1 的向量;kσ(x,xt)是以xt為中心的Parzen 窗[26];參數(shù)σ是窗口寬度。

        對N×N的核矩陣K=ΦTΦ進行中心化得到?,中心化公式為

        式中,IN是一個N×N的矩陣,其中每個元素都等于1。

        在KICA 中,僅僅基于特征值的大小選擇特征值和特征向量來執(zhí)行降維,而從熵的角度來看,熵的估計值同時受特征值和特征向量的影響。因此在式(4)中,Ψi的值可以用作Rényi熵的估計。

        因為QLQT=I0,I0為單位矩陣,所以得到白化矩陣Q。白化后的得分矩陣Z為

        根據(jù)式(7)進一步求出解混矩陣W為

        其中獨立信號f的計算方式為

        式中,B為正交矩陣,通過Fast ICA 迭代過程求出。迭代公式為

        式中,g為非線性函數(shù),這里取g(y) = tanh(ay)。因為W的行序直接影響到獨立元的選取,所以使用核技巧求出‖Wi‖2并從大到小進行排序選取前c個獨立元。KEICA 的I2和SPE 統(tǒng)計量定義如式(11)所示

        式中,e=Z-BcZ,Bc是B矩陣的前c列。

        本文選用核密度估計(kernel density estimation,KDE)[28]確定樣本統(tǒng)計量的控制限。核密度估計是一種非參數(shù)估計,它不需要數(shù)據(jù)的先驗知識,不做任何假設,被廣泛用于確定數(shù)據(jù)分布非正態(tài)或未知時的控制限。統(tǒng)計量SPE 的控制限計算公式如式(12)所示

        式中,h為帶寬;k代表高斯核函數(shù)。同理可得統(tǒng)計量I2的控制限公式。

        1.2 基于核熵獨立成分分析的故障檢測

        基于KEICA 的故障檢測步驟包括兩部分:離線建模和在線監(jiān)控,其流程圖如圖1所示。

        圖1 基于KEICA故障檢測流程圖Fig.1 Flowchart of fault detection based on KEICA

        (1)離線建模

        正常數(shù)據(jù)用D(M×N)表示,其中N代表樣本數(shù)量,M代表每個樣本所含變量的個數(shù)。將數(shù)據(jù)集D作為訓練數(shù)據(jù)按照以下步驟進行處理。

        ①使用每個變量的均值和標準差對數(shù)據(jù)進行標準化。

        ②給定核函數(shù)和核參數(shù),計算核矩陣K并中心化。使用式(4)計算信息熵并排序,選擇核主成分。

        ③根據(jù)式(7)對Φ進行白化,得到非線性矩陣Z。使用式(10)進行ICA 迭代,根據(jù)求出的解混矩陣W提取獨立成分。

        ④利用式(11)計算樣本數(shù)據(jù)的監(jiān)測統(tǒng)計量I2和SPE。

        (2)在線監(jiān)控

        ①對測試數(shù)據(jù)xnew,按離線建模數(shù)據(jù)的均值與方差對測試數(shù)據(jù)標準化。

        ②通過離線建模中給定的核函數(shù)和核參數(shù)計算測試數(shù)據(jù)對訓練數(shù)據(jù)的核矩陣Knew并中心化。

        ③向ICA模型上投影得到非線性矩陣Znew。

        ④使用式(11)計算測試數(shù)據(jù)的監(jiān)測統(tǒng)計量I2new和SPEnew。

        2 仿真結果和分析

        2.1 數(shù)值例子

        按照下列模型構造非線性數(shù)值例子[29-30]以檢驗本文方法的有效性,該數(shù)據(jù)集由兩個變量組成。

        式中,t服從[0.01,2]的均勻分布;e1和e2服從均值為0、標準差為0.01的正態(tài)分布噪聲。

        按照式(13)生成500 組數(shù)據(jù)作為訓練數(shù)據(jù)集;生成960 組數(shù)據(jù),保持前160 組數(shù)據(jù)不變,分別對第161 到第960 組數(shù)據(jù)的變量1 增加0.003 ×(i- 100)的擾動、變量2 增加0.01 的階躍,作為測試數(shù)據(jù)集,其中i代表樣本的數(shù)量。4 種方法的控制限設為99%,采用高斯核函數(shù)處理非線性數(shù)據(jù),通過尋優(yōu)測試將核參數(shù)設為3500,核主成分個數(shù)均設為2。圖2 為KPCA、KECA、KICA 和KEICA 方法應用于該數(shù)值例子的檢測結果。由圖2 可以看出KPCA 和KECA 都無法對故障數(shù)據(jù)進行有效檢測,漏報樣本比 較 多,其 中KPCA 的T2統(tǒng) 計 量、KECA 的SPE 和CS 統(tǒng)計量檢測效果較差。KICA 的檢測效果則優(yōu)于KPCA 和KECA 方法。作為一種非線性的特征提取技術,KICA 的核心部分是非線性的ICA 迭代,在非線性特征空間提取重要的獨立成分,因此檢測效果突出。KEICA 方法的兩種統(tǒng)計量能夠完全檢測出所有的故障數(shù)據(jù),這是因為KEICA 是將KECA 選取核主成分的思想與ICA 相結合,進一步彌補KICA 選取核主成分時丟失過多數(shù)據(jù)信息熵的不足,從而提高檢測效果。

        圖2 數(shù)值例子的仿真結果對比Fig.2 Comparison of simulation results of numerical example

        使用故障檢測率(fault detection rate,FDR)和誤報率(false alarm rate,FAR)兩個故障檢測指標對本文所提出的KEICA 方法進行評估。表1 為4 種方法故障檢測指標的對比。從表中可以看出,與KPCA、KECA 和KICA 對比,KEICA 的故障檢測效果最好,誤報率最低,驗證了該方法的有效性。

        表1 數(shù)值例子中4種方法的仿真結果對比Table 1 Comparison of simulation results for four algorithms in numerical example

        2.2 TE過程

        TE 過程[31]是評估工業(yè)過程故障檢測方法有效性和實用性的重要實驗對象,其工藝流程如圖3 所示。該過程由五個主要單元操作組成,包括:化學反應器、冷凝器、循環(huán)壓縮機、氣液分離器和汽提塔;由四種氣態(tài)反應物A、C、D、E和惰性的氣態(tài)組分B 參與反應,生產(chǎn)出兩種液態(tài)產(chǎn)物G 和H 以及副產(chǎn)物F。反應器產(chǎn)物流通過部分冷凝器冷卻,并進料至氣/液分離器中以進行組分分離。此外離開分離器的蒸氣流通過壓縮機再循環(huán)至反應器進料流。凈化一部分循環(huán)物料以防止過程中惰性產(chǎn)物和副產(chǎn)物的積累。同時,來自分離器的冷凝組分(物流10)被泵送到汽提塔。離開汽提塔的產(chǎn)品G 和H 在下游操作中進一步處理。

        圖3 TE過程工藝流程圖[24]Fig.3 Flowchart of TE process[24]

        TE 過程包括1 種正常工況和21 種可操作的故障工況。正常和故障工況下的采樣時間間隔為3 min。在正常工況下,采集運行25 h產(chǎn)生的500個數(shù)據(jù)作為正常樣本。21 種故障工況是在過程穩(wěn)定運行8 h 后引入,故采集的960 個數(shù)據(jù)中前160 個數(shù)據(jù)不含故障,后800 個數(shù)據(jù)含有故障。將正常工況下的500 個數(shù)據(jù)作為訓練樣本,所有含故障的數(shù)據(jù)作為測試樣本。

        隨機選取TE 過程中的故障1、2、4、7、11、12、13、17 和20 作為測試數(shù)據(jù)集,將KPCA、KECA 和KICA 方法與本文提出的KEICA 方法進行對比。4種方法的控制限設為99%,采用高斯核函數(shù)處理非線性數(shù)據(jù),核參數(shù)設為3500。KPCA 與KICA 方法的核主成分個數(shù)通過85%的累計方差貢獻率確定,而KECA和KEICA方法的核主成分個數(shù)由85%的累計熵貢獻率確定。

        以故障11 為例,圖4 是4 種方法仿真結果的對比。由圖4可知,4種方法對正常樣本的檢測性能都比較穩(wěn)定,均未出現(xiàn)明顯的誤報現(xiàn)象。然而對故障樣本的檢測效果差距明顯,KPCA 根據(jù)特征值的大小選取核主成分,且只考慮二階統(tǒng)計量,因此丟失了數(shù)據(jù)的高階信息,檢測效果較差且誤報率偏高。KECA 根據(jù)熵值選取核主成分,考慮了數(shù)據(jù)的高階信息,KECA 的誤報率低于KPCA,而檢測率并沒有明顯提升。KECA 的CS 統(tǒng)計量的檢測率相比傳統(tǒng)的T2和SPE 統(tǒng)計量有所提升。由于CS 統(tǒng)計量是對傳統(tǒng)檢測指標的改進,使用各得分向量之間的角度方差來度量變換后樣本對象在方向上的差異,彌補了基于距離的檢測指標對那些故障幅度較小、數(shù)據(jù)結構變化不明顯的故障檢測效果較差的不足。然而這種度量方式?jīng)]有從根本上改變KECA 對原始樣本數(shù)據(jù)統(tǒng)計信息的提取方式,檢測率提升有限。KICA 對故障樣本的檢測效果優(yōu)于KPCA 和傳統(tǒng)的KECA。KICA 在核特征空間中執(zhí)行ICA 迭代,使投影數(shù)據(jù)分布更為獨立,能更好地捕捉過程數(shù)據(jù)的非高斯信息。但是KICA 在核主成分的選取方面損失了數(shù)據(jù)的信息熵,所以檢測效果有待進一步的提升。KEICA 對正常樣本與故障樣本進行了明顯的區(qū)分,檢測率遠高于其他3種方法。在KICA 的基礎上,KEICA 運用信息熵值的大小選取核主成分。在信息論中,熵被用于度量信息的不確定度,這種度量利用了數(shù)據(jù)中的高階統(tǒng)計量,因此避免了KPCA、KICA 等方法中非高斯信息的丟失,從而更好地保留樣本的數(shù)據(jù)特征。此外,KEICA 保留了傳統(tǒng)KICA 的ICA 迭代過程,ICA 可以從原變量中提取基于高階統(tǒng)計量的獨立分量,因此其對非高斯過程可實現(xiàn)有效的監(jiān)測。綜上所述,KEICA 兼顧了數(shù)據(jù)高階信息的捕捉和數(shù)據(jù)獨立性,因此可以對同時具有高斯與非高斯特性的非線性過程進行有效的故障識別。

        圖4 故障11的仿真結果對比Fig.4 Comparison of simulation results of fault 11

        圖5是4種方法對故障17的仿真結果對比。由圖可以看出,KPCA、KECA 和KICA 3 種方法的檢測效果沒有太大的差距。由于KECA 方法改變了KPCA 選取核主成分的方式,其SPE 統(tǒng)計量的誤報率明顯降低。KECA 的CS 統(tǒng)計量檢測率高于KPCA和傳統(tǒng)的KECA,這是因為CS 統(tǒng)計量很好地利用了KECA 方法所選取的核主成分間的角度結構特性。KICA 的SPE 統(tǒng)計量的檢測效果好于KPCA 和傳統(tǒng)的KECA,這是因為KICA 方法處理樣本數(shù)據(jù)中的非高斯信息更具優(yōu)勢,但是KICA 根據(jù)特征值選取核主成分的方式,丟失了部分信息熵,因此檢測效果不如KECA 的CS 統(tǒng)計量。KEICA 方法的檢測率高于其他3 種方法,表現(xiàn)出了明顯的優(yōu)勢。這是因為KEICA 繼承了KICA 對樣本數(shù)據(jù)非高斯信息的捕捉能力,同時,KEICA 根據(jù)信息熵選取核主成分,兼顧了樣本數(shù)據(jù)中的高階信息,因此對故障樣本的檢測有了較大程度的提高。

        圖5 故障17的仿真結果對比Fig.5 Comparison of simulation results of fault 17

        表2 和表3 分別是4 種方法的FDR 與FAR 的對比。從表中可以看出,對TE 過程的9 種故障,KEICA 的SPE 統(tǒng)計量的FDR 均高于其他3 種方法,而I2統(tǒng)計量不僅FDR 比較高,而且FAR 比較低,這進一步說明了KEICA方法的優(yōu)越性。

        表2 TE過程中4種方法的故障檢測率對比Table 2 Comparison of FDRs for four algorithms in TE process

        表3 TE過程中4種方法的誤報率對比Table 3 Comparison of FARs for four algorithms in TE process

        3 結 論

        本文提出一種基于KEICA 的新型故障檢測方法,并將其應用于非線性數(shù)值例子和TE過程的故障檢測。該方法吸取之前KECA 方法在選取核主成分方式的優(yōu)點并將其用于改進KICA 方法,不僅充分捕捉過程的高階信息,還充分保持樣本數(shù)據(jù)的獨立性。監(jiān)測結果表明,KEICA 在故障檢測方面的應用效果優(yōu)于KPCA、KECA 和KICA 方法,具有較為可靠的故障檢測能力。

        未來的工作將集中在故障診斷部分,KEICA 對于樣本數(shù)據(jù)中各個變量的分離為診斷引起故障的具體變量提供了便利,因此進行故障診斷或探討該方法在其他工業(yè)過程中的應用也需要進一步研究。

        猜你喜歡
        高斯矩陣樣本
        小高斯的大發(fā)現(xiàn)
        用樣本估計總體復習點撥
        天才數(shù)學家——高斯
        推動醫(yī)改的“直銷樣本”
        隨機微分方程的樣本Lyapunov二次型估計
        初等行變換與初等列變換并用求逆矩陣
        村企共贏的樣本
        矩陣
        南都周刊(2015年4期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年3期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年1期)2015-09-10 07:22:44
        久久综合噜噜激激的五月天| 久久久久久久性潮| 日韩在线第二页| 全部免费国产潢色一级| 91尤物在线看| 久久精品国产亚洲av调教| 亚洲天堂精品一区入口| 狼人青草久久网伊人 | 日韩免费一区二区三区在线| 亚洲国产精品美女久久久| 国内自拍色第一页第二页| 九九热线有精品视频86| 精品五月天| 午夜亚洲精品视频网站| 一级一片内射视频网址| 不卡的高清av一区二区三区| 国产午夜鲁丝片av无码| 国产白丝在线| 熟女乱乱熟女乱乱亚洲| 久久久久久久久无码精品亚洲日韩| 人妻少妇久久中文字幕一区二区| 国产激情久久99久久| 亚洲精品高清av在线播放| 美利坚亚洲天堂日韩精品| 国产精品对白一区二区三区| 久久久久88色偷偷| 天堂aⅴ无码一区二区三区| 伊人精品无码AV一区二区三区| 久久亚洲春色中文字幕久久久综合| 久久亚洲中文字幕伊人久久大 | 国产福利小视频在线观看| 亚洲av成人一区二区三区色| 国产一区二区三区仙踪林| 免费观看18禁无遮挡真人网站| 亚洲av综合久久九九| 乱码一二区在线亚洲| 国产精品99久久精品女同| 国产精品沙发午睡系列| 天干天干啦夜天干天2017| 成人免费无码视频在线网站| 日本一曲二曲三曲在线|