丁書久 田佳
西安建筑科技大學(xué)建筑設(shè)備科學(xué)與工程學(xué)院
冷水機組發(fā)生故障時會造成大量能耗,將故障檢測與診斷(FDD)方法應(yīng)用到冷水機組領(lǐng)域,及時發(fā)現(xiàn)冷水機組故障并確定故障類型,具有重要意義。
貝葉斯網(wǎng)絡(luò)(BN)適合處理不確定性問題,且具有強大的融合能力,在 FDD 領(lǐng)域廣泛應(yīng)用。趙陽等人[1]開發(fā)了三層BN,通過專家調(diào)查和統(tǒng)計學(xué)確定參數(shù)。王亞蘭等人[2]將離散化算法融入BN,避免了依賴專家的主觀性,但會造成信息缺失。何所畏等人[3]提出了條件高斯網(wǎng)(CGN),實現(xiàn)了連續(xù)節(jié)點變量的概率推理。
CGN 方法需假設(shè)連續(xù)型節(jié)點服從高斯分布,導(dǎo)致方法普適性較差,F(xiàn) DD 準確率也下降。針對以上方法的局限性,本文在 CGN 的結(jié)構(gòu)基礎(chǔ)上,融入 KDE 估計連續(xù)型節(jié)點的條件概率分布,在實現(xiàn)故障檢測診斷過程一體化的同時,提高了 FDD 的準確率。
貝葉斯網(wǎng)絡(luò)(BN)是基于貝葉斯公式的判別模型,由結(jié)構(gòu)和參數(shù)兩部分組成[4]。BN 的結(jié)構(gòu)是一個有向無環(huán)圖,包括節(jié)點和有向邊,其中節(jié)點代表隨機變量,節(jié)點之間的有向邊代表變量之間的依賴關(guān)系[5]。BN 的參數(shù)包括所有根節(jié)點在所有可能狀態(tài)下的先驗概率和所有子節(jié)點在給定父節(jié)點狀態(tài)下的條件概率表[4]。在BN 中,節(jié)點的數(shù)學(xué)意義為變量各狀態(tài)的概率。有向邊的數(shù)學(xué)意義為給定父節(jié)點狀態(tài)下,子節(jié)點的條件概率。將BN 應(yīng)用到 FDD 中時,已知各故障的先驗概率和各類故障發(fā)生時各特征參數(shù)的條件概率后,通過貝葉斯公式可計算檢測到各特征參數(shù)時,各故障發(fā)生的新概率,即后驗概率。后驗概率最大的故障可作為最后的判斷結(jié)果。
條件高斯網(wǎng)(CGN)是 BN 的一種特殊形式,可以實現(xiàn)檢測和診斷過程同時進行。相比一般 BN 相比,CGN 最大特點為實現(xiàn)了連續(xù)型節(jié)點變量的概率推理。圖1 顯示了一個簡單的CGN,其中,節(jié)點S(S1,S2,,Sk)為節(jié)點F的父節(jié)點,S為離散型節(jié)點,F(xiàn) 為連續(xù)型節(jié)點,CGN 假設(shè)節(jié)點F服從高斯分布。CGN 規(guī)定對于一個高斯節(jié)點 F,若其只有一個離散的父節(jié)點S,那么在給定S的任一種可能的取值Si(i=1,2,,k)時,F(xiàn)的條件分布可用式(1)表示[5]:
圖1 一個簡單的條件高斯網(wǎng)(CGN)
式中:μS i和ΣS i分布為總體Si的均值向量和協(xié)方差矩陣,其值可使用極大似然估計法對樣本數(shù)據(jù)參數(shù)估計獲得。
GGN 模型中存在一個假設(shè):連續(xù)型節(jié)點為高斯節(jié)點,即在計算連續(xù)型節(jié)點的條件概率時,假設(shè)該節(jié)點服從高斯分布。這使CGN 方法的普適性較差,一旦節(jié)點的真實分布與高斯分布的偏離度較大,就會嚴重影響診斷的準確率。
本文針對連續(xù)型節(jié)點,在 CGN 的結(jié)構(gòu)基礎(chǔ)上,將非參數(shù)核密度估計(KDE)方法融入到 CGN 模型中,KDE 是一種不對數(shù)據(jù)總體做任何假設(shè),完全從樣本數(shù)據(jù)本身出發(fā),估計數(shù)據(jù)總體概率密度函數(shù)的方法,定義如下:
對于單變量的情況,設(shè)X1,X2,……X n是一元總體X的樣本,在任意點x處的總體密度函數(shù)f(x)的核密度估計定義如下[6]。
式中:K()稱為核函數(shù),h稱為帶寬,n為樣本容量。
由以上定義可知,核函數(shù)和帶寬是估計核密度的兩個因素。在實際應(yīng)用中,若核函數(shù)選擇 Gaussian 核函數(shù)時,最優(yōu)帶寬的計算用式(3)來計算,其中S為樣本標準差。
假設(shè)冷水機組有k類故障,用S1,S2,…,S k來表示,正常狀況用Normal 表示,特征參數(shù)有n個。構(gòu)建用于FDD 的改良 CGN(KDE-CGN)模型:第一步,構(gòu)建CGN 結(jié)構(gòu),如圖 2,C GN 共兩層,狀態(tài)層(State Layer)和特征層(Feature Layer),每一層分別有一個節(jié)點,父節(jié)點為S節(jié)點,為離散型節(jié)點;子節(jié)點F節(jié)點,為連續(xù)型節(jié)點;有向邊由S節(jié)點指向F節(jié)點。S1,S2,…,S k和Normal 為S節(jié)點的k+1 個狀態(tài),F(xiàn)節(jié)點服從 n維分布。第二步,設(shè)置BN 參數(shù),如表 1,F(xiàn)節(jié)點的條件概率分布可通過KDE 方法對各類故障數(shù)據(jù)和正常數(shù)據(jù)非參數(shù)估計獲得。
表1 用于FDD 的KDE-CGN 模型參數(shù)
圖2 用于FDD 的KDE-CGN 模型
表1 中:Hn表示利用 KDE 方法非參數(shù)估計出的F節(jié)點的n維真實分布;其中X為S 節(jié)點狀態(tài)下F節(jié)點的樣本數(shù)據(jù);h和K(u)分布為Hn的帶寬和核函數(shù)。
基于改良條件高斯網(wǎng)(KDE-CGD)的 FDD 流程圖如圖3 所示。
圖3 基于KDE-CGN 模型的FDD 流程
本文所提出的研究方法采用 ASHEAE RP-1043的實驗數(shù)據(jù)進行驗證。實驗對象是一臺 90 冷噸(約316 kW)的離心式冷水機組,制冷劑選用 R134a,冷水機組工作過程圖見圖4,壓焓圖見圖5。實驗通過改變參數(shù)模擬了27 個運行工況,并在27 個工況下采集冷水機組正常數(shù)據(jù)和故障數(shù)據(jù),其中,故障數(shù)據(jù)通過實驗?zāi)M獲得,共模擬了7 類典型軟故障,且每類故障劃分為 4 個劣化等級,從低到高依次為 SL1,S L2,S L3,SL4。7 類典型故障見表2。該實驗通過傳感器測量以10 秒的間隔進行數(shù)據(jù)采樣,共需要采集 29 組數(shù)據(jù)集,其中包括一組正常數(shù)據(jù)集和28 組故障數(shù)據(jù)集(7 類故障,每類故障分4 個劣化等級)。每一組數(shù)據(jù)包含64 個特征參數(shù),每一個特征參數(shù)包含5191 個數(shù)據(jù)。
圖4 冷水機組系統(tǒng)的理想工作過程圖
圖5 冷水機組熱力循環(huán)壓焓圖
表2 7 類典型軟故障
本文首先選用移動平均濾波器法對原始數(shù)據(jù)進行平滑處理,然后選用 Glass 提出的計算幾何加權(quán)運行平均值和幾何加權(quán)運行方差的方法對平滑數(shù)據(jù)進行穩(wěn)態(tài)篩選[7]。
基于成本和敏感度角度從 64 個特征中選出 8 個特征,8 個特征見表3。
表3 特征選擇后8 個特征
經(jīng)過數(shù)據(jù)預(yù)處理和特征選擇后,本文正常樣本和7 類故障的所有劣化等級樣本中共隨機選取 1800 個樣本,并劃分為1200 個樣本的訓(xùn)練集和600 個樣本的測試集。訓(xùn)練集的樣本數(shù)據(jù)用于確定 FDD 模型的參數(shù),測試集的樣本數(shù)據(jù)用于對模型的驗證。
KDE-CGN 模型的結(jié)構(gòu)如圖2 所示,其中父節(jié)點S為離散型節(jié)點,共有 8 個狀態(tài),分別為 Normal 和本文選取的 7 類典型軟故障。子節(jié)點F為連續(xù)型節(jié)點,由于通過特征選擇選出了8 個特征,所以F節(jié)點服從 8維真實分布。
本文假設(shè)8 個狀態(tài)的先驗概率初值相等且相加之和為1,均為0.125,詳細結(jié)果見表4。
表4 S 節(jié)點各狀態(tài)的先驗概率
S節(jié)點各狀態(tài)下,F(xiàn)節(jié)點的條件概率分布可分布利用各自的 1200 個訓(xùn)練樣本通過 KDE 方法進行非參數(shù)估計獲得,其中 KDE 方法中的核函數(shù),本研究選用Gaussian 核函數(shù),KDE 方法中的帶寬,本研究通過式(3)計算。由于F節(jié)點服從8 維真實分布,可得F節(jié)點的8 維條件概率密度的核密度估計為:
式中:K()表示高斯核函數(shù);h1,h2,…,h8分別表示 8 個特征在S節(jié)點各狀態(tài)下的數(shù)據(jù)帶寬,具體數(shù)值見表5。
表5 8 個特征在S 節(jié)點各狀態(tài)下的數(shù)據(jù)帶寬
1)首先用未融合KDE 的CGN 模型分別對冷水機組8 個狀態(tài)下的600 個測試樣本進行FDD 判定,結(jié)果見表6。
表6 未融合KDE 的CGN 模型FDD 結(jié)果矩陣
2)利用構(gòu)建好的 KDE-CGN 模型分別對冷水機組8 個狀態(tài)下的600 個測試樣本進行FDD 判定,結(jié)果見表7。
表7 KDE-CGN 模型的FDD 結(jié)果矩陣
FDD 的精度評價指標主要表現(xiàn) FDD 方法的檢測診斷準確性,F(xiàn) AR 指正常狀態(tài)被誤判為故障狀態(tài)的概率。在 HVAC 領(lǐng)域,由于用戶對舒適度要求較高,相對而言,設(shè)備發(fā)生故障產(chǎn)生的危害沒那么嚴重,所以廠家和用戶對于 FAR 的容忍度較低,F(xiàn) AR 通常為在HVAC 系統(tǒng)FDD 過程中最優(yōu)先控制的精度指標。因此本文選用FAR 作為驗證FDD 結(jié)果的評價指標。
由表6 和表 7 可計算 CGN 和 KDE-CGN 的 FAR分別為22.7%(136/600)和 5.3%(32/600)。由圖6 可看出,融入 KDE 后的 CGN 在 FDD 精度方面好于傳統(tǒng)CGN,此時FAR 可被大部分用戶所接受。
圖6 兩種方法的FAR 對比圖
本文提出了基于改良 CGN(KDE-CGN)的 FDD方法,并用ASHEAE RP-1043 實驗數(shù)據(jù)對所提方法進行驗證,結(jié)論如下:
1)C GN 能夠用概率的形式解決不確定性問題,適合作為 FDD 方法的判別模型,且 CGN 模型的結(jié)構(gòu)能夠?qū)崿F(xiàn)故障檢測診斷過程一體化。
2)用 KDE 方法估計CGN 模型中連續(xù)型節(jié)點的真實分布,代替?zhèn)鹘y(tǒng)CGN 中假設(shè)的高斯分布,增加了模型的普適性。與 CGN 相比,K DE-CGN 將 FAR 由22.7%降到了5.3%,提高了診斷性能。