丁書久 田佳
西安建筑科技大學(xué)建筑設(shè)備科學(xué)與工程學(xué)院
冷水機(jī)組發(fā)生故障時(shí)會(huì)造成大量能耗,將故障檢測(cè)與診斷(FDD)方法應(yīng)用到冷水機(jī)組領(lǐng)域,及時(shí)發(fā)現(xiàn)冷水機(jī)組故障并確定故障類型,具有重要意義。
貝葉斯網(wǎng)絡(luò)(BN)適合處理不確定性問(wèn)題,且具有強(qiáng)大的融合能力,在 FDD 領(lǐng)域廣泛應(yīng)用。趙陽(yáng)等人[1]開發(fā)了三層BN,通過(guò)專家調(diào)查和統(tǒng)計(jì)學(xué)確定參數(shù)。王亞蘭等人[2]將離散化算法融入BN,避免了依賴專家的主觀性,但會(huì)造成信息缺失。何所畏等人[3]提出了條件高斯網(wǎng)(CGN),實(shí)現(xiàn)了連續(xù)節(jié)點(diǎn)變量的概率推理。
CGN 方法需假設(shè)連續(xù)型節(jié)點(diǎn)服從高斯分布,導(dǎo)致方法普適性較差,F(xiàn) DD 準(zhǔn)確率也下降。針對(duì)以上方法的局限性,本文在 CGN 的結(jié)構(gòu)基礎(chǔ)上,融入 KDE 估計(jì)連續(xù)型節(jié)點(diǎn)的條件概率分布,在實(shí)現(xiàn)故障檢測(cè)診斷過(guò)程一體化的同時(shí),提高了 FDD 的準(zhǔn)確率。
貝葉斯網(wǎng)絡(luò)(BN)是基于貝葉斯公式的判別模型,由結(jié)構(gòu)和參數(shù)兩部分組成[4]。BN 的結(jié)構(gòu)是一個(gè)有向無(wú)環(huán)圖,包括節(jié)點(diǎn)和有向邊,其中節(jié)點(diǎn)代表隨機(jī)變量,節(jié)點(diǎn)之間的有向邊代表變量之間的依賴關(guān)系[5]。BN 的參數(shù)包括所有根節(jié)點(diǎn)在所有可能狀態(tài)下的先驗(yàn)概率和所有子節(jié)點(diǎn)在給定父節(jié)點(diǎn)狀態(tài)下的條件概率表[4]。在BN 中,節(jié)點(diǎn)的數(shù)學(xué)意義為變量各狀態(tài)的概率。有向邊的數(shù)學(xué)意義為給定父節(jié)點(diǎn)狀態(tài)下,子節(jié)點(diǎn)的條件概率。將BN 應(yīng)用到 FDD 中時(shí),已知各故障的先驗(yàn)概率和各類故障發(fā)生時(shí)各特征參數(shù)的條件概率后,通過(guò)貝葉斯公式可計(jì)算檢測(cè)到各特征參數(shù)時(shí),各故障發(fā)生的新概率,即后驗(yàn)概率。后驗(yàn)概率最大的故障可作為最后的判斷結(jié)果。
條件高斯網(wǎng)(CGN)是 BN 的一種特殊形式,可以實(shí)現(xiàn)檢測(cè)和診斷過(guò)程同時(shí)進(jìn)行。相比一般 BN 相比,CGN 最大特點(diǎn)為實(shí)現(xiàn)了連續(xù)型節(jié)點(diǎn)變量的概率推理。圖1 顯示了一個(gè)簡(jiǎn)單的CGN,其中,節(jié)點(diǎn)S(S1,S2,,Sk)為節(jié)點(diǎn)F的父節(jié)點(diǎn),S為離散型節(jié)點(diǎn),F(xiàn) 為連續(xù)型節(jié)點(diǎn),CGN 假設(shè)節(jié)點(diǎn)F服從高斯分布。CGN 規(guī)定對(duì)于一個(gè)高斯節(jié)點(diǎn) F,若其只有一個(gè)離散的父節(jié)點(diǎn)S,那么在給定S的任一種可能的取值Si(i=1,2,,k)時(shí),F(xiàn)的條件分布可用式(1)表示[5]:
圖1 一個(gè)簡(jiǎn)單的條件高斯網(wǎng)(CGN)
式中:μS i和ΣS i分布為總體Si的均值向量和協(xié)方差矩陣,其值可使用極大似然估計(jì)法對(duì)樣本數(shù)據(jù)參數(shù)估計(jì)獲得。
GGN 模型中存在一個(gè)假設(shè):連續(xù)型節(jié)點(diǎn)為高斯節(jié)點(diǎn),即在計(jì)算連續(xù)型節(jié)點(diǎn)的條件概率時(shí),假設(shè)該節(jié)點(diǎn)服從高斯分布。這使CGN 方法的普適性較差,一旦節(jié)點(diǎn)的真實(shí)分布與高斯分布的偏離度較大,就會(huì)嚴(yán)重影響診斷的準(zhǔn)確率。
本文針對(duì)連續(xù)型節(jié)點(diǎn),在 CGN 的結(jié)構(gòu)基礎(chǔ)上,將非參數(shù)核密度估計(jì)(KDE)方法融入到 CGN 模型中,KDE 是一種不對(duì)數(shù)據(jù)總體做任何假設(shè),完全從樣本數(shù)據(jù)本身出發(fā),估計(jì)數(shù)據(jù)總體概率密度函數(shù)的方法,定義如下:
對(duì)于單變量的情況,設(shè)X1,X2,……X n是一元總體X的樣本,在任意點(diǎn)x處的總體密度函數(shù)f(x)的核密度估計(jì)定義如下[6]。
式中:K()稱為核函數(shù),h稱為帶寬,n為樣本容量。
由以上定義可知,核函數(shù)和帶寬是估計(jì)核密度的兩個(gè)因素。在實(shí)際應(yīng)用中,若核函數(shù)選擇 Gaussian 核函數(shù)時(shí),最優(yōu)帶寬的計(jì)算用式(3)來(lái)計(jì)算,其中S為樣本標(biāo)準(zhǔn)差。
假設(shè)冷水機(jī)組有k類故障,用S1,S2,…,S k來(lái)表示,正常狀況用Normal 表示,特征參數(shù)有n個(gè)。構(gòu)建用于FDD 的改良 CGN(KDE-CGN)模型:第一步,構(gòu)建CGN 結(jié)構(gòu),如圖 2,C GN 共兩層,狀態(tài)層(State Layer)和特征層(Feature Layer),每一層分別有一個(gè)節(jié)點(diǎn),父節(jié)點(diǎn)為S節(jié)點(diǎn),為離散型節(jié)點(diǎn);子節(jié)點(diǎn)F節(jié)點(diǎn),為連續(xù)型節(jié)點(diǎn);有向邊由S節(jié)點(diǎn)指向F節(jié)點(diǎn)。S1,S2,…,S k和Normal 為S節(jié)點(diǎn)的k+1 個(gè)狀態(tài),F(xiàn)節(jié)點(diǎn)服從 n維分布。第二步,設(shè)置BN 參數(shù),如表 1,F(xiàn)節(jié)點(diǎn)的條件概率分布可通過(guò)KDE 方法對(duì)各類故障數(shù)據(jù)和正常數(shù)據(jù)非參數(shù)估計(jì)獲得。
表1 用于FDD 的KDE-CGN 模型參數(shù)
圖2 用于FDD 的KDE-CGN 模型
表1 中:Hn表示利用 KDE 方法非參數(shù)估計(jì)出的F節(jié)點(diǎn)的n維真實(shí)分布;其中X為S 節(jié)點(diǎn)狀態(tài)下F節(jié)點(diǎn)的樣本數(shù)據(jù);h和K(u)分布為Hn的帶寬和核函數(shù)。
基于改良條件高斯網(wǎng)(KDE-CGD)的 FDD 流程圖如圖3 所示。
圖3 基于KDE-CGN 模型的FDD 流程
本文所提出的研究方法采用 ASHEAE RP-1043的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行驗(yàn)證。實(shí)驗(yàn)對(duì)象是一臺(tái) 90 冷噸(約316 kW)的離心式冷水機(jī)組,制冷劑選用 R134a,冷水機(jī)組工作過(guò)程圖見(jiàn)圖4,壓焓圖見(jiàn)圖5。實(shí)驗(yàn)通過(guò)改變參數(shù)模擬了27 個(gè)運(yùn)行工況,并在27 個(gè)工況下采集冷水機(jī)組正常數(shù)據(jù)和故障數(shù)據(jù),其中,故障數(shù)據(jù)通過(guò)實(shí)驗(yàn)?zāi)M獲得,共模擬了7 類典型軟故障,且每類故障劃分為 4 個(gè)劣化等級(jí),從低到高依次為 SL1,S L2,S L3,SL4。7 類典型故障見(jiàn)表2。該實(shí)驗(yàn)通過(guò)傳感器測(cè)量以10 秒的間隔進(jìn)行數(shù)據(jù)采樣,共需要采集 29 組數(shù)據(jù)集,其中包括一組正常數(shù)據(jù)集和28 組故障數(shù)據(jù)集(7 類故障,每類故障分4 個(gè)劣化等級(jí))。每一組數(shù)據(jù)包含64 個(gè)特征參數(shù),每一個(gè)特征參數(shù)包含5191 個(gè)數(shù)據(jù)。
圖4 冷水機(jī)組系統(tǒng)的理想工作過(guò)程圖
圖5 冷水機(jī)組熱力循環(huán)壓焓圖
表2 7 類典型軟故障
本文首先選用移動(dòng)平均濾波器法對(duì)原始數(shù)據(jù)進(jìn)行平滑處理,然后選用 Glass 提出的計(jì)算幾何加權(quán)運(yùn)行平均值和幾何加權(quán)運(yùn)行方差的方法對(duì)平滑數(shù)據(jù)進(jìn)行穩(wěn)態(tài)篩選[7]。
基于成本和敏感度角度從 64 個(gè)特征中選出 8 個(gè)特征,8 個(gè)特征見(jiàn)表3。
表3 特征選擇后8 個(gè)特征
經(jīng)過(guò)數(shù)據(jù)預(yù)處理和特征選擇后,本文正常樣本和7 類故障的所有劣化等級(jí)樣本中共隨機(jī)選取 1800 個(gè)樣本,并劃分為1200 個(gè)樣本的訓(xùn)練集和600 個(gè)樣本的測(cè)試集。訓(xùn)練集的樣本數(shù)據(jù)用于確定 FDD 模型的參數(shù),測(cè)試集的樣本數(shù)據(jù)用于對(duì)模型的驗(yàn)證。
KDE-CGN 模型的結(jié)構(gòu)如圖2 所示,其中父節(jié)點(diǎn)S為離散型節(jié)點(diǎn),共有 8 個(gè)狀態(tài),分別為 Normal 和本文選取的 7 類典型軟故障。子節(jié)點(diǎn)F為連續(xù)型節(jié)點(diǎn),由于通過(guò)特征選擇選出了8 個(gè)特征,所以F節(jié)點(diǎn)服從 8維真實(shí)分布。
本文假設(shè)8 個(gè)狀態(tài)的先驗(yàn)概率初值相等且相加之和為1,均為0.125,詳細(xì)結(jié)果見(jiàn)表4。
表4 S 節(jié)點(diǎn)各狀態(tài)的先驗(yàn)概率
S節(jié)點(diǎn)各狀態(tài)下,F(xiàn)節(jié)點(diǎn)的條件概率分布可分布利用各自的 1200 個(gè)訓(xùn)練樣本通過(guò) KDE 方法進(jìn)行非參數(shù)估計(jì)獲得,其中 KDE 方法中的核函數(shù),本研究選用Gaussian 核函數(shù),KDE 方法中的帶寬,本研究通過(guò)式(3)計(jì)算。由于F節(jié)點(diǎn)服從8 維真實(shí)分布,可得F節(jié)點(diǎn)的8 維條件概率密度的核密度估計(jì)為:
式中:K()表示高斯核函數(shù);h1,h2,…,h8分別表示 8 個(gè)特征在S節(jié)點(diǎn)各狀態(tài)下的數(shù)據(jù)帶寬,具體數(shù)值見(jiàn)表5。
表5 8 個(gè)特征在S 節(jié)點(diǎn)各狀態(tài)下的數(shù)據(jù)帶寬
1)首先用未融合KDE 的CGN 模型分別對(duì)冷水機(jī)組8 個(gè)狀態(tài)下的600 個(gè)測(cè)試樣本進(jìn)行FDD 判定,結(jié)果見(jiàn)表6。
表6 未融合KDE 的CGN 模型FDD 結(jié)果矩陣
2)利用構(gòu)建好的 KDE-CGN 模型分別對(duì)冷水機(jī)組8 個(gè)狀態(tài)下的600 個(gè)測(cè)試樣本進(jìn)行FDD 判定,結(jié)果見(jiàn)表7。
表7 KDE-CGN 模型的FDD 結(jié)果矩陣
FDD 的精度評(píng)價(jià)指標(biāo)主要表現(xiàn) FDD 方法的檢測(cè)診斷準(zhǔn)確性,F(xiàn) AR 指正常狀態(tài)被誤判為故障狀態(tài)的概率。在 HVAC 領(lǐng)域,由于用戶對(duì)舒適度要求較高,相對(duì)而言,設(shè)備發(fā)生故障產(chǎn)生的危害沒(méi)那么嚴(yán)重,所以廠家和用戶對(duì)于 FAR 的容忍度較低,F(xiàn) AR 通常為在HVAC 系統(tǒng)FDD 過(guò)程中最優(yōu)先控制的精度指標(biāo)。因此本文選用FAR 作為驗(yàn)證FDD 結(jié)果的評(píng)價(jià)指標(biāo)。
由表6 和表 7 可計(jì)算 CGN 和 KDE-CGN 的 FAR分別為22.7%(136/600)和 5.3%(32/600)。由圖6 可看出,融入 KDE 后的 CGN 在 FDD 精度方面好于傳統(tǒng)CGN,此時(shí)FAR 可被大部分用戶所接受。
圖6 兩種方法的FAR 對(duì)比圖
本文提出了基于改良 CGN(KDE-CGN)的 FDD方法,并用ASHEAE RP-1043 實(shí)驗(yàn)數(shù)據(jù)對(duì)所提方法進(jìn)行驗(yàn)證,結(jié)論如下:
1)C GN 能夠用概率的形式解決不確定性問(wèn)題,適合作為 FDD 方法的判別模型,且 CGN 模型的結(jié)構(gòu)能夠?qū)崿F(xiàn)故障檢測(cè)診斷過(guò)程一體化。
2)用 KDE 方法估計(jì)CGN 模型中連續(xù)型節(jié)點(diǎn)的真實(shí)分布,代替?zhèn)鹘y(tǒng)CGN 中假設(shè)的高斯分布,增加了模型的普適性。與 CGN 相比,K DE-CGN 將 FAR 由22.7%降到了5.3%,提高了診斷性能。