楊皓琳 丁 強(qiáng) 江愛(ài)朋 戴炳坤
(杭州電子科技大學(xué)自動(dòng)化學(xué)院 浙江 杭州 310018)
能耗問(wèn)題是當(dāng)今社會(huì)的熱點(diǎn)問(wèn)題,隨著社會(huì)發(fā)展,我國(guó)建筑能耗逐年增加,其中空調(diào)系統(tǒng)能耗占建筑總能耗的40%~50%??照{(diào)系統(tǒng)中冷水機(jī)組是最主要的能耗設(shè)備,冷水機(jī)組其結(jié)構(gòu)復(fù)雜、內(nèi)部零件多、工作環(huán)境特殊,導(dǎo)致制冷系統(tǒng)容易出現(xiàn)各種故障,“帶障運(yùn)行”會(huì)使其性能下降,維護(hù)成本增加,人員舒適感降低,能耗大大增加,對(duì)冷水機(jī)組進(jìn)行故障診斷具有重要意義。
近年來(lái)在故障診斷領(lǐng)域,不少學(xué)者取得了卓越成就。Yin等[2]采用主元分析法(PCA)結(jié)合似然比檢驗(yàn)應(yīng)用于故障診斷系統(tǒng);Haddad等[3]采用線性判別分析(LDA)作為分類(lèi)方法,完成對(duì)電機(jī)的故障診斷;朱紅林等[4]將局部鄰域保留(LPP)結(jié)合非負(fù)矩陣分解(NMF)完成對(duì)化工過(guò)程的故障檢測(cè);徐瑩等[5]把獨(dú)立分量分析(ICA)和貝葉斯估計(jì)結(jié)合,提出一種基于獨(dú)立元的混合模型,并將該方法應(yīng)用于過(guò)程故障診斷。
上述方法均為線性的降維方法,在制冷領(lǐng)域,由于制冷工質(zhì)存在相變以及系統(tǒng)參數(shù)的非線性、高耦合、低內(nèi)聚、非高斯性使得系統(tǒng)更加復(fù)雜。線性降維方法面對(duì)這樣的復(fù)雜系統(tǒng)顯得無(wú)能為力,若繼續(xù)使用如上方法進(jìn)行線性降維,將會(huì)丟失大量的重要信息,影響診斷結(jié)果。針對(duì)這一問(wèn)題,Hinton等[6]提出可用于非線性降維分析的隨機(jī)鄰域嵌入(SNE)算法。SNE算法一經(jīng)提出便引起了國(guó)內(nèi)外眾多學(xué)者的關(guān)注,并將其應(yīng)用于人臉識(shí)別、指紋匹配、智慧建筑和遙感影像分析等領(lǐng)域[7-11],近年來(lái)也成功應(yīng)用于故障診斷領(lǐng)域[12]。
盡管SNE提供了很好的非線性降維方法,但存在不對(duì)稱(chēng)和擁擠問(wèn)題(crowding problem)。為解決此問(wèn)題,Laurens等[13]引入t分布,對(duì)SNE算法進(jìn)行了改進(jìn),提出t分布隨機(jī)鄰域嵌入(t-SNE)。t-SNE在計(jì)算條件概率時(shí),會(huì)計(jì)算數(shù)據(jù)樣本點(diǎn)間的歐氏距離。文獻(xiàn)[14]指出在高維空間中,歐氏距離并不可靠,因?yàn)樗鼈兛赡馨S多只產(chǎn)生噪聲數(shù)據(jù)的不相關(guān)維度。并且歐氏距離會(huì)賦予每個(gè)變量相同的權(quán)重,忽略了各個(gè)變量間的相關(guān)性,所以不能準(zhǔn)確地進(jìn)行距離度量。而馬氏距離的計(jì)算是建立在總體樣本的基礎(chǔ)上,它充分考慮了數(shù)據(jù)分布的統(tǒng)計(jì)特征,排除了變量之間相關(guān)性的干擾,能有效降低樣本間的混疊性,是一種衡量?jī)蓚€(gè)未知樣本集相似程度的有效方法。因此,本文引入馬氏距離度量方式對(duì) t-SNE 算法進(jìn)行改進(jìn),提出基于馬氏距離的t分布隨機(jī)鄰域嵌入(Mt-SNE)算法,利用Mt-SNE算法降維后的數(shù)據(jù)作為支持向量機(jī)的輸入向量,研究Mt-SNE算法的改進(jìn)效果。
t-SNE算法的核心為構(gòu)造高維空間的數(shù)據(jù)點(diǎn)X={x1,x2,…,xN}之間的相似度轉(zhuǎn)化為條件概率,高維空間中數(shù)據(jù)點(diǎn)的相似度由高斯聯(lián)合分布表示,構(gòu)造低維空間中數(shù)據(jù)點(diǎn)Y={y1,y2,…,yN}的相似度由t分布表示,使得這兩個(gè)概率分布之間盡可能地相似,從而實(shí)現(xiàn)降維效果。 t-SNE首先定義高維數(shù)據(jù)點(diǎn)xi和xj之間的條件概率分布pj/i:
(1)
式中:σi是以xi為中心點(diǎn)的高斯分布方差;‖xi-xj‖為高維數(shù)據(jù)點(diǎn)xi和xj之間的歐氏距離。
由于t-SNE解決了對(duì)稱(chēng)化問(wèn)題,所以任取i和j都有pij=pji,根據(jù)條件概率pj/i和pi/j計(jì)算聯(lián)合概率pij:
(2)
定義高維數(shù)據(jù)點(diǎn)xi和xj在低維空間中對(duì)應(yīng)的點(diǎn)yi和yj的聯(lián)合概率qij:
(3)
定義代價(jià)函數(shù)為Kullback-Leibler 散度:
(4)
為了獲得攜帶更多信息的低維數(shù)據(jù)Y={y1,y2,…,yN},通過(guò)梯度下降法迭代求得式(4)的最優(yōu)解。
Mt-SNE算法的具體步驟如下:
(5)
(6)
式中:s為樣本的協(xié)方差矩陣,其可逆條件為樣本的個(gè)數(shù)應(yīng)該要大于每個(gè)樣本自身的維度。
(7)
(8)
(9)
(10)
(6) 定義Mt-SNE算法的代價(jià)函數(shù):
(11)
(7) 對(duì)式(11)求偏導(dǎo)計(jì)算其梯度,并將求E(Y)最小值最為目標(biāo)函數(shù):
(12)
(8) 用梯度下降法進(jìn)行迭代尋優(yōu):
(13)
式中:y′(t)為高維數(shù)據(jù)點(diǎn)經(jīng)過(guò)映射后的低維矩陣;t為迭代次數(shù),取t為1 000;η為學(xué)習(xí)率,將η設(shè)置為500;α(t)是為了加快尋優(yōu)速度加入的動(dòng)量因子,取α(t)等于0.5。
Mt-SNE算法流程如圖1所示。
圖1 Mt-SNE算法流程
傳統(tǒng)的支持向量機(jī)(SVM)是由Vapnik提出的一種基于統(tǒng)計(jì)學(xué)習(xí)理論有導(dǎo)師學(xué)習(xí)的線性分類(lèi)器。SVM解決了線性二分類(lèi)問(wèn)題,核心思想為尋找一個(gè)超平面使得樣本間的間距最大,其基本原理文獻(xiàn)[15-17]作了詳細(xì)介紹,本文不再贅述。
為解決多分類(lèi)問(wèn)題,把SVM分為“一對(duì)一”或者“一對(duì)多”模型,本文采用“一對(duì)一”的模型。在處理非線性問(wèn)題時(shí),支持向量機(jī)引入了核函數(shù)替換了內(nèi)積。不同的核函數(shù)的選擇對(duì)分類(lèi)性能有重大影響,常見(jiàn)的核函數(shù)主要有線性核、多項(xiàng)式核、RBF徑向基核、拉普拉斯核、Sigmoid核。本文采用RBF徑向基核,并用網(wǎng)格搜索法對(duì)SVM的懲罰系數(shù)C和核參數(shù)gamma進(jìn)行尋優(yōu)。
本文采用ASHRAE 1043-RP提供的實(shí)驗(yàn)數(shù)據(jù)對(duì)故障診斷模型完成訓(xùn)練與測(cè)試。ASHRAE實(shí)驗(yàn)的研究對(duì)象是一臺(tái)制冷量為90冷噸(約316 kW)的冷水機(jī)組,其壓縮機(jī)為離心式,制冷工質(zhì)為R134a, 實(shí)驗(yàn)環(huán)境為22.2 ℃,共有4個(gè)換熱器均為殼管式換熱器,分別為冷卻水-冷凍水換熱器、冷卻水-自來(lái)水換熱器、蒸汽-熱水換熱器和冷凍水-熱水換熱器。
實(shí)驗(yàn)平臺(tái)通過(guò)改變相關(guān)變量能夠模擬 27 種典型工況,其中(TCI)冷凝器進(jìn)水溫度和(TCO)冷凝器出水溫度等 48個(gè)參數(shù)為傳感器測(cè)得,直接送到上位機(jī)。制冷量、過(guò)冷度等 16個(gè)參數(shù)通過(guò)計(jì)算簡(jiǎn)單獲得,共計(jì)64個(gè)參數(shù)。通過(guò)調(diào)節(jié)系統(tǒng)中的相關(guān)設(shè)備,實(shí)驗(yàn)平臺(tái)能夠模擬出7種典型故障,包括 4 種局部故障和3 種系統(tǒng)故障,如表1所示。每種故障設(shè)有4種故障程度,表2為7種故障4個(gè)故障程度的詳細(xì)指標(biāo),從總體看,最輕的故障程度約為10%,最嚴(yán)重的故障程度約為40%,分別命名為A、B、C和D故障程度依次升高。根據(jù)ASHRAE的數(shù)據(jù)庫(kù),對(duì)表1的每種故障程度的7種典型故障和正常狀態(tài)各取1 000個(gè)樣本,得到4組8 000個(gè)樣本用于模型的訓(xùn)練與測(cè)試。
表1 7種典型故障和正常狀態(tài)
表2 4種故障程度故障類(lèi)別
文獻(xiàn)[18]定義了如下指標(biāo)評(píng)價(jià)分類(lèi)結(jié)果。
準(zhǔn)確率(Accuracy):衡量所有樣本被分類(lèi)準(zhǔn)確的比例。
(14)
虛警率(FAR):正常狀態(tài)被分類(lèi)為故障狀態(tài)的比例。
(15)
誤報(bào)率(FPR):將某類(lèi)故障錯(cuò)分為其他故障的比例。
(16)
漏報(bào)率(FNR):故障狀態(tài)被分類(lèi)為正常狀態(tài)的比例。
(17)
式中:TP為被分類(lèi)為正樣本,事實(shí)是正樣本;FP為被分類(lèi)為正樣本,事實(shí)是負(fù)樣本;FN為被分類(lèi)為負(fù)樣本,事實(shí)是正樣本;TN為被分類(lèi)為負(fù)樣本,事實(shí)是負(fù)樣本;NFPR為將某類(lèi)故障分為其他故障的個(gè)數(shù)。
為了驗(yàn)證Mt-SNE算法對(duì)特征提取的有效性,分別設(shè)置3個(gè)對(duì)照組:(1) 主元分析法(PCA)+核參數(shù)為徑向基函數(shù)的支持向量機(jī)(SVM);(2) t分布隨機(jī)鄰域嵌入(t-SNE)+核參數(shù)為徑向基函數(shù)的支持向量機(jī)(SVM);(3) 基于馬氏距離改進(jìn)的t分布隨機(jī)鄰域嵌入(Mt-SNE)+核參數(shù)為徑向基函數(shù)的支持向量機(jī)(SVM),以下分別簡(jiǎn)稱(chēng)為M1、M2和M3。為了公平起見(jiàn),將PCA、t-SNE和Mt-SNE的降維維數(shù)統(tǒng)一設(shè)置為8,并統(tǒng)一將降維后8 000個(gè)樣本隨機(jī)取80%(共計(jì)6 400)用于訓(xùn)練,剩余20%(共計(jì)1 600)作為驗(yàn)證。其結(jié)果如圖2所示。
圖2 三種模型準(zhǔn)確率對(duì)比情況
可以看出,3種模型在故障程度D的情況下,都能顯示出優(yōu)異的性能(準(zhǔn)確率都在95%以上)。隨著故障程度的提升,準(zhǔn)確率不斷提高,這是由于故障程度越高,故障數(shù)據(jù)越偏離正常水平,樣本間的混疊越小,數(shù)據(jù)之間的差異越大,更能被分類(lèi)器識(shí)別。
M3模型對(duì)于各種故障程度其準(zhǔn)確率都優(yōu)于M1模型和M2模型。尤其對(duì)A故障程度而言,M3模型的準(zhǔn)確率比M1模型提高5.56百分點(diǎn),比M2模型高出6百分點(diǎn)。說(shuō)明針對(duì)程度較低的故障,Mt-SNE算法具有更高的故障靈敏度,能進(jìn)一步降低數(shù)據(jù)之間的耦合性,去除冗余信息,能使SVM獲得更優(yōu)質(zhì)的超平面,及時(shí)發(fā)現(xiàn)故障,減少損失。
表3為三種模型對(duì)不同故障程度診斷效果的評(píng)價(jià)指標(biāo)??梢钥闯鯩3模型除了B故障程度的虛警率低于M2模型0.24個(gè)百分點(diǎn),其原因?yàn)閷?個(gè)RefLeak故障和3個(gè)RefOver故障誤判為正常運(yùn)行狀態(tài)。而其他指標(biāo)不管在FAR、FPR和FNR上對(duì)比其他兩種模型都有大幅度降低。其中M3模型對(duì)于D故障程度的誤報(bào)率為0%,表明在D故障程度發(fā)生時(shí),可以完全信任M3模型對(duì)不同故障類(lèi)別的判斷。
表3 三種模型診斷效果評(píng)價(jià)指標(biāo)(%)
高程度的故障程度容易檢測(cè),而低程度的故障通常是首先發(fā)生并且難以檢測(cè)。因此提高低程度的故障的檢測(cè)能力,對(duì)于冷水機(jī)組運(yùn)行狀態(tài)監(jiān)測(cè)而言有重要意義。為了進(jìn)一步分析Mt-SNE算法的性能,后面只對(duì)故障程度最低的A類(lèi)故障程度做分析。圖3為三種模型對(duì)A故障程度各類(lèi)故障和正常運(yùn)行的診斷準(zhǔn)確率。其中:1-4為局部故障,5-7為系統(tǒng)故障,8為正常運(yùn)行狀態(tài)。
圖3 三種模型對(duì)A故障程度各類(lèi)故障的診斷準(zhǔn)確率
分析圖3可得,對(duì)于故障ExcsOil(類(lèi)別7)而言,M3模型的準(zhǔn)確率高達(dá)98.5%,比M1模型和M2模型分別高出13.3百分點(diǎn)、5.7百分點(diǎn)。M3模型診斷故障RefLeak(類(lèi)別5)的準(zhǔn)確率為97.9%,高出M1模型13.7百分點(diǎn),高出M2模型9百分點(diǎn)。對(duì)故障RefOver(類(lèi)別6),M1模型的檢測(cè)準(zhǔn)確率僅為81.3%,而M3模型高達(dá)97.4%。上述3種故障均屬于系統(tǒng)故障,由文獻(xiàn)[19-20]可知,系統(tǒng)故障涉及到整個(gè)制冷系統(tǒng),對(duì)系統(tǒng)的參數(shù)影響范圍大,數(shù)據(jù)之間的耦合系數(shù)更高,易與其他故障混淆,相對(duì)局部故障而言更難被檢測(cè)到。
表4為三種模型對(duì)故障程度A,訓(xùn)練集和測(cè)試集評(píng)判的總體性能指標(biāo)。由表4可知,M3模型測(cè)試集的FP、NFPR和FN都比其他兩個(gè)模型有明顯減少。其中M3模型的FP個(gè)數(shù)比M1模型減少10個(gè),比M2模型減少18個(gè),NFPR個(gè)數(shù)比M1模型減少48個(gè),比M2模型減少74個(gè),F(xiàn)N個(gè)數(shù)比M1模型減少39個(gè),比M2模型減少12個(gè)。M3模型訓(xùn)練集的FAR、FPR和FNR也大多優(yōu)于M1模型和M2模型。比較訓(xùn)練集和測(cè)試集的準(zhǔn)確率發(fā)現(xiàn),M3模型的準(zhǔn)確率差值僅為1.69百分點(diǎn),M1模型差值為2.56百分點(diǎn),M2模型的差值為7.51百分點(diǎn)。其原因?yàn)镻CA和t-SNE提取的特征混疊較為嚴(yán)重,造成SVM的過(guò)擬合,使其超平面過(guò)于復(fù)雜,泛化能力降低。綜合而言,Mt-SNE算法提取特征的效果優(yōu)于PCA和t-SNE,表現(xiàn)為故障識(shí)別準(zhǔn)確率更高,測(cè)試集FP、NFPR和FN更少。
表4 三種模型故障診斷總體性能
本文針對(duì)歐氏距離和馬氏距離在高維空間中對(duì)樣本度量的差異性,提出基于馬氏距離的t分布隨機(jī)鄰域嵌入算法(Mt-SNE)。本文使用改進(jìn)的t分布隨機(jī)鄰域嵌入(Mt-SNE)算法結(jié)合支持向量機(jī)對(duì)制冷系統(tǒng)7種典型故障,包括3種系統(tǒng)故障和4種局部故障進(jìn)行診斷。并對(duì)比了PCA+SVM、t-SNE+SVM模型的診斷效果,通過(guò)研究分析,得到的主要結(jié)論如下。
(1) 對(duì)Mt-SNE算法特征提取后的數(shù)據(jù)進(jìn)行分類(lèi),4個(gè)故障程度的整體準(zhǔn)確率均得到明顯提高,對(duì)故障程度A提升最為顯著。
(2) 尤其解決了系統(tǒng)故障檢測(cè)率偏低的局面,對(duì)比傳統(tǒng)的特征提取方法,其對(duì)系統(tǒng)故障的檢測(cè)率均有大幅度提升。
(3) Mt-SNE算法在降低樣本相關(guān)性的同時(shí),可以改善SVM的過(guò)擬合程度,提高了SVM的泛化能力。
綜上所述,基于馬氏距離改進(jìn)的t分布隨機(jī)鄰域嵌入(Mt-SNE)結(jié)合支持向量機(jī)(SVM)復(fù)合模型在冷水機(jī)組故障診斷中有良好的應(yīng)用前景。