徐廷喜,杜志敏,吳斌,黃小清,晉欣橋
(上海交通大學(xué)機(jī)械與動力工程學(xué)院,上海 200240)
據(jù)統(tǒng)計(jì),建筑能耗約占總能量消耗的20%~40%,50%以上的建筑能耗用于HVAC系統(tǒng)中[1]。變頻空調(diào)系統(tǒng)利用容量可變壓縮技術(shù),該系統(tǒng)在長時間使用后,由于制冷劑泄漏、機(jī)械性損壞或不適當(dāng)?shù)南到y(tǒng)保養(yǎng),導(dǎo)致系統(tǒng)效率大幅下降[2]。理想VRF系統(tǒng)應(yīng)具有故障檢測和診斷的能力。制冷劑充注故障是多種故障類型中最為常見的一種,直接影響制冷系統(tǒng)的效率[3-4]。
FDD方法可分為3種:定量模型研究方法、基于規(guī)則的研究方法和基于過程數(shù)據(jù)的數(shù)據(jù)挖掘方法[5]。本文診斷方法采用第3種,該方法與傳統(tǒng)故障檢測和診斷方法相比,具有靈活、可直接運(yùn)用、節(jié)省時間和提高效率的優(yōu)點(diǎn)。故障識別方法的理論和算法較為成熟,無故障數(shù)據(jù)通常可在建筑模型或一些數(shù)據(jù)庫中獲得。郭憲民等[6]和吳斌等[7]研究表明,基于過程數(shù)據(jù)的數(shù)據(jù)挖掘方法可以量化不同故障等級,將模型拓展到相似的系統(tǒng)中。
將機(jī)器學(xué)習(xí)模式識別方法應(yīng)用于HVAC的故障診斷的研究較少。在HVAC的FDD方法中,主成分分析(Principal Component Analysis,PCA)是主要的方法之一,PCA可以通過數(shù)據(jù)分析進(jìn)行故障識別,通過重建算法用于傳感器故障診斷[8-9]。近年來數(shù)據(jù)挖掘方法是故障診斷領(lǐng)域中的研究熱點(diǎn),神經(jīng)網(wǎng)絡(luò)[10-11]等方法均已用在空調(diào)系統(tǒng)的故障診斷中,該方法通過挖掘數(shù)據(jù)之間的固有關(guān)系來區(qū)分正常數(shù)據(jù)與故障數(shù)據(jù)。部分專家學(xué)者將支持向量機(jī)(Support Vector Machine,SVM)及支持向量數(shù)據(jù)描述(Support Vector Data Description,SVDD)算法引入制冷裝置故障診斷領(lǐng)域中[12-17],制冷裝置的FDD方法為多類劃分方法,診斷準(zhǔn)確率可達(dá)90%以上。多分類問題將未知類別的數(shù)據(jù)劃分到指定的類別中,但當(dāng)數(shù)據(jù)不屬于任何一個指定類別時,便會出現(xiàn)問題。多分類問題在所有故障類型均可獲得時有效,否則將失效。
故障檢測為單類劃分問題,將一類故障從所有數(shù)據(jù)診斷出來。無故障數(shù)據(jù)在制冷裝置無故障條件下獲得,簡單方便且成本低。本文故障條件下的診斷數(shù)據(jù)通過控制制冷劑充注量,模擬不同的制冷劑泄漏的故障等級獲得。單類劃分故障診斷模型是通過串聯(lián)多個單故障診斷模型得到,利用支持向量機(jī)等機(jī)器學(xué)習(xí)方法,每次從數(shù)據(jù)中診斷一類故障,按照故障等級依次診斷,直至對所有故障類別均作出判斷[18-21]。
本文以變頻空調(diào)系統(tǒng)作為研究對象,采用了PCA-SVDD的方法,分別構(gòu)建并研究了不同壓縮機(jī)轉(zhuǎn)速,不同制冷劑泄漏等級下的故障檢測與診斷的模型。介紹了PCA和SVDD算法的基本原理,說明了模型具體構(gòu)建過程并驗(yàn)證了該方法的準(zhǔn)確性。利用遺傳算法優(yōu)化模型超參數(shù)的求解過程,優(yōu)化后的診斷模型準(zhǔn)確率進(jìn)一步提高。本文還給出了該方法優(yōu)缺點(diǎn)分析以及該方法潛在的應(yīng)用價值。
圖1所示為變頻空調(diào)系統(tǒng)原理,對制冷劑泄漏故障進(jìn)行檢測和診斷。實(shí)驗(yàn)直接或間接獲得64個變量,制冷劑為R410A。共有3種實(shí)驗(yàn)工況,如表1所示。制冷劑充注量故障分為6個等級,分別為無故障數(shù)據(jù)、制冷劑泄漏10%、制冷劑泄漏15%、制冷劑泄漏20%、制冷劑泄漏30%和制冷劑泄漏40%。利用無故障數(shù)據(jù)訓(xùn)練SVDD無故障模型,無故障SVDD模型可以將數(shù)據(jù)分為無故障類和故障類。故障數(shù)據(jù)可以通過對具體的故障或故障等級數(shù)據(jù)進(jìn)行訓(xùn)練,以便分類確定具體故障類型或故障等級。
圖1 變頻空調(diào)系統(tǒng)原理
表1 實(shí)驗(yàn)工況
主成分分析(PCA)是一種常用的數(shù)據(jù)分析方法。PCA通過線性變換將原始數(shù)據(jù)變換為一組各維度線性無關(guān)的表示,可用于提取數(shù)據(jù)的主要特征分量,常用于高維數(shù)據(jù)的降維。使用 PCA獲取低維度的樣本特征還能夠加快機(jī)器學(xué)習(xí)的速度。
設(shè)訓(xùn)練樣本集X為:
文中取N=14,訓(xùn)練樣本集為14個特征變量數(shù)據(jù)集,分別為制冷量、輸入功率、COP、質(zhì)量流量、過冷度、過熱度、蒸發(fā)溫度、冷凝溫度、排氣溫度、膨脹閥開度、室外風(fēng)機(jī)轉(zhuǎn)速、室內(nèi)風(fēng)機(jī)轉(zhuǎn)速和冷凝器空氣側(cè)溫升。14個特征數(shù)據(jù)變量依據(jù)制冷系統(tǒng)故障診斷經(jīng)驗(yàn)規(guī)則選取,部分變量為直接測得(如溫度和轉(zhuǎn)速等),但制冷量及質(zhì)量流量根據(jù)質(zhì)量守恒公式和能量守恒計(jì)算得到。
該樣本集的平均向量為:
樣本集的協(xié)方差矩陣為:
求出協(xié)方差矩陣的特征向量和對應(yīng)的特征值,這些特征向量組成的矩陣U即變量的正交基底,信息集中在特征值大的特征向量中,即使丟棄特征值小的向量也不會影響初始變量質(zhì)量。將協(xié)方差矩陣的特征值按大到小排序:λ1≥λ2≥…≥λd≥λd+1≥…。
由大于λd的λ對應(yīng)的特征向量構(gòu)成主成分,模型中λd=0.1,特征向量主成分矩陣包含5個特征變量。主成分構(gòu)成的變換矩陣為:
式中:
u1——制冷量,kW;
u2——輸入功率,kW;
u3——COP;
u4——質(zhì)量流量,kg/min;
u5——過冷度,℃。
本文通過給定一個目標(biāo)xi∈Rd,i=1,2,3…N,SVDD的原理是在高維空間中尋找一個球心為aF,半徑為D的最小超球面[9],包裹盡可能多的目標(biāo)點(diǎn)。
式中:C為控制超球面的體積與誤差;ξi為一個松弛變量,允許訓(xùn)練的模型可以有一定的誤差。這是一個非線性的映射,可以把輸入變量映射到一個φ的高維特征空間F中,式(7)的對偶問題為式(9)。
式中,K(xi,xj)為一個核函數(shù),α為拉格朗日對偶變量。
核函數(shù)為高斯核:
選擇高斯核,是因?yàn)楦咚购税粋€自由參數(shù),更加趨近于邊界條件。目標(biāo)可以分為3類:1)如果αi=0,則目標(biāo)位于球面內(nèi);2)0<αi<C,目標(biāo)位于超球面邊界上;3)αi=C,在超球面外,而且有一定誤差余量。0<αi<C的目標(biāo)為支持向量點(diǎn),在邊界上的點(diǎn)為邊界支持向量,超球面的球心可用式(14)確定,半徑則利用球心與目標(biāo)之間的距離確定。對于檢測變量x,其輸出結(jié)果可以比較目標(biāo)點(diǎn)距離球心的距離與半徑大小,式(16)是SVDD的決策方程。
制冷裝置故障檢測的對象是無故障系統(tǒng)中異常的數(shù)據(jù),故障診斷的目的是如果數(shù)據(jù)被劃分到故障類別中,需要確定具體類別,如圖2所示。
A是目標(biāo)類,即某種故障數(shù)據(jù)點(diǎn),如果過程數(shù)據(jù)在圓內(nèi),故障可以被檢測和診斷,如果在圓外,故障不存在。文中需要指定C和γ兩個變量。C為控制超球面的體積和模型誤差的權(quán)重,γ為改變高斯核內(nèi)的寬度參數(shù),γ=1/2σ2,其中σ越小,邊界條件越嚴(yán)格。
在SVDD模型訓(xùn)練環(huán)節(jié)中,將數(shù)據(jù)分為無故障數(shù)據(jù)和故障數(shù)據(jù)。首先收集數(shù)據(jù),并進(jìn)行數(shù)據(jù)預(yù)處理,由于穩(wěn)態(tài)中3,000 r/min和5,000 r/min數(shù)據(jù)較多,因此僅對該兩種轉(zhuǎn)速進(jìn)行建模,轉(zhuǎn)速可根據(jù)實(shí)際樣本數(shù)據(jù)選擇,同樣適用于其他轉(zhuǎn)速。圖3所示為診斷邏輯圖。
3.1.1 數(shù)據(jù)預(yù)處理
考慮系統(tǒng)穩(wěn)定運(yùn)行的影響,訓(xùn)練數(shù)據(jù)為壓縮機(jī)轉(zhuǎn)速為3,000、5,000 r/min的工況數(shù)據(jù)。工況數(shù)據(jù)3,000 r/min實(shí)際轉(zhuǎn)速范圍為2,950~3,050 r/min,工況數(shù)據(jù)5,000 r/min實(shí)際轉(zhuǎn)速范圍為4,950~5,050 r/min。轉(zhuǎn)速取值可以適當(dāng)變動,在不同工況和轉(zhuǎn)速的分布量上取值。根據(jù)樣本非穩(wěn)態(tài)數(shù)據(jù),通過異常值過濾器和穩(wěn)態(tài)數(shù)據(jù)檢測器去除異常值。參與訓(xùn)練的變量可以通過分析常用物理變量變化趨勢進(jìn)行合理的選擇,這一步驟可嘗試多次。根據(jù)制冷系統(tǒng)原理初次選用變量14個,再對已選擇的變量進(jìn)行歸一化處理,預(yù)處理完成后,數(shù)據(jù)按4:1比例分為訓(xùn)練數(shù)據(jù)和檢測數(shù)據(jù)。
圖2 SVDD二維數(shù)據(jù)分類診斷圖
圖3 診斷邏輯圖
數(shù)據(jù)歸一化將有量綱的表達(dá)式,變換為無量綱的表達(dá)式。選定范圍為(-1,1),將數(shù)據(jù)進(jìn)行歸一化處理。文中采用的歸一化方法為:
3.1.2 特征選擇
數(shù)據(jù)預(yù)處理完成后,對14個特征變量利用PCA算法進(jìn)行降維處理,確定4個特征變量進(jìn)行分析。選定的特征變量為制冷量、輸入功率、質(zhì)量流量和過冷度。圖4所示為PCA模型特征變量權(quán)重分布。
圖4 PCA模型特征變量權(quán)重分布
3.1.3 模型參數(shù)設(shè)定
SVDD模型在訓(xùn)練之前,需要指定模型的可信度,即模型允許的錯誤診斷率。采用交叉驗(yàn)證可以優(yōu)化得到參數(shù)C和γ。文中模型采用5折交叉驗(yàn)證,訓(xùn)練數(shù)據(jù)和交叉測試數(shù)據(jù)精度要求在95%以上,否則模型將繼續(xù)尋優(yōu)。
3.1.4 模型驗(yàn)證
利用測試數(shù)據(jù)驗(yàn)證模型,表2所示為錯誤類別說明。當(dāng)某SVDD模型錯誤劃分該類型數(shù)據(jù)為異常點(diǎn)(一類錯誤),或錯誤劃分另類故障數(shù)據(jù)為該類型故障數(shù)據(jù)(二類錯誤)均認(rèn)為分類錯誤。對每個模型,當(dāng)用驗(yàn)證數(shù)據(jù)進(jìn)行驗(yàn)證時,一類錯誤概率應(yīng)小于5%;反之,模型需要調(diào)整兩個參數(shù)直至模型滿足該條件為止。訓(xùn)練好的模型應(yīng)可以有效區(qū)分?jǐn)?shù)據(jù)類別,二類錯誤的概率應(yīng)盡可能小,所有的模型都需要用其他類的樣本數(shù)據(jù)進(jìn)行驗(yàn)證。二類錯誤的概率一般小于40%可以接受。如果二類錯誤概率大于該閾值,SVDD模型則需要重新訓(xùn)練,這種情況下,一類錯誤概率可以適當(dāng)調(diào)整。
表2 錯誤類別說明
3.1.5 模型優(yōu)化
當(dāng)粗略確定較優(yōu)的參數(shù)后,利用遺傳算法在局部范圍內(nèi)進(jìn)一步尋優(yōu),進(jìn)而優(yōu)化模型。
不同故障類型對應(yīng)的模型測試或訓(xùn)練的組數(shù),每組數(shù)據(jù)包含4列,分別代表參與模型訓(xùn)練的4個變量,即制冷量、輸入功率、質(zhì)量流量和過冷度。
當(dāng)壓縮機(jī)轉(zhuǎn)速為3,000 r/min時,采用5折交叉驗(yàn)證,表3所示為不同故障類型的模型測試或訓(xùn)練組數(shù),表4所示為不同故障類型的模型預(yù)測結(jié)果。
表3 不同故障類型的模型測試或訓(xùn)練組數(shù)(3,000 r/min)
表4 不同故障類型的模型預(yù)測結(jié)果(3,000 r/min)
由表4可知,模型訓(xùn)練數(shù)據(jù)集以及交叉驗(yàn)證測試集的模型準(zhǔn)確率達(dá)到96%以上,在無故障數(shù)據(jù)測試集準(zhǔn)確率達(dá)到 85.06%,遠(yuǎn)高于制冷劑泄漏的 5種故障數(shù)據(jù),具有較高的故障檢測率,說明模型具有較高的可信度。
當(dāng)壓縮機(jī)轉(zhuǎn)速為5,000 r/min時,采用5折交叉驗(yàn)證,表5所示為不同故障類型的模型測試或訓(xùn)練組數(shù),表6所示為不同故障類型的模型預(yù)測結(jié)果。
由表6可知,模型訓(xùn)練數(shù)據(jù)集以及交叉驗(yàn)證測試集的模型精度均達(dá)到95%以上,在測試數(shù)據(jù)集中,無故障數(shù)據(jù)達(dá)到 75.39%,遠(yuǎn)高于制冷劑泄漏的 4種故障數(shù)據(jù),具有較高的故障檢測率,說明模型具有較高的可信度。
對比表4與表6可知,5,000 r/min模型訓(xùn)練數(shù)據(jù)達(dá)到1,800組,大約為3,000 r/min測試模型訓(xùn)練數(shù)據(jù)量的9倍,對故障數(shù)據(jù)的誤診率更低,制冷劑泄漏15%數(shù)據(jù)的61.29%準(zhǔn)確率提高至73.16%。
表5 不同故障類型的模型測試或訓(xùn)練組數(shù)(5,000 r/min)
表6 不同故障類型的模型預(yù)測結(jié)果(5,000 r/min)
由前文研究結(jié)果可知,準(zhǔn)確率提高的同時,無故障數(shù)據(jù)的測試精度卻降低了,經(jīng)數(shù)據(jù)分析,這是由于訓(xùn)練數(shù)據(jù)增多,為縮短模型訓(xùn)練時間,所取有限窮舉步長過大造成。這可以通過遺傳算法在小范圍進(jìn)一步尋優(yōu),獲取更好的參數(shù),以提高模型精度。
遺傳算法也稱基因進(jìn)化算法,或進(jìn)化算法,屬于啟發(fā)式搜索算法的一種[10]。文中遺傳算法的局部優(yōu)化范圍為0.9 表7 采用遺傳算法的模型預(yù)測結(jié)果(5,000 r/min) 在SVDD模型中,通過交叉驗(yàn)證,應(yīng)用遺傳算法優(yōu)化參數(shù)C和γ。完整的網(wǎng)格比較浪費(fèi)時間,建議首先用較大步長的網(wǎng)格。當(dāng)初步確定更好的優(yōu)化區(qū)域后,對區(qū)域進(jìn)行細(xì)化網(wǎng)格,在交叉驗(yàn)證過程中,建議計(jì)算兩個參數(shù)的分類比例,避免過度擬合。 參數(shù)C控制超球面體積和劃分錯誤模型之間的比重,C越小,超球面的半徑越大,參數(shù)r控制超球面的形狀,r越小,越接近邊界,在無故障模型中,進(jìn)行網(wǎng)格探索,C∈(2-10,2-1),r∈(2-10,210),運(yùn)用5步交叉驗(yàn)證,如圖5所示。 圖5 不同參數(shù)下模型精度分布 本文以變頻空調(diào)系統(tǒng)作為研究對象,采用了PCA-SVDD的方法,分別構(gòu)建并研究了不同壓縮機(jī)轉(zhuǎn)速及制冷劑泄漏不同等級下的故障檢測與診斷的模型,得到如下結(jié)論: 1)PCA-SVDD模型適用于變頻空調(diào)系統(tǒng)制冷劑泄漏故障的檢測和診斷,隨著故障等級的降低,模型的準(zhǔn)確率也會隨之降低,但小故障等級的模型準(zhǔn)確率仍然在60%以上; 2)訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量會影響模型準(zhǔn)確率,轉(zhuǎn)速為5,000 r/min模型訓(xùn)練數(shù)據(jù)達(dá)到1,800組,約為3,000 r/min測試模型訓(xùn)練數(shù)據(jù)量的9倍,對故障數(shù)據(jù)的準(zhǔn)確率更高,15%制冷劑泄漏數(shù)據(jù)的準(zhǔn)確率由61.29%提高為73.16%;因此豐富訓(xùn)練數(shù)據(jù)集可以提高模型準(zhǔn)確率; 3)遺傳算法可以優(yōu)化SVDD算法的參數(shù),加速模型收斂,提高模型準(zhǔn)確率。本文通過先網(wǎng)格搜索,然后局部使用遺傳算法優(yōu)化的方法改進(jìn)SVDD模型。模型改進(jìn)后,模型參數(shù)得到優(yōu)化,模型5,000 r/min轉(zhuǎn)速下無故障數(shù)據(jù)診斷率由 75.06%提高為93.43%,模型對其他類型故障水平的準(zhǔn)確率達(dá)到100%,模型的檢測能力大幅度提高。4 結(jié)論