亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于RFECV-隨機(jī)森林特征選擇的地鐵空調(diào)制冷劑充注量故障診斷

        2023-01-04 03:26:18陳煥新程亨達(dá)張鑒心陳璐瑤
        鐵道車輛 2022年6期
        關(guān)鍵詞:故障診斷特征故障

        張 麗,鮑 超,王 釗,陳煥新,程亨達(dá),張鑒心,陳璐瑤

        (1. 華中科技大學(xué)能源與動力工程學(xué)院,湖北 武漢 430074;2. 廣州地鐵集團(tuán)有限公司,廣東 廣州 510330; 3. 廣州鼎漢軌道交通車輛裝備有限公司,廣東 廣州 510260)

        地鐵車輛已成為大中型城市出行方式中重要的一部分,地鐵車輛車廂內(nèi)的空氣環(huán)境、舒適性和能源消耗等問題正被得到更多的關(guān)注。2020年城軌交通總的電能耗為172.4億kW·h[1],其中地鐵車輛能耗占比達(dá)70%[2-3],而在地鐵車輛的整車能耗中,空調(diào)能耗占比達(dá)25%~40%,僅次于牽引系統(tǒng)能耗[4]。地鐵車輛在運(yùn)行過程中處于封閉狀態(tài),一旦空調(diào)系統(tǒng)出現(xiàn)故障,將會造成大量能源的浪費(fèi)并使乘客處于不舒適的環(huán)境溫度中,因此提高空調(diào)運(yùn)行過程中的運(yùn)維效率、保證空調(diào)正常高效運(yùn)作至關(guān)重要。

        針對上述情況,近年來已有眾多研究將機(jī)器學(xué)習(xí)作為數(shù)據(jù)挖掘工具應(yīng)用于地鐵空調(diào)智能運(yùn)維領(lǐng)域,同時將數(shù)據(jù)驅(qū)動方法用于各式交通工具空調(diào)故障診斷,而關(guān)于地鐵車輛空調(diào)系統(tǒng)的故障診斷智能化研究相對較少。參考文獻(xiàn)[5]設(shè)計了地鐵站空調(diào)在線運(yùn)維與診斷系統(tǒng),并在廣州一地鐵站進(jìn)行了應(yīng)用,通過對空調(diào)環(huán)控系統(tǒng)、冷水機(jī)組等各系統(tǒng)的實時檢測與診斷,有效提升了運(yùn)維人員工作效率;參考文獻(xiàn)[6]以濟(jì)南地鐵空調(diào)智能運(yùn)維系統(tǒng)為例,搭建了包含數(shù)據(jù)層、分析層、應(yīng)用層及展示層4部分的智慧運(yùn)維平臺,有效縮短了空調(diào)設(shè)備全壽命周期中的維修時間;參考文獻(xiàn)[7]提出了將神經(jīng)網(wǎng)絡(luò)多傳感器信息融合技術(shù)應(yīng)用于地鐵中央空調(diào)風(fēng)機(jī)故障診斷的方法,利用多傳感器監(jiān)測風(fēng)機(jī)的運(yùn)行狀態(tài),判斷結(jié)果比單信息源更精確、更完全;參考文獻(xiàn)[8]基于SVM與改進(jìn)的AHP-DS證據(jù)融合對船舶空調(diào)系統(tǒng)進(jìn)行了故障診斷,引入了差異性、沖突性和不確定性3個證據(jù)沖突衡量標(biāo)準(zhǔn),診斷準(zhǔn)確率達(dá)到了98.33%;參考文獻(xiàn)[9]提出了在列車運(yùn)行過程中判斷空調(diào)機(jī)組制冷系統(tǒng)是否存在制冷劑泄漏的預(yù)診斷方案,通過橫向?qū)Ρ日谶\(yùn)行的其他車廂空調(diào)機(jī)組制冷系統(tǒng)的參數(shù)進(jìn)行診斷和預(yù)判;參考文獻(xiàn)[10]以CRH380B、CRH380BL型動車組為研究對象,建立了動車組客室空調(diào)制冷系統(tǒng)診斷模型和規(guī)則,提出了一種新的適用于檢修現(xiàn)場的動車組客室空調(diào)制冷系統(tǒng)故障診斷方法,對空調(diào)制冷系統(tǒng)故障發(fā)現(xiàn)率達(dá)60.87%。

        地鐵空調(diào)系統(tǒng)的運(yùn)行環(huán)境復(fù)雜,這給傳統(tǒng)的空調(diào)運(yùn)維方式造成了壓力[11]。近年來,機(jī)器學(xué)習(xí)已普遍應(yīng)用于分析處理數(shù)據(jù)中心或運(yùn)行監(jiān)控系統(tǒng)的各類數(shù)據(jù),在家用或商用空調(diào)的智能運(yùn)維領(lǐng)域也展開了大量工作,這給了地鐵空調(diào)運(yùn)維領(lǐng)域啟發(fā)。在地鐵車輛空調(diào)故障中,制冷劑充注量故障發(fā)生頻繁卻難以察覺,由于輕度或中度的制冷劑過充或欠充不能引起故障報警,但能導(dǎo)致地鐵在運(yùn)行過程中長期偏離正常工況,造成地鐵車輛空調(diào)系統(tǒng)制冷/制熱效率顯著下降、壓縮機(jī)內(nèi)部溫度升高、機(jī)械部件磨損等一系列問題。由于地鐵運(yùn)行狀態(tài)實時監(jiān)控數(shù)據(jù)量中特征變量多為冗余或不相關(guān),難以精準(zhǔn)體現(xiàn)空調(diào)系統(tǒng)制冷劑充注量故障信息,因此,本文針對地鐵運(yùn)維過程中制冷劑充注量故障診斷問題進(jìn)行機(jī)器學(xué)習(xí),采用基于交叉驗證的特征消除方法進(jìn)行特征選擇,選出較優(yōu)特征子集,通過隨機(jī)森林特種重要性度量進(jìn)一步降維得到最優(yōu)特征子集,并用最優(yōu)特征子集分別建立基于支持向量機(jī)(Support Vector Machine,SVM)、K-最近鄰算法(K-Nearest Neighbor,KNN)和反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)的地鐵空調(diào)制冷劑充注量故障診斷模型,驗證最優(yōu)特征子集的診斷準(zhǔn)確率。

        1 故障診斷模型

        1.1 建立模型

        由于增加了交叉驗證過程,基于交叉驗證的遞歸特征消除(Recursive Feature Elimination and Cross Validation,RFECV)法具有自動選擇其認(rèn)為最佳特征子集的數(shù)目的能力,其所選特征子集的診斷準(zhǔn)確率已被廣泛驗證。參考文獻(xiàn)[12]比較了RFECV法、基于最大互信息系數(shù)法和基于最大相關(guān)最小冗余法3種特征篩選算法,認(rèn)為RFECV法篩選得到的特征子集分類準(zhǔn)確率比另外2種方法更高,在選取15維特征情況下的最優(yōu)準(zhǔn)確率為98.28%;參考文獻(xiàn)[13]結(jié)合距離相關(guān)法(DC法)和RFECV法進(jìn)行混合特征選擇,融合了DC法的高效率和RFECV法的高精度特點,在減少計算時間的同時有效提高模型性能。

        在建立故障診斷模型過程中,從加強(qiáng)學(xué)習(xí)特征算法的角度優(yōu)化特征選擇過程。為保證特征子集的充分降維,本文在采用RFECV法的基礎(chǔ)上增加了隨機(jī)森林特征重要性度量過程。隨機(jī)森林(Random Forest,RF)算法是當(dāng)前最好的算法之一[14],因為RF算法不僅可以在分類或回歸問題中表現(xiàn)良好,而且還可以用于特征降維,穩(wěn)健性很強(qiáng),因此本文采用隨機(jī)森林算法進(jìn)一步對采用RFECV法選出的特征子集進(jìn)行重要性度量,在確保不丟失重要特征的基礎(chǔ)上得到更為精簡的最優(yōu)特征子集。同時,分別基于SVM、KNN、BPNN建立故障診斷模型,用以驗證篩選得到的最優(yōu)特征子集的故障診斷效果。圖1 為基于RFECV-隨機(jī)森林特征重要性度量建立故障診斷模型的流程圖。

        圖1 基于RFECV-隨機(jī)森林特征重要性度量建立故障診斷模型的流程圖

        1.2 數(shù)據(jù)采集

        在廣州某地鐵空調(diào)焓差試驗室中對地鐵車輛空調(diào)系統(tǒng)進(jìn)行不同制冷工況、不同制冷劑充注量的故障試驗,并進(jìn)行原始數(shù)據(jù)采集。焓差試驗室的地鐵車輛空調(diào)制冷故障試驗系統(tǒng)原理如圖2所示。

        圖2 地鐵車輛空調(diào)制冷故障試驗系統(tǒng)原理圖

        地鐵車輛空調(diào)制冷故障試驗的制冷工況有2種:

        (1) 室內(nèi)溫度30.7 ℃,室外溫度38 ℃;

        (2) 室內(nèi)溫度28.1 ℃,室外溫度35 ℃。

        試驗系統(tǒng)的額定制冷劑充注量為4.5 kg。試驗記錄了在2種制冷工況、4種制冷劑充注量水平(表1)下5臺室內(nèi)機(jī)工作的試驗運(yùn)行數(shù)據(jù),采集了圖2所示2套制冷循環(huán)系統(tǒng)的運(yùn)行數(shù)據(jù)共82 435條。

        表1 制冷工況和制冷劑充注量水平

        2 最優(yōu)特征子集選擇

        地鐵車輛空調(diào)制冷劑充注量故障試驗中采集的空調(diào)原始運(yùn)行數(shù)據(jù)集中共包含40個特征變量(表2),由于試驗系統(tǒng)有2套制冷循環(huán)系統(tǒng),各有1套蒸發(fā)器和冷凝器,因此表2中序號1~3、16~24的特征變量均有1、2之分;2套系統(tǒng)新風(fēng)均取自焓差試驗室外,因此新風(fēng)溫度相同。在采用機(jī)器學(xué)習(xí)方法進(jìn)行故障診斷的過程中,由于冗余特征和無關(guān)特征的存在增加了機(jī)器學(xué)習(xí)過程的復(fù)雜程度,并且還會在一定程度上降低后續(xù)建立模型的診斷準(zhǔn)確率,因此需要在數(shù)據(jù)處理階段進(jìn)行特征選擇,找出所有特征變量中不同故障出現(xiàn)時有顯著區(qū)分的變量,即最優(yōu)特征子集,在保證診斷準(zhǔn)確率的情況下達(dá)到降低數(shù)據(jù)集維數(shù)、減輕機(jī)器學(xué)習(xí)復(fù)雜程度的效果。

        表2 40個特征變量及中文釋義

        特征選擇方法主要分為過濾式、包裹式和嵌入式3種[15]。過濾式通過選擇某個統(tǒng)計指標(biāo)對各特征進(jìn)行評分,設(shè)定閾值去除掉所選特征中評分低的特征,如卡方檢驗和互信息法;包裹式與學(xué)習(xí)算法相結(jié)合,利用分類器的準(zhǔn)確率對特征子集進(jìn)行評價,從而得到最優(yōu)特征子集,如遞歸消除(RFE)法;嵌入式是將特征選擇的過程和后續(xù)訓(xùn)練模型過程融合在一起,與過濾式不同的是通過訓(xùn)練來評價特征的重要性,如L1正則化、基于樹的特征選擇。本文首先采用RFECV法得到較優(yōu)特征子集,然后采用隨機(jī)森林特征重要性度量進(jìn)一步削減特征維度,得到最優(yōu)特征子集。

        2.1 RFECV特征選擇

        RFE法是一種包裹式特征選擇的方法,首先指定一個基模型,每次通過獲得每個特征的重要程度進(jìn)行不重要特征的移除,不斷遞歸直至最終達(dá)到所規(guī)定的特征數(shù)量。本文特征選擇選取了RFECV法,RFECV法在RFE法基礎(chǔ)上結(jié)合了交叉驗證自動尋找最優(yōu)特征數(shù)量,如果特征的移除會造成性能損失則不再移除,自行選擇其認(rèn)為效果最優(yōu)數(shù)目的特征子集。

        RFECV法包括4個步驟:(1)以原始特征數(shù)據(jù)集訓(xùn)練一個基模型(以隨機(jī)森林為例);(2)計算特征的重要性得分;(3)交叉驗證移除某特征變量后的特征子集;(4)重復(fù)步驟(1)~(3),最終自行決定合適數(shù)目的特征變量。圖3為應(yīng)用RFECV法得到的分類正確率隨所選特征變量數(shù)的變化圖。由圖3可知,當(dāng)特征變量數(shù)為18個時,分類正確率最高,為99.995%。因此第一步驟特征選擇選出的較優(yōu)特征子集包含18個特征變量,分別為:TCdo1、Tevo1、Pds、Pso、Pe、Tco1、Tci1、Tci2、Tco2、S1_Pl2、S1_Ph1、S1_Ph2、Cload、S1_Pl1、Cloff、p_surp、Vos、Ves。

        圖3 分類正確率隨所選特征變量數(shù)的變化圖

        2.2 隨機(jī)森林特征重要性度量

        由圖3可知,特征變量數(shù)小于18個時仍可得到較高的正確分類率,因此本文采用了隨機(jī)森林算法特征重要性排序方法,進(jìn)一步進(jìn)行特征降維,通過平均不純度減少指標(biāo)(Mean Decrease Impurity,MDI)來評估特征變量重要性。在特征降維過程中,隨機(jī)森林算法利用自帶的重要測度指標(biāo)——基于基尼指數(shù)(Gini指數(shù))的MDI指標(biāo)對特征變量進(jìn)行重要性排序,通過Gini指數(shù)來反映每個特征在隨機(jī)森林每棵樹上所作貢獻(xiàn)的大小,取平均值后進(jìn)行比較,該指標(biāo)的值越大說明該特征變量在分類過程中作用越強(qiáng),即越能高效地進(jìn)行故障診斷。式(1)為Gini指數(shù)的計算方法[16]。

        (1)

        式中:K——樣本類別總數(shù);

        pk——類別k的樣本權(quán)重。

        計算結(jié)果如圖4所示,由圖4可知,各特征重要性得分均在0.01以上,重要性明顯較高的得分均在0.04以上,因此分別選取0.02、0.03、0.04作為閾值得到對應(yīng)特征子集。本文采用基于決策樹的診斷模型綜合比較3個特征子集,結(jié)果顯示,3個模型的誤判樣本數(shù)分別為1個、0個和9個,因此將閾值選為0.03能夠兼顧準(zhǔn)確性和簡便性。取特征重要性得分大于0.03的8個特征變量組成最優(yōu)特征子集,按照重要性排序的最優(yōu)特征子集有:Tci1、Tco1、Pe、S1_Ph1、S1_Pl1、S1_Pl2、Tco2、S1_Ph2。

        圖4 隨機(jī)森林特征重要性排序圖

        3 故障診斷結(jié)果對比分析

        取所有最優(yōu)特征子集對應(yīng)的低維數(shù)據(jù)集建立故障診斷模型進(jìn)行故障診斷準(zhǔn)確率驗證,按照7∶3的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。本文選取了SVM、KNN和BPNN 3種機(jī)器學(xué)習(xí)算法訓(xùn)練地鐵空調(diào)制冷劑充注量故障診斷模型,并對最優(yōu)特征子集在各模型中的故障診斷結(jié)果進(jìn)行對比分析。

        3.1 基于SVM算法的診斷結(jié)果

        SVM算法是適合小樣本決策的分類方法之一[17]。當(dāng)故障診斷中獲得相應(yīng)的故障數(shù)據(jù)較困難或得到數(shù)據(jù)量較少時,可采用SVM算法進(jìn)行故障診斷,而其他方法很難得到精確的結(jié)果。SVM算法的原理是:嘗試尋找最優(yōu)決策超平面,這一超平面到兩類別中距離最近的樣本的距離之和最遠(yuǎn),其中距離超平面最近的幾個訓(xùn)練樣本點便是支持向量。SVM算法本身既用于處理二分類問題,也可處理多分類問題,此外在模式識別、統(tǒng)計分類等領(lǐng)域同樣發(fā)展迅速,在解決小樣本、非線性和高維模式識別問題時具有良好的性能[18]。

        采用低維數(shù)據(jù)訓(xùn)練集建立SVM診斷模型后,將低維數(shù)據(jù)測試集輸入模型中,完成診斷過程并進(jìn)行效果評估。圖5為SVM診斷模型用于測試集得到的混淆矩陣結(jié)果,根據(jù)圖5顯示數(shù)據(jù)計算,該診斷模型對L1~L4制冷劑充注量故障等級的診斷精確率分別為:99.26%、99.95%、100.00%、100.00%,總準(zhǔn)確率為99.83%。診斷錯誤的部分主要集中在L1等級,即在地鐵空調(diào)制冷劑過充110%時,但仍保證了98%以上的診斷準(zhǔn)確率。對于另外的L2、L3、L4故障等級的診斷基本完全正確,說明最優(yōu)特征子集對應(yīng)的低維數(shù)據(jù)集應(yīng)用于訓(xùn)練SVM診斷模型的效果良好。

        圖5 SVM診斷模型用于測試集的混淆矩陣結(jié)果

        3.2 基于KNN算法的診斷結(jié)果

        KNN算法是一個理論上比較成熟且簡單的分類算法之一,該算法認(rèn)為,在特征空間中,如果一個樣本附近的k個依據(jù)距離函數(shù)計算得到的待測樣本到已知樣本距離最近樣本的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別[19]。為保證對3種診斷模型進(jìn)行對比分析時對其他影響因素的控制,對數(shù)據(jù)集采取相同的標(biāo)準(zhǔn)化預(yù)處理得到無量綱化的數(shù)據(jù),算法中k值采用默認(rèn)值進(jìn)行分類。圖6為KNN診斷模型用于測試集得到的混淆矩陣結(jié)果,根據(jù)圖6中顯示數(shù)據(jù)計算,SVM診斷模型對L1~L4制冷劑充注量等級的診斷精確率分別為:99.96%、99.97%、100.00%、100.00%,診斷總準(zhǔn)確率為99.98%。相比SVM診斷模型, KNN診斷模型對于L1等級制冷劑充注量故障的診斷效果明顯改善,都達(dá)到了較高的診斷準(zhǔn)確率,驗證了基于RFECV-隨機(jī)森林特征重要性度量的特征選擇后得到的低維數(shù)據(jù)集用于訓(xùn)練地鐵空調(diào)制冷劑充注量故障診斷模型的高效性。

        圖6 KNN診斷模型用于測試集的混淆矩陣結(jié)果

        3.3 基于BPNN算法的診斷結(jié)果

        神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)方法中研究的一種重要方法,該方法通過模擬人腦的神經(jīng)網(wǎng)絡(luò)來實現(xiàn)類人工智能,實現(xiàn)過程中“神經(jīng)元”的連接依靠的是賦予的權(quán)重值。BPNN是神經(jīng)網(wǎng)絡(luò)的一種,在處理如空調(diào)系統(tǒng)故障診斷這一類非線性問題時效果良好。BPNN的權(quán)重值根據(jù)反向傳播的預(yù)測誤差計算得到,輸入的信號向前傳遞,當(dāng)輸出層未能輸出理想結(jié)果時,將會反向傳播預(yù)測誤差,重新計算得到權(quán)重和閾值,信號再重新傳至輸出層,循環(huán)往復(fù)直至輸出結(jié)果為理想結(jié)果或十分接近理想結(jié)果[20]。圖7為BPNN診斷模型在測試集上進(jìn)行故障診斷得到的混淆矩陣結(jié)果,根據(jù)圖7顯示數(shù)據(jù)計算,BPNN模型對L1~L4制冷劑充注量等級下的故障診斷精確率分別為:99.86%、99.98%、99.98%、100.00%,診斷總準(zhǔn)確率為99.96%??梢姡珺PNN診斷模型對4個故障等級的診斷準(zhǔn)確率都很高,沒有出現(xiàn)對某一故障等級明顯的診斷能力不足的情況,實現(xiàn)了在簡化模型訓(xùn)練復(fù)雜程度的基礎(chǔ)上保證模型診斷性能的目標(biāo)。

        圖7 BPNN診斷模型用于測試集的混淆矩陣結(jié)果

        4 結(jié)束語

        本文提出了一種基于RFECV-隨機(jī)森林特征重要性度量的特征選擇方法,并驗證了最優(yōu)子集的故障診斷效果。結(jié)合RFECV和隨機(jī)森林特征重要性度量的特征選擇方法可以高效降低變量維度,通過該方法將地鐵車廂空調(diào)焓差試驗室所得制冷劑充注量故障數(shù)據(jù)中包含的40個特征變量篩選至8個特征變量并組成最優(yōu)特征子集。將最優(yōu)子集分別用于訓(xùn)練基于SVM、KNN、BPNN算法的3個故障診斷模型,結(jié)果顯示:各診斷模型在診斷測試集上的診斷總準(zhǔn)確率分別為99.83%、99.98%、99.96%,各等級精確率均在98%以上,表現(xiàn)良好;基于SVM算法的診斷模型對制冷劑過充110%等級的故障診斷能力略低于其他2種模型,相比之下3種模型對于制冷劑欠充時的各等級故障診斷更為精準(zhǔn)。

        本文已對所選最優(yōu)特征子集在地鐵車廂空調(diào)制冷劑充注量故障試驗數(shù)據(jù)中進(jìn)行了性能驗證,但由于當(dāng)前實車運(yùn)行條件限制,在實車中難以開展制冷劑充注量故障試驗,故障試驗僅在焓差試驗室內(nèi)進(jìn)行,因此有待進(jìn)一步開展實測數(shù)據(jù)的采集驗證等后續(xù)研究。

        猜你喜歡
        故障診斷特征故障
        故障一點通
        如何表達(dá)“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        奔馳R320車ABS、ESP故障燈異常點亮
        因果圖定性分析法及其在故障診斷中的應(yīng)用
        故障一點通
        江淮車故障3例
        基于LCD和排列熵的滾動軸承故障診斷
        基于WPD-HHT的滾動軸承故障診斷
        精品人人妻人人澡人人爽牛牛| 在线免费欧美| 99精品国产成人一区二区在线| 亚洲国产国语对白在线观看| 国产精品白丝久久av网站| 男女啪啪永久免费观看网站| 欧美国产亚洲精品成人a v| 午夜国产小视频在线观看黄| 国内自拍色第一页第二页| 香港台湾经典三级a视频| 五月天激情小说| 中文字幕一区,二区,三区| 国产一区二区三区的区| 国产无夜激无码av毛片| 成人做爰69片免费看网站| 亚洲欧美日本人成在线观看| 最新国产精品精品视频| 日韩一区二区三区熟女| 性色欲情网站| 大地资源中文第三页| av日本一区不卡亚洲午夜| 亚洲国产一区二区三区精品| 屁屁影院ccyy备用地址 | 精品女同一区二区三区不卡| 亚洲av日韩一卡二卡| 亚洲七久久之综合七久久| 国产一区二区精品在线观看 | 免费jjzz在线播放国产| 亚洲一区二区女优视频| 337p日本欧洲亚洲大胆色噜噜| 国产福利一区二区三区在线观看| 2022国内精品免费福利视频| 国产理论亚洲天堂av| 深夜福利啪啪片| 亚洲男人第一av网站| 日本av一区二区播放| 校园春色人妻激情高清中文字幕| 婷婷五月六月综合缴情| 免费国产黄线在线播放| 久久亚洲精品一区二区三区| 极品av一区二区三区|