亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)Xgboost算法的多聯(lián)機(jī)空調(diào)系統(tǒng)故障診斷策略

        2021-10-30 02:02:32朱波胡寬李正飛陳煥新
        制冷技術(shù) 2021年4期
        關(guān)鍵詞:特征選擇子集制冷劑

        朱波,胡寬,李正飛,陳煥新

        (華中科技大學(xué)能源與動(dòng)力工程學(xué)院,湖北武漢 430074)

        0 引言

        多聯(lián)機(jī)空調(diào)系統(tǒng)也稱(chēng)作“一拖多”空調(diào)系統(tǒng),是指一臺(tái)室外機(jī)連接多臺(tái)室內(nèi)機(jī),室外機(jī)風(fēng)冷換熱、室內(nèi)機(jī)直接蒸發(fā)換熱的一次制冷劑空調(diào)系統(tǒng)。多聯(lián)機(jī)系統(tǒng)多用于中小型建筑和部分公共建筑,具有節(jié)約能源、控制先進(jìn)和運(yùn)行可靠等特點(diǎn)。機(jī)組適應(yīng)性好、制冷制熱溫度范圍寬、設(shè)計(jì)自由度高、安裝和計(jì)費(fèi)方便[1]。工作原理是通過(guò)控制制冷劑流量和壓縮機(jī)的制冷劑充注量來(lái)實(shí)現(xiàn)制冷與節(jié)能。制冷劑充注量是多聯(lián)機(jī)系統(tǒng)運(yùn)行過(guò)程中重要的參數(shù),一旦出現(xiàn)充注量故障,會(huì)導(dǎo)致一系列安全問(wèn)題和經(jīng)濟(jì)損失。因此對(duì)制冷劑充注量故障的檢測(cè)十分必要。目前,制冷系統(tǒng)故障診斷方法有3 種:經(jīng)驗(yàn)知識(shí)、模型分析和數(shù)據(jù)分析。數(shù)據(jù)分析方法不需要先驗(yàn)知識(shí),僅通過(guò)分析發(fā)現(xiàn)大量數(shù)據(jù)之間的聯(lián)系,因此在多聯(lián)機(jī)復(fù)雜系統(tǒng)故障檢測(cè)中有較好的應(yīng)用前景[2-4]。

        特征選擇是機(jī)器學(xué)習(xí)過(guò)程中重要的數(shù)據(jù)預(yù)處理過(guò)程,對(duì)現(xiàn)實(shí)任務(wù)的解決有兩點(diǎn)重要意義。一是避免維度災(zāi)難。維度災(zāi)難是由特征屬性過(guò)多引發(fā)的,若能從過(guò)多的屬性中挑選重要的屬性即可大大減輕計(jì)算量,從而避免維度災(zāi)難。二是去除冗余特征以降低學(xué)習(xí)難度,可以把握重點(diǎn)[5-6]。李正飛等[7]結(jié)合ReliefF 和mRMR 特征選擇算法獲得特征后建立反向傳播算法模型進(jìn)行故障診斷,結(jié)果表明:該方法可以提高多聯(lián)機(jī)制冷劑充注量故障診斷的精度與效率。陳逸杰等[8]對(duì)比了Boruta 算法和改進(jìn)的Boruta 算法,結(jié)果表明改進(jìn)的Boruta 算法不僅降低了樣本復(fù)雜度,而且提高了模型的預(yù)測(cè)性能。劉藝等[9]闡述了現(xiàn)有特征選擇穩(wěn)定性提升方法,分析比較了各類(lèi)方法的特點(diǎn)和適用范圍,總結(jié)了特征選擇穩(wěn)定性中的相關(guān)評(píng)估工作,并通過(guò)實(shí)驗(yàn)剖析穩(wěn)定性度量指標(biāo)的性能,對(duì)比了4 種集成方法的效用。石拓等[10]提出了SEFV_Bagging 算法,結(jié)果表明其具有良好的泛化性能與穩(wěn)定性,在測(cè)試數(shù)據(jù)上表現(xiàn)出的預(yù)測(cè)精度理想。崔鴻雁等[11]總結(jié)了5 種特征選擇方法,通過(guò)對(duì)比各個(gè)方法的原理、實(shí)現(xiàn)過(guò)程和應(yīng)用場(chǎng)景,得出不同算法適用的范圍和優(yōu)缺點(diǎn)。徐廷喜等[12]提出一種基于支持向量數(shù)據(jù)描述的算法來(lái)檢測(cè)變頻空調(diào)系統(tǒng)制冷劑故障,利用主成分分析法進(jìn)行降維,大幅提升診斷準(zhǔn)確率。吳斌等[13]提出一種基于隨機(jī)森林的屋頂空調(diào)故障診斷策略,結(jié)果表明該方法對(duì)于膨脹閥類(lèi)型相同,但制冷劑、壓縮機(jī)與系統(tǒng)冷量不同的屋頂機(jī)空調(diào)系統(tǒng)診斷效果良好。

        以上研究對(duì)故障診斷的效率均有較大提升但他們的研究方法局限于單一特征選擇法,單一特征選擇容易得到局部最優(yōu)解且抗干擾能力差、穩(wěn)定性差。穩(wěn)定性差的特征是不利于發(fā)現(xiàn)特征之間的相關(guān)性的[14]。為了解決這些問(wèn)題,本文將集成策略與Xgboost 算法相結(jié)合,使用交叉驗(yàn)證和網(wǎng)格搜索尋找最優(yōu)參數(shù),提出了改進(jìn)Xgboost 算法,將單一特征選擇得到的變量重要性排序后集成,得到集成特征排序,以提高特征穩(wěn)定性和預(yù)測(cè)準(zhǔn)確率。

        1 制冷劑充注量故障診斷實(shí)驗(yàn)

        1.1 實(shí)驗(yàn)設(shè)計(jì)

        本論文使用的數(shù)據(jù)是通過(guò)多聯(lián)機(jī)制冷劑充注量實(shí)驗(yàn)獲取的,多聯(lián)機(jī)系統(tǒng)由一臺(tái)室內(nèi)機(jī)和五臺(tái)室外機(jī)組成,室內(nèi)機(jī)主要由風(fēng)機(jī)和換熱器組成,室外機(jī)主要由氣液分離器、渦輪式壓縮機(jī)和過(guò)冷器組成,室內(nèi)機(jī)和室外機(jī)同時(shí)配備了多種傳感器來(lái)采集相關(guān)數(shù)據(jù)。實(shí)驗(yàn)中的室外換熱器采用的是U 型翅片換熱器,有效加快了與外界的換熱,同時(shí)室外機(jī)組還配備有相關(guān)安全設(shè)施來(lái)保證實(shí)驗(yàn)的安全進(jìn)行。實(shí)驗(yàn)選擇R410A 作為制冷劑,制冷劑額定充注量為9.9 kg,室內(nèi)機(jī)和室外機(jī)的額定功率分別為28.0 kW和7.1 kW。多聯(lián)機(jī)系統(tǒng)傳感器用于測(cè)量溫度、壓力等數(shù)據(jù),制冷劑充注量水平由膨脹閥來(lái)調(diào)節(jié)。多聯(lián)機(jī)系統(tǒng)原理如圖1所示。

        圖1 多聯(lián)機(jī)系統(tǒng)原理

        1.2 數(shù)據(jù)采集

        實(shí)驗(yàn)共測(cè)試了10 種制冷劑充注量水平下機(jī)組的運(yùn)行參數(shù),充注量水平設(shè)定在63%~140%,制冷劑充注量水平劃分為不足、適量和過(guò)量3 種情況,實(shí)驗(yàn)每隔15 s 記錄一次數(shù)據(jù),充注量與充注程度的對(duì)應(yīng)關(guān)系和類(lèi)別情況如表1所示。實(shí)驗(yàn)系統(tǒng)在室內(nèi)溫度下進(jìn)行,運(yùn)行工況數(shù)據(jù)如表2所示。

        表1 制冷劑充注量與類(lèi)別

        表2 系統(tǒng)運(yùn)行工況

        2 Xgboost 算法及其參數(shù)設(shè)置

        XgBoost 算法是陳天奇[15]開(kāi)發(fā)的一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目,它可以高效地實(shí)現(xiàn)GBDT 算法,在進(jìn)行了算法和工程上的多次改進(jìn)后,被廣泛應(yīng)用于各種機(jī)器學(xué)習(xí)競(jìng)賽中并取得了不錯(cuò)的成績(jī)。Xgboost算法的核心思想是不斷地進(jìn)行特征分裂來(lái)生長(zhǎng)一棵樹(shù),每生長(zhǎng)一棵樹(shù),就會(huì)得到一個(gè)新函數(shù)來(lái)擬合上次預(yù)測(cè)的殘差。訓(xùn)練完成后,當(dāng)我們要預(yù)測(cè)一個(gè)樣本時(shí)每個(gè)樣本會(huì)落到每棵樹(shù)中對(duì)應(yīng)的葉子節(jié)點(diǎn),每個(gè)葉子節(jié)點(diǎn)對(duì)應(yīng)一個(gè)分?jǐn)?shù),最后只需要將每棵樹(shù)對(duì)用的分?jǐn)?shù)加起來(lái)就是該樣本的預(yù)測(cè)值[16-17]。

        Xgboost 算法目標(biāo)函數(shù)為:

        用泰勒公式展開(kāi)得目標(biāo)函數(shù)為:

        式中,l 為損失函數(shù);Ω(ft)為正則項(xiàng);c 為常數(shù)項(xiàng)。

        Xgboost 算法參數(shù)較多,本文主要設(shè)置了max_depth、n_estimators 和learning_rate 三個(gè)參數(shù)。其中max_depth 控制樹(shù)的深度,深度越大越容易過(guò)擬合,n_estimators 控制弱學(xué)習(xí)器的數(shù)量,learning_rate 為學(xué)習(xí)率。

        3 貪心搜索集成

        貪心搜索是基于貪心算法的集成搜索過(guò)程。貪心算法的基本思路是首先建立起數(shù)學(xué)模型來(lái)描述所要求解的問(wèn)題,然后把待求解的問(wèn)題拆分成若干個(gè)子問(wèn)題,再對(duì)每個(gè)子問(wèn)題進(jìn)行求解,獲得每個(gè)子問(wèn)題的局部最優(yōu)解,最后把每個(gè)子問(wèn)題的局部最優(yōu)解集成,得到原問(wèn)題的解。貪心算法的使用有一定的限制,只能求解在約束范圍以?xún)?nèi)的可行解,并不能保證最優(yōu),也就不能求解極值問(wèn)題。貪心算法以迭代的方式連續(xù)做出貪心選擇,每次貪心選擇都將使所求解問(wèn)題簡(jiǎn)化為更小的子問(wèn)題[18-19]。

        本文采用貪心搜索集成策略,貪心搜索集成的基本思路是將基特征選擇器得到的特征序列構(gòu)成特征子集,將每個(gè)特征看作一個(gè)候選特征子集,然后對(duì)所有候選特征子集進(jìn)行評(píng)價(jià)且保證每輪的選擇均為目前狀況下的最優(yōu)選擇。對(duì)特征子集以預(yù)測(cè)準(zhǔn)確率作為評(píng)價(jià)標(biāo)準(zhǔn),每輪搜索都選擇預(yù)測(cè)準(zhǔn)確率最大的變量,據(jù)此對(duì)特征進(jìn)行排序。

        4 改進(jìn)Xgboost算法的制冷劑充注量故障診斷

        4.1 數(shù)據(jù)預(yù)處理

        實(shí)驗(yàn)所得的數(shù)據(jù)量十分龐大,如果直接將如此龐大的數(shù)據(jù)量帶入模型進(jìn)行故障檢測(cè),不僅預(yù)測(cè)精度低、計(jì)算量龐大而且可能導(dǎo)致計(jì)算機(jī)崩潰。因此,數(shù)據(jù)的預(yù)處理十分重要。數(shù)據(jù)預(yù)處理就是剔除異常值、死值、無(wú)關(guān)變量和邏輯變量,降低數(shù)據(jù)維度,獲得較好的特征變量,最后對(duì)特征變量進(jìn)行歸一化處理[20]。數(shù)據(jù)歸一化是將數(shù)據(jù)轉(zhuǎn)化為均值為0、方差為1的正態(tài)分布,這樣可以使不同數(shù)據(jù)處在同一數(shù)量級(jí),消除量綱對(duì)模型的影響,保證了預(yù)測(cè)的穩(wěn)定性,可表示為:

        式中,E(xi)為變量xi的數(shù)學(xué)期望,var(xi)為方差。

        數(shù)據(jù)預(yù)處理分為兩個(gè)步驟:1)數(shù)據(jù)清洗;2)選取特征變量。數(shù)據(jù)清洗時(shí),時(shí)間記錄和異常值要首先剔除,然后去除與目標(biāo)變量相關(guān)性強(qiáng)的特征變量,降低數(shù)據(jù)冗余。特征變量的選取主要基于專(zhuān)家先驗(yàn)知識(shí),最終選定18個(gè)變量作為最終的特征變量輸入到故障診斷模型,變量名及編號(hào)如表3所示。

        表3 變量名及編號(hào)

        4.2 算法參數(shù)尋優(yōu)

        在運(yùn)行Xgboost 算法前,需要輸入數(shù)據(jù)矩陣,標(biāo)簽向量和迭代次數(shù)等參數(shù)。本文使用十折交叉驗(yàn)證和網(wǎng)格搜索來(lái)尋找最優(yōu)參數(shù)。十折交叉驗(yàn)證是將數(shù)據(jù)集平均分為10 份,每次拿出1 份作為測(cè)試集,其余作為訓(xùn)練集,直到十個(gè)子集均作為測(cè)試集使用過(guò),最后將10 個(gè)模型參數(shù)取平均值,作為最終指標(biāo)。網(wǎng)格搜索是一種窮舉調(diào)參方法,即在所有候選的參數(shù)中循環(huán)遍歷,實(shí)驗(yàn)每一種可能,將效果最好的參數(shù)作為最終結(jié)果[21-22]。

        4.3 特征選擇優(yōu)化

        首先從原始數(shù)據(jù)集中抽取30,000 個(gè)數(shù)據(jù)作為樣本子集,樣本子集保留了原始數(shù)據(jù)集的所有特征。通過(guò)抽樣可以大大減少運(yùn)算時(shí)間,同時(shí)通過(guò)形成數(shù)據(jù)擾動(dòng),保證了特征子集的多樣性和穩(wěn)定性。抽樣后運(yùn)行五次Xgboost 算法,得到5 個(gè)特征子集,然后將所得特征子集按照特定集成策略集成,得到集成后的特征子集。

        然后再取30,000個(gè)樣本進(jìn)行驗(yàn)證過(guò)程。在驗(yàn)證過(guò)程樣本中取80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測(cè)試集。將5種單一特征排序和集成特征排序按照排名依次帶入Adaboost和Xgboost預(yù)測(cè)模型中,最終獲得6種變量排序?qū)?yīng)的預(yù)測(cè)準(zhǔn)確率。故障診斷準(zhǔn)確率可以定義為:

        式中,C1、C2、Cn分別代表n種故障預(yù)測(cè)正確的樣本數(shù);N為樣本總數(shù)。

        數(shù)據(jù)處理與模型預(yù)測(cè)的過(guò)程如圖2所示。

        圖2 模型訓(xùn)練流程

        5 結(jié)果分析

        5.1 準(zhǔn)確率對(duì)比

        圖3所示為Xgboost模型和Adaboost模型準(zhǔn)確率對(duì)比。由圖3可知,在兩種模型中改進(jìn)的Xgboost算法獲得的準(zhǔn)確率基本都高于所有單一特征選擇算法,最差時(shí)也和單一特征選擇中的最高準(zhǔn)確率持平,充分說(shuō)明該算法的優(yōu)越性,這也表明集成算法可以獲得更好的特征排序、更優(yōu)的診斷性能。集成算法的準(zhǔn)確率隨變量個(gè)數(shù)的增加呈現(xiàn)出先增再減最后趨于穩(wěn)定的變化。準(zhǔn)確率隨變量個(gè)數(shù)增加先增加,是因?yàn)樽兞繑?shù)少時(shí),模型預(yù)測(cè)能力低,變量較少時(shí)無(wú)法對(duì)制冷劑充注量進(jìn)行準(zhǔn)確預(yù)測(cè)。變量數(shù)達(dá)到15時(shí),準(zhǔn)確率達(dá)到峰值。當(dāng)變量數(shù)大于15時(shí),準(zhǔn)確率開(kāi)始略有下降,這是由于過(guò)多的變量造成特征的冗余程度變大,冗余變量降低了預(yù)測(cè)性能,同時(shí)增加了運(yùn)算負(fù)荷。特征選擇的目的在于選擇合適數(shù)量的變量構(gòu)成特征子集,在獲得較高準(zhǔn)確率的同時(shí)降低運(yùn)算量,因此,本論文選擇貪心搜索集成得到的前7個(gè)變量構(gòu)成最優(yōu)特征子集,按照排序依次為壓縮機(jī)排氣溫度、過(guò)冷器液出溫度、壓縮機(jī)模塊溫度、冷凝溫度、氣分進(jìn)管溫度、EXV、室外環(huán)境溫度。這樣選擇既可以保證準(zhǔn)確率,也可以保證較少的特征變量,盡可能減少計(jì)算復(fù)雜度。

        圖3 Xgboost模型和Adaboost模型準(zhǔn)確率對(duì)比

        5.2 泛化性能驗(yàn)證

        為了驗(yàn)證改進(jìn)Xgboost算法的泛化性能,再次從原始數(shù)據(jù)中抽取40,000組數(shù)據(jù),代入兩種模型中進(jìn)行驗(yàn)證,結(jié)果如圖4所示,Xgboost模型部分準(zhǔn)確率數(shù)值如表4所示。

        圖4 Xgboost模型和Adaboost模型部分?jǐn)?shù)據(jù)準(zhǔn)確率對(duì)比

        表4 Xgboost模型前七位特征準(zhǔn)確率

        圖4所示為所有18個(gè)特征的準(zhǔn)確率。表4給出了在Xgboost模型中排在前7位的特征準(zhǔn)確率,因?yàn)?位以后的準(zhǔn)確率已經(jīng)十分接近,原因是隨著特征變量的個(gè)數(shù)增加,準(zhǔn)確率逐步提高,當(dāng)變量個(gè)數(shù)達(dá)到一定數(shù)量時(shí),基本接近了最高的準(zhǔn)確率。由圖4和表4可知,改進(jìn)Xgboost算法的準(zhǔn)確率依然整體上高于所有的單一算法,證明該模型泛化性能良好。

        6 結(jié)論

        本文將集成思想運(yùn)用到特征選擇上,將單一算法得到的特征順序集成,結(jié)合交叉驗(yàn)證網(wǎng)格搜索等手段改進(jìn)Xgboost算法,來(lái)提高模型預(yù)測(cè)的準(zhǔn)確率,得出如下結(jié)論:

        1)改進(jìn)Xgboost算法的集成方法得到的特征子集能獲得比所有單一特征選擇方法更高的準(zhǔn)確率,在Adaboost和Xgboost兩種模型上選擇特征數(shù)量較少時(shí),準(zhǔn)確率提升明顯,最優(yōu)時(shí)分別提升了15.28%和4.68%;

        2)使用交叉驗(yàn)證、網(wǎng)格搜索和貪心搜索策略可以有效改進(jìn)Xgboost算法,提高其特征選擇穩(wěn)定性和預(yù)測(cè)準(zhǔn)確率;

        3)改進(jìn)Xgboost算法具有良好的泛化性能,適用于更多其他復(fù)雜情況,具備一定的推廣能力。

        猜你喜歡
        特征選擇子集制冷劑
        揚(yáng)州市出臺(tái)“制冷劑六條”提升制冷劑安全管理水平
        由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
        拓?fù)淇臻g中緊致子集的性質(zhì)研究
        關(guān)于奇數(shù)階二元子集的分離序列
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        近共沸制冷劑R134a/R1234yf的PVTx性質(zhì)的實(shí)驗(yàn)研究
        聯(lián)合互信息水下目標(biāo)特征選擇算法
        每一次愛(ài)情都只是愛(ài)情的子集
        都市麗人(2015年4期)2015-03-20 13:33:22
        基于特征選擇和RRVPMCD的滾動(dòng)軸承故障診斷方法
        基于二元搭配詞的微博情感特征選擇
        国产人妻久久精品二区三区老狼| xxxx国产视频| 无码一区二区三区在线在看| 澳门精品一区二区三区| 精品亚洲国产成人av色哟哟| 久久久受www免费人成| 国产男女猛烈无遮挡免费视频| 国产在线一区二区视频免费观看| 被灌醉的日本人妻中文字幕| 免费无码av一区二区| 亚洲精品夜夜夜| 久久精品国产亚洲av成人擦边| 最近更新中文字幕一区二区 | 男女上床视频免费网站| 亚洲精品岛国av一区二区| 777米奇色狠狠俺去啦| 国产一起色一起爱| 粉嫩av一区二区在线观看| 91精品久久久老熟女91精品| 精品伊人久久大香线蕉综合| 亚洲人免费| 亚洲性码不卡视频在线| 亚洲国产美女高潮久久久| 精品乱码久久久久久久| 男人的天堂在线无码视频| 视频一区视频二区亚洲| 无码国产成人午夜电影在线观看| 国产在线精品欧美日韩电影| 激情 一区二区| 亚洲国产综合精品中久| 国产后入又长又硬| 中文字幕不卡在线播放| 天天综合色中文字幕在线视频| 成年丰满熟妇午夜免费视频| 久久精品中文字幕一区| 97人妻无码免费专区| 国产在线视频91九色| 免费观看激色视频网站| 亚洲免费一区二区三区视频| 日本淫片一区二区三区| 国产精品毛片无遮挡|