亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于XGBoost的采煤機(jī)健康狀態(tài)評(píng)估方法研究

        2022-05-13 11:41:54曹現(xiàn)剛陳瑞昊李彥川伍宇澤
        煤炭工程 2022年5期
        關(guān)鍵詞:錯(cuò)誤率采煤機(jī)分類

        曹現(xiàn)剛,陳瑞昊,李彥川,伍宇澤,岳 東

        (1.西安科技大學(xué) 機(jī)械工程學(xué)院,陜西 西安 710054;2.陜西省礦山機(jī)電裝備智能監(jiān)測(cè)重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710054;3.陜西陜煤銅川礦業(yè)有限公司,陜西 銅川 727000)

        采煤機(jī)作為多部件復(fù)雜系統(tǒng),在運(yùn)行過程中由于截割煤巖時(shí)受到變工況、環(huán)境噪聲等各種復(fù)雜因素影響,采集到的振動(dòng)、電流等監(jiān)測(cè)信號(hào)往往難以提取關(guān)鍵信息[1]。復(fù)雜設(shè)備的健康狀態(tài)評(píng)估方法根據(jù)不同的評(píng)估原理,大致可以分為以下三類:基于經(jīng)驗(yàn)的健康狀態(tài)評(píng)估[2]、基于模型的健康狀態(tài)評(píng)估[3]和基于人工智能的健康狀態(tài)評(píng)估[4]。其中,基于經(jīng)驗(yàn)的評(píng)估方法包括:灰色理論法、模糊綜合評(píng)判法[5]、云模型理論[6]、層次分析法、D-S證據(jù)理論;基于模型的評(píng)估方法主要包括失效物理模型、故障樹等[7,8];基于人工智能的評(píng)估方法主要有:支持向量機(jī)[9]、馬爾科夫理論、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)[10-12]等。

        目前國內(nèi)外設(shè)備健康狀態(tài)評(píng)估研究多集中于電力[13,14]、導(dǎo)彈[15]、航空航天[16,17]等領(lǐng)域,針對(duì)煤礦設(shè)備的狀態(tài)評(píng)估研究并不多見;在評(píng)估對(duì)象上主要集中于對(duì)單一或者簡(jiǎn)單部件系統(tǒng)進(jìn)行狀態(tài)評(píng)估,對(duì)于多部件復(fù)雜系統(tǒng)[18]的健康狀態(tài)評(píng)估研究成果較少。采煤機(jī)健康狀態(tài)評(píng)估工作是一個(gè)多層次、多屬性評(píng)估過程,基于模型的評(píng)估方法建模困難求解異常復(fù)雜,而基于經(jīng)驗(yàn)的評(píng)估方法受主觀因素影響較大,各部件、指標(biāo)權(quán)重難以確定?;趥鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)的評(píng)估方法可解釋性較差,易陷入局部極小值。此外,大多數(shù)健康狀態(tài)評(píng)估方法無法針對(duì)冗余性、突變性、不平衡數(shù)據(jù)集,導(dǎo)致評(píng)估效率較低。針對(duì)以上問題,本文提出了XGBooost的采煤機(jī)健康狀態(tài)評(píng)估方法研究,首先篩選出相關(guān)性較低的參數(shù)數(shù)據(jù),構(gòu)建采煤機(jī)健康狀態(tài)評(píng)估指標(biāo)體系;采用XGBoost算法對(duì)采煤機(jī)健康狀態(tài)進(jìn)行評(píng)估,調(diào)優(yōu)模型確定關(guān)鍵參數(shù),通過實(shí)驗(yàn)驗(yàn)證,得到XGBoost算法的評(píng)估結(jié)果和混淆矩陣為采煤機(jī)健康狀態(tài)評(píng)估工作提供依據(jù),對(duì)采煤機(jī)健康管理具有一定意義。

        1 采煤機(jī)健康狀態(tài)評(píng)估指標(biāo)構(gòu)建及運(yùn)行狀態(tài)劃分

        1.1 采煤機(jī)狀態(tài)量選取

        本文主要研究電牽引雙滾筒式采煤機(jī),雙滾筒采煤機(jī)可分為牽引部、截割部、電氣系統(tǒng)和輔助裝置。雙滾筒電牽引采煤機(jī)各部位名稱如圖1所示。

        根據(jù)采煤機(jī)結(jié)構(gòu)組成和工作方式,同時(shí)考慮采煤機(jī)實(shí)際可安裝部位,分析得到采煤機(jī)主要運(yùn)行狀態(tài)監(jiān)測(cè)數(shù)據(jù)。采煤機(jī)的各個(gè)關(guān)鍵部件或部位均安裝對(duì)應(yīng)的傳感器對(duì)其進(jìn)行實(shí)時(shí)監(jiān)測(cè),保證采煤機(jī)的健康狀態(tài)。采煤機(jī)需要監(jiān)測(cè)的部分狀態(tài)參數(shù)見表1。

        1—截割滾筒;2—搖臂;3—截割電機(jī);4—牽引電機(jī);5—油泵電機(jī);6—液壓?jiǎn)卧?—電氣控制箱;8—變頻箱;9—電磁閥柜;10—變壓器箱;11—牽引減速箱;12—調(diào)高調(diào)斜裝置;13—破碎機(jī)構(gòu);14—破碎電機(jī)圖1 電牽引采煤機(jī)基本結(jié)構(gòu)

        表1 采煤機(jī)的部分狀態(tài)監(jiān)測(cè)參數(shù)

        1.2 采煤機(jī)狀態(tài)參數(shù)相關(guān)性分析

        采煤機(jī)運(yùn)行過程中各部件監(jiān)測(cè)的狀態(tài)參數(shù)間存在復(fù)雜的關(guān)聯(lián)關(guān)系,因此需要找出這些關(guān)聯(lián)數(shù)據(jù),去除數(shù)據(jù)的冗余性和相關(guān)性,為采煤機(jī)健康狀態(tài)評(píng)估工作做準(zhǔn)備。單一的相關(guān)系數(shù)并不能客觀地表征數(shù)據(jù)變量間密切的相關(guān)關(guān)系,因此本文選擇綜合相關(guān)系數(shù),即將Spearman相關(guān)系數(shù)、Person相關(guān)系數(shù)進(jìn)行綜合用于表征采煤機(jī)狀態(tài)數(shù)據(jù)變量間的相關(guān)關(guān)系。

        Spearman相關(guān)系數(shù)計(jì)算公式如下:

        式中,ρ1為兩變量間的Spearman相關(guān)系數(shù);N為樣本容量;di為變量間秩次差值。

        Person相關(guān)系數(shù)ρ2的計(jì)算公式如下:

        式中,cov(X,Y)為X和Y的協(xié)方差;σX、σY為X和Y的標(biāo)準(zhǔn)差;μX、μY為變量X和Y的平均值。Person相關(guān)系數(shù)一般在-1到1之間取值,當(dāng)前提條件一定的情況下,一般使用絕對(duì)值表示兩參數(shù)變量間的相關(guān)性。

        狀態(tài)參量間的綜合相關(guān)系數(shù)用rxy表示,則rxy為:

        通過計(jì)算狀態(tài)參數(shù)間的綜合相關(guān)系數(shù)rxy,篩選出狀態(tài)評(píng)估指標(biāo),構(gòu)建出采煤機(jī)健康狀態(tài)評(píng)估體系。采用rxy表示狀態(tài)監(jiān)測(cè)參數(shù)x和y之間的綜合相關(guān)系數(shù),兩狀態(tài)參數(shù)間的相關(guān)系數(shù)rxy的值與對(duì)應(yīng)的兩個(gè)變量之間的相關(guān)性描述見表2。

        表2 綜合相關(guān)系數(shù)rxy的絕對(duì)值與對(duì)應(yīng)的兩個(gè)變量間關(guān)系

        本文以采煤機(jī)牽引部各監(jiān)測(cè)參數(shù)為例,完成監(jiān)測(cè)參數(shù)間相關(guān)性分析,進(jìn)而完成采煤機(jī)狀態(tài)評(píng)估指標(biāo)篩選。為了分析采煤機(jī)狀態(tài)監(jiān)測(cè)參數(shù)和指標(biāo)間的相關(guān)性,選取正常工況下的采煤機(jī)牽引部8項(xiàng)狀態(tài)參數(shù)序列數(shù)據(jù),包括牽引電機(jī)溫度、牽引電機(jī)轉(zhuǎn)速、牽引電機(jī)振動(dòng)、牽引電機(jī)電流、冷卻水壓、牽引電機(jī)轉(zhuǎn)矩、油缸內(nèi)油壓、牽引減速箱溫度等八項(xiàng)參數(shù),分別計(jì)算這八項(xiàng)參數(shù)之間的綜合相關(guān)系數(shù),將相關(guān)度高于閾值0.6的幾個(gè)參數(shù)用同一指標(biāo)參數(shù)替代,減少監(jiān)測(cè)參數(shù)間的冗余屬性,通過相關(guān)性分析得到的相關(guān)性熱力圖結(jié)果如圖2所示。

        圖2 牽引部狀態(tài)參數(shù)間綜合相關(guān)系數(shù)熱力圖

        由圖2可知,C1牽引電機(jī)溫度與C2牽引電機(jī)轉(zhuǎn)矩密切相關(guān),因此可以用C1即牽引電機(jī)溫度代替這兩個(gè)指標(biāo),以此類推,篩選出狀態(tài)參數(shù)間相關(guān)性都低于0.6的四項(xiàng)基本監(jiān)測(cè)參數(shù),依次為:牽引電機(jī)振動(dòng)、牽引電機(jī)溫度、牽引電機(jī)電流、牽引電機(jī)轉(zhuǎn)速。同理,得到其他部件的狀態(tài)參數(shù)相關(guān)性分析結(jié)果,篩選出相關(guān)性低的狀態(tài)參數(shù)作為采煤機(jī)健康狀態(tài)評(píng)估指標(biāo),剔除掉相關(guān)性較強(qiáng)的數(shù)據(jù)。

        由于采煤機(jī)集機(jī)械,電力和液壓系統(tǒng)于一體,因此影響采煤機(jī)的狀態(tài)監(jiān)測(cè)參數(shù)眾多,但若將其全部用作采煤機(jī)狀態(tài)評(píng)估指標(biāo),會(huì)增加不必要的工作量和影響評(píng)估工作效率。因此,本文在煤礦調(diào)研的基礎(chǔ)上,結(jié)合采煤機(jī)結(jié)構(gòu)、易發(fā)故障部位置和采煤機(jī)監(jiān)測(cè)參數(shù)相關(guān)性分析,篩選出影響采煤機(jī)健康狀態(tài)的最重要的多維指標(biāo),在此基礎(chǔ)上確定采煤機(jī)健康狀態(tài)評(píng)估指標(biāo)體系的組成,分別從指標(biāo)層、部件層到整機(jī)層進(jìn)行分層劃分,如圖3所示。

        圖3 采煤機(jī)健康狀態(tài)評(píng)估指標(biāo)體系

        1.3 采煤機(jī)健康狀態(tài)等級(jí)劃分

        采煤機(jī)作為一個(gè)復(fù)雜設(shè)備,它的健康狀態(tài)等級(jí)變化是一個(gè)漸變過程,從健康狀態(tài)到劣化再到故障,因此為了便于量化計(jì)算和結(jié)合專家經(jīng)驗(yàn),本實(shí)驗(yàn)將其分為四個(gè)健康狀態(tài)等級(jí),分別是健康、良好、劣化、故障,采煤機(jī)健康狀態(tài)對(duì)應(yīng)的采煤機(jī)各等級(jí)描述見表3。

        2 XGBoost原理

        極端梯度提升算法(extreme gradient boosting,XGBoost)采用多線程加速樹的構(gòu)建,使用樹模型作為基礎(chǔ)分類器來形成強(qiáng)大的分類器,并通過將多個(gè)基礎(chǔ)分類器集成在一起,這在分類任務(wù)中具有高效、準(zhǔn)確和解釋性好的優(yōu)點(diǎn)[19]。XGBoost算法的基本概念和理論如下:

        表3 數(shù)據(jù)集基本信息

        1)基學(xué)習(xí)器。極限梯度提升樹由回歸樹和分類樹這兩個(gè)基本部分構(gòu)成,XGBoost是以分類和回歸樹(classification and regression tree,CART)作為基礎(chǔ)學(xué)習(xí)器,采用XGBoost對(duì)評(píng)估模型進(jìn)行訓(xùn)練,特征的屬性被轉(zhuǎn)移到每個(gè)葉子節(jié)點(diǎn),對(duì)應(yīng)于每個(gè)葉子的分?jǐn)?shù)。

        2)樹的復(fù)雜度。每一棵回歸樹,可拆分為結(jié)構(gòu)部分和葉子節(jié)點(diǎn)權(quán)重部分,則第t個(gè)樹模型:

        ft(x)=wq(x),w∈RT

        (4)

        式中,w為葉子節(jié)點(diǎn)分值;q(x)為樣本x對(duì)應(yīng)的葉子節(jié)點(diǎn)號(hào);T為葉子數(shù),RT是T維實(shí)數(shù),表示葉子權(quán)重的集合。復(fù)雜度包含了一棵樹里面節(jié)點(diǎn)的個(gè)數(shù)以及每個(gè)數(shù)葉子節(jié)點(diǎn)上面輸出分?jǐn)?shù)的模平方,因此,樹的復(fù)雜度為:

        式中,Ω為復(fù)雜度;γ是葉子節(jié)點(diǎn)數(shù)的懲罰系數(shù);λ是正則項(xiàng)系數(shù);wj是葉子節(jié)點(diǎn)j對(duì)應(yīng)的分值。

        3)目標(biāo)函數(shù)為:

        式中,I={i|q(xi)=j},Gj=∑i∈Ijgi,Hj=∑i∈Ijhi。

        5)增益。在創(chuàng)建樹模型時(shí),可采用貪心算法,每次對(duì)已有的葉子加入分割。對(duì)于一個(gè)決提的分割方案,其獲得的增益為:

        式中,第一項(xiàng)為左子樹分?jǐn)?shù),GL為樹分類后左子樹gi之和,HL為樹分類后左子樹hi之和;第二項(xiàng)為右子樹分?jǐn)?shù),GR為樹分類后左子樹gi之和,HR為樹分類后左子樹hi之和;第三項(xiàng)為不分割下的分?jǐn)?shù),表示新葉子節(jié)點(diǎn)帶來的復(fù)雜度代價(jià)。由以上原理可知XGBoost將多個(gè)弱學(xué)習(xí)器結(jié)合,因而可以獲得更好的性能。

        將采煤機(jī)狀態(tài)數(shù)據(jù)作為特征量輸入,采煤機(jī)的四種健康狀態(tài)作為分類輸出結(jié)果,通過模型訓(xùn)練,通過各項(xiàng)模型參數(shù)調(diào)優(yōu),得到最佳參數(shù)值。

        3 XGBoost集成學(xué)習(xí)模型訓(xùn)練

        3.1 模型建立步驟

        本節(jié)采用XGBoost集成學(xué)習(xí)建立采煤機(jī)健康狀態(tài)評(píng)估模型,通過劃分采煤機(jī)健康狀態(tài)等級(jí),建立訓(xùn)練樣本,并對(duì)XGBoost模型內(nèi)部關(guān)鍵參數(shù)優(yōu)化,最后對(duì)采煤機(jī)健康狀態(tài)進(jìn)行評(píng)估,得出結(jié)論。應(yīng)用XGBoost對(duì)采煤機(jī)健康狀態(tài)進(jìn)行評(píng)估的主要過程如下:

        第一步是將相關(guān)分析、特征選擇后的指標(biāo)數(shù)據(jù)作為XGBoost的輸入特征,將采煤機(jī)不同的健康狀態(tài)等級(jí)作為評(píng)估算法的類別標(biāo)簽。

        第二步是將采煤機(jī)狀態(tài)數(shù)據(jù)集進(jìn)行劃分。通過狀態(tài)量的選取和指標(biāo)體系的構(gòu)建,將采煤機(jī)狀態(tài)數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,按照一定的比例對(duì)其進(jìn)行劃分。

        第三步是對(duì)XGBoost分類模型的主要參數(shù)進(jìn)行初始設(shè)置。模型建立后對(duì)采煤機(jī)狀態(tài)評(píng)估模型的各項(xiàng)參數(shù)進(jìn)行設(shè)置,如樹的最大深度、模型的學(xué)習(xí)率、最小葉子權(quán)重和等。

        第四步是用訓(xùn)練集數(shù)據(jù)對(duì)采煤機(jī)XGBoost狀態(tài)評(píng)估模型進(jìn)行訓(xùn)練,用采煤機(jī)數(shù)據(jù)測(cè)試集對(duì)模型進(jìn)行測(cè)試。通過構(gòu)建一棵CART決策樹,然后依次增加狀態(tài)分類節(jié)點(diǎn),分別對(duì)前一次的評(píng)估結(jié)果進(jìn)行擬合,訓(xùn)練過程中的目標(biāo)是損失函數(shù)最小,通過求取損失函數(shù)最小的特征作為分叉樹的特征,在此基礎(chǔ)上求出每一個(gè)葉子節(jié)點(diǎn)即狀態(tài)的預(yù)測(cè)分?jǐn)?shù),將每棵樹的每種評(píng)估結(jié)果的預(yù)測(cè)分值作為概率值,根據(jù)概率值最大完成狀態(tài)分類和評(píng)估。

        最后一步是不斷調(diào)整XGBoost模型參數(shù)。通過改變各項(xiàng)參數(shù)值查看評(píng)估模型分類效果,以綜合評(píng)估效果最優(yōu)的XGBoost各項(xiàng)參數(shù)作為最終的評(píng)估模型參數(shù)。具體的評(píng)估流程如圖4所示。

        圖4 XGBoost模型評(píng)估流程

        3.2 XGBoost狀態(tài)評(píng)估模型參數(shù)

        為保證評(píng)估結(jié)果的準(zhǔn)確性,本節(jié)通過選取采煤機(jī)狀態(tài)指標(biāo)數(shù)據(jù)1000條作為實(shí)驗(yàn)數(shù)據(jù),將采煤機(jī)指標(biāo)參數(shù)如牽引電動(dòng)機(jī)溫度等歸一化后的15維數(shù)據(jù)導(dǎo)入XGBoost評(píng)估模型中,數(shù)據(jù)集中80%作為訓(xùn)練集,20%作為測(cè)試集。通過交叉驗(yàn)證[20]的方法對(duì)XGBoost評(píng)估模型的參數(shù)進(jìn)行調(diào)優(yōu),將訓(xùn)練集和測(cè)試集分類錯(cuò)誤率作為模型的評(píng)估指標(biāo),多次調(diào)參得到采煤機(jī)狀態(tài)評(píng)估模型的最優(yōu)參數(shù)。

        在對(duì)XGBoost的采煤機(jī)評(píng)估模型參數(shù)優(yōu)化前,首先需要對(duì)影響XGBoost模型評(píng)估效率的關(guān)鍵參數(shù)進(jìn)行分析。第一類參數(shù)是調(diào)節(jié)過擬合的參數(shù)即樹的最大深度max_depth、最小葉子節(jié)點(diǎn)權(quán)重和min_child_weight等。一般來說max_depth越深,說明評(píng)估模型可以學(xué)習(xí)到更細(xì)微具體的數(shù)據(jù)樣本信息,但當(dāng)樹的深度的過深時(shí),就可能發(fā)生過擬合現(xiàn)象。此時(shí)測(cè)試集數(shù)據(jù)分類錯(cuò)誤率較高、訓(xùn)練集分類錯(cuò)誤率較低;min_child_weight的值越大時(shí),越能全面學(xué)習(xí)到樣本的各項(xiàng)特征,但當(dāng)min_child_weight值過大時(shí),模型學(xué)習(xí)到較多無用信息,因而發(fā)生過擬合現(xiàn)象。因此,本章主要對(duì)這兩個(gè)關(guān)鍵參數(shù)進(jìn)行優(yōu)化。

        最小葉子節(jié)點(diǎn)權(quán)重和“min_child_weight”的取值一般在4~10之間,本章取“min_child_weight”取值為4、6、8、10時(shí),得到XGBoost模型的訓(xùn)練集和測(cè)試集的分類錯(cuò)誤率如圖5所示。由圖5可知,當(dāng)設(shè)置樹的高度為2、4時(shí),訓(xùn)練集合測(cè)試集的分類錯(cuò)誤率相差不大且能控制在相對(duì)較小的范圍內(nèi)且樹高度為4時(shí)平均分類錯(cuò)誤率更小;當(dāng)設(shè)置樹的高度為6、8時(shí),錯(cuò)誤率雖較小,但是訓(xùn)練集和測(cè)試集差距過大,不適合作為最佳參數(shù)。因此,綜合以上因素,選擇樹高度為4時(shí)最為合理。

        圖5 不同樹高度時(shí)XGBoost模型分類錯(cuò)誤率對(duì)比

        不同min_child_weight時(shí)XGBoost模型分類錯(cuò)誤率對(duì)比如圖6所示,可知,當(dāng)設(shè)置min_child_weight為4、6時(shí),訓(xùn)練集合測(cè)試集的分類錯(cuò)誤率相差不大且能控制在相對(duì)較小的范圍內(nèi),min_child_weight值為6時(shí)分類錯(cuò)誤率更??;當(dāng)設(shè)置min_child_weight值為8、10時(shí),錯(cuò)誤率雖不大,但是訓(xùn)練集和測(cè)試集差距過大,訓(xùn)練集誤差率過高,因此不適合作為最佳參數(shù)。因此,綜合以上因素,選擇最小葉子節(jié)點(diǎn)權(quán)重為6時(shí)最為合理。

        圖6 不同最小葉子節(jié)點(diǎn)權(quán)重和時(shí)分類錯(cuò)誤率對(duì)比

        接下來要調(diào)整的參數(shù)為最小損失函數(shù)下降值gamma與隨機(jī)采樣比例subsample、隨機(jī)列數(shù)比例colsample_bytree。gamma表示每個(gè)節(jié)點(diǎn)劃分時(shí)對(duì)應(yīng)的損失函數(shù)的下降值,若算法越保守gamma的數(shù)值越大。本章中,gamma的大小依據(jù)經(jīng)驗(yàn)在0~0.5之間進(jìn)行調(diào)整,每次相隔0.1,通過實(shí)驗(yàn)得出當(dāng)gamma的值為0.1時(shí)最佳,準(zhǔn)確率為0.985。隨機(jī)列數(shù)比例colsample_bytree表示決策樹的生成時(shí)間,而隨機(jī)采樣比例subsample表示采樣的樣本占整個(gè)樣本的比例。通過不斷調(diào)整參數(shù),求得colsample_bytree和subsample的最佳組合參數(shù)為前者的值為1,后者的值為0.8時(shí)模型的效果最佳主要模型參數(shù)見表4。

        表4 模型參數(shù)

        3.3 評(píng)估過程

        參數(shù)調(diào)優(yōu)后,將數(shù)據(jù)集導(dǎo)入XGBoost評(píng)估模型,因?yàn)閄GBoost采用集成樹模型,因此將模型可視化,可以看到評(píng)估過程樹的結(jié)構(gòu),因?yàn)闃涞臄?shù)量較多,以第一個(gè)類別(即健康狀態(tài)1)的第一棵樹為例,可得到樹結(jié)構(gòu)如圖7所示。

        圖7 樹結(jié)構(gòu)

        由圖7可知,每一棵樹劃分的狀態(tài)指標(biāo)參數(shù)和對(duì)應(yīng)的劃分閾值,其和采煤機(jī)狀態(tài)數(shù)據(jù)集的第一組數(shù)據(jù)對(duì)應(yīng),將每組數(shù)據(jù)4種狀態(tài)的相對(duì)應(yīng)的葉子節(jié)點(diǎn)分值相加,即得到該組狀態(tài)數(shù)據(jù)所對(duì)應(yīng)的4種健康狀態(tài)的分值[X1,X2,X3,X4],以此類推可計(jì)算出該組數(shù)據(jù)對(duì)應(yīng)的每個(gè)健康狀態(tài)的概率[P1,P1,P1,P1],依據(jù)概率最大即可得到采煤機(jī)對(duì)應(yīng)的健康狀態(tài)等級(jí)。

        4 實(shí)例分析

        本文選取陜北煤礦某型采煤機(jī)監(jiān)測(cè)數(shù)據(jù)篩選出采煤機(jī)狀態(tài)指標(biāo)數(shù)據(jù)1000組作為實(shí)驗(yàn)數(shù)據(jù),每種狀態(tài)數(shù)據(jù)包括15維狀態(tài)指標(biāo)數(shù)據(jù)和對(duì)應(yīng)的健康狀態(tài)等級(jí)標(biāo)簽。其中“健康”狀態(tài)數(shù)據(jù)400組、“良好”狀態(tài)數(shù)據(jù)300組、“劣化”狀態(tài)數(shù)據(jù)200組、“故障”狀態(tài)數(shù)據(jù)100組,采煤機(jī)各個(gè)健康狀態(tài)等級(jí)對(duì)應(yīng)的狀態(tài)等級(jí)描述見表3。

        在設(shè)置各項(xiàng)參數(shù)最優(yōu)值的基礎(chǔ)上,將采煤機(jī)狀態(tài)數(shù)據(jù)集導(dǎo)入進(jìn)行訓(xùn)練和測(cè)試,模型訓(xùn)練步驟如圖4所示。模型訓(xùn)練完畢后,將200組測(cè)試數(shù)據(jù)導(dǎo)入XGBoost狀態(tài)評(píng)估模型,分別計(jì)算評(píng)估準(zhǔn)確率、每種健康狀態(tài)的召回率、以及綜合評(píng)估參數(shù)F1的值來評(píng)判模型。評(píng)估準(zhǔn)確率是表示評(píng)估模型總體好壞的指標(biāo),然而采煤機(jī)健康狀態(tài)評(píng)估樣本存在不平衡問題,即健康樣本數(shù)量遠(yuǎn)多于不健康的樣本,僅憑單一的準(zhǔn)確率指標(biāo)無法定性模型的評(píng)估效果,因此用每一類樣本中被正確分類的數(shù)量占該類健康狀態(tài)樣本中的比例即來評(píng)價(jià)模型對(duì)樣本不平衡問題的適用程度。同時(shí)為避免單一準(zhǔn)確率和召回率評(píng)價(jià)指標(biāo)的弊端,采用兩者的綜合評(píng)價(jià)指標(biāo)F1值來綜合反映評(píng)估模型的效果,F(xiàn)1值越接近于1,評(píng)估模型的分類效果越好。通過程序運(yùn)行,評(píng)估過程中測(cè)試集的多分類錯(cuò)誤率merror如圖8所示,得到模型的具體評(píng)估結(jié)果用混淆矩陣表示如圖9所示。

        由圖9可以看出,在200組數(shù)據(jù)中,有197組狀態(tài)數(shù)據(jù)被正確分類,即197組狀態(tài)數(shù)據(jù)可以被準(zhǔn)確得到對(duì)應(yīng)的健康狀態(tài),有1組數(shù)據(jù)屬于“健康”狀態(tài)而被分類為“良好”狀態(tài),有2組數(shù)據(jù)屬于“劣化”狀態(tài)而被分類為故障狀態(tài),但狀態(tài)預(yù)測(cè)結(jié)果與實(shí)際只相差一個(gè)等級(jí),對(duì)結(jié)果影響不是特別大。模型總體評(píng)估效果較好,總體準(zhǔn)確率高達(dá)98.50%,“健康”狀態(tài)等級(jí)準(zhǔn)確率為98.66%,“良好”狀態(tài)等級(jí)準(zhǔn)確率為100%,“劣化”狀態(tài)等級(jí)準(zhǔn)確率為94.87%,“故障”狀態(tài)等級(jí)評(píng)估準(zhǔn)確率為100%,4種健康狀態(tài)等級(jí)的平均召回率為98.38%,F(xiàn)1平均值為97.61%,平均召回率和FI值較高,說明模型對(duì)采煤機(jī)數(shù)據(jù)集每種狀態(tài)和總體的評(píng)估效果都較好。

        5 結(jié) 語

        本文針對(duì)采煤機(jī)變工況、工作環(huán)境惡劣等特點(diǎn),將XGBoost集成學(xué)習(xí)方法引入采煤機(jī)健康狀態(tài)評(píng)估工作中,根據(jù)綜合相關(guān)系數(shù),對(duì)采煤機(jī)狀態(tài)指標(biāo)進(jìn)行篩選。實(shí)驗(yàn)表明,經(jīng)過調(diào)參以后的模型評(píng)估效率和準(zhǔn)確性較高,更適用于采煤機(jī)不平衡數(shù)據(jù)集。

        猜你喜歡
        錯(cuò)誤率采煤機(jī)分類
        限制性隨機(jī)試驗(yàn)中選擇偏倚導(dǎo)致的一類錯(cuò)誤率膨脹*
        煤礦用隔爆型采煤機(jī)電機(jī)FMECA分析
        分類算一算
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        正視錯(cuò)誤,尋求策略
        教師·中(2017年3期)2017-04-20 21:49:49
        解析小學(xué)高段學(xué)生英語單詞抄寫作業(yè)錯(cuò)誤原因
        降低學(xué)生計(jì)算錯(cuò)誤率的有效策略
        MGTY300/700-1.1D采煤機(jī)制動(dòng)系統(tǒng)分析改進(jìn)
        河南科技(2014年18期)2014-02-27 14:14:58
        男女动态视频99精品| 国产精品自线在线播放| 国产激情一区二区三区成人免费| 美女极度色诱视频国产免费 | 中文人妻av久久人妻18| 国产成人av综合色| 午夜无码伦费影视在线观看| 精品久久久中文字幕人妻| 连续高潮喷水无码| 日韩不卡无码三区| 一区二区三区视频免费观看在线 | 久久九九有精品国产尤物| 精品一区二区三区影片| 毛片色片av色在线观看| 日韩在线一区二区三区中文字幕| 中文字幕女同系列在线看一| 精品国偷自产在线视频九色| 人妻丰满熟妇av无码区hd| 国产精品免费久久久久影院| 久久av无码精品人妻糸列| 亚洲国产一区久久yourpan| 亚洲乱码中文字幕第一页| 亚洲国产精品久久无人区| 国产一区二区三区小说| 久久精品人妻无码一区二区三区| 日本老熟欧美老熟妇| 精品无码久久久久久久久粉色| 青青草免费高清视频在线观看| 成人影院视频在线播放| 手机在线观看免费av网站| av人摸人人人澡人人超碰妓女 | 女人色熟女乱| 久久精品国产亚洲av瑜伽| 久久精品国产精品亚洲婷婷| 在线亚洲免费精品视频| 久久精品国产亚洲av精东| 国产精品www夜色视频| 嫩草影院未满十八岁禁止入内| 中文字幕永久免费观看| 久久国产精品av在线观看| 精品高朝久久久久9999|