亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        不平衡數(shù)據(jù)集下齒輪裝配的故障診斷方法

        2023-06-25 17:21:37王喆徐曦張畢生黃曉瑋胡萬(wàn)里
        現(xiàn)代信息科技 2023年6期
        關(guān)鍵詞:隨機(jī)森林故障診斷

        王喆 徐曦 張畢生 黃曉瑋 胡萬(wàn)里

        摘? 要:汽車(chē)零部件的齒輪裝配過(guò)程中往往伴隨著多種類(lèi)型的故障,快速且精準(zhǔn)地判斷故障類(lèi)型,對(duì)保證齒輪裝配工位穩(wěn)定運(yùn)行具有重要意義。因此,提出一種基于SMOTE采樣方法和隨機(jī)森林(RF)分類(lèi)方法的故障診斷模型——SMOTE-RF。首先,在實(shí)際齒輪裝配過(guò)程中,故障數(shù)據(jù)是不平衡的,可以使用SMOTE算法生成平衡的故障數(shù)據(jù);其次,將平衡后的數(shù)據(jù)作為隨機(jī)森林算法的輸入實(shí)現(xiàn)故障分類(lèi);最后,對(duì)模型進(jìn)行性能評(píng)估。實(shí)驗(yàn)結(jié)果表明,SMOTE-RF模型的分類(lèi)效果優(yōu)于SVM和XGBoost。

        關(guān)鍵詞:故障診斷;不平衡數(shù)據(jù);SMOTE算法;隨機(jī)森林

        中圖分類(lèi)號(hào):TP391.4;TP181 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2023)06-0139-05

        Fault Diagnosis Method of Gear Assembly under Imbalanced Data Set

        WANG Zhe1,2, XU Xi1,2, ZHANG Bisheng3, HUANG Xiaowei3, HU Wanli4

        (1.School of Computer Science, Hunan University of Technology, Zhuzhou? 412007, China; 2.Key Laboratory of Intelligent Information Perception and Processing Technology of Hunan Province, Hunan University of Technology, Zhuzhou? 412007, China; 3.Bosch Automotive Products (Changsha) Co., Ltd, Changsha? 410100, China; 4.Changsha Robot Technology Co., Ltd., Changsha? 410100, China)

        Abstract: The gear assembly process of automobile parts is often accompanied by various types of faults. It is of great significance to quickly and accurately determine the fault type to ensure the stable operation of the gear assembly station. Therefore, a fault diagnosis model based on SMOTE sampling method and Random Forest (RF) classification method, SMOTE-RF, is proposed. Firstly, in the actual gear assembly process, the fault data is unbalanced, and the SMOTE algorithm can be used to generate balanced fault data. Secondly, the balanced data is used as the input of Random Forest algorithm to realize fault classification. Finally, the performance of the model is evaluated. The experimental results show that the classification effect of SMOTE-RF model is better than that of SVM and XGBoost.

        Keywords: fault diagnosis; imbalanced data; SMOTE algorithm; Random Forest

        0? 引? 言

        裝配是將各種零部件按照一定順序組合在一起以實(shí)現(xiàn)產(chǎn)品預(yù)定的功能,它不僅是制造過(guò)程中的最后一個(gè)環(huán)節(jié),還是保證產(chǎn)品質(zhì)量的重要一環(huán),所以確保產(chǎn)品裝配過(guò)程中的可靠性、持續(xù)性是提高產(chǎn)品質(zhì)量的有效方法之一[1]。在汽車(chē)裝配線中,零部件的裝配是一個(gè)很重要的過(guò)程,而齒輪裝配正是汽車(chē)零部件裝配的重要組成部分之一[2]。在齒輪裝配的過(guò)程中,難免會(huì)發(fā)生異?;蚬收?,如果不能迅速正確地處理好這些故障問(wèn)題,不僅影響產(chǎn)線的生產(chǎn),還可能造成嚴(yán)重的安全事故。因此為了保證齒輪裝配能夠安全、有效地運(yùn)行,對(duì)其進(jìn)行故障檢測(cè)與診斷是很有必要的。

        故障診斷在尋找設(shè)備監(jiān)測(cè)數(shù)據(jù)和設(shè)備健康狀態(tài)之間的關(guān)系時(shí)尤為重要。傳統(tǒng)上,這種關(guān)系是由經(jīng)驗(yàn)豐富的工程師用專(zhuān)業(yè)知識(shí)來(lái)把握的[3]。例如目前長(zhǎng)沙某汽車(chē)零部件公司的IPB產(chǎn)線中的齒輪裝配工位在裝配過(guò)程中發(fā)生故障后,需要相關(guān)專(zhuān)家根據(jù)設(shè)備的壓裝曲線圖進(jìn)行分析,判斷故障類(lèi)型。然而,在工程場(chǎng)景中,更需要有一種自動(dòng)化的方法能夠在提高診斷準(zhǔn)確率的前提下,盡可能縮短診斷時(shí)間。同時(shí),隨著5G技術(shù)及AIoT解決方案在該公司的不斷落地,數(shù)字化轉(zhuǎn)型的推進(jìn)進(jìn)一步深入,建立基于實(shí)時(shí)數(shù)據(jù)鏡像映射的工業(yè)數(shù)字孿生被提上日程,而齒輪裝配工位的故障診斷正是其中的重要組成部分之一。因此,通過(guò)分析歷史故障數(shù)據(jù)信息,采用有監(jiān)督學(xué)習(xí)方法將其相關(guān)屬性與故障類(lèi)型標(biāo)簽進(jìn)行映射,以實(shí)現(xiàn)故障類(lèi)型的識(shí)別,可有效提高故障診斷的效率,對(duì)齒輪裝配穩(wěn)定運(yùn)行具有重要意義。

        隨著機(jī)器學(xué)習(xí)的快速發(fā)展,在智能故障診斷領(lǐng)域中多類(lèi)別的故障分類(lèi)技術(shù)是非常重要的研究方向之一,目前主流的分類(lèi)方法包括支持向量機(jī)(Support Vector machine, SVM)[4]、決策和回歸樹(shù)(Classification and Regression Tree, CART)[5]以及神經(jīng)網(wǎng)絡(luò)[6]等。在大數(shù)據(jù)樣本下,單個(gè)分類(lèi)器的性能已經(jīng)難以達(dá)到分類(lèi)精度需求,所以需要將多個(gè)分類(lèi)器組合在一起,集成分類(lèi)器擁有更高的準(zhǔn)確率。隨機(jī)森林(Random Forest, RF)[7]是一種有監(jiān)督的集成學(xué)習(xí)算法,它是由Leo Breiman等在2001年提出的一種機(jī)器學(xué)習(xí)方法。該算法具備分類(lèi)性能好、不易過(guò)擬合、訓(xùn)練效率高等優(yōu)點(diǎn),因此常常應(yīng)用于故障診斷領(lǐng)域,如徐佳慶提出的對(duì)高性能互連網(wǎng)絡(luò)阻塞故障檢測(cè)方法[8]。

        此外,在齒輪裝配過(guò)程中不同故障出現(xiàn)的頻率相差很大,會(huì)出現(xiàn)部分故障樣本過(guò)少的情況,導(dǎo)致在進(jìn)行故障分類(lèi)時(shí),分類(lèi)模型無(wú)法準(zhǔn)確識(shí)別出故障樣本過(guò)少的故障類(lèi)別,反而對(duì)多數(shù)樣本類(lèi)型過(guò)于敏感,使得分類(lèi)模型泛化能力較差。因此,在訓(xùn)練分類(lèi)模型之前需要解決樣本不平衡的問(wèn)題。通常我們會(huì)對(duì)原始數(shù)據(jù)集進(jìn)行重采樣,分為過(guò)采樣、欠采樣和混合采樣[9]。合成少數(shù)類(lèi)過(guò)采樣(Synthetic Minority Oversampling, SMOTE)是Chawla等[10]在2002年提出的,該算法是基于K-最近鄰算法(K-Nearest-Neighbors, KNN)[11]在鄰近樣本中隨機(jī)插值,在不平衡問(wèn)題中常常采用SMOTE對(duì)少數(shù)類(lèi)樣本過(guò)采樣來(lái)平衡數(shù)據(jù)集。

        本文針對(duì)齒輪裝配過(guò)程中不同故障類(lèi)型樣本數(shù)據(jù)不平衡的問(wèn)題,提出了首先利用SMOTE算法對(duì)不平衡的原始數(shù)據(jù)集進(jìn)行處理生成新的均衡數(shù)據(jù)集,然后將均衡數(shù)據(jù)集放入隨機(jī)森林模型進(jìn)行訓(xùn)練,構(gòu)建SMOTE與隨機(jī)森林結(jié)合的算法模型,即SMOTE-RF模型。最后為了避免在對(duì)模型性能評(píng)估時(shí)偏向于多數(shù)類(lèi),使用綜合考慮所有類(lèi)別各自的召回率和準(zhǔn)確率的評(píng)估指標(biāo)來(lái)對(duì)分類(lèi)模型進(jìn)行評(píng)價(jià)。結(jié)果表明SMOTE-RF模型的分類(lèi)效果優(yōu)于不進(jìn)行平衡處理的模型,同時(shí)也驗(yàn)證了在分類(lèi)效果方面,相較于SVM和XGBoost,隨機(jī)森林的分類(lèi)效果更優(yōu)。

        1? 基于SMOTE-RF的故障診斷

        1.1? SMOTE算法

        SMOTE算法的基本思想是通過(guò)少量樣本與其相鄰樣本之間的隨機(jī)線性?xún)?nèi)插來(lái)獲得新樣本。SMOTE算法為少數(shù)類(lèi)中的每個(gè)樣本搜索其最近的相鄰樣本。通過(guò)合成一定數(shù)量的人工少數(shù)樣本使類(lèi)別分布平衡,降低過(guò)擬合的可能性,從而提高不平衡數(shù)據(jù)集的分類(lèi)效果,并且提高分類(lèi)器的泛化性能。SMOTE的具體過(guò)程如下:

        Step1:對(duì)于每個(gè)少數(shù)類(lèi)樣本xi (i=1, 2,…, n),按照一定的規(guī)則計(jì)算其與少數(shù)樣本中其他樣本的距離,得到其k個(gè)最近鄰域。

        Step2:根據(jù)過(guò)采樣放大倍數(shù),選擇每個(gè)樣本x的隨機(jī)m個(gè)最近鄰作為k個(gè)最近鄰集合的子集,記為xij ( j=1, 2,…, m),然后用式(1)計(jì)算人工構(gòu)造的少數(shù)樣本pij:

        pij=xi+rand(0, 1)×(xij-xi), i=1, 2,…, N? ? ? ? ?(1)

        其中,rand(0, 1)是在[0, 1]范圍內(nèi)均勻分布的隨機(jī)數(shù)。直到新生成的少數(shù)類(lèi)數(shù)據(jù)與多數(shù)類(lèi)數(shù)據(jù)達(dá)到一定的不平衡比才停止式(1)的運(yùn)算。

        1.2? 隨機(jī)森林算法

        隨著機(jī)器學(xué)習(xí)領(lǐng)域的快速發(fā)展,隨機(jī)森林因其高容錯(cuò)性和強(qiáng)分類(lèi)性能而得到廣泛應(yīng)用。傳統(tǒng)的隨機(jī)森林算法被用來(lái)處理平衡數(shù)據(jù)集,但在實(shí)際問(wèn)題中,不平衡數(shù)據(jù)集更為常見(jiàn)。隨機(jī)森林是由多棵相互之間獨(dú)立的決策樹(shù)組合在一起的一種袋裝集成學(xué)習(xí)算法。隨機(jī)森林中的每一顆決策樹(shù)都是通過(guò)Boostrap進(jìn)行有放回的抽樣方法從原始樣本中抽取多個(gè)樣本得到的,然后將這些決策樹(shù)組合在一起,并行的完成學(xué)習(xí)任務(wù),通過(guò)投票的方式得到最終的預(yù)測(cè)和分類(lèi)結(jié)果。隨機(jī)森林的構(gòu)建過(guò)程如下:

        Step1:構(gòu)建訓(xùn)練子集。給定原始數(shù)據(jù)集D,總樣本數(shù)為M,特征屬性總數(shù)為R;利用Boostrap有放回的隨機(jī)抽樣方法從原始數(shù)據(jù)D中抽取n個(gè)樣本,并重復(fù)n次,構(gòu)建訓(xùn)練子集,其中訓(xùn)練子集小于M,其余的構(gòu)建為袋外測(cè)試集OOB。

        Step2:構(gòu)建決策樹(shù)。從R個(gè)特征屬性中隨機(jī)抽取r個(gè)(r<R),利用訓(xùn)練子集構(gòu)建完全分裂的決策樹(shù)。

        Step3:生成隨機(jī)森林。重復(fù)Step2步驟K次,直至構(gòu)建K棵決策樹(shù),以組成隨機(jī)森林{ti, i=1, 2, …, K}。

        Step4:結(jié)果預(yù)測(cè)。通過(guò)K棵決策樹(shù)分別對(duì)OOB測(cè)試集進(jìn)行分類(lèi),匯總K次決策樹(shù)分類(lèi)的結(jié)果{ti, i=1, 2, …, K}。

        {t1(x), t2(x),…, tk(x)},用少數(shù)服從多數(shù)的投票方式得出最終的分類(lèi)結(jié)果,該結(jié)果即為隨機(jī)森林的分類(lèi)結(jié)果:

        (2)

        1.3? SMOTE算法與隨機(jī)森林算法組合

        將RF算法應(yīng)用于齒輪壓裝故障診斷時(shí),診斷結(jié)果通常會(huì)傾向于多數(shù)類(lèi),盡管整體的分類(lèi)準(zhǔn)確率較高,但是對(duì)少數(shù)類(lèi)樣本分類(lèi)的準(zhǔn)確率很低。在齒輪壓裝運(yùn)行的實(shí)際數(shù)據(jù)中,故障樣本遠(yuǎn)遠(yuǎn)少于正常樣本,但是在故障診斷模型中對(duì)少數(shù)類(lèi)的故障樣本的分類(lèi)精度更為重要。為了解決上述問(wèn)題,本文提出了基于SMOTE-RF的齒輪壓裝故障診斷模型,模型的整體結(jié)構(gòu)如圖1所示,具體步驟為:

        (1)數(shù)據(jù)預(yù)處理。對(duì)數(shù)據(jù)進(jìn)行篩選,剔除異常數(shù)據(jù),去除冗余數(shù)據(jù),提取合適的特征來(lái)構(gòu)建原始數(shù)據(jù)集。

        (2)SMOTE過(guò)采樣。通過(guò)SMOTE算法對(duì)原始數(shù)據(jù)集中少數(shù)類(lèi)的故障數(shù)據(jù)進(jìn)行過(guò)采樣,并把過(guò)采樣所生成的新的數(shù)據(jù)與多數(shù)類(lèi)樣本合并,以此得到類(lèi)別均衡的數(shù)據(jù)集。

        (3)隨機(jī)森林算法訓(xùn)練。將處理后產(chǎn)生的均衡數(shù)據(jù)集使用隨機(jī)森林進(jìn)行訓(xùn)練,利用網(wǎng)格搜索算法對(duì)隨機(jī)森林模型進(jìn)行參數(shù)優(yōu)化,來(lái)提升分類(lèi)結(jié)果的準(zhǔn)確率。

        (4)模型評(píng)估。構(gòu)建齒輪裝配故障診斷模型評(píng)估指標(biāo),將測(cè)試集輸入到已經(jīng)訓(xùn)練好的模型中進(jìn)行故障類(lèi)別的分類(lèi),然后再將分類(lèi)結(jié)果與測(cè)試集對(duì)應(yīng)數(shù)據(jù)的真實(shí)類(lèi)別對(duì)比,以此來(lái)驗(yàn)證模型的準(zhǔn)確性。

        2? 實(shí)驗(yàn)結(jié)果與分析

        2.1? 數(shù)據(jù)集

        本文實(shí)驗(yàn)所采用的數(shù)據(jù)源自長(zhǎng)沙某汽車(chē)部件公司IPB產(chǎn)線的齒輪壓裝工位2022年4月11日至2022年4月15日的實(shí)際運(yùn)行數(shù)據(jù)。其中包含齒輪壓裝的正常運(yùn)行狀態(tài)和故障狀態(tài)。數(shù)據(jù)特征包括齒輪類(lèi)型、壓裝時(shí)間、壓裝位移和壓裝力矩。檢定的故障原因包括壓入力超過(guò)上限、壓入力超過(guò)下線、無(wú)壓入力或壓入力很小以及其他故障,為了方便表示,下文將各類(lèi)故障名替換為類(lèi)別編碼。

        本文所用模型為有監(jiān)督學(xué)習(xí),因此需要將部分缺失故障樣本或者故障樣本數(shù)量不足10個(gè)的故障類(lèi)別進(jìn)行舍去,經(jīng)過(guò)處理后數(shù)據(jù)集共有10 177條數(shù)據(jù),包括4個(gè)輸入特征和4種故障類(lèi)別,各類(lèi)故障樣本數(shù)量如表1所示。

        由表1可得,其中正常類(lèi)別的樣本量最多,故障類(lèi)別2的樣本量最少,相對(duì)于正常類(lèi)別來(lái)說(shuō),故障類(lèi)別1、2、3不平衡率均較高,都屬于少數(shù)類(lèi)樣本,需要在實(shí)驗(yàn)分析時(shí)更為關(guān)注。

        2.2? 評(píng)價(jià)指標(biāo)

        常用的分類(lèi)評(píng)價(jià)標(biāo)準(zhǔn)是針對(duì)平衡數(shù)據(jù)集的。但這些評(píng)價(jià)標(biāo)準(zhǔn)并不適用于不平衡的數(shù)據(jù)集。例如,分類(lèi)的正確率。考慮一個(gè)極端情況,假如一個(gè)數(shù)據(jù)集中有99個(gè)負(fù)樣本和1個(gè)正樣本,即使分類(lèi)器判斷所有樣本都是負(fù)樣本,分類(lèi)器的整體預(yù)測(cè)準(zhǔn)確率也能夠達(dá)到99%。但這個(gè)分類(lèi)器顯然是沒(méi)有意義的。

        為了有效地評(píng)估分類(lèi)器對(duì)不平衡數(shù)據(jù)集的效果,本人使用的指標(biāo)為F1-Score值、AUC(Area Under the Curve)值[12]和ROC(Receiver Operating Characteristic)[13]曲線,這三類(lèi)評(píng)價(jià)指標(biāo)都是基于混淆矩陣得到的,混淆矩陣如表2所示。

        F1-Score值是一個(gè)從正樣本的角度評(píng)價(jià)不平衡集的分類(lèi)性能的指標(biāo)。F1-Score值越高,模型的分類(lèi)效果就越好。AUC表示被正確分類(lèi)的樣本總數(shù)與樣本總數(shù)的比率。AUC一般在0到1之間,AUC越高,表示分類(lèi)器的性能越好。如果AUC為0.5,則完全是隨機(jī)猜測(cè)的結(jié)果。ROC曲線則是不平衡數(shù)據(jù)分類(lèi)問(wèn)題最為常見(jiàn)的評(píng)價(jià)指標(biāo),在評(píng)價(jià)隨機(jī)森林的整體分類(lèi)性能,可以通過(guò)ROC曲線來(lái)展現(xiàn)。ROC曲線在坐標(biāo)軸上的位置越靠近左上方就代表該分類(lèi)器的處理不平衡數(shù)據(jù)的性能越出色。同時(shí)ROC曲線下的面積即為AUC值,AUC值也可以更為直觀的反應(yīng)分類(lèi)器的效果:

        (3)

        (4)

        其中β∈(0, 1),但β通常為1。并且:

        (5)

        (6)

        2.3? 實(shí)驗(yàn)結(jié)果與分析

        為了驗(yàn)證本文所用SMOTE-RF算法的有效性,將本文提出的方法與支持向量機(jī)(SVM)和極端梯度提升(XGBoost)算法進(jìn)行實(shí)驗(yàn)對(duì)比與分析,分別測(cè)試在原始數(shù)據(jù)集下隨機(jī)森林算法的分類(lèi)效果、在SMOTE過(guò)采樣的數(shù)據(jù)集下SVM和XGBoost的分類(lèi)效果,比較他們的分類(lèi)性能。實(shí)驗(yàn)環(huán)境均是在PyCharm基于Python 3.9的sklearn庫(kù)來(lái)實(shí)現(xiàn)。其中原始數(shù)據(jù)集和均衡數(shù)據(jù)集均按照4:1的比例隨機(jī)分為訓(xùn)練集和測(cè)試集。

        首先用原始數(shù)據(jù)集輸入到隨機(jī)森林進(jìn)行訓(xùn)練,然后再將過(guò)采樣后的數(shù)據(jù)集逐次輸入到SVM、XGBoost和隨機(jī)森林中進(jìn)行訓(xùn)練,可以得到各分類(lèi)器的F1-Score值,如表3所示,該值越高所對(duì)應(yīng)的分類(lèi)器故障分類(lèi)的性能就越好。

        從表3可以看出:

        (1)通過(guò)SMOTE算法對(duì)少數(shù)類(lèi)進(jìn)行插值來(lái)平衡數(shù)據(jù),一定程度上提上了隨機(jī)森林的分類(lèi)性能,相比于未經(jīng)過(guò)不平衡數(shù)據(jù)處理的原始數(shù)據(jù)集放入隨機(jī)森林中訓(xùn)練后模型的分類(lèi)效果,均衡數(shù)據(jù)集下模型分類(lèi)效果更好。

        (2)在均衡數(shù)據(jù)集下,將隨機(jī)森林、SVM和XGBoost分別進(jìn)行訓(xùn)練后,SMOTE-RF的F1-Score值可以達(dá)到0.997 0,和SVM和XGBoost兩種分類(lèi)器相比,隨機(jī)森林的分類(lèi)效果明顯優(yōu)于他們。

        ROC曲線圖的橫軸為負(fù)正類(lèi)率,縱軸為真正類(lèi)率。根據(jù)圖2的ROC曲線可以看出,相比于原始數(shù)據(jù)集訓(xùn)練的隨機(jī)森林,通過(guò)SMOTE算法對(duì)原始數(shù)據(jù)集過(guò)采樣之后的隨機(jī)森林AUC提高了2.19%,說(shuō)明經(jīng)過(guò)SMOTE過(guò)采樣后,均衡的數(shù)據(jù)集能夠一定程度上提高隨機(jī)森林的分類(lèi)性能。

        由圖3可以得出,在相同的經(jīng)過(guò)SMOTE過(guò)采樣的均衡數(shù)據(jù)集下,隨機(jī)森林算法的AUC值比SVM和XGBoost的分別高了1.88%和2.6%,隨機(jī)森林的ROC曲線整體在其他兩種算法之上。

        通過(guò)實(shí)驗(yàn)結(jié)果表明,經(jīng)過(guò)SMOTE過(guò)采樣之后隨機(jī)森林的分類(lèi)性能很優(yōu)異,說(shuō)明本文所提的方法可以在讓隨機(jī)森林的分類(lèi)性能進(jìn)一步得到提升;從分類(lèi)器來(lái)看,在同一均衡數(shù)據(jù)集下,隨機(jī)森林的分類(lèi)性能明顯高于SVM和XGBoost,具有較強(qiáng)的綜合分類(lèi)能力,在齒輪裝配的故障分類(lèi)的問(wèn)題會(huì)更有效。

        2.4? 應(yīng)用場(chǎng)景

        本文所提出的基于SMOTE-RF的故障診斷模型可以用于汽車(chē)零部件中齒輪裝配的工位上,對(duì)數(shù)據(jù)實(shí)時(shí)采集,將壓裝的實(shí)時(shí)數(shù)據(jù)輸入到故障診斷模型中,通過(guò)故障診斷模型對(duì)每一次的壓裝數(shù)據(jù)進(jìn)行判斷,如若出現(xiàn)故障,則迅速在顯示屏上顯示故障類(lèi)型和故障原因,及時(shí)告知產(chǎn)線工作人員出現(xiàn)故障的原因,方便工作人員能夠及時(shí)地解決故障問(wèn)題,保證產(chǎn)線的正常、可靠的運(yùn)行?,F(xiàn)場(chǎng)效果圖如圖4和圖5所示。

        3? 結(jié)? 論

        考慮到齒輪裝配的實(shí)際情況下數(shù)據(jù)不平衡問(wèn)題,本文提出了一種考慮到多種類(lèi)型數(shù)據(jù)不平衡的齒輪裝配故障診斷方法,通過(guò)SMOTE過(guò)采樣方法降低原始數(shù)據(jù)集的不平衡性,再將經(jīng)過(guò)處理后的數(shù)據(jù)作為隨機(jī)森林的輸入以提高算法分類(lèi)的精度。本文利用長(zhǎng)沙某汽車(chē)部件公司IPB產(chǎn)線的齒輪壓裝工位的故障數(shù)據(jù)對(duì)所提方法進(jìn)行驗(yàn)證,實(shí)驗(yàn)表明本文方法能夠有效提高齒輪裝配故障分類(lèi)的精度,同時(shí)證明了相比于SVM和XGBoost的故障分類(lèi)精度,SMOTE方法和隨機(jī)森林的結(jié)合具有顯著的優(yōu)勢(shì)。后續(xù)將收集更多齒輪裝配的故障樣本數(shù)據(jù),可以研究在不同樣本量分別進(jìn)行采樣時(shí)分類(lèi)器的性能變化;同時(shí)還需要尋找更多潛在的數(shù)據(jù)特征,以提高分類(lèi)器的泛化性。

        參考文獻(xiàn):

        [1] 吳清偉,葛茂根,王強(qiáng).面向機(jī)械產(chǎn)品裝配過(guò)程的在線故障診斷策略研究 [J].機(jī)械工程師,2014(7):60-62.

        [2] 謝宇嬋.基于物聯(lián)網(wǎng)的汽車(chē)裝配線智慧電動(dòng)工具控制研究 [D].長(zhǎng)春:長(zhǎng)春工業(yè)大學(xué),2022.

        [3] LEI Y G,YANG B,JIANG X W,et al. Applications of machine learning to machine fault diagnosis:A review and roadmap [J/OL].Mechanical Systems and Signal Processing,2020,138:106587[2022-09-20].https://doi.org/10.1016/j.ymssp.2019.106587.

        [4] KANG Q,SHI L,ZHOU M C,et al. A distance-based weighted undersampling scheme for support vector machines and its application to imbalanced classification [J].IEEE transactions on neural networks and learning systems,2017,29(9):4152-4165.

        [5] LIU W,CHAWLA S,CIESLAK D A,et al. A Robust Decision Tree Algorithm for Imbalanced Data Sets [C]//Proceedings of the 2010 SIAM International Conference on Data Mining. Society for Industrial and Applied MathematicsA Robust Decision Tree Algorithm for Imbalanced Data Sets,2010:766-777.

        [6] JIANG G Q,HE H B,YAN J,et al. Multiscale convolutional neural networks for fault diagnosis of wind turbine gearbox [J].IEEE Transactions on Industrial Electronics,2018,66(4):3196-3207.

        [7] BREIMAN L. Random Forests [J].Machine learning,2001,45(1):5-32.

        [8] 徐佳慶,胡小月,唐付橋,等.基于隨機(jī)森林的高性能互連網(wǎng)絡(luò)阻塞故障檢測(cè) [J].計(jì)算機(jī)科學(xué),2021,48(6):246-252.

        [9] 翟嘉琪,楊希祥,程玉強(qiáng),等.機(jī)器學(xué)習(xí)在故障檢測(cè)與診斷領(lǐng)域應(yīng)用綜述 [J].計(jì)算機(jī)測(cè)量與控制,2021,29(3):1-9.

        [10] CHAWLA N V,BOWYER K W,HALL L O,et al. SMOTE:synthetic minority over-sampling technique [J].Journal of artificial intelligence research,2002,16(1):321-357.

        [11] GUO G D,WANG H,BELL D,et al. KNN Model-Based Approach in Classification [C]//OTM 2003:On The Move to Meaningful Internet Systems 2003:CoopIS,DOA,and ODBASE.Catania:Springer,2003:986-996.

        [12] 王誠(chéng),趙曉培.基于混合采樣的改進(jìn)隨機(jī)森林算法研究 [J].計(jì)算機(jī)技術(shù)與發(fā)展,2021,31(12):50-54+91.

        [13] 汪力純,劉水生.基于混合采樣和特征選擇的改進(jìn)隨機(jī)森林算法研究 [J].南京郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2022,42(1):81-89.

        作者簡(jiǎn)介:王喆(1997—),男,漢族,湖南長(zhǎng)沙人,碩士在讀,研究方向:工業(yè)物聯(lián)網(wǎng)。

        收稿日期:2022-10-20

        基金項(xiàng)目:湖南省教委科研基金(19K026);湖南省重點(diǎn)實(shí)驗(yàn)室建設(shè)項(xiàng)目(2020KF02)

        猜你喜歡
        隨機(jī)森林故障診斷
        凍干機(jī)常見(jiàn)故障診斷與維修
        隨機(jī)森林在棉蚜蟲(chóng)害等級(jí)預(yù)測(cè)中的應(yīng)用
        基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類(lèi)算法
        軟件(2016年7期)2017-02-07 15:54:01
        拱壩變形監(jiān)測(cè)預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
        基于量子萬(wàn)有引力搜索的SVM自駕故障診斷
        基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
        因果圖定性分析法及其在故障診斷中的應(yīng)用
        基于隨機(jī)森林算法的B2B客戶(hù)分級(jí)系統(tǒng)的設(shè)計(jì)
        基于多視角特征融合與隨機(jī)森林的蛋白質(zhì)結(jié)晶預(yù)測(cè)
        基于LCD和排列熵的滾動(dòng)軸承故障診斷
        国产啪亚洲国产精品无码| 亚洲国产成人久久精品美女av| 欧美日韩一线| 国内精品久久人妻互换| 精品国产成人av久久| 亚洲国产精品久久久久秋霞小说| 亚洲色婷婷一区二区三区| 久久成年片色大黄全免费网站| 日韩在线视精品在亚洲| 少妇特殊按摩高潮对白| 国产高清精品一区二区| 亚洲午夜无码毛片av久久| 国产亚洲午夜高清国产拍精品| 97人人超碰国产精品最新o| WWW拍拍拍| 少妇精品揄拍高潮少妇桃花岛 | 午夜成人理论福利片| 黑人玩弄人妻中文在线| 亚洲欧洲综合有码无码| 女主播啪啪大秀免费观看| 中文精品久久久久人妻不卡| 97久久精品人人做人人爽| 国产强伦姧在线观看| 久久本道久久综合一人| 我和丰满妇女激情视频| 亚洲人成无码区在线观看| 纯爱无遮挡h肉动漫在线播放| 在线免费欧美| 亚洲国产精品成人一区二区在线| 999国产精品999久久久久久| 亚洲h在线播放在线观看h| 国产女人精品视频国产灰线| 国产一区二区三区视频大全| 91九色最新国产在线观看| 玩50岁四川熟女大白屁股直播| 国产精品九九九无码喷水| 亚洲精品日本久久久中文字幕| 亚洲人成伊人成综合久久| av免费不卡国产观看| 国产一级做a爱免费观看| 极品视频一区二区三区在线观看|