梁超
摘? 要:預(yù)測(cè)性維護(hù)是工業(yè)互聯(lián)網(wǎng)應(yīng)用的重點(diǎn),實(shí)現(xiàn)預(yù)測(cè)性維護(hù)的關(guān)鍵是對(duì)設(shè)備系統(tǒng)或核心部件的壽命進(jìn)行有效預(yù)測(cè)。隨著近年來機(jī)器學(xué)習(xí)的發(fā)展,機(jī)械設(shè)備海量數(shù)據(jù)已成為工業(yè)互聯(lián)網(wǎng)分析核心部件剩余壽命的關(guān)鍵指標(biāo),也成為設(shè)備健康管理決策性數(shù)據(jù)?;诠こ虣C(jī)械設(shè)備大數(shù)據(jù),結(jié)合XGBoost、隨機(jī)森林、LightGBM等多種機(jī)器學(xué)習(xí)模型,多維度探究影響機(jī)械核心部件壽命的機(jī)器學(xué)習(xí)模型效果,建立Stacking算法模型融合的部件壽命預(yù)測(cè)模型,并在核心部件數(shù)據(jù)上驗(yàn)證模型預(yù)測(cè)有效性,從而減少設(shè)備非計(jì)劃停機(jī)時(shí)間,推進(jìn)智能制造和預(yù)測(cè)性維護(hù)的進(jìn)步。
關(guān)鍵詞:工程機(jī)械;壽命預(yù)測(cè);機(jī)器學(xué)習(xí);Stacking
中圖分類號(hào):TP181? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
Life Prediction of Construction Machinery Core Components
Based on Stacking Model Fusion
LIANG Chao
(School of Information Science and Technology,Zhejiang SCI-TECH University,Hangzhou 310018,China)
Life Prediction of Construction Machinery Core Components
Based on Stacking Model Fusion
LIANG Chao
(School of Information Science and Technology,Zhejiang SCI-TECH University,Hangzhou 310018,China)
1? ?引言(Introduction)
在工業(yè)4.0的環(huán)境下,工程機(jī)械設(shè)備自動(dòng)化發(fā)展高速,設(shè)備部件在傳統(tǒng)機(jī)械行業(yè)運(yùn)行通信環(huán)境惡劣,為工程機(jī)械設(shè)備監(jiān)控管理帶來了新的挑戰(zhàn)。設(shè)備部件長期運(yùn)行,零部件壽命減少,可靠性降低將大大影響工程設(shè)備使用,甚至威脅人類生命財(cái)產(chǎn)安全。那么及時(shí)維護(hù)更換工程設(shè)備核心部件成為設(shè)備健康管理的關(guān)鍵。壽命預(yù)測(cè)是工程機(jī)械設(shè)備安全運(yùn)行的重要基礎(chǔ)[1]。早期部件壽命研究指的是基于理論物理學(xué)和統(tǒng)計(jì)學(xué),計(jì)算部件壽命,探索其電壓、電流、轉(zhuǎn)速、工作時(shí)長、溫度等數(shù)據(jù)挖掘出指標(biāo)之間的規(guī)律[2]。統(tǒng)計(jì)學(xué)模型則選擇合適的壽命分布模型,建立統(tǒng)計(jì)學(xué)可靠性高的概率性公式研究零部件特征分布,如正態(tài)分布、指數(shù)分布等[3]。物理學(xué)壽命預(yù)測(cè)模型則是根據(jù)零部件運(yùn)行過程物理感應(yīng)失效模型,損傷力學(xué),能量等方法對(duì)零部件失效類型進(jìn)行了定義分析,對(duì)各類零部件退化機(jī)能對(duì)應(yīng)物理模型定義,均偏重理論研究[4,5]。目前已經(jīng)廣泛運(yùn)用在汽車零部件等制造業(yè)中,但是在工程機(jī)械使用過程中,存在著數(shù)據(jù)非線性、不等長、維度多等波動(dòng),眾多參數(shù)甚至是傳感器無法及時(shí)傳播的,導(dǎo)致理論壽命計(jì)算出現(xiàn)較大誤差。
本文運(yùn)用大數(shù)據(jù)分析機(jī)器學(xué)習(xí)的方法評(píng)估零部件運(yùn)行中晚期健康狀態(tài),數(shù)據(jù)挖掘分析核心部件電動(dòng)機(jī)在相同情況下歷史數(shù)據(jù),探究影響機(jī)械核心部件壽命指標(biāo)關(guān)聯(lián)關(guān)系,如電流電壓、振動(dòng)、噪聲、轉(zhuǎn)速、溫度等,結(jié)合機(jī)器學(xué)習(xí)K-means聚類分析、線性回歸算法、隨機(jī)森林、LightGBM和XGBoost等方法,構(gòu)建與壽命相關(guān)的高質(zhì)量特征Stacking集成算法預(yù)測(cè)模型,可預(yù)先知曉設(shè)備零部件結(jié)果,及時(shí)檢測(cè)更換,有利于在機(jī)械設(shè)備使用中期發(fā)現(xiàn)設(shè)備零部件異常狀態(tài),增強(qiáng)零部件健康質(zhì)量把控。
2? 工程機(jī)械核心部件壽命預(yù)測(cè)數(shù)據(jù)處理(Processing of life prediction data for core components of construction machinery)
中期壽命預(yù)測(cè)是工程設(shè)備監(jiān)控管理的重要內(nèi)容,主要針對(duì)機(jī)械設(shè)備運(yùn)行過程中出現(xiàn)的狀態(tài)把控,防止運(yùn)行過程中發(fā)生意外[6]。很多設(shè)備零部件在未充分使用到設(shè)計(jì)壽命規(guī)定年限時(shí),就已經(jīng)損耗嚴(yán)重需要報(bào)廢。如果不能及時(shí)發(fā)現(xiàn),將會(huì)造成很大的影響,設(shè)備不合理使用也將會(huì)造成極大的浪費(fèi)[7]。通常在實(shí)際使用環(huán)境中預(yù)測(cè)存在較大偏差。因?yàn)楝F(xiàn)實(shí)采集到的數(shù)據(jù)數(shù)量龐大,復(fù)雜多變,基礎(chǔ)數(shù)據(jù)質(zhì)量差,能都對(duì)大量數(shù)據(jù)探索性分析研究,從中挖掘出與壽命相關(guān)隱藏的信息非常重要。
針對(duì)工程機(jī)械設(shè)備耗損性部件電動(dòng)機(jī),獲取到數(shù)據(jù)集包含訓(xùn)練集和測(cè)試集兩部分。訓(xùn)練集中涵蓋電動(dòng)機(jī)全壽命物聯(lián)網(wǎng)采樣數(shù)據(jù),即從安裝后一直到更換之間的對(duì)應(yīng)數(shù)據(jù),形式為多維時(shí)間序列[8]。字段“部件工作時(shí)長”的最大值,即為該部件實(shí)例的實(shí)際壽命。測(cè)試集中包含部件一段時(shí)間內(nèi)的電動(dòng)機(jī)物聯(lián)網(wǎng)采樣數(shù)據(jù),基于該段數(shù)據(jù),預(yù)測(cè)電動(dòng)機(jī)此后的剩余壽命。數(shù)據(jù)集中樣本EDA后特征數(shù)據(jù)字段如表1所示。
數(shù)據(jù)標(biāo)準(zhǔn)化(歸一化)處理,將消除指標(biāo)之間的量綱影響,解決數(shù)據(jù)指標(biāo)之間的可比性,使各指標(biāo)處于同一數(shù)量級(jí),適合進(jìn)行綜合對(duì)比評(píng)價(jià)[9]。采用Min-Max Normalization如公式(1),對(duì)數(shù)據(jù)進(jìn)行歸一化構(gòu)造量化[0,1]區(qū)間,特征縮放后梯度下降過程會(huì)更加筆直,收斂可以得到更快的提升,得到數(shù)據(jù)歸一化處理結(jié)果如表2所示。
3 工程機(jī)械核心部件壽命預(yù)測(cè)模型構(gòu)造(Construction of life prediction model for core components of construction machinery)
3.1? ?K-Means聚類
使用K-Means聚類無須進(jìn)行模型的訓(xùn)練,無監(jiān)督學(xué)習(xí)效率高,處理大數(shù)據(jù)集,算法保持可伸縮性和高效性當(dāng)簇接近高斯分布時(shí),效果較好[10]。本文利用優(yōu)秀的特征進(jìn)行聚類,使用最小距離分類器MDC進(jìn)行測(cè)試獲得最佳K均值聚類k值為5,結(jié)果得分如表所示。