周成鵬,王衛(wèi)軍,侯至丞,馮 偉
(1. 中國科學(xué)院 深圳先進(jìn)技術(shù)研究院,廣東 深圳 518055;2. 中國科學(xué)院大學(xué),北京 100049)
銑刀作為高速數(shù)控機(jī)床的關(guān)鍵部件之一,在加工過程中,其磨損會(huì)嚴(yán)重影響工件表面的光潔度和尺寸精度。工業(yè)統(tǒng)計(jì)數(shù)據(jù)顯示,刀具故障損壞是導(dǎo)致機(jī)床故障的主要因素,其產(chǎn)生的停機(jī)時(shí)間占據(jù)數(shù)控機(jī)床總停機(jī)時(shí)間的較大比例。當(dāng)?shù)毒咴诔霈F(xiàn)磨損故障但未被發(fā)現(xiàn)的狀態(tài)下繼續(xù)加工時(shí),會(huì)導(dǎo)致刀具損壞、工件報(bào)廢,甚至損壞機(jī)床。文獻(xiàn)[1]通過對(duì)數(shù)百臺(tái)加工中心的機(jī)床進(jìn)行統(tǒng)計(jì)分析發(fā)現(xiàn),每天有40~50把刀具損壞,其中大部分是由于刀具超過了使用壽命而造成的。準(zhǔn)確可靠的刀具磨損量預(yù)測(cè)可有效指導(dǎo)生產(chǎn),降低非必要的停機(jī)時(shí)間,節(jié)省制造成本,提高生產(chǎn)效率。工業(yè)4.0時(shí)代[2]的到來,使得工業(yè)大數(shù)據(jù)分析與應(yīng)用成為重要的研究課題[3],其中時(shí)間序列數(shù)據(jù)能夠很好地反映工業(yè)進(jìn)程中的關(guān)鍵變化,從而以此為依據(jù)進(jìn)行故障預(yù)測(cè)。刀具磨損量預(yù)測(cè)就是基于工業(yè)采集信號(hào)數(shù)據(jù)來推斷未來的磨損情況,了解加工過程的趨勢(shì),從而科學(xué)合理地評(píng)估刀具磨損的當(dāng)前狀態(tài),實(shí)現(xiàn)生產(chǎn)過程質(zhì)量的改善。
目前,評(píng)估刀具磨損狀態(tài)可以使用直接監(jiān)測(cè)和間接監(jiān)測(cè)的方法。直接監(jiān)測(cè)方法精度高,但需要停機(jī)測(cè)量而不能實(shí)現(xiàn)在線監(jiān)測(cè)[4]。間接監(jiān)測(cè)則是通過傳感器來獲取與刀具當(dāng)前磨損狀態(tài)有間接相關(guān)性的各種信號(hào)數(shù)據(jù)來實(shí)現(xiàn)的,適用于數(shù)字化智能制造系統(tǒng)。傳感器主要用于采集工業(yè)過程中的三向力信號(hào)、高頻振動(dòng)信號(hào)、聲發(fā)射信號(hào)和電流信號(hào)等。該方法通過對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和特征提取后,使用深度學(xué)習(xí)模型對(duì)刀具磨損量進(jìn)行監(jiān)測(cè)。
深度學(xué)習(xí)模型可以更好地適應(yīng)時(shí)間序列數(shù)據(jù)中復(fù)雜的非線性關(guān)系。在非線性建模方法中,深度學(xué)習(xí)模型具有自適應(yīng)、自組織學(xué)習(xí)機(jī)制,對(duì)非線性時(shí)間序列數(shù)據(jù)具有良好的預(yù)測(cè)能力。文獻(xiàn)[5]提出基于支持向量回歸(support vector regression, SVR)的刀具磨損量預(yù)測(cè)模型,其實(shí)驗(yàn)結(jié)果表明,該方法具有一定有效性。文獻(xiàn)[6]針對(duì)數(shù)控銑刀的磨損問題,提出了決策樹回歸(decision tree regression, DTR)和集成方法AdaBoost相結(jié)合的刀具磨損量預(yù)測(cè)方法。文獻(xiàn)[7]提出了一種基于分布式卷積神經(jīng)網(wǎng)絡(luò)的刀具磨損評(píng)估方法,對(duì)刀具磨損量進(jìn)行預(yù)測(cè)。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN) 是時(shí)間序列預(yù)測(cè)模型中常用的工具[8],模型特點(diǎn)是具有記憶空間,可對(duì)前置計(jì)算過程的結(jié)果進(jìn)行存儲(chǔ)。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中計(jì)算結(jié)果之間并沒有相關(guān)性不同,RNN隱含層計(jì)算既采納了當(dāng)前的輸入信息,也包含隱含層最后的計(jì)算過程狀態(tài)。然而,RNN網(wǎng)絡(luò)對(duì)于時(shí)間序列數(shù)據(jù)中的長距離依賴關(guān)系學(xué)習(xí)的能力較差,因?yàn)槠渲痪邆涠唐诘挠洃浤芰?,?dāng)時(shí)間序列的長度過長時(shí),容易造成梯度消失和梯度爆炸,因此出現(xiàn)了長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory, LSTM)、門控循環(huán)單元(gate recurrent unit,GRU)、簡(jiǎn)單循環(huán)單元(simple recurrent unit, SRU)等一些變體來解決這個(gè)問題。
因此,本文提出一種基于特征提取(feature extraction,F(xiàn)E)及LSTM的銑刀磨損量預(yù)測(cè)方法,即FE-LSTM。該方法通過建立時(shí)域、頻域和時(shí)頻域分析,提取原始信號(hào)數(shù)據(jù)對(duì)應(yīng)特征;LSTM可充分利用工業(yè)數(shù)據(jù)的時(shí)間序列特性,自適應(yīng)地學(xué)習(xí)所提取特征之間的復(fù)雜隱含關(guān)系,并具備長距離依賴學(xué)習(xí)能力,可避免出現(xiàn)梯度爆炸和梯度消失問題,從而精準(zhǔn)地預(yù)測(cè)銑刀的磨損量。
采用間接監(jiān)測(cè)方法,通過對(duì)傳感器所采集的工業(yè)原始信號(hào)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析及特征提取,結(jié)合長短期記憶神經(jīng)網(wǎng)絡(luò)建立銑刀磨損量預(yù)測(cè)模型。
本文所提方法基于特征提取及長短期記憶神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)銑刀的磨損量,其主要框架如圖1所示。
圖1 銑刀磨損量預(yù)測(cè)模型Fig. 1 Wear prediction model of milling cutter
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN的變體。RNN算法適用于處理序列問題,屬于全連接神經(jīng)網(wǎng)絡(luò),主要是通過t時(shí)刻的輸入Xt來計(jì)算得到隱含層輸出ht。ht將會(huì)是(t+1)時(shí)刻RNN輸入的一部分,因此RNN可以展開為圖2右邊的形式。
圖2 RNN結(jié)構(gòu)圖Fig. 2 RNN architecture diagram
作為一種先進(jìn)的RNN變體,LSTM可以自適應(yīng)地捕捉時(shí)間序列數(shù)據(jù)中存在的長距離依賴和非線性動(dòng)態(tài)變化[9]。LSTM與RNN的整體結(jié)構(gòu)基本相似,不同之處在于每個(gè)隱含層內(nèi)的計(jì)算方式。LSTM在隱含層計(jì)算中新增了細(xì)胞狀態(tài)和門機(jī)制。LSTM的核心是細(xì)胞狀態(tài),RNN中的每個(gè)隱藏單元,在LSTM中變成了一個(gè)個(gè)有記憶功能的細(xì)胞;然后通過“門”機(jī)制來控制信息的記憶。LSTM中有遺忘門、輸入門和輸出門這3種控制門。遺忘門負(fù)責(zé)調(diào)節(jié)上一時(shí)刻細(xì)胞狀態(tài)Ct-1可傳遞到當(dāng)前時(shí)刻細(xì)胞狀態(tài)Ct的比例,因此可保存長距離序列信息。輸入門則負(fù)責(zé)調(diào)節(jié)當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入Xt傳遞到Ct的比例,可以避免當(dāng)前無關(guān)信息進(jìn)入記憶。輸出門決定Ct能夠輸出到LSTM的當(dāng)前輸出值ht的比例,進(jìn)而控制長期記憶對(duì)當(dāng)前輸出的影響。控制門主要由點(diǎn)乘運(yùn)算和sigmoid函數(shù)來實(shí)現(xiàn)。點(diǎn)乘運(yùn)算決定了可以傳輸多少信息。sigmoid函數(shù)值范圍在0到1之間:為0時(shí),不會(huì)傳輸任何信息;為1時(shí),傳輸所有信息。LSTM隱含層內(nèi)的計(jì)算結(jié)構(gòu)如圖3所示。
圖3 LSTM隱含層計(jì)算結(jié)構(gòu)Fig. 3 Calculation structure of LSTM hidden layer
使用上述細(xì)胞狀態(tài)和控制門兩種結(jié)構(gòu)即可以實(shí)現(xiàn)對(duì)序列較早期信息的存儲(chǔ),充分掌握序列信息中的長距離相關(guān)性。利用細(xì)胞狀態(tài)可以完成存儲(chǔ)訓(xùn)練梯度的任務(wù),從而避免發(fā)生梯度消失。在t時(shí)刻,LSTM的輸入包括當(dāng)前t時(shí)刻網(wǎng)絡(luò)的輸入值Xt、上一時(shí)刻LSTM的輸出值ht-1以及上一時(shí)刻的細(xì)胞狀態(tài)Ct-1。
FE-LSTM銑刀磨損量預(yù)測(cè)模型由輸入層、隱含層、全連接層和輸出層構(gòu)成,主要功能是在采集的信號(hào)樣本數(shù)據(jù)和銑刀磨損量之間建立非線性映射關(guān)系。本文設(shè)計(jì)了一個(gè)輸入特征維度為6、隱含層數(shù)為4、每層包含64個(gè)神經(jīng)元的LSTM模型。輸入層接收各傳感器所采集的振動(dòng)信號(hào)和切削力信號(hào)的敏感特征值;隱含層利用神經(jīng)元進(jìn)行特征提??;全連接層將LSTM學(xué)習(xí)到的特征映射到輸出值,即銑刀磨損量。使用Dropout優(yōu)化方式[10]防止過擬合,選取線性整流函數(shù)(rectified linear unit, ReLU)用于加強(qiáng)神經(jīng)網(wǎng)絡(luò)各層之間的非線性關(guān)系,防止梯度消失。LSTM網(wǎng)絡(luò)在訓(xùn)練時(shí)會(huì)使用上一時(shí)刻的信息加上本時(shí)刻的輸入信息來共同訓(xùn)練,在時(shí)間軸上傳遞隱含層狀態(tài)。模型結(jié)構(gòu)如圖4所示。
圖4 FE-LSTM銑刀磨損量預(yù)測(cè)模型結(jié)構(gòu)Fig. 4 Structure of FE-LSTM based prediction model for milling cutter
在FE-LSTM銑刀磨損量預(yù)測(cè)模型的訓(xùn)練階段,選用Adam優(yōu)化器來負(fù)責(zé)反向傳播預(yù)測(cè)值與標(biāo)簽值之間的誤差信息、優(yōu)化隱含層內(nèi)神經(jīng)元的權(quán)值,使下一輪的預(yù)測(cè)值可不斷逼近標(biāo)簽值。在該階段,采用平均絕對(duì)誤差(mean square error, MSE)來比較評(píng)價(jià)模型的性能:
式中:ylabel,i——第i次走刀后銑刀磨損量的具體標(biāo)簽值;ypre,i——模型對(duì)于第i次走刀后銑刀磨損量的具體預(yù)測(cè)值;n——總走刀數(shù)。
模型建立后,需通過實(shí)際銑刀加工數(shù)據(jù)進(jìn)行模型訓(xùn)練及驗(yàn)證。通過分析實(shí)驗(yàn)數(shù)據(jù)集,進(jìn)行特征工程,建立時(shí)域、頻域及時(shí)頻域分析,提取原始信號(hào)數(shù)據(jù)的有效信息,使預(yù)測(cè)方法達(dá)到更高精度。
本次實(shí)驗(yàn)選取的工業(yè)數(shù)據(jù)集是2010年故障預(yù)測(cè)與健康管理協(xié)會(huì)數(shù)據(jù)競(jìng)賽中的銑削刀具磨損量預(yù)測(cè)數(shù)據(jù)集[11]。該實(shí)驗(yàn)以3齒球頭硬質(zhì)合金銑刀作為研究對(duì)象,采用羅德斯 RFM760型高速數(shù)控機(jī)床作為實(shí)驗(yàn)平臺(tái),配合奇石樂9265B型三向測(cè)力儀和5019A型多通道電荷放大器以及NI-DAQ數(shù)據(jù)采集卡來采集加工過程中所產(chǎn)生的信號(hào)數(shù)據(jù)。
具體實(shí)驗(yàn)是將6把完全相同的3齒球頭硬質(zhì)合金銑刀在銑床上進(jìn)行銑削實(shí)驗(yàn),加工參數(shù)一致。銑刀每次走刀的長度為108 mm,選用徠卡MZ12型顯微鏡來測(cè)量銑刀每一次走刀結(jié)束后3個(gè)切削刃的后刀面磨損量,并記錄相應(yīng)的高頻切削力信號(hào)、高頻振動(dòng)信號(hào)以及高頻聲發(fā)射信號(hào)。銑削主軸轉(zhuǎn)速為10 400 r/min,進(jìn)給速度為1 555 mm/min,軸向銑削深度為0.2 mm,徑向銑削寬度為0.125 mm,每次走刀進(jìn)給量為0.001 mm,采樣頻率為50 kHz。實(shí)驗(yàn)裝置[12]如圖5所示。
圖5 實(shí)驗(yàn)裝置Fig. 5 Experimental equipments
實(shí)驗(yàn)產(chǎn)生6份數(shù)據(jù)集(c1~c6),每份數(shù)據(jù)集對(duì)應(yīng)315次銑削過程,其中c1,c4和c6是訓(xùn)練集數(shù)據(jù),c2,c3和c5是測(cè)試集數(shù)據(jù)。每次銑削過程所采集的信號(hào)數(shù)據(jù)包括3個(gè)軸向的高頻銑削力和振動(dòng)信號(hào),以及銑削過程中高頻聲發(fā)射信號(hào)的方均根值,總共有7個(gè)通道的數(shù)據(jù),對(duì)應(yīng)127 399~252 492條信號(hào)數(shù)據(jù)。每次銑削過程分別對(duì)應(yīng)3個(gè)槽向(flute1,flute2和flute3)的磨損值,僅訓(xùn)練集c1,c4和c6有相對(duì)應(yīng)的真實(shí)磨損值。
綜上所述,每次銑削過程對(duì)應(yīng)數(shù)萬條信號(hào)數(shù)據(jù)和一個(gè)真實(shí)的磨損值,但并非所有信號(hào)數(shù)據(jù)都與磨損量有關(guān)系,且原始信號(hào)中還夾雜著干擾噪聲。實(shí)施適當(dāng)?shù)奶卣鞴こ?,篩選出對(duì)銑刀磨損量敏感的特征,不僅可以減小特征空間,加快模型訓(xùn)練速度,還可以有效提升模型的擬合效果。文獻(xiàn)[6]采用互信息(mutual information, MI)評(píng)估方法和F-test檢驗(yàn)方法進(jìn)行了特征評(píng)估和選擇,論證了聲發(fā)射信號(hào)并未貢獻(xiàn)出最優(yōu)特征,故舍棄聲發(fā)射信號(hào)數(shù)據(jù)。
對(duì)于每個(gè)獨(dú)立樣本(c1、c4和c6)的x軸、y軸、z軸銑削力和振動(dòng)共計(jì)6個(gè)通道的信號(hào)數(shù)據(jù)進(jìn)行獨(dú)立分析處理,提取其時(shí)域特征、頻域特征和時(shí)頻域特征。
2.2.1 時(shí)域特征提取
有量綱特征值是對(duì)通道信號(hào)數(shù)據(jù)的時(shí)域描述。所選擇的有量綱特征值包括絕對(duì)均值、峰值、均方根值、方根幅值、歪度值、峭度值、波形因子和脈沖因子等。所提取時(shí)域敏感統(tǒng)計(jì)特征可在一定程度上表征銑刀的不同磨損狀況。圖6示出x軸銑削力信號(hào)所提取的時(shí)域特征與走刀數(shù)之間的關(guān)系。
2.2.2 頻域特征提取
將信號(hào)數(shù)據(jù)從時(shí)域轉(zhuǎn)換到頻域可通過數(shù)學(xué)處理方法來實(shí)現(xiàn)。 如傅里葉變換可將時(shí)域上連續(xù)或離散的信號(hào)數(shù)據(jù)變換成頻域上的信號(hào)數(shù)據(jù),使我們可以更清晰直觀地在頻域維度上去分析信號(hào)數(shù)據(jù)的頻譜組成細(xì)節(jié)。本文采用快速傅里葉變換(fast Fourier transform, FFT)對(duì)銑削力和振動(dòng)信號(hào)進(jìn)行時(shí)頻變換分析,提取重心頻率、均方頻率、均方根頻率和頻率方差等頻域特征。
2.2.3 時(shí)頻域特征提取
銑刀運(yùn)行過程信號(hào)數(shù)據(jù)具有非平穩(wěn)或準(zhǔn)平穩(wěn)的特點(diǎn),使用時(shí)頻域分析方法可以準(zhǔn)確表征加工過程信號(hào)數(shù)據(jù)的特性。時(shí)頻域分析常用的方法有小波變換(wavelet transform, WT)[13-14]和經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition, EMD)。與EMD相比,小波變換具有堅(jiān)實(shí)的理論基礎(chǔ)[15]。小波包分解是比小波變換更為精細(xì)的分析方法,小波包分解對(duì)信號(hào)數(shù)據(jù)的全頻帶進(jìn)行了多層次分解,可分離信號(hào)數(shù)據(jù)中與銑刀磨損量相關(guān)的各頻帶能量,而每個(gè)頻帶中相對(duì)能量的變化反映了銑刀的磨損量變化情況。故此處采用小波包分解來提取銑削力和振動(dòng)信號(hào)的時(shí)頻域特征。
對(duì)銑削力和振動(dòng)信號(hào)進(jìn)行3層小波變換分解,將信號(hào)拆分成8個(gè)不同頻段,各個(gè)頻段的特征即為其能量值。圖7示出x軸銑削力信號(hào)所提取的時(shí)頻域特征與走刀數(shù)之間的關(guān)系,可見隨著走刀數(shù)的增加,銑削力信號(hào)所對(duì)應(yīng)的各頻段能量值呈現(xiàn)大致相同的走勢(shì),銑刀在加工過程中的磨損程度與銑刀力信號(hào)之間存在相關(guān)性。
圖7 時(shí)頻域特征Fig. 7 Time-frequency domain features
最終,針對(duì)每一通道信號(hào)對(duì)應(yīng)提取了24個(gè)特征。數(shù)據(jù)集c1, c4和c6各對(duì)應(yīng)一組大小為315×6×24的特征空間,選定每次走刀過程結(jié)束后銑刀3個(gè)切削刃的后刀面磨損量的最大值作為標(biāo)簽值。
通過分析實(shí)驗(yàn)數(shù)據(jù)以及進(jìn)行特征工程后,提取了原始信號(hào)數(shù)據(jù)中的有效信息。為檢驗(yàn) FE-LSTM銑刀磨損量預(yù)測(cè)模型的有效性,需通過建立對(duì)比實(shí)驗(yàn)來多方面驗(yàn)證模型的預(yù)測(cè)準(zhǔn)確性、適用性以及泛化能力等,并根據(jù)實(shí)驗(yàn)結(jié)果來對(duì)模型的性能進(jìn)行評(píng)價(jià)。
經(jīng)過特征工程后,初始數(shù)據(jù)集相關(guān)信號(hào)數(shù)據(jù)被轉(zhuǎn)換為對(duì)應(yīng)大小的特征空間,將其作為模型的輸入,配合所選定標(biāo)簽值對(duì)模型進(jìn)行訓(xùn)練。訓(xùn)練過程中,計(jì)算采用平均絕對(duì)誤差(MSE)作為損失函數(shù),利用Adam優(yōu)化器[16]使MSE最小。Adam優(yōu)化器不同于傳統(tǒng)的隨機(jī)梯度下降(stochastic gradient descent, SGD),SGD沒有動(dòng)量和自適應(yīng)學(xué)習(xí)率的概念,收斂速度慢且可能在鞍點(diǎn)處振蕩。Adam優(yōu)化器可以自適應(yīng)調(diào)節(jié)參數(shù)的學(xué)習(xí)率,從而大幅提升訓(xùn)練速度,提高穩(wěn)定性,使模型預(yù)測(cè)值不斷接近標(biāo)簽值。此外引入Dropout算法對(duì)模型進(jìn)行正則化,防止過擬合。Dropout在模型訓(xùn)練過程中會(huì)根據(jù)所設(shè)定的參數(shù)隨機(jī)屏蔽部分神經(jīng)元,從而形成新的網(wǎng)絡(luò)結(jié)構(gòu),且神經(jīng)元之間彼此互不依賴,可減少神經(jīng)網(wǎng)絡(luò)模型在特征學(xué)習(xí)過程中的局部性特征依賴,從而進(jìn)一步提升神經(jīng)網(wǎng)絡(luò)的穩(wěn)健性。最后將未經(jīng)訓(xùn)練過的測(cè)試數(shù)據(jù)集輸入到訓(xùn)練完成后的FE-LSTM模型中,從而實(shí)現(xiàn)有效的銑刀磨損量預(yù)測(cè)。實(shí)驗(yàn)框架如圖8所示。
圖8 實(shí)驗(yàn)框架Fig. 8 Experimental framework
為檢驗(yàn)FE-LSTM模型對(duì)銑刀磨損量預(yù)測(cè)的有效性,實(shí)施3個(gè)不同的對(duì)比實(shí)驗(yàn)。
實(shí)驗(yàn)一:探究不同隱含層數(shù)對(duì)FE-LSTM預(yù)測(cè)性能的影響。隱含層數(shù)集合為{2, 4, 6, 8},采用MSE作為FE-LSTM預(yù)測(cè)性能的評(píng)價(jià)指標(biāo)。
實(shí)驗(yàn)二:選用“留一組”交叉驗(yàn)證實(shí)驗(yàn)分析方法,驗(yàn)證FE-LSTM銑刀磨損量預(yù)測(cè)方法對(duì)未知的一組數(shù)據(jù)集的預(yù)測(cè)準(zhǔn)確性和適用性,從而可有效檢驗(yàn)?zāi)P偷姆夯芰?。在?xùn)練過程中,按8∶2的比例隨機(jī)劃分c1和c6樣本數(shù)據(jù)作為訓(xùn)練集和驗(yàn)證集。記錄各訓(xùn)練輪次中訓(xùn)練集和驗(yàn)證集上的損失值。訓(xùn)練500輪后完成模型訓(xùn)練,而后輸入c4樣本數(shù)據(jù)作為測(cè)試集進(jìn)行測(cè)試實(shí)驗(yàn)。
實(shí)驗(yàn)三:將FE-LSTM模型與不同模型進(jìn)行性能對(duì)比,如SVR模型[17]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)[18]與反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BPNN)[12],采用平均絕對(duì)誤差(MSE)和平均絕對(duì)誤差百分比(mean absolute percentage error, MAPE) 這兩項(xiàng)指標(biāo)來比較模型的性能。MAPE計(jì)算公式為
表1示出模型不同隱含層個(gè)數(shù)對(duì)應(yīng)的平均絕對(duì)誤差大小。可以看出,對(duì)于FE-LSTM銑刀磨損量預(yù)測(cè)模型,隱含層個(gè)數(shù)為4時(shí)性能最佳。因而實(shí)驗(yàn)二和實(shí)驗(yàn)三均設(shè)定模型隱含層個(gè)數(shù)為4。
表1 不同隱含層個(gè)數(shù)實(shí)驗(yàn)結(jié)果Tab. 1 Experimental results of different hidden layer numbers
表2示出訓(xùn)練過程中對(duì)應(yīng)輪次的訓(xùn)練集損失及驗(yàn)證集損失具體數(shù)值,圖9示出對(duì)應(yīng)的損失函數(shù)變化曲線。圖中,x軸是FE-LSTM模型的訓(xùn)練輪次,即模型在訓(xùn)練階段內(nèi)部權(quán)重參數(shù)更新迭代的次數(shù);y軸是訓(xùn)練集以及驗(yàn)證集上損失函數(shù)的值。可見,隨著訓(xùn)練輪數(shù)的增多,損失函數(shù)的值不斷減小直至收斂(趨近于零),即銑刀磨損量預(yù)測(cè)值與實(shí)際測(cè)量值之間的誤差MSE不斷減小并最終收斂,說明模型較好地學(xué)習(xí)了所提取的信號(hào)數(shù)據(jù)特征。此外,訓(xùn)練集與驗(yàn)證集對(duì)應(yīng)的損失函數(shù)均成功收斂,并且在兩個(gè)數(shù)據(jù)集上損失函數(shù)最終收斂的值相差無幾,表明FE-LSTM銑刀磨損量預(yù)測(cè)模型具有良好的泛化能力。
表2 訓(xùn)練過程實(shí)驗(yàn)結(jié)果Tab. 2 Experimental results of the training process
圖9 損失函數(shù)變化曲線Fig. 9 Loss function curve
圖10示出銑刀磨損量預(yù)測(cè)值和測(cè)試值的變化曲線??梢钥闯?,模型預(yù)測(cè)值與真實(shí)值的變化趨勢(shì)一致,證明了FE-LSTM模型能有效適用于銑刀磨損量預(yù)測(cè)。
圖10 銑刀磨損量預(yù)測(cè)結(jié)果Fig. 10 Tool wear prediction results
表3示出FE-LSTM銑刀磨損量預(yù)測(cè)模型與不同模型的對(duì)比結(jié)果。SVR,BPNN,CNN和FE-LSTM模型均可以實(shí)現(xiàn)銑刀磨損量的預(yù)測(cè),其中SVR模型和BPNN模型屬于傳統(tǒng)的機(jī)器學(xué)習(xí)模型,無法保存時(shí)間序列數(shù)據(jù)較早時(shí)刻的信息并缺乏學(xué)習(xí)長距離依賴序列特征的能力。由表3可以看出,F(xiàn)E-LSTM銑刀磨損量預(yù)測(cè)模型與SVR模型和BPNN模型進(jìn)行比較,MSE分別降低了67.07%和41.32%;與SVR模型相比MAPE降低了1.745%。與深度學(xué)習(xí)模型CNN相比,MSE降低了77.09%,MAPE降低了5.685%。實(shí)驗(yàn)對(duì)比結(jié)果證明,F(xiàn)E-LSTM銑刀磨損量預(yù)測(cè)模型優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)模型和CNN模型,能更好地適應(yīng)時(shí)間序列數(shù)據(jù),從而更準(zhǔn)確地進(jìn)行銑刀磨損量預(yù)測(cè)。
本文聚焦高速數(shù)控機(jī)床銑削過程中的銑刀磨損問題,提出了一種基于特征提取及長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的銑刀磨損量預(yù)測(cè)方法,主要采用時(shí)域分析、頻域分析和時(shí)頻域分析方法對(duì)傳感器采集到的多通道原始信號(hào)數(shù)據(jù)進(jìn)行特征提取,而后使用LSTM模型對(duì)提取后的信號(hào)特征數(shù)據(jù)進(jìn)行訓(xùn)練,LSTM模型可保存時(shí)間序列數(shù)據(jù)中的時(shí)刻信息,并具備長距離依賴時(shí)間序列特征的學(xué)習(xí)能力且解決了RNN存在的梯度消失和梯度爆炸問題。實(shí)驗(yàn)結(jié)果表明,相比于傳統(tǒng)機(jī)器學(xué)習(xí)模型,F(xiàn)E-LSTM銑刀磨損量預(yù)測(cè)模型可以實(shí)現(xiàn)對(duì)銑刀磨損量更為有效、精準(zhǔn)的預(yù)測(cè)。后續(xù)將在自采真實(shí)數(shù)據(jù)集上應(yīng)用此方法,以期解決實(shí)際工業(yè)問題;并將嘗試引入Attention機(jī)制,以提升模型的并行能力以及更好地解決長距離依賴問題。