周文軍,肖曉萍,李自勝,張楷,劉聰,鄭升鵬
(1.西南科技大學(xué)制造科學(xué)與工程學(xué)院,四川綿陽 621010;2.西南科技大學(xué)工程技術(shù)中心,四川綿陽 621010;3.西南交通大學(xué)機(jī)械工程學(xué)院,四川成都 610031)
制造業(yè)的快速發(fā)展對機(jī)床加工精度的要求越來越高,刀具作為加工工件的關(guān)鍵執(zhí)行者,與工件直接接觸,對工件質(zhì)量有直接影響[1-2]。刀具磨損狀態(tài)監(jiān)測作為一種先進(jìn)制造技術(shù),是實(shí)現(xiàn)機(jī)床不間斷生產(chǎn)、加工自動(dòng)化及工件高質(zhì)量生產(chǎn)的關(guān)鍵[3]。刀具邊緣與工件之間不可避免地會產(chǎn)生摩擦,導(dǎo)致加工過程中出現(xiàn)刀具故障的時(shí)間占總機(jī)械故障時(shí)間的7%~20%[4],刀具本身和刀具更換成本占總加工成本的3%~12%[5],造成生產(chǎn)力和利潤的巨大損失。因此有必要實(shí)時(shí)準(zhǔn)確地監(jiān)測刀具磨損狀態(tài),以降低生產(chǎn)成本、提高刀具利用率與工件質(zhì)量[6]。
刀具磨損狀態(tài)監(jiān)測方法主要分為直接法和間接法。直接法是直接識別刀刃外觀、表面質(zhì)量或幾何形狀的變化[7]。直接法雖然監(jiān)測精度高,但需要停機(jī)監(jiān)測,不能檢測出刀具在加工過程中突然出現(xiàn)的磨損或破壞。間接法是利用傳感器采集刀具在切削過程中同步產(chǎn)生的相關(guān)參量,并通過建立特征信號與刀具磨損量之間的關(guān)系來預(yù)測刀具實(shí)際磨損情況[8]。間接法所采集的信號可能因加工工序或環(huán)境的影響而含有冗余信息,但可在刀具切削狀態(tài)下進(jìn)行實(shí)時(shí)在線檢測,便于實(shí)現(xiàn)刀具磨損狀態(tài)的智能化監(jiān)測,因此成為一種主流方法。間接法實(shí)現(xiàn)步驟主要包括:信號采集、信號預(yù)處理、特征提取、預(yù)測模型構(gòu)建及磨損預(yù)測[9]。間接法常用的預(yù)測模型有傳統(tǒng)的機(jī)器學(xué)習(xí)法[10],該模型被認(rèn)為是一種有效的刀具磨損狀態(tài)識別方法,被廣泛應(yīng)用于刀具磨損狀態(tài)監(jiān)測和識別研究中[11],其中最常用的有BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Networks,BPNN)[12]、支持向量回歸模型(Support Vector Regression,SVR)[13]、隱馬爾科夫模型(Hidden Markov Model,HMM)[14]等。曹利平等[15]提出了基于遺傳算法優(yōu)化BP網(wǎng)絡(luò)的刀具磨損狀態(tài)識別方法,對比改進(jìn)前的BP網(wǎng)絡(luò),驗(yàn)證了該方法的有效性。KONG等[16]提出了一種集成支持向量機(jī)和鯨魚優(yōu)化算法的 WOA-SVM 預(yù)測模型,該模型能快速高效識別鈦合金加工中的銑刀刀具磨損狀態(tài)。何棟磊、黃民[17]提出了遺傳算法優(yōu)化HMM的預(yù)測方法,利用主軸電流信號,準(zhǔn)確有效地監(jiān)測了銑刀磨損狀態(tài)。但淺層次的機(jī)器學(xué)習(xí)法在處理高維數(shù)據(jù)時(shí)容易出現(xiàn)過擬合、維數(shù)災(zāi)難等問題;另一方面,采集數(shù)據(jù)的本質(zhì)為時(shí)間序列數(shù)據(jù),上述模型無法用于序列數(shù)據(jù)建模,進(jìn)而無法挖掘序列數(shù)據(jù)隱藏的序列特征[18-19]。
與淺層機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)模型在數(shù)據(jù)量、非線性關(guān)系和收斂性能等方面的處理能力都有明顯的優(yōu)勢[20]。深度學(xué)習(xí)模型在處理時(shí)間序列數(shù)據(jù)中復(fù)雜的非線性關(guān)系時(shí)有自適應(yīng)、自組織學(xué)習(xí)機(jī)制,具有有效的預(yù)測能力[21]。常用的深度學(xué)習(xí)方法有卷 積 神 經(jīng) 網(wǎng) 絡(luò) (Convolutional Neural Networks,CNN)[22]和堆疊式自動(dòng)編碼器網(wǎng)絡(luò)(Sparse Autoencoders,SAE)[23]等模型。安華等人[24]提出了一種基于稀疏自編碼器的刀具狀態(tài)檢測及壽命預(yù)測方法,該方法利用切削力信號實(shí)現(xiàn)了刀具在各階段下的剩余使用壽命預(yù)測。周成鵬等[21]提出了一種基于特征提取長短期記憶網(wǎng)絡(luò)(Feature Extraction Long Short-Term Memory,F(xiàn)E-LSTM)的銑刀磨損量預(yù)測方法,與傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,可實(shí)現(xiàn)更為精準(zhǔn)可靠的銑刀磨損量預(yù)測。但人為設(shè)定FE-LSTM的隱藏層神經(jīng)元數(shù)與學(xué)習(xí)率等模型參數(shù),難以達(dá)到最優(yōu)參數(shù)的效果[24]。
針對長短期記憶網(wǎng)絡(luò)預(yù)測精度難以達(dá)到最優(yōu)參數(shù)效果的問題,本文作者提出使用遺傳算法(Genetic Algorithm,GA)尋找LSTM的最優(yōu)參數(shù),并將參數(shù)輸入LSTM實(shí)現(xiàn)改進(jìn)模型GA-LSTM。利用力傳感器與振動(dòng)傳感器采集信號,采用時(shí)域、頻域及時(shí)頻域方法提取信號特征以及相關(guān)性分析法篩選出與銑刀磨損量高度相關(guān)的特征,輸入GA尋出隱藏層神經(jīng)元數(shù)和學(xué)習(xí)率等參數(shù)最優(yōu)值,然后將參數(shù)最優(yōu)值和訓(xùn)練數(shù)據(jù)輸入LSTM模型訓(xùn)練,最終將測試數(shù)據(jù)輸入到訓(xùn)練好的LSTM模型中,實(shí)現(xiàn)銑刀磨損量的有效預(yù)測。
遺傳算法(GA)是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法[17]。其中,選擇、交叉和變異構(gòu)成了遺傳算法的遺傳操作,使遺傳算法具有優(yōu)良的特性。遺傳算法開始時(shí)隨機(jī)產(chǎn)生一些個(gè)體,根據(jù)GA算法里自定義的適應(yīng)度函數(shù)分別對每一個(gè)個(gè)體進(jìn)行計(jì)算評估,給出一個(gè)適應(yīng)度值?;诖诉m應(yīng)度值,選擇一些個(gè)體產(chǎn)生下一代,然后選擇出來的個(gè)體經(jīng)過交叉和變異進(jìn)行再組合從而生成新的一代,以此類推,朝著最優(yōu)解的方向進(jìn)化,最終輸出最優(yōu)化參數(shù)[25]。
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)[26]的一種變體,RNN由于梯度消失只有短期記憶,LSTM網(wǎng)絡(luò)通過精妙的門控制將短期記憶與長期記憶結(jié)合起來,且一定程度上解決了梯度信息傳播衰減的問題,使網(wǎng)絡(luò)保持長時(shí)間的記憶。LSTM的結(jié)構(gòu)如圖1所示。
圖1 LSTM單元結(jié)構(gòu)
圖中:ft表示輸入門;it表示遺忘門;Ot表示輸出門;Ct表示t時(shí)刻神經(jīng)單元狀態(tài);ht表示t時(shí)刻隱藏層狀態(tài);σ和tanh為激活函數(shù)。LSTM單元數(shù)據(jù)輸入輸出遵循公式(1):
(1)
式中:W、b分別表示權(quán)重和偏置;*表示2個(gè)維度相同矩陣的對應(yīng)位置元素相乘。
在LSTM模型中,選擇合適的隱藏層神經(jīng)元數(shù)和初始學(xué)習(xí)率有助于提高預(yù)測精度。合理的隱藏層神經(jīng)元數(shù)可以改善訓(xùn)練過程中的梯度流,使得模型從訓(xùn)練樣本中提取有效的潛在規(guī)律。初始學(xué)習(xí)率作為LSTM深度學(xué)習(xí)框架中的一個(gè)重要超參數(shù),控制著損失梯度調(diào)整網(wǎng)絡(luò)權(quán)值的速度,決定著訓(xùn)練過程中模型能否收斂至最小值以及何時(shí)收斂。為保證模型的預(yù)測性能,有必要尋出隱藏層神經(jīng)元數(shù)和初始學(xué)習(xí)率的最優(yōu)值。文中采用遺傳算法尋出隱藏層神經(jīng)元數(shù)和初始學(xué)習(xí)率等參數(shù)最優(yōu)值,進(jìn)而構(gòu)建GA-LSTM模型來預(yù)測刀具磨損量。遺傳算法改進(jìn)LSTM模型流程如圖2所示。
圖2 基于GA-LSTM的銑刀磨損狀態(tài)監(jiān)測流程
將待優(yōu)化參數(shù)隱藏層神經(jīng)元數(shù)和初始學(xué)習(xí)率作為遺傳算法的優(yōu)化對象,并根據(jù)各自優(yōu)化范圍初始化染色體,建立初始化染色體種群;將染色體重組賦值于 LSTM模型進(jìn)行訓(xùn)練,并將計(jì)算得到的預(yù)測值與實(shí)際值之間的均方誤差作為評價(jià)染色體適應(yīng)度優(yōu)劣的指標(biāo)。然后對染色體進(jìn)行遺傳操作,并將更新的染色體再賦值于LSTM模型訓(xùn)練,直至篩選出具有最佳適應(yīng)度值的染色體。最后對篩選出的染色體進(jìn)行解碼,獲取到最優(yōu)隱藏層神經(jīng)元數(shù)和學(xué)習(xí)率,將參數(shù)輸入到LSTM模型完成模型的訓(xùn)練及預(yù)測。
基于上述流程構(gòu)建改進(jìn)的LSTM模型,圖3所示為改進(jìn)前后訓(xùn)練精度效果曲線,圖4所示為改進(jìn)前后訓(xùn)練過程中的均方根誤差(RMSE)曲線。為驗(yàn)證該模型的有效性,且減少隨機(jī)因素的影響,通過測試集進(jìn)行重復(fù)實(shí)驗(yàn)10次,實(shí)驗(yàn)結(jié)果如表1所示。
表1 實(shí)驗(yàn)結(jié)果均方根誤差單位:μm
圖3 改進(jìn)前后LSTM訓(xùn)練精度曲線
圖4 改進(jìn)前后LSTM訓(xùn)練誤差曲線
由圖3、4可知:與LSTM模型相比,GA-LSTM模型有較高的訓(xùn)練精度,相對平穩(wěn)且訓(xùn)練誤差較低。分析表1知LSTM模型預(yù)測誤差整體較大,且浮動(dòng)范圍大,穩(wěn)定性差,而GA-LSTM模型的均方根誤差在2~5 μm,顯示了該模型的有效性與可靠性。
文中采用2010年P(guān)HM協(xié)會的公開數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)[27],實(shí)驗(yàn)平臺為 R?ders Tech RFM760高速數(shù)控銑床,刀具為三刃碳化鎢球頭銑刀,切削材料為不銹鋼(HRC52),表2為設(shè)置的銑削參數(shù),圖5所示為刀具磨損實(shí)驗(yàn)數(shù)據(jù)采集平臺。
表2 銑削參數(shù)設(shè)置
圖5 2010年P(guān)HM數(shù)據(jù)挑戰(zhàn)實(shí)驗(yàn)平臺
由于切削刃的中間位置存在著較為均勻的后刀面磨損量且其部位具有合理的磨損量走勢,故每次走刀結(jié)束后采用立體顯微鏡測量銑刀的后刀面磨損值。銑刀在磨損測試期間連續(xù)采樣頻率為50 kHz,進(jìn)行315次走刀測試,每次走刀長度為108 mm,所采集數(shù)據(jù)除三刃的后刀面磨損值外還包括x、y、z方向的銑削力、振動(dòng)及聲發(fā)射信號。實(shí)驗(yàn)使用的三刃碳化鎢球頭銑刀每次走刀結(jié)束后產(chǎn)生對應(yīng)3個(gè)刀刃的新后刀面磨損值分別為flute_1、flute_2、flute_3。為更準(zhǔn)確地反映刀具當(dāng)前的磨損狀態(tài),將3個(gè)刀刃后刀面磨損值取均值作為此次實(shí)驗(yàn)的目標(biāo),銑削力與振動(dòng)信號經(jīng)預(yù)處理后得到的特征作為訓(xùn)練與測試數(shù)據(jù)。
傳感器采集的原始信號不僅數(shù)據(jù)量大,且混有干擾信息,直接使用會影響銑刀磨損量預(yù)測精度,因此,需要對原始信號進(jìn)行數(shù)據(jù)預(yù)處理[28]。文中對x、y、z方向上力與振動(dòng)信號使用時(shí)域、頻域及時(shí)頻域方法進(jìn)行特征提取,選取時(shí)域方法11個(gè)特征,頻域方法5個(gè)特征,時(shí)頻域方法為小波包分解后提取頻段能量,小波包基為db8,進(jìn)行3層分解后將信號分為8個(gè)能量頻段。
上述方法共計(jì)提取了144個(gè)特征,其中可能包含一些冗余或不相關(guān)的特征,必定會影響實(shí)驗(yàn)結(jié)果,采用相關(guān)性分析法從144個(gè)特征中提取與刀具磨損量相關(guān)性高的特征。相關(guān)性分析法是指對2個(gè)或多個(gè)具備相關(guān)性的變量元素進(jìn)行分析,從而衡量2個(gè)變量因素的相關(guān)密切程度[29]。假設(shè)x為某一特征向量,y為后刀具磨損值,則該特征向量與后刀面磨損值之間的相關(guān)系數(shù)表達(dá)式如公式(2)所示:
(2)
式中:cov(x,y)為協(xié)方差;var(x)、var(y)分別為x和y的方差。
其中:ρxy的取值范圍為[-1,1],|ρxy|≥0.9的特征包含切削力信號44個(gè),振動(dòng)信號27個(gè),共計(jì)提取71個(gè)特征。文中將每間隔5個(gè)數(shù)據(jù)選取一個(gè)作為測試數(shù)據(jù),其余數(shù)據(jù)為訓(xùn)練數(shù)據(jù),故訓(xùn)練數(shù)據(jù)量為71×264,測試數(shù)據(jù)量為71×51。同理,將后刀面磨損均值1×315劃分為訓(xùn)練目標(biāo)1×264,測試目標(biāo)1×51。為提升模型的精度和收斂速度,輸入前對所有數(shù)據(jù)進(jìn)行歸一化處理。圖6所示為力信號特征隨走刀次數(shù)的變化曲線。
圖6 力信號特征曲線
根據(jù)初始化參數(shù)設(shè)置隨機(jī)產(chǎn)生初始化染色體種群。二進(jìn)制編碼可以將區(qū)間內(nèi)的無窮多個(gè)點(diǎn)用間隔足夠小的有限個(gè)點(diǎn)來代替,使用二進(jìn)制編碼染色體種群。將染色體重組賦值于 LSTM模型訓(xùn)練,以公式(3)所示的LSTM損失函數(shù)作為評價(jià)染色體適應(yīng)度的優(yōu)劣指標(biāo)[30]。
(3)
然后對篩選出的染色體使用公式(4)解碼獲得個(gè)體的自適應(yīng)函數(shù)值。
(4)
式中:bi1,bi2,…,bil為某個(gè)個(gè)體的第i段,每段段長都為l,每個(gè)bij都是0或1;Ti和Ri是第i段分量xi定義域的左右2個(gè)端點(diǎn)。
為選出種群中適應(yīng)度值最大的個(gè)體,文中采用輪盤賭方法選擇最優(yōu)適應(yīng)度。種群中的個(gè)體是否能夠遺傳到子代將取決于個(gè)體適應(yīng)度值除以種群中所有個(gè)體的適應(yīng)度值之和,即同一種群中適應(yīng)度值越大的個(gè)體成為父代的概率越高,如公式(5)所示:
(5)
式中:fi為第i個(gè)個(gè)體的適應(yīng)度;pi為第i個(gè)個(gè)體被選中的概率。
交叉算子可以保證種群的相對穩(wěn)定且使所得解集朝著最優(yōu)解的方向進(jìn)化,故可隨機(jī)選擇2個(gè)未進(jìn)行過交叉組合的個(gè)體進(jìn)行交叉組合操作。設(shè)交叉概率為P′c,若交叉概率超過閾值Pc,則個(gè)體間發(fā)生交叉組合。具體交叉過程可由公式(6)表示:
C1=A(1,m-1)+B(m,n-1)+A(n,k),P′c≥Pc
C2=B(1,m-1)+A(m,n-1)+B(n,k),P′c≥Pc
(6)
式中:C1、C2為發(fā)生交叉組合后的變型基因;A、B分別為同時(shí)被選定的2個(gè)個(gè)體基因型;m、n分別表示交叉片段的起始點(diǎn)和結(jié)束點(diǎn),且1≤m,n≤k,k為種群中所有個(gè)體基因的長度,即二進(jìn)制編碼的長度。
交叉過后產(chǎn)生的新個(gè)體具有一定的概率發(fā)生變異,可能造成某些遺傳基因的丟失。變異算子可修復(fù)和補(bǔ)充選擇與交叉算子引起的某些基因的丟失,且可防止遺傳算法收斂于局部最優(yōu)解,設(shè)定變異概率為Pm,隨機(jī)從種群中選擇未發(fā)生過變異的個(gè)體計(jì)算其發(fā)生變異的概率P′m,若P′m≥Pm,則對個(gè)體基因編碼的一個(gè)字符取反。若P′m≤Pm,不進(jìn)行變異操作。
經(jīng)以上運(yùn)算過程將產(chǎn)生新的種群,計(jì)算適應(yīng)度值后,對種群進(jìn)行反復(fù)迭代,從而構(gòu)造出最優(yōu)適應(yīng)度的參數(shù)隱藏層神經(jīng)元數(shù)與學(xué)習(xí)率作為遺傳算法的尋優(yōu)參數(shù)。表3為GA-LSTM模型的初始化參數(shù)設(shè)置。
表3 GA-LSTM模型參數(shù)設(shè)置
將100次迭代作為隱藏層神經(jīng)元數(shù)與學(xué)習(xí)率的尋優(yōu)終止條件。圖7所示為適應(yīng)度與學(xué)習(xí)率隨迭代次數(shù)的變化曲線。
圖7 GA改進(jìn)LSTM迭代曲線
由圖7(a)可知:隨迭代次數(shù)的增加,適應(yīng)度呈現(xiàn)逐級下降的趨勢,迭代46次后趨于穩(wěn)定,其最優(yōu)適應(yīng)度為0.000 23。通過GA優(yōu)化后得到LSTM模型的隱藏層神經(jīng)元數(shù)為88,學(xué)習(xí)率為0.049 3。
文中訓(xùn)練LSTM模型采用優(yōu)化器Adam,最大迭代次數(shù)為600,梯度閾值為1,訓(xùn)練125輪后通過乘以因子0.2降低學(xué)習(xí)率。LSTM模型訓(xùn)練時(shí),遵循第1.2節(jié)公式(1)前向計(jì)算每個(gè)神經(jīng)元的輸出值,反向計(jì)算誤差,計(jì)算權(quán)重梯度并進(jìn)行迭代調(diào)整,達(dá)到最大迭代次數(shù)后輸出當(dāng)前的磨損量預(yù)測模型。實(shí)驗(yàn)建模流程如圖8所示。
圖8 建模流程
與絕對誤差相比,相對誤差(MAPE)更能反映測量的可信度,均方根誤差(RMSE)對時(shí)間序列的較高值更敏感[31]。因此,文中將MAPE和RMSE作為模型精度的評價(jià)指標(biāo)。將測試數(shù)據(jù)輸入到訓(xùn)練好的GA-LSTM模型,基于切削力信號和振動(dòng)信號的融合特征進(jìn)行預(yù)測實(shí)驗(yàn),圖9所示為測試集后刀面磨損值預(yù)測曲線??芍篗APE為0.045,RMSE為3.347。
圖9 兩類傳感器信號特征下的后刀面磨損值預(yù)測曲線
為驗(yàn)證GA-LSTM模型的合理性,從數(shù)據(jù)量大小及同一銑刀不同信號類型進(jìn)行驗(yàn)證?;谡駝?dòng)信號和切削力信號分別進(jìn)行預(yù)測實(shí)驗(yàn),圖10所示為振動(dòng)與力信號測試集后刀面磨損值預(yù)測曲線??芍狠斎胝駝?dòng)信號MAPE為0.083,RMSE為6.373;輸入切削力信號MAPE為0.067,RMSE為4.872。
圖10 單一傳感器信號特征下的后刀面磨損曲線
從上述實(shí)驗(yàn)結(jié)果知:隨輸入特征量(27、44、71)的增大,銑刀磨損量預(yù)測效果越好,特征量達(dá)到一定程度時(shí)預(yù)測效果處于平穩(wěn)狀態(tài)。振動(dòng)與力信號預(yù)測結(jié)果大同小異,數(shù)據(jù)量大小是導(dǎo)致結(jié)果存在偏差的原因。因此,GA-LSTM可以有效運(yùn)用于銑刀磨損量預(yù)測。
文中將GA-LSTM預(yù)測結(jié)果與FE-LSTM、CNN及BPNN進(jìn)行對比,表4為不同模型實(shí)驗(yàn)結(jié)果。
表4 不同模型實(shí)驗(yàn)結(jié)果
由表4可知:GA-LSTM、FE-LSTM、CNN及BPNN均可實(shí)現(xiàn)銑刀磨損量的有效預(yù)測,與FE-LSTM、CNN及BPNN相比,GA-LSTM的RMSE分別下降了39.0%、51.5%、41.3%,MAPE分別下降了40.8%、56.7%、48.3%,實(shí)現(xiàn)了銑刀磨損量的高精度預(yù)測。
文中提出了一種基于GA改進(jìn)LSTM的銑刀磨損量預(yù)測方法,該方法利用GA系統(tǒng)內(nèi)部對參數(shù)進(jìn)行優(yōu)勝劣汰而求解出最優(yōu)化參數(shù)的作用,求解出了隱藏層神經(jīng)元數(shù)和學(xué)習(xí)率參數(shù)的最優(yōu)值,并將參數(shù)最優(yōu)值輸入到LSTM模型中,從而達(dá)到對模型的改進(jìn)效果。實(shí)驗(yàn)結(jié)果表明:改進(jìn)后的LSTM模型可實(shí)現(xiàn)對銑刀磨損量的有效預(yù)測,與BPNN、CNN、FE-LSTM等模型相比具備更高的識別精度。另外,此次實(shí)驗(yàn)所使用數(shù)據(jù)的采集裝置比較昂貴且信號采集難度大,不利于實(shí)際生產(chǎn)中的廣泛應(yīng)用。因此,如何有效利用機(jī)床易于采集的各類信號降低信號的采集成本,應(yīng)對不同種類信號時(shí)GA-LSTM模型泛化能力的提升,且將它應(yīng)用于銑刀磨損量的預(yù)測是下一步要研究的問題。