吳琪文,周學(xué)良,吳瑤
(湖北汽車工業(yè)學(xué)院 機(jī)械工程學(xué)院,湖北十堰 442002)
隨著智能制造技術(shù)的迅猛發(fā)展,數(shù)控加工裝備及其輔助加工過程的智能化和自動化逐漸成為提升智能制造水平的關(guān)鍵之一。隨著加工零件產(chǎn)品樣式的復(fù)雜化以及所用材料硬度的提高,導(dǎo)致刀具失效的頻率要高于傳統(tǒng)產(chǎn)品。在加工過程中由于切削材料的組織和硬度不均勻、加工系統(tǒng)產(chǎn)生不良振動或是刀具刃磨質(zhì)量欠佳均易造成切削刃微崩,但是當(dāng)?shù)毒甙l(fā)生細(xì)微崩刃時(shí)并不會引起較大的加工噪聲變化,因此不易被察覺。一旦出現(xiàn)這種情況后刀具的切削能力會下降,雖能夠繼續(xù)切削工作但會大幅降低工件的表面質(zhì)量,若未及時(shí)發(fā)現(xiàn)則會導(dǎo)致刀具的刃損部分迅速擴(kuò)大使刀具完全喪失切削能力,造成生產(chǎn)線的停工。因此及時(shí)有效地監(jiān)測切削刃的破損狀態(tài)對提示工藝系統(tǒng)服役能力、減少質(zhì)量損失具有重要的意義。
以往是在生產(chǎn)線停工后通過監(jiān)測裝置的觸頭與刀具間的接觸或者非接觸式激光束監(jiān)測進(jìn)行判斷刀具的狀態(tài),但考慮到加工現(xiàn)場的可操作性以傳感器信號來反映刀具切削刃的變化更為常用[1-2],常用信號有切削力信號[3-4]、振動信號[5]、聲發(fā)射信號[6-7]、主軸功率信號[8-9]以及電流信號[10]。由于加工過程中的信號噪聲含量較高,需采用信號處理技術(shù)提取有效特征來表征刀具狀態(tài)。最常用的是根據(jù)加工動態(tài)信號的特性,從時(shí)域、頻域以及時(shí)頻域分析提取有效特征來表征刀具的變化,例如Li[11]在時(shí)域中分析電流信號均值的變化來跟蹤銑刀的狀態(tài),從而達(dá)到監(jiān)測的目的,Sun 等[6]依據(jù)聲發(fā)射信號的特定頻率分量特征來判斷刀具的破損狀態(tài),文獻(xiàn)[12-13]則將信號模態(tài)分解到不同頻帶分量中提取其時(shí)頻域中的能量特征來監(jiān)測銑刀的破損狀態(tài),Akbari 等[8]則通過時(shí)頻域特征研究主軸電流信號的諧波畸變,發(fā)現(xiàn)峰值和均方差能夠及時(shí)反映刀具的狀態(tài)。通常表征刀具變化的相關(guān)特征是根據(jù)加工過程和失效機(jī)制來定義的,而特征的選擇則是影響模型預(yù)測精度的關(guān)鍵因素,因此針對不同的加工過程想要保證后續(xù)模型預(yù)測的精度,不僅需要依靠豐富的專家經(jīng)驗(yàn)來提取特征同時(shí)也要花費(fèi)大量的時(shí)間。
隨著深度學(xué)習(xí)方法的不斷發(fā)展,神經(jīng)網(wǎng)絡(luò)在特征提取和異常監(jiān)測方面的性能不斷提高,被廣泛應(yīng)用于刀具狀態(tài)監(jiān)測研究中,也取得了相應(yīng)的成果[14-15]。在神經(jīng)網(wǎng)絡(luò)中CNN 因其較強(qiáng)的特征提取能力被廣泛應(yīng)用于刀具狀態(tài)監(jiān)測領(lǐng)域,Duroa 等[16]通過搭建聲發(fā)射傳感器框架以采集過程數(shù)據(jù),使用CNN 擬合刀具失效的過程來增強(qiáng)刀具狀態(tài)監(jiān)測系統(tǒng)的可靠性;Li 等[10]在主軸電流信號時(shí)域分析的基礎(chǔ)上通過CNN 學(xué)習(xí)刀具在加工過程中的失效過程,達(dá)到預(yù)測刀具破損的目的;Ambadekar 等[17]基于DCNN 提取刀具的側(cè)面磨損特征,在線監(jiān)測刀具狀態(tài)。以往的研究人員在利用CNN 模型監(jiān)測刀具狀態(tài)時(shí),通常采用傳統(tǒng)CNN 結(jié)構(gòu),即構(gòu)造二維數(shù)據(jù)樣本和二維卷積核提取刀具特征。受此啟發(fā),Anti?等[18]將提取到的振動信號經(jīng)短時(shí)傅里葉變換(STFT)為頻譜圖,再經(jīng)過CNN 學(xué)習(xí)頻譜圖中的磨損特征,也取得了較好的監(jiān)測效果。
想要通過CNN 有效提取復(fù)雜數(shù)據(jù)中刀具破損的相關(guān)特征,往往需要大量不同工況下的樣本數(shù)據(jù)訓(xùn)練模型,才能準(zhǔn)確得到不同狀態(tài)下的特征分布。以往研究中作者對數(shù)據(jù)集的構(gòu)建僅限于采集單一切削參數(shù)下的加工數(shù)據(jù),然而單一的工況不能夠全面反映機(jī)械加工中的復(fù)雜工況,因此造成模型的泛化能力差和監(jiān)測準(zhǔn)確性差的結(jié)果。針對這個(gè)問題,提出了一種基于多尺度卷積膠囊網(wǎng)絡(luò)(Multiscaleconvolution capsule network,MCCN)的刀具破損狀態(tài)監(jiān)測模型,監(jiān)測多種切削參數(shù)下刀具是否發(fā)生細(xì)微崩刃??紤]到工業(yè)中傳感器的成本以及安裝的便捷性,采用振動傳感器采集多種切削參數(shù)下刀具正常和細(xì)微崩刃時(shí)的振動信號,然后通過模型中的一維多尺度卷積層對采集到的原始振動信號降噪和提取特征。進(jìn)而通過模型中的膠囊網(wǎng)絡(luò)層進(jìn)一步學(xué)習(xí)特征中的空間位置信息彌補(bǔ)多尺度卷積層特征提取的不足,進(jìn)一步提取信號中的隱藏特征。且在模型中采用學(xué)習(xí)率自適應(yīng)優(yōu)化算法(Adam)動態(tài)更新網(wǎng)絡(luò)參數(shù),同時(shí)在多尺度卷積層中設(shè)計(jì)批量歸一化(Bacth normalization)來規(guī)范網(wǎng)絡(luò)層中輸入數(shù)據(jù)的分布。
卷積神經(jīng)網(wǎng)絡(luò)中的特征提取過程主要由卷積層完成。卷積層中通過卷積核對輸入數(shù)據(jù)進(jìn)行卷積運(yùn)算生成特征圖,特征圖通過激活函數(shù)非線性化生成輸出特征輸入下一層。用Kil和bli分別表示l層中第i個(gè)卷積核的權(quán)重和偏置,卷積運(yùn)算可表示為
式中:*為卷積核和局部區(qū)域之間進(jìn)行點(diǎn)積運(yùn)算;yli+1(j)為 第l+1層 中特征圖i的 第j個(gè)神經(jīng)元的輸出特征。
激活函數(shù)讓網(wǎng)絡(luò)能夠非線性映射輸入信號,增強(qiáng)網(wǎng)絡(luò)的表達(dá)能力。目前在卷積層中常用的激活函數(shù)為整流線性單元( R eLu) , R eLu激活函數(shù)因其在參數(shù)更新的過程中不會出現(xiàn)梯度彌散的性質(zhì)而被廣泛應(yīng)用,可表示為
式中ali+1(j)為經(jīng)過激活函數(shù)后的激活值。
批量歸一化(Batch normalization, BN)的意義在于減少輸入數(shù)據(jù)內(nèi)部協(xié)方差的偏移,使輸入數(shù)據(jù)的分布一致。在訓(xùn)練中利用批量歸一化調(diào)整數(shù)據(jù)在網(wǎng)絡(luò)內(nèi)部層與層中的輸入分布,規(guī)范每一層網(wǎng)絡(luò)輸入數(shù)據(jù)的分布不僅能夠加速網(wǎng)絡(luò)的收斂而且可以減少訓(xùn)練占用的內(nèi)存。通常在卷積層或全連接層之后激活函數(shù)之前添加。批量歸一化中,參數(shù) γ(i)和 β(i)能夠縮放和平移歸一化后的特征,恢復(fù)網(wǎng)絡(luò)的表達(dá)能力,并且在反向傳播參數(shù)更新時(shí)避免梯度消失或爆炸的問題,訓(xùn)練更加高效。當(dāng)批量歸一化層的n維輸入是x=(x(1),···,x(i),···,x(n))時(shí),批量歸一化操作可以表示為:
式中:y(i)為神經(jīng)元響應(yīng)的輸出; γ(i)為 尺度因子; β(i)為平移因子,在參數(shù)更新的過程當(dāng)中 γ(i)和 β(i)也能不斷被更新。
膠囊網(wǎng)絡(luò)是2017 年由Hinton 設(shè)計(jì)提出的[19]。膠囊網(wǎng)絡(luò)的特殊之處在于以膠囊向量神經(jīng)元作為輸入模型,而傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中是使用標(biāo)量神經(jīng)元作為輸入;使用膠囊向量神經(jīng)元作為模型的輸入和輸出,在降低特征信息丟失的同時(shí)也能夠提高模型的特征提取能力[20]。標(biāo)量神經(jīng)元與向量神經(jīng)元對比如圖1所示。
圖1 標(biāo)量與向量神經(jīng)元Fig.1 Scalar neurons and vector neurons
膠囊網(wǎng)絡(luò)的結(jié)構(gòu)分別由普通卷積層、主膠囊層以及數(shù)字膠囊層組成,整個(gè)運(yùn)算過程可以大致分為以下3 個(gè)部分:
1)普通卷積層。與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)一樣,對輸入的數(shù)據(jù)進(jìn)行卷積操作提取初級特征,其表達(dá)式為
2)主膠囊層。在主膠囊層中會將卷積層提取到的初級特征進(jìn)一步提取為高級特征,并且膠囊化后形成主膠囊層,主膠囊主要由卷積層的輸出以及擠壓函數(shù)構(gòu)成,其表達(dá)式為
在擠壓函數(shù)中,輸入的向量被壓縮到0 ~ 1 之間,可以有效降低后續(xù)計(jì)算量。由于擠壓函數(shù)并不會改變輸入向量的方向,因此能夠?qū)⒅髂z囊層中的特征完好的傳遞至數(shù)字膠囊層中。
3)主膠囊層到數(shù)字膠囊層之間的傳遞。膠囊在兩層之間的傳遞涉及兩個(gè)過程,即線性變換和動態(tài)路由參數(shù)更新。與全連接神經(jīng)網(wǎng)絡(luò)不同的是,在數(shù)字膠囊層的線性變換中每一個(gè)膠囊向量都會乘以一個(gè)獨(dú)有的權(quán)重矩陣來預(yù)測更高級別的膠囊向量,其表達(dá)式為
式中:ui為 第i個(gè) 輸入膠囊;Wij為 權(quán)重矩陣;u?j,i為預(yù)測向量。
在動態(tài)路由過程當(dāng)中,每個(gè)由線性變換所得到的預(yù)測向量u?j,i將會按比例分配給高級膠囊sj,并且由動態(tài)路由完成參數(shù)的更新,因此將所有預(yù)測向量加權(quán)求和且經(jīng)擠壓函數(shù)壓縮得到更高級的膠囊,其表達(dá)式為:
式(10)表示sj壓 縮得到vj的 過程,參數(shù)ci j和bi j的更新過程表示為:
式中bi j的初始值表示膠囊i和 膠囊j耦合的對數(shù)先驗(yàn)概率。在每一次迭代中都先將bi j初始化為0,進(jìn)而計(jì)算出耦合系數(shù)ci j的 初始化值和vj, 并且由vj和u?j,i來更新bi j和ci j的值,最終得到一組最佳的耦合系數(shù)。
動態(tài)路由更新過程示意圖如圖2 所示。
圖2 動態(tài)路由更新過程示意圖Fig.2 Schematic diagram of the dynamic routing update process
由于加工環(huán)境中的噪音不可避免,若直接提取特征那么信號中的高頻噪聲會干擾局部特征的提取,從而降低預(yù)測準(zhǔn)確性[21]。因此,本文提出了一種基于MCCN 的監(jiān)測模型,有效避免噪聲干擾的同時(shí)也減少了數(shù)據(jù)預(yù)處理的工作量。MCCN 模型中由多尺度卷積層提取相關(guān)特征,膠囊網(wǎng)絡(luò)層(主膠囊層、全連接層和分類層)監(jiān)測刀具狀態(tài),模型結(jié)構(gòu)如圖3 所示。
圖3 MCCN 網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.3 Diagram of MCCN network structure
在多尺度卷積層中,將第一層卷積層設(shè)計(jì)為寬核卷積,利用寬核卷積感受野寬的特性來抑制信號中的高頻噪聲以此增強(qiáng)網(wǎng)絡(luò)的抗噪性能,同時(shí)在寬核卷積層之后添加兩層小卷積核層來增加網(wǎng)絡(luò)的深度以提高網(wǎng)絡(luò)學(xué)習(xí)能力。多尺度卷積層的輸出作為膠囊網(wǎng)絡(luò)層的輸入,膠囊網(wǎng)絡(luò)層的核心思想是將多尺度卷積層的標(biāo)量輸出膠囊化為向量,進(jìn)一步提取特征中的隱藏信息提高模型的空間特征提取能力。該模型將原始信號作為輸入無需對信號進(jìn)行預(yù)處理,這種端到端的數(shù)據(jù)驅(qū)動方法有效降低了信號處理的復(fù)雜性??紤]到模型是直接輸入原始信號各層中的數(shù)據(jù)分布會明顯變化,因此在卷積層之后設(shè)計(jì)BN 層將各層數(shù)據(jù)的分布拉回一致,進(jìn)而縮短訓(xùn)練時(shí)間提升模型性能。
MCCN 模型中多尺度卷積層的運(yùn)算過程與1.1 節(jié)中介紹的卷積運(yùn)算類似,多尺度卷積層的設(shè)計(jì)能夠從高維空間中抽取有效的刀具特征。由于多尺度卷積層的下一層是主膠囊層,主膠囊層中的膠囊單元為向量單元,將卷積層后激活的特征圖中每8 個(gè)通道合并為一個(gè)新的膠囊單元,因此主膠囊層中膠囊的個(gè)數(shù)為上層激活特征總數(shù)的1/8,重構(gòu)后的膠囊單元作為下一層的輸入。
膠囊單元在主膠囊層中的運(yùn)算過程見1.3 節(jié)中的介紹,數(shù)字膠囊層中輸出的膠囊單元為兩個(gè)維度為10 的向量,分別代表不同的刀具狀態(tài)。因此對預(yù)測向量求其二范數(shù)來表征不同道具狀態(tài)的概率,其表達(dá)式為
式中pj為模型輸出的概率值。在模型的前向傳播過程當(dāng)中,經(jīng)過多尺度卷積層、主膠囊層和數(shù)字膠囊層的運(yùn)算后,將輸出的預(yù)測向量轉(zhuǎn)化為標(biāo)量,最終輸出的是2 個(gè)概率值,分別對應(yīng)刀具的兩種狀態(tài)。
模型訓(xùn)練過程中需要通過損失函數(shù)來衡量模型輸出的預(yù)測值和真實(shí)值之間的差距,作為反向傳播更新網(wǎng)絡(luò)權(quán)重參數(shù)的依據(jù)。本文模型中采用的損失函數(shù)由間隔損失和重構(gòu)損失結(jié)合來計(jì)算總損失,其表達(dá)式為
在反向傳播過程中選用Adam 優(yōu)化方法來更新網(wǎng)絡(luò)權(quán)重,它能夠根據(jù)訓(xùn)練數(shù)據(jù)不斷迭代更新網(wǎng)絡(luò)的權(quán)重有效避免局部最優(yōu)解的同時(shí)占用最少的內(nèi)存,Adam 算法的細(xì)節(jié)可見[22]。
為了驗(yàn)證所提方法的有效性,搭建了車削過程刀具狀態(tài)監(jiān)測實(shí)驗(yàn)平臺,并進(jìn)行了實(shí)驗(yàn)分析。實(shí)驗(yàn)設(shè)備采用J1CK6132 數(shù)控車床、切削材料為45#鋼,切割刀具為硬質(zhì)合金(本次實(shí)驗(yàn)中使用兩種類型的刀具:全新的刀具和細(xì)微崩刃刀具,如圖4 所示)。數(shù)據(jù)采集系統(tǒng)為DT9857 數(shù)據(jù)采集儀,使用Kilster型號為PCB352C33 的振動加速度傳感器(頻率響應(yīng):0.3 ~ 15 kHz)采集車削加工中Z和Y方向的振動信號,外部傳感器數(shù)據(jù)以10.24 kHz 通道采集,傳感器安裝示意圖和實(shí)驗(yàn)環(huán)境如圖5 所示。
圖4 全新刀具和細(xì)微崩刃刀具Fig.4 New tools and slightly chipped tools
圖5 實(shí)驗(yàn)環(huán)境和傳感器布局圖Fig.5 Experimental environment and sensor layout
在實(shí)驗(yàn)中設(shè)置6 種不同的切削參數(shù),主軸轉(zhuǎn)速為800 r/min、1 000 r/min 和1 200 r/min,進(jìn)給量為0.05 mm/r 和 0.06 mm/r,切割深度直徑為0.3 mm。分別使用全新的刀具和崩刃的刀具車削實(shí)驗(yàn),兩種不同狀態(tài)的刀具分別在6 種不同的切削參數(shù)下實(shí)驗(yàn),共計(jì)12 組實(shí)驗(yàn)??紤]到采集的數(shù)據(jù)為完整的車削加工過程包括進(jìn)刀和退刀,為排除此干擾則截取穩(wěn)定車削階段的振動信號構(gòu)建模型訓(xùn)練的數(shù)據(jù)集,且不對信號做任何處理(不同切削參數(shù)下截取穩(wěn)定車削階段中Y方向振動信號,如圖6 所示)。
圖6 平穩(wěn)車削時(shí)原始信號圖Fig.6 Original signals during smooth turning
為了驗(yàn)證MCCN 模型的有效性及優(yōu)越性,本文使用相同的數(shù)據(jù)集從以下角度比較驗(yàn)證:
1)網(wǎng)絡(luò)參數(shù):選取不同batch size 值和不同輸入數(shù)據(jù)段長度進(jìn)行分析。
2)模型對比:在確定網(wǎng)絡(luò)參數(shù)后與CNN 和WDCNN 進(jìn)行對比。
影響MCCN 模型的主要參數(shù)包括batch size 值與輸入數(shù)據(jù)段長度。為比較不同batch size 值下模型性能,設(shè)計(jì)了不同batch size 值對比實(shí)驗(yàn)(batch size=10、25、50、75、100);由于本實(shí)驗(yàn)數(shù)據(jù)集為一維時(shí)間序列,輸入數(shù)據(jù)段長度對網(wǎng)絡(luò)模型的準(zhǔn)確性也會有影響,通過設(shè)計(jì)不同長度的數(shù)據(jù)段作為模型輸入對比試驗(yàn)(輸入數(shù)據(jù)段長度為1 024、2 048、4 096)。
在確定MCCN 的batch size 值和輸入數(shù)據(jù)段長度后與CNN 和WDCNN 進(jìn)行對比。在本文對比的3 種模型當(dāng)中,均直接將原始數(shù)據(jù)作為輸入不進(jìn)行信號預(yù)處理。MCCN 模型的結(jié)構(gòu)參數(shù)、網(wǎng)絡(luò)的前向傳播過程以及損失函數(shù)均在第2 節(jié)中加以介紹,MCCN 模型的網(wǎng)絡(luò)參數(shù)如表1 所示。
表1 MCCN 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Tab.1 MCCN network structural parameters
對比模型CNN 中的卷積操作為二維卷積,池化操作為最大池化,損失函數(shù)選用交叉熵?fù)p失函數(shù),結(jié)構(gòu)參數(shù)如表2所示。
表2 CNN 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Tab.2 CNN network structural parameters
對比模型WDCNN 是Zhang 等提出的一種用于軸承故障診斷的新型CNN 模型,因其較強(qiáng)的抗噪性能,能夠識別不同負(fù)載下軸承的故障種類,并且達(dá)到較高的識別精度[21],因此做為本實(shí)驗(yàn)中的對比模型。對比模型WDCNN 中卷積為一維卷積,池化操作為最大池化,損失函數(shù)選用交叉熵?fù)p失函數(shù),結(jié)構(gòu)參數(shù)信息如表3 所示。
表3 WDCNN 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Tab.3 WDCNN network structural parameters
如3.1 節(jié)所示,實(shí)驗(yàn)中設(shè)置6 種不同切削參數(shù),主軸轉(zhuǎn)速為800 r/min、1 000 r/min 和1 200 r/min,進(jìn)給量為0.05 mm/r 和 0.06 mm/r,切割深度直徑為0.3 mm。分別使用全新的刀具和崩刃的刀具車削實(shí)驗(yàn),兩種不同狀態(tài)的刀具分別在6 種不同的切削參數(shù)下實(shí)驗(yàn),共計(jì)12 組實(shí)驗(yàn)。在刀具正常狀態(tài)的6 組實(shí)驗(yàn)中,均截取穩(wěn)定車削階段下時(shí)常為150 s 的Y方向振動信號,總點(diǎn)數(shù)為9 216 000。在細(xì)微崩刃狀態(tài)的6 組實(shí)驗(yàn)中,均截取穩(wěn)定車削階段下時(shí)常為150 s 的Y方向振動信號,總點(diǎn)數(shù)為9 216 000。因此整個(gè)數(shù)據(jù)集的總總數(shù)據(jù)點(diǎn)數(shù)為18 432 000。
本次實(shí)驗(yàn)基于TensorFlow 框架搭建MCCN、CNN 和WDCNN 網(wǎng)絡(luò)模型,服務(wù)器配置為Intel i7 10TH1650Ti。選取數(shù)據(jù)集的85%作為訓(xùn)練集,15%作為測試集,首先使用訓(xùn)練集訓(xùn)練網(wǎng)絡(luò)模型,其次將訓(xùn)練后的網(wǎng)絡(luò)模型在測試集上進(jìn)行評估測試。
首先對提出的模型進(jìn)行網(wǎng)絡(luò)參數(shù)分析,MCCN模型的主要參數(shù)包括輸入的數(shù)據(jù)段長度和batch size 值。對于輸入數(shù)據(jù)段長度這一參數(shù)來說,數(shù)據(jù)段的長度越長其包含的時(shí)序信息就越多,卷積提取到的時(shí)序特征就越高。但是對比結(jié)果圖7a)顯示,不是數(shù)據(jù)段的長度越長模型的識別精度和收斂速度就越好。因此從時(shí)間成本和準(zhǔn)確度兩方面考慮,應(yīng)當(dāng)選擇合適的數(shù)據(jù)段長度(input=2 048)作為輸入。在確定輸入數(shù)據(jù)段長度為2 048 的前提下,對于另一個(gè)參數(shù)batch size 來說,理論上講batch size 的值越小,模型的精度會越高網(wǎng)絡(luò)的收斂速度更快,但訓(xùn)練時(shí)間也會變長。通常情況下,增大batch size 的值,不僅可以提高內(nèi)存的利用率、減少迭代次數(shù)還能夠縮短計(jì)算時(shí)間,但是在數(shù)據(jù)集較大時(shí)盲目的增加batch size 值則會降低網(wǎng)絡(luò)收斂的速度。因此選取不同的batch size 值對模型性能進(jìn)行測試,測試結(jié)果如圖7b)所示。從結(jié)果中也能夠看出batch size值越小模型的準(zhǔn)確率就越高收斂速度也越快,但是從時(shí)間成本和準(zhǔn)確度兩方面考慮,batch size 值并不是越小越好也不是越大越好。因此根據(jù)數(shù)據(jù)集的大小和網(wǎng)絡(luò)的特點(diǎn),選擇合適的batch size 值(batch size=25)才是提高網(wǎng)絡(luò)性能的解決辦法。
在確定最優(yōu)輸入數(shù)據(jù)段長度和batch size 值后,將MCCN 與對比模型對比試驗(yàn),結(jié)果如表4 所示??梢钥闯瞿P蚆CCN 和WDCNN 在測試集上預(yù)測的準(zhǔn)確度和損失值均遠(yuǎn)高于普通的CNN 模型。然而造成這一結(jié)果的主要原因是,MCCN 和WDCNN模型當(dāng)中均是使用一維信號作為模型輸入和也是使用一維卷積來提取刀具特征,且輸入的信號段尺寸較長來盡可能保留數(shù)據(jù)之間的時(shí)序信息。然而在CNN 對比模型中是將一維原始信號重塑成了二維矩陣作為模型CNN 的輸入且使用二維卷積核提取信號中的特征。對比發(fā)現(xiàn),一維數(shù)據(jù)會比二維數(shù)據(jù)包含更多的時(shí)序信息,同時(shí)一維卷積會比二維卷積更加有效的挖掘信號中隱藏的時(shí)序特征信息,所以MCCN 和WDCNN 能夠更加高效準(zhǔn)確的識別刀具在加工過程當(dāng)中的狀態(tài)。
從表4 中MCCN 和WDCNN 模型在測試集上的預(yù)測精度可以看出,經(jīng)20 次迭代后MCCN 模型的準(zhǔn)確率穩(wěn)定在99.5%以上,且MCCN 模型的損失值在迭代過程中收斂的速度更快,并且損失值穩(wěn)定于0.01 以下,這表明MCCN 模型的泛化能力和魯棒性更強(qiáng)。這可能是由于MCCN 中膠囊網(wǎng)絡(luò)層的設(shè)計(jì)不僅加深了網(wǎng)絡(luò)深度提高了模型的學(xué)習(xí)能力,同時(shí)膠囊網(wǎng)絡(luò)層中特征在主膠囊層到數(shù)字膠囊層之間的傳播有效地過濾出關(guān)鍵的特征信息,減少了關(guān)鍵特征信息的丟失,使模型在多種工況下監(jiān)測的結(jié)果更加準(zhǔn)確。因此本文提出的MCCN 模型在實(shí)際工業(yè)加工中能夠有效的監(jiān)測不同切削參數(shù)下刀具是否發(fā)生破損,具有一定的優(yōu)越性和先進(jìn)性。
本文建立了基于多尺度卷積膠囊網(wǎng)絡(luò)的刀具破損監(jiān)測模型,采用加速度傳感器信號反映刀具的狀態(tài),并且通過多尺度卷積神經(jīng)網(wǎng)絡(luò)建立加工信號與刀具狀態(tài)之間的聯(lián)系。通過多尺度卷積層初步提取相關(guān)特征,膠囊網(wǎng)絡(luò)層進(jìn)一步提取特征中的隱藏信息,最終準(zhǔn)確的識別出刀具在不同切削參數(shù)下是否發(fā)生破損。實(shí)驗(yàn)結(jié)果表明MCCN 模型在識別精度上均優(yōu)于CNN 模型和WDCNN 模型,并且在多種切削參數(shù)下模型的泛化能力更強(qiáng),在實(shí)際機(jī)械加工應(yīng)用中具有一定的優(yōu)越性和先進(jìn)性。