王明微,高靜,李智昂,周競濤,蔡聞峰,龔菊賢
(1.西北工業(yè)大學 機電學院,陜西 西安 710072;2.上海航天設(shè)備制造總廠有限公司,上海 200245)
在切削加工過程中,刀具不可避免地會發(fā)生磨損甚至破損的現(xiàn)象,刀具狀態(tài)的變化會直接導致切削力增大、切削溫度升高、工件表面粗糙度上升、工件尺寸超出公差要求以及切削顫振等問題的產(chǎn)生[1]。因此,在加工過程中對刀具狀態(tài)進行監(jiān)控十分必要。隨著傳感技術(shù)的發(fā)展,通過采集加工過程中與刀具磨損相關(guān)的傳感器信號,如切削力信號、聲發(fā)射信號、電流(功率)信號燈等[2],利用這些信號與刀具磨損之間的強耦合性,通過提取與刀具磨損狀態(tài)相關(guān)的信號特征間接判斷刀具狀態(tài),成為加工過程中實時監(jiān)測刀具的有效手段。
由于從傳感器上采集到的信號無法直接使用,必須先對預處理后的信號進行特征提取。傳統(tǒng)的刀具磨損特征提取方法,如信號處理中的時頻域特征提取方法,是從高維、多源的加工信號、加工工藝等因素中提取刀具磨損特征,其效果一般,且還未完全擺脫對人工經(jīng)驗的依賴。WU等[3]提取了噪聲信號和電流信號的均值、方根幅值、標準差、均方根值、峭度、最大值等,并進行特征篩選,實現(xiàn)對刀具剩余壽命預測。YU等[4]對力信號進行時域特征篩選,從中選擇標準差作為磨損特征,建立了刀具狀態(tài)識別模型。王曉強等[5]采用傅里葉變換提取振動信號和聲發(fā)射信號的頻率幅值,融合統(tǒng)計特征和能量特征,采用隱馬爾科夫建立磨損量預測模型。盡管當前多數(shù)方法可以檢測刀具的磨損情況,但其預測的準確性與切削信號的預處理方法和特征提取有很大關(guān)系,而信號的預處理以及特征的提取都是人為選擇或人為手動構(gòu)建的,耗時長且效果不理想,無法自適應提取對磨損敏感的特征信息。因此,迫切需要一種方法以解決加工中海量切削數(shù)據(jù)的特征提取問題,從而對刀具磨損進行精準預測。
近年來,深度學習方法已成為提取非平穩(wěn)、動態(tài)變化數(shù)據(jù)的有效手段,越來越多地被應用在信號特征提取中。趙光全等[6]提出一種通用性較強的基于深度置信網(wǎng)絡(luò)的故障特征提取及診斷方法。FU等[7]建立基于深度置信網(wǎng)絡(luò)(Deep Belief Networks,DBN)的切削狀態(tài)監(jiān)測的特征空間,將此方法與梅爾頻率倒譜系數(shù)、小波方法相比,結(jié)果表明,DBN具有更好地表征切割狀態(tài)監(jiān)測信號的能力。林楊等[8]采用小波變換對力信號進行特征提取,得到不同頻段上的能量,采用堆棧自編碼網(wǎng)絡(luò)(Stacked Auto-Encoder,SAE)建立刀具磨損狀態(tài)預測模型。孫慧斌[9]采用希爾伯特-黃變換(Hilbert-Huang Transform,HHT)提取監(jiān)測信號的特征信息,得到固有模態(tài)函數(shù)的振幅均值和邊際譜的最大幅值點。曹大理等[10]利用卷積神經(jīng)網(wǎng)絡(luò)自適應的提取特征,通過加深網(wǎng)絡(luò)進一步挖掘信號中隱藏的微小特征。石國強等[11]利用特征描述符網(wǎng)絡(luò)實現(xiàn)對圖像特征點的特征提取。上述深度學習模型雖然降低了特征提取對人工經(jīng)驗的依賴,但仍存在著由于初始化不合理導致的局部最優(yōu)問題,以及網(wǎng)絡(luò)層數(shù)過深帶來的過擬合現(xiàn)象。因此,本文利用SAE 無監(jiān)督和有監(jiān)督學習相結(jié)合的特點,自適應地挖掘出切削數(shù)據(jù)內(nèi)部的隱藏特征,此方法可以有效避免特征提取時由于初始化不合理導致的局部最優(yōu)化問題以及網(wǎng)絡(luò)過擬合問題。
自動編碼器(Auto-Encoder,AE)是一種無監(jiān)督學習神經(jīng)網(wǎng)絡(luò)模型,即原始數(shù)據(jù)不需要添加標簽,其本質(zhì)為一個2 層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),分別為編碼層和解碼層,網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。編碼層主要負責提取原始數(shù)據(jù)中的特征,解碼層負責將特征信息恢復成原始輸入數(shù)據(jù)。
圖1 自動編碼器結(jié)構(gòu)Fig.1 AE structure
圖中:X=[X1,X2,…,Xn]T為網(wǎng)絡(luò)的輸入;n為網(wǎng)絡(luò)輸入層節(jié)點的個數(shù),表示每個樣本的數(shù)據(jù)維度,則原始數(shù)據(jù)X經(jīng)過編碼可以得到的特征數(shù)據(jù)h為
式中:h為經(jīng)過編碼層提取出的特征參數(shù);f為編碼過程使用的激活函數(shù),一般使用Sigmoid 函數(shù);W、b分別為編碼階段使用的權(quán)重和偏置,W的維數(shù)是s×n,s為特征參數(shù)的維度。
解碼過程是原始輸入數(shù)據(jù)的重構(gòu)過程,對特征數(shù)據(jù)h經(jīng)過解碼層可得到重構(gòu)數(shù)據(jù)X'為
式中:Y=[Y1,Y2,…,Yn]T為重構(gòu)出的原始數(shù)據(jù);U為解碼過程使用的激活函數(shù),一般使用Sigmoid函數(shù);W'和b'分別為編碼階段使用的權(quán)重和偏置,其中W'=WT。
針對給定的輸入樣本X,AE 的訓練目標為尋找參數(shù)集θ={W,b,W',b'},使得原始輸入數(shù)據(jù)和重構(gòu)數(shù)據(jù)之間的誤差最小化。在解決回歸問題上,一般將均方誤差函數(shù)作為損失函數(shù),其定義為
式中:m為訓練總 樣本數(shù);X(i)、X'(i)分別 為第i個樣本的原始數(shù)據(jù)和重構(gòu)數(shù)據(jù)。
AE 網(wǎng)絡(luò)采用反向傳播(Back Propagation,BP)訓練方法,采用隨機梯度下降算法求解式(3)的極小值問題。網(wǎng)絡(luò)每訓練一次,AE 模型的參數(shù)更新一次,更新方程為
式中:η∈[0,1]為學習率;α為動量因子;αΔW(t)為動量項,可以改善算法的收斂性能。
自編碼器本質(zhì)上屬于淺層神經(jīng)網(wǎng)絡(luò)模型,處理復雜問題的能力有限,為了克服這一缺點,提出了SAE。SAE 是將一系列AE 模型依次堆疊,前一個AE 的輸出是后一個AE 的輸入,SAE 增加了隱藏層的個數(shù),每一個隱藏層都是前一層輸出的非線性映射表示,每增加一個隱藏層,網(wǎng)絡(luò)就可計算出更加復雜的非線性映射關(guān)系,能夠獲取到原始數(shù)據(jù)更加深層低維的特征,這種標準的SAE 模型具有強大的特征挖掘及表達能力。
具有3 個隱藏層的SAE 模型的構(gòu)建過程,如圖2 所示。首先將原始數(shù)據(jù)X作為輸入,采用無監(jiān)督的學習方式預訓練第一個AE(AE-1)模型,得到隱藏層特征h1,然后將隱藏層特征h1作為下一個AE(AE-2)模型的輸入,采用無監(jiān)督學習方式訓練得到新的隱藏層特征h2,以此類推,最終得到下一個AE(AE-3)模型的隱藏層特征數(shù)據(jù)h3,在此基礎(chǔ)上,對整個網(wǎng)絡(luò)進行有監(jiān)督微調(diào)可以得到更優(yōu)的特征表達。
圖2 SAE 模型的構(gòu)建過程Fig.2 Construction process of the SAE model
為了從原始切削加工數(shù)據(jù)中獲取深層次的非線性特征,本文將SAE 作為特征學習器,借助SAE在無監(jiān)督特征提取方面的優(yōu)勢,增強網(wǎng)絡(luò)自身學習能力,同時減小網(wǎng)絡(luò)過擬合現(xiàn)象?;诖?,提出一種基于SAE 的切削信號數(shù)據(jù)特征提取網(wǎng)絡(luò),其本質(zhì)是一系列特征自主學習的過程,將原始高維數(shù)據(jù)中的主體信息映射到低維空間。
在對原始切削信號進行分割、預處理和壓縮感知處理后,從中選擇分割后的壓縮數(shù)據(jù)片段4 096×3 維切削信號數(shù)據(jù)進行特征提取,具體的SAE 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置如圖3 所示。壓縮后的切削信號通過采用SAE 網(wǎng)絡(luò)進行特征提取得到的低維刀具磨損特征向量的具體流程見表1。
表1 刀具磨損特征提取流程Tab.1 Cutter wear feature extraction process
圖3 基于SAE 的刀具磨損特征提取網(wǎng)絡(luò)Fig.3 Cutter wear feature extraction network based on SAE
在上述刀具磨損特征提取的過程中,每一個AE 都是為了挖掘隱藏在數(shù)據(jù)內(nèi)部的磨損特征,每經(jīng)歷一個隱藏層,都是對數(shù)據(jù)進行一次非線性映射,即是對數(shù)據(jù)的抽象特征提取過程。在刀具磨損特征提取網(wǎng)絡(luò)中,隱藏層節(jié)點數(shù)依次被設(shè)置為:4 096、2 048、1 024、512、128、60。一方面,可以提取到原始切削數(shù)據(jù)內(nèi)部的刀具磨損特征,去除冗余特征;另一方面,可以實現(xiàn)原始數(shù)據(jù)降維,為后續(xù)刀具磨損預測網(wǎng)絡(luò)的輸入做準備。
為了評估基于SAE 提取的切削信號特征,本文從SAE 本身對數(shù)據(jù)的重構(gòu)性能和提取到的切削信號特征2個方面評估基于SAE 提取到的切削信號特征。
由第1 章對SAE 的理論介紹可知,SAE 由多個AE 堆疊而成,經(jīng)過壓縮感知(Compressed Sensing,CS)壓縮后的監(jiān)測信號作為輸入經(jīng)過編碼單元激活函數(shù)被映射到隱藏層,再通過解碼單元重構(gòu)出原始切削信號,以最小化重構(gòu)信號和原始信號的差異為優(yōu)化目標,得到隱藏層最優(yōu)解,將此信號作為下一個編碼器的輸入重復上述過程,最終學習得到深層次的抽象特征。本文采用SAE 對特征數(shù)據(jù)的重構(gòu)能力來研究其特征提取性能,數(shù)據(jù)重構(gòu)網(wǎng)絡(luò)如圖4 所示。
SAE 數(shù)據(jù)重構(gòu)的步驟如下:
步驟1根據(jù)表1 所示的刀具磨損特征提取流程逐個對深度自編碼網(wǎng)絡(luò)進行訓練,得到經(jīng)過SAE網(wǎng)絡(luò)提取到的特征向量;
步驟2在完成SAE 的訓練之后,將最終得到的特征參數(shù)進行逐層反向重構(gòu),建立1 個SAE 重構(gòu)網(wǎng)絡(luò);
步驟3利用原始數(shù)據(jù)對重構(gòu)SAE 網(wǎng)絡(luò)進行微調(diào),得到微調(diào)后的網(wǎng)絡(luò)各層之間的權(quán)重和偏置;
步驟4向訓練好的重構(gòu)網(wǎng)絡(luò)中輸入測試數(shù)據(jù),得到與原始數(shù)據(jù)相對應的重構(gòu)數(shù)據(jù)。
為了進一步探究SAE 的特征提取能力,對經(jīng)過SAE 重構(gòu)得到的數(shù)據(jù),準確、有效地評估重構(gòu)數(shù)據(jù)質(zhì)量是非常重要的,本文采用定性分析和定量分析相結(jié)合的方法對其能力進行評價。定性分析是指通過可視化輸入數(shù)據(jù)曲線和重構(gòu)數(shù)據(jù)曲線來初步評價SAE 的特征提取能力;定量分析是采用均方根誤差(RMSE)和失真度(K)來精確、有效評價輸入數(shù)據(jù)和重構(gòu)數(shù)據(jù)之間的差異性,RMSE、K的值越小,則輸入數(shù)據(jù)和重構(gòu)數(shù)據(jù)的差異性越小,說明SAE 從輸入數(shù)據(jù)提取特征能力越強。RMSE、K可通過式(6)和式(7)進行計算:
式中:x為原始輸入數(shù)據(jù);y為重構(gòu)數(shù)據(jù);m為樣本維數(shù);n為樣本總數(shù)。
主成分分析(Principal Component Analysis,PCA)是提取特征中主成分的一種方法,通過計算樣本數(shù)據(jù)協(xié)方差矩陣的特征向量,將原始特征矩陣線性映射到低維特征空間中。研究表明:相同工況下,經(jīng)PCA 降維得到的特征與刀具磨損量的變化趨勢越相近,則原始特征中包含的刀具磨損信息越多,即原始特征越優(yōu)[12]。因此,本文采用PCA 評估SAE 提取特征的優(yōu)劣,主要步驟如下:
步驟1將經(jīng)SAE 提取的特征值矩陣T(n為樣本數(shù),m為特征數(shù))進行歸一化處理得到特征值矩陣T1,對矩陣T1按列(特征種類)進行去均值處理得到特征值矩陣T0;
步驟2計算矩陣的協(xié)方差矩陣C=T0·T'0,并求出C對應的特征值λi和相應的特征向量μi;
步驟3將特征值λi按照降序排列,前m個特征值λ1≥λ2≥…≥λm代表前m個主成分的方差,若m個主成分的方差貢獻率大于85%,則說明提取的主成分特征能夠反應原始特征信息,對應的特征向量μi按照λi的大小換位,得到新的向量P=[μ1,μ2,…,μm]T;
步驟4計算原始特征向量的主成分得分SC=X0·P,SC=[s1,s2,…,sm],其中s1,s2,…,sm為原始特征向量的第1主成分,第2主成分,…,第m主成分。
得到原始特征的主成分矩陣后,依據(jù)同種工況下主成分特征與刀具磨損量的相關(guān)性程度來判斷原始特征的優(yōu)劣。
4.1.1 實驗裝置
本文采用美國故障診斷與健康管理(Prognostic and Health Management,PHM)協(xié)會在2010年刀具健康預測競賽中的公開數(shù)據(jù)集[13],對本文所提方法進行驗證。實驗平臺為高速數(shù)控銑床,實驗刀具為碳化鎢球頭銑刀,切削材料為不銹鋼(HRC 52)。
實驗采用了多傳感器收集銑削過程中的數(shù)據(jù),包括力傳感器、加速度傳感器和聲發(fā)射傳感器。力傳感器選擇Kistler 壓電石英三向平臺測力儀,測力儀可直接安裝在工作臺上,并將工件裝夾在測力儀平臺上,經(jīng)Kistler 電荷放大器轉(zhuǎn)化為電壓信號并輸出;選擇壓電式加速度傳感器(3 個)采集工件振動信號,將其分別安裝在工件3 個不同方向的表面上,測量出X、Y、Z3 個方向的振動;選擇Kistler 聲發(fā)射傳感器采集銑削過程中的高頻壓力波信號,將其安裝在工件上。
上述傳感器收集的信號經(jīng)過電荷放大后,通過NI DAQ PCI 1200 采集卡(采樣頻率為50 KHz)轉(zhuǎn)化為數(shù)字信號,并將其存入PC 機。PHM 實驗裝置[14]如圖5 所示。
圖5 PHM 實驗裝置Fig.5 PHM experimental facilities
銑削方式為端銑,每次沿著X方向走刀切削108 mm,將它記為一個切削行程,每把刀具切削315 個行程,每次走刀完成,記錄銑刀每個切削刃的后刀面磨損量值,切削參數(shù)見表2。
表2 銑削參數(shù)設(shè)置Tab.2 Milling parameter setting
4.1.2 實驗數(shù)據(jù)
共采用3 把刀具進行切削,分別標記為1 號、2 號和3 號,記作C1、C2、C3。每把刀經(jīng)歷315 個切削行程,共945 個切削行程,即945 個樣本。每把刀包括315 個傳感器數(shù)據(jù)采集表和1 個刀具磨損量采集表。
傳感器數(shù)據(jù)采集表格式為:csv。表格共7 列,分別為:X、Y、Z方向的銑削力,X、Y、Z方向的振動,聲發(fā)射信號的均方根。刀具磨損量采集表格式為:csv,共315 行3 列,315 行為315 個樣本,3 列為每個樣本對應的銑刀3 個刃的磨損量。刀具C1、C2 和C3 分別有315 個切削行程,即為315 個工步,針對每一個工步,將切削力信號數(shù)據(jù)和振動信號數(shù)據(jù)以時間片段328 ms 分割,三向切削力共分為10 個片段,三向振動信號數(shù)據(jù)共分為10 個片段。
下面利用4.1 節(jié)銑削加工中的振動信號,從SAE 自身角度出發(fā),通過重構(gòu)信號與原始信號的均方誤差和失真度來說明SAE 特征提取的有效性。
SAE 的特征提取通過堆疊AE 來實現(xiàn),為探討SAE 的特征提取能力,實驗采用上述壓縮信號進行研究,從時域信號中取12 288 個數(shù)據(jù)點,實驗中將SAE 的個數(shù)設(shè)置為3,第1 個AE 節(jié)點數(shù)為:12 288、4 096、2 048、4 096、12 288;第2 個AE 的節(jié)點數(shù)為2 048、1 024、512、1 024、2 048。保持前2 個AE 節(jié)點個數(shù)不變,第3 個AE 保持前2 個節(jié)點數(shù)設(shè)置為512 128,分別設(shè)置AE 最后一層的節(jié)點數(shù)為512、128、60、30,這4種不同的節(jié)點代表4個不同的目標特征維數(shù),分別以這4種網(wǎng)絡(luò)結(jié)構(gòu)討論SAE 的數(shù)據(jù)重構(gòu)能力。
對原始輸入數(shù)據(jù)進行歸一化處理,按照第3 章步驟對樣本數(shù)據(jù)按照4 種結(jié)構(gòu)進行重構(gòu),為方便觀察,取前100 個數(shù)據(jù)點得到原始數(shù)據(jù)曲線和重構(gòu)數(shù)據(jù)曲線對比如圖6 所示。從圖6 可知,當目標維數(shù)為512維和30 維時,即相對前一層網(wǎng)絡(luò)維數(shù)偏多或過少時,網(wǎng)絡(luò)的重構(gòu)效果相對較差,當目標節(jié)點個數(shù)為60,即維數(shù)相對接近上一層節(jié)點數(shù)時,效果相對最好。
圖6 原始曲線和重構(gòu)曲線Fig.6 Original curve and reconstructed curve
以上定性分析不易得到可靠、直觀的結(jié)論,為進一步定量分析經(jīng)SAE 網(wǎng)絡(luò)重構(gòu)過程得到的重構(gòu)數(shù)據(jù)與原始樣本數(shù)據(jù)之間的差異,本文采用式(6)和式(7)分別計算在每種目標維數(shù)下的RMSE值和K值,結(jié)果見表3。
由表3 可得,目標層維數(shù)為60時RMSE值和K值最小,分別為0.076 5 和0.654 0。該定量分析結(jié)果與定性分析結(jié)果一致,當目標維數(shù)與上一層節(jié)點數(shù)相差過大時,在對原始數(shù)據(jù)進行學習的過程中會有較多的信息丟失,導致前向堆疊AE 提取到的特征數(shù)據(jù)難以重構(gòu)原始輸入數(shù)據(jù),這表明:與上一層節(jié)點數(shù)相比,目標維數(shù)過少時,SAE 網(wǎng)絡(luò)的特征提取能力相對較弱;目標維數(shù)過多時,在AE 網(wǎng)絡(luò)最后一個隱藏層的學習過程中,會引入無用的不相關(guān)的信息,因此對數(shù)據(jù)的重構(gòu)能力相對較差。
表3 不同目標維數(shù)下的RMSE值和S值Tab.3 RMSE and K values in different target dimensions
下面利用銑削加工中的振動信號,將SAE 特征提取方法與其他種類信號特征提取方法進行對比,以PCA 降維后的主成分與磨損量的相關(guān)性為指標闡述SAE 特征提取的優(yōu)勢。
將基于SAE 的特征提取方法與傳統(tǒng)特征提取方法進行對比,包括信號統(tǒng)計特征(21 種)和基于小波包分解的特征提?。?4 種)2 種方法,原始數(shù)據(jù)的統(tǒng)計特征包括壓縮數(shù)據(jù)的最大值、平均值、均方根值、峭度因子、裕度因子、重心頻率、均方頻率等[15]?;谛〔ò纸獾奶卣魈崛∵^程為:將原始壓縮數(shù)據(jù)樣本進行3 層小波包分解(db2 小波基),提取最高能量頻帶的特征參數(shù)(24 個),公式詳見文獻[16]。
本文將SAE 方法學習到的深度特征與傳統(tǒng)的統(tǒng)計特征以及小波包分解提取到的特征進行可視化對比,采用PCA 分別提取統(tǒng)計特征、小波特征以及深度特征的前2 個主成分,為了避免基于SAE 特征提取的偶然性,按照第1 節(jié)所提方法重復運行10次,隨機選擇其中2 次的特征數(shù)據(jù)做測試(可視化其中一次結(jié)果)。
數(shù)據(jù)集C3 中3 種特征的主成分1、主成分2 和刀具磨損量的變化趨勢,如圖7 所示。其中,統(tǒng)計特征的第1、第2 主成分貢獻率分別為84.482%、9.377%;小波特征的第1、第2 主成分貢獻率分別為85.336%、7.052%;深度特征的第1、第2 主成分貢獻率分別為89.909%、5.820%。
圖7 二維特征可視化Fig.7 Two-dimensional feature visualization
由圖7 可知,同種工況下,3 種特征中主成分特征2 與刀具磨損量的相關(guān)度都較低,這可能是由于主成分2 的方差貢獻率較小造成的,主成分特征1與刀具磨損量的變化趨勢大致相同,其中,深度特征的主成分1 與刀具磨損量的相關(guān)程度最高,小波特征次之,統(tǒng)計特征最差。
綜上對比,相較于手工提取的特征,采用SAE提取壓縮數(shù)據(jù)的深層特征包含了更多的刀具磨損信息。主要原因是SAE 能夠自適應地從壓縮數(shù)據(jù)中學習到最能夠表征刀具磨損的代表性特征信息,而人工提取的特征具有一定的盲目性,并不是輸入數(shù)據(jù)最客觀的轉(zhuǎn)換,難以得到準確有效的刀具磨損特征信息。
本文主要采用SAE 特征提取方法,設(shè)計了堆棧自編碼網(wǎng)絡(luò)結(jié)構(gòu),利用其無監(jiān)督學習和有監(jiān)督學習相結(jié)合的優(yōu)勢,自適應地從原始數(shù)據(jù)中挖掘刀具磨損的特征信號。通過與統(tǒng)計特征和小波特征進行對比可以發(fā)現(xiàn):SAE 能從原始數(shù)據(jù)中有效提取出加工信號特征,且特征提取效果優(yōu)于統(tǒng)計特征和小波特征。本文所提方法在壓縮信號的特征提取方面表現(xiàn)出明顯的優(yōu)勢,進一步說明了SAE 特征提取的有效性。