(河北工業(yè)大學(xué) 機(jī)械工程學(xué)院,天津 300130)
當(dāng)前,數(shù)控機(jī)床以高速度、高精度為發(fā)展趨勢(shì),而作為數(shù)控機(jī)床關(guān)鍵傳動(dòng)部件的滾珠絲杠的精度保持是個(gè)重要的問題。這是因?yàn)闈L珠絲杠在長(zhǎng)期工作中,會(huì)出現(xiàn)磨損而導(dǎo)致數(shù)控機(jī)床的精度下降,給高精度加工帶來難題,因而對(duì)絲杠的磨損檢測(cè)具有重要意義。滾珠絲杠的磨損失效形式分為六種:斷裂、粘合、微裂紋、疲勞剝落、滾道面振紋。而在實(shí)際觀測(cè)中,滾珠絲杠的磨損失效形式往往是多種磨損混合在一起,相互干涉、相互影響[1]。因而,對(duì)絲杠磨損的檢測(cè)是有一定難度的。
在過去的二十年中,磨損檢測(cè)多針對(duì)齒輪、軸承等單一旋轉(zhuǎn)零件,對(duì)往復(fù)式零件的磨損檢測(cè)較少[2~4]。而對(duì)往復(fù)機(jī)械的研究多集中在復(fù)壓縮機(jī)、內(nèi)燃機(jī)(柴油機(jī)及汽油機(jī))、往復(fù)泵等,而對(duì)如絲杠這類旋轉(zhuǎn)往復(fù)式零件的磨損檢測(cè)還是較少[5]。滾珠絲杠是將旋轉(zhuǎn)運(yùn)動(dòng)轉(zhuǎn)換為直線運(yùn)動(dòng),其磨損形式和滾子軸承的磨損有很大的區(qū)別,所以直接運(yùn)用滾子軸承磨損檢測(cè)方法是存在問題的。經(jīng)過多年的研究,雖然滾珠絲杠力學(xué)模型已經(jīng)完備[6],但滾珠絲杠磨損理論還有待進(jìn)一步發(fā)展[7]。
當(dāng)前,滾珠絲杠副磨損診斷方法可分為:經(jīng)驗(yàn)法、振動(dòng)測(cè)量法[8]、聲發(fā)射檢測(cè)法[9]、溫度檢測(cè)法[10,11]、潤(rùn)滑檢測(cè)法[12]。針對(duì)滾珠絲杠的磨損,王禹林等人[13]提出了一種基于全周期分段步加策略的極小子樣滾動(dòng)功能部件加速實(shí)驗(yàn)?zāi)P?,該模型能高效地獲得滾動(dòng)功能部件在不同時(shí)間歷程下的在線監(jiān)測(cè)和離線狀態(tài)數(shù)據(jù)??椎马樀热薣14]利用滾珠絲杠副磨損特征建立了加速退化模型,能夠有效地獲取滾珠絲杠副精度壽命特征。徐向紅等人[15]根據(jù)Archard模型的增量形式建立的滾珠絲杠副的磨損模型,能夠很好的反映黏著磨損階段時(shí)的實(shí)際磨損變化規(guī)律。
對(duì)于絲杠副螺母和絲杠滾道之間磨損模式的研究,徐建生等人[16]在研究滾珠絲杠螺母副的磨損時(shí),發(fā)現(xiàn)常用的精密滾珠絲杠的滾道磨損比螺母嚴(yán)重。由于本文主要研究精密滾珠絲杠,所以就以滾珠絲杠的滾道磨損為具體研究對(duì)象。另外,當(dāng)前磨損診斷對(duì)顯著磨損研究的多,而對(duì)微弱磨損的研究少[4]。而在本文中,以滾珠絲杠滾道的連續(xù)磨損為研究對(duì)象,用于提高診斷的應(yīng)用價(jià)值。
基于經(jīng)驗(yàn)方法的滾珠絲杠磨損檢測(cè),是建立在人長(zhǎng)時(shí)間積累的知識(shí)經(jīng)驗(yàn)上。而視覺信息和聽覺信息是人類兩大信息來源,對(duì)人類學(xué)習(xí)知識(shí)及積累經(jīng)驗(yàn)累至關(guān)重要。本文擬用視聽信息來檢測(cè)滾珠絲杠滾道的磨損狀況,實(shí)現(xiàn)非接觸檢測(cè)、智能診斷的目的。聽覺可以判斷滾珠絲杠的健康狀態(tài),而視覺可以判斷絲杠不同位置對(duì)應(yīng)的健康狀態(tài)。利用視聽信息檢測(cè)絲杠磨損,需要提前進(jìn)行視聽信息的預(yù)處理,使之規(guī)范化。將處理后的聽覺信息采用棧式自編碼器(Stacked Autoencoder)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并得到訓(xùn)練模型。利用訓(xùn)練得到的模型,就能測(cè)試當(dāng)前絲杠滾道的磨損狀況。
由于滾珠絲杠螺桿一般只有旋轉(zhuǎn)運(yùn)動(dòng),直接用視覺測(cè)量絲杠的運(yùn)動(dòng)是不方便的,因此在這里主要測(cè)量絲杠拖動(dòng)的滑塊的運(yùn)動(dòng)。用視覺測(cè)量滑塊的運(yùn)動(dòng),需要從相機(jī)拍攝的每一幀圖像中,提取滑塊角點(diǎn)的位移即可。常用的角點(diǎn)檢測(cè)方法有SIFT算法[16]、SUSAN算法[17]、Harris算法[18]等,其中Harris算法是最成熟的,所以在這里使用Harris算法進(jìn)行角點(diǎn)檢測(cè)。
Harris角點(diǎn)檢測(cè)依據(jù):當(dāng)圖像中某一窗口向任何方向移動(dòng)時(shí),都會(huì)引起灰度大幅度的改變,則可認(rèn)為該窗口處在一個(gè)角點(diǎn)上。在一幅圖像I(x,y)中,從像素點(diǎn)(x,y)平移(u,v)個(gè)單位后,得到移動(dòng)窗口的灰度插值。
其中,E(u,v)是圖像窗口內(nèi)的圖像灰度;w(x,y)為窗函數(shù),在這里選用高斯函數(shù),這樣有利于提升中間像素的權(quán)重,降低邊緣噪聲的影響。將I(x+u,y+v)按照泰勒級(jí)數(shù)進(jìn)行展開,并只取前兩階:
其中,Ix和Iy分別為圖像x方向和y方向的梯度。將上式進(jìn)行如下變換:
將式(3)代入式(1),得:
為了方便表示,現(xiàn)令:
由上可知,矩陣M為一個(gè)2×2的實(shí)對(duì)稱陣。令M的特征值分別為和,以特征值作為角點(diǎn)響應(yīng)值:
其中,k是常量,通常取0.04~0.06[19];當(dāng)R大于設(shè)定的閾值時(shí),則可以認(rèn)為像素點(diǎn)(x,y)為角點(diǎn)。
假設(shè)相機(jī)連續(xù)拍攝了兩張絲杠運(yùn)行的圖片,I1和I2。由Harris角點(diǎn)檢測(cè)得到這兩張圖片中的特征點(diǎn)的集合分別為A1和A2。為了提取絲杠拖動(dòng)滑塊的位移,只需將這兩張圖像中的特征點(diǎn)匹配上,就可以求得。在本文中相機(jī)拍攝的視角是固定的,因而得到的背景也是固定。而由Harris角點(diǎn)檢測(cè)得到的特征點(diǎn)中,有很多屬于背景的角點(diǎn)。為了減少匹配誤差,以及提升匹配速度,而將A1和A2中相同的點(diǎn)去除掉(這里的相同的點(diǎn)是指兩個(gè)特征點(diǎn)間的距離小于一個(gè)像素),分別得到新的集合A1'和A2'。令點(diǎn)(x1,y1)∈A1',該點(diǎn)在A2'中對(duì)應(yīng)的點(diǎn)為(x2,y2),從(x1,y1)到(x2,y2)的映射為:
其中,H∈R3×3為變換矩陣。單憑一對(duì)特征點(diǎn)是無法解出H,這至少還需要3對(duì)特征點(diǎn)。在這里,角點(diǎn)匹配算法采用隨機(jī)抽樣一致(Random Sample Consensus,RANSAC[20])算法。RANSAC算法是從A1'和A2'中隨機(jī)選取4對(duì)特征點(diǎn)來計(jì)算變換矩陣H,其過程如下:
步驟1:選取最大匹配次數(shù)q和距離閾值 ,特征點(diǎn)對(duì)數(shù)設(shè)為m;
步驟2:分別從集合A1'和A2'中隨機(jī)選取4個(gè)點(diǎn),構(gòu)成4對(duì)特征點(diǎn),并計(jì)算出變換矩陣H;
步驟3:利用上面所得H,計(jì)算A2'剩余點(diǎn)對(duì)應(yīng)的配對(duì)點(diǎn),記做(xb,yb)(b=1,2,…,m-4)。
步驟4:令A(yù)1'中剩余的點(diǎn)為(xa,ya),則計(jì)算(xb,yb)到(xa,ya)的距離di(i=1,2,…,m-4)。當(dāng)di< 時(shí),可認(rèn)為該點(diǎn)為內(nèi)點(diǎn)。與此同時(shí),計(jì)算所有內(nèi)點(diǎn)的個(gè)數(shù)ni(i=1,2,…,q);
步驟5:重復(fù)第2步到第4步的方法,直到迭代上限q。從ni中找出最大的數(shù)所對(duì)應(yīng)的變換矩陣H,即為所求匹配關(guān)系。
以上求得的特征點(diǎn)中,雖然不包括背景特征點(diǎn),但是還包括了很多絲杠螺紋運(yùn)動(dòng)的特征點(diǎn)。所以,求取所有特征點(diǎn)對(duì)的平均距離是不能當(dāng)作滑塊的位移大小。為了將絲杠螺紋的特征點(diǎn)對(duì)去除掉,這里采用概率密度來區(qū)分。這是因?yàn)榛瑝K只有平移運(yùn)動(dòng),所以隸屬于滑塊上的特征點(diǎn)對(duì)的距離基本保持一致。而絲杠上的特征點(diǎn)對(duì)的距離隨機(jī)性很大,所以比較容易辨別。對(duì)特征點(diǎn)對(duì)的距離的這種分析,屬于聚類分析。常用的聚類分析有K-means算法、RCOSD算法、DBSCAN算法等[22]。由于經(jīng)過上一節(jié)求取到的特征點(diǎn)對(duì)已經(jīng)很少了,所以在這里采用一個(gè)簡(jiǎn)單的方法進(jìn)行分類。將{di}從小到大排列成{di'},在區(qū)間[d1', dm']之間平分成10份。之后,檢索每個(gè)區(qū)間中di'的個(gè)數(shù),并取個(gè)數(shù)最多的區(qū)間中的di'的平均值作為滑塊的位移大小。
如果將得到的聽覺信號(hào)全部進(jìn)行速傅里葉變換(Fast Fourier Transformation, FFT),就可以得到其頻譜圖,但是這種方法只能針對(duì)時(shí)不變信號(hào)。如果用這種方法處理非穩(wěn)定的信號(hào),則得到的效果是很差的。而短時(shí)傅里葉變換(Short-Time Fourier Transform, STFT)可在一定程度上應(yīng)對(duì)這種時(shí)變信號(hào),能夠揭示信號(hào)頻率隨時(shí)間的變換過程。
首先從離散信號(hào)x讀取M個(gè)采樣點(diǎn):
其中,xm代表輸入信號(hào)的第m幀,R為每幀數(shù)據(jù)的間隔長(zhǎng)度,M=2Ml+1。為了減少頻譜泄露,現(xiàn)令xm(n)與漢明窗口W(n)相乘,得到新的截取數(shù)據(jù):
其中N是FFT的尺寸大小。則得到在m時(shí)刻的STFT為:
其中,wk=2 πkfs/N,fs是采樣頻率。
絲杠信號(hào)的周期性分為兩種形式,一種是絲杠轉(zhuǎn)動(dòng)一圈產(chǎn)生的信號(hào),另一種是滑塊往返絲杠一次產(chǎn)生的信號(hào)。絲杠的滾道磨損信號(hào)的產(chǎn)生只存在磨損處,其不同于軸承每轉(zhuǎn)都會(huì)經(jīng)過磨損處。所以,經(jīng)由STFT得到的絲杠信號(hào)與滑塊所在絲杠的位置有很強(qiáng)的關(guān)聯(lián)性。當(dāng)絲杠以不同的速度運(yùn)行時(shí),得到的STFT數(shù)據(jù)量也是不同的。這樣就導(dǎo)致以不同速度得到的樣本,無法直接進(jìn)行對(duì)比處理?,F(xiàn)將STFT得到的信號(hào)進(jìn)行進(jìn)一步處理:令絲杠旋轉(zhuǎn)一圈為一個(gè)單位,目標(biāo)是在一個(gè)單位內(nèi)產(chǎn)生固定個(gè)數(shù)(ns)的STFT。假設(shè)絲杠在轉(zhuǎn)速r0(單位:r/s)的情況下,經(jīng)由一個(gè)單位產(chǎn)生的STFT個(gè)數(shù)為n0(n0>ns)。令源STFT為S={X1,X2,…,Xn0},目標(biāo)STFT為S'={X1',X2',…,X'ns},Xi'∈S'。則:
其中,a=[in0/ns],b=[n0/(2ns)],符號(hào)[●]為取整運(yùn)算。采用這種變化,可以將絲杠的磨損位置與頻率直接關(guān)聯(lián)上,并能將不同速度下頻率特征的數(shù)據(jù)量保持一致。
在一般情況下,麥克風(fēng)的采樣頻率都很高,為了保持頻率的分辨率,而導(dǎo)致每個(gè)FFT的數(shù)據(jù)量都很大。單個(gè)FFT中含有相當(dāng)大的冗余數(shù)據(jù),這會(huì)嚴(yán)重影響后期的計(jì)算速度。為了方便后期的處理,這里采用降采樣的方式,只截取絲杠頻譜的5000Hz以內(nèi)的頻譜,并將FFT分辨率設(shè)置成10Hz,即每個(gè)FFT只含有500個(gè)數(shù)據(jù)。為了進(jìn)一步優(yōu)化數(shù)據(jù),還需在每個(gè)樣本中進(jìn)行歸一化,這樣方便后續(xù)處理。
經(jīng)過STFT得到的聽覺信息包含了大量的信息,需要進(jìn)一步降維處理才能得到最能表征絲杠健康狀態(tài)的信息。在這里采用棧式自編碼器神經(jīng)網(wǎng)絡(luò),它是由多個(gè)稀疏自編碼器(Sparse Autoencoder)組成的。
稀疏自編碼器是無監(jiān)督學(xué)習(xí)的一種方式,其分為兩個(gè)過程:編碼和解碼,如圖1所示。令輸入樣本集合為{x(1),x(2),x(3),…},x(i)∈Rm,1<i<m;輸出為中間隱藏層為hh(1)},h(1)∈Rn。在編碼過程中,將輸入x(i)映射到隱藏層h(1),其計(jì)算形式如下:
其中,W(1)∈Rn×m是編碼權(quán)值矩陣,b(1)∈Rn是編碼偏置向量;(x)是一個(gè)向量值函數(shù),在非線性情況下通常取為逐元sigmoid函數(shù)或者逐元tanh函數(shù)。
圖1 稀疏自編碼器結(jié)構(gòu)
在解碼過程中,將隱藏層h(1)映射到輸出層,以對(duì)輸入x(i)進(jìn)行重建的過程,其計(jì)算形式如下:
其中,W(2)∈Rn×m是解碼權(quán)值矩陣,b(2)∈Rn為解碼偏置向量;(x)是一個(gè)與(x)類似的逐元函數(shù)。
為了最大程度的保存網(wǎng)絡(luò)輸入信息,現(xiàn)求取與參數(shù)W和b相關(guān)的代價(jià)函數(shù)J(W,b):
其中,J(W,b)定義中的第一項(xiàng)是均方差項(xiàng),m為神經(jīng)元個(gè)數(shù);第二項(xiàng)是權(quán)重衰減項(xiàng),nl為網(wǎng)絡(luò)中層數(shù),sl為第l層的單元數(shù)目(不包含偏置單元), 為權(quán)重衰減系數(shù),其目的是減小權(quán)重的幅度,防止過度擬合。
用aj(x)來表示在給定輸入為x情況下,自編碼神經(jīng)網(wǎng)絡(luò)隱藏神經(jīng)元j的激活度。令隱藏神經(jīng)元的平均活躍度為:
之后,選取稀疏性參數(shù) ,它代表所用網(wǎng)絡(luò)要達(dá)到最終的稀疏程度,其通常是一個(gè)接近于0的較小的值(比如0.06)。在這里用KL散度(Kullback-Leibler divergence)來求取網(wǎng)絡(luò)的稀疏程度與目標(biāo)的差距程度。則 與之間的KL散度為:
為了讓隱藏神經(jīng)元的平均活躍度接近 ,而將KL散度引入代價(jià)函數(shù),得到稀疏自編碼器的代價(jià)函數(shù):
其中,β為稀疏性懲罰因子的權(quán)重。當(dāng)Jsparse(W,b)取得最小值時(shí),此時(shí)得到的W和b的值便是最終所求值。這里首先需要將參數(shù)初始化為一個(gè)接近零的隨機(jī)值,之后采用重復(fù)梯度下降的迭代方法來減小Jsparse(W,b)的值,進(jìn)而得到稀疏自編碼器的參數(shù)。
多層稀疏自編碼器可以構(gòu)成棧式自編碼器,其前一層稀疏自編碼器的編碼輸出作為其后一層稀疏自編碼器的輸入,如圖2所示。棧式自編碼神經(jīng)網(wǎng)絡(luò)參數(shù)的方法是采用逐層貪婪訓(xùn)練(Greedy Layer-wise Training)進(jìn)行訓(xùn)練,即先利用原始輸入x(i)來訓(xùn)練網(wǎng)絡(luò)的第一層,得到原始輸入的一階特征h(1),以及其參數(shù)W(1)和b(1);然后再用這些一階特征作為另一個(gè)稀疏自編碼器的輸入,使用它們來學(xué)習(xí)二階特征h(2),以及得到第二層的參數(shù)W(2)和b(2);最后,對(duì)后面的各層同樣采用的策略,即將前層的輸出作為下一層輸入依次進(jìn)行訓(xùn)練。
圖2 棧式自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
以上為無監(jiān)督訓(xùn)練方式,因?yàn)樵谟?xùn)練每一層參數(shù)的時(shí)候,其他各層的參數(shù)保持不變。而棧式自編碼神經(jīng)網(wǎng)絡(luò)一般會(huì)結(jié)合監(jiān)督式訓(xùn)練方法,即在上述預(yù)訓(xùn)練過程完成之后,可以通過反向傳播算法同時(shí)微調(diào)(finetuning)所有層的參數(shù)以改善結(jié)果。如在圖2中,在最后一層自編碼器訓(xùn)練完成后,把其輸出作為特征輸入到Softmax分類器進(jìn)行分類,利用分類錯(cuò)誤的梯度值直接反向傳播給前面的編碼層。現(xiàn)令訓(xùn)練集由m個(gè)已標(biāo)記的樣本構(gòu)成:
其中,輸入特征為x(i)=[x0,x1,…,xn],而x0=1;輸出特征為y(i)∈{1,2,…,k}。Softmax回歸中將輸入數(shù)據(jù)分類為類別j(j∈{1,2,…,k})的概率為:
Softmax回歸算法的代價(jià)函數(shù)為:
其中,1{.}是示性函數(shù),其取值規(guī)則為:1{True}=1,1{False}=1;為衰減系數(shù),用于懲罰過大的參數(shù)值。此時(shí),為凸函數(shù),用梯度下降法就可以保證收斂到全局最優(yōu)解,并最終得到Softmax回歸模型。
為了驗(yàn)證以上方法的有效性,而進(jìn)行了絲杠滾道磨損實(shí)驗(yàn)。在實(shí)驗(yàn)過程中,保證視聽信息的采集不受外部環(huán)境的聲光影響,以提高實(shí)驗(yàn)的準(zhǔn)確性。
絲杠滾道磨損實(shí)驗(yàn)設(shè)置如圖3所示。其中絲杠直徑為12mm,步長(zhǎng)為4mm。絲杠螺母有3列內(nèi)循環(huán)滾珠,且螺母固定在滑塊內(nèi)。在絲杠的滾道上進(jìn)行人為磨損,磨損方式為從左向右磨損量逐漸增大,之后再逐漸減小,如圖3(b)所示。絲杠有30圈參與磨損實(shí)驗(yàn),其中最左邊的3圈與最右邊的3圈沒有磨損,是作為正常樣本。絲杠由步進(jìn)電機(jī)驅(qū)動(dòng),電機(jī)型號(hào)為57BYGH250B。步進(jìn)電機(jī)驅(qū)動(dòng)器為DM542,設(shè)置其每轉(zhuǎn)脈沖為800,輸出峰值電流為1.91A。相機(jī)與麥克風(fēng)都置于絲杠的正前方,且麥克風(fēng)位于相機(jī)之下。所用相機(jī)為Basler相機(jī),其型號(hào)為acA3800-14uc。在本次實(shí)驗(yàn)中,相機(jī)選用的分辨率為3840 2748,相機(jī)的成像畸變需提前矯正。相機(jī)采用外觸發(fā)方式進(jìn)行拍攝,觸發(fā)頻率為15Hz。麥克風(fēng)采用的是舒伯樂生產(chǎn)的電容型麥克風(fēng),其型號(hào)為ECM888B。該電容的頻率響應(yīng)范圍為20~20000Hz,符合實(shí)驗(yàn)要求。麥克風(fēng)的數(shù)據(jù)采集用惠普筆記本(g6-2146tx)自帶聲卡,聲卡的采樣頻率設(shè)置為44100Hz。實(shí)驗(yàn)的底層控制系統(tǒng)主要由Stm32F103處理器構(gòu)成(未在圖3中顯示),其主要功能為接受來自計(jì)算機(jī)的控制指令,控制步進(jìn)電機(jī)的旋轉(zhuǎn)和相機(jī)的外觸發(fā),并將底層系統(tǒng)狀態(tài)返回到計(jì)算機(jī)。
圖3 實(shí)驗(yàn)設(shè)置
在絲杠磨損實(shí)驗(yàn)中,聽覺作為故障信息的來源,而視覺作為滑塊位置的檢測(cè)。首先將絲杠磨損區(qū)域分為2組,每組含有5種磨損狀態(tài),總計(jì)10份,每份含有3整圈絲杠,其標(biāo)簽如圖3(b)所示。其中,L1為無磨損區(qū)域;L5為嚴(yán)重磨損區(qū)域。在采集絲杠的視聽信息時(shí),以絲杠從左到右運(yùn)行一個(gè)循環(huán)為一組樣本。則一組樣本中含有4個(gè)同一標(biāo)簽區(qū)域的磨損數(shù)據(jù)。實(shí)驗(yàn)的具體流程圖如圖4所示。其中,相機(jī)記錄滑塊的運(yùn)行位置,以及滑塊的運(yùn)行速度;麥克風(fēng)記錄的音頻信息通過STFT處理。STFT的窗口寬度為4410個(gè)采樣點(diǎn);重疊點(diǎn)數(shù)為4000;每次FFT變換的點(diǎn)數(shù)為4409;采樣頻率為44100Hz。根據(jù)2.2節(jié)中的方法,STFT結(jié)合絲杠的位移,便可將STFT映射到絲杠長(zhǎng)度上。每組樣本中含有500個(gè)FFT,則每個(gè)標(biāo)簽下有100個(gè)FFT?,F(xiàn)只取前5000Hz的數(shù)據(jù),即FFT的前500個(gè)數(shù)據(jù)點(diǎn)(因?yàn)槊總€(gè)FFT的分辨率為10Hz)。則每個(gè)樣本為100/4×500=12500個(gè)數(shù)據(jù)點(diǎn)。
由于絲杠磨損區(qū)域比較微小,且絲杠鏡面效應(yīng)嚴(yán)重,所以用相機(jī)直接觀察磨損區(qū)域是困難的。在第一次采集中,需要人工標(biāo)注相機(jī)采集滑塊的位置與磨損處的相對(duì)位置,即標(biāo)注絲杠的標(biāo)簽位置。在本次實(shí)驗(yàn)中,絲杠的速度有四種:5mm/s、7.5mm/s、10mm/s、12.5mm/s。相機(jī)拍攝的連續(xù)兩幀圖像如圖5(a)所示(相機(jī)采集的是彩色圖片,為了方便顯示特征點(diǎn)對(duì)而轉(zhuǎn)成灰度圖),圖中絲杠的設(shè)置速度為7.5mm/s。根據(jù)第1節(jié)中的方法,進(jìn)行Harris角點(diǎn)檢測(cè)并匹配,得到的分類結(jié)果如圖5(b)所示,其中有總共有20個(gè)特征點(diǎn)對(duì)??芍瑝K上的特征點(diǎn)對(duì)與絲杠上的特征點(diǎn)對(duì)有明顯的分離,取第一組中的平均值為6.61像素/幀。在每種速度下的STFT如圖6所示,其對(duì)應(yīng)的規(guī)范化數(shù)據(jù)如圖7所示(為了方便顯示,圖7中的數(shù)據(jù)都是歸一化后并映射到彩色空間中)。從圖6和圖7中可知,絲杠的對(duì)比磨損信號(hào)很微弱,只在L1和L5區(qū)域的數(shù)據(jù)對(duì)比有細(xì)微差別。
圖4 實(shí)驗(yàn)流程
在每一種速度下,分別采集1000組樣本,這其中750組作為訓(xùn)練樣本,250組作為測(cè)試樣本。之后,將訓(xùn)練樣本分別標(biāo)號(hào)并打亂次序后,輸入到棧式自編碼器神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練模型分為5種:其中4種為只對(duì)單一速度進(jìn)行訓(xùn)練和測(cè)試;第5種為將這4種速度放到一塊,混合訓(xùn)練和測(cè)試。棧式自編碼器神經(jīng)網(wǎng)絡(luò)總共有4層,其中,第一層是輸入層,有12500個(gè)神經(jīng)元;第二層為隱藏層,有200個(gè)神經(jīng)元;第三層也為隱藏層,有100個(gè)神經(jīng)元;第四層為Softmax分類層,有5個(gè)神經(jīng)元,這5個(gè)神經(jīng)元對(duì)應(yīng)不同的標(biāo)簽。棧式自編碼器神經(jīng)網(wǎng)絡(luò)按照第3節(jié)中的方法,先將第一次和第二層當(dāng)做第一個(gè)稀疏自編碼器并訓(xùn)練;之后,將其輸出作為第二個(gè)稀疏自編碼器的輸入,并將第三層作為第二個(gè)稀疏自編碼器的輸出,進(jìn)行訓(xùn)練第二個(gè)稀疏自編碼器;最后進(jìn)行Softmax微調(diào)訓(xùn)練。其中,稀疏性懲罰因子的權(quán)重;衰減系數(shù) 。
等完成模型訓(xùn)練后,將測(cè)試數(shù)據(jù)及其標(biāo)簽輸入到模型后,得到測(cè)試結(jié)果,如表1所示。其中,模型A~D分別對(duì)應(yīng)速度5mm/s、7.5mm/s、10mm/s、12.5mm/s;模型E為混合模型。從測(cè)試結(jié)果可知,模型B的整體識(shí)別正確率最高;模型E整體識(shí)別率最低。這說明所用模型對(duì)于不同速度下的數(shù)據(jù)進(jìn)行統(tǒng)一訓(xùn)練,其效果不如只針對(duì)單一速度下的模型。另外,對(duì)于模型對(duì)于磨損量的識(shí)別率沒有明顯的差距:在模型A、C中,對(duì)L1的識(shí)別正確率要高于L5;在模型B、D、E中,對(duì)L1的識(shí)別正確率要低于L5。另外,在本次實(shí)驗(yàn)中也加入了其他算法——SVM和廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network,GRNN)。SVM采用LIBSVM軟件包中的函數(shù),其類型選用C-SVC;核函數(shù)為RBF。采用SVM對(duì)同樣的樣本進(jìn)行訓(xùn)練和測(cè)試,其結(jié)果如表2所示。GRNN在光滑因子值為0.01時(shí),得到測(cè)試結(jié)果如表3所示。由表1~表3可知,棧式自編碼器神經(jīng)網(wǎng)絡(luò)的正確率要高于SVM和GRNN。
圖5 相機(jī)采集的數(shù)據(jù)
圖6 不同速度下的STFT
圖7 規(guī)范化之后的圖6
表1 棧式自編碼器神經(jīng)網(wǎng)絡(luò)測(cè)試正確率(%)
表2 SVM測(cè)試正確率(%)
表3 GRNN測(cè)試正確率(%)
針對(duì)當(dāng)前絲杠磨損檢測(cè),無法有效的確定磨損量的空間分布,本文采用視聽信息來檢測(cè)絲杠的磨損情況:用視覺確定磨損區(qū)域;用聽覺判斷磨損量。視覺采用Harris角點(diǎn)檢測(cè)來確定絲杠滑塊的位移;聽覺采用STFT來提取絲杠健康信息。由于絲杠磨損具有空間上的相關(guān)性,所以依據(jù)視覺信息將STFT進(jìn)行規(guī)范化,使得磨損信號(hào)與空間相關(guān)聯(lián)。為了從規(guī)范化的STFT中提取絲杠健康信息,本文采用棧式自編碼神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)的訓(xùn)練與測(cè)試。該神經(jīng)網(wǎng)絡(luò)含有兩個(gè)稀疏自編碼器和一個(gè)Softmax分類器,能有效地進(jìn)行數(shù)據(jù)分類,且微調(diào)后的準(zhǔn)確率能夠達(dá)到90%以上。文中采用的方法還有些不足之處:棧式自編碼神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)長(zhǎng)過長(zhǎng);檢測(cè)精度還有有待提高;聲音信號(hào)易受環(huán)境噪音影響等。未來還需進(jìn)一步提升視聽檢測(cè)的性能,使其能真正用在實(shí)際工程中。