何高清,肖 健
(合肥工業(yè)大學(xué) 機(jī)械工程學(xué)院,安徽 合肥 230009)
在軸承形廓質(zhì)量檢測(cè)中,尺寸檢測(cè)是重要的檢測(cè)環(huán)節(jié)。本文采用多激光傳感器并行高速自動(dòng)化軸承檢測(cè)設(shè)備,在連續(xù)尺寸檢測(cè)過(guò)程中,其采樣檢測(cè)點(diǎn)數(shù)量眾多,檢測(cè)數(shù)據(jù)存在異常值與數(shù)據(jù)波動(dòng)是不可避免的。正確地識(shí)別與處理異常值、降低數(shù)據(jù)的波動(dòng)性,對(duì)軸承檢測(cè)結(jié)果的準(zhǔn)確性與穩(wěn)定性有重要意義。檢測(cè)數(shù)據(jù)發(fā)生波動(dòng)與產(chǎn)生異常值有以下幾個(gè)主要原因:
(1)由于選用激光傳感器進(jìn)行檢測(cè),其檢測(cè)靈敏度高,外界易對(duì)其造成干擾,造成檢測(cè)數(shù)據(jù)不穩(wěn)定;
(2)由于采用類(lèi)三爪卡盤(pán)式固定軸承,當(dāng)檢測(cè)到卡盤(pán)處時(shí),超出傳感器檢測(cè)量程,會(huì)產(chǎn)生異常數(shù)據(jù)點(diǎn);
(3)由伺服電機(jī)帶動(dòng)卡盤(pán)高速旋轉(zhuǎn),進(jìn)而對(duì)軸承進(jìn)行檢測(cè),高速旋轉(zhuǎn)所帶來(lái)的振動(dòng)也會(huì)影響檢測(cè)結(jié)果。
異常檢測(cè)也叫異常挖掘,是指從大量數(shù)據(jù)中找出其行為明顯不同于預(yù)期對(duì)象的過(guò)程[1]。目前,異常數(shù)據(jù)檢測(cè)的方法大體可分為基于統(tǒng)計(jì)的異常檢測(cè)方法[2]、基于距離的異常檢測(cè)方法[3]、基于密度的異常檢測(cè)方法[4]和基于聚類(lèi)的異常檢測(cè)方法[5]等幾種。各方法的優(yōu)缺點(diǎn)分述如下:
(1)基于統(tǒng)計(jì)的異常檢測(cè)方法,通過(guò)統(tǒng)計(jì)學(xué)理論,確定數(shù)據(jù)的分布模型,分析數(shù)據(jù)的離散程度和相應(yīng)模型的評(píng)價(jià)指標(biāo)來(lái)確定數(shù)據(jù)的異常程度,這種方法用于分析只包含單種屬性的數(shù)據(jù);
(2)基于距離的異常檢測(cè)方法,通過(guò)設(shè)定距離閾值,計(jì)算各數(shù)據(jù)點(diǎn)與數(shù)據(jù)集的距離,將大于距離閾值的數(shù)據(jù)確定為異常數(shù)據(jù)。該方法不需要數(shù)據(jù)的具體分布模型,但其算法復(fù)雜度較高,不適用于大數(shù)據(jù)集和密度不均勻的數(shù)據(jù)集;
(3)基于密度的異常檢測(cè)方法,能夠檢測(cè)出基于距離異常算法不能識(shí)別的一類(lèi)數(shù)據(jù)——局部異常,打破了固有的絕對(duì)異常的觀點(diǎn),更符合實(shí)際應(yīng)用,但其結(jié)果對(duì)參數(shù)的選擇敏感,異常因子閾值的選取需要一定的先驗(yàn)知識(shí);
(4)基于聚類(lèi)的異常檢測(cè)方法,一般利用K-Means算法將整個(gè)數(shù)據(jù)集聚類(lèi)成多個(gè)簇,根據(jù)假設(shè)(異常點(diǎn)不屬于任何的簇、異常點(diǎn)一般離最近的簇較遠(yuǎn)、稀疏簇中的點(diǎn)都被認(rèn)為是異常的)確定異常數(shù)據(jù),但其分類(lèi)結(jié)果依賴于分類(lèi)中心的初始化,對(duì)類(lèi)別規(guī)模差異太明顯數(shù)據(jù)的處理效果不好[6-9]。
本文中檢測(cè)數(shù)據(jù)僅關(guān)于軸承尺寸屬性,而且其數(shù)據(jù)量大,對(duì)系統(tǒng)實(shí)時(shí)性要求高,因而需要降低檢測(cè)算法時(shí)間復(fù)雜度;綜合以上異常檢測(cè)方法的優(yōu)勢(shì)與不足并結(jié)合軸承尺寸檢測(cè)數(shù)據(jù)的分布特點(diǎn),筆者采用統(tǒng)計(jì)學(xué)箱型圖理論對(duì)異常值進(jìn)行檢測(cè),對(duì)于異常值用中位數(shù)暫代,再利用最小二乘多項(xiàng)式擬合法對(duì)原數(shù)據(jù)異常點(diǎn)處進(jìn)行校正,且通過(guò)該方法對(duì)檢測(cè)數(shù)據(jù)重新估計(jì),提高檢測(cè)結(jié)果的精度。
軸承檢測(cè)系統(tǒng)主要由硬件系統(tǒng)與軟件系統(tǒng)組成,設(shè)備實(shí)物圖如圖1所示。
圖1 軸承尺寸檢測(cè)設(shè)備
其硬件系統(tǒng)主要包括:激光傳感器、光柵尺、HMI觸摸屏、伺服驅(qū)動(dòng)器及電機(jī)等。
其中,檢測(cè)系統(tǒng)的硬件:激光傳感器選用德國(guó)米銥1420型號(hào),檢測(cè)精度1 μm,完成對(duì)軸承的尺寸采樣;光柵尺用以記錄傳感器的位置,并將位置信號(hào)送入到DSP中;HMI觸摸屏,用以控制整個(gè)檢測(cè)設(shè)備,并對(duì)不同種類(lèi)軸承選擇相應(yīng)的測(cè)量方案;伺服驅(qū)動(dòng)器及電機(jī),用以將激光傳感器移動(dòng)到檢測(cè)位置,并帶動(dòng)軸承的旋轉(zhuǎn)運(yùn)動(dòng)。
軟件系統(tǒng)主要包括DSP(數(shù)字信號(hào)處理器),完成對(duì)電機(jī)的控制、與HMI觸摸屏的信息交互、檢測(cè)參數(shù)的處理、檢測(cè)結(jié)果的輸出等工作。
軸承產(chǎn)品的合格與否,根據(jù)檢測(cè)結(jié)果的最大值、最小值是否在軸承的極限尺寸范圍之內(nèi)判斷。
基于正態(tài)分布的3σ準(zhǔn)則是以假定數(shù)據(jù)服從正態(tài)分布為前提的,但實(shí)際數(shù)據(jù)往往并不符合正態(tài)分布模型,其以均值和方差為基礎(chǔ)來(lái)判定數(shù)據(jù)的異常,受異常值本身的影響較大。而箱形圖理論無(wú)需對(duì)數(shù)據(jù)做出限制,不受異常值的影響,可以直觀地描述數(shù)據(jù)的離散分布情況,并且提供了一個(gè)識(shí)別異常值的標(biāo)準(zhǔn),即大于箱型圖設(shè)定的上界或小于下界的數(shù)值即為異常值。
箱型圖如圖2所示。
圖2 箱型圖
將檢測(cè)數(shù)據(jù)按照從小到大的順序依次排列X1,X2,…,Xn,得到有序數(shù)列,則其中位數(shù)M記為:
(1)
異常值的判定標(biāo)準(zhǔn)為:
Xi>U+K·IQR|Xi (2) 式中:U—上四分位數(shù),區(qū)間[M,Xn]的中位數(shù),表明樣本中只有1/4的數(shù)值大于U;L—下四分位數(shù),區(qū)間[X1,M]的中位數(shù),表明樣本中只有1/4的數(shù)值小于L;IQR—四分位距,IQR=U-L;K—步長(zhǎng)系數(shù),取K=1.5。 選取中位數(shù)暫代異常值,數(shù)據(jù)集的中位數(shù)比平均值具有更強(qiáng)的魯棒性,理論上可以“容忍”不超過(guò)總數(shù)據(jù)量50%的異常值[10],并且保證了數(shù)據(jù)的完整性,有助于對(duì)整體數(shù)據(jù)的最小二乘多項(xiàng)式擬合,即: Xi=M(Xi>U+K·IQR|Xi (3) 原始檢測(cè)數(shù)據(jù)經(jīng)過(guò)異常值檢測(cè)與替代,繼而需要對(duì)替換值進(jìn)行校正。使用最小二乘法多項(xiàng)式擬合的方式,可以根據(jù)整體數(shù)據(jù)的分布趨勢(shì)對(duì)替換值進(jìn)行校正。同時(shí),利用擬合的方式重新處理數(shù)據(jù),降低其波動(dòng)性。 2.3.1 最小二乘法基本原理 最小二乘法(最小平方法)是一種數(shù)學(xué)優(yōu)化技術(shù),通過(guò)最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配[11]。 對(duì)于一組實(shí)驗(yàn)數(shù)據(jù)(xi,yi)(i=0,1,…,m),要求在某個(gè)函數(shù)類(lèi),Φ=span{φ0(x),φ1(x),…,φn(x)}中尋求一個(gè)函數(shù),即: (4) 使φ(x)滿足條件: (5) 由多元函數(shù)極值必要條件可知: (6) 即: (7) 記: (8) 則上式可表示為: α0(φj,φ0)+α1(φj,φ1)+…+αn(φj,φn)=(φj,y) (9) 寫(xiě)成矩陣形式為: (10) 式(10)即為最小二乘法求解的法方程組。 2.3.2 擬合函數(shù)的選取 合適的φ(x)可以增強(qiáng)模型對(duì)檢測(cè)數(shù)據(jù)的解釋能力。 以軸承內(nèi)徑尺寸檢測(cè)為例,本文選用擬合函數(shù)為多項(xiàng)式函數(shù),是根據(jù)在MATLAB的Curve Fitting工具箱中[12],利用有理函數(shù)、三角函數(shù)和多項(xiàng)式函數(shù)對(duì)篩選和替換后的檢測(cè)數(shù)據(jù)擬合后所得到的。 各擬合函數(shù)效果如圖3所示。 圖3 各擬合函數(shù)效果 對(duì)于曲線擬合效果是否最佳,MATLAB有具體的評(píng)價(jià)指標(biāo)SSE和R-square。其中,SSE為誤差平方和,該參數(shù)計(jì)算擬合參數(shù)后的回歸值與原始數(shù)據(jù)對(duì)應(yīng)點(diǎn)的誤差平方和,SSE越小說(shuō)明模型選擇和擬合得更好;R-square為確定系數(shù),其值越接近1,表明方程的自變量對(duì)因變量的解釋能力越強(qiáng),模型對(duì)數(shù)據(jù)的擬合程度越好。 各曲線擬合程度評(píng)價(jià)指標(biāo)如表1所示。 表1 各曲線擬合程度評(píng)價(jià)指標(biāo) 根據(jù)表1中SSE與R-square綜合考慮,筆者選擇七次多項(xiàng)式函數(shù)為擬合函數(shù),即: φ(x)=α0+α1x+α2x2+α3x3+ (11) 筆者以公稱(chēng)內(nèi)徑尺寸為Φ150.7 mm軸承檢測(cè)為例,進(jìn)行實(shí)驗(yàn)。 檢測(cè)數(shù)據(jù)分布與頻率分布直方圖,如圖4所示。 圖4 檢測(cè)數(shù)據(jù)分布與頻率分布直方圖 根據(jù)圖4,通過(guò)計(jì)算可得到檢測(cè)數(shù)據(jù)的均值μ=150.947 0和標(biāo)準(zhǔn)差σ=0.942 2,則正態(tài)分布的概率密度曲線f(x)為: (12) 檢測(cè)數(shù)據(jù)箱型圖和概率密度曲線f(x)如圖5所示。 圖5 檢測(cè)數(shù)據(jù)箱型圖和概率密度曲線f(x) 當(dāng)傳感器檢測(cè)到卡盤(pán)處時(shí),會(huì)得到如圖4(a)中的上部異常數(shù)據(jù)。由圖5(a)觀察可知,箱型圖可以檢測(cè)出這類(lèi)異常數(shù)據(jù)以及其他原因所造成的異常值。由圖4(b)與圖5(b)對(duì)比可知,檢測(cè)數(shù)據(jù)的實(shí)際分布模型不符合正態(tài)分布。 筆者分別使用箱型圖法與3σ準(zhǔn)則法識(shí)別數(shù)據(jù)的異常值,異常數(shù)據(jù)檢測(cè)結(jié)果如表2所示。 表2 異常數(shù)據(jù)檢測(cè)結(jié)果 由表2結(jié)果對(duì)比可知:箱型圖法的異常值識(shí)別率高于3σ準(zhǔn)則法2.3%,而且箱型圖法的異常值識(shí)別區(qū)間小于3σ準(zhǔn)則法,表明箱型圖法對(duì)異常值的識(shí)別準(zhǔn)確率更高;主要由于3σ準(zhǔn)則法要求數(shù)據(jù)服從正態(tài)分布,然而實(shí)際數(shù)據(jù)分布并不能滿足要求。 因此,在大數(shù)據(jù)量的檢測(cè)系統(tǒng)中,箱型圖法更具有優(yōu)勢(shì),故在本研究中選用箱型法作為檢測(cè)異常值的方法。 筆者分別用檢測(cè)數(shù)據(jù)的中位值與平均值替換異常值。異常值替換后數(shù)據(jù)分布如圖6所示。 圖6 異常值替換后數(shù)據(jù)分布 由圖6可知:用中位值替代異常值數(shù)據(jù)分布更為集中化,均值由于受異常值影響較大,而且其在箱型圖法中屬于異常值,不適合選作替換值。 綜上所述,筆者認(rèn)為選取中位數(shù)更為合適。 筆者對(duì)用中位數(shù)替換后的數(shù)據(jù)進(jìn)行擬合。七階多項(xiàng)式最小二乘擬合結(jié)果如圖7所示。 圖7 七階多項(xiàng)式最小二乘擬合 由圖7可知,未經(jīng)擬合時(shí)數(shù)據(jù)的波動(dòng)范圍約為0.1 mm,七階多項(xiàng)式擬合后數(shù)據(jù)的波動(dòng)范圍約為0.05 mm,明顯地降低了數(shù)據(jù)的波動(dòng)性;擬合的數(shù)據(jù)分布相比較直接用中位值替代的數(shù)據(jù)分布,更符合實(shí)際測(cè)量趨勢(shì)。 針對(duì)軸承檢測(cè)系統(tǒng)中出現(xiàn)的異常值與數(shù)據(jù)波動(dòng)問(wèn)題,筆者采用統(tǒng)計(jì)學(xué)箱型圖理論對(duì)異常值進(jìn)行檢測(cè),對(duì)于異常值用中位數(shù)暫代,再利用最小二乘多項(xiàng)式擬合法對(duì)原數(shù)據(jù)異常點(diǎn)處進(jìn)行校正,且通過(guò)該方法對(duì)檢測(cè)數(shù)據(jù)重新估計(jì)。 實(shí)驗(yàn)及研究結(jié)果表明: (1)箱型圖法異常值識(shí)別率高于3σ準(zhǔn)則法2.3%,可準(zhǔn)確、快速地識(shí)別異常值; (2)中位值替換的方式受異常值影響較低,保證了檢測(cè)數(shù)據(jù)的完整性; (3)通過(guò)最小二乘多項(xiàng)式擬合的方式,數(shù)據(jù)波動(dòng)降低為原來(lái)的50%,使數(shù)據(jù)分布更為合理化。 此方法的時(shí)間和空間復(fù)雜度低,易于實(shí)現(xiàn)編程,可保證檢測(cè)系統(tǒng)的實(shí)時(shí)性和準(zhǔn)確性。因此,對(duì)于使用位移傳感器測(cè)量零件尺寸的系統(tǒng)具有一定的參考價(jià)值。2.2 中位數(shù)暫代
2.3 最小二乘法多項(xiàng)式擬合
α4x4+α5x5+α6x6+α7x73 軸承檢測(cè)實(shí)驗(yàn)及結(jié)果分析
4 結(jié)束語(yǔ)