杜柳青,李仁杰,李寶釧
(重慶理工大學(xué) 機(jī)械工程學(xué)院,重慶 400054)
數(shù)控機(jī)床熱誤差預(yù)測(cè)與補(bǔ)償是提高數(shù)控機(jī)床加工精度和可靠性的重要技術(shù)[1-2]。有效補(bǔ)償?shù)年P(guān)鍵是熱誤差準(zhǔn)確建模,近年來,國內(nèi)外學(xué)者對(duì)機(jī)床熱誤差預(yù)測(cè)模型的研究分為理論熱誤差模型與經(jīng)驗(yàn)熱誤差模型[3-5]。理論熱誤差模型依靠對(duì)機(jī)床部件的物理機(jī)理進(jìn)行實(shí)驗(yàn)研究,進(jìn)而進(jìn)行物理建模[6]。Kim[7]、Yun[8]等利用質(zhì)量集中法對(duì)機(jī)床絲杠系統(tǒng)建模,并與有限元模型進(jìn)行對(duì)比。謝飛等[9]發(fā)現(xiàn)了機(jī)床偽滯后現(xiàn)象,建立了基于優(yōu)化最小二乘支持向量機(jī)的熱誤差偽滯后預(yù)測(cè)模型。譚峰等[10]利用二進(jìn)制鯨魚優(yōu)化算法對(duì)最小二乘支持向量機(jī)的超參數(shù)進(jìn)行優(yōu)化,其損失函數(shù)設(shè)計(jì)考慮最大化預(yù)測(cè)精度和最小化最優(yōu)溫度關(guān)鍵點(diǎn),實(shí)驗(yàn)結(jié)果表明熱誤差模型精度提高約62.8%,溫度測(cè)點(diǎn)從20個(gè)減至3個(gè)。上述研究在機(jī)床熱態(tài)性能方面均取得較好進(jìn)展,但現(xiàn)有熱誤差模型受溫度測(cè)點(diǎn)的影響很大,模型的建立和精度依賴于機(jī)床溫度敏感點(diǎn)進(jìn)行布局并優(yōu)化選取。
熱誤差具有時(shí)變、非線性和耦合的特點(diǎn),工況不同,機(jī)床的溫度場(chǎng)分布模式和熱誤差均會(huì)發(fā)生變化。而溫度傳感器的優(yōu)化布置一直是熱誤差補(bǔ)償研究和實(shí)際應(yīng)用中的一個(gè)瓶頸。魏弦等[11]利用模糊聚類與相關(guān)性分析對(duì)溫度測(cè)點(diǎn)進(jìn)行優(yōu)化后,采用特征提取法得到預(yù)測(cè)模型的自變量,從而建立了自適應(yīng)模糊聚類熱關(guān)鍵點(diǎn)優(yōu)化方法,消除了復(fù)共線性對(duì)模型精度與魯棒性的影響。張偉等[12]采用灰色關(guān)聯(lián)法計(jì)算溫度與熱誤差之間的相關(guān)系數(shù),并選取最優(yōu)溫度變量;再用模糊聚類對(duì)所選變量進(jìn)行聚類,確定關(guān)鍵溫度點(diǎn);最后,建立線性回歸模型,將機(jī)床熱誤差由41.3 μm減小到7.6 μm。凡志磊等[13]提出了一種基于偏相關(guān)分析的數(shù)控機(jī)床溫度測(cè)點(diǎn)優(yōu)化方法,實(shí)現(xiàn)了溫度測(cè)點(diǎn)的優(yōu)化,并提高了所建立的多元回歸熱誤差模型的精確性與魯棒性。Chen等[14]通過分別計(jì)算9個(gè)溫度傳感器與3個(gè)方向的位移傳感器之間的關(guān)系,利用判定系數(shù),確定進(jìn)給量的5次多項(xiàng)式與6個(gè)溫度敏感點(diǎn)作為模型的輸入。以上溫度優(yōu)化研究均需面對(duì)一個(gè)難以克服的問題,即數(shù)控機(jī)床的溫度分布具有極強(qiáng)的耦合性并且存在熱彈性效應(yīng)[15],數(shù)控機(jī)床的熱特性不可能達(dá)到絕對(duì)的穩(wěn)定狀態(tài),且隨著機(jī)床的工況不同,以及季節(jié)與氣候等影響因素的作用,機(jī)床的溫度敏感點(diǎn)是可能發(fā)生變化的[16]。使用傳統(tǒng)熱誤差建模方法對(duì)機(jī)床熱誤差進(jìn)行預(yù)測(cè)就會(huì)產(chǎn)生較大的預(yù)測(cè)誤差,導(dǎo)致數(shù)控機(jī)床加工精度降低,滿足不了不同工況運(yùn)行下的精度要求。
深度學(xué)習(xí)算法具有強(qiáng)大的數(shù)據(jù)處理與特征自學(xué)習(xí)能力。目前,針對(duì)深度學(xué)習(xí)的研究主要集中在圖像處理、字符識(shí)別、語義分割等方面,并取得了一些成果[17-19]。為避免溫度測(cè)點(diǎn)變化與敏感點(diǎn)人工選擇對(duì)機(jī)床精度的影響,提高機(jī)床熱誤差預(yù)測(cè)精度和魯棒性,提出一種基于注意力機(jī)制的溫度敏感點(diǎn)自動(dòng)識(shí)別網(wǎng)絡(luò),根據(jù)計(jì)算出的溫度測(cè)點(diǎn)與熱誤差關(guān)聯(lián)程度,賦予各溫度測(cè)點(diǎn)不同的權(quán)值;基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN),建立數(shù)控機(jī)床熱誤差深度學(xué)習(xí)預(yù)測(cè)模型;利用深度CNN的強(qiáng)大特征提取能力,自動(dòng)提取機(jī)床溫度數(shù)據(jù)圖像的特征,準(zhǔn)確建立溫度圖像與熱誤差的非線性映射關(guān)系,在實(shí)驗(yàn)中獲得了較高的熱誤差預(yù)測(cè)精度。
作者建立了一種基于注意力機(jī)制與卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)熱誤差模型,結(jié)構(gòu)如圖1所示,主要包括數(shù)據(jù)轉(zhuǎn)換模塊、敏感點(diǎn)注意力網(wǎng)絡(luò)、深度CNN預(yù)測(cè)網(wǎng)絡(luò)等。該模型的輸入為圖像化的溫度數(shù)據(jù),將數(shù)控機(jī)床原始溫度數(shù)據(jù)轉(zhuǎn)化為溫度圖像,建立的數(shù)控機(jī)床溫度分布圖與深度卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)特性具有高度契合性,也即全部原始溫度數(shù)據(jù)直接作為深度學(xué)習(xí)網(wǎng)絡(luò)的輸入,完整保留了數(shù)控機(jī)床溫度特征。敏感點(diǎn)注意力網(wǎng)絡(luò)自動(dòng)挖掘溫度敏感點(diǎn),避免了溫度測(cè)點(diǎn)人工優(yōu)化,有利于提高效率。深度CNN預(yù)測(cè)網(wǎng)絡(luò)進(jìn)行特征自動(dòng)提取,從多維帶有耦合性的數(shù)據(jù)中自動(dòng)提取出機(jī)床熱誤差的高層次特征,通過訓(xùn)練自動(dòng)找到合適的卷積核,避免了傳統(tǒng)熱誤差建模方法中需要人為優(yōu)化溫度敏感點(diǎn)而存在的種種弊端,從而提升模型的精度與魯棒性。
圖1 基于注意力機(jī)制的深度CNN熱誤差模型Fig. 1 Thermal error modeling of CNN based on attention mechanism
數(shù)控機(jī)床溫度場(chǎng)是在某一瞬間機(jī)床內(nèi)各點(diǎn)溫度分布點(diǎn)的總稱,是時(shí)間與空間位置點(diǎn)分布函數(shù),其溫度分布屬于非穩(wěn)態(tài)溫度場(chǎng)。采用溫度場(chǎng)數(shù)據(jù)轉(zhuǎn)換為溫度圖像點(diǎn)的方式保留了機(jī)床溫度場(chǎng)的完整信息;同時(shí),利用深度學(xué)習(xí)建模方法也避免了溫度測(cè)點(diǎn)之間的非線性與耦合問題。轉(zhuǎn)化思路基于圖像的數(shù)值屬性,即圖像由0~256數(shù)值組成,轉(zhuǎn)換原理如圖2所示。
圖2 溫度場(chǎng)轉(zhuǎn)換示意圖Fig. 2 Schematic diagram of temperature field conversion
將同一時(shí)刻溫度測(cè)點(diǎn)數(shù)據(jù)轉(zhuǎn)換為溫度矩陣,即組成同一時(shí)刻具有機(jī)床完整溫度信息的溫度圖像。
構(gòu)建的深度學(xué)習(xí)熱誤差模型一共有12層,除輸入層和輸出層以外,還含有10個(gè)隱藏層,分別為4個(gè)卷積層、3個(gè)池化層、1個(gè)全連接層和2個(gè)回歸層,具體網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,結(jié)構(gòu)參數(shù)如表1所示。
表1 CNN具體結(jié)構(gòu)Tab. 1 CNN structure
圖3 深度CNN預(yù)測(cè)網(wǎng)絡(luò)Fig. 3 Deep learning prediction net
卷積層與池化層交替連接。卷積層實(shí)現(xiàn)特征自動(dòng)提取,其映射公式為:
式中:x為熱誤差模型的層次特征圖;k為提取溫度抽象特征而構(gòu)造的卷積核;M為溫度特征學(xué)習(xí)的感受野;b為層次特征圖的偏置;l為熱誤差模型的卷積層序號(hào);j為當(dāng)前層特征圖序號(hào);i為前一層特征圖序號(hào);*為卷積運(yùn)算;f(·)為激活函數(shù),采用ReLU型激活函數(shù),其計(jì)算速度與收斂速度快于Sigmoid和tanh,同時(shí)能消除負(fù)信號(hào)的干擾,解決了梯度消失的問題,表達(dá)式為:
池化層盡可能保留較多原始特征信息,同時(shí)降低特征維度,減少運(yùn)算量,并且具有平移不變性的特點(diǎn)。池化層的映射公式為:
式中,down(·)為池化函數(shù), β為權(quán)重,b為池化層偏置。
全連接層的功能是將多維的特征圖展成單一維度的向量,向下傳遞進(jìn)入全連接層網(wǎng)絡(luò),傳遞式為:
式中,b為全連接層偏置,w為權(quán)值。
回歸層用于將卷積神經(jīng)網(wǎng)絡(luò)輸出的傳統(tǒng)分類模式變成回歸預(yù)測(cè)模式,計(jì)算熱誤差預(yù)測(cè)值,計(jì)算式為:
式中,h為回歸層的偏置,s為權(quán)值,h(·)為線性變換函數(shù)。
注意力機(jī)制(attention mechanism,AM)[20]能從較大的信息集里面挑選出有用信息。設(shè)計(jì)一種溫度敏感點(diǎn)注意力網(wǎng)絡(luò),自動(dòng)挖掘溫度測(cè)點(diǎn)與機(jī)床熱誤差間的關(guān)聯(lián)關(guān)系,根據(jù)關(guān)聯(lián)程度,對(duì)溫度測(cè)點(diǎn)賦予不同的重要性,以提高機(jī)床熱誤差預(yù)測(cè)的效率和準(zhǔn)確性。溫度敏感點(diǎn)注意力網(wǎng)絡(luò)如圖4所示。
圖4 敏感點(diǎn)注意力網(wǎng)絡(luò)Fig. 4 Sensitive attention network
注意力網(wǎng)絡(luò)采用softmax函數(shù)實(shí)現(xiàn)注意力評(píng)分操作,softmax將上一層網(wǎng)絡(luò)輸出的相關(guān)性系數(shù)轉(zhuǎn)化為權(quán)值,即狀態(tài)信號(hào)權(quán)重矩陣a,得到各溫度測(cè)點(diǎn)對(duì)機(jī)床熱誤差的重要程度。
然后,對(duì)輸入的溫度數(shù)據(jù)對(duì)應(yīng)加權(quán),對(duì)不同測(cè)點(diǎn)數(shù)據(jù)采取不同的權(quán)重,加權(quán)后的溫度數(shù)據(jù)再作為深度CNN預(yù)測(cè)網(wǎng)絡(luò)的輸入。
深度CNN熱誤差模型網(wǎng)絡(luò)結(jié)構(gòu)較復(fù)雜,導(dǎo)致模型在訓(xùn)練過程中提取數(shù)據(jù)特征時(shí),可能相應(yīng)對(duì)隨機(jī)噪聲特征進(jìn)行了提取,從而導(dǎo)致模型的過擬合。因此,在模型中引入Dropout[21]正則化方法防止模型過擬合,以一定概率隨機(jī)放棄一些被激活的神經(jīng)元,讓模型不會(huì)太依賴某些局部的特征,使網(wǎng)絡(luò)具有稀疏特性,模型更健壯,泛化能力更強(qiáng)。
傳統(tǒng)網(wǎng)絡(luò)訓(xùn)練采用隨機(jī)梯度下降法(stochastic gradient descent,SGD)求解局部最優(yōu)值,由于方向選擇的問題,其得到的結(jié)果不一定是全局最優(yōu)。因此,在深度CNN熱誤差模型的構(gòu)建中引入Adam(adaptive momentum,Adam)[22]自適應(yīng)動(dòng)量的隨機(jī)優(yōu)化方法,通過控制超參數(shù)和調(diào)整學(xué)習(xí)率改善模型的訓(xùn)練過程。
溫度圖像數(shù)據(jù)直接輸入網(wǎng)絡(luò)的第一層,即輸入層;經(jīng)過中間各隱層,逐層變換,逐層映射,直到輸出層。
前向傳播過程包含數(shù)據(jù)前向傳播與Dropout正則化過程,設(shè)置熱誤差深度學(xué)習(xí)網(wǎng)絡(luò)的丟棄率p(一般為0.3~0.6),生成一個(gè)0~1之間均勻分布的隨機(jī)數(shù)組U1,U1中小于p的被置0,大于p的被置1。
設(shè)置神經(jīng)元H1=U1,U1中置0位對(duì)應(yīng)的神經(jīng)元被放棄,即隨機(jī)選擇神經(jīng)層中的一些單元,并將其臨時(shí)隱藏。
使用Dropout正則化后神經(jīng)元的連接方式變化如圖5所示。
圖5 Dropout正則化Fig. 5 Dropout regularization
Adam基于訓(xùn)練數(shù)據(jù)迭代更新熱誤差深度學(xué)習(xí)網(wǎng)絡(luò)參數(shù),熱誤差模型參數(shù)的更新不受梯度的伸縮變換影響,計(jì)算效率高,對(duì)內(nèi)存需求少。該算法從梯度均值及梯度平方2個(gè)角度進(jìn)行更新,步長自適應(yīng)地調(diào)節(jié),而不是直接取決于前梯度值。
在G460L高速線軌刀塔式數(shù)控車床上進(jìn)行了驗(yàn)證應(yīng)用。采用PT100溫度傳感器采集機(jī)床溫度信息,采用ML33-B-V2-3型電渦流位移傳感器測(cè)量主軸徑向與軸向熱誤差,并分別經(jīng)過SBWZ-2460溫度變送器、前置器,以及USB-3120數(shù)據(jù)采集卡將測(cè)得模擬信號(hào)轉(zhuǎn)變?yōu)閿?shù)字信號(hào),輸出到數(shù)據(jù)采集軟件進(jìn)行處理。部分傳感器布置如圖6所示。
圖6 部分傳感器布置Fig. 6 Partial sensors arrangement
溫度傳感器在機(jī)床各部件的布置如表2所示。
表2 溫度傳感器布置Tab. 2 Arrangement of temperature sensors
機(jī)床工況發(fā)生變化,以及不同季節(jié)條件下,實(shí)際的機(jī)床溫度場(chǎng)將發(fā)生不確定的變化。因此,在不同季節(jié)、不同時(shí)間、不同工況下,采集G460L機(jī)床熱誤差與溫度數(shù)據(jù),如表3所示。噪聲問題在空載時(shí)更為突出,空載曲線最富有意義[23-24],因此,設(shè)定機(jī)床主軸為空轉(zhuǎn)模式,機(jī)床主軸以1 500和3 000 r/min 2種轉(zhuǎn)速模擬實(shí)際加工的空載轉(zhuǎn)速;為了提高模型的泛化性,也設(shè)置了6 000 r/min的高轉(zhuǎn)速空載。數(shù)據(jù)采集系統(tǒng)的取樣間隔為30 s,為了降低高采樣頻率帶來的誤差影響,對(duì)測(cè)量數(shù)據(jù)進(jìn)行移動(dòng)均值濾波處理。
表3 G460L溫度數(shù)據(jù)采集Tab. 3 Acquisition of G460L’s temperature data
隨機(jī)選取K8與K11這2組熱誤差和溫升的數(shù)據(jù)進(jìn)行對(duì)比,如圖7所示。從圖7可以看出:在開始測(cè)量的前100 min內(nèi),機(jī)床X方向上熱誤差內(nèi)小于機(jī)床Z方向熱誤差。隨著測(cè)試時(shí)間的增加,X向熱誤差逐漸增大并超過Z向熱誤差;X向熱誤差值總體上呈現(xiàn)指數(shù)形式增長,在測(cè)量時(shí)長達(dá)到150 min左右時(shí),機(jī)床達(dá)到了準(zhǔn)熱特性平衡狀態(tài),熱誤差值變化較小。隨著測(cè)量時(shí)間的增加,機(jī)床溫度也在不斷地增加。部分測(cè)點(diǎn)溫度變化趨勢(shì)十分相近,且呈現(xiàn)出一定的耦合性與相關(guān)性;在不同轉(zhuǎn)速下,同一溫度測(cè)點(diǎn)的溫度值變化也可能發(fā)生較大變化,這與環(huán)境溫度及車間的空氣流通有一定的關(guān)系。
圖7 熱誤差比較、溫升比較Fig. 7 Comparison of temperature rise and thermal error
因此,機(jī)床的溫度變化呈現(xiàn)出較大耦合性與不確定性,這對(duì)熱誤差模型的建立產(chǎn)生了極大影響,使模型的魯棒性及預(yù)測(cè)精度在一定程度上受到影響。相關(guān)研究指出,溫度敏感點(diǎn)在不同工況下會(huì)發(fā)生變化,故根據(jù)現(xiàn)有熱誤差模型選擇溫度敏感點(diǎn)作為模型的輸入,在機(jī)床工況發(fā)生變化時(shí)會(huì)產(chǎn)生模型預(yù)測(cè)精度下降和泛化性降低等問題。
為了減少長時(shí)間測(cè)量過程中其他因素對(duì)數(shù)據(jù)的影響,采用增量形式記錄數(shù)據(jù);同時(shí),也對(duì)數(shù)據(jù)進(jìn)行歸一化處理,減小因數(shù)據(jù)維度差距過大所帶來的影響。將訓(xùn)練數(shù)據(jù)集的順序進(jìn)行隨機(jī)打亂,避免每次訓(xùn)練都以相同的數(shù)據(jù)集順序傳入網(wǎng)絡(luò)模型中。這種措施可以在一定程度上緩解過度擬合。
在模型訓(xùn)練過程中,采用了水平或垂直翻轉(zhuǎn)圖像、隨機(jī)角度旋轉(zhuǎn)圖像、比例縮放圖像、隨機(jī)剪裁圖像、位移圖像、添加高斯噪聲、顏色增強(qiáng)等“數(shù)據(jù)增強(qiáng)”方法提高熱誤差模型的準(zhǔn)確性與泛化性。對(duì)卷積神經(jīng)網(wǎng)絡(luò)在每個(gè)圖像的多個(gè)不同副本上進(jìn)行訓(xùn)練,有利于針對(duì)同一對(duì)象的變化進(jìn)行泛化,從而提高模型的泛化能力與魯棒性。
采用平均絕對(duì)誤差(mean absolute error,MAE)、均方差(mean squared error,MSE)和修正決定系數(shù)R2adj對(duì)模型的性能進(jìn)行量化評(píng)定,彌補(bǔ)R2隨樣本量增加而增大的缺陷。決定系數(shù)R2越接近1,模型預(yù)測(cè)效果越好,精度越高。模型訓(xùn)練后的決定系數(shù)R2值最大的同時(shí),MAE與MSE越小,模型預(yù)測(cè)誤差越小。f(value)為數(shù)據(jù)的相對(duì)變化值,上述指標(biāo)的計(jì)算公式如下:
數(shù)據(jù)增強(qiáng)后的溫度圖像大小對(duì)模型精度會(huì)產(chǎn)生的影響如圖8所示。從圖8中可以看出,選擇將圖像增強(qiáng)為12×12大小時(shí),模型訓(xùn)練后的輸入模型訓(xùn)練后得到的模型各項(xiàng)指標(biāo)均為最優(yōu)。故采用12×12輸入圖像大小作為模型輸入尺寸時(shí)能獲得最高的預(yù)測(cè)精度。
圖8 數(shù)據(jù)增強(qiáng)圖像尺寸對(duì)模型精度的影響Fig. 8 Influence of image size on model accuracy in data enhancement
帶注意力機(jī)制CNN模型的建立基于Tensor-Flow框架,集成開發(fā)環(huán)境為Pycharm以及GTX 1050 Ti顯卡。表4為模型訓(xùn)練參數(shù)的設(shè)置,在模型的全連接層到輸出層之間再設(shè)置2個(gè)回歸層,用于將傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)輸出的分類模式變成回歸預(yù)測(cè)模式。2個(gè)回歸層都使用Dropout正則化優(yōu)化方法,分別設(shè)置Dropout值為0.4和0.3。模型的輸出層激活函數(shù)選擇回歸預(yù)測(cè)模型中常用的Sigmoid激活函數(shù),以得到具有連續(xù)性的熱誤差預(yù)測(cè)值。
表4 CNN熱誤差模型參數(shù)設(shè)置Tab. 4 Parameters setting of CNN thermal error model
選擇最大值池化函數(shù)減少估計(jì)值方差。卷積層與池化層之間的激活函數(shù)為ReLU激活函數(shù),卷積核的初始化采用正態(tài)分布的隨機(jī)數(shù),結(jié)合Adam優(yōu)化算法對(duì)卷積核進(jìn)行優(yōu)化,模型訓(xùn)練結(jié)果如圖9所示。基于深度卷積神經(jīng)網(wǎng)絡(luò)的熱誤差模型設(shè)置有4個(gè)卷積層,深度不斷加深。卷積層的卷積核大小通常優(yōu)先選擇3×3或更小的卷積核,在每個(gè)卷積核后進(jìn)行非線性化,使得在具有相同感受野大小的同時(shí),可以節(jié)省參數(shù),減少過擬合。而且由于網(wǎng)絡(luò)更深,非線性更強(qiáng),效果往往更好[25-28]。
圖9 CNN模型訓(xùn)練集和測(cè)試集的損失函數(shù)曲線Fig. 9 Loss function value curves of CNN model training set and test set
選用應(yīng)用改進(jìn)優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)熱誤差模型[29]、MLR熱誤差模型和非改進(jìn)CNN熱誤差模型用于驗(yàn)證本文AM?CNN熱誤差模型的預(yù)測(cè)效果,并進(jìn)行對(duì)比。將不同工況、不同季節(jié)的數(shù)據(jù)合并作為訓(xùn)練數(shù)據(jù),對(duì)不同轉(zhuǎn)速下測(cè)試集進(jìn)行預(yù)測(cè)[30]。
根據(jù)前述方法進(jìn)行數(shù)據(jù)預(yù)處理及降噪后,一共得到23組數(shù)據(jù),其中17組作為訓(xùn)練集合,選擇不同典型環(huán)境溫度下的6組數(shù)據(jù)進(jìn)行熱誤差預(yù)測(cè)驗(yàn)證。根據(jù)前述建模方法與優(yōu)化方法,建立熱誤差預(yù)測(cè)模型,6組數(shù)據(jù)均有較高的預(yù)測(cè)準(zhǔn)確性,其中,轉(zhuǎn)速條件分別為1 500、3 000、6 000 r/min的K8、K13、K23組預(yù)測(cè)效果如圖10所示(熱誤差觀測(cè)值為X向數(shù)據(jù))。
圖10 不同混合轉(zhuǎn)速下預(yù)測(cè)模型預(yù)測(cè)結(jié)果對(duì)比Fig. 10 Comparison of prediction results of different prediction models under mixed speed
MLR模型、BP模型均采用灰色關(guān)聯(lián)度與聚類分析方法篩選出4個(gè)溫度敏感點(diǎn)作為模型的輸入,CNN與本文AM?CNN模型則采用溫度場(chǎng)轉(zhuǎn)化方法,將溫度圖像作為模型的輸入。BP模型的網(wǎng)絡(luò)超參數(shù)采用遺傳算法對(duì)其進(jìn)行優(yōu)化,優(yōu)化后其網(wǎng)絡(luò)結(jié)構(gòu)為4-9-3-1。從圖10可以看出,基于注意力機(jī)制的CNN熱誤差模型具有較好的預(yù)測(cè)精度與準(zhǔn)確性,對(duì)于混合轉(zhuǎn)速下的數(shù)控機(jī)床熱誤差做出預(yù)測(cè)的同時(shí)也表現(xiàn)出了良好的泛化性,能夠在不同的條件下對(duì)機(jī)床熱誤差做出準(zhǔn)確的預(yù)測(cè)。
AM-CNN模型采用的注意力網(wǎng)絡(luò)能自動(dòng)對(duì)機(jī)床溫度場(chǎng)敏感特征進(jìn)行識(shí)別,進(jìn)行一次建模即能取得和其他模型針對(duì)性建模的預(yù)測(cè)效果。注意力機(jī)制對(duì)溫度敏感點(diǎn)特征重構(gòu)如圖11所示,在不同的時(shí)間,機(jī)床溫度特征重要性發(fā)生了變化,注意力機(jī)制很好地抓住了這個(gè)變化并分配不同的重要性權(quán)重,與傳統(tǒng)CNN方法比較,本文模型的預(yù)測(cè)精度更好,具有更高的魯棒性。
圖11 注意力機(jī)制對(duì)溫度敏感點(diǎn)特征重構(gòu)Fig. 11 Reconstruction of temperature sensitive point features by attention mechanism
圖12為BP方法、CNN方法、MLR方法、本文基于注意力機(jī)制的CNN方法3種數(shù)據(jù)殘差對(duì)比。由圖12可以看出,與CNN模型、BP和MLR模型相對(duì)比,本文AMCNN模型的殘差值波動(dòng)最小,預(yù)測(cè)表現(xiàn)更加穩(wěn)定。幅度的上升。由公式(14)、(15)可得:以K8數(shù)據(jù)集轉(zhuǎn)速為基準(zhǔn),AM-CNN模型的泛化性指標(biāo)Rrpm為0.134 7與0.076 0,BP模型的泛化性指標(biāo)為0.185 2與0.167 1,CNN模型的泛化性指標(biāo)為0.137 4與0.073 3,MLR模型的泛化性指標(biāo)Rrpm為0.098 9與0.282 4。
圖12 模型殘差對(duì)比Fig. 12 Comparison of model residuals
表5 K8數(shù)據(jù)集下各模型預(yù)測(cè)指標(biāo)Tab. 5 Prediction indexes of each model in K8 data set
表6 K13數(shù)據(jù)集下各模型預(yù)測(cè)指標(biāo)Tab. 6 Prediction index of each model in K13 data set
表7 K23數(shù)據(jù)集下各模型預(yù)測(cè)指標(biāo)Tab. 7 Prediction index of each model in K23 data set
從各個(gè)模型的殘差對(duì)比(圖12)中也可以看出,AMCNN模型的殘差值波動(dòng)范圍均為最小。MLR作為熱誤差經(jīng)驗(yàn)?zāi)P椭袘?yīng)用最廣泛的模型,在針對(duì)不同工況下進(jìn)行的建模,其模型的預(yù)測(cè)指標(biāo)與AM-CNN表現(xiàn)較為接近。但是,AM-CNN模型建模與訓(xùn)練過程較為簡單,且不需要人為地對(duì)溫度敏感點(diǎn)進(jìn)行數(shù)學(xué)分析與選擇,采用全部原始機(jī)床溫度場(chǎng)數(shù)據(jù),利用注意力機(jī)制對(duì)其進(jìn)行識(shí)別,很好地利用數(shù)據(jù)驅(qū)動(dòng)模型的特點(diǎn),增加了模型的泛化性。
綜合上述分析,在變轉(zhuǎn)速狀況下,AM-CNN模型更能學(xué)習(xí)到機(jī)床熱特性動(dòng)態(tài)變化的特征,綜合預(yù)測(cè)指標(biāo)相較于BP、MLR和CNN模型更優(yōu),很好地體現(xiàn)出了基于深度卷積神經(jīng)網(wǎng)絡(luò)熱誤差模型對(duì)機(jī)床溫度場(chǎng)信息的特征提取能力。
溫度敏感點(diǎn)隨著季節(jié)、工況、氣候變化而變化,從而影響機(jī)床熱誤差補(bǔ)償?shù)聂敯粜院脱a(bǔ)償精度?;谧⒁饬C(jī)制和卷積神經(jīng)網(wǎng)絡(luò)探索建立了無溫度敏感點(diǎn)預(yù)選的熱誤差預(yù)測(cè)模型,并在G460L型高速線軌刀塔式數(shù)控車床上進(jìn)行了驗(yàn)證應(yīng)用,提高效率的同時(shí)取得了良好的預(yù)測(cè)精度與魯棒性,可在機(jī)床熱誤差建模與補(bǔ)償中應(yīng)用推廣。
1)本文熱誤差模型預(yù)測(cè)準(zhǔn)確,且泛化性好,得益于深度卷積神經(jīng)網(wǎng)絡(luò)高層次特征提取能力。該模型可以學(xué)習(xí)溫度與熱誤差之間的高層次映射關(guān)系,提高了模型的適用性。與BP模型、MLR和CNN模型相比較,AM-CNN模型具有更好的泛化性與預(yù)測(cè)準(zhǔn)確性。
2)基于注意力機(jī)制的敏感點(diǎn)自動(dòng)識(shí)別網(wǎng)絡(luò)解決了溫度測(cè)點(diǎn)人為選取對(duì)熱誤差模型的精度與魯棒性的影響。模型的建立所采用的溫度傳感器數(shù)量為16個(gè),無需對(duì)敏感點(diǎn)進(jìn)行預(yù)選擇,在保留盡可能多的溫度特征信息的同時(shí)也能抑制各溫度點(diǎn)的共線性弊端,解決不同工況、季節(jié)與氣候等因素導(dǎo)致的溫度敏感點(diǎn)變化對(duì)模型精度的影響,與傳統(tǒng)線性模型和機(jī)器學(xué)習(xí)模型相比,優(yōu)勢(shì)明顯。