王小東,王 柱,林承敏,王天雷,黃桂武,周智恒
(1.廣東科杰機械自動化有限公司,廣東 江門 529030;2.五邑大學(xué)智能制造學(xué)部,廣東 江門 529020;3.華南理工大學(xué)電信工程學(xué)院,廣州 510640)
數(shù)控加工的主要目的是減少加工誤差。一般有兩種方法:輪廓控制和軌跡跟蹤控制[1-2]。輪廓控制旨在減少加工過程中的輪廓誤差,已有學(xué)者進(jìn)行了研究[3-4]。與輪廓控制不同,軌跡跟蹤控制旨在提高各軸的跟蹤性能,控制器結(jié)構(gòu)簡單,魯棒性好。為獲得良好軌跡跟蹤控制性能,采用了許多傳統(tǒng)控制方法,如滑??刂芠5-6]和前饋控制[7-8]。近年來,迭代學(xué)習(xí)被用于軌跡跟蹤控制[9-11],但其缺點是需要在同一軌跡上重復(fù)運行。需要一種能夠?qū)崿F(xiàn)高精度軌跡跟蹤控制并適用于不同軌跡的控制算法。
隨著計算能力的提高,人工神經(jīng)網(wǎng)絡(luò)在軌跡跟蹤控制中的應(yīng)用越來越廣泛[12-14]。由于其獨特的學(xué)習(xí)能力,神經(jīng)網(wǎng)絡(luò)可以在訓(xùn)練過程中學(xué)習(xí)系統(tǒng)的動力學(xué),并將其應(yīng)用于控制系統(tǒng)。Wai R J[15]提出了一種滑模神經(jīng)網(wǎng)絡(luò)(SMNN)控制系統(tǒng),用于n剛性連桿機器人的軌跡跟蹤控制,以實現(xiàn)高精度的位置控制。Chen S[16]提出了一種將人工神經(jīng)網(wǎng)絡(luò)用于迭代學(xué)習(xí)控制的方法,以減小多軸工業(yè)機器人的跟蹤誤差。使用高保真動態(tài)模擬器,針對給定的期望軌跡,對外部命令進(jìn)行迭代優(yōu)化,以補償機器人內(nèi)環(huán)動力學(xué)。然后,使用這些期望軌跡和相應(yīng)的細(xì)化輸入軌跡訓(xùn)練多層神經(jīng)網(wǎng)絡(luò),以仿真非線性內(nèi)環(huán)動力學(xué)的動態(tài)逆。最后,Li Q[17]提出了一種基于DNN的算法作為一個附加模塊,以提高經(jīng)典反饋控制器的跟蹤性能。給定所需軌跡,DNN根據(jù)其學(xué)習(xí)經(jīng)驗為控制器提供定制的參考輸入。
實際加工時,封裝在機床中的控制器很難修改。因此,修改參考軌跡的方法更為實用。本文提出了一種基于閉環(huán)伺服系統(tǒng)LSTM-NN模型的軌跡跟蹤方法。首先,分析了伺服系統(tǒng)各部分的動態(tài)特性,建立了系統(tǒng)模型。然后,通過分析系統(tǒng)傳遞函數(shù),選擇LSTM-NN的輸入特征并對其進(jìn)行訓(xùn)練,以建立參考軌跡與實際軌跡之間的映射。最后,利用訓(xùn)練好的LSTM-NN,得到修改后的參考軌跡,用于提高系統(tǒng)的跟蹤精度。本文的主要貢獻(xiàn)體現(xiàn)在本文介紹了一種新的基于LSTM-NN的軌跡跟蹤控制方法,該方法在不修改伺服系統(tǒng)控制器的情況下,提高了加工精度,適合于實際應(yīng)用。
三軸數(shù)控機床系統(tǒng)由3個單軸伺服系統(tǒng)組成。由于3個軸之間耦合性較弱且系統(tǒng)模型相似,本文將對單軸伺服系統(tǒng)進(jìn)行分析并建模。如圖1所示,單軸伺服系統(tǒng)一般分為伺服驅(qū)動器、伺服電機和機械傳動3部分,接下來分別對這3部分進(jìn)行建模。
圖1 伺服系統(tǒng)結(jié)構(gòu)
機械傳動部分的動力學(xué)方程為:
式中:JL為總慣性矩;BL為總阻尼因子;KL為總剛度;θS為輸出角;θM為期望角;TS為擾動;TL為總扭矩。
為便于分析,考慮TS=0,將轉(zhuǎn)動運動轉(zhuǎn)換為直線運動,然后進(jìn)行拉普拉斯變換,得到機械傳動部分的傳遞函數(shù):
式中:y(s)=iSθS(s),iS=l/2π,l為螺桿導(dǎo)程。
伺服電機通常是永磁同步電機。在d-q坐標(biāo)系下,用以下4個方程來建立永磁同步電機的數(shù)學(xué)模型。
(1)電壓方程
式中:Ud和Uq分別為d軸和q軸的電壓;R為定子電阻;ψd和ψq分別為d軸和q軸的磁通;id和iq分別為d軸和q軸的電流;ω為轉(zhuǎn)子角速度。
(2)磁鏈方程
式中:Ld和Lq分別為d軸和q軸的等效電感;ψf為永磁體穿過定子繞組磁鏈的磁場。
(3)電磁轉(zhuǎn)矩方程
式中:Kc=npψf;Te為電磁轉(zhuǎn)矩;np為定子的極對數(shù)。
(4)運動方程
式中:TL為電機的負(fù)載轉(zhuǎn)矩;J為轉(zhuǎn)動慣量;D為電機的阻尼系數(shù);ωr為電機的角速度;
基于以上4個方程,考慮Ld=L,D=0以及id=0,可以得到一個簡化的永磁同步電機模型:
在伺服系統(tǒng)中,通常采用三回路控制器,電流和速度環(huán)采用比例積分(PI)控制器,位置環(huán)采用P控制器。伺服驅(qū)動器包括逆變器、低通濾波器、電流環(huán)控制器、速度環(huán)控制器和位置環(huán)控制器,下面分別對其進(jìn)行建模。
(3)位置環(huán)控制器為KPP,其中KPP是位置環(huán)控制器的比例增益。
式中:b0,b1和a0,a1,…,a6由圖2中簡化模型計算所得。
圖2 傳遞函數(shù)模型
基于ANN逆模型的傳統(tǒng)控制框架如圖3所示。采用神經(jīng)網(wǎng)絡(luò)逆模型作為前饋控制器,通過修改控制輸入補償系統(tǒng)的跟蹤誤差,并采用反饋控制器抑制未知擾動和參數(shù)不確定性。在此控制框架中,建立了開環(huán)被控對象的逆模型,該模型由于不可避免的系統(tǒng)不確定性而限制了模型的精度。
圖3 傳統(tǒng)控制框架
本文提出的閉環(huán)LSTM軌跡跟蹤控制框架如圖4所示。在閉環(huán)LSTM中,控制系統(tǒng)可分為兩部分。第一部分是一個單軸伺服系統(tǒng),其中包括一個采用三環(huán)控制的伺服驅(qū)動器,一個伺服電機和機械傳動部分。閉環(huán)PEA的輸入為參考軌跡yr(k),輸出為實際軌跡y(k)。第二部分是基于LSTM-NN的軌跡修正模塊。其輸入為給定軌跡yd(k),輸出為修改后的參考軌跡yr(k)。伺服系統(tǒng)中的三環(huán)伺服驅(qū)動器既能保證系統(tǒng)的穩(wěn)定性,又能實現(xiàn)一定的軌跡跟蹤精度。對于相同的參考軌跡,閉環(huán)系統(tǒng)可以產(chǎn)生類似的跟蹤誤差,即與開環(huán)系統(tǒng)相比,該系統(tǒng)具有更好的魯棒性和可重復(fù)性。對于這樣的閉環(huán)系統(tǒng),可以使用具有強大時間序列逼近能力的LSTM-NN學(xué)習(xí)yd(k)與yr(k)之間的映射關(guān)系。利用訓(xùn)練好的LSTM-NN對參考軌跡進(jìn)行修正,提高了整個伺服系統(tǒng)的跟蹤性能。
圖4 閉環(huán)LSTM軌跡跟蹤控制框架
提出的Closed-LSTM如圖5所示,包括一個訓(xùn)練階段和一個測試階段,使用LSTM-NN學(xué)習(xí)yd(k)和yr(k)之間的映射。在訓(xùn)練階段,把y(k)看作yd(k),實際軌跡y(k),y(k+1),…,y(k+N)作為LSTM-NN的訓(xùn)練輸入,參考軌跡yr(k),yr(k+1),…,yr(k+N)作為LSTM-NN的訓(xùn)練輸出。在測試階段,利用訓(xùn)練好的LSTM-NN對期望軌跡進(jìn)行修正,得到新的參考軌跡。LSTM-NN的輸入為期望軌跡yd(k),輸出為參考軌跡yr(k)。當(dāng)伺服系統(tǒng)中輸入?yún)⒖架壽Eyr(k)時,如果LSTM-NN絕對準(zhǔn)確,則其實際軌跡y(k)等于期望軌跡yd(k)。
圖5 控制系統(tǒng)框架
基于單軸伺服系統(tǒng)的簡化模型(8),將傳遞函數(shù)轉(zhuǎn)化為離散形式:
式中:Y(z)和Yr(z)分別為單軸伺服系統(tǒng)的參考軌跡和實際軌跡的z變換表達(dá)式;β0,β1和α0,α1,…,α6為式(8)計算得到的系數(shù)。
通過對式(9)進(jìn)行z逆變換,可獲得參考軌跡和實際軌跡之間的關(guān)系:
式中:y(k)和yr(k)分別代表單軸伺服系統(tǒng)的在k時刻的實際軌跡和參考軌跡。
基于離散時間表達(dá)式,k時刻的參考軌跡和實際軌跡y(k+j),j=-1,0,…,5與參考軌跡yr(k-1)相關(guān)。同時,由于速度信號可以表示為位置信號的差分,并且為了提高輸入特征的豐富度,本文選擇y(k+j),j=-1,0,…,5和y˙(k+j),j=-1,0,…,5作為輸入特征,yr(k)作為輸出特征,即當(dāng)前時刻的參考軌跡由前一時刻、當(dāng)前時刻和后5個時刻的實際軌跡和實際速度計算而來。而參考位移yr( )k-1作為隱藏信息被LSTMNN的長期和短期記憶特征所保留和擬合。
利用LSTM-NN建立實際軌跡與參考軌跡之間的映射關(guān)系,訓(xùn)練LSTM-NN的數(shù)據(jù)需要覆蓋大部分特征空間,充分激發(fā)系統(tǒng)的響應(yīng)特性。在這個意義上,幅值逐漸增大的正弦軌跡能夠覆蓋機床運行軌跡能夠經(jīng)歷的所有特征空間,非常適合作為本文的訓(xùn)練集,其表達(dá)式如下:
最終得到訓(xùn)練軌跡如圖6所示。
圖6 訓(xùn)練集軌跡
訓(xùn)練集的特征分布圖如圖7所示,能夠覆蓋所有機床運行軌跡能夠到達(dá)的特征空間,具有很好的泛化性能。
圖7 訓(xùn)練集覆蓋的特征空間
2.4.1 LSTM-NN結(jié)構(gòu)
LSTM神經(jīng)網(wǎng)絡(luò)是一種對序列響應(yīng)進(jìn)行模型擬合的神經(jīng)網(wǎng)絡(luò)。LSTM作為一種特殊的RNN,通過在標(biāo)準(zhǔn)RNN中加入長時記憶序列,可以適應(yīng)長時記憶和短期記憶。在時域,LSTM-NN將返回兩個信息:cell狀態(tài)和hidden狀態(tài)。LSTM-NN具有良好的記憶能力,適用于長期依賴問題。
調(diào)整神經(jīng)網(wǎng)絡(luò)參數(shù)后,確定神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖8所示,其中包含3個隱藏層64個神經(jīng)元,dropout參數(shù)為0.2。求解器為Adam,預(yù)設(shè)的max-epoch為10 000,minbatchsize為128,學(xué)習(xí)率初始化為0.01。
圖8 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
2.4.2 LSTM-NN訓(xùn)練
LSTM-NN的權(quán)值參數(shù)需要離線訓(xùn)練。簡而言之,訓(xùn)練過程就是通過BP算法迭代更新權(quán)值參數(shù),找到最優(yōu)權(quán)值矩陣。
LSTM-NN的訓(xùn)練輸入為實際的軌跡信息(濾波后的位置和速度),網(wǎng)絡(luò)訓(xùn)練輸出為估計的參考軌跡(t)。損失函數(shù)定義為估計參考軌跡(t)與實際參考軌跡y(t)之間的均方根誤差(root mean square error,RMSE),t時刻的表達(dá)式為:
式中:‖·‖表示標(biāo)準(zhǔn)差。
在T個訓(xùn)練樣本中,LSTM神經(jīng)網(wǎng)絡(luò)的總損失函數(shù)為最后,根據(jù)J的梯度更新LSTM-NN的權(quán)值矩陣。
本文采用了三軸數(shù)控機床實驗平臺,主要由1個機械本體、3個GTHD伺服驅(qū)動器、實時仿真控制器及計算機組成,系統(tǒng)的整體效果如圖9所示。
圖9 實驗平臺
該實驗平臺的工作原理為:首先在計算機上的SIMULINK中實現(xiàn)控制算法,然后SIMULINK將相應(yīng)的代碼和模塊編譯成嵌入式系統(tǒng)可運行的目標(biāo)文件,將目標(biāo)文件下載到實時仿真控制器中。實時仿真控制器通過GTHD伺服驅(qū)動器與被控伺服電機連接,伺服電機帶動3個軸進(jìn)行運動。其中,伺服驅(qū)動器工作在模擬速度模式,也就是電流環(huán)和速度環(huán)在伺服驅(qū)動器端,位置環(huán)在實時仿真控制器端。伺服驅(qū)動器為GTHD-006AAP1-00伺服驅(qū)動器,平臺使用的電機為多摩川TS4607N2190E200伺服電機,實時仿真控制器為dSPACE公司的產(chǎn)品,型號為DS1103 PPC Controller Board。
在工業(yè)生產(chǎn)中,常用于機床伺服電機的控制算法是三環(huán)控制。為了驗證本算法的有效性,本實驗以常用的皇冠軌跡作為測試軌跡,如圖10所示。比較了兩種控制系統(tǒng)運行后的輪廓誤差:(1)三環(huán)PID控制伺服系統(tǒng);(2)經(jīng)過訓(xùn)練后的LSTM神經(jīng)網(wǎng)絡(luò)逆模型控制系統(tǒng)。
圖10 皇冠軌跡
對于兩種控制算法,給定軌跡均為皇冠曲線,對于算法1,伺服系統(tǒng)的輸入軌跡為皇冠曲線;對于算法2,給定軌跡為皇冠曲線,參考軌跡為給定軌跡經(jīng)過LSTMNN修改后的軌跡,伺服系統(tǒng)的輸入軌跡為參考軌跡。如圖11和表1所示,經(jīng)過逆模型補償后3個軸的單軸跟蹤誤差均有很大的下降。如圖12和表2所示,輪廓誤差也有很大的下降,最大輪廓誤差為25 μm,降低了11 μm。
圖11 跟蹤誤差對比
表1 跟蹤誤差對比
表2 輪廓誤差對比
圖12 輪廓誤差對比
針對數(shù)控機床在加工時,控制器難以修改導(dǎo)致加工精度提高困難問題,本文提出了一種基于閉環(huán)伺服系統(tǒng)LSTM-NN模型的軌跡跟蹤控制方法,該方法通過建立實際軌跡與參考軌跡之間的映射關(guān)系,對參考軌跡進(jìn)行修正和補償,提高了單軸軌跡跟蹤能力,從而降低了機床加工過程中的輪廓誤差。實驗結(jié)果表明經(jīng)過逆模型補償后3個軸的單軸跟蹤誤差均有很大的下降,輪廓誤差也有很大的下降。與現(xiàn)有的輪廓控制方法相比,所提出的控制方法不修改機床本身控制器的情況下,降低了11 μm輪廓誤差,有效地提高了數(shù)控加工的精度。在后續(xù)的研究工作中將對數(shù)控機床軌跡跟蹤控制中的抗擾問題開展進(jìn)一步研究。