李?lèi)?ài)琳,李 璟*
(1.中國(guó)科學(xué)院 微電子研究所,北京 100029;2.中國(guó)科學(xué)院大學(xué),北京 100049)
集成電路(Integrated Circuit,IC)制造在先進(jìn)制程芯片的生產(chǎn)中占有非常重要的地位[1]。近年來(lái),由于工藝制程的縮短,對(duì)IC 制造裝備產(chǎn)率和精度的要求不斷提高。作為IC 制造裝備的重要子系統(tǒng),工作臺(tái)通常采用直線電機(jī)-氣浮/磁浮式導(dǎo)軌驅(qū)動(dòng)結(jié)構(gòu)和激光干涉-鏡面反射測(cè)量系統(tǒng)來(lái)實(shí)現(xiàn)高速、高加速運(yùn)動(dòng)和納米級(jí)運(yùn)動(dòng)定位精度[2-3]。但氣浮/磁浮導(dǎo)軌使工作臺(tái)在運(yùn)動(dòng)摩擦力近似為零的同時(shí)也導(dǎo)致工作臺(tái)對(duì)振動(dòng)敏感,這有悖其快速準(zhǔn)確定位的要求[4]。針對(duì)這一問(wèn)題,人們從改進(jìn)控制器[5-8]、優(yōu)化參考軌跡[4,7,9-12]等方面著手進(jìn)行研究。
控制器的改進(jìn)目標(biāo)是減小系統(tǒng)在工作區(qū)間的運(yùn)動(dòng)定位誤差。運(yùn)動(dòng)定位誤差有多種來(lái)源,包括多自由度耦合誤差、跟蹤誤差等。工作臺(tái)的多自由度耦合誤差一般通過(guò)力學(xué)補(bǔ)償解耦和控制系統(tǒng)補(bǔ)償兩步消除[13]:力學(xué)補(bǔ)償解耦即通過(guò)補(bǔ)償策略消除各軸之間的力學(xué)因素耦合[7,14],如驅(qū)動(dòng)電機(jī)的出力點(diǎn)和測(cè)量系統(tǒng)的測(cè)量點(diǎn)(Point of Interest,POI)不一致帶來(lái)的耦合誤差;力學(xué)補(bǔ)償解耦后殘余的耦合誤差(由驅(qū)動(dòng)電機(jī)出力不穩(wěn)定、制造安裝等導(dǎo)致的運(yùn)動(dòng)誤差)一般可進(jìn)行矢量場(chǎng)正交分解,再通過(guò)控制系統(tǒng)實(shí)時(shí)補(bǔ)償,控制系統(tǒng)通常采用對(duì)各軸獨(dú)立設(shè)計(jì)單輸入單輸出控制器的策略[6,13]。
除多自由度耦合誤差外,由參考軌跡和外部擾動(dòng)引起的跟蹤誤差也是控制系統(tǒng)動(dòng)態(tài)誤差的主要來(lái)源之一。為減小跟蹤誤差,Dai等設(shè)計(jì)了一種加速度+參考軌跡三階導(dǎo)+參考軌跡四階導(dǎo)的多項(xiàng)式前饋控制器[5],能有效減小系統(tǒng)建立時(shí)間,但僅對(duì)前饋控制器的性能進(jìn)行改進(jìn)難以滿足工作臺(tái)納米精度的定位要求。目前,工作臺(tái)的反饋控制器多采用比例-積分-微分(Proportional Integral Derivative,PID)控制[5,7,15-16],根據(jù)經(jīng)驗(yàn)在線調(diào)試3個(gè)參數(shù),但在線調(diào)試需要耗費(fèi)大量時(shí)間試湊。差分進(jìn)化算法具有良好的全局搜索能力,能根據(jù)當(dāng)前搜索情況動(dòng)態(tài)調(diào)整搜索策略[17-18]。將差分進(jìn)化算法應(yīng)用于PID 控制器的參數(shù)整定中,可在給定范圍內(nèi)自動(dòng)尋找符合優(yōu)化目標(biāo)的控制參數(shù)。
除了改進(jìn)控制器之外,對(duì)參考軌跡進(jìn)行合理規(guī)劃也有助于提高工作臺(tái)的性能[12]。工程中常采用的參考軌跡分為梯形運(yùn)動(dòng)軌跡(二階)和S型運(yùn)動(dòng)軌跡(三階及以上)。梯形運(yùn)動(dòng)軌跡算法實(shí)現(xiàn)簡(jiǎn)單且具有良好的快速性,但運(yùn)動(dòng)過(guò)程中被控對(duì)象的加速度會(huì)發(fā)生突變[4],對(duì)機(jī)械結(jié)構(gòu)造成沖擊,進(jìn)而激發(fā)振動(dòng),導(dǎo)致系統(tǒng)建立時(shí)間增加,影響運(yùn)動(dòng)定位精度。為改善上述問(wèn)題,Roover 等[15]提出使用邊緣平滑的S 型軌跡來(lái)實(shí)現(xiàn)最小振動(dòng)下的點(diǎn)對(duì)點(diǎn)運(yùn)動(dòng),Pizza 等提出通過(guò)約束軌跡的三階導(dǎo)來(lái)提高運(yùn)動(dòng)的平滑度[5],并通過(guò)實(shí)驗(yàn)驗(yàn)證[11]了該方法能有效降低被控對(duì)象加減速造成的沖擊以及設(shè)備的機(jī)械磨損。雖然Roover 和Pizza 提出的軌跡規(guī)劃算法提高了系統(tǒng)定位精度,但均未考慮參考軌跡對(duì)控制器的要求。軌跡規(guī)劃所考慮的階次越高,軌跡輪廓越平滑,對(duì)系統(tǒng)機(jī)械結(jié)構(gòu)的沖擊越小,然而高階軌跡對(duì)控制器實(shí)時(shí)處理的數(shù)據(jù)量和處理速度的要求更高,控制器的設(shè)計(jì)難度隨之增加[19]。另一方面,上述軌跡規(guī)劃算法均未考慮如何確定軌跡的動(dòng)力學(xué)約束,通常是由設(shè)備情況推算軌跡動(dòng)力學(xué)約束的范圍,然后試湊出具體值。由于動(dòng)力學(xué)約束的可選范圍很廣,手動(dòng)試湊的工作量大。蒙特卡洛算法作為已經(jīng)被廣泛應(yīng)用的一種數(shù)值計(jì)算方法,是以概率統(tǒng)計(jì)理論為基礎(chǔ),通過(guò)模擬隨機(jī)變量來(lái)解決數(shù)學(xué)問(wèn)題中的非確定性[20]。將蒙特卡洛算法應(yīng)用于軌跡運(yùn)動(dòng)學(xué)約束的參數(shù)整定,可以提高調(diào)參效率。
本文提出了一種應(yīng)用于工作臺(tái)的軌跡規(guī)劃優(yōu)化方案。該方案以工作臺(tái)為被控對(duì)象搭建相應(yīng)的控制系統(tǒng),在驅(qū)動(dòng)電機(jī)的出力點(diǎn)和測(cè)量系統(tǒng)測(cè)量點(diǎn)不一致等引入的耦合誤差可進(jìn)行矢量場(chǎng)正交分解的前提下,考慮在控制回路中加入補(bǔ)償策略,并通過(guò)差分進(jìn)化算法自動(dòng)整定控制器參數(shù);其次,在進(jìn)行軌跡設(shè)計(jì)時(shí)考慮控制器的實(shí)際跟蹤效果,并根據(jù)應(yīng)用需求和設(shè)備情況確定軌跡的動(dòng)力學(xué)約束后,運(yùn)用蒙特卡洛算法迭代優(yōu)化出符合控制器性能和應(yīng)用場(chǎng)景的參考軌跡。最后,通過(guò)仿真和實(shí)驗(yàn)驗(yàn)證了所提軌跡規(guī)劃方案的有效性和合理性。
為提高工程調(diào)試的效率和運(yùn)動(dòng)定位精度,本文提出的軌跡規(guī)劃方案如圖1 所示。根據(jù)設(shè)備情況得出驅(qū)動(dòng)電機(jī)參數(shù)及布局、機(jī)械系統(tǒng)所能承受的最大沖擊等信息,結(jié)合應(yīng)用場(chǎng)景確定軌跡動(dòng)力學(xué)約束的范圍,再由應(yīng)用需求確定系統(tǒng)優(yōu)化目標(biāo)。根據(jù)系統(tǒng)優(yōu)化目標(biāo)改進(jìn)控制器,并考慮控制器的實(shí)際跟蹤效果,進(jìn)行參考軌跡的優(yōu)化。
圖1 本文提出的軌跡規(guī)劃方案Fig.1 Proposed trajectory planning scheme
現(xiàn)代集成電路對(duì)晶圓制造設(shè)備的量產(chǎn)要求是產(chǎn)能達(dá)到每小時(shí)280 片晶圓[6],對(duì)運(yùn)動(dòng)系統(tǒng)的挑戰(zhàn)就是需要同時(shí)滿足高時(shí)效性和納米級(jí)重復(fù)定位精度。根據(jù)現(xiàn)有驗(yàn)證平臺(tái)的工程實(shí)際需求,本研究預(yù)期運(yùn)動(dòng)定位系統(tǒng)在力學(xué)補(bǔ)償解耦的情況下,按照0.4 s 內(nèi)完成一次一維參考軌跡跟蹤的要求,并保證重復(fù)性定位精度達(dá)到約±5 nm/3σ。
工作臺(tái)的單個(gè)運(yùn)動(dòng)周期可以用S 型軌跡描述,理想S 型運(yùn)動(dòng)軌跡通??蓜澐譃榧铀?、勻速、減速區(qū)間三部分[12]。實(shí)驗(yàn)發(fā)現(xiàn),工作臺(tái)高加減速結(jié)束時(shí)刻存在的殘余能量會(huì)激發(fā)機(jī)械結(jié)構(gòu)的振動(dòng),所以將勻速區(qū)間繼續(xù)劃分為穩(wěn)定區(qū)間(殘余振動(dòng)區(qū)間)和工作區(qū)間(掃描區(qū)間),如圖2 所示。在穩(wěn)定區(qū)間內(nèi)控制器需要將跟蹤誤差收斂到可接受范圍ε內(nèi)(一般要求ε在納米甚至亞納米量級(jí)),才能使工作區(qū)間內(nèi)設(shè)備精細(xì)加工操作的精度滿足系統(tǒng)要求。
圖2 工作臺(tái)的單個(gè)運(yùn)動(dòng)周期Fig.2 Individual motion cycle of stage
工作臺(tái)在理想工作區(qū)間內(nèi)的跟蹤誤差的均值(Moving Average,MA)和標(biāo)準(zhǔn)差(Moving Standard Average,MSD)能反映工作臺(tái)的運(yùn)動(dòng)定位精度[7]。本文將MA 和MSD 兩個(gè)指標(biāo)作為系統(tǒng)優(yōu)化目標(biāo),并采用ISO230-2 標(biāo)準(zhǔn)評(píng)價(jià)工作臺(tái)的重復(fù)定位精度。
工作臺(tái)控制系統(tǒng)的簡(jiǎn)化模型如圖3(a)所示,r表示參考軌跡(r,r',…,r(n))中的位置指令,控制系統(tǒng)(包括前饋控制器FF 和反饋控制器GC)根據(jù)測(cè)量系統(tǒng)解算出的位置out 和位置指令r之差計(jì)算控制信號(hào)uPOI。根據(jù)第1 節(jié)描述,驅(qū)動(dòng)電機(jī)出力點(diǎn)和測(cè)量系統(tǒng)測(cè)量點(diǎn)不一致造成的力學(xué)因素耦合誤差在納米精度的定位系統(tǒng)中不可忽略,控制信號(hào)uPOI需要經(jīng)過(guò)補(bǔ)償矩陣G,質(zhì)心受力-控制信號(hào)轉(zhuǎn)換矩陣Q,以及位置變換矩陣R后才能轉(zhuǎn)換為POI 受力fPOI??刂菩盘?hào)uPOI與fPOI之間的轉(zhuǎn)換關(guān)系為:
圖3 工作臺(tái)控制系統(tǒng)的簡(jiǎn)化模型Fig.3 Simplified model of stage's control system
補(bǔ)償策略的目的是能夠把根據(jù)POI 位置計(jì)算得到的控制信號(hào)完全轉(zhuǎn)化為POI 受力,即R·G=I。
從控制器的角度而言,被控對(duì)象的傳遞函數(shù)為:
其中:Ga=Diag {Gax,Gay,Gaz,Gaθx,GaθY,Gaθz}指工作臺(tái)在POI 處的六自由度模型,如圖3所示[5-7]。
以地面某固定點(diǎn)O為原點(diǎn)定義六自由度的參考坐標(biāo)系(x,y,z,θx,θy,θz)。圖3 給出了測(cè)量系統(tǒng)測(cè)量點(diǎn)POI 和驅(qū)動(dòng)電機(jī)出力點(diǎn)Oc的相對(duì)位置。在集成電路制造的工藝過(guò)程中,POI 位于工作臺(tái)上表面且隨參考軌跡變化,而驅(qū)動(dòng)電機(jī)的出力點(diǎn)為工作臺(tái)質(zhì)心Oc。根據(jù)POI 位置與參考位置之差計(jì)算出的控制信號(hào)uPOI經(jīng)過(guò)補(bǔ)償矩陣G轉(zhuǎn)換為控制信號(hào)uc。uc經(jīng)過(guò)出力分配后轉(zhuǎn)換成每個(gè)電機(jī)驅(qū)動(dòng)器接收到的電壓指令,驅(qū)動(dòng)器內(nèi)部的電流環(huán)在接收到電壓指令之后輸出對(duì)應(yīng)大小的電流驅(qū)動(dòng)工作臺(tái)運(yùn)動(dòng)。工作臺(tái)屬于過(guò)驅(qū)動(dòng)系統(tǒng),對(duì)同一自由度上的驅(qū)動(dòng)電機(jī)出力進(jìn)行合并后得到Oc處受力fc(fc=fx1+fx2),上述過(guò)程用質(zhì)心受力-控制信號(hào)轉(zhuǎn)換矩陣Q表示,Q為6×6 的常值對(duì)角矩陣,由電機(jī)的布局方式、出力分配策略和電機(jī)參數(shù)(電壓-電流轉(zhuǎn)換系數(shù)、推力常數(shù))決定。Oc處受力(fc)還需經(jīng)過(guò)位置變換矩陣R得到POI 受力(fPOI),R代表Oc與POI 的相對(duì)位置關(guān)系,由參考軌跡決定。
記POI 在參考坐標(biāo)系下的測(cè)量位置為(xm,ym,zm,θxm,θym,θzm),POI 和Oc均位于工作臺(tái)上,根據(jù)剛體變換可以導(dǎo)出控制信號(hào)uPOI到uc的轉(zhuǎn)換關(guān)系[7]:
其中:m表示工作臺(tái)的質(zhì)量,h表示Oc和POI 沿z方向的距離,Jx,Jy,Jz分別表示θx,θy,θz方向的轉(zhuǎn)動(dòng)慣量,通常根據(jù)名義值或系統(tǒng)辨識(shí)獲得。
在本文的應(yīng)用場(chǎng)景下,運(yùn)動(dòng)系統(tǒng)在x方向和y方向需要跟蹤參考軌跡進(jìn)行一維掃描,掃描過(guò)程中z方向會(huì)有微小位移,θx,θy,θz方向一直處于定位控制狀態(tài),所以做以下近似:θz≈0,θ'z≈0(其余兩個(gè)自由度同理),結(jié)合式(3)導(dǎo)出六自由度補(bǔ)償矩陣G:
其中:I表示單位矩陣,G的第1~6 行行向量分別對(duì)應(yīng)6 個(gè)自由度方向(xm,ym,zm,θxm,θym,θzm)的力學(xué)耦合補(bǔ)償分量。
根據(jù)第1 節(jié)描述,當(dāng)G的設(shè)置使得各自由度之間的力學(xué)耦合誤差可以忽略,控制器的設(shè)計(jì)及補(bǔ)償就能針對(duì)各軸分別開(kāi)展[6,13]。
以x方向?yàn)槔龑?duì)單自由度上的被控對(duì)象進(jìn)行建模。由于實(shí)際系統(tǒng)中不同元件之間的連接并非理想的剛性連接,被控對(duì)象采用non-collocated 形式的雙質(zhì)量塊柔性體模型[5,8,16],如圖3所示。圖中,fPOI表示POI 處受到的電機(jī)驅(qū)動(dòng)力;m1表示x方向的驅(qū)動(dòng)電機(jī)動(dòng)子的質(zhì)量;m2表示用于精密定位的鏡面系統(tǒng)的質(zhì)量;out 表示由激光干涉儀測(cè)量解算得到的系統(tǒng)在x方向的位置;k和c分別表示m1和m2在x方向的等效連接剛度和等效連接阻尼,二者可以與系統(tǒng)的結(jié)構(gòu)阻尼比ζ、結(jié)構(gòu)的諧振頻率ω相互轉(zhuǎn)換。系統(tǒng)的傳遞函數(shù)為:
對(duì)超精密系統(tǒng)的位置控制器而言,由機(jī)電設(shè)備引起的延時(shí)不可忽略??紤]到電機(jī)驅(qū)動(dòng)延時(shí)、信號(hào)傳輸延時(shí)等因素,模型中引入延時(shí)τ,得到控制器角度下被控對(duì)象在x方向的數(shù)學(xué)模型:
其中:Qf-u為常數(shù),表示x方向Oc受力與控制信號(hào)之間的轉(zhuǎn)換關(guān)系。
理想單自由度掃描運(yùn)動(dòng)的補(bǔ)償分量為式(4)中補(bǔ)償矩陣G對(duì)應(yīng)的行向量,單自由度參考軌跡r的數(shù)學(xué)模型會(huì)在后文進(jìn)行推導(dǎo)。
根據(jù)圖3,若忽略擾動(dòng)的影響,控制系統(tǒng)的跟蹤誤差為:
控制目標(biāo)為error →0,所以前饋控制器應(yīng)當(dāng)盡量逼近被控對(duì)象的逆模型:
本文中前饋控制器也采用多項(xiàng)式前饋的形式uff(t)=β1r(2)(t)+…+βn-1r(n)(t)[5,7-8],且uff(s)=FF(s)·r(s)。由于四階參考軌跡有r(5)≡0,取式(6)右側(cè)前4 項(xiàng)(k=3)代入式(8)得到前饋控制器的相關(guān)參數(shù):
反饋控制器采用PID 控制[6-7]:
在實(shí)驗(yàn)場(chǎng)景下,運(yùn)動(dòng)系統(tǒng)在x方向和y方向上的跟蹤參考軌跡要進(jìn)行一維掃描,同時(shí)要保證掃描的穩(wěn)定性和可靠性,即工作臺(tái)的穩(wěn)定性和重復(fù)性精度要高。在掃描過(guò)程中工作臺(tái)需要跟蹤預(yù)設(shè)參考軌跡完成點(diǎn)對(duì)點(diǎn)運(yùn)動(dòng),具有動(dòng)力學(xué)約束的n階點(diǎn)對(duì)點(diǎn)參考軌跡位置指令r是由位置函數(shù)r(t)按周期Ts采樣得到的,r(t)的一般形式為:
其中:αn由軌跡的動(dòng)力學(xué)約束range 確定,r(n)表示參考軌跡的n階導(dǎo),δn表示常數(shù),n階軌跡r(n+1)≡0。
根據(jù)綜合控制器的實(shí)時(shí)處理能力和跟蹤精度,本文采用圖4 所示的四階參考軌跡(n=4),它由td,tj,ta,tv唯一確定,分別對(duì)應(yīng)工作臺(tái)處于最大加加加速度dmax、最大加加速度jmax、最大加速度amax和最大速度vmax的時(shí)間段。
圖4 典型的四階運(yùn)動(dòng)軌跡Fig.4 Typical fourth-order motion trajectory
綜上,系統(tǒng)模型的相關(guān)參數(shù)組為:
其中:m1表示工作臺(tái)沿x方向驅(qū)動(dòng)電機(jī)動(dòng)子的質(zhì)量;m2表示工作臺(tái)鏡面系統(tǒng)的質(zhì)量;τ表示系統(tǒng)延時(shí);Ts表示系統(tǒng)采樣周期;ω和ζ表示工作臺(tái)的諧振頻率和結(jié)構(gòu)阻尼比;Jx,Jy,Jz表示工作臺(tái)在θx,θy,θz方向的轉(zhuǎn)動(dòng)慣量,以上參數(shù)在實(shí)際調(diào)試過(guò)程中一般均可通過(guò)名義值或系統(tǒng)辨識(shí)獲得。
控制器的相關(guān)參數(shù)組為:
其中:β1,β2,β3表示前饋控制器參數(shù),可通過(guò)式(9)計(jì)算得出;kP,kI,kD表示反饋控制器參數(shù),后續(xù)將給出反饋控制參數(shù)的獲取方法。
在工作臺(tái)跟蹤參考軌跡進(jìn)行一維掃描的過(guò)程中,圖1 所述的系統(tǒng)優(yōu)化問(wèn)題可描述為:
其中:smax一般由掃描對(duì)象的長(zhǎng)度確定;運(yùn)動(dòng)速度和加速度過(guò)大易引發(fā)系統(tǒng)的殘余振動(dòng),一般在設(shè)備的說(shuō)明手冊(cè)中會(huì)給出vmax和amax的參考值;jmax和dmax由工作臺(tái)機(jī)械系統(tǒng)所能承受的最大沖擊決定,工程設(shè)定的經(jīng)驗(yàn)值范圍:20amax≤jmax≤50amax,20jmax≤dmax≤50jmax;為了減小環(huán)境變化(溫度、濕度和潔凈度)對(duì)精度的影響,要求單個(gè)運(yùn)動(dòng)周期不超過(guò)0.4 s。
根據(jù)系統(tǒng)優(yōu)化目標(biāo)對(duì)控制器和參考軌跡進(jìn)行優(yōu)化。反饋控制器的第一個(gè)設(shè)計(jì)目標(biāo)是最小化系統(tǒng)的跟蹤誤差;第二個(gè)設(shè)計(jì)目標(biāo)是最小化系統(tǒng)在高加減速結(jié)束后的殘余振動(dòng),由于殘余振動(dòng)與運(yùn)動(dòng)軌跡的三階導(dǎo)有關(guān),這反映到控制上就是對(duì)控制信號(hào)的微分進(jìn)行約束。所以PID 控制器的參數(shù)選擇屬于多目標(biāo)優(yōu)化問(wèn)題,即有:
其中tend表示單個(gè)運(yùn)動(dòng)周期。
軌跡規(guī)劃的第一個(gè)目標(biāo)是減小控制器的跟蹤誤差;第二個(gè)目標(biāo)是提高軌跡勻速區(qū)間的長(zhǎng)度,使控制器有足夠的時(shí)間調(diào)整系統(tǒng)加減速造成的沖擊。
使用改進(jìn)的差分進(jìn)化算法[18]對(duì)式(15)進(jìn)行參數(shù)整定,整定步驟如圖5 所示。
圖5 使用改進(jìn)的差分進(jìn)化算法整定反饋控制器參數(shù)[18]Fig.5 Tuning feedback controller settings using improved differential evolutionary algorithm[18]
軌跡規(guī)劃希望所得軌跡的總運(yùn)動(dòng)時(shí)間短,工作區(qū)間占總運(yùn)動(dòng)時(shí)間的比例高。本文采用的軌跡規(guī)劃算法流程如圖6 所示,具體步驟如下:
圖6 軌跡規(guī)劃算法流程[4,12]Fig.6 Flow chart trajectory planning algorithm[4,12]
第1 步:根據(jù)圖4,由軌跡的單個(gè)動(dòng)力學(xué)約束分別確定td1,td2,td3,td4[4],系統(tǒng)需要滿足軌跡的所有動(dòng)力學(xué)約束,td=min{td1,td2,td3,td4}。由于算法的計(jì)算機(jī)實(shí)現(xiàn)均為離散化處理,為了確保所得軌跡滿足給定的動(dòng)力學(xué)約束,需要將td向上圓整為采樣周期Ts的整數(shù)倍tdr;
第2 步:將tdr和軌跡動(dòng)力學(xué)約束一起作為已知參數(shù),代入求得tjr;
第3 步:按照上述方式依次求得tar,tvr;
第4 步:根據(jù)圖4,在得到tdr,tjr,tar,tvr四段時(shí)間之后就能得到r(4)(t),按照不同的時(shí)間段對(duì)r(4)(t)依次向上進(jìn)行數(shù)值積分,可以得到r(t);
第5 步:將r(t)按周期Ts采樣,得到參考軌跡r。
圖6 算法流程的前提條件是軌跡的動(dòng)力學(xué)約束參數(shù)值已給定,所以還需要在式(14)給出的約束空間中進(jìn)行參數(shù)整定。由于動(dòng)力學(xué)約束參數(shù)和軌跡之間的映射關(guān)系非線性,且每個(gè)約束參數(shù)的可選范圍大,對(duì)軌跡性能的影響程度難以用單一方程進(jìn)行描述,導(dǎo)致手動(dòng)試湊約束參數(shù)組的工作量大。本文使用蒙特卡洛算法整定軌跡的動(dòng)力學(xué)約束參數(shù)。整定的基本步驟為:
第1 步:參數(shù)初始化,初始邊界由式(14)確定,初始約束參數(shù)組的數(shù)量為N,個(gè)體選取比例為ρ;
第2步:在邊界內(nèi)隨機(jī)產(chǎn)生N組能生成可行軌跡的約束參數(shù)組rangei={smax,vmax,amax,jmax,dmax}i(i=1,2,…,N),根據(jù)圖6 得到相應(yīng)的軌跡ri;
第3 步:采用圖3 所示的控制系統(tǒng)進(jìn)行軌跡跟蹤。根據(jù)控制系統(tǒng)的輸出outi,計(jì)算勻速區(qū)間的長(zhǎng)度Li以及系統(tǒng)在工作區(qū)間的MAi;
第4 步:將{L1,L2,…,LN}按從大到小的順序排列并按比例ρ(0<ρ<1)選取前W=ρ·N條軌跡,取這W組軌跡對(duì)應(yīng)的約束參數(shù)組的上下限作為新的邊界,同時(shí)記錄W組軌跡中MA 最小的軌跡作為本次迭代的最優(yōu)軌跡ribest;
第5 步:判斷ribest和r(i-1)best是否相同,是則迭代結(jié)束,ribest為待求軌跡;否則返回步驟2。
綜上,優(yōu)化算法的相關(guān)參數(shù)組為:
其中:NP表示差分進(jìn)化算法中的初始種群數(shù)量;Q表示差分進(jìn)化算法種群個(gè)體的初始可調(diào)范圍;F表示差分進(jìn)化算法變異的比例因子;CR表示差分進(jìn)化算法的交叉率;MC表示差分進(jìn)化算法的維護(hù)周期;J如式(15),是差分進(jìn)化算法中評(píng)價(jià)種群個(gè)體好壞的指標(biāo);MAX_FES是差分進(jìn)化算法的結(jié)束條件,當(dāng)有MAX_FES代最優(yōu)個(gè)體的J相同時(shí)算法結(jié)束;N表示蒙特卡洛算法中的初始參數(shù)組數(shù)量;ρ表示蒙特卡洛算法中的選取比例。N和ρ的取值與優(yōu)化結(jié)果和算法運(yùn)行時(shí)間的關(guān)系如圖7 所示。
圖7 蒙特卡洛算法尋優(yōu)結(jié)果與參數(shù)的關(guān)系Fig.7 Optimization results of Monte-Carlo algorithm with respect to parameters
圖7(a)是在ρ固定(ρ=0.3)的前提下,運(yùn)行30 次算法所得優(yōu)化結(jié)果和運(yùn)行時(shí)間的均值與N的關(guān)系;圖7(b)是在N固定(N=103)的前提下,運(yùn)行30 次算法所得優(yōu)化結(jié)果和運(yùn)行時(shí)間的均值與ρ的關(guān)系??梢钥闯?,N和ρ的值越大,算法運(yùn)行時(shí)間越長(zhǎng),若需進(jìn)行在線軌跡規(guī)劃,選取參數(shù)時(shí)需要權(quán)衡優(yōu)化效果和運(yùn)行時(shí)長(zhǎng)。本文在使用蒙特卡洛算法整定軌跡的動(dòng)力學(xué)約束參數(shù)時(shí)取N=104,ρ=0.3。
為驗(yàn)證算法的收斂性,圖8 給出了蒙特卡洛算法的尋優(yōu)結(jié)果分布。其中,方框是30 次蒙特卡洛算法優(yōu)化出的動(dòng)力學(xué)約束對(duì)應(yīng)的跟蹤效果分布;圓圈是隨機(jī)生成30 組動(dòng)力學(xué)約束對(duì)應(yīng)的跟蹤效果分布。圖中蒙特卡洛算法的30 次尋優(yōu)結(jié)果基本都收斂到相近解空間中,一定程度上驗(yàn)證了算法的收斂性。
圖8 蒙特卡洛算法的30 次尋優(yōu)結(jié)果分布Fig.8 Distribution of 30 times optimization result by Monte-Carlo algorithm
參考實(shí)際的六自由度測(cè)試臺(tái)得到式(12)中的系統(tǒng)模型參數(shù),再分別使用傳統(tǒng)工程調(diào)試方法和本文軌跡規(guī)劃方案(見(jiàn)圖1)計(jì)算參考軌跡和式(13)中的控制器參數(shù),最后進(jìn)行實(shí)驗(yàn)驗(yàn)證。
在Matlab 中進(jìn)行仿真,根據(jù)表1~表5 中的參數(shù)搭建圖3 描述的控制系統(tǒng)。
表1 系統(tǒng)模型的相關(guān)參數(shù)Tab.1 Parameters of stage's model
本文軌跡規(guī)劃方案所用優(yōu)化算法的相關(guān)參數(shù)組見(jiàn)式(16),仿真取值見(jiàn)表2。
表2 本文優(yōu)化算法的相關(guān)參數(shù)Tab.2 Parameters of proposed optimization method
將表1 參數(shù)代入式(9)可以計(jì)算出前饋控制器參數(shù),再分別通過(guò)傳統(tǒng)工程調(diào)試和本文差分進(jìn)化算法(見(jiàn)圖5)得到式(13)中反饋控制器參數(shù)。
傳統(tǒng)工程調(diào)試方法整定PID 控制器參數(shù)通常為:使用Ziegler-Nichol 響應(yīng)曲線法計(jì)算PID 控制器參數(shù)的初始值,根據(jù)該初始值確定參數(shù)可調(diào)空間Q,在Q內(nèi)以最小化系統(tǒng)跟蹤誤差為目標(biāo)進(jìn)行在線調(diào)試,調(diào)試步長(zhǎng)可根據(jù)經(jīng)驗(yàn)設(shè)置,本文取ΔkP=104,ΔkI=102,ΔkD=102。
為對(duì)比兩種方案對(duì)控制參數(shù)的整定效果,將算法從相同初始空間收斂到表3 中參數(shù)所需的迭代次數(shù),作為方案的調(diào)參效率和收斂速度的評(píng)價(jià)指標(biāo)。目標(biāo)函數(shù)J(見(jiàn)式(15))在參數(shù)整定過(guò)程中的變化如圖9 所示。
表3 控制器參數(shù)Tab.3 Parameters of controller
圖9 兩種方案的調(diào)參效率對(duì)比Fig.9 Comparison of tuning efficiency
由圖9 可以看出,使用傳統(tǒng)工程調(diào)試法進(jìn)行控制參數(shù)整定的次數(shù)和效果依賴(lài)于工程經(jīng)驗(yàn);而差分進(jìn)化算法能使種群向逼近最優(yōu)解的方向自動(dòng)迭代,可以提高控制器的參數(shù)整定效率。兩種方案的控制參數(shù)見(jiàn)表3。
傳統(tǒng)工程調(diào)試方法所得伺服系統(tǒng)的控制帶寬為644 Hz,相位裕度為45°;使用差分進(jìn)化算法所得伺服系統(tǒng)的控制帶寬為627 Hz,相位裕度為30°。兩種控制系統(tǒng)的性能基本一致,但差分進(jìn)化算法的迭代次數(shù)減少了90%以上。
確定系統(tǒng)的控制器參數(shù)后,還需要確定參考軌跡。為對(duì)比兩種方案的動(dòng)力學(xué)約束參數(shù)整定效果,在仿真中模擬傳統(tǒng)工程調(diào)試方法和蒙特卡洛算法(見(jiàn)4.3 節(jié))分別進(jìn)行3 次軌跡動(dòng)力學(xué)參數(shù)整定,兩種方案的初始計(jì)算域都為式(14),整定結(jié)果見(jiàn)表4 和表5。
表4 傳統(tǒng)工程調(diào)試方法整定軌跡動(dòng)力學(xué)約束Tab.4 Constraints of trajectory dynamics modified using trial-and-error method
表5 本文蒙特卡洛算法整定軌跡動(dòng)力學(xué)約束Tab.5 Constraints of trajectory dynanics modified using Monte-Carlo method
表6 實(shí)驗(yàn)結(jié)果對(duì)比Tab.6 Comparison of experiment results
傳統(tǒng)工程調(diào)試方法整定軌跡動(dòng)力學(xué)的約束參數(shù)通常為:根據(jù)設(shè)備情況和應(yīng)用需求推算出動(dòng)力學(xué)約束范圍后,根據(jù)整定經(jīng)驗(yàn),通過(guò)試湊確定參數(shù)的具體值。整定經(jīng)驗(yàn)是:MA 主要與dmax,jmax,amax有關(guān),總運(yùn)動(dòng)時(shí)間主要與vmax,smax有關(guān),一般首先確定dmax的值,然后依次確定jmax,amax,vmax,smax。
從表4 和表5 可以看出,兩種方案均能使系統(tǒng)在工作區(qū)間內(nèi)的MA 收斂到3 nm 以?xún)?nèi)。傳統(tǒng)工程調(diào)試法的整定次數(shù)和整定效果依賴(lài)于工程經(jīng)驗(yàn);而本文提出的軌跡規(guī)劃方案通過(guò)設(shè)定優(yōu)化目標(biāo),每一次迭代都縮小參數(shù)的可調(diào)范圍,使算法朝逼近最優(yōu)解的方向迭代。
相比傳統(tǒng)工程調(diào)試法,本文方案保證控制器在工作區(qū)間內(nèi)的MA 也收斂到3 nm 以?xún)?nèi)的同時(shí),參數(shù)整定的次數(shù)還減小了90%以上,有效提高了工程調(diào)試的效率。
實(shí)際測(cè)試中,控制系統(tǒng)的簡(jiǎn)化模型和驅(qū)動(dòng)電機(jī)的分布情況如圖3 所示。對(duì)測(cè)試臺(tái)在x方向的掃描運(yùn)動(dòng)進(jìn)行軌跡規(guī)劃,圖10 給出了被控對(duì)象的系統(tǒng)辨識(shí)結(jié)果,其低頻段-40 dB/dec 的幅頻響應(yīng)特性和445 Hz 左右的一階諧振頻率進(jìn)一步驗(yàn)證了被控對(duì)象使用雙質(zhì)量塊柔性體模型的合理性。測(cè)試平臺(tái)的驅(qū)動(dòng)電機(jī)采用音圈電機(jī),其質(zhì)心受力-控制信號(hào)轉(zhuǎn)換系數(shù)Qf-u=169 N/V。
圖10 測(cè)試臺(tái)x 方向辨識(shí)結(jié)果Fig.10 Identification results in x direction of stage
用2.2 描述的系統(tǒng)優(yōu)化目標(biāo)評(píng)價(jià)由表4 和表5 中參數(shù)確定的軌跡,實(shí)驗(yàn)時(shí)分別取其中的最佳軌跡(表4 第1 次,表5 第3 次)作為系統(tǒng)的參考輸入r,在100~400 μm 的一維行程進(jìn)行重復(fù)掃描。采用前饋+反饋控制器進(jìn)行軌跡跟蹤,使用分辨率為0.15 nm 的激光干涉儀進(jìn)行位置測(cè)量并計(jì)算工作臺(tái)的運(yùn)動(dòng)定位精度。
圖11 表明,同一控制器對(duì)本文軌跡規(guī)劃方案得到的參考軌跡在工作區(qū)間內(nèi)的最大跟蹤誤差為5 nm;而對(duì)傳統(tǒng)工程調(diào)試得到的參考軌跡在工作區(qū)間內(nèi)的最大跟蹤誤差為13.5 nm。
圖11 實(shí)驗(yàn)結(jié)果對(duì)比Fig.11 Comparison of experiment results
實(shí)驗(yàn)結(jié)果表明,在控制器相同的情況下,兩種方案得到的參考軌跡均能保證測(cè)試臺(tái)的重復(fù)定位精度達(dá)到±5 nm 以?xún)?nèi)(ISO230-2標(biāo)準(zhǔn)下,傳統(tǒng)工程調(diào)試法為 ±4.64 nm/3σ,本文方案為±3.76 nm/3σ)。本研究的簡(jiǎn)化模型目前考慮了由驅(qū)動(dòng)電機(jī)的出力點(diǎn)和測(cè)量點(diǎn)不一致帶來(lái)的耦合誤差,實(shí)際應(yīng)用中的運(yùn)動(dòng)定位誤差會(huì)更加復(fù)雜。表4~表5 中的仿真結(jié)果基本印證了本文提出的軌跡規(guī)劃方案在優(yōu)化過(guò)程中可使跟蹤誤差快速收斂。
本文針對(duì)多自由度工作臺(tái)在加工過(guò)程中對(duì)參考軌跡的跟蹤問(wèn)題,提出了一種可提高工程應(yīng)用中調(diào)試效率和運(yùn)動(dòng)定位精度的軌跡規(guī)劃方案。該方案考慮了力學(xué)因素解耦在單軸分量控制回路中的補(bǔ)償計(jì)算,使用差分進(jìn)化算法自動(dòng)整定反饋控制器參數(shù),并考慮到應(yīng)用場(chǎng)景需求和控制器的實(shí)際跟蹤能力,運(yùn)用蒙特卡洛算法迭代優(yōu)化參考軌跡。該方案的重復(fù)定位精度達(dá)到±3.76 nm/3σ,該方案相比傳統(tǒng)工程調(diào)試,在工作臺(tái)重復(fù)定位精度均能達(dá)到±5 nm/3σ以?xún)?nèi)的前提下,控制器的跟蹤誤差能快速收斂,將參數(shù)整定過(guò)程的迭代次數(shù)減少約90%。
本文所述的軌跡規(guī)劃方案的相關(guān)參數(shù)均可通過(guò)自動(dòng)整定得到,能大幅減少調(diào)參過(guò)程的工作量,運(yùn)用仿真和實(shí)驗(yàn)驗(yàn)證了大幅提升控制器精確調(diào)參效率的可行性。在此基礎(chǔ)上,可進(jìn)一步研究不同應(yīng)用場(chǎng)景下多自由度運(yùn)動(dòng)的控制方案以及參考軌跡的實(shí)時(shí)在線規(guī)劃,探索動(dòng)態(tài)補(bǔ)償策略。