趙峙堯,張念東,魏 偉
(1. 北京工商大學(xué)人工智能學(xué)院,北京 100048;2. 北京郵電大學(xué)自動(dòng)化學(xué)院,北京 100876)
納米定位技術(shù)是對(duì)100nm甚至更小量級(jí)的認(rèn)知和操控的技術(shù)[1],納米定位技術(shù)作為納米制造技術(shù)的重要組成部分,是納米測(cè)量、納米加工的核心技術(shù)之一。壓電陶瓷驅(qū)動(dòng)器驅(qū)動(dòng)力大、剛度高、重復(fù)性好, 適合作為納米定位平臺(tái)的驅(qū)動(dòng)器[2]。這種機(jī)構(gòu)已廣泛應(yīng)用于微操縱器,半導(dǎo)體制造行業(yè)[3,4],超精密機(jī)床[5]。然而,壓電陶瓷存在蠕變、遲滯非線(xiàn)性和微阻尼共振特性,對(duì)環(huán)境溫度變化敏感[2],使得此類(lèi)系統(tǒng)的建模和控制具有挑戰(zhàn)性。遲滯作為壓電陶瓷固有的一種復(fù)雜非線(xiàn)性,對(duì)精度控制的影響最大。前饋控制技術(shù)是抑制遲滯的常用方法,通過(guò)串聯(lián)遲滯補(bǔ)償器降低遲滯的影響?;赑randtl-Ishlinskii模型[6]、改進(jìn)的Bouc-Wen模型[7],建立遲滯逆模型,設(shè)計(jì)前饋控制,如基于改進(jìn)的Bouc-Wen模型的前饋補(bǔ)償方法[7]以及基于自適應(yīng)的逆模型前饋補(bǔ)償[8]。這些方法對(duì)遲滯模型有一定的依賴(lài)。不依賴(lài)遲滯模型的閉環(huán)控制將遲滯視為一種擾動(dòng),消除其影響?;跀_動(dòng)觀測(cè)的PID 控制[9],重復(fù)控制[10,11],time-delay control[12],模型參考自適應(yīng)控制[13]實(shí)現(xiàn)了具有一定魯棒性的定位控制。更進(jìn)一步,采用遲滯補(bǔ)償?shù)拈]環(huán)復(fù)合控制也得到了應(yīng)用。如:基于直接逆遲滯補(bǔ)償?shù)牡鷮W(xué)習(xí)控制[14],基于逆補(bǔ)償?shù)哪P蛥⒖甲赃m應(yīng)控制[15]。無(wú)論是基于遲滯模型前饋控制還是基于遲滯模型的閉環(huán)控制,都需要精確的遲滯模型。而不依賴(lài)遲滯模型的閉環(huán)控制則更為實(shí)用。
基于主動(dòng)抗擾的控制思路,文獻(xiàn)[16]將非線(xiàn)性特性視為總擾動(dòng)的一部分,設(shè)計(jì)線(xiàn)性自抗擾控制(Linear active disturbance rejection control, LADRC)實(shí)現(xiàn)了具有較強(qiáng)魯棒性的定位。LADRC只依賴(lài)于模型的相對(duì)階和控制增益,這是該方法的優(yōu)點(diǎn),也是缺點(diǎn)。減小總擾動(dòng)觀測(cè)負(fù)擔(dān)或提高觀測(cè)能力可提升LADRC的控制性能。文獻(xiàn)[17]提出了基于被控對(duì)象模型信息的廣義自抗擾控制(Generalized Active Disturbance Rejection Control,GADRC)。將微位移臺(tái)線(xiàn)性動(dòng)力學(xué)模型用于控制器設(shè)計(jì),是提高定位性能的常用方法[10-12]。在線(xiàn)性動(dòng)力學(xué)模型的基礎(chǔ)上設(shè)計(jì)GADRC控制器,廣義擴(kuò)張狀態(tài)觀測(cè)器(Generalized Extended State Observer, GESO)只需要觀測(cè)未準(zhǔn)確建模的線(xiàn)性部分和非線(xiàn)性部分,大大減輕了擾動(dòng)估計(jì)負(fù)擔(dān)。在提高觀測(cè)器的性能方面,文獻(xiàn)[18]提出相位優(yōu)化的線(xiàn)性自抗擾控制(Phase Optimized LADRC,POLADRC),利用微分信號(hào)的相位超前性,優(yōu)化觀測(cè)器,在壓電納米定位臺(tái)上測(cè)試取得了比LADRC更好的定位性能。應(yīng)用相位優(yōu)化的思路進(jìn)一步提高GADRC的控制能力,從而實(shí)現(xiàn)在減輕擾動(dòng)估計(jì)負(fù)擔(dān)的同時(shí),提高擾動(dòng)估計(jì)能力。
LADRC與PID控制有著內(nèi)在的聯(lián)系,文獻(xiàn)[19]將二階LADRC等效為反饋補(bǔ)償器結(jié)合濾波器的結(jié)構(gòu)。在此基礎(chǔ)上,文獻(xiàn)[20]將二階LADRC等效為二階低通濾波器串聯(lián)理想PID控制器的結(jié)構(gòu)。同時(shí),無(wú)論LADRC還是GADRC,在等效為內(nèi)??刂苹芈窌r(shí),等效的內(nèi)部模型都是構(gòu)建擴(kuò)張狀態(tài)觀測(cè)器的基準(zhǔn)模型,通過(guò)內(nèi)模控制可以證明GADRC的穩(wěn)定性[21,22]。本文從參考模型的角度解釋擴(kuò)張狀態(tài)觀測(cè)器,不同于模型參考控制以一個(gè)參考模型的輸出為樣板讓實(shí)際控制對(duì)象向其接近,直至一致。擴(kuò)張狀態(tài)觀測(cè)器是通過(guò)一個(gè)理想PID使得參考模型跟隨實(shí)際對(duì)象輸出,理想PID控制量的一部分作為總擾動(dòng)的估計(jì)結(jié)果,兩者在工作原理上有根本不同。通過(guò)模型參考的解釋思路,進(jìn)一步理解POLADRC的同時(shí),也獲得相位優(yōu)化規(guī)律在GADRC中應(yīng)用的參數(shù)整定方法,提出相位優(yōu)化的廣義自抗擾控制(Phase Optimized GADRC,POGADRC)
圖1顯示了不同頻率電壓輸入時(shí)的遲滯回線(xiàn)。理想情況下,沒(méi)有遲滯特性的回線(xiàn)為45°的直線(xiàn)。
表1 納米定位實(shí)驗(yàn)系統(tǒng)參數(shù)表
圖1 不同頻率的遲滯回線(xiàn)
文獻(xiàn)[11]通過(guò)施加1 Hz至 250Hz的低振幅正弦電壓掃描信號(hào),辨識(shí)壓電納米定位平臺(tái)的線(xiàn)性動(dòng)力學(xué)模型。較低振幅電壓激勵(lì),避免了遲滯非線(xiàn)性引起的失真。采用正弦掃描信號(hào)0.1sin(50πt2),0≤t≤10,建立線(xiàn)性模型Pm1(s)和Pm2(s)。已建立模型和納米定位臺(tái)實(shí)際的頻率響應(yīng)如圖2所示,Pm1(s)和Pm2(s)準(zhǔn)確地描述了系統(tǒng)較低頻率范圍內(nèi)的動(dòng)力學(xué)特性,Pm2(s)在較高頻率部分也具有較高的準(zhǔn)確性。Pm2(s)顯示實(shí)驗(yàn)臺(tái)的實(shí)際諧振頻率約為225Hz。
(1)
Pm2(s)=
(2)
圖2 識(shí)別模型和測(cè)量值的頻率響應(yīng)
不同于LADRC只需要關(guān)鍵參數(shù):被控對(duì)象的階次和控制量增益b0,GADRC可以利用更多的模型信息??紤]到控制器的復(fù)雜程度,選擇階次較低的模型Pm1(s)作為基準(zhǔn)模型,二階模型Pm1(s)在較低頻率范圍內(nèi)與實(shí)驗(yàn)臺(tái)實(shí)際模型符合度較高,能夠滿(mǎn)足在較低頻率范圍內(nèi)定位控制的要求。
參考文獻(xiàn)[23]設(shè)計(jì)二階LADRC控制器,如圖3所示。其核心部分線(xiàn)性擴(kuò)張狀態(tài)觀測(cè)器(Linear Extended State Observer, LESO)為
(3)
z1,z2為狀態(tài)觀測(cè),z3為總擾動(dòng)估計(jì),y為被控對(duì)象輸出。LADRC控制律
(4)
采用帶寬整定參數(shù)法[23]
(5)
zG1,zG2,zG3為GESO的輸出,y為被控對(duì)象輸出。GADRC控制律
(6)
采用帶寬整定參數(shù)法[17]
(7)
ωo,ωc為GESO觀測(cè)帶寬和控制器帶寬。
(8)
POLADRC控制律
(9)
z1,z2為狀態(tài)觀測(cè),zpo3為相位優(yōu)化之后得總擾動(dòng)估計(jì)??烧{(diào)參數(shù)c=β2/β3。
zpo3=z3+β2(yp-z1)
(10)
由式(3)和(10),相對(duì)于LESO,在總擾動(dòng)估計(jì)中,增加的一項(xiàng)是(y-z1)β2。
在相位優(yōu)化律的作用下,POESO的估計(jì)相位總是超前于LESO。相位超前使得觀測(cè)器估計(jì)速度更快、估計(jì)誤差更小。文獻(xiàn)[9]分析結(jié)果顯示,當(dāng)總擾動(dòng)是階躍形式時(shí),POESO和LESO對(duì)總擾動(dòng)估計(jì)的穩(wěn)態(tài)誤差都為0,當(dāng)總擾動(dòng)是斜坡形式時(shí),POESO對(duì)總擾動(dòng)估計(jì)的穩(wěn)態(tài)誤差都為0,而LESO對(duì)總擾動(dòng)估計(jì)存在穩(wěn)態(tài)誤差。本文將應(yīng)用POLADRC的改進(jìn)思路提高GADRC控制效果。
在二階LADRC中,LESO以b0/s2為基準(zhǔn)模型,理想情況下, LESO通過(guò)總擾動(dòng)補(bǔ)償,將被控對(duì)象轉(zhuǎn)換為串聯(lián)積分的形式。
圖3 二階LADRC控制框圖
結(jié)合圖3,式(3)可以整理為:
(10)
其中:
(11)
z1是參考模型b0/s2的輸出,通過(guò)一個(gè)理想的PID控制器,實(shí)現(xiàn)參考模型輸出z1對(duì)被控對(duì)象輸出y的跟蹤。結(jié)合圖3和式(4),(11),總擾動(dòng)補(bǔ)償回路中的補(bǔ)償項(xiàng)為z3/b0,是LESO中等效理想PID中的積分項(xiàng)。
同理,結(jié)合圖4和式(6),GESO以Pm(s)為基準(zhǔn)模型,理想情況下,在補(bǔ)償項(xiàng)zG3/b0作用下,補(bǔ)償回路的輸入輸出之間的動(dòng)態(tài)特性與基準(zhǔn)模型Pm(s) 動(dòng)態(tài)特性相同。
圖4 二階GADRC控制框圖
式(5)可整理為:
(12)
其中
(13)
zG1是參考模型Pm(s)的輸出。通過(guò)一個(gè)理想的PID控制器,zG1實(shí)現(xiàn)對(duì)被控對(duì)象輸出y跟蹤。由圖4和式(6),(13)可知,補(bǔ)償項(xiàng)zG3/b0是GESO中等效理想PID中的積分項(xiàng)。
從參考模型的角度出發(fā),LESO和GESO的內(nèi)部工作原理是通過(guò)一個(gè)理想的PID控制器,實(shí)現(xiàn)參考模型對(duì)實(shí)際對(duì)象的跟蹤。
圖5 LESO和實(shí)際對(duì)象的等效框圖
圖6 GESO和實(shí)際對(duì)象的等效框圖
將相位優(yōu)化規(guī)律應(yīng)用到GADRC中,控制律中的擾動(dòng)補(bǔ)償項(xiàng)為積分加比例的形式。由式(5)和(13),相位優(yōu)化的GESO為
(14)
POGADRC控制律
(15)
圖7 POGADRC控制框圖
實(shí)驗(yàn)在P-561.3CD上進(jìn)行,壓電驅(qū)動(dòng)器與電壓放大器E-727.3CDA連接。采樣間隔設(shè)置為0.05 ms。實(shí)驗(yàn)平臺(tái)如圖9。以階躍信號(hào)和正弦信號(hào)作為參考信號(hào),進(jìn)行多項(xiàng)實(shí)驗(yàn)。POGADRC,GADRC和 LADRC控制器參數(shù)見(jiàn)表2。
圖8 納米定位實(shí)驗(yàn)平臺(tái)
表2 POGADRC,GADRC和 LADRC控制器參數(shù)
圖9 階躍跟蹤實(shí)驗(yàn)
響應(yīng)結(jié)果如圖9, POGADRC階躍設(shè)定值的響應(yīng)曲線(xiàn)更加平滑,收斂更快。當(dāng)定位臺(tái)受到階躍或正弦外部電壓擾動(dòng)時(shí),POGADRC受到的影響更小。
本節(jié)中,POGADRC的優(yōu)勢(shì)通過(guò)跟蹤時(shí)變參考信號(hào)的響應(yīng)來(lái)證明,實(shí)驗(yàn)中1Hz、5Hz、10Hz和50Hz正弦信號(hào)作為設(shè)定值。 其中,5Hz正弦跟蹤實(shí)驗(yàn)Ⅰ中,r(t)=sin(10πt)+3,不施加外部擾動(dòng)。5Hz正弦跟蹤實(shí)驗(yàn)Ⅱ中,r(t)=sin(10πt)+3,施加外部電壓擾動(dòng):d2(t)=-0.1ε(t-1)-0.1ε(t-4)sin(2πt)。實(shí)驗(yàn)結(jié)果如圖10,11,12,13所示。
圖10 5Hz正弦跟蹤實(shí)驗(yàn)Ⅰ
圖11 5Hz正弦跟蹤實(shí)驗(yàn)Ⅰ跟隨偏差
圖12 5Hz正弦跟蹤實(shí)驗(yàn)Ⅰ控制量
圖13 5Hz正弦跟蹤實(shí)驗(yàn)Ⅱ
以跟蹤誤差的均方根誤差(Root Mean Square of Error, RMSE)和控制信號(hào)u的均方根誤差(Root Mean Square of u, RMSU)作為定量比較的對(duì)比項(xiàng),RMSU表征控制量的能量。相對(duì)變化量表示POGADRC相對(duì)GADRC, RMSE或RMSE的相對(duì)變化量。對(duì)于RMSE而言,相對(duì)變化量為負(fù)值時(shí),表示跟蹤誤差相對(duì)變小,控制效果提高,反之則控制能力未提高或降低。對(duì)于RMSE而言,相對(duì)變化量為負(fù)值時(shí),表示跟蹤消耗的能量減少,反之消耗的能量不變或增加。表3反應(yīng)了不同頻率下,無(wú)外部電壓擾動(dòng)跟隨實(shí)驗(yàn)在三個(gè)正弦周期內(nèi)的RMSE和RMSU數(shù)據(jù)。在RMSU幾乎相同的情況下,POGADRC控制偏差更小。
表3 未施加外部電壓擾動(dòng)的正弦跟隨響應(yīng)結(jié)果RMSE和RMSU定量比較
圖14顯示了在GADRC和POGADRC閉環(huán)控制下和開(kāi)環(huán)條件下實(shí)驗(yàn)臺(tái)的遲滯回線(xiàn)。GADRC和POGADRC都表現(xiàn)出了較好的遲滯非線(xiàn)性抑制能力。跟隨頻率為50Hz時(shí),兩者抑制效果相近,跟隨頻率較低時(shí),1 Hz、5 Hz、10 Hz條件下,POGADRC表現(xiàn)出優(yōu)于GADRC的非線(xiàn)性抑制能力。
圖14 開(kāi)環(huán)和閉環(huán)控制下遲滯回線(xiàn)對(duì)比
為實(shí)現(xiàn)對(duì)具由遲滯非線(xiàn)性特性壓電驅(qū)動(dòng)的納米定位臺(tái)良好的定位控制,在建立的實(shí)驗(yàn)臺(tái)線(xiàn)性模型的基礎(chǔ)上,設(shè)計(jì)了POGADRC。實(shí)驗(yàn)結(jié)果表明,POGADRC具有更優(yōu)的動(dòng)態(tài)響應(yīng)特性和擾動(dòng)、遲滯非線(xiàn)性抑制能力,實(shí)現(xiàn)了壓電驅(qū)動(dòng)的納米定位臺(tái)的良好定位控制,這為自抗擾控制在壓電驅(qū)動(dòng)的納米定位領(lǐng)域的應(yīng)用提供了一種實(shí)用控制方案。