張義超,黃 晨,陸浩然,孫 戎
(北京宇航系統(tǒng)工程研究所,北京 100076)
輸入飽和的雙積分系統(tǒng)的復(fù)合時(shí)間最優(yōu)控制
張義超,黃 晨,陸浩然,孫 戎
(北京宇航系統(tǒng)工程研究所,北京 100076)
針對(duì)典型的有輸入飽和的雙積分環(huán)節(jié)或系統(tǒng)的時(shí)間最優(yōu)控制問(wèn)題,建立了雙積分環(huán)節(jié)的傳遞函數(shù)和狀態(tài)空間方程兩種數(shù)學(xué)模型,設(shè)計(jì)雙積分環(huán)節(jié)的閉環(huán)時(shí)間最優(yōu)控制律;對(duì)時(shí)間最優(yōu)控制在系統(tǒng)存在干擾和不確定性存在條件下出現(xiàn)的振顫現(xiàn)象進(jìn)行分析;基于對(duì)振顫問(wèn)題的分析,提出一種對(duì)時(shí)間最優(yōu)控制的改進(jìn),即一種復(fù)合控制方法,當(dāng)輸入作用時(shí),系統(tǒng)先由時(shí)間最優(yōu)控制律控制,當(dāng)誤差達(dá)到預(yù)定值限,控制律由時(shí)間最優(yōu)控制律切換到另一種線性控制律。采用了比例微分控制律,來(lái)解決時(shí)間最優(yōu)控制的振顫問(wèn)題,響應(yīng)時(shí)間達(dá)到最優(yōu),并解決振顫問(wèn)題。
雙積分環(huán)節(jié);時(shí)間最優(yōu)控制;振顫;復(fù)合控制
我們周圍的很多實(shí)際系統(tǒng),都可以看作雙積分系統(tǒng),并且具有顯著的非線性。在進(jìn)行控制器系統(tǒng)設(shè)計(jì)時(shí),不能忽略。典型地,在進(jìn)行計(jì)算機(jī)硬盤(HDD)伺服系統(tǒng)控制器設(shè)計(jì)時(shí),HDD的驅(qū)動(dòng)器便被視為雙積分環(huán)節(jié)[1-2]。該系統(tǒng)的典型的主要非線性包括摩擦、高周波機(jī)械共振和執(zhí)行器的輸入飽和,并且輸入飽和性是所有這些非線性特性中最顯著的[3-4]。在本文中,我們只研究具有輸入飽和的雙積分環(huán)節(jié)。
考慮我們上面所提到問(wèn)題,在非線性存在的情況下,一個(gè)單一的線性控制器在實(shí)際情況下是不可行的。一個(gè)典型的控制系統(tǒng),包括具有輸入飽和的雙積分系統(tǒng),控制性能是穩(wěn)定性、響應(yīng)速度和準(zhǔn)確性,為了達(dá)到最佳的速度性能,我們一般自然會(huì)首先想到時(shí)間最優(yōu)控制。
但是,經(jīng)典的時(shí)間最優(yōu)控制(Time Optimal Control)在任何實(shí)際情況下都不能應(yīng)用,因?yàn)樵谙到y(tǒng)不確定性與測(cè)量噪聲存在情況下它將變得不具有魯棒性或魯棒性明顯降低[4-5]。因此,TOC是理論上的時(shí)間最優(yōu),在大多數(shù)實(shí)際情況下,它不能達(dá)到預(yù)期的控制性能。這將在下面的章節(jié)中證明,單一TOC控制系統(tǒng)在引入測(cè)量噪聲后系統(tǒng)輸出出現(xiàn)明顯顫振現(xiàn)象。
因此,TOC的改進(jìn)成為必要。事實(shí)上,文獻(xiàn)[5]和[6]提出并研究了一種的對(duì)TOC改進(jìn),稱為近似時(shí)間最優(yōu)伺服機(jī)構(gòu)(PTOS),來(lái)克服這種缺點(diǎn)。受PTOS及[4]中提出的復(fù)合非線性反饋(CNF)的啟發(fā),本文提出了對(duì)具有輸入飽和的雙積分系統(tǒng)的復(fù)合非線性控制,即所謂的TOC-PID控制。TOC-PID控制由TOC控制律和PD控制兩部分組成。TOC部分設(shè)計(jì)首先致力于閉環(huán)TOC控制系統(tǒng)的響應(yīng)時(shí)間最優(yōu);為了克服TOC的缺點(diǎn),當(dāng)系統(tǒng)輸出接近目標(biāo)參考值時(shí),控制律切換到PID控制律,文中針對(duì)雙積分環(huán)節(jié),采用了PD控制律。
雙積分系統(tǒng),或者說(shuō)雙積分環(huán)節(jié),服從牛頓第二定律,這種系統(tǒng)可以如下描述:
(1)
其中:y(t)為系統(tǒng)輸出,u(t)為輸入控制量,即控制律輸出,ka為減速度常數(shù),與系統(tǒng)的結(jié)構(gòu)和參數(shù)有關(guān)。
根據(jù)設(shè)計(jì)過(guò)程的不同要求和為了設(shè)計(jì)方便,對(duì)方程式描述的雙積分環(huán)節(jié),建立兩種不同形式的動(dòng)態(tài)數(shù)學(xué)模型,狀態(tài)空間方程和傳遞函數(shù),分別用于TOC和PD控制律。
1.1 雙積分環(huán)節(jié)狀態(tài)空間方程
(2)
1.2 雙積分環(huán)節(jié)傳遞函數(shù)
根據(jù)傳遞函數(shù)與狀態(tài)方程的關(guān)系:G(s)=c(sI-A)-1b,可得雙積分環(huán)節(jié)傳遞函數(shù):
(3)
1.3 雙積分環(huán)節(jié)輸入約束
考慮被控對(duì)象的輸入飽和性,控制量輸入被限制為:
|u|≤umax
(4)
其中:umax為被控對(duì)象的輸入限制水平。
2.1 閉環(huán)TOC控制律設(shè)計(jì)
2.1.1 最優(yōu)解條件與形式
根據(jù)TOC的性能指標(biāo),利用變分法,首先給出這種問(wèn)題的哈密頓函數(shù)[7-8]:
H(x,u,λ,t)=1+λT(Ax+bu)=
1+λ1(t)x2(t)+λ2(t)x1(t)
(5)
其中:λ=[λ1λ2]∈R2為時(shí)變拉格朗日乘子向量。時(shí)間最優(yōu)控制u*(t)的設(shè)計(jì)應(yīng)滿足龐特里亞金原理[8-9]。u*(t)應(yīng)使H(x,u,λ,t)取最小值:
(6)
其中:上標(biāo)*表示最優(yōu)。根據(jù)式(5)、(6),龐特里亞金原理要求的條件簡(jiǎn)化為:
(7)
由此,可得u*(t)應(yīng)按如下取值:
(8)
變分法同樣給出時(shí)間最優(yōu)解的條件[7],即協(xié)態(tài)方程:
(9)
協(xié)態(tài)方程解為:
(10)
其中:c1與c2為待定常數(shù)。式(8)和(10)表明u*(t)在+umax與-umax之間最多切換一次,切換次數(shù)有系統(tǒng)初始狀態(tài)決定。
2.1.2 相軌跡分析
在閉環(huán)Bang-Bang控制中,雙積分環(huán)節(jié)的速度被控制跟隨預(yù)期狀態(tài)軌跡,確切的說(shuō)是減速(正向和反向減速)軌跡,這些軌跡可通過(guò)下面的相平面分析得到。
考慮u*(t)=+umax或u*(t)=-umax,狀態(tài)方程(2)的解有如下形式:
(11)
其中:c3與c4為由系統(tǒng)初始狀態(tài)決定的積分常數(shù)。
首先消去狀態(tài)方程解(11)中的與,得相應(yīng)的最優(yōu)相軌跡方程:
(12)
由于每取一個(gè)初始狀態(tài),常數(shù)c5=c4-c3/(2kaumax)與c6=c4+c3/(2kaumax)對(duì)應(yīng)取某一值,則式(12)表示拋物線簇,即最優(yōu)軌線集合。
為實(shí)現(xiàn)以為反饋量的閉環(huán)TOC控制系統(tǒng),我們研究e(t)與v(t)之間的相軌跡。為了實(shí)現(xiàn)具體的TOC控制器,應(yīng)將(13)表示為具體的關(guān)于e(t)的函數(shù)。
定義位置誤差,為輸入量,亦即期望輸出,由式(12)得到e(t)與之間的相軌跡方程:
(13)
研究問(wèn)題:初始狀態(tài)x(0)=[00]T,x(tf)=[r0]T,則對(duì)應(yīng)e(0)=[r0]T,e(tf)=[00]T,其中0和tf分別表示初始與終止時(shí)刻。
由始末其變化可知,系統(tǒng)狀態(tài)其必然要經(jīng)過(guò)加速與減速的過(guò)程,因此最優(yōu)解u*(t)開關(guān)次數(shù)為1。此時(shí),式(13)中的常數(shù)為0,e(t)與v(t)之間的軌跡,對(duì)應(yīng)拋物線:
(14)
相平面由拋物線(14)分成幾部分,分析e(t)與v(t)之間的關(guān)系,假定控制輸入u*(t)=+umax產(chǎn)生加速度,u*(t)=-umax產(chǎn)生幅值相同的減速度。
當(dāng)e(t)>0時(shí),
(15)
當(dāng)e(t)<0時(shí),
(16)
2.1.3 閉環(huán)TOC控制律
(17)
用符號(hào)函數(shù)可表示為:
u*(t)=sgn[fe(e)-v]·umax+
{1-|sgn[fe(e)-v]|}sgn(e)·umax
(18)
若定義如下函數(shù):
fv(sgn(fe(e)-v)):=sgn(fe(e)-v)+
[1-sgn(fe(e))]sgn(e)
(19)
則時(shí)間最優(yōu)控制律u*(t)可表示為:
u*(t)=fv[sgn(fe(e)-v)]umax
(20)
2.1.4TOC控制振顫問(wèn)題分析
前面已經(jīng)提出,單一TOC控制系統(tǒng)在引入測(cè)量噪聲后系統(tǒng)輸出出現(xiàn)明顯顫振現(xiàn)象,而典型的硬盤伺服系統(tǒng)中的磁頭致動(dòng)器為雙積分環(huán)節(jié)。
本節(jié)將以MaxtorHDD(型號(hào)為51536U3,具體的參數(shù)為:ka=6.401 3×107,u*(t)=3V)為實(shí)際仿真對(duì)象,在設(shè)計(jì)的時(shí)間最優(yōu)控制律u*(t)基礎(chǔ)上,引入白噪聲(WhiteNoise)作為輸出測(cè)量干擾[10],并通過(guò)對(duì)系統(tǒng)輸出(磁頭位置信號(hào))測(cè)量值取微分實(shí)現(xiàn)速度反饋,進(jìn)行仿真,研究分析TOC的振顫問(wèn)題。引入輸出測(cè)量干擾前后單TOC控制系統(tǒng)輸出結(jié)果如圖1所示。
圖1 TOC控制系統(tǒng)輸出
由圖1可知,引入輸出測(cè)量干擾后,在系統(tǒng)輸出上升階段結(jié)束的后續(xù)階段,位置誤差較小,相對(duì)于實(shí)際的位置誤差,干擾對(duì)TOC控制器的影響相對(duì)增強(qiáng)。干擾一方面使誤差信號(hào)不斷波動(dòng),另一方面干擾的高頻率變化也使反饋速度不斷波動(dòng),從而使TOC控制器的輸出量不斷在兩個(gè)正負(fù)極端值之間進(jìn)行切換??刂屏糠禑o(wú)衰減,VCM致動(dòng)器始終處于輸入飽和狀態(tài),從而使系統(tǒng)輸出呈現(xiàn)無(wú)衰減收斂的趨勢(shì)且變化很快,而呈波動(dòng)現(xiàn)象,即所謂的輸出振顫。
不僅在HDD磁道搜尋控制系統(tǒng)中,在其它實(shí)際工程中TOC也會(huì)由于系統(tǒng)存在不確定性或干擾而出現(xiàn)振顫,因而TOC在實(shí)際工程中不能應(yīng)用或很少應(yīng)用。振顫問(wèn)題是TOC在實(shí)際工程應(yīng)用中存在的主要問(wèn)題,解決該問(wèn)題是關(guān)鍵所在。
2.2 TOC-PD復(fù)合控制
2.2.1 TOC-PD復(fù)合控制律
TOC控制的主要控制目標(biāo)是快速性,由上一節(jié)仿真TOC可使系統(tǒng)輸出在最短的時(shí)間內(nèi)到達(dá)目標(biāo)輸出值,即TOC可以實(shí)現(xiàn)系統(tǒng)輸出的最優(yōu)上升時(shí)間。但此后系統(tǒng)輸出圍繞目標(biāo)值上下波動(dòng),不呈現(xiàn)衰減收斂趨勢(shì),即輸出振顫。
引入輸出測(cè)量干擾后的TOC系統(tǒng)輸出的振顫波形與二階0阻尼系統(tǒng)的等幅振蕩波形具有相似性。解決二階0阻尼系統(tǒng)等幅振蕩問(wèn)題的方法是增大系統(tǒng)阻尼比使系統(tǒng)穩(wěn)定,從而使輸出收斂于目標(biāo)值。選擇不同的阻尼比,來(lái)實(shí)現(xiàn)系統(tǒng)輸出的動(dòng)態(tài)特性。
受復(fù)合非線性反饋控制思想啟發(fā),理論上可提出:先由TOC控制使系統(tǒng)輸出達(dá)到目標(biāo)值,當(dāng)位置誤差e=0時(shí),立即將TOC控制器切換到另一線性控制器,此后由該控制器作用使系統(tǒng)構(gòu)成一個(gè)穩(wěn)定的二階系統(tǒng),使系統(tǒng)輸出收斂,解決單一TOC控制的振顫問(wèn)題。
但考慮實(shí)際情況,當(dāng)TOC使系統(tǒng)輸出第一次達(dá)到目標(biāo)值,即e=0時(shí),立即完成控制器的切換是很難實(shí)現(xiàn)的,或者是無(wú)法實(shí)現(xiàn)的,存在延時(shí)性,再者,e=0的測(cè)量也存在誤差。因此,只能在e接近于0的一定誤差范圍內(nèi)完成控制器的切換。
根據(jù)以上分析,提出如下復(fù)合控制方案:
uTOC-PD(t)=f(e)·uTOC(t)+[1-f(e)]·uPD(t)
(21)
(22)
其中:uTOC(t)=u*(t)為TOC控制律,uPD(t)為另PID控制律,本文提出了PD控制律,a為實(shí)現(xiàn)uTOC(t)與uPD(t)之間切換的位置誤差限度,稱之為切換誤差限度常數(shù)。
2.2.2PD控制律
雙積分環(huán)節(jié)傳遞函數(shù)為G(s)=ka/s2,有兩個(gè)積分環(huán)節(jié),為實(shí)現(xiàn)穩(wěn)定的二階控制系統(tǒng),應(yīng)減弱或消除積分環(huán)節(jié)對(duì)系統(tǒng)帶來(lái)的不穩(wěn)定影響,保證加入線性控制器后構(gòu)成的閉環(huán)系統(tǒng)是穩(wěn)定的,因而可將線性控制器 選為PD控制器。
PD控制器的傳遞函數(shù)如下:
uPD(t)=kp(1-τ)e(t)
(23)
其中:kp為比例系數(shù);τ為微分時(shí)間常數(shù)。在同時(shí)保證系統(tǒng)的穩(wěn)定應(yīng)性的同時(shí),保證控制輸出在約束范圍內(nèi)。調(diào)節(jié)kp與τ,可以改變阻尼比與固有頻率,從而改變系統(tǒng)的動(dòng)態(tài)性能。
2.2.3 復(fù)合控制仿真分析
本節(jié)將對(duì)上節(jié)所設(shè)計(jì)的“TOC-PD”復(fù)合控制系統(tǒng)進(jìn)行仿真分析,說(shuō)明提出方案的可行性。仿真所用HDD的類型和參數(shù)、引入的輸出測(cè)量干擾及具體的數(shù)據(jù)與2.1.3節(jié)TOC控制振顫問(wèn)題分析研究時(shí)應(yīng)用的相同。
引入輸出測(cè)量干擾后的TOC、TOC-PD控制系統(tǒng)的輸出結(jié)果如圖2所示。不同a之下TOC-PD控制系統(tǒng)的輸出如圖3所示。
圖2 TOC、TOC-PD控制系統(tǒng)輸出
圖3 不同a值下TOC-PD控制系統(tǒng)輸出
由圖2可見(jiàn),復(fù)合控制系統(tǒng)與TOC系統(tǒng)的系統(tǒng)輸出上升過(guò)程基本相同,說(shuō)明復(fù)合控制能夠?qū)崿F(xiàn)TOC的最優(yōu)上升時(shí)間。復(fù)合控制系統(tǒng)系統(tǒng)輸出在上升過(guò)程結(jié)束后,衰減收斂,說(shuō)明復(fù)合控制中PD控制器發(fā)揮了作用,消除了TOC的振顫。
原理上可知,切換誤差限度常數(shù)a的選取,直接影響到TOC控制器與PD控制器之間的切換,因此a對(duì)振顫的消除有著直接影響。由圖3可知,當(dāng)切換誤差常數(shù)a由小到大調(diào)整時(shí),輸出的上升過(guò)程基本不變,說(shuō)明a對(duì)輸出上升時(shí)間基本無(wú)影響。切換誤差限度常數(shù)a對(duì)系統(tǒng)輸出的影響主要在上升階段之后。隨著a的取值增大,振顫輕微減弱,直至無(wú)振顫,系統(tǒng)的超調(diào)量減小。
本文針對(duì)雙積分環(huán)節(jié)提出了時(shí)間最優(yōu)控制(TOC)和PD控制的一種組合,稱為TOC-PD控制。一方面,TOC用于獲得最優(yōu)的系統(tǒng)響應(yīng)時(shí)間,然而,TOC在系統(tǒng)存在不確定性或輸出測(cè)量噪聲時(shí),魯棒性降低或不具有魯棒性。在本文中,具體地表現(xiàn)為,單一TOC控制在系統(tǒng)引入測(cè)量噪聲后,系統(tǒng)輸出呈現(xiàn)振顫現(xiàn)象;另一方面,當(dāng)系統(tǒng)誤差達(dá)到某一接近于0的范圍時(shí),PD控制被引入來(lái)克服TOC的這種缺點(diǎn),系統(tǒng)具有了很好的魯棒性。一個(gè)具體的硬盤伺服系統(tǒng)的仿真應(yīng)用很好地說(shuō)明了文中所體方法的可行性與有效性。
[1] 程國(guó)揚(yáng), 金文光. 硬盤磁頭快速精確定位伺服控制系統(tǒng)的設(shè)計(jì)[J]. 中國(guó)電機(jī)工程學(xué)報(bào),2006,26(12):139-143.
[2]LiY,GuoG,WangY.Anonlinearcontrolschemeforfastsettlinginharddiskdrives[J].IEEETransactionsonMagnetics, 2004, 40(4):2086-2088.
[3]Chen,Lee,Venkataramanan.HardDiskDriveServoSystems(2endedition)[M].SpringerScienceandBusinessMedia, 2006.
[4]ChenBM,LeeTH,PengK,etal.Compositenonlinearfeedbackcontrolforlinearsystemswithinputsaturation:theoryandanapplication[J].IEEETransactionsonAutomaticControl, 2003,48(3):427-439.
[5]HredzakB,HerrmannG,GuoG.Aproximate-time-optimal-controldesignanditsapplicationtoaharddiskdrivedual-stageactuatorsystem[J].IEEETransactionsonMagnetics, 2006, 42 (6):1708-1715.
[6]ChoiYM,JeongJ,GweonDG.Anoveldampingschedulingschemeforproximatetimeoptimalservomechanisminharddiskdrives[J].IEEETrans.onMagnetics, 2006, 42(3):468-472.
[7] 胡壽松. 自動(dòng)控制原理(第6版)[M]. 北京:科學(xué)出版社,2013.
[8] 王曉陵, 陸 軍. 最優(yōu)化方法與最優(yōu)控制[M]. 哈爾濱:哈爾濱工程大學(xué)出版社,2008.
[9] 張嗣瀛, 高立群. 現(xiàn)代控制理論[M]. 北京:清華大學(xué)出版社出版社,2007.
[10] 龐中華, 崔 紅. 系統(tǒng)辨識(shí)與自適應(yīng)控制MATLAB仿真[M]. 北京:北京航空航天大學(xué)出版社版,2009.
Composite TOC Control for Double Integrating Systems with Input Saturation
Zhang Yichao,Huang Chen,Lu Haoran, Sun Rong
(Beijing Institute of Astronautical Systems Engineering, Beijing 100083, China)
To the issue of time optimal control of double integrating systems with input saturation, the transferring function model and state-space model of double integrating systems are established, and the time optimal controller (TOC) is designed. Unfortunately, it is well known that the classical TOC is not robust with respect to the system uncertainties and measurement noises. Thus, we ,in the paper, study the chatter problem by simulation and introduces a nonlinear composite control,method, i.e., a combination of time optimal control (TOC) and PID control, for double integrating systems with input saturation. The TOC part is designed to enable the time optimization. In order to solve the drawback of TOC, when the error is small to a certain level, it will switch to the PD part to overcome the chatter problem caused by the TOC. Finally, the simulation results, approximate time optimization and fair robustness demonstrate the effectiveness and feasibility of the proposed method.
double integrating systems; time optimal control; chatter problem; composite control
2016-10-26;
2016-12-03。
張義超(1986-),男,河北唐山人,碩士研究生,主要從事電子信息與控制工程方向的研究。
1671-4598(2017)04-0051-03
10.16526/j.cnki.11-4762/tp.2017.04.016
TP273
A