孫笑云,吳樹范,沈 強(qiáng)
(1.上海交通大學(xué) 航空航天學(xué)院,上海 200240;2.上海市引力波探測前沿科學(xué)研究基地,上海 200240)
無拖曳控制是航天器平臺與其內(nèi)部以檢驗(yàn)質(zhì)量為主的關(guān)鍵載荷用于保證超高精度相對運(yùn)動關(guān)系的主要控制方法,為以空間引力波探測等為代表的先進(jìn)空間探測任務(wù)提供超靜、超穩(wěn)的航天器平臺。在空間低頻引力波探測任務(wù)中[1],無拖曳控制的引入要求慣性傳感器的敏感軸殘余擾動加速度在毫赫茲頻段優(yōu)于10–15m/s2/量級,位移控制精度優(yōu)于[2]。考慮近地衛(wèi)星受到的復(fù)雜外部及內(nèi)部干擾等因素,這些性能指標(biāo)的滿足對航天器平臺控制方法的設(shè)計及控制技術(shù)的實(shí)現(xiàn)提出極具挑戰(zhàn)性的要求。
當(dāng)前,針對無拖曳控制問題的研究主要集中于被動控制[3-4]和主動控制[5-9]兩個方面。被動控制即通過設(shè)計具有強(qiáng)魯棒性的控制器提高無拖曳控制各敏感軸控制穩(wěn)定性,主動控制則針對系統(tǒng)潛在的各類干擾進(jìn)行識別或估計,提高各自由度抗干擾能力。文獻(xiàn)[3]基于定量反饋理論,根據(jù)性能指標(biāo)轉(zhuǎn)化成設(shè)計準(zhǔn)則,在已解耦的無拖曳控制系統(tǒng)中設(shè)計控制器以滿足不同的性能規(guī)范。文獻(xiàn)[4]提出一種基于頻率分離策略的H1混合靈敏度控制方案,在具有科學(xué)測量約束的無拖曳衛(wèi)星中,滿足穩(wěn)定控制需求,實(shí)現(xiàn)全頻段控制消耗的降低。
在主動控制問題中,基于狀態(tài)觀測或估計的方法是目前解決這一類時變不確定系統(tǒng)的主要手段[10-14]??紤]系統(tǒng)模型不確定性引起的狀態(tài)不確定性,基于已知信息逼近或估計未知狀態(tài),并據(jù)此設(shè)計反饋控制器實(shí)現(xiàn)各閉環(huán)信號的穩(wěn)定,仍是當(dāng)前主動控制問題解決的主要思想。自適應(yīng)控制是良好的不確定性估計方法,用于解決一類參數(shù)不確定性逼近問題[15-19];除此之外,針對僅有輸出信息可知的情況,基于觀測器實(shí)現(xiàn)的輸出跟蹤方法也是解決這一類不確定逼近問題的有效手段。當(dāng)前,狀態(tài)觀測器的設(shè)計方法主要基于模型[20-23]和數(shù)據(jù)[24-25]?;谀P偷臓顟B(tài)觀測器往往建立于系統(tǒng)狀態(tài)可觀可測前提,而基于數(shù)據(jù)的狀態(tài)估計方法多基于樣本先驗(yàn)知識,依賴于樣本數(shù)據(jù)的準(zhǔn)確性,運(yùn)用監(jiān)督學(xué)習(xí)方法或數(shù)據(jù)優(yōu)化策略實(shí)現(xiàn)模型整體的逼近和預(yù)測。
然而,針對無拖曳控制系統(tǒng)的研究中,往往忽略了無拖曳控制系統(tǒng)作為多體跟蹤控制問題的本質(zhì),即航天器跟蹤純引力作用下的慣性傳感器敏感軸,現(xiàn)有成果中多數(shù)采用的線性魯棒控制方案建立在各控制通道解耦,且已假設(shè)不同控制通道間實(shí)現(xiàn)頻率分離,忽略了多自由度無拖曳控制問題的通道間相互耦合作用;已有的無拖曳控制系統(tǒng)設(shè)計大多基于近似的線性動力學(xué)模型,忽略了因傳感器電壓驅(qū)動、微推力執(zhí)行器內(nèi)部擾動及外部環(huán)境擾動引起的非線性和參數(shù)不確定性,所設(shè)計的控制器針對實(shí)際非線性動力學(xué)系統(tǒng)的魯棒性不足,從而位移跟蹤精度尚有提高空間。文獻(xiàn)[15]提出了一種慣性傳感器自適應(yīng)控制方法,研究了無拖曳控制系統(tǒng)的靜電懸浮子系統(tǒng)控制方案設(shè)計問題,基于自適應(yīng)控制手段考慮了系統(tǒng)的非線性和多自由度控制需求。然而,考慮到實(shí)際控制系統(tǒng)應(yīng)利用量測輸出而非狀態(tài)信息設(shè)計反饋控制器,尤其在僅有降維輸出信息可獲取時,一般的自適應(yīng)控制方法不可用,需予以改進(jìn)。文獻(xiàn)[17]提出一種輸出調(diào)節(jié)自適應(yīng)控制方案,用于解決上述降維輸出反饋的自適應(yīng)控制問題,為無拖曳控制系統(tǒng)提供了理論指導(dǎo)。其利用龍伯格觀測器首先將降維輸出信息擴(kuò)展觀測為全維狀態(tài)信息,隨后進(jìn)行自適應(yīng)控制方案設(shè)計,具有一定可行性。然而,當(dāng)系統(tǒng)存在外界擾動及非線性時,所述龍伯格觀測器的引入將對系統(tǒng)引起額外的觀測誤差,從而影響閉環(huán)系統(tǒng)位移控制精度,為使輸出調(diào)節(jié)自適應(yīng)控制方案應(yīng)用于存在復(fù)雜非線性、參數(shù)不確定性及外界擾動的無拖曳控制系統(tǒng)中,狀態(tài)觀測手段需進(jìn)行改進(jìn)。
卡爾曼濾波是一種有效的基于數(shù)據(jù)的未知狀態(tài)估計方法,利用卡爾曼濾波方法實(shí)現(xiàn)量測(輸出)信息向狀態(tài)信息的預(yù)測是其應(yīng)用方向之一[26-28]。文獻(xiàn)[26]基于卡爾曼濾波方法實(shí)現(xiàn)一類參數(shù)不確定系統(tǒng)的狀態(tài)估計,并設(shè)計自適應(yīng)控制器實(shí)現(xiàn)一種壓電驅(qū)動微夾持器的精密運(yùn)動控制;文獻(xiàn)[27]提出一種自適應(yīng)卡爾曼濾波無模型控制方案,應(yīng)用于附加干擾存在下的連續(xù)機(jī)器人的穩(wěn)定控制器設(shè)計中,同時避免了機(jī)器人運(yùn)動的屈曲現(xiàn)象。
利用基于卡爾曼濾波的狀態(tài)觀測器改進(jìn)輸出調(diào)節(jié)控制方案,本文以空間引力波探測航天器[18]為研究對象,設(shè)計一種基于卡爾曼濾波的自適應(yīng)無拖曳控制系統(tǒng),利用基于輸出調(diào)節(jié)的多變量模型參考自適應(yīng)控制(Model Reference Adaptive Control,MRAC)方法實(shí)現(xiàn)各敏感軸自由度的精確與穩(wěn)定控制。本文所述創(chuàng)新性如下:
1)在應(yīng)對非線性不確定性時,該自適應(yīng)控制方案額外考慮了輸出信息降維的情況,相比一般線性魯棒控制方案提高了系統(tǒng)對參考狀態(tài)的自適應(yīng)逼近能力及對外界非線性擾動的抑制能力;
2)基于卡爾曼濾波實(shí)現(xiàn)低軌衛(wèi)星運(yùn)行時外界與內(nèi)部復(fù)雜干擾存在時系統(tǒng)輸出向狀態(tài)的快速預(yù)測及逼近,解決了傳統(tǒng)觀測器中因收斂速率及外界擾動引起的逼近誤差對輸出跟蹤造成負(fù)面影響的問題。
本文內(nèi)容安排如下:第1節(jié)給出包含6個敏感軸自由度的無拖曳航天器非線性模型建立過程;第2節(jié)給出控制器結(jié)構(gòu),設(shè)計基于卡爾曼濾波的狀態(tài)估計器,并設(shè)計基于狀態(tài)估計信息的輸出調(diào)節(jié)多變量MRAC控制器,基于Lyapunov分析驗(yàn)證其閉環(huán)信號收斂性;第3節(jié)給出與常規(guī)方案對比的敏感軸各狀態(tài)響應(yīng)的數(shù)值仿真結(jié)果,第4節(jié)給出結(jié)論。
本節(jié)將對無拖曳控制系統(tǒng)進(jìn)行動力學(xué)建模,并描述控制問題。
以LISA Pathfinder科學(xué)探測任務(wù)航天器為樣例建立無拖曳控制系統(tǒng)動力學(xué)模型。執(zhí)行探測任務(wù)的航天器構(gòu)造如圖1所示,由兩個對置的慣性質(zhì)量塊TM1、TM2及航天器自身構(gòu)成3個相互關(guān)聯(lián)的物理實(shí)體。根據(jù)文獻(xiàn)[19-20,28],其多體動力學(xué)方程描述為
圖1 LISA Pathfinder航天器構(gòu)型[10]Fig.1 Diagram of the LISA Pathfinder spacecraft[10]
其中:E為單位矩陣;、為由roi=[roi,x,roi,y,roi,z]T,i=1,2定義的斜對稱交叉矩陣,表述為
TiB,i=1,2為在標(biāo)稱位置下,航天器主體到檢驗(yàn)質(zhì)量塊的變換矩陣。航天器和檢驗(yàn)質(zhì)量加速度則重新定義為
其中:m、m1、m2、I、I1、I2分別為航天器及檢驗(yàn)質(zhì)量塊的質(zhì)量及轉(zhuǎn)動慣量。
根據(jù)LISA Pathfinder任務(wù)規(guī)則[21],在執(zhí)行科學(xué)探測模式時,選取檢驗(yàn)質(zhì)量1的3個平動自由度、1個轉(zhuǎn)動自由度及檢驗(yàn)質(zhì)量2的兩個平動自由度施行無拖曳控制。根據(jù)文獻(xiàn)[6]給出的坐標(biāo)選擇矩陣DDF、DSUS,將無拖曳系統(tǒng)動力學(xué)模型重新表述為
其中:qDF、qSUS分別為無拖曳控制與靜電懸浮控制坐標(biāo),qDF=DDFq,qSUS=DSUSq,B1、B2、BATT為更緊湊的參數(shù)矩陣,定義為
其中:aSC、aTM為航天器與質(zhì)量塊所受合外力及力矩,認(rèn)為合外力及力矩由控制器輸入uT,uS、外界干擾dSC,dTM及檢驗(yàn)質(zhì)量剛度變形構(gòu)成,將系統(tǒng)開環(huán)動力學(xué)最終表達(dá)為
其中:BDF=DDFB1,BSUS=DSUSB1,控制器輸入uS1=DDFB2uS,uS2=DSUSB2uS,無拖曳系統(tǒng)輸入噪聲。對角矩陣?2DF、?2SUS與交叉耦合矩陣 ?2C為剛度矩陣。僅針對無拖曳控制回路進(jìn)行分析,定義狀態(tài)量x=則計及干擾的無拖曳控制回路標(biāo)準(zhǔn)形式可表述為
其中:dTM=B?1(uS1+dTM1)+dSC為系統(tǒng)總噪聲;A=認(rèn)為B、C已知,A為慢時變的矩陣;y為輸出。由此給出無拖曳控制系統(tǒng)式(4)的頻域輸入輸出描述
其中:u(t)=uT(t)+dTM(t);y(t)=G(s)[u](t)則為一種結(jié)合時域和頻域信號運(yùn)算的簡單符號[7]。給出如下引理[13]:
引理1對于任何M×M嚴(yán)格適當(dāng)和滿秩有理矩陣G(s),存在下三角多項(xiàng)式矩陣ξm(s),定義為G(s)的修正左相互作用矩陣,形式為
其中:(s),j=1,···,M?1,i=2,···,M是多項(xiàng)式,并且di(s) 是li>0次的單調(diào)穩(wěn)定多項(xiàng)式,使得G(s)的高頻增益矩陣,定義為是有限的和非奇異的。給出如下假設(shè):
假設(shè)1G(s)=C(sI?A)?1B的所有零點(diǎn)都是穩(wěn)定的,且A,B,C是穩(wěn)定、可檢測的。
假設(shè)2G(s)滿秩且其修正左相互作用矩陣ξm(s)是已知的。
本節(jié)將首先給出控制系統(tǒng)架構(gòu),描述基于卡爾曼濾波估計器改進(jìn)的輸出調(diào)節(jié)模型參考自適應(yīng)控制方案結(jié)構(gòu),隨后建立標(biāo)稱離散時間狀態(tài)空間動力學(xué)模型,并依據(jù)此模型給出標(biāo)稱卡爾曼濾波估計器,引入基于多變量MRAC的輸出反饋控制器,完成無拖曳控制系統(tǒng)的設(shè)計。
在僅能獲取降維輸出信息的前提下,為實(shí)現(xiàn)存在系統(tǒng)不確定性時各閉環(huán)信號的穩(wěn)定跟蹤能力,依據(jù)卡爾曼濾波估計器替換一般輸出調(diào)節(jié)自適應(yīng)控制方案的狀態(tài)觀測器部分,考慮擾動影響,基于線性二次型得到狀態(tài)的快速估計,并依據(jù)估計狀態(tài)設(shè)計反饋控制器,表達(dá)為輸出反饋形式,利用自適應(yīng)律及模型匹配條件估計該輸出反饋增益。閉環(huán)系統(tǒng)結(jié)構(gòu)如圖2所示。
圖2 控制結(jié)構(gòu)Fig.2 Control Framework.
卡爾曼濾波是一種基于線性二次型的估計器,將其用于系統(tǒng)未知狀態(tài)的估計中,相比傳統(tǒng)狀態(tài)觀測器具有更快的收斂性。盡管本文的研究處于連續(xù)時間系統(tǒng)中,考慮到硬件實(shí)現(xiàn)的實(shí)際過程也為離散時間系統(tǒng),首先將給出基于離散時間表述的狀態(tài)空間方程
依據(jù)卡爾曼濾波方程,依據(jù)量測輸出信息對狀態(tài)進(jìn)行估計,首先給出時間更新方程
隨后給出下述量測更新方程
部分變量的定義已由文獻(xiàn)[17]給出。根據(jù)得到的狀態(tài)估計信息,進(jìn)行自適應(yīng)控制器設(shè)計。
利用系統(tǒng)輸出y(t)=Cx(t)首先觀測系統(tǒng)狀態(tài),并基于觀測狀態(tài)設(shè)計反饋控制結(jié)構(gòu)。給出包含干擾反饋的輸出調(diào)節(jié)反饋控制律
其中:K1、K2?為觀測狀態(tài)x?(t)及參考模型輸入r(t)的反饋增益,該反饋控制設(shè)計目的是使控制對象跟蹤參考模型
其中:ym為參考輸出,同時抑制外界干擾。注意到在卡爾曼濾波估計器中,狀態(tài)估計(t)與系統(tǒng)輸入、附加干擾及系統(tǒng)輸出有關(guān),考慮到干擾dTM不可知,由此將控制器的狀態(tài)反饋部分表達(dá)為
其中:A1(s)、A2(s)為表達(dá)在復(fù)數(shù)域中且與狀態(tài)參數(shù)方程無關(guān)的卡爾曼濾波估計器參數(shù),Θ?1T、Θ?2T為其各自相對應(yīng)的反饋增益?;谏鲜鐾茖?dǎo)與Θ?3=K2?,并忽略指數(shù)衰減項(xiàng)可以得到含有部分狀態(tài)觀測誤差的參數(shù)化標(biāo)稱部分狀態(tài)反饋控制器表述
其中:
在進(jìn)行自適應(yīng)律設(shè)計之前,首先探討模型的輸出匹配條件,即自適應(yīng)律的存在性。文獻(xiàn)中已針對基于輸出反饋控制器的對象模型輸出匹配性做出探討及證明,即認(rèn)為由輸出反饋推導(dǎo)得到的觀測狀態(tài)反饋控制器中,標(biāo)稱控制器參數(shù)K1?和K2?滿足匹配條件
時,能夠確保模型輸出匹配
y(t)?ym(t)=e(t)
e(t)在任何初始條件下都能指數(shù)收斂至0,且閉環(huán)信號y(t)有界。
自適應(yīng)控制方案的引入旨在解決系統(tǒng)狀態(tài)參數(shù)矩陣A、B、C未知的問題??紤]時域模型中對3個狀態(tài)矩陣的自適應(yīng)估計會進(jìn)一步增大自適應(yīng)更新律的設(shè)計難度,在頻域內(nèi)對高頻增益矩陣Kp進(jìn)行LDS分解,從而簡化自適應(yīng)逼近過程,降低控制器設(shè)計難度。給出如下假設(shè)[21]:
假設(shè)3高頻矩陣Kp的所有順序主子式?i,i=1,2,···,M都是非零的,并且它們的符號已知。這樣的Kp具有非唯一的LDS矩陣分解
其中:S=ST>0;Ls是一個單位上三角矩陣,Ds=diag具有任意和選定的常數(shù)i=1,2,···,M。
將輸出調(diào)節(jié)控制的自適應(yīng)版本表述為γi>0,
其中:β為符號已知的系數(shù);?為在式(25)中定義的系統(tǒng)估計誤差。將輸出誤差跟蹤方程表述為
利用高頻增益矩陣Kp的LDS分解對該跟蹤誤差各自適應(yīng)變量實(shí)現(xiàn)參數(shù)化求解,同時根據(jù)式(17),將等式改寫為
為將未知單位上三角矩陣Ls參數(shù)化,引入一個常數(shù)矩陣其中θ?ij=0,i=1,2,···,M,j>i,同時定義參數(shù)矩陣估計誤差變量(t)=Θ(t)?Θ?(t),將式((18)進(jìn)一步改寫為
進(jìn)一步將該方程進(jìn)行參數(shù)化,引入一個穩(wěn)定的單項(xiàng)多項(xiàng)式f(s),其次數(shù)等于左相互作用矩陣ξm(s)的最大次數(shù)。利用濾波器h(s)=1/f(s)對估計誤差方程進(jìn)行修正,將等式表述為
令
則等式進(jìn)一步改寫為
為實(shí)現(xiàn)控制對象向參考模型的跟蹤,除跟蹤誤差收斂需求外,還需實(shí)現(xiàn)模型的輸出匹配,即要求高頻增益矩陣及控制器參數(shù)向標(biāo)稱值的收斂。由此構(gòu)建包含參數(shù)估計誤差的方程
上述線性化的估計誤差方程將應(yīng)用于自適應(yīng)律的推導(dǎo)。給出參數(shù)估計自適應(yīng)律
其中:Γθi、ΓΨ為自適應(yīng)增益矩陣,滿足Γθi=ΓTθi>0,ΓΨ=ΓTΨ>0,同時有
給出下述定理:
定理1以輸出反饋控制器式(16)、自適應(yīng)律式(25)、狀態(tài)估計器式(9)及被控對象式(4)構(gòu)成的無拖曳閉環(huán)控制系統(tǒng),保證各閉環(huán)信號有界。
證明:首先設(shè)計Lyapunov函數(shù)驗(yàn)證基于自適應(yīng)律設(shè)計的參數(shù)估計有界性。定義Lyapunov函數(shù)如下
對等式兩邊求取一階微分,得到
由于DsSh(s)β符號確定,則當(dāng)時,
則容易得到各自適應(yīng)估計參數(shù)一致收斂。根據(jù)文獻(xiàn)[21]中對各估計誤差收斂性向系統(tǒng)輸出誤差收斂性的推導(dǎo)分析,也能得到閉環(huán)系統(tǒng)內(nèi)各信號的一致穩(wěn)定性。
數(shù)值仿真驗(yàn)證基于樣例無拖曳控制非線性動力學(xué)模型[11]。由于需考察閉環(huán)系統(tǒng)各狀態(tài)響應(yīng)的性能指標(biāo),部分?jǐn)?shù)值仿真結(jié)果展示為頻域形式。數(shù)值仿真通過與PID控制方案[5]的對比驗(yàn)證了該MRAC方案在兩個分別代表平動和轉(zhuǎn)動的敏感軸無拖曳自由度上針對位移噪聲抑制的控制效果,設(shè)置仿真時間為100 s,步長為0.1 s。數(shù)值仿真結(jié)果如圖3~5所示。
圖3 三自由度濾波器估計與真值對比Fig.3 3-DOFs comparisons of the filter estimation and true value
執(zhí)行器存在以如下成型濾波器表達(dá)的隨機(jī)過程噪聲
其中:作用于x1,θ1兩敏感坐標(biāo)軸上的噪聲相關(guān)參數(shù)p1,p2,p3,p4,p5,z1,K1,K2的取值由文獻(xiàn)[3]給出。
1)數(shù)值仿真結(jié)果驗(yàn)證該自適應(yīng)卡爾曼濾波器用于狀態(tài)估計的有界性。如圖3所示,將3個平動自由度狀態(tài)真值與濾波器估計值對比,能夠得出估計值與真值均處于固定半徑的球面內(nèi),以此說明自適應(yīng)濾波器估計的有界性。2)該自適應(yīng)控制方法具有良好的閉環(huán)性能。根據(jù)圖4,在頻域內(nèi)對3個平動自由度進(jìn)行數(shù)值仿真,根據(jù)仿真結(jié)果,應(yīng)用該卡爾曼濾波–自適應(yīng)控制方法后,敏感軸位移噪聲控制精度優(yōu)于移噪聲控制精度優(yōu)于這一噪聲抑制水平非敏感軸位體現(xiàn)了該方法在低頻段空間引力波探測任務(wù)中的較高可行性,在各自由度上均體現(xiàn)了良好的閉環(huán)控制性能。3)該方法相比于線性魯棒控制方法具有更好的噪聲抑制能力。根據(jù)圖5及圖6,該方案相比基于QFT理論的線性控制方法在各自由度上均體現(xiàn)了良好的噪聲抑制水平。其原因是系統(tǒng)本身存在較為強(qiáng)烈的非線性及附加干擾,利用卡爾曼濾波和自適應(yīng)控制的良好估計能力,可以實(shí)現(xiàn)上述不確定性的較好估計和抑制。
圖4 KF-MRAC方案下閉環(huán)頻域性能Fig.4 Closed-loop frequency domain performance under KF-MRAC scheme
圖5 x1軸閉環(huán)時域性能對比Fig.5 Comparison of closed-loop time domain performance on x1 axis
圖6 y1軸閉環(huán)時域性能對比Fig.6 Comparison of closed-loop time domain performance on y1 axis
4)卡爾曼濾波估計器相比傳統(tǒng)龍伯格(Luenberger)觀測器具有更好的估計效果。根據(jù)圖7,在一個平動自由度上驗(yàn)證傳統(tǒng)觀測器與該估計器的性能對比,仿真結(jié)果表明,運(yùn)用卡爾曼濾波估計器的控制方法擁有較好的閉環(huán)性能。這是由于卡爾曼濾波估計器基于線性二次規(guī)劃,盡管非線性系統(tǒng)中并不能保證該估計器的全局最優(yōu)性,但其良好的尋優(yōu)能力相比于傳統(tǒng)觀測器在觀測及閉環(huán)性能上均有較大優(yōu)勢;同時,傳統(tǒng)觀測器基于狀態(tài)的前饋或反饋,盡管能夠保證其指數(shù)收斂性,但收斂速率引起的慣性難以避免,因此在動態(tài)時變系統(tǒng)中,傳統(tǒng)觀測器的引入也將引起閉環(huán)跟蹤誤差的負(fù)面影響。
圖7 z1軸閉環(huán)時域性能對比Fig.7 Comparison of closed-loop time domain performance on z1 axis
本文設(shè)計了基于卡爾曼濾波狀態(tài)估計器的輸出調(diào)節(jié)MRAC方案,應(yīng)用于空間引力波探測無拖曳控制問題中,提高了引力波探測多體閉環(huán)系統(tǒng)針對復(fù)雜非線性隨機(jī)擾動項(xiàng)的逼近能力。卡爾曼濾波估計器的引入實(shí)現(xiàn)了僅有輸出信息可以獲得時全狀態(tài)的估計,Lyapunov分析證明了各閉環(huán)信號全局一致漸進(jìn)穩(wěn)定及跟蹤誤差的收斂性,數(shù)值仿真驗(yàn)證了該控制方案的優(yōu)良控制性能。