馬嘉程,馮 慧,王 生
(1. 中國科學(xué)院空天信息創(chuàng)新研究院,北京 100094;2. 中國科學(xué)院大學(xué),北京 100049)
光電吊艙在工作中,會受到外部載體的姿態(tài)變化和振動,以及來自內(nèi)部的軸系摩擦力矩和傳感器噪聲等擾動。這些擾動會導(dǎo)致傳感器指向不穩(wěn)定,使得傳感器獲取的圖像模糊,降低跟蹤精度,甚至“丟失”跟蹤目標(biāo)。因此,需要采用合適的控制方法,來提高光電吊艙的穩(wěn)定性,保持傳感器視軸指向的穩(wěn)定。
PID控制是工程實(shí)際中,應(yīng)用最廣泛的控制方法,具有結(jié)構(gòu)簡單、穩(wěn)定性好的優(yōu)點(diǎn)。如今,人們對光電吊艙的精度和穩(wěn)定性指標(biāo)要求越來越高,傳統(tǒng)PID的控制,使系統(tǒng)的低頻段增益難以做到更高的水平,擾動隔離度水平難以提高[1]。自抗擾控制(ADRC)具有經(jīng)典PID控制不依賴被控系統(tǒng)精確模型的優(yōu)點(diǎn),解決了經(jīng)典PID快速性與超調(diào)量之間的矛盾,具有較強(qiáng)的魯棒性,已得到了大量的研究和應(yīng)用[2,3]。
但是ADRC的參數(shù)較多,參數(shù)整定存在困難,能夠快速地整定ADRC的參數(shù),成為學(xué)者們的一個研究方向。目前,ADRC的參數(shù)整定方法已經(jīng)取得了一些研究成果,如經(jīng)驗(yàn)法、基于時間尺度的方法[4]、人工智能法[5-12]。而普通的經(jīng)驗(yàn)試湊法,對研究者的經(jīng)驗(yàn)依賴較大,難以獲取最優(yōu)參數(shù),不適用于大范圍推廣和應(yīng)用。人工智能算法占據(jù)了非線性ADRC參數(shù)整定的半壁江山[13],如神經(jīng)網(wǎng)絡(luò)[5],自適應(yīng)遺傳算法[6],粒子群算法[7-9](PSO)、人群搜索算法[10](SOA)、自適應(yīng)免疫算法[11],遺傳退火粒子群混合算法[12]等。
本文針對所提出的光電吊艙控制系統(tǒng),對其速度環(huán)采用PID和ADRC兩種方法進(jìn)行設(shè)計(jì),采用PSO和SOA對兩種方法參數(shù)尋優(yōu)。同時,在ADRC中,使用了兩種形式的誤差反饋控制率(FAL和FHAN),通過仿真比較,分析哪種誤差反饋控制率的控制性能最好。
光電吊艙控制系統(tǒng)的穩(wěn)定性實(shí)質(zhì)上是要保證光電吊艙在內(nèi)外擾動的情況下,控制各軸電機(jī)轉(zhuǎn)動來實(shí)時補(bǔ)償,減弱或消除干擾,保證傳感器視軸指向在慣性空間內(nèi)的穩(wěn)定。通常改善速度環(huán)的動態(tài)特性來提高控制系統(tǒng)的穩(wěn)定性,速度環(huán)如圖1所示。
圖1 速度環(huán)控制回路
在控制系統(tǒng)中,被控對象主要是直流力矩電機(jī)和負(fù)載,直流力矩電機(jī)和負(fù)載之間等效電路如圖2所示:
圖2 電機(jī)負(fù)載等效電路
根據(jù)基爾霍夫電壓原理,該電路動態(tài)電壓微分方程可表示為
(1)
電機(jī)的力矩平衡方程
(2)
電機(jī)電磁力矩
Md=CmIa
(3)
反電動勢
E=Ceω
(4)
式中,ω為電機(jī)軸上的角速度;J為電機(jī)軸上的總轉(zhuǎn)動慣量;Cm為電機(jī)轉(zhuǎn)矩系數(shù);Ce為電機(jī)的電動勢系數(shù)。電機(jī)傳遞函數(shù)框圖如圖3所示。
圖3 電機(jī)傳遞函數(shù)框圖
取電樞回路電磁時間常數(shù)Te=La/Ra,電機(jī)時間常數(shù)Tm=JRa/(CeCm),可得
(5)
上式可根據(jù)所選電機(jī)類型和負(fù)載轉(zhuǎn)矩求得,也可以通過系統(tǒng)掃頻,利用系統(tǒng)模型參數(shù)辨識的方法獲得較為貼合實(shí)際的傳遞函數(shù)。本文擬采用文獻(xiàn)[14]中的傳遞函數(shù)為控制對象,對控制方法開展研究和仿真
(6)
PID是典型的工業(yè)控制之一,PID的參數(shù)調(diào)整多依賴于經(jīng)驗(yàn),往往需要不斷調(diào)試才能得出,PID控制系統(tǒng)框圖如圖4所示。
圖4 PID控制系統(tǒng)框圖
PID控制器是一種線性控制器,它根據(jù)給定值v(t)與實(shí)際輸出y(t)構(gòu)成控制偏差
e(t)=v(t)-y(t)
(7)
PID通過比例、微分和積分的線性組合組成控制率
(8)
PID控制器只需要調(diào)節(jié)kp,ki,kd三個系數(shù),就可以產(chǎn)生較好的控制效果。相比于經(jīng)驗(yàn)法,采用智能算法可以獲得更優(yōu)的PID控制器參數(shù)。
韓京清研究員在研究出跟蹤微分器[15](TD)、非線性狀態(tài)誤差反饋控制律[16](NLSEF)以及擴(kuò)張狀態(tài)觀測器[17](ESO)三大工具后,于1998年正式提出了自抗擾控制[18]。光電吊艙控制系統(tǒng)微分方程可以寫為
(9)
(10)
二階自抗擾結(jié)構(gòu)框圖如圖5所示。
圖5 自抗擾結(jié)構(gòu)框圖
二階控制系統(tǒng)離散型自抗擾控制器算法可以表示為
TD
(11)
其中,u=fhan(x1,x2,r,h)為最速控制綜合函數(shù)
(12)
ESO
(13)
其中,非線性函數(shù)fal(x,a,δ)為
(14)
NLSEF有兩種形式,FAL形式
(15)
FHAN形式
(16)
在自抗擾控制參數(shù)中,TD:r,h,h0;ESO:h,β01,β02,β03,δ,b;NLSEF:β1,β2,α1,α2,δ1或c,r1,h1。自抗擾控制器部分參數(shù)可以根據(jù)經(jīng)驗(yàn)設(shè)定,實(shí)際需要確定和優(yōu)化的參數(shù)為5個:β01,β02,β03,β1,β2或β01,β02,β03,c,h1。但是將這五個調(diào)節(jié)好,使自抗擾控制器具有良好的抗擾性能,取得令人滿意的控制效果也存在一定的難度。
粒子群算法是美國社會心理學(xué)家James Kennedy和電氣工程師Russell Eberhart共同提出的[19]。該方法模擬鳥類捕食過程,算法如下:
假設(shè)在D維的搜索空間中,有N個粒子,第i個粒子的位置表示為一個D維的向量xi,第i個粒子的速度也是一個D維的向量vi,第i個粒子目前搜索到的最優(yōu)位置稱為個體極值Pbest(i),整個粒子群目前搜索到的最優(yōu)位置為全局極值gbest。
在找到個體極值和全局極值時,粒子根據(jù)帶有權(quán)重的公式來更新自己的速度和位置
(17)
式中,c1和c2是學(xué)習(xí)因子,r1和r2是[0,1]之間的隨機(jī)數(shù),w是權(quán)重因子。1998年,Shi等人提出了線性抵減權(quán)值策略[20],表示為
(18)
粒子群算法流程如下:
1)初始化粒子群,包括搜索空間維度D,粒子群規(guī)模N,加速常數(shù)c1和c2,隨機(jī)數(shù)r1和r2,最大慣性權(quán)重和最小慣性權(quán)重wmax和wmin。每個粒子的位置xi、速度vi和個體極值Pbest(i)、全局極值gbest;
2) 并計(jì)算每個粒子的適應(yīng)度值;
3) 對每個粒子,用它的適應(yīng)度值fit[i]和個體極值Pbest(i)比較。如果fit[i] 4) 對每個粒子,用它的適應(yīng)度值fit[i]和全局極值gbest比較。如果fit[i] 5) 迭代更新粒子的速度位置xi和速度vi; 6) 判斷算法終止條件是否滿足:若是,則結(jié)束算法并輸出優(yōu)化結(jié)果;否則,返回步驟2)。 人群搜索算法是一種新型群體智能算法,通過對人的隨機(jī)搜索行為進(jìn)行分析,利用人的利己行為、利他行為和預(yù)動行為,確定個體的搜索方向,從而尋找最優(yōu)解。 SOA根據(jù)不確定推理的行為部分可得步長 (19) 其中,uij為j維搜索空間目標(biāo)函數(shù)值i的隸屬度,αij為j維搜索空間的搜索步長,δij為高斯隸屬函數(shù)參數(shù),其值可由下式確定 (20) 其中,xmin和xmax分別是同一子群中的具有最小和最大函數(shù)值的位置,t和T分別為當(dāng)前迭代次數(shù)和最大迭代次數(shù)。 (21) 確定搜索方向和步長后,按照下式進(jìn)行位置更新 (22) 人群搜索算法流程如下: 1)t→0,初始化,在可行解域隨機(jī)產(chǎn)生s個初始位置; 2) 評價各組參數(shù)的位置,計(jì)算每個位置的適應(yīng)度值; 3) 計(jì)算每一個個體i在每一維j的搜索方向dij和步長αij; 4) 位置更新,按公式更新每個搜尋者的位置; 5)t→t+1,判斷是否滿足停止條件,若是,則結(jié)束算法并輸出優(yōu)化結(jié)果;否則,返回步驟2)。 一般采用時間乘絕對誤差積分(ITAE)作為適應(yīng)度函數(shù) (23) 為了防止控制能量過大,產(chǎn)生震蕩,加入控制器的輸出量的平方項(xiàng)和權(quán)值。為了防止超調(diào),加入超調(diào)量,發(fā)生超調(diào)時將以超調(diào)量作為最優(yōu)指標(biāo),組成 (24) e(t)為給定值與輸出量的偏差;Δe(t)為相鄰兩次步距輸出量之間的差值;c1和c2是權(quán)值。由于算法結(jié)構(gòu)的不同,經(jīng)過測試,在進(jìn)行PID參數(shù)尋優(yōu)時,取c1=0.9999,c2=0.0001。在進(jìn)行ADRC參數(shù)尋優(yōu)時,取c1=0.02,c2=0.98。 利用智能算法PSO和SOA,對PID和ADRC進(jìn)行參數(shù)優(yōu)化的原理如圖6和圖7所示。 圖6 PSO/SOA優(yōu)化PID原理圖 圖7 PSO/SOA優(yōu)化ADRC原理圖 采取PSO和SOA進(jìn)行參數(shù)優(yōu)化,對PID優(yōu)化3個參數(shù),對ADRC優(yōu)化5個參數(shù),共有六種形式:PSO-PID,SOA-PID,PSO-ADRC-FAL,SOA-ADRC-FAL,PSO-ADRC-FHAN,SOA-ADRC-FHAN。根據(jù)經(jīng)驗(yàn)確定參數(shù)模糊范圍。 在PID中,取仿真步長0.001,維數(shù)為3。在ADRC中,取仿真步長0.001,維數(shù)為5,r=5000,h0=6h,δ=h,b0=1。在ADRC-FAL中,α1=0.5,α2=1.5,δ1=8h;在ADRC-FHAN中,取r1=5000。 對于PSO,取N=100,最大迭代次數(shù)100,wmax=0.9,wmin=0.4,c1=c2=1.5。對于SOA,取S=100,最大迭代次數(shù)100。 通過MATLAB工具模擬優(yōu)化過程,得到PSO和SOA適應(yīng)值變化曲線,如圖8所示。 圖8 優(yōu)化尋優(yōu)歷程 從尋優(yōu)歷程中可以看出,在PID和ADRC參數(shù)優(yōu)化過程中,PSO比SOA收斂速度快。在優(yōu)化PID參數(shù)中,PSO的適應(yīng)度值較小,精度高于SOA。而在ADRC參數(shù)優(yōu)化中,PSO的適應(yīng)度值較大,精度低于SOA。 通過運(yùn)行程序,得到PID和ADRC參數(shù)的優(yōu)化值,如表1和表2所示。 表1 PID優(yōu)化參數(shù)值 表2 ADRC優(yōu)化參數(shù)值 5.3.1 階躍響應(yīng) 根據(jù)優(yōu)化的參數(shù),建立SIMULINK仿真圖??刂葡到y(tǒng)在載荷發(fā)生突變時,需要快速響應(yīng),以滿足光電吊艙的角速度和角加速度指標(biāo)。輸入信號是1rad/s的階躍信號,采樣時間為0.001s,仿真時間為1s,得到階躍響應(yīng)曲線和誤差曲線,如圖9所示。 圖9 階躍響應(yīng)曲線及誤差曲線 從圖9中可以看到,無論是PID還是ADRC,經(jīng)過PSO和SOA優(yōu)化之后,都可以快速地達(dá)到輸入值。從d)中可以看出,采用ADRC比PID響應(yīng)速度快,其中ADRC-FHAN響應(yīng)速度最快。從仿真圖中可以讀出系統(tǒng)階躍響應(yīng)的動態(tài)性能,如表3所示。 表3 階躍響應(yīng)動態(tài)性能 ADRC比PID具有更快的調(diào)節(jié)時間,差值最大約0.226s。PID和ADRC-FHAN都無超調(diào),ADRC-FAL最大有0.4%的超調(diào)。相比于文獻(xiàn)[14]的經(jīng)驗(yàn)法,系統(tǒng)超調(diào)量明顯降低,達(dá)到穩(wěn)定的時間更短。在穩(wěn)態(tài)誤差上,ADRC-FAL的誤差為0rad/s,完全達(dá)到給定值,PID的誤差為0.0021rad/s,ADRC-FHAN誤差分別為0.0039rad/s和0.0016rad/s。 5.3.2 正弦跟蹤響應(yīng) 除了階躍響應(yīng),還要考慮控制系統(tǒng)對給定信號的跟隨性能。將仿真系統(tǒng)輸入端改為幅值1 rad/s,頻率為1/(2π)Hz的正弦信號,系統(tǒng)響應(yīng)曲線及誤差曲線如圖10所示。 圖10 正弦跟蹤響應(yīng)曲線及誤差曲線 從圖10可以看出,ADRC跟蹤正弦曲線滯后約0.02s,相比于PID的0.05s更小,表明ARDC的跟蹤速度更快,精度更高。跟蹤誤差是正弦曲線,從幅值上來看,采用PID的跟蹤誤差為0.053rad/s,ADRC-FAL的跟蹤誤差為0.015rad/s,而ADRC-FHAN的跟蹤誤差可以達(dá)到0.00125rad/s,是PID跟蹤誤差的2.4%。相比于文獻(xiàn)[14]PID的0.2rad/s和ADRC的0.053rad/s,經(jīng)PSO和SOA優(yōu)化后的參數(shù)具有跟蹤性能好,穩(wěn)定性高的優(yōu)勢。 5.3.3 抗干擾能力 為了測試PID和ADRC控制器的擾動抑制能力,首先控制輸入端為0rad/s,保證視軸穩(wěn)定狀態(tài),在仿真模型中,按照圖1所示的位置,加入力矩擾動和速度擾動。力矩擾動為sin(2π)N·m,速度擾動為sin(2π)rad/s。力矩擾動殘余和角速度擾動殘余分別如圖11、圖12所示,擾動殘差幅值如表4所示。 表4 擾動殘差幅值 圖11 力矩擾動殘余 圖12 速度擾動殘余 從表4中可以看出,在力矩擾動下,ADRC-FHAN的擾動殘余是PID的0.37%,是ADRC-FAL的3.9%。在速度擾動下,ADRC-FHAN的擾動殘余約是PID和ADRC-FAL的1%,抗速度擾動效果顯著。結(jié)合擾動數(shù)據(jù)分析,ADRC-FHAN結(jié)構(gòu)的控制器抗擾是最有效的。 5.3.4 參數(shù)魯棒性仿真 為保證設(shè)計(jì)的控制器具有好的魯棒性,在參數(shù)變化時仍具有較好的擾動隔離效果。保持控制器的參數(shù)不變,將控制對象的總轉(zhuǎn)動慣量增大15%,保持0rad/s輸入,加入同樣的速度擾動。與初始速度擾動對比如圖13所示,幅值對比如表5所示。 表5 速度擾動殘差幅值對比 圖13 速度擾動殘余對比 從圖13和表5可以看出,在總轉(zhuǎn)動慣量增大15%時,各控制器速度擾動殘余都有小范圍的增大,其中ADRC-FHAN在數(shù)值上增大最小,波動仍保持在較小范圍內(nèi)。說明ADRC-FHAN控制器參數(shù)魯棒性較好,在控制參數(shù)不確定時仍具有良好的控制性能。 為提高光電吊艙的穩(wěn)定性,采用PID算法和ADRC算法,分別對光電吊艙控制系統(tǒng)的速度回路進(jìn)行控制。針對PID和ADRC參數(shù)整定困難的問題,采用粒子群算法和人群搜索算法分別對PID控制器和ADRC控制器的參數(shù)進(jìn)行優(yōu)化,其中ADRC采用了FAL和FHAN兩種形式的反饋控制率。通過仿真,驗(yàn)證了ADRC算法的可行性和有效性,為工程實(shí)踐提供一定的應(yīng)用價值,為研究系留氣球平臺光電吊艙的穩(wěn)定性提供一定的參考。結(jié)論如下: 1) PSO收斂速度比SOA快,在PID參數(shù)尋優(yōu)上,PSO精度高于SOA,但在ADRC參數(shù)尋優(yōu)上,PSO精度要低于SOA; 2)經(jīng)PSO和SOA參數(shù)優(yōu)化過的PID和ADRC控制器,都要比經(jīng)驗(yàn)法取值響應(yīng)更快,穩(wěn)態(tài)誤差更小; 3) ADRC在響應(yīng)速度,跟隨誤差,抵抗力矩干擾和抵抗速度干擾上,性能都要優(yōu)于PID; 4) ADRC的兩種反饋率都無超調(diào),ADRC-FHAN比ADRC-FAL響應(yīng)速度快,抗干擾能力更強(qiáng),魯棒性好,但存在較小的穩(wěn)態(tài)誤差; 5) 綜合來看,采用SOA參數(shù)優(yōu)化的ADRC-FHAN自抗擾控制器具有良好的控制性能,響應(yīng)速度快,誤差小,抗擾擾能力強(qiáng),魯棒性好。4.2 人群搜索算法
4.3 適應(yīng)度函數(shù)選取
5 仿真結(jié)果與分析
5.1 參數(shù)初始化設(shè)置
5.2 尋優(yōu)歷程
5.3 系統(tǒng)仿真和結(jié)果分析
6 結(jié)論