賈 桐,李秀智,張祥銀
(北京工業(yè)大學(xué)信息學(xué)部,北京 100124;北京工業(yè)大學(xué)數(shù)字社區(qū)教育部工程研究中心,北京 100124)
在地面機器人和無人機等智能體上,慣性穩(wěn)定平臺通過伺服控制可以有效的隔離載體的運動干擾,保證傳感器工作在期望的姿態(tài),例如對于相機獲取穩(wěn)定的成像非常有效,因此慣性穩(wěn)定平臺在安防巡檢、地形勘探、大型建筑物測繪等領(lǐng)域應(yīng)用十分廣泛[1],而且對慣性穩(wěn)定平臺控制性能的要求也越來越高.
影響控制系統(tǒng)性能因素為零件的加工誤差與安裝誤差、框架的質(zhì)量不平衡與接觸面間的非線性摩擦力、慣性測量裝置的系統(tǒng)誤差與載體擾動[2].針對上述影響,提升加工精度、改進機械結(jié)構(gòu)、更換高精度慣性測量裝置可以使系統(tǒng)性能提升,但不能從根本解決問題,通過設(shè)計合適的控制器可以有效的提升系統(tǒng)性能[3].在實際的應(yīng)用中比例-積分-微分(proportion integral differential,PID)控制占據(jù)了90%以上,但PID控制是基于誤差來消除誤差的控制策略[4],不易滿足高性能的動態(tài)跟蹤要求.有很多學(xué)者嘗試在控制方法上做出創(chuàng)新[5].比如,文獻(xiàn)[6]提出一種基于角加速度擾動觀測器的控制方法,通過雙環(huán)的策略增強了系統(tǒng)的抗干擾性,較好的提升了控制精度和穩(wěn)定性;文獻(xiàn)[7]提出了一種基于快速跟蹤微分器的多輸入多輸出(multi input multi output,MIMO)模糊滑??刂品椒?提升了慣性穩(wěn)定平臺在目標(biāo)跟蹤狀態(tài)下的穩(wěn)定精度,但模糊控制難以通過理論驗證系統(tǒng)的穩(wěn)定性;文獻(xiàn)[8]為了提升慣性穩(wěn)定平臺的干擾隔離性能,提出一種帶有擴張觀測器的超扭曲滑??刂破?實現(xiàn)了慣性穩(wěn)定平臺的穩(wěn)定控制.
針對參數(shù)不確定的控制系統(tǒng)優(yōu)化問題,Kokotovic與Kanellakopoulos等人在1991年提出反演設(shè)計法.經(jīng)過近30年的發(fā)展,反演控制在不確定的非線性系統(tǒng)控制中有著明顯的優(yōu)越性[9].反演設(shè)計法是一種遞歸設(shè)計方法,將復(fù)雜的非線性系統(tǒng)分解成多個子系統(tǒng),逐步回退使閉環(huán)系統(tǒng)達(dá)到期望的性能.大量的實驗證明,將反演控制方法與滑模變結(jié)構(gòu)控制[10]、模糊控制[11]、自抗擾控制[12]相結(jié)合,使被控對象具有更快的響應(yīng)速度、更強的魯棒性以及更低的動態(tài)誤差.
近些年來,隨著對神經(jīng)網(wǎng)絡(luò)理論不斷深入的研究,神經(jīng)網(wǎng)絡(luò)已經(jīng)成功解決了多種現(xiàn)代計算機難以解算的問題,表現(xiàn)了其優(yōu)越的性能[13].將控制理論與神經(jīng)網(wǎng)絡(luò)相結(jié)合的智能控制方法已經(jīng)成為控制領(lǐng)域一個新的分支,推進了非線性系統(tǒng)與不確定系統(tǒng)的發(fā)展.基于此,采用徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)作為擾動補償器,將滑模變結(jié)構(gòu)控制與神經(jīng)網(wǎng)絡(luò)控制的優(yōu)點相結(jié)合,削弱了滑??刂坡奢敵龆墩竦膯栴},使得系統(tǒng)具備更加優(yōu)越的動態(tài)性能.
本文結(jié)合了滑??刂频膭討B(tài)性能好、抗干擾性強和RBF神經(jīng)網(wǎng)絡(luò)的非線性逼近能力、實時性高的優(yōu)點,以及反步法的回退解耦特性,設(shè)計了一種神經(jīng)網(wǎng)絡(luò)反演滑??刂破?用于提升車載慣性穩(wěn)定平臺的各項系統(tǒng)性能,同時針對建模過程中參數(shù)的不確定設(shè)計了前向增穩(wěn)通道.其中滑模控制用于克服載體擾動,反步法的應(yīng)用可以對系統(tǒng)進行解耦控制,而RBF神經(jīng)網(wǎng)絡(luò)可以實時的估計與補償框架間接觸面的非線性摩擦力與系統(tǒng)耦合造成的擾動.
本文研究所采用的慣性穩(wěn)定平臺為三軸三框架,如圖1所示.由外到內(nèi)依次是航向框架Y、橫滾框架R、俯仰框架P,將相機以及其他傳感器安裝在俯仰框架的負(fù)載平臺上.各個框架均由直流無刷電機獨立驅(qū)動,通過調(diào)節(jié)框架間的夾角實現(xiàn)慣性穩(wěn)定平臺的伺服控制和姿態(tài)穩(wěn)定控制.
假設(shè)1零件的安裝誤差與加工誤差忽略不計,即俯仰框架、橫滾框架和航向框架軸心交于一點.
假設(shè)2慣性穩(wěn)定平臺所有零部件均為剛體.
圖1 車載慣性穩(wěn)定平臺模型Fig.1 Model of vehicle inertial stabilization platform
為了準(zhǔn)確描述慣性穩(wěn)定平臺的動態(tài)響應(yīng),采用Stribeck模型[14]描述慣性穩(wěn)定平臺的動摩擦與靜摩擦.根據(jù)該模型,摩擦力隨運動速度的增加而減小.
根據(jù)歐拉方程建立慣性穩(wěn)定平臺的動力學(xué)模型:
其中:ε為角加速度,ω為角速度,T為作用力對剛體的矩,JC為轉(zhuǎn)動慣量,通過調(diào)整力臂后,認(rèn)為各框架的轉(zhuǎn)動慣量為對角陣.
慣性測量裝置位于俯仰框架,則其測量數(shù)值ωg與俯仰框架角速度ωP相同,通過坐標(biāo)轉(zhuǎn)換關(guān)系將其他框架角速度轉(zhuǎn)換為ωP,轉(zhuǎn)換后的方程被控量的二次項過多,不利于控制器的設(shè)計與仿真測試.
圖2 坐標(biāo)轉(zhuǎn)換關(guān)系Fig.2 Coordinate transformation relationship
引理1類似平衡點線性化的處理,可以忽略二次項[15],將動力學(xué)方程表現(xiàn)為
其中:TPM,TRM,TYM為電機作用于框架的轉(zhuǎn)矩;TPD,TRD,TYD為未知擾動,包括摩擦力在內(nèi).
通過式(5)-(7),將動力學(xué)模型表示為矩陣方程形式
式(9)表現(xiàn)為狀態(tài)空間方程為
其中:δ為框架接觸面間的摩擦力,dt為未知外部擾動,
θg,ωg為慣性測量裝置的角度、角速度.
慣性穩(wěn)定平臺的具有姿態(tài)伺服和姿態(tài)鎖定兩種工作模式,分別用于搜索與跟蹤目標(biāo)、隔離車體與負(fù)載平臺的振動.框架耦合使系統(tǒng)無法建立精確的數(shù)學(xué)模型,同時非線性摩擦與外部擾動無法準(zhǔn)確估計,由此可見該系統(tǒng)為MIMO非線性系統(tǒng).針對慣性穩(wěn)定平臺框架間的耦合,本文選用反演法對其解耦控制,反演控制可將復(fù)雜的非線性系統(tǒng)轉(zhuǎn)化為多個子系統(tǒng),分別為每個子系統(tǒng)設(shè)計虛擬控制量與Lyapunov函數(shù)使系統(tǒng)達(dá)到期望的靜態(tài)、動態(tài)性能.針對外部擾動與接觸面摩擦力無法準(zhǔn)確估計,在反演控制中引入滑模面使系統(tǒng)具備一定的抗干擾性.可知摩擦力與角速度呈非線性相關(guān),為估計非線性摩擦力與系統(tǒng)內(nèi)部框架耦合,選用神經(jīng)網(wǎng)絡(luò)作為估計器,其具有優(yōu)秀的非線性逼近能力,為滿足控制系統(tǒng)的實時性選用RBF神經(jīng)網(wǎng)絡(luò).由于無法建立精確的數(shù)學(xué)模型,同時神經(jīng)網(wǎng)絡(luò)存在逼近誤差,設(shè)計前向增穩(wěn)通道加強系統(tǒng)魯棒性.基于此,本文設(shè)計了基于RBF神經(jīng)網(wǎng)絡(luò)的反演滑??刂破?neural network backstepping sliding mode controller,NNBSMC),使慣性穩(wěn)定平臺具備優(yōu)秀的靜態(tài)、動態(tài)性能,控制器原理如圖3所示.
假設(shè)期望姿態(tài)信號為xd=[xdxxdyxdz]T.定義跟蹤角度誤差
其中:x1為穩(wěn)定平臺的慣性角度,x2為穩(wěn)定平臺的慣性角速度.
根據(jù)反演控制方法設(shè)計Lyapunov函數(shù):
圖3 NNBSMC控制流程圖Fig.3 NNBSMC control structure
單一的反演控制無法保證魯棒性,為克服干擾增強系統(tǒng)魯棒性引入滑模面.考慮反演解耦控制中虛擬控制量的設(shè)計,結(jié)合滑模變結(jié)構(gòu)控制,定義滑模面為
其中Φ,Ψ為3×3對角矩陣
基于滑模的抗干擾控制是優(yōu)劣并存的,雖然擁有極佳的動態(tài)性能,但系統(tǒng)輸出存在抖振現(xiàn)象.同時控制律式(24)中摩擦力δ未知,并且系統(tǒng)具有耦合性,難以建立數(shù)值精準(zhǔn)的模型,可知摩擦力與角速度呈非線性關(guān)系,系統(tǒng)輸出換向時會增強抖振現(xiàn)象.因此,優(yōu)化系統(tǒng)性能的重要問題就是消除或減弱抖振.神經(jīng)網(wǎng)絡(luò)擁有優(yōu)秀的非線性逼近性能[16]、環(huán)境適應(yīng)性能,采用神經(jīng)網(wǎng)絡(luò)作為擾動估計器,與滑??垢蓴_控制器結(jié)合以減弱抖振現(xiàn)象.
常用于非線性映射的神經(jīng)網(wǎng)絡(luò)有反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò).兩種網(wǎng)絡(luò)的學(xué)習(xí)過程相似,主要區(qū)別為使用不同的作用函數(shù).BP網(wǎng)絡(luò)是一種全局逼近網(wǎng)絡(luò),作用函數(shù)為Sigmoid函數(shù).RBF網(wǎng)絡(luò)隱含層到輸出層是線性的,因此非線性逼近能力不如BP網(wǎng)絡(luò).由于BP網(wǎng)絡(luò)具有雙層權(quán)值,收斂速度慢,容易陷入局部最優(yōu),難以滿足實時性要求.RBF網(wǎng)絡(luò)是一種局部逼近網(wǎng)絡(luò),作用函數(shù)為高斯函數(shù),采用其可獲得更快的學(xué)習(xí)速度同時避免陷入局部最優(yōu),更易滿足實時性要求.
本方法采用3-7-3的RBF網(wǎng)絡(luò)結(jié)構(gòu)建立了一種自適應(yīng)律逼近非線性摩擦力δ,RBF網(wǎng)絡(luò)算法為
建模過程中,由于零件的加工誤差、安裝誤差、框架的耦合轉(zhuǎn)動慣量難以精確測量,而控制律式(29)需要A與dt的準(zhǔn)確數(shù)值,為增加系統(tǒng)的穩(wěn)定性,可將狀態(tài)空間方程式(10)轉(zhuǎn)化為具有不確定性的狀態(tài)空間方程:
其中:Λ為切換面厚度,i=1,2,3.
如果神經(jīng)網(wǎng)絡(luò)權(quán)值按照式(35)更新,可以保證閉環(huán)系統(tǒng)穩(wěn)定,并且系統(tǒng)動態(tài)誤差收斂為零.
為了驗證所設(shè)計控制器的有效性,通過仿真實驗對NNBSMC的性能進行測試.在考慮內(nèi)外干擾的條件下,分別將實驗結(jié)果雙環(huán)PID、滑??刂?sliding mode control,SMC)[18]、反演滑??刂?backstepping sliding mode control,BSMC)[19]和NNBSMC這4種控制方法作對比.基于NNBSMC的控制參數(shù)設(shè)置如表1所示.
表1 慣性穩(wěn)定平臺物理參數(shù)表Table 1 Physical parameters of ISP
表中τ為無刷電機的機電時間常數(shù).
為了量化實驗對比結(jié)果,引入絕對值積分誤差(integral absolute error,IAE)和平方積分誤差(integral square error,ISE):
其中誤差e(t)的單位為rad.
實驗中的期望軌跡xd與外部干擾dt如下:
其中3個自由度的期望角度xd與外部擾動dt數(shù)值相同.
在Intel i7-4720 HQ處理器的環(huán)境下,對同樣3-7-3結(jié)構(gòu)的RBF網(wǎng)絡(luò)估計器與BP網(wǎng)絡(luò)估計器進行了在線訓(xùn)練,結(jié)果如圖4-5所示.
圖4 RBF神經(jīng)網(wǎng)絡(luò)補償值Fig.4 RBF neural network compensate
圖5 BP神經(jīng)網(wǎng)絡(luò)補償值Fig.5 BP neural network compensate
圖6 跟蹤誤差對比結(jié)果Fig.6 Tracking error comparison results
不難看出RBF網(wǎng)絡(luò)的逼近誤差小于BP網(wǎng)絡(luò)的逼近誤差,同時RBF網(wǎng)絡(luò)估計器單次訓(xùn)練與估計的時間為65μs,而BP 網(wǎng)絡(luò)為59 ms,在精度與運算速度上RBF網(wǎng)絡(luò)估計器都更勝一籌,因此本文選用RBF網(wǎng)絡(luò)作為NNBSMC控制器的擾動估計器.
圖7 電機輸出扭矩對比結(jié)果Fig.7 Motor torque comparison results
圖8 負(fù)載平臺姿態(tài)對比結(jié)果Fig.8 Attitude comparison results of load platform
根據(jù)實驗數(shù)據(jù),分析跟蹤誤差如表2-3所示.
表2 IAE對比結(jié)果Table 2 Comparison results of IAE
表3 ISE對比結(jié)果Table 3 Comparison results of ISE
圖9 負(fù)載平臺角速度對比結(jié)果Fig.9 Comparison results of angular velocity of load platform
從圖6-9和表2-3可以看出,滑??刂频娘柡晚棇?dǎo)致系統(tǒng)輸出抖振,同時在高頻擾動下系統(tǒng)輸出換向,接觸面之間的摩擦力也會增強系統(tǒng)輸出抖振,采用RBF神經(jīng)網(wǎng)絡(luò)對接觸面之間的摩擦力與系統(tǒng)耦合進行估計與補償是可以有效降低系統(tǒng)輸出抖振的.由于最內(nèi)側(cè)的俯仰框架只受摩擦力,而橫滾框架和航向框架還會受到耦合轉(zhuǎn)矩,故RBFNN擾動估計器是有效的.
通過姿態(tài)鎖定實驗,驗證慣性穩(wěn)定平臺在車輛通過溝壑或減速帶時的穩(wěn)定性,期望姿態(tài)與車體加速度擾動如下:
根據(jù)實驗數(shù)據(jù),分析跟蹤誤差如表4-5所示.
表4 IAE對比結(jié)果Table 4 Comparison results of IAE
表5 ISE對比結(jié)果Table 5 Comparison results of ISE
從圖10-12和表4-5可以看出,當(dāng)慣性穩(wěn)定平臺只受到外部擾動時,雙閉環(huán)PID有著較為良好的抗干擾能力,但其在姿態(tài)控制中動態(tài)誤差較大;由于接觸面摩擦力的存在,SMC和BSMC表現(xiàn)出較強的抖振;而NNBSMC則有較好的抗干擾能力.
圖10 車體姿態(tài)Fig.10 Attitude of velocity
圖11 負(fù)載平臺角速度對比結(jié)果Fig.11 Comparison results of angular velocity of load platform
圖12 誤差對比結(jié)果Fig.12 Error comparison results
在兩項實驗中可以看出,基于NNBSMC的慣性穩(wěn)定平臺控制系統(tǒng)的動態(tài)誤差更小,收斂速度更快,系統(tǒng)輸出更加平滑,具有更好的魯棒性.同時,仿真實驗也表現(xiàn)出,針對系統(tǒng)參數(shù)不確定復(fù)雜的非線性系統(tǒng),NNBSMC算法具有更好的適應(yīng)性.
本文針對不確定擾動下的車載慣性穩(wěn)定平臺伺服控制問題設(shè)計了神經(jīng)網(wǎng)絡(luò)反演滑??刂破?NNBSMC),該方法使用反演法對系統(tǒng)解耦,并引入滑模面增加系統(tǒng)的魯棒性與抗干擾性,同時RBF神經(jīng)網(wǎng)絡(luò)作為擾動估計器實時估計與補償接觸面的非線性摩擦力與系統(tǒng)耦合,針對系統(tǒng)建模過程中參數(shù)的不確定性加入前向增穩(wěn)通道,最后應(yīng)用Lyapunov方法從理論上分析了系統(tǒng)的穩(wěn)定性.實驗結(jié)果表明,在不確定的擾動情況下,慣性穩(wěn)定平臺采用本文提出的控制算法具有較強的魯棒性能,系統(tǒng)動態(tài)誤差更小,有更好的抗干擾能力.下一步工作將使用優(yōu)化算法對控制器參數(shù)進行優(yōu)化,并探索替代飽和函數(shù)的方法,以消除或減弱系統(tǒng)輸出的抖振,以獲取更佳的控制效果.