劉麗麗 左繼紅 吳 軍
(1.中南大學(xué)信息科學(xué)與工程學(xué)院 長(zhǎng)沙 410083)(2.湖南鐵道職業(yè)技術(shù)學(xué)院 株洲 412001)(3.長(zhǎng)沙理工大學(xué)電氣與信息工程學(xué)院 長(zhǎng)沙 410083)
基于RBF-ARX模型四旋翼飛行器的LQR控制方法*
劉麗麗1,2左繼紅1,2吳 軍1,3
(1.中南大學(xué)信息科學(xué)與工程學(xué)院 長(zhǎng)沙 410083)(2.湖南鐵道職業(yè)技術(shù)學(xué)院 株洲 412001)(3.長(zhǎng)沙理工大學(xué)電氣與信息工程學(xué)院 長(zhǎng)沙 410083)
針對(duì)四旋翼欠驅(qū)動(dòng)系統(tǒng)飛行過(guò)程中具有的非線性和強(qiáng)耦合性,提出了基于RBF-ARX模型四旋翼飛行器的LQR控制器設(shè)計(jì)方法。該法首先根據(jù)四旋翼飛行器的動(dòng)力學(xué)特性構(gòu)建四旋翼飛行器RBF-ARX的模型結(jié)構(gòu),并采用離線非線性參數(shù)優(yōu)化方法辨識(shí)模型參數(shù),獲取滿足工程精度需要的四旋翼非線性動(dòng)態(tài)模型。然后,基于該模型設(shè)計(jì)了具有狀態(tài)反饋的四旋翼飛行器的LQR控制器,并通過(guò)求解工作點(diǎn)的Riccati方程,獲得狀態(tài)反饋矩陣。最后通過(guò)仿真和實(shí)時(shí)控制結(jié)果驗(yàn)證了該方法的有效性和可行性。
四旋翼飛行器; 非線性; 姿態(tài)控制; 狀態(tài)反饋; 實(shí)時(shí)控制
四旋翼飛行器的起飛和巡航是由四個(gè)螺旋槳配合完成的,通過(guò)改變各旋翼轉(zhuǎn)速,就能控制飛行姿態(tài),具有結(jié)構(gòu)簡(jiǎn)單、操縱方便以及靈活機(jī)動(dòng)等優(yōu)點(diǎn),通常被設(shè)計(jì)成無(wú)人駕駛的微型飛行器。廣泛用于野外航拍或飛行偵查等軍事領(lǐng)域,也用于建筑物內(nèi)的導(dǎo)航與勘測(cè)等商業(yè)和民用領(lǐng)域。
實(shí)際應(yīng)用中,四旋翼飛行器是一個(gè)多輸入多輸出的復(fù)雜非線性系統(tǒng)。目前絕大多數(shù)的研究,主要集中在非線性控制器的設(shè)計(jì)方面。文獻(xiàn)[1]采用PID控制策略和LQ控制策略實(shí)現(xiàn)四旋翼飛行器的控制[1]。文獻(xiàn)[2]提出了具有指數(shù)收斂特性的PD2反饋結(jié)構(gòu)來(lái)補(bǔ)償飛行過(guò)程中的螺旋力矩[2]。文獻(xiàn)[3]提出了一種將魯棒非線性PI控制策略和backstepping技術(shù)相結(jié)合的方法[3],實(shí)現(xiàn)飛行器姿態(tài)控制。針對(duì)四旋翼飛行器的耦合問(wèn)題,文獻(xiàn)[4]提出了一種動(dòng)態(tài)逆策略[4]。為克服模型精確性和大風(fēng)干擾對(duì)飛行器飛行姿態(tài)的影響,一些文獻(xiàn)討論了基于神經(jīng)網(wǎng)絡(luò)的控制器設(shè)計(jì)方法[5~8]。
然而,這些方法大多基于系統(tǒng)物理模型進(jìn)行設(shè)計(jì)的,但四旋翼在飛行過(guò)程中,不僅受到重力、空氣動(dòng)力和陀螺效應(yīng)等多種物理效應(yīng)作用外,還受制于氣流等外部環(huán)境干擾[9~10],飛行器的精確物理參數(shù)無(wú)法得到,難以建立準(zhǔn)確的物理模型,而模型的不精確又會(huì)給控制效果帶來(lái)不利的影響。使得傳統(tǒng)的基于物理模型的四旋翼姿態(tài)控制設(shè)計(jì)方法在實(shí)際應(yīng)用時(shí)具有局限性。為了更好地描述四旋翼飛行器的非線性動(dòng)態(tài)特性,可采用RBF-ARX模型的非線性建模方法。RBF-ARX模型是高斯徑向基函數(shù)網(wǎng)絡(luò)(RBF)和線性ARX(AutoRegressive model with exogenous variable)模型結(jié)構(gòu)相結(jié)合的復(fù)合結(jié)構(gòu),是一種離線辨識(shí)的全局模型,兼具RBF網(wǎng)絡(luò)對(duì)非線性函數(shù)逼近精度高、學(xué)習(xí)速度快和ARX模型結(jié)構(gòu)簡(jiǎn)單、應(yīng)用方便的優(yōu)點(diǎn),比較適合復(fù)雜非線性系統(tǒng)的控制問(wèn)題,而LQR(linear-quadratic regulator)控制器是一種結(jié)構(gòu)簡(jiǎn)單、易于實(shí)現(xiàn)的基于模型的控制器。
為此,提出了一種基于RBF-ARX模型的自適應(yīng)LQR控制方案。采用結(jié)構(gòu)化非線性參數(shù)優(yōu)化方法辨識(shí)模型參數(shù),得到滿足工程精度要求的四旋翼非線性動(dòng)態(tài)RBF-ARX模型。基于該模型通過(guò)求解工作點(diǎn)的Riccati方程,得到該區(qū)間內(nèi)狀態(tài)反饋矩陣,設(shè)計(jì)了具有狀態(tài)反饋的LQR控制器,最終使得飛行器在其整個(gè)狀態(tài)空間內(nèi)良好運(yùn)行。
本文以四旋翼飛行器實(shí)驗(yàn)平臺(tái)作為研究對(duì)象,型號(hào)是固高GHP3001,如圖1所示,采用GT-400-SV運(yùn)動(dòng)控制器,電機(jī)采24V5000RPM永磁直流電機(jī),該物理平臺(tái)可以用來(lái)檢驗(yàn)各種建模方法和控制算法在四旋翼飛行器中的應(yīng)用。為保障飛行器運(yùn)行過(guò)程中無(wú)損,固定了飛行器的三個(gè)自由度。其飛行動(dòng)力由4個(gè)獨(dú)立直流電機(jī)帶動(dòng)的相應(yīng)旋翼提供,控制電機(jī)電壓可改變旋翼轉(zhuǎn)速,4個(gè)旋翼中有3個(gè)是水平放置的,它們決定飛行器的俯仰角pitch(繞Y軸旋轉(zhuǎn))和翻轉(zhuǎn)角roll(繞X軸旋轉(zhuǎn))輸出,這兩個(gè)輸出角范圍為-150~150(rad),還有一個(gè)豎直安裝,用來(lái)控制飛行器的巡航角yaw(繞Z軸旋轉(zhuǎn)),該輸出可以為任意角。該系統(tǒng)是一個(gè)具有4輸入3輸出的非線性耦合系統(tǒng)。對(duì)于飛行器來(lái)說(shuō)基本的姿態(tài)控制包括飛行器的前進(jìn)后退和左右平移。
3.1 RBF-ARX模型結(jié)構(gòu)
Deng等提出了一個(gè)離散時(shí)間線性時(shí)不變模型來(lái)逼近飛行器的連續(xù)時(shí)間非線性的動(dòng)態(tài)模型[11],基于這個(gè)辨識(shí)模型設(shè)計(jì)了輸出狀態(tài)反饋控制器,本文嘗試用多個(gè)線性ARX模型來(lái)描述四旋翼飛行器的全局非線性模型,期望得到比物理模型更好的精度。對(duì)于多輸入多輸出的非線性系統(tǒng),可將非線性區(qū)劃分若干局部線性區(qū),局部線性區(qū)可采用式(1)的ARX模型來(lái)描述:
Y(t)=f(Y(t-1),…,Y(t-ka),U(t-1),…,
U(t-kb),V(t-1),…,V(t-kc))+ε(t)
(1)
其中:Y(t)∈Rn為輸出,U(t)∈Rm為輸入,ε(t)∈Rn為白噪聲序列,定義變量:
X(t-1)= [Y(t-1),…,Y(t-ka),U(t-1),…,
U(t-kb),V(t-1),…,V(t-kc)]T
(2)
模型(1)可寫(xiě)成:
Y(t)=f(X(t-1))+ε(t)
(3)
模型(3)可以看成是一個(gè)具有函數(shù)系數(shù)的ARX模型,可看出,模型(3)的依存于狀態(tài)的函數(shù)系數(shù)問(wèn)題實(shí)際上是一個(gè)函數(shù)逼近問(wèn)題,即將多維輸入空間X轉(zhuǎn)換成一維的向量空間wi=πi(X)??刹捎蒙窠?jīng)(RBF)網(wǎng)絡(luò)逼近非線性矢量函數(shù)的方法,RBF網(wǎng)絡(luò)描述非線性系統(tǒng)動(dòng)態(tài)特性效果優(yōu)良。對(duì)于多變量的四旋翼飛行器的RBF-ARX模型描述如下:
(4)
(5)
(6)
確定一組合適的狀態(tài)矢量,可將式(6)轉(zhuǎn)換成狀態(tài)空間模型,定義狀態(tài)變量如下:
確定式(6)中的w(t)后,其對(duì)應(yīng)的局部線性狀態(tài)空間模型方程為
(7)
其中:
χ=[1 0 … 0]1×(n+1)
3.2 系統(tǒng)模型的辨識(shí)和結(jié)果分析
為了驗(yàn)證RBF-ARX模型的有效性,采樣四旋翼飛行器在基于物理模型LQR控制的實(shí)時(shí)運(yùn)行的全局?jǐn)?shù)據(jù)來(lái)辨識(shí)和測(cè)試模型。四旋翼飛行器RBF-ARX模型的階次可利用比較AIC值的方法來(lái)選取。針對(duì)研究本體,AIC計(jì)算方法為[12]
(8)
圖2 俯仰角實(shí)際輸出與模型輸出結(jié)果
圖2~圖4所示為四旋翼飛行器采用RBF-ARX模型后對(duì)測(cè)試數(shù)據(jù)的建模結(jié)果。圖2中,y1(t)、ym1(t)分別為飛行器俯仰角實(shí)際輸出和模型輸出,error1代表俯仰角實(shí)際和期望輸出的誤差,單位是rad,histogram1代表應(yīng)殘差直方圖反映誤差的分布情況。同理,圖3和圖4分別代表翻轉(zhuǎn)角和巡航角模型輸出精度,顯然,RBF-ARX模型下系統(tǒng)實(shí)際輸出能很好的跟隨期望輸出,誤差波動(dòng)范圍小且成高斯?fàn)罘植?表明模型比較理想,建模精度優(yōu)良,能很好地描述飛行器系統(tǒng)的全局非線性動(dòng)態(tài)特性。
圖3 翻轉(zhuǎn)角實(shí)際輸出與模型輸出結(jié)果
圖4 巡航角實(shí)際輸出與模型輸出結(jié)果
4.1 基于RBF-ARX模型的LQR控制策略
根據(jù)圖5局部線性狀態(tài)空間LQR控制器的設(shè)計(jì)思路,利用多變量RBF-ARX模型可以方便地在任意工作點(diǎn)處局部線性化的優(yōu)點(diǎn),采用基于局部線性ARX模型設(shè)計(jì)LQR控制器的方法,設(shè)計(jì)出了基于局部線性狀態(tài)空間模型的無(wú)限時(shí)間狀態(tài)調(diào)節(jié)器。
圖5 基于RBF-ARX模型LQR控制器結(jié)構(gòu)圖
由于多變量RBF-ARX模型是一個(gè)時(shí)變?nèi)址蔷€性模型,所以,基于多變量RBF-ARX模型的全局LQR控制器,實(shí)際上是一種基于局部線性化模型的無(wú)限時(shí)域預(yù)測(cè)控制器。引入最優(yōu)控制的性能指標(biāo)作為目標(biāo)函數(shù),即設(shè)計(jì)一個(gè)輸入量ΔU(k),使得
(9)
為最小,其中Q>0,R>0分別為對(duì)狀態(tài)變量和輸入變量的加權(quán)矩陣,表示目標(biāo)函數(shù)中動(dòng)態(tài)偏差和控制作用的相對(duì)重要性。相對(duì)較大的權(quán),意味著對(duì)目標(biāo)函數(shù)中對(duì)應(yīng)項(xiàng)的較大限制。據(jù)實(shí)際要求為實(shí)現(xiàn)對(duì)系統(tǒng)的最佳控制,需在輸出控制輸出間找尋一個(gè)最優(yōu)平衡點(diǎn)。使得如上性能指標(biāo)最小化,可由Riccati方程在某個(gè)工作點(diǎn)求解P:
-pA-ATp+pBR-1BTp-Q=0
(10)
得到對(duì)稱定常矩陣P,進(jìn)而得到該工作點(diǎn)處的狀態(tài)反饋增益矩陣:
K=R-1BTA-T(P-Q)
(11)
最后得到在該工作點(diǎn)處的狀態(tài)反饋?zhàn)顑?yōu)控制律
(12)
4.2 基于RBF-ARX模型LQR實(shí)時(shí)控制結(jié)果
通過(guò)RBF-ARX模型的辨識(shí)及仿真結(jié)果已經(jīng)看出其卓越的建模精度,基于RBF-ARX模型的全局LQR控制策略不僅在局部工作區(qū)間控制精確,在全局工作區(qū)間具有很強(qiáng)的自適應(yīng)性,因?yàn)榛赗BF-ARX模型的全局LQR控制策略可看成是由多個(gè)局部線性模型和多個(gè)局部LQR控制器組成,在相鄰兩個(gè)釆樣點(diǎn)處控制器的控制率的變化具有平滑連續(xù)性。通過(guò)實(shí)時(shí)控制實(shí)驗(yàn)進(jìn)一步說(shuō)明該方法的優(yōu)越性。圖5~圖6為基于RBF-ARX模型的LQR控制器的實(shí)時(shí)控制結(jié)果,為進(jìn)一步證明該模型的優(yōu)越性,將基于ARX模型的LQR控制器的實(shí)時(shí)控制結(jié)果(圖8所示)進(jìn)行對(duì)比。
圖6和圖7分別是四旋翼飛行器基于RBF-ARX模型的實(shí)時(shí)控制輸出和輸入曲線,圖6中括號(hào)內(nèi)的三個(gè)值分別是俯仰角、翻轉(zhuǎn)角和巡航角的控制目標(biāo)值,箭頭指定控制目標(biāo)的時(shí)間區(qū)間,實(shí)線是俯仰角(PITCH)變化曲線,虛線是翻轉(zhuǎn)角(ROLL)變化曲線,點(diǎn)線是巡航角(YAW)變化曲線。
圖6 基于RBF-ARX模型的實(shí)時(shí)控制輸出曲線
圖7 基于RBF-ARX模型的實(shí)時(shí)控制輸入曲線
圖8 基于ARX模型LQR實(shí)時(shí)控制輸出結(jié)果
圖6中四旋翼首先處于水平懸停姿態(tài),即:俯仰角(p)、翻轉(zhuǎn)角(r)和巡航角(y)分別為22、20和0;在10s處,控制俯仰角由初始值22變?yōu)?2,保持翻轉(zhuǎn)角和巡航角不變;在40s處,控制翻轉(zhuǎn)角由初始值20變?yōu)?0,保持俯仰角和巡航角不變;在70s處,控制巡航角由初始值0變?yōu)?0,保持俯仰角和翻轉(zhuǎn)角不變;根據(jù)控制目標(biāo)依次分別改變?nèi)齻€(gè)輸出角,維持一段時(shí)間后,控制四旋翼飛行器達(dá)到另一目標(biāo)飛行姿態(tài),并保持一段時(shí)間,最終使四旋翼飛行器回到初始水平懸停狀態(tài)。圖6曲線顯示,初始懸停狀態(tài)就很穩(wěn)定,沒(méi)有抖動(dòng)和超調(diào),當(dāng)輸出姿態(tài)角按照控制目標(biāo)分別變化時(shí),動(dòng)態(tài)過(guò)程響應(yīng)迅速,并且?guī)缀鯖](méi)有超調(diào),穩(wěn)定后輸出非常平穩(wěn),基本沒(méi)有震蕩和超調(diào)。
為進(jìn)一步證明RBF-ARX模型的優(yōu)越性,對(duì)比圖8所示的基于ARX模型的LQR控制器的實(shí)時(shí)控制結(jié)果,可看出該模型下盡管穩(wěn)態(tài)振蕩和超調(diào)不是很大,但初始狀態(tài)有很大的震蕩,由此可見(jiàn),基于RBF-ARX模型的實(shí)時(shí)控制更勝一籌。
為證明基于RBF-ARX模型的LQR控制策略具有更強(qiáng)的適應(yīng)性,控制3個(gè)輸出根據(jù)目標(biāo)在同一時(shí)刻改變飛行姿態(tài),并保持一段時(shí)間,最終恢復(fù)初始水平懸停姿態(tài)。圖9和圖10分別顯示了基于物理模型和RBF-ARX模型下完成同一控制目標(biāo)的效果。從圖9所示的基于物理模型的LQR實(shí)時(shí)控制曲線可以看出,在初始水平懸停姿態(tài),輸出曲線有較大的震蕩;飛行器目標(biāo)姿態(tài)突然變化后,雖然動(dòng)態(tài)響應(yīng)迅速,但超調(diào)較大,穩(wěn)定到新姿態(tài)后穩(wěn)態(tài)特性尚可;穩(wěn)定一段時(shí)間重新回到初始水平懸停狀態(tài),輸出曲線又出現(xiàn)了存在較大超調(diào)和振蕩。原因是物理模型參數(shù)不夠精確,是一個(gè)簡(jiǎn)化的模型,并且旋翼的非線性動(dòng)態(tài)特性被簡(jiǎn)化為線性,無(wú)法保證在所有姿態(tài)下的控制都表現(xiàn)良好。
圖9 基于物理模型的LQR實(shí)時(shí)控制效果
圖10 基于RBF-ARX模型組的LQR實(shí)時(shí)控制效果
圖10為基于ARX模型組的LQR實(shí)時(shí)控制曲線,相比圖9,該建模及控制方法取得了較好的控制效果。在初始懸停位置,輸出曲線震蕩在很小幅度內(nèi),到達(dá)穩(wěn)態(tài)后基本平穩(wěn),沒(méi)有出現(xiàn)大幅震蕩現(xiàn)象;控制輸出姿態(tài)角突然變化后其動(dòng)態(tài)反應(yīng)迅速,超調(diào)量明顯比基于物理模型的控制策略小得多;回到初始水平懸停姿態(tài)后,并未出現(xiàn)大的振蕩和超調(diào)現(xiàn)象。
總之,基于RBF-ARX模型的LQR控制器在非線性的四旋翼飛行器的應(yīng)用效果十分顯著,該方法在實(shí)際工程應(yīng)用領(lǐng)域是可行的。
針對(duì)非線性和強(qiáng)耦合的四旋翼飛行器,提出了一種基于RBF-ARX模型的LQR控制方法。通過(guò)建立該模型并采用離線的方法辨識(shí)參數(shù),通過(guò)仿真分析證實(shí)該模型具有較高精度?;谠撃P驮O(shè)計(jì)了雙閉環(huán)狀態(tài)反饋LQR控制器,實(shí)際上是一種基于局部線性化模型局部控制器的無(wú)限時(shí)域預(yù)測(cè)控制器,通過(guò)實(shí)時(shí)控制結(jié)果分析,該方法控制效果顯著,并與基于物理模型和ARX模型的控制結(jié)果對(duì)比,結(jié)果顯示,基于RBF-ARX模型的LQR控制方法控制效果更佳,從而證實(shí)該方法的有效性和卓越性。
[1] Bouabdallah S, Noth A, Siegwart R. PID vs LQ Control Techniques Applied to an Indoor Micro Quadrotor[C]//Proceedings of the IEEE International Conference on Intelligent Robots and Systems. Sendai, Japan,2004:2451-2456.
[2] Tayebi A, McGilvray S. Attitude stabilization of a VTOL quadrotor aircraft[J]. IEEE Transactions on Control Systems Technology,2006,14(3):562-71.
[3] Bouchoucha M, Tadjine M, Tayebi A, et al. Step by step robust nonlinear PI for attitude stabilisation of a four-rotor maniaircraft[C]//16th Mediterranean Conference on Control and Automation. Ajaccio,2008:1276-1283.
[4] Das A, Subbarao K, Lewis F. Dynamic inversion with zero-dynamics stabilisation for quadrotor control[J]. IET Control Theory & Applications,2009,3(3):303-314.
[5] Guenard N, Hamel T, Mahony R. A Practical Visual Servo Control for an Unmanned Aerial Vehicle[J]. IEEE Transactions on Robotics,2008,24(2):331-340.
[6] Morel Y, Leonessa A. Direct adaptive tracking control of quadrotor aerial vehicles[C]//Florida Conference on Recent Advances in Robotics, Miami, Florida,2006:1-6.
[7] Nicol C, Macnab C, Ramirez-Serrano A. Robust neural network control of a quadrotor helicopter[C]//Canadian Conference on Electrical and Computer Engineering,2008:1233-1238.
[8] Dierks T, Jagannathan S. Neural network output feedback control of a quadrotor UAV[C]//47th IEEE Conference on Decision and Control. Cancun,2008:3633-3639.
[9] Dunfied J, Tarbouchi M, Labonte G. Neural network based control of a four rotor helicopter[C]//IEEE International Conference on Industrial Technology,2004:1543-1548.
[10] 朱君.四旋翼無(wú)人飛行器控制系統(tǒng)設(shè)計(jì)及控制方法研究[D].呼和浩特:內(nèi)蒙古科技大學(xué)碩士學(xué)位論文,2012. ZHU Jun. Design and control method for the control system of four rotor unmanned aerial[D]. Huhhot: Master’s degree thesis of technological University of Inner Mongolia,2012.
[11] Deng X, Schenato L, Sastry S. Mode1 identification and attitude control for a Micromechanical flying insect including thorax and sensor models[C]//Proceedings of IEEE International Conference on Robotics and Automation,2003:1152-1157.
[12] 秦宣云,卜英勇,夏毅敏.基于AIC準(zhǔn)則優(yōu)化的徑向神經(jīng)網(wǎng)絡(luò)微地形曲面重構(gòu)[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2004(10):815-819. QIN Xuanyun, BU Yingyong, XIA Yimin. Micro terrain surface’s reconstruction based on the RBF neural network of AIC criterion optimization[J]. Journal of Central South University(Natural Science Edition),2004(10):815-819.
LQR Control for A Quad-Rotor Helicopter Based on RBF-ARX Mode
LIU Lili1,2ZUO Jihong1,2WU Jun1,3
(1. School of Information Science and Engineering, Central South University, Changsha 410083)(2. College of Hunan Railway Professional Technology, Zhuzhou 412001)(3. School of Electrical and Information Engineering, Changsha University of Science & Tehcnology, Changsha 410083)
For the quad-rotor helicopter which is nonlinear and coupled with each other, the design of LQR controller on quad-rotor helicopter based on RBF-ARX mode are discussed. The structure of the quad-rotor helicopter’ RBF-ARX model based on dynamic properties is built firstly, and the model parameters is identified using the off-line nonlinear parameter optimization methods, the quad-rotor helicopter’s nonlinear dynamic model is obtained to meet the demand of engineering precision.then, the state feedback ‘s LQR controller based on the model is given, and by solving the Riccati equation of working point, the state feedback matrix is accessed. Finally, the simulation results and real time attitude control verify the validity and feasibility of the proposed method.
quad-rotor helicopter, nonlinear, attitude control, state feedback, real time control Class Number TP391.9
2016年10月13日,
2016年11月11日
2015年度國(guó)家自然科學(xué)基金“抗參數(shù)橫揺的欠驅(qū)動(dòng)船舶航跡跟蹤控制研究”(編號(hào):61403045);2015年度湖南省教育廳科學(xué)研究資助項(xiàng)目“四旋翼飛行器的建模及控制策略的研究”(編號(hào):15C0903)資助。
劉麗麗,女,碩士研究生,講師,研究方向:復(fù)雜非線性系統(tǒng)建模及控制方法。左繼紅,男,碩士研究生,講師,研究方向:復(fù)雜非線性系統(tǒng)建模及控制方法。
TP391.9
10.3969/j.issn.1672-9722.2017.04.014