劉曉東 馬 飛 張 玉 杜立夫
1.北京航天自動控制研究所, 北京 100854 2.北京航空航天大學(xué)自動化科學(xué)與電氣工程學(xué)院, 北京 100191
模型參考自適應(yīng)控制系統(tǒng)是包含有理想系統(tǒng)模型并能以模型的工作狀態(tài)為標(biāo)準(zhǔn)自行調(diào)整參數(shù)的自適應(yīng)控制系統(tǒng)。模型參考適應(yīng)控制系統(tǒng)最初是為設(shè)計飛機自動駕駛儀而提出的,初期階段由于技術(shù)上的困難而未能得到廣泛應(yīng)用。然而,隨著計算機技術(shù)的發(fā)展,模型參考自適應(yīng)控制已在飛機自動駕駛儀、船艦自動駕駛系統(tǒng)、光電跟蹤望遠(yuǎn)鏡隨動系統(tǒng)和機械手控制系統(tǒng)等方面得到較廣泛應(yīng)用,目前已成為比較流行的自適應(yīng)控制方式之一[1-3]。
自上世紀(jì)40年代提出單神經(jīng)元模型構(gòu)建的神經(jīng)網(wǎng)絡(luò)計算模型起,神經(jīng)網(wǎng)絡(luò)在感知學(xué)習(xí)、模式識別、建模技術(shù)和系統(tǒng)控制方面取得了巨大的發(fā)展和應(yīng)用[4-7]。神經(jīng)網(wǎng)絡(luò)具有強大的學(xué)習(xí)能力和容錯能力,能夠很好地逼近連續(xù)非線性函數(shù),這種優(yōu)良特性進(jìn)一步促進(jìn)了神經(jīng)網(wǎng)絡(luò)技術(shù)在非線性系統(tǒng)辨識和系統(tǒng)控制方面的應(yīng)用[8]。1986年,Rumelhart等人在Nature上首次提出了這種多層前向反饋網(wǎng)絡(luò),目前已經(jīng)稱為一種十分成熟的神經(jīng)網(wǎng)絡(luò)技術(shù),一般簡稱為BP神經(jīng)網(wǎng)絡(luò)或BP算法[9]。BP神經(jīng)網(wǎng)絡(luò)是一種前向網(wǎng)絡(luò),由一個輸入層、一個或者多個隱含層和一個輸出層構(gòu)成,同一層的神經(jīng)元之間無關(guān)聯(lián),不同層的神經(jīng)元依次向前連接。
PID控制以其結(jié)構(gòu)簡單、可靠性高、易于工程實現(xiàn)等優(yōu)點至今仍被廣泛采用。但是,想要PID控制取得很好的控制能力,就需要調(diào)整好比例、積分和微分3種控制量,而這3個控制量的組合之間必然有一種最優(yōu)的組合。此時,可以結(jié)合BP神經(jīng)網(wǎng)絡(luò)的任意逼近能量,通過選取系統(tǒng)指標(biāo)學(xué)習(xí)實現(xiàn)對PID參數(shù)的自整定[10-11]。
因此,針對飛行器對象,本文將采用模型參考自適應(yīng)控制的基本設(shè)計框架,采用PID控制,并引入BP神經(jīng)網(wǎng)絡(luò)對PID控制器參數(shù)進(jìn)行自主調(diào)節(jié),從而實現(xiàn)飛行器姿態(tài)控制系統(tǒng)設(shè)計的智能化,提高其自適應(yīng)控制能力,這也是本文研究的主要出發(fā)點。
對于增量式PID控制律,其PID算法設(shè)計為如下形式:
u(k)=u(k-1)+Δu(k)
(1)
Δu(k)=kp[e(k)-e(k-1)]+kie(k)+
kd[e(k)-2e(k-1)+e(k-2)]
(2)
式中,u(k-1)和u(k)分別表示上一拍和當(dāng)前拍控制量,Δu(k)表示當(dāng)前拍控制增量,e(k)、e(k-1)和e(k-2)表示當(dāng)前拍和前兩拍的跟蹤誤差,對于飛行器而言則表示姿態(tài)角跟蹤誤差;kp,ki和kd分別表示比例系數(shù)、積分系數(shù)和微分系數(shù)。
對于傳統(tǒng)的設(shè)計過程,通常采用試湊法對kp,ki和kd三個控制參數(shù)進(jìn)行人工調(diào)整,此種方法會大大增加設(shè)計工作量,不利于控制系統(tǒng)的快速設(shè)計。因此,本文將設(shè)計一種通過訓(xùn)練獲取如上三個控制參數(shù)的智能方法,提高設(shè)計效率,達(dá)到優(yōu)化系統(tǒng)性能的作用。
1)基本框架設(shè)計
設(shè)計神經(jīng)網(wǎng)絡(luò)為3層BP神經(jīng)網(wǎng)絡(luò)模型,其對應(yīng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖 1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
BP網(wǎng)絡(luò)輸入層的輸入與輸出為:
(3)
式中,M為輸入變量的個數(shù),取決于所選取的被控系統(tǒng)的復(fù)雜程度,上角標(biāo)(1), (2), (3)分別代表輸入層、隱含層和輸出層。
網(wǎng)絡(luò)隱含層的輸入、輸出分別為:
(4)
(5)
(6)
網(wǎng)絡(luò)輸出層的輸入、輸出分別為:
(7)
(8)
此時,取3個輸出分別為:
(9)
(10)
2)權(quán)值更新律設(shè)計
基于模型參考自適應(yīng)控制的設(shè)計理念,為了確保實際對象輸出與參考模型輸出保持一致,可選取實際系統(tǒng)性能指標(biāo)為:
(11)
式中,yd(k)為參考模型的輸出,即期望的輸出,y(k)為實際系統(tǒng)的輸出。此時,問題將轉(zhuǎn)化為J(k)關(guān)于權(quán)值系數(shù)的極小值求解問題。按照梯度下降原則修正網(wǎng)絡(luò)的權(quán)系數(shù)可得,輸出層權(quán)重系數(shù)的增量為:
(12)
可以根據(jù)鏈?zhǔn)角髮?dǎo)法則得出:
(13)
根據(jù)式(7)可得:
(14)
基于增量式PID控制律(2),可以得到如下關(guān)系:
(15)
(16)
(17)
根據(jù)如上推導(dǎo),可以得出網(wǎng)絡(luò)輸出層權(quán)系數(shù)的學(xué)習(xí)算法為:
(18)
(19)
類似的,此時根據(jù)鏈?zhǔn)角髮?dǎo)法則逐層剝離,先算輸出層到隱藏層網(wǎng)絡(luò)可得如下:
(20)
再進(jìn)一步計算對于權(quán)值的變化量:
(21)
可以求出隱含層權(quán)系數(shù)的學(xué)習(xí)算法為:
(22)
式中,η2>0為學(xué)習(xí)速率,α2>0為慣性系數(shù),
(23)
式中,g′(x)=2g(x)[1-g(x)],f′(x)=1-f2(x)。
以某飛行器俯仰通道為例,其小擾動線性化模型如下所示:
(24)
式中,各小偏差系數(shù)的具體形式此處不再給出。
針對如上對象,采用增量式PID控制律,其PID算法設(shè)計為如下形式:
Δδφ(k)=Δδφ(k-1)+Δδφ(k)
(25)
Δδφ(k)=kp[eα(k)-eα(k-1)]+kieα(k)+
kd[eα(k)-2eα(k-1)+eα(k-2)]
(26)
其中,eα=αd-α表示參考模型輸出攻角與飛行器實際對象輸出攻角之間的誤差量。
采用基于如1.2節(jié)所示的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行姿態(tài)控制律參數(shù)的自整定,從而實現(xiàn)飛行器姿控系統(tǒng)的自適應(yīng)控制。飛行器參考模型自適應(yīng)控制方案如圖2所示。
圖2 飛行器參考模型自適應(yīng)控制方案框圖
仿真中,選取飛行器對象的相關(guān)參數(shù)為:
m=1000kg,S=0.4m2,L=1.0m,Jz=4000kg·m2
并且,在某特征點(馬赫數(shù)Ma=3.5,高度h=15km)處開展控制方案的仿真驗證與分析。
基于飛行器姿控系統(tǒng)的性能指標(biāo)要求,參考模型設(shè)計如下:
BP神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù)設(shè)計如下:
關(guān)于網(wǎng)絡(luò)初始權(quán)重值的選取,可以先開展一次基本的網(wǎng)絡(luò)訓(xùn)練,得到穩(wěn)定收斂后的一組網(wǎng)絡(luò)權(quán)重,然后將此作為BP網(wǎng)絡(luò)在線工作的初始權(quán)重系數(shù)。最后,將此網(wǎng)絡(luò)載入到飛行器自適應(yīng)姿控系統(tǒng)中。將攻角指令設(shè)置為20°的階躍信號,進(jìn)行仿真驗證,攻角跟蹤曲線如圖3所示。
圖3 攻角跟蹤曲線
由圖3可以看出,飛行器對象的攻角輸出曲線與參考模型的輸出曲線一致性較好,從而確保了飛行器實際攻角對指令的跟蹤效果,同時也體現(xiàn)出實際飛控系統(tǒng)對參考模型的逼近效果。
對于BP網(wǎng)絡(luò),其輸出初值設(shè)置為0,即PID控制參數(shù)初始為0,經(jīng)過參數(shù)自整定處理,最終收斂到一個穩(wěn)定值,進(jìn)而呈現(xiàn)出PID控制參數(shù)的智能調(diào)節(jié)過程,該過程中控制參數(shù)的變化曲線如圖4所示。
圖4 控制參數(shù)自適應(yīng)調(diào)整曲線
最后,給出本文控制方案下的升降舵控制量曲線,如圖5所示。
圖5 升降舵控制量曲線
至此,本文所提出的基于BP神經(jīng)網(wǎng)絡(luò)的模型參考自適應(yīng)姿態(tài)控制方案的仿真驗證完畢。
針對飛行器姿態(tài)控制的智能設(shè)計問題,本文提出的基于BP神經(jīng)網(wǎng)絡(luò)的模型參考自適應(yīng)姿態(tài)控制方案,可確保飛行器攻角與參考模型輸出保持一致,實現(xiàn)了實際飛控系統(tǒng)向理想系統(tǒng)的性能逼近。仿真結(jié)果表明,所設(shè)計的BP網(wǎng)絡(luò)可實現(xiàn)PID控制器參數(shù)的快速整定,使其由初始零值快速收斂至某穩(wěn)定狀態(tài),并滿足飛行器攻角跟蹤的性能指標(biāo)要求。此外,基于BP網(wǎng)絡(luò)進(jìn)行參數(shù)的智能調(diào)整,可以從一定程度上避免人工調(diào)參造成的工作量較大的問題。