朱啟軒, 張紅剛, 高軍科
(1.光電控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,河南 洛陽(yáng) 471000;2.中國(guó)航空工業(yè)集團(tuán)公司洛陽(yáng)電光設(shè)備研究所,河南 洛陽(yáng) 471000)
在飛機(jī)飛行過(guò)程中,光電穩(wěn)定平臺(tái)探測(cè)器視軸指向會(huì)受到各種擾動(dòng)的干擾,影響視軸穩(wěn)定精度,進(jìn)而影響成像清晰度和信息獲取準(zhǔn)確性。提高擾動(dòng)隔離度是提高視軸穩(wěn)定精度的關(guān)鍵[1-2]。
傳統(tǒng)的控制策略受到了機(jī)械諧振頻率的嚴(yán)格限制,使得系統(tǒng)在擾動(dòng)作用頻段的增益無(wú)法得到進(jìn)一步提高[3],進(jìn)而限制了穩(wěn)定精度的提高。為解決傳統(tǒng)控制策略的內(nèi)在矛盾提出了自抗擾控制(Active Disturbance-Rejection Control,ADRC),利用擾動(dòng)補(bǔ)償控制來(lái)抑制擾動(dòng)影響。擴(kuò)張狀態(tài)觀測(cè)器(Extended State Obser-ver,ESO)是自抗擾控制的核心,對(duì)系統(tǒng)中的“總和擾動(dòng)”進(jìn)行實(shí)時(shí)觀測(cè),并加以補(bǔ)償,從而大幅度提高系統(tǒng)的擾動(dòng)隔離度,提高光電平臺(tái)穩(wěn)定精度[4-5]。
ESO的參數(shù)整定對(duì)于擾動(dòng)觀測(cè)器的性能影響至關(guān)重要,通常用菲波納奇數(shù)列、基于帶寬概念的單參數(shù)化[6]等設(shè)計(jì)方法設(shè)定擴(kuò)張狀態(tài)觀測(cè)器系數(shù),這些方法具有較好的魯棒性,經(jīng)調(diào)整后可適應(yīng)各類(lèi)模型。
自適應(yīng)調(diào)整參數(shù)的智能算法可以在保持系統(tǒng)較好的魯棒性的同時(shí)提高自抗擾控制系統(tǒng)性能指標(biāo),因此受到重視,有些文獻(xiàn)已經(jīng)嘗試使用類(lèi)似BP神經(jīng)網(wǎng)絡(luò)整定PID的方式整定自抗擾控制器[7],但多數(shù)僅整定其中非線(xiàn)性控制律的兩個(gè)參數(shù)[8-9]。事實(shí)上,擴(kuò)張狀態(tài)觀測(cè)器的參數(shù)整定方法更為復(fù)雜,由于系統(tǒng)精確模型難以獲得,目前主要依靠經(jīng)驗(yàn)公式試湊對(duì)其進(jìn)行調(diào)整,這種方法不僅費(fèi)時(shí)而且難以確定最優(yōu)參數(shù),因此使用BP神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行自適應(yīng)調(diào)整對(duì)于提升ESO性能具有深遠(yuǎn)的意義。
自抗擾控制技術(shù)首先由中科院數(shù)學(xué)與系統(tǒng)科學(xué)研究院的韓京清研究員于20世紀(jì)80年代后期提出,其核心思想為“主動(dòng)抗擾”,它最突出的特點(diǎn)就是把所有的外界擾動(dòng)和系統(tǒng)“未建模動(dòng)態(tài)”稱(chēng)為“總和擾動(dòng)”,然后通過(guò)擴(kuò)張狀態(tài)觀測(cè)器對(duì)該“總和擾動(dòng)”進(jìn)行實(shí)時(shí)估計(jì),從而實(shí)現(xiàn)對(duì)擾動(dòng)的直接前饋補(bǔ)償控制,達(dá)到提高擾動(dòng)隔離度的目的。
自抗擾控制器分為跟蹤微分器、擴(kuò)張狀態(tài)觀測(cè)器和非線(xiàn)性控制律三部分。
跟蹤微分器的主要作用是根據(jù)控制目標(biāo)和對(duì)象承受能力安排合適的過(guò)渡過(guò)程,解決系統(tǒng)的快速性和超調(diào)之間的矛盾。本文用的最速跟蹤微分器為
(1)
式中:x1為指令的跟蹤值;x2為指令微分的跟蹤值;fhan(x1(k)-v(k),x2(k),r,h)是系統(tǒng)的最速控制綜合函數(shù),其具體算法為
(2)
式中:r為速度因子,r的值越大,跟蹤速度越快;h為采樣時(shí)間,其余均為中間變量。
本文以帶擾動(dòng)的二階非線(xiàn)性被控系統(tǒng)為研究對(duì)象,對(duì)擴(kuò)張狀態(tài)觀測(cè)器的原理進(jìn)行討論,建立三階離散擴(kuò)張狀態(tài)觀測(cè)器,即
(3)
式中:βi(i=1,2,3)為待調(diào)整參數(shù),后文將采用BP神經(jīng)網(wǎng)絡(luò)方法對(duì)該3個(gè)參數(shù)進(jìn)行整定;fal(e1,αi,δi)為非線(xiàn)性函數(shù),這是韓京清總結(jié)出來(lái)的擴(kuò)張狀態(tài)觀測(cè)器非線(xiàn)性函數(shù),即
(4)
通過(guò)調(diào)整合適的αi,δi可以得到合適的非線(xiàn)性函數(shù),相比于線(xiàn)性ADRC,非線(xiàn)性ADRC具有更好的擾動(dòng)估計(jì)和補(bǔ)償能力,同時(shí)由于待調(diào)整參數(shù)增加,非線(xiàn)性ADRC的調(diào)整也就更為復(fù)雜。
本文采用指令信號(hào)與觀測(cè)信號(hào)相結(jié)合的方式生成控制律,類(lèi)似于PD控制,采用的非線(xiàn)性控制律為
u0=k1·fal(e1,α3,δ3)+k2·fal(e2,α4,δ4)
(5)
ESO的參數(shù)整定是自抗擾控制器設(shè)計(jì)的重要環(huán)節(jié),由于自抗擾控制不依賴(lài)系統(tǒng)精確模型的特點(diǎn),ESO參數(shù)的選擇往往采用經(jīng)驗(yàn)公式的調(diào)整方法,利用BP神經(jīng)網(wǎng)絡(luò)在線(xiàn)整定ESO參數(shù),可以使ESO隨擾動(dòng)變化及系統(tǒng)自身變化而進(jìn)行自適應(yīng)參數(shù)調(diào)整,相當(dāng)于進(jìn)行了自動(dòng)調(diào)整的系統(tǒng)辨識(shí),可以在提高自抗擾控制系統(tǒng)魯棒性的同時(shí)提高ESO觀測(cè)值精確性,進(jìn)而提高系統(tǒng)的穩(wěn)定精度。圖1所示為基于BP神經(jīng)網(wǎng)絡(luò)整定ESO參數(shù)的ADRC結(jié)構(gòu)框圖。
圖1 BP神經(jīng)網(wǎng)絡(luò)整定的ADRC結(jié)構(gòu)框圖Fig.1 ADRC based on BPNN
使用基于BP神經(jīng)網(wǎng)絡(luò)整定ESO參數(shù)β1,β2,β3,方法是采用三層BP神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)的輸入應(yīng)選擇與ESO觀測(cè)精度關(guān)系最為密切的幾個(gè)信號(hào),經(jīng)試驗(yàn),選擇以信號(hào)誤差E1、信號(hào)微分誤差E2、觀測(cè)值誤差eerror這3個(gè)信號(hào)和偏置值1作為神經(jīng)網(wǎng)絡(luò)的4個(gè)輸入節(jié)點(diǎn),隱含層節(jié)點(diǎn)數(shù)一般比輸出層節(jié)點(diǎn)數(shù)稍多,輸出層節(jié)點(diǎn)為3個(gè)ESO參數(shù)β1,β2,β3,結(jié)合特定被控對(duì)象并經(jīng)過(guò)試湊選擇5個(gè)隱含層節(jié)點(diǎn), 由此得出圖2所示的BP神經(jīng)網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)。
圖2 BP神經(jīng)網(wǎng)絡(luò)整定的ESO內(nèi)部結(jié)構(gòu)圖Fig.2 Internal structure of ESO based on BPNN
由于神經(jīng)網(wǎng)絡(luò)輸出層的激活函數(shù)往往選擇sigmoid函數(shù),其特性是輸出值非負(fù)且小于等于1,而ESO的參數(shù)并不在此范圍內(nèi),因此在使用BP神經(jīng)網(wǎng)絡(luò)對(duì)ESO進(jìn)行參數(shù)整定時(shí)需要對(duì)BP神經(jīng)網(wǎng)絡(luò)的輸出值進(jìn)行調(diào)整再作為ESO的參數(shù)使用,否則自抗擾控制器將無(wú)法收斂。由于BP神經(jīng)網(wǎng)絡(luò)是按照梯度下降法修正網(wǎng)絡(luò)的權(quán)值系數(shù),這種方法的缺點(diǎn)是如果輸出值與理想輸出偏差過(guò)大很容易發(fā)散,因此需要選取比較合適的輸出層系數(shù),使神經(jīng)網(wǎng)絡(luò)更好地收斂。
上文確定的神經(jīng)網(wǎng)絡(luò)輸入層的輸出為
(6)
隱含層輸入、輸出分別為
(7)
隱含層神經(jīng)元激活函數(shù)采用雙曲正切函數(shù)
(8)
輸出層的輸入輸出
(9)
輸出層輸出節(jié)點(diǎn)分別對(duì)應(yīng)3個(gè)ESO參數(shù)β1,β2,β3,Ak為輸出層系數(shù),輸出層神經(jīng)元激活函數(shù)采用非負(fù)的sigmoid函數(shù),即
(10)
定義系統(tǒng)的代價(jià)函數(shù)為
式中:rin()是系統(tǒng)的指令值;yout()是系統(tǒng)的輸出。
BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法應(yīng)用已經(jīng)很成熟,在此不再贅述。
提出一種將輸出層激活函數(shù)輸出乘以由BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練得出的相應(yīng)輸出層系數(shù)再作為ESO參數(shù)使用的方法,如圖3所示。
圖3 輸出層系數(shù)選取方法流程圖Fig.3 Flow chart of coefficient selection for output layer
首先用基于帶寬概念的單參數(shù)化設(shè)計(jì)方法[6]選擇一組初始系數(shù)[3ω,3ω2,ω3]的基值,其中,參數(shù)ω與系統(tǒng)帶寬有關(guān),ω?cái)?shù)值越大,ESO的帶寬越高。
ESO中擴(kuò)張狀態(tài)的收斂性和ESO參數(shù)h,β1,β2,β3密切相關(guān)[12]。由于采樣間隔h受到處理器的限制,無(wú)法進(jìn)一步提高,要使ESO的收斂性更好,則需要調(diào)整β1,β2,β3這3個(gè)參數(shù),使其更加適用于被控對(duì)象。上文所述的系數(shù)選取方法通過(guò)迭代,使ESO參數(shù)從一個(gè)較優(yōu)的初始值開(kāi)始,在系統(tǒng)工作過(guò)程中神經(jīng)網(wǎng)絡(luò)會(huì)根據(jù)系統(tǒng)的性能再對(duì)ESO參數(shù)進(jìn)行進(jìn)一步的調(diào)整優(yōu)化,這樣的方法比傳統(tǒng)的試湊法調(diào)整ESO參數(shù)要快捷,并且觀測(cè)性能更好。
光電穩(wěn)定平臺(tái)伺服控制系統(tǒng)以陀螺、旋轉(zhuǎn)變壓器/光電編碼器、圖像跟蹤器等作為反饋元件,通過(guò)控制器處理輸入信號(hào)及反饋信號(hào)并驅(qū)動(dòng)電機(jī)對(duì)平臺(tái)負(fù)載進(jìn)行控制。控制器通過(guò)調(diào)整PWM波信號(hào)實(shí)現(xiàn)對(duì)方位俯仰電機(jī)的控制,從而調(diào)整視軸的指向;通過(guò)陀螺視軸反饋在慣性空間中的速度變化情況;通過(guò)碼盤(pán)反饋反射鏡相對(duì)于載機(jī)的角度變化情況;通過(guò)圖像跟蹤器反饋目標(biāo)脫靶量,對(duì)視軸指向進(jìn)行精確控制。其工作原理如圖4所示。
圖4 兩軸穩(wěn)定平臺(tái)工作原理示意圖Fig.4 Operating principle of dual-axis stabilization platform
單軸穩(wěn)定回路的伺服控制系統(tǒng)流程如圖5所示。
圖5 單軸穩(wěn)定回路結(jié)構(gòu)框圖Fig.5 Diagram of a single-axis stabilization loop
當(dāng)載機(jī)在慣性空間內(nèi)運(yùn)動(dòng)時(shí),會(huì)對(duì)光電穩(wěn)定平臺(tái)伺服系統(tǒng)產(chǎn)生慣性空間中的速度擾動(dòng)。實(shí)驗(yàn)中通常采用角振動(dòng)臺(tái)產(chǎn)生的正弦擾動(dòng)來(lái)模擬這種擾動(dòng)。仿真中,將這種正弦擾動(dòng)等效為 “總和擾動(dòng)”加入到電壓輸入端,即加入如圖6所示的幅值為1 V,頻率為1.6 Hz的正弦電壓擾動(dòng)。
機(jī)載光電穩(wěn)定平臺(tái)的控制系統(tǒng)由于軸系間摩擦力矩、質(zhì)量不平衡力矩、繞線(xiàn)力矩等擾動(dòng)作用,往往存在單方向變化的干擾力矩,加入隨時(shí)間線(xiàn)性變化的電壓擾動(dòng)w(k)=0.000 8×k+1來(lái)模擬這些力矩的 “總和擾動(dòng)”,k隨時(shí)間變化,每0.001 s增大1,即在仿真時(shí)間10 s內(nèi),擾動(dòng)電壓由1 V增大至9 V,如圖7所示。
圖6 正弦電壓擾動(dòng)Fig.6 Sine voltage disturbance
圖7 線(xiàn)性電壓擾動(dòng)Fig.7 Linear voltage disturbance
為研究基于BP神經(jīng)網(wǎng)絡(luò)的自抗擾控制器的性能特點(diǎn),利用Matlab對(duì)基于BP神經(jīng)網(wǎng)絡(luò)的自抗擾控制器在機(jī)載光電穩(wěn)定平臺(tái)中的應(yīng)用進(jìn)行了仿真。
自抗擾控制器的非線(xiàn)性控制率有2個(gè)需要調(diào)整的參數(shù)k1,k2,本文也是用類(lèi)似整定ESO參數(shù)的方式對(duì)這2個(gè)參數(shù)進(jìn)行調(diào)整,其輸入輸出與前文所述的調(diào)整ESO參數(shù)的神經(jīng)網(wǎng)絡(luò)不同,輸入分別為系統(tǒng)輸入、系統(tǒng)輸出、反饋誤差和偏置值1,輸出為k1,k2,輸出系數(shù)也使用前文所述輸出系數(shù)確定方法使用[25 000,250]。
為驗(yàn)證基于BP神經(jīng)網(wǎng)絡(luò)的自抗擾控制器的抗擾動(dòng)效果,采用非線(xiàn)性自抗擾控制器作為對(duì)照,比較兩者的性能差異。
得到的輸出幅值對(duì)比如圖8所示,圖8a為自抗擾輸出結(jié)果,圖8b為BP神經(jīng)網(wǎng)絡(luò)自抗擾的輸出結(jié)果。 圖8a幅值約為6×10-4rad/s,圖8b幅值約為2.4×10-4rad/s。可以看出,加入了BP神經(jīng)網(wǎng)絡(luò)的自抗擾控制器相對(duì)于傳統(tǒng)自抗擾控制器的正弦擾動(dòng)隔離效果提升了1.5倍。
圖8 有正弦擾動(dòng)的穩(wěn)定精度曲線(xiàn)Fig.8 Stabilizing accuracy curves with sine disturbance
圖9a為自抗擾輸出結(jié)果,圖9b為BP神經(jīng)網(wǎng)絡(luò)自抗擾的輸出結(jié)果。
圖9 加入線(xiàn)性變化擾動(dòng)的穩(wěn)定精度曲線(xiàn)Fig.9 Stabilizing accuracy curves with linear disturbance
圖9a偏差峰值約為2.1×10-3rad/s,偏差穩(wěn)態(tài)值約為5×10-5rad/s,圖9b偏差峰值約為1.4×10-3rad/s,偏差穩(wěn)態(tài)值約為3×10-5rad/s。可以看出,加入了BP神經(jīng)網(wǎng)絡(luò)的自抗擾控制器相對(duì)于傳統(tǒng)自抗擾控制器的力矩?cái)_動(dòng)隔離效果提升了67%。
加入BP神經(jīng)網(wǎng)絡(luò)的自抗擾控制器性能比傳統(tǒng)的自抗擾控制器更好,產(chǎn)生這樣的仿真結(jié)果的原因主要有兩點(diǎn):1) BP神經(jīng)網(wǎng)絡(luò)迭代得到參數(shù)的方法快捷準(zhǔn)確,有人工試湊參數(shù)無(wú)法比擬的優(yōu)勢(shì);2) BP神經(jīng)網(wǎng)絡(luò)在迭代過(guò)程中會(huì)在線(xiàn)實(shí)時(shí)修改參數(shù),使系統(tǒng)魯棒性更強(qiáng)。
本文以機(jī)載光電穩(wěn)定平臺(tái)的基于BP神經(jīng)網(wǎng)絡(luò)的自抗擾控制器為研究重點(diǎn),對(duì)穩(wěn)定回路及其擾動(dòng)進(jìn)行了分析和建模。對(duì)基于BP神經(jīng)網(wǎng)絡(luò)的自抗擾控制器調(diào)參方式進(jìn)行了分析,提出了得出ESO參數(shù)迭代初值的方法,有效地提高了BP神經(jīng)網(wǎng)絡(luò)自抗擾控制器的收斂性,并與傳統(tǒng)的自抗擾控制方法在機(jī)載光電穩(wěn)定平臺(tái)的應(yīng)用進(jìn)行分析、仿真,比較了這兩種自抗擾控制器應(yīng)用于機(jī)載光電穩(wěn)定平臺(tái)的性能優(yōu)劣。仿真結(jié)果表明,基于BP神經(jīng)網(wǎng)絡(luò)的ADRC參數(shù)整定方法可以顯著提高機(jī)載光電穩(wěn)定平臺(tái)自抗擾控制器的擾動(dòng)隔離度,控制效果較傳統(tǒng)的自抗擾控制方法有較大提升,對(duì)提高機(jī)載光電穩(wěn)定平臺(tái)的視軸穩(wěn)定精度具有重要意義。
[1] 劉向.線(xiàn)加速度計(jì)在平臺(tái)穩(wěn)定系統(tǒng)中應(yīng)用的理論研究[D].長(zhǎng)春:中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所,2004.
[2] 張葆.《航空光電成像平臺(tái)關(guān)鍵技術(shù)》專(zhuān)題文章導(dǎo)讀[J].光學(xué)精密工程,2007,15(8):1280.
[3] 趙秀元,張新立,耿樂(lè).擴(kuò)張狀態(tài)觀測(cè)器的抑制擾動(dòng)性分析[J].遼寧師范大學(xué)學(xué)報(bào):自然科學(xué)版,2011,34(3):262-265.
[4] 鄭穎.某集束火箭炮位置伺服系統(tǒng)自抗擾方法研究[D].南京:南京理工大學(xué),2015.
[5] 韓京清.自抗擾控制技術(shù)[M].北京:國(guó)防工業(yè)出版社,2009.
[6] GAO Z Q.Scaling and bandwidth-parameterization based controller tuning[C]//American Control Conference, IEEE,2003:4989-4996.
[7] 齊曉慧,李杰,韓帥濤.基于BP神經(jīng)網(wǎng)絡(luò)的自適應(yīng)自抗擾控制及仿真[J].兵工學(xué)報(bào),2013,32(6)776-782.
[8] 段慧達(dá).一類(lèi)不確定高階非線(xiàn)性系統(tǒng)的級(jí)聯(lián)自抗擾控制策略研究[D].長(zhǎng)春:吉林大學(xué),2012.
[9] 李賢濤.航空光電穩(wěn)定平臺(tái)擾動(dòng)抑制技術(shù)的研究[D].長(zhǎng)春:中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所,2014.
[10] HILKERT J M,PAUTLER B.A reduced-order disturbance observer applied to inertially stabilized line-of-sight control[C]//Defense,Security,and Sensing,SPIE, 80520H (2011). doi: 10.1117/12.884123.
[11] 鄭春艷,張紅剛,馮興偉,等.機(jī)載光電穩(wěn)定平臺(tái)自抗擾控制研究[J].電光與控制,2017,24(2):51-54.
[12] 邵立偉,廖曉鐘,夏元清,等.三階離散擴(kuò)張狀態(tài)觀測(cè)器的穩(wěn)定性分析及其綜合[J].信息與控制,2008,37(2):135-139.