張通彤,姜湖海,岳巍,司晨,袁滿
(1.西南技術(shù)物理研究所,四川 成都 610041;2.空裝駐成都地區(qū)第五軍事代表室,四川 成都 610041)
光電跟蹤系統(tǒng)在軍用及民用領(lǐng)域中實現(xiàn)對感興趣目標(biāo)的捕獲、識別以及穩(wěn)定跟蹤,其組成主要包括光電傳感組件、跟蹤信息處理組件、伺服控制組件,衡量系統(tǒng)性能優(yōu)劣的指標(biāo)之一為伺服控制回路的閉環(huán)跟蹤精度(簡稱跟蹤精度)。跟蹤精度通常定義為在給定的輸入指令下,系統(tǒng)跟蹤目標(biāo)的偏差距離原點的大小。影響跟蹤精度的因素主要包括:系統(tǒng)延遲、跟蹤偏差計算精度、伺服控制精度等。伺服控制算法作為系統(tǒng)的最終串行環(huán)節(jié),其控制效果直接影響跟蹤精度,制約伺服控制系統(tǒng)性能的主要指標(biāo)包括控制系統(tǒng)自身的系統(tǒng)精度、穩(wěn)定性、響應(yīng)特性、工作頻率等。
光電跟蹤系統(tǒng)是一個具有多變量、高階、高度非線性和強耦合等特征的復(fù)雜系統(tǒng)。系統(tǒng)在跟蹤目標(biāo)時,由于受到負(fù)載特性變化、外界擾動等不確定因素影響,導(dǎo)致系統(tǒng)的參數(shù)描述不完全準(zhǔn)確,通常情況下很難建立精準(zhǔn)的動力學(xué)模型。因此,必須提出合理的控制技術(shù)來改善系統(tǒng)的動靜態(tài)性能。針對上述需求,大量研究工作集中在PID控制及其衍生算法,核心是如何合理地給出控制器的3個參數(shù),使控制達到所期望的效果。針對特定系統(tǒng)設(shè)計的自整定PID控制器控制效果良好,但仍存在一些問題需要解決。
隨著對光電跟蹤控制系統(tǒng)模型認(rèn)識的加深和控制理論與控制方法的發(fā)展,科研工作者提出了自適應(yīng)控制、滑模變結(jié)構(gòu)控制等方法來解決模型的不確定性或干擾有界的問題。這些方法在系統(tǒng)不確定性滿足假設(shè)條件情況下保證了控制系統(tǒng)的收斂,但實際系統(tǒng)仍然會有某些尚未認(rèn)識到的不確定性因素存在,并影響控制系統(tǒng)的控制效果?;诋?dāng)前人工智能的發(fā)展,機器學(xué)習(xí)算法廣泛應(yīng)用于數(shù)據(jù)挖掘、模型辨識等領(lǐng)域。韓宇萌等提出一種基于反向傳播(BP)神經(jīng)網(wǎng)絡(luò)的滾仰式捷聯(lián)導(dǎo)引頭位置回路PID控制器,仿真結(jié)果表明控制器的動態(tài)性能優(yōu)于傳統(tǒng)PID控制器,能夠?qū)C動目標(biāo)實現(xiàn)快速穩(wěn)定跟蹤。殷建國等設(shè)計一個基于遺傳算法的PID控制系統(tǒng),與傳統(tǒng)PID做對比,驗證了該方法的可行性。針對姿態(tài)控制的需求,鐘山等應(yīng)用遺傳編程的交叉變異等方法讓計算機自動進化姿態(tài)控制律,仿真結(jié)果表明進化后的控制律響應(yīng)快、無超調(diào)、控制精度高。針對傳統(tǒng)PID難以適應(yīng)電機負(fù)載特性以及其他非線性因素影響的問題,閆峰等提出一種基于神經(jīng)網(wǎng)絡(luò)的電機控制算法,仿真和實驗結(jié)果表明算法能夠有效抑制超調(diào)、縮短調(diào)整時間、提高系統(tǒng)響應(yīng)速度。
神經(jīng)網(wǎng)絡(luò)在控制系統(tǒng)中的應(yīng)用可以提高控制系統(tǒng)的智能水平和適應(yīng)能力,且神經(jīng)網(wǎng)絡(luò)可以逼近任意的非線性映射關(guān)系,能夠?qū)Ψ蔷€性系統(tǒng)及不確定系統(tǒng)的控制提供一種有效方法。本文針對特定的光電跟蹤系統(tǒng)對感興趣目標(biāo)的快速與準(zhǔn)確跟蹤的需求,而常規(guī)PID控制方法難以滿足要求的問題,提出一種基于徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制策略,該方法結(jié)合了神經(jīng)網(wǎng)絡(luò)控制的優(yōu)點,使伺服穩(wěn)定平臺控制系統(tǒng)具有更高的跟蹤精度和更好的魯棒性。
光電跟蹤系統(tǒng)通常配置可見光探測器、紅外探測器等光電探測設(shè)備,其主要功能是實時響應(yīng)圖像信息處理器目標(biāo)偏差并隔離運動載體對光電跟蹤系統(tǒng)的擾動,使光電跟蹤系統(tǒng)視軸能夠穩(wěn)定、準(zhǔn)確和迅速地指向并跟蹤目標(biāo),其組成如圖1所示。
圖1 典型光電系統(tǒng)組成示意圖Fig.1 Composition of typical electro-optical system
光電系統(tǒng)跟蹤目標(biāo)時,目前通常采用面陣成像器件對目標(biāo)實施探測,以探測器件的對稱中心為坐標(biāo)原點,測量并解算目標(biāo)距離中心的偏離量,并根據(jù)光學(xué)系統(tǒng)的設(shè)計參數(shù)換算為角度表示,又稱脫靶量(Δ,Δ),其中Δ為坐標(biāo)軸軸方向上的脫靶量,Δ為坐標(biāo)軸軸方向上的脫靶量。以獲取的脫靶量為輸入,驅(qū)動穩(wěn)定平臺將脫靶量控制在原點附近,即可實現(xiàn)對目標(biāo)的實時動態(tài)跟蹤。圖2所示為目標(biāo)脫靶量示意圖。
圖2 目標(biāo)脫靶量示意圖Fig.2 Illustration of target miss distance
典型的光電跟蹤系統(tǒng)采用力矩電機直接驅(qū)動或者小減速比傳動的方式,載體的運動擾動通過平臺和負(fù)載間的摩擦傳遞,從而影響跟蹤目標(biāo)的精度。按照影響因素的來源,將跟蹤精度的影響要素分為外部干擾和內(nèi)部干擾兩類,如表1所示。
表1 影響光電跟蹤系統(tǒng)的要素Tab.1 Factors affecting on tracking accuarcy of electro-optical system
外部干擾是指系統(tǒng)外部輸入的影響, 主要包括目標(biāo)和場景隨著時間以及空間的變化,以及光電跟蹤系統(tǒng)載體在地面、空間運動產(chǎn)生的抖動。內(nèi)部干擾主要包含軸系摩擦、傳感器測量誤差和控制算法誤差等,其中軸系摩擦與光電伺服平臺的軸系設(shè)計及裝配、器件選型等直接相關(guān);傳感器測量誤差包含傳感器的噪聲、時延和計算誤差等。光電跟蹤系統(tǒng)通常通過合理的電氣布線、動平衡配平方式解決導(dǎo)線擾動和不平衡力矩,本文暫不考慮兩項誤差的影響。光電跟蹤系統(tǒng)的誤差源之間并非互相獨立,存在一定的耦合關(guān)系,如圖3所示,當(dāng)光電系統(tǒng)的結(jié)構(gòu)特征、傳感器選型確定后,控制系統(tǒng)作為光電系統(tǒng)的一個子系統(tǒng),其控制算法的持續(xù)優(yōu)化成為改善系統(tǒng)跟蹤性能的重要途徑。
跟蹤精度定義為光電系統(tǒng)經(jīng)圖像解算和伺服控制閉環(huán)跟蹤目標(biāo)時,跟蹤偏差距離跟蹤坐標(biāo)原點的殘差大小,用偏差像素數(shù)或者等效偏差角度描述,通常,∝,且∝1。其中,為控制器的控制增益,決定了控制系統(tǒng)的系統(tǒng)誤差,為跟蹤偏差輸入量(即上文所提脫靶量),決定了控制系統(tǒng)的隨機誤差。用(1)式表示跟蹤精度與跟蹤偏差、控制增益之間的關(guān)系,
由圖3可以得出,跟蹤精度誤差模型如下:
圖3 光電系統(tǒng)跟蹤精度指標(biāo)誤差模型Fig.3 Tracking error model of electro-optical system
式中:σ表示跟蹤精度指標(biāo)的標(biāo)準(zhǔn)差;σ表示由跟蹤器測量誤差的標(biāo)準(zhǔn)差;σ表示控制算法產(chǎn)生誤差的標(biāo)準(zhǔn)差
因此,跟蹤精度誤差可以表示為
現(xiàn)代光電跟蹤平臺多采用數(shù)字圖像處理以及離散控制方法,σ的數(shù)值通??梢詫崿F(xiàn)3像素,σ的數(shù)值等效折算為像素數(shù),通常可以實現(xiàn)1像素,于是(3)式可以表示為
結(jié)合(1)式可以得出,當(dāng)跟蹤精度一定時,跟蹤精度的誤差與以及的關(guān)系分別為
由(5)式、(6)式可以看出,控制算法中的增益控制對光電跟蹤系統(tǒng)的跟蹤精度影響至關(guān)重要。
光電跟蹤系統(tǒng)中,跟蹤目標(biāo)時通常會產(chǎn)生視線角速度信號用于配合其他系統(tǒng)使用或者報送載體與目標(biāo)的相對運動關(guān)系,如圖1的光電系統(tǒng)組成所示,目標(biāo)的能量輻射,經(jīng)過光學(xué)鏡片組和探測器、圖像信息處理器、伺服控制器以后,形成視線角速度信號。
典型的光電系統(tǒng)跟蹤目標(biāo)后測量的視線角速度數(shù)據(jù)示例如圖4所示。圖4中數(shù)據(jù)在均值附近的波動情況反映了系統(tǒng)的跟蹤精度。
圖4 跟蹤誤差示例圖Fig.4 Sample graph of tracking error
根據(jù)實際光電跟蹤系統(tǒng)的精度要求,對(5)式、(6)式中的跟蹤精度取值0.1s、0.2s、0.3s,控制增益取值范圍2~20,跟蹤偏差取值0.03~0.30,經(jīng)數(shù)值計算仿真,得到跟蹤精度誤差隨跟蹤偏差與控制器增益的變化趨勢如圖5和圖6所示。
圖5和圖6所示的數(shù)值仿真結(jié)果表明,通過改善控制增益,能夠有效提升跟蹤精度。
圖5 跟蹤精度誤差與控制增益關(guān)系Fig.5 Relationship between tracking accuracy and control gain
圖6 跟蹤精度誤差與跟蹤偏差關(guān)系Fig.6 Relationship between tracking accuracy and tracking error
從神經(jīng)網(wǎng)絡(luò)開始研究以來,先后發(fā)展了單神經(jīng)元、BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)和正交函數(shù)網(wǎng)絡(luò)模型等。其中,RBF網(wǎng)絡(luò)以其擁有函數(shù)全局逼近能力的特點,在信號處理、模式識別和非線性系統(tǒng)的建模和控制等領(lǐng)域得到了大量應(yīng)用。
RBF神經(jīng)網(wǎng)絡(luò)能以任意精度逼近任意連續(xù)函數(shù)。RBF神經(jīng)網(wǎng)絡(luò)輸入到隱含層的映射是非線性的,隱含層到輸出的映射是線性的,這種結(jié)構(gòu)形式在提高學(xué)習(xí)速度的同時避免了局部極小問題。RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。圖7中,、、…、x分別為輸入節(jié)點上的輸入值,為輸入節(jié)點的個數(shù),、、…、h分別為隱層節(jié)點的高斯基函數(shù),為隱層節(jié)點個數(shù),y為網(wǎng)絡(luò)的輸出,Σ為對隱層輸出的加權(quán)求和。
圖7 基于控制系統(tǒng)調(diào)節(jié)的RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.7 RBF neural network for control system
令為RBF神經(jīng)網(wǎng)絡(luò)的輸入向量,=[,,…,x],為 其 徑 向 基 向 量,=[,,…,h,…,h],h為高斯基函數(shù),
式中:C 為第個節(jié)點的中心矢量,
b為神經(jīng)網(wǎng)絡(luò)基寬向量的第個元素,=[,,…,b]。設(shè)網(wǎng)絡(luò)的權(quán)向量為=[,,…,w],辨識網(wǎng)絡(luò)的輸出為y()=++…+wh,為輸出的場數(shù),辨識器的性能指標(biāo)函數(shù)為
根據(jù)梯度下降法,輸出權(quán)向量元素w()、節(jié)點基寬元素b()及節(jié)點中心向量元素c()的迭代算法分別如(10)式、(11)式、(12)式所示。其中:輸出權(quán)向量元素w()的迭代算法為
式中:為學(xué)習(xí)速率;為動量因子。
節(jié)點基寬元素b()的迭代算法如(11)式所示:
節(jié)點中心向量元素c()的迭代算法如(12)式所示:
式中:∈[1,2,…,]。在模型辨識過程中(10)式、(11)式、(12)式中的輸出權(quán)向量元素w()、節(jié)點基寬元素b()、節(jié)點中心向量元素c()不斷迭代更新,停止迭代時得到最優(yōu)解,網(wǎng)絡(luò)訓(xùn)練結(jié)束。
本文用于光電伺服系統(tǒng)控制的RBF神經(jīng)網(wǎng)絡(luò)中,輸入包括控制器的控制律及平臺的輸出量,即=[,],隱層取3個節(jié)點,即=[,,],其結(jié)構(gòu)如圖8所示。
圖8 基于控制系統(tǒng)調(diào)節(jié)的RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.8 RBF neural network for control system
基于RBF神經(jīng)網(wǎng)絡(luò)的光電跟蹤平臺伺服控制回路結(jié)構(gòu)如圖9所示。圖9中,、分別為系統(tǒng)的輸入和輸出。
圖9 RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制框圖Fig.9 Block diagram of RBF neural network adaptive control
基于RBF神經(jīng)網(wǎng)絡(luò)的光電跟蹤平臺伺服控制系統(tǒng)的Jacobian算法為式中
由(10)式、(11)式、(12)式得到神經(jīng)網(wǎng)絡(luò)的參數(shù)更新值,代入(13)式便可得到模型的Jacobian信息。
跟蹤精度用誤差表示為
根據(jù)控制器的原理,控制器的3項輸入分別為
控制器的算法為
式中:為比例增益;為積分增益;為微分增益。
神經(jīng)網(wǎng)絡(luò)整定指標(biāo)可由(17)式計算:
采用梯度下降法調(diào)整、、,調(diào)整量如下:
根據(jù)梯度下降法原理,當(dāng)整定指標(biāo)()達到最小時得到、、的最優(yōu)解,即為使跟蹤精度最高的控制系統(tǒng)最優(yōu)參數(shù)。
為充分驗證算法的有效性,結(jié)合實際工程項目的研制需求,在實物光電跟蹤平臺的控制回路中,采用基于RBF神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制器,利用MATLAB/Simulink軟件建立仿真模型如圖10所示,對跟蹤平臺的穩(wěn)定跟蹤性能進行驗證。圖10中,為拉普拉斯算子。
圖10 RBF神經(jīng)網(wǎng)絡(luò)仿真模型Fig.10 Simulation model of RBF neural network
3.1.1 階躍輸入仿真
為驗證RBF神經(jīng)網(wǎng)絡(luò)控制器的性能,取采樣時間=0.001 s,學(xué)習(xí)速率=0.25,動量因子=0.05。
如1.2節(jié)所述,跟蹤精度經(jīng)過光電系統(tǒng)測量后,轉(zhuǎn)換為跟蹤目標(biāo)時的視線角速度信息。對于光電跟蹤平臺的視線角速度信息的衡量評價,通常會選用階躍信號、正弦信號作為輸入,比較系統(tǒng)跟隨兩種輸入的幅值和時滯誤差。光電跟蹤平臺跟蹤誤差給定階躍信號時,跟蹤系統(tǒng)的階躍響應(yīng)曲線如圖11所示。
由圖11可見,與傳統(tǒng)PID控制器、積分分離PID控制器、單神經(jīng)元PID控制器相比,基于RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器的上升時間最短約為18 ms,階躍響應(yīng)無超調(diào),具體數(shù)據(jù)如表2所示。由此可知控制系統(tǒng)采用基于RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器后,其動態(tài)性能比采用常規(guī)PID控制器的動態(tài)性能優(yōu)異。
表2 不同算法仿真對比Tab.2 Comparison of simulated results of several control algorithms
圖11 不同算法階躍響應(yīng)對比Fig.11 Comparison of step responses of several control algorithms
3.1.2 正弦輸入仿真
對光電系統(tǒng)跟蹤性能評價時,通常也會采用對正弦信號跟隨性能進行考核的方式,在仿真模型中輸入典型值為幅值1°、頻率為1 Hz的正弦信號,經(jīng)數(shù)值計算,截取前半周期對局部數(shù)據(jù)進行放大,得到仿真結(jié)果如圖12所示。由圖12可以看出,傳統(tǒng)PID、積分分離PID、單神經(jīng)元PID以及RBF神經(jīng)網(wǎng)絡(luò)PID的滯后時間分別為8 ms、8 ms、24 ms、1 ms;幅值誤差分別為0.4%、2%、1%、1%。仿真數(shù)據(jù)表明,RBF神經(jīng)網(wǎng)絡(luò)綜合快速性與準(zhǔn)確性的效果較好,能夠在較小滯后的條件下獲取小誤差的跟蹤結(jié)果。
圖12 不同算法正弦信號響應(yīng)對比(頻率1 Hz、幅值1°)Fig.12 Comparison of sinusoidal signal responses of several control algorithms at 1 Hz and 1°
受到系統(tǒng)的成像探測器件采樣傳輸延時、穩(wěn)定平臺慣性延時等環(huán)節(jié)的約束,光電跟蹤系統(tǒng)的帶寬通常在3 Hz以內(nèi),為充分驗證算法在帶寬范圍內(nèi)的跟隨性能,選取0.5 Hz、2.0 Hz、3.0 Hz,幅值均為1°的信號進行數(shù)字仿真,其中頻率0.5 Hz、幅值1°的仿真曲線如圖13所示。
圖13 不同算法正弦信號響應(yīng)對比(頻率0.5 Hz、幅值1°)Fig.13 Comparison of sinusoidal signal responses of several control algorithms at 0.5 Hz and 1°
頻率分別為0.5 Hz、1.0 Hz、2.0 Hz、3.0 Hz的正弦響應(yīng)的時滯以及幅值誤差統(tǒng)計結(jié)果如表3和表4所示。
由表3和表4可以看出,相比于另外3種算法,基于RBF神經(jīng)網(wǎng)絡(luò)的PID算法在3.0 Hz帶寬內(nèi)時滯最小,約為1 ms,同時在帶寬范圍內(nèi)的幅值誤差同樣較小,在3 Hz處約為4%,可以滿足光電跟蹤系統(tǒng)的通用要求。
表3 不同頻率下正弦信號響應(yīng)的時滯仿真結(jié)果Tab.3 Time-delay results for sinusoidal signal responses at different frequencies
表4 不同頻率下正弦信號響應(yīng)的幅值誤差仿真結(jié)果Tab.4 Simulated amplitude errors of sinusoidal signal responses at different frequencies
為進一步充分驗證RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器的效果,搭建圖14所示半實物仿真驗證系統(tǒng),并在模擬載體運動的平臺中加入頻率1 Hz、幅值1°的正弦擾動,將仿真模型下載到實時仿真機中進行驗證。
圖14 半實物仿真系統(tǒng)Fig.14 Hardware-in-the-loop simulation system
3.2.1 階躍響應(yīng)半實物仿真實驗
圖15所示為不同算法階躍響應(yīng)實測數(shù)據(jù)對比結(jié)果。由圖15可知:與傳統(tǒng)PID控制器、積分分離PID控制器、單神經(jīng)元PID控制器相比,基于RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器的實測上升時間為19 ms(測試用光電系統(tǒng)的跟蹤信息處理純延時60 ms,在對此統(tǒng)計上升時間以及后文的時滯時,均未包含信息處理純延時數(shù)據(jù)),階躍響應(yīng)的超調(diào)量0%,具體如表5所示。
圖15 不同算法階躍響應(yīng)實測數(shù)據(jù)對比Fig.15 Test results of step responses from several control algorithms
表5 不同算法實測數(shù)據(jù)對比Tab.5 Test results of several control algorithms
對比可知控制系統(tǒng)采用基于RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器后,其動態(tài)性能比采用常規(guī)PID控制器的動態(tài)性能優(yōu)異。
3.2.2 正弦信號半實物仿真實驗
與數(shù)字仿真的條件類似,為充分驗證算法在帶寬范圍內(nèi)的跟隨性能,選取頻率分別為0.5 Hz、2.0 Hz、3.0 Hz以及幅值均為1°的信號,進行半實物仿真測試。0.5 Hz、1.0 Hz、2.0 Hz、3.0 Hz的正弦響應(yīng)時滯以及幅值誤差統(tǒng)計結(jié)果如表6和表7所示。
表6 不同頻率下正弦響應(yīng)時滯實測對比Tab.6 Measured comparison of time-delay of sinusoidal signal response at different frequencies
表7 不同頻率下正弦響應(yīng)幅值誤差實測對比Tab.7 Comparison of measured sinusoidal signal response amplitude errors at different frequencies
由表6和表7可以看出,相比于另外3種算法,基于RBF神經(jīng)網(wǎng)絡(luò)的PID算法在3.0 Hz帶寬內(nèi)時滯最小,約為28 ms,同時在帶寬范圍內(nèi)的幅值誤差同樣較小,在3.0 Hz處約為4%,實測數(shù)據(jù)同樣滿足光電跟蹤系統(tǒng)的通用要求。
本文針對光電跟蹤平臺控制回路設(shè)計了一種基于RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器,建立了穩(wěn)定跟蹤的仿真模型。根據(jù)跟蹤誤差信號,通過學(xué)習(xí)在線調(diào)整控制參數(shù),實現(xiàn)具有最佳組合的PID控制。得出主要結(jié)論如下:
1)通過不同算法的數(shù)字仿真與半實物仿真實驗驗證,基于RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器可以提高光電跟蹤平臺控制系統(tǒng)的響應(yīng)速度,減小系統(tǒng)的超調(diào)量,使控制回路的自適應(yīng)能力得到提高,在不同運動狀態(tài)條件下能滿足系統(tǒng)的快速機動響應(yīng)。
2)在自適應(yīng)響應(yīng)的同時能夠?qū)崿F(xiàn)對目標(biāo)的快速穩(wěn)定跟蹤,使目標(biāo)持續(xù)有效地穩(wěn)定在視場內(nèi),滿足系統(tǒng)高跟蹤精度的要求。
3)對控制系統(tǒng)智能化的研究在實際工程應(yīng)用中能夠為光電跟蹤系統(tǒng)的控制提供有益的參考。