鄧偉偉,段朝陽(yáng),閆 亮
(中國(guó)空空導(dǎo)彈研究院,洛陽(yáng) 471009)
隨著武器技術(shù)的進(jìn)步和裝備的發(fā)展,現(xiàn)代戰(zhàn)爭(zhēng)中以第四代戰(zhàn)斗機(jī)及高超聲速巡航導(dǎo)彈為代表的高空、高速、高機(jī)動(dòng)目標(biāo)不斷涌現(xiàn),對(duì)導(dǎo)彈的敏捷轉(zhuǎn)彎能力和末端精確打擊能力提出了更高的要求,導(dǎo)彈面臨嚴(yán)峻挑戰(zhàn)。為了彌補(bǔ)傳統(tǒng)氣動(dòng)舵控制的不足,采用直/氣復(fù)合控制來(lái)提高導(dǎo)彈的響應(yīng)特性,實(shí)現(xiàn)對(duì)目標(biāo)的精確打擊。
針對(duì)導(dǎo)彈直/氣復(fù)合控制問(wèn)題,國(guó)內(nèi)外學(xué)者已經(jīng)開(kāi)展了大量研究工作[1-4],導(dǎo)彈直/氣復(fù)合控制系統(tǒng)是一個(gè)非線性、時(shí)變、多變量復(fù)雜控制系統(tǒng),難以建立精確的數(shù)學(xué)模型,基于經(jīng)典與現(xiàn)代控制理論設(shè)計(jì)的導(dǎo)彈直/氣復(fù)合控制系統(tǒng)依賴精確的數(shù)學(xué)模型,缺乏自學(xué)習(xí)和自適應(yīng)能力。近年來(lái),人工智能成為研究熱點(diǎn),未來(lái)是智能化戰(zhàn)爭(zhēng)時(shí)代,各國(guó)為占領(lǐng)智能化軍事領(lǐng)域制高點(diǎn),都在加快研究智能武器裝備[5],導(dǎo)彈直/氣復(fù)合控制系統(tǒng)智能控制也得到了相應(yīng)的研究。神經(jīng)網(wǎng)絡(luò)[6]、模糊控制[7-8]和遺傳算法[9]結(jié)合了定性決策和定量控制,將人的經(jīng)驗(yàn)與思維加入到導(dǎo)彈直/氣復(fù)合控制系統(tǒng)中,設(shè)計(jì)過(guò)程不依賴精確的數(shù)學(xué)模型,但是各類(lèi)智能控制存在著不可避免的缺點(diǎn)。模糊控制表達(dá)人腦的推理能力,設(shè)計(jì)相當(dāng)依賴專(zhuān)家或操作人員的經(jīng)驗(yàn)與知識(shí),若缺乏這樣的經(jīng)驗(yàn),很難獲得滿意的控制效果。神經(jīng)網(wǎng)絡(luò)模擬人腦的組織結(jié)構(gòu),具有自學(xué)習(xí)能力,但實(shí)際類(lèi)似于一個(gè)黑箱,缺少透明度,可解釋性較差,不能很好地表達(dá)人腦的推理功能。自適應(yīng)神經(jīng)模糊推理系統(tǒng)(Adaptive Neural-based Fuzzy Inference System,ANFIS)將二者有機(jī)地結(jié)合起來(lái),通過(guò)神經(jīng)網(wǎng)絡(luò)建立具有自學(xué)習(xí)能力的模糊控制系統(tǒng),利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機(jī)制補(bǔ)償模糊控制系統(tǒng)原有的缺點(diǎn),能夠得出比較科學(xué)合理的參數(shù),從而提高整個(gè)系統(tǒng)對(duì)知識(shí)的學(xué)習(xí)和表達(dá)能力。
本文以末制導(dǎo)段空空導(dǎo)彈為研究對(duì)象,建立俯仰通道數(shù)學(xué)模型,設(shè)計(jì)2輸入2輸出的模糊控制器。采用自適應(yīng)神經(jīng)模糊推理系統(tǒng),通過(guò)樣本數(shù)據(jù)學(xué)習(xí),優(yōu)化常規(guī)模糊控制。直接力裝置數(shù)學(xué)模型首先采用線性化模型進(jìn)行設(shè)計(jì),之后通過(guò)脈沖調(diào)寬調(diào)頻(Pulse Width Pulse Frequency,PWPF)調(diào)制器對(duì)線性化設(shè)計(jì)得到的直接力控制量進(jìn)行調(diào)制,得到離散的開(kāi)關(guān)指令。仿真結(jié)果表明,基于ANFIS的導(dǎo)彈直/氣復(fù)合控制系統(tǒng)能夠快速精確地跟蹤導(dǎo)彈加速度指令,提高系統(tǒng)的控制品質(zhì)。
空空導(dǎo)彈直/氣復(fù)合控制采用姿控式,直接力裝置位于質(zhì)心后,結(jié)構(gòu)如圖1所示。
導(dǎo)彈俯仰通道上小擾動(dòng)線性化動(dòng)力學(xué)方程[10]為
(1)
俯仰通道狀態(tài)空間模型為
(2)
其中
氣動(dòng)舵數(shù)學(xué)模型描述為如下二階系統(tǒng)
(3)
直接力裝置數(shù)學(xué)模型描述為如下一階系統(tǒng)
(4)
模糊控制是一種簡(jiǎn)單地將某一空間的輸入映射到另一空間的輸出的規(guī)則[11]。模糊控制的人機(jī)對(duì)話能力強(qiáng),方便將人的思考邏輯加入控制過(guò)程。模糊控制分為模糊化、模糊推理和解模糊3個(gè)過(guò)程,3個(gè)過(guò)程的完成基于知識(shí)庫(kù)。
知識(shí)庫(kù)包含了應(yīng)用知識(shí)以及控制目標(biāo),由數(shù)據(jù)庫(kù)和規(guī)則庫(kù)構(gòu)成。數(shù)據(jù)庫(kù)包括隸屬函數(shù)和尺度變化因子等,規(guī)則庫(kù)包括模糊語(yǔ)言構(gòu)成的一系列控制規(guī)則。模糊化是將輸入指令的清晰量轉(zhuǎn)化為模糊量,以便于模糊推理。模糊推理是模糊控制的核心,基于模糊概念模擬人的推理能力,一般基于控制工程知識(shí)、操作人員實(shí)際操作過(guò)程等來(lái)模仿人的決策行為,通過(guò)相應(yīng)的模糊控制規(guī)則,得到控制指令的模糊量。解模糊是將模糊推理得到的控制指令的模糊量轉(zhuǎn)化為實(shí)際控制的清晰量。模糊控制器結(jié)構(gòu)如圖2所示。
圖2 模糊控制器結(jié)構(gòu)
自適應(yīng)神經(jīng)模糊推理系統(tǒng)利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,通過(guò)對(duì)樣本數(shù)據(jù)的學(xué)習(xí)實(shí)現(xiàn)模糊控制的模糊化、模糊推理和解模糊3個(gè)過(guò)程,優(yōu)化模糊控制的知識(shí)庫(kù),建立具有自學(xué)習(xí)、自適應(yīng)能力的模糊控制系統(tǒng)[12]。以2輸入(x1,x2)和1輸出(y)的系統(tǒng)為例,模糊if-then規(guī)則如下:
規(guī)則1:ifx1isA1andx2isB1thenf1=p1x1+q1x2+r1
規(guī)則2:ifx1isA2andx2isB2thenf2=p2x1+q2x2+r2
自適應(yīng)神經(jīng)模糊推理系統(tǒng)可以認(rèn)為是T-S型模糊控制的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),該網(wǎng)絡(luò)是一個(gè)多層前饋網(wǎng)絡(luò),結(jié)構(gòu)如圖3所示。
圖3 自適應(yīng)神經(jīng)模糊推理系統(tǒng)結(jié)構(gòu)
第一層:輸入變量模糊化,該層參數(shù)可變,每個(gè)節(jié)點(diǎn)是以節(jié)點(diǎn)函數(shù)表示的方形節(jié)點(diǎn)
O1,i=μAi(x1),i=1,2;O1,i=μB(i-2)(x2),i=3,4
(5)
其中,x1(或x2)為節(jié)點(diǎn)的輸入;O1,i為模糊集Ai(或Bi-2)的隸屬函數(shù),隸屬函數(shù)的參數(shù)集為前提參數(shù)。
第二層:模糊集運(yùn)算,輸入信號(hào)相乘,而將其乘積輸出為
O2,i=ωi=μAi(x1)μBi(x2),i=1,2
(6)
第三層:計(jì)算每條規(guī)則ωi與全部規(guī)則ω之和的比值為
(7)
第四層:計(jì)算每條規(guī)則輸出為
(8)
其中,{pi,qi,ri},i=1,2為結(jié)論參數(shù)。
第五層:計(jì)算所有輸入信號(hào)的總輸出為
(9)
自適應(yīng)神經(jīng)模糊推理系統(tǒng)根據(jù)樣本數(shù)據(jù)學(xué)習(xí)調(diào)整前提參數(shù)和結(jié)論參數(shù),對(duì)于集上任意函數(shù)有無(wú)限的逼近能力,為復(fù)雜系統(tǒng)的控制提供了有效的工具。
PWPF調(diào)制器由一階慣性環(huán)節(jié)、施密特觸發(fā)器以及反饋回路組成,如圖4所示。
圖4 PWPF調(diào)制器
其中,Km為一階慣性環(huán)節(jié)放大系數(shù),Tm為一階慣性環(huán)節(jié)時(shí)間常數(shù);Uon和Uoff為施密特觸發(fā)器的開(kāi)關(guān)閾值,Um為施密特觸發(fā)器的脈沖幅值。脈沖調(diào)制基于沖量等價(jià)原理,采用PWPF調(diào)制器可以將連續(xù)推力轉(zhuǎn)化為等效的常值脈沖推力。
結(jié)合純氣動(dòng)舵控制采用的經(jīng)典Raytheon三回路結(jié)構(gòu)[13],針對(duì)導(dǎo)彈直/氣復(fù)合控制數(shù)學(xué)模型,直接力控制回路與氣動(dòng)舵控制回路并行工作,建立導(dǎo)彈直/氣復(fù)合模糊控制系統(tǒng),如圖5所示。
圖5 導(dǎo)彈直/氣復(fù)合模糊控制系統(tǒng)
加速度誤差信號(hào)ea和角速度誤差信號(hào)eω為模糊控制器的輸入;氣動(dòng)舵控制信號(hào)δz和直接力控制信號(hào)δR為模糊控制器的輸出;彈體加速度ay和俯仰角速度ωz為反饋信號(hào)。
自適應(yīng)神經(jīng)模糊推理系統(tǒng)的輸入為加速度誤差與角速度誤差,輸出為直接力控制與氣動(dòng)舵控制。采用離線學(xué)習(xí)模式,通過(guò)線性二次型調(diào)節(jié)器(Linear Quadratic Regulator, LQR)采集樣本數(shù)據(jù),分為訓(xùn)練、測(cè)試、檢核3個(gè)部分,對(duì)于裝入系統(tǒng)的樣本數(shù)據(jù)通過(guò)網(wǎng)格分割法,按照設(shè)定參數(shù),依據(jù)模糊C-均值聚類(lèi)方法建立模糊推理系統(tǒng)。依據(jù)模糊控制的設(shè)計(jì)經(jīng)驗(yàn),設(shè)置模糊子集個(gè)數(shù)為7,選取三角形隸屬函數(shù),輸出為線性函數(shù)。利用混合最小二乘估計(jì)的反向傳播算法,確定自適應(yīng)神經(jīng)模糊推理系統(tǒng)的前提參數(shù)和結(jié)論參數(shù),確定與輸入輸出樣本數(shù)據(jù)相匹配的模糊控制知識(shí)庫(kù),建立具有自適應(yīng)能力的模糊推理系統(tǒng)。
選取導(dǎo)彈在高度12km,馬赫數(shù)3.0的特征點(diǎn)進(jìn)行設(shè)計(jì),其狀態(tài)方程矩陣為
執(zhí)行機(jī)構(gòu)參數(shù)ωδ=120,ξ=0.7,τ=0.02;穩(wěn)態(tài)傳遞增益Kωss=0.00113;PWPF調(diào)制器參數(shù)選取為Km=5,Tm=0.1。
圖6~圖10所示為加速度10m/s2的仿真結(jié)果??梢钥闯觯R?guī)模糊控制相對(duì)于LQR超調(diào)量更小,控制用量更優(yōu),控制品質(zhì)更高。當(dāng)加速度指令變化時(shí),基于經(jīng)驗(yàn)設(shè)計(jì)的常規(guī)模糊控制的知識(shí)庫(kù)需要更新,經(jīng)驗(yàn)不足時(shí)一般采用試湊法完成知識(shí)庫(kù)更新,設(shè)計(jì)過(guò)程復(fù)雜。圖11~圖14所示為加速度100m/s2的仿真結(jié)果??梢钥闯?,自適應(yīng)神經(jīng)模糊推理系統(tǒng)控制品質(zhì)優(yōu)于常規(guī)模糊控制,常規(guī)模糊控制設(shè)計(jì)由于經(jīng)驗(yàn)不足,加速度指令跟蹤存在一定的穩(wěn)態(tài)誤差與振蕩。圖15~圖17所示為直接力裝置采用PWPF調(diào)制器,驗(yàn)證導(dǎo)彈直/氣復(fù)合控制系統(tǒng)的離散特性。加速度響應(yīng)曲線上升段的波動(dòng)是由于直接力裝置點(diǎn)火產(chǎn)生的瞬時(shí)推力造成的正?,F(xiàn)象。仿真結(jié)果表明,基于ANFIS的導(dǎo)彈直/氣復(fù)合控制系統(tǒng)能夠快速精確地跟蹤導(dǎo)彈加速度指令。
圖6 加速度指令10m/s2時(shí)加速度響應(yīng)
圖7 加速度指令10m/s2時(shí)俯仰角速度響應(yīng)
圖8 加速度指令10m/s2時(shí)氣動(dòng)舵偏用量
圖9 加速度指令10m/s2時(shí)直接力用量
圖10 直接力用量局部放大
圖11 加速度指令100m/s2時(shí)加速度響應(yīng)
圖12 加速度指令100m/s2時(shí)俯仰角速度響應(yīng)
圖13 加速度指令100m/s2時(shí)氣動(dòng)舵偏用量
圖14 加速度指令100m/s2時(shí)直接力用量
圖15 采用PWPF調(diào)制器的加速度響應(yīng)
圖16 采用PWPF調(diào)制器的直接力裝置開(kāi)關(guān)指令
圖17 直接力裝置開(kāi)關(guān)指令局部放大
本文針對(duì)空空導(dǎo)彈直/氣復(fù)合控制問(wèn)題,基于ANFIS設(shè)計(jì)了導(dǎo)彈直/氣復(fù)合控制系統(tǒng)。常規(guī)模糊控制設(shè)計(jì)基于經(jīng)驗(yàn),不依賴精確的數(shù)學(xué)模型,但是當(dāng)系統(tǒng)工作狀態(tài)變化時(shí),知識(shí)庫(kù)相應(yīng)地需要更新,設(shè)計(jì)過(guò)程復(fù)雜,經(jīng)驗(yàn)不足時(shí)難以保證控制品質(zhì)。本文通過(guò)引入神經(jīng)網(wǎng)絡(luò),建立了自適應(yīng)神經(jīng)模糊推理系統(tǒng),通過(guò)樣本數(shù)據(jù)學(xué)習(xí)建立了模糊控制知識(shí)庫(kù),優(yōu)化了常規(guī)模糊控制。采用PWPF調(diào)制器對(duì)線性化設(shè)計(jì)得到的直接力控制量進(jìn)行調(diào)制,得到離散的開(kāi)關(guān)指令,驗(yàn)證了導(dǎo)彈直/氣復(fù)合控制系統(tǒng)的離散特性。仿真結(jié)果表明,常規(guī)模糊控制的控制品質(zhì)優(yōu)于LQR,系統(tǒng)狀態(tài)發(fā)生變化時(shí),基于ANFIS的導(dǎo)彈直/氣復(fù)合控制系統(tǒng)可以實(shí)現(xiàn)加速度指令的快速精確跟蹤,改善了空空導(dǎo)彈的響應(yīng)特性。