亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于非線性模型預(yù)測控制的火星大氣進(jìn)入智能制導(dǎo)方法

        2021-07-05 01:37:20張金鵬
        關(guān)鍵詞:制導(dǎo)神經(jīng)網(wǎng)絡(luò)誤差

        胥 彪, 李 翔, 李 爽,*, 張金鵬

        (1. 南京航空航天大學(xué)航天學(xué)院, 江蘇 南京 210016; 2. 中國空空導(dǎo)彈研究院, 河南 洛陽 471009;3. 航空制導(dǎo)武器航空科技重點(diǎn)實(shí)驗(yàn)室, 河南 洛陽 471009)

        0 引 言

        火星作為地球的鄰近行星,在很多方面都與地球相似,已經(jīng)成為人類進(jìn)行深空探測的重要目標(biāo)天體?;鹦谴髿鈱臃浅O”?具有很大的不確定性,時(shí)常出現(xiàn)狂風(fēng)、沙塵等天氣。在探測器進(jìn)入、下降與著陸過程中,大氣進(jìn)入段歷時(shí)最久,工作條件最惡劣,飛行狀態(tài)變化快,對減速性能的要求極高。

        目前大氣進(jìn)入制導(dǎo)方法一般分為參考軌跡制導(dǎo)和預(yù)測校正制導(dǎo)[1]。參考軌跡制導(dǎo)方法首先按照要求設(shè)計(jì)好離線參考剖面(如阻力加速度剖面),然后根據(jù)實(shí)時(shí)跟蹤誤差設(shè)計(jì)制導(dǎo)律來在線跟蹤這條軌跡。該方法易于實(shí)現(xiàn),但制導(dǎo)性能受進(jìn)入過程中各種不確定性的影響較大。預(yù)測校正制導(dǎo)方法是在飛行過程中不斷預(yù)測終端狀態(tài),然后根據(jù)與期望終端狀態(tài)的偏差校正控制量,具有較高的落點(diǎn)精度,并且對進(jìn)入的初始條件不敏感。但其計(jì)算復(fù)雜度較高,需要較強(qiáng)的計(jì)算機(jī)性能以提高計(jì)算速度,在線制導(dǎo)的實(shí)時(shí)性難以保證。文獻(xiàn)[2]比較了這兩種方法,并從仿真研究中得出參考軌跡制導(dǎo)方案更適合火星大氣進(jìn)入段制導(dǎo)任務(wù)的結(jié)論。

        近年來參考軌跡制導(dǎo)方法取得了許多研究進(jìn)展。PID控制律已成功運(yùn)用到了阿波羅飛船和航天飛機(jī)的再入制導(dǎo)[3],但其基于一些線性假設(shè)條件,且增益系數(shù)的整定比較麻煩。文獻(xiàn)[4]使用反饋線性化的思想,利用狀態(tài)反饋項(xiàng)來抵消阻力動力學(xué)的非線性。然而,在存在較大模型誤差以及出現(xiàn)控制飽和現(xiàn)象時(shí),其軌跡跟蹤的性能很不理想。在此基礎(chǔ)上,有些學(xué)者提出利用滑模狀態(tài)觀測器估計(jì)模型誤差來提高控制精度[5],但是由于滑模本身的特點(diǎn),得到的控制量存在抖動,對滾轉(zhuǎn)角執(zhí)行機(jī)構(gòu)帶來較大挑戰(zhàn)。模型參考自適應(yīng)方法也被用于火星大氣進(jìn)入制導(dǎo)[6],跟蹤性能有所提高,但控制輸入仍存在抖動現(xiàn)象。文獻(xiàn)[7]采用了自抗擾控制方法進(jìn)行跟蹤,輸入相對平滑,能夠獲得較高的跟蹤精度。但是以上跟蹤方法都未考慮實(shí)際存在的控制量約束,大都存在控制飽和的問題,不可避免地會導(dǎo)致在線跟蹤的效果變差。

        模型預(yù)測控制(model predictive control, MPC)方法是目前應(yīng)用于工業(yè)過程中最常見的先進(jìn)控制技術(shù)之一,近年來也被應(yīng)用到了大氣進(jìn)入制導(dǎo)問題,能夠很好地解決跟蹤參考軌跡時(shí)存在的控制飽和問題。針對大氣進(jìn)入段復(fù)雜的非線性模型,文獻(xiàn)[8]通過線性化預(yù)測模型,設(shè)計(jì)了基于約束預(yù)測控制的軌跡跟蹤方法,但這種模型失配的影響會造成精度下降。文獻(xiàn)[9]提出了一種火星大氣復(fù)合進(jìn)入軌跡跟蹤策略,將約束多模型預(yù)測控制和干擾觀測器結(jié)合,提高了著陸精度?;诜蔷€性預(yù)測控制(nonlinear MPC, NMPC)算法[10],文獻(xiàn)[11-12]設(shè)計(jì)了基于阻力跟蹤的火星大氣進(jìn)入段NMPC制導(dǎo)律,能夠在滿足控制約束的條件下實(shí)現(xiàn)安全著陸。但其采用泰勒級數(shù)展開對未來輸出進(jìn)行近似預(yù)測,在模型不確定性較大情況下預(yù)測精度不高,會降低制導(dǎo)精度。文獻(xiàn)[13]綜合考慮了控制量約束和高度約束,基于局部線性化的NMPC和狀態(tài)觀測器提出了一種新的制導(dǎo)方案,不對模型進(jìn)行簡化,直接利用數(shù)值優(yōu)化算法在線求解復(fù)雜非線性規(guī)劃(nonlinear programming, NLP)問題的NMPC方法可以避免采用線性模型或近似預(yù)測造成的模型失配影響,具有更高的精度,但大大增加了計(jì)算的復(fù)雜度,會導(dǎo)致控制系統(tǒng)的指令延遲。

        神經(jīng)網(wǎng)絡(luò)(neural network,NN)[14]是模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立的算法,在航天器制導(dǎo)方面得到了廣泛應(yīng)用,如針對傳統(tǒng)預(yù)測校正制導(dǎo)方法中高精度制導(dǎo)與快速實(shí)時(shí)解算之間的矛盾,文獻(xiàn)[15]提出了一種基于最優(yōu)制導(dǎo)模板的神經(jīng)網(wǎng)絡(luò)預(yù)測制導(dǎo)方法,提高了綜合性能。文獻(xiàn)[16]結(jié)合數(shù)值預(yù)測校正制導(dǎo)算法和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),設(shè)計(jì)了進(jìn)入制導(dǎo)的神經(jīng)網(wǎng)絡(luò)在線預(yù)測器。近年來,由于計(jì)算機(jī)技術(shù)的迅速發(fā)展以及在多層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方面取得的大量研究成果[17],一些學(xué)者對神經(jīng)網(wǎng)絡(luò),尤其是深度神經(jīng)網(wǎng)絡(luò)(deep NN,DNN)在控制領(lǐng)域應(yīng)用的興趣在不斷提高。盡管DNN特別適用于如圖像識別、語音識別等感知相關(guān)的問題[18],但最近一些研究證明一些控制問題也能充分利用DNN的優(yōu)勢[19-20]。文獻(xiàn)[21]以非線性肢體模型為研究基礎(chǔ),證明了由自動編碼器堆疊而成的深度神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)最優(yōu)控制和狀態(tài)的對應(yīng)關(guān)系。文獻(xiàn)[22]通過訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)來近似表示4種不同飛行器在精確著陸場景中最優(yōu)控制量,證明了利用DNN實(shí)現(xiàn)實(shí)時(shí)最優(yōu)控制的可行性。

        考慮到大氣進(jìn)入段復(fù)雜的非線性模型,利用NMPC方法設(shè)計(jì)的制導(dǎo)系統(tǒng)需要數(shù)值求解相當(dāng)復(fù)雜的優(yōu)化問題,收斂到最優(yōu)解的速度較慢,而且每個(gè)制導(dǎo)周期的預(yù)測輸出要通過對預(yù)測模型的非線性微分方程組進(jìn)行數(shù)值積分得到。這些計(jì)算較為耗時(shí),使其直接應(yīng)用于在線制導(dǎo)比較困難。而具有強(qiáng)大特征學(xué)習(xí)能力的DNN利用深層非線性網(wǎng)絡(luò)結(jié)構(gòu),能夠?qū)崿F(xiàn)復(fù)雜關(guān)系的逼近,具有快速尋找優(yōu)化解的能力。因此,結(jié)合NMPC與DNN各自的優(yōu)勢設(shè)計(jì)制導(dǎo)方法是一種可行的思路。

        本文針對火星大氣進(jìn)入?yún)⒖架壽E制導(dǎo)問題,首先考慮模型不確定性對NMPC系統(tǒng)預(yù)測精度的影響,提出了一種提高系統(tǒng)魯棒性的預(yù)測模型優(yōu)化方法,并采用變預(yù)測時(shí)域策略改善系統(tǒng)性能。然后以改進(jìn)的NMPC系統(tǒng)為制導(dǎo)模板,通過訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)火星智能進(jìn)入制導(dǎo)。最后通過仿真驗(yàn)證了所設(shè)計(jì)方法的有效性。

        1 大氣進(jìn)入段動力學(xué)模型

        火星大氣進(jìn)入段的動力學(xué)方程表示為

        (1)

        (2)

        (3)

        (4)

        (5)

        式中:μ=4.279 2×1013m3/s2為火星引力常數(shù);m=2 802 kg為探測器質(zhì)量;S=15.9 m2為探測器參考面積;CD和CL分別為氣動阻力系數(shù)和升力系數(shù),升阻比小于0.25。大氣密度模型如下:

        (6)

        式中:ρ為高度h=r-r0處的大氣密度;火星半徑r0=3 396.2 km;hp為火星高度參數(shù),取9 354 m;ρ0為火星表面的標(biāo)準(zhǔn)大氣密度,取0.015 8 kg/m3。

        2 制導(dǎo)方法設(shè)計(jì)

        進(jìn)入制導(dǎo)包括互相解耦的縱向制導(dǎo)和橫向制導(dǎo),兩個(gè)通道均是將滾轉(zhuǎn)角作為唯一的控制變量??v向制導(dǎo)通過調(diào)整滾轉(zhuǎn)角的大小來改變探測器升力在縱向平面的分量,影響縱程大小;橫向制導(dǎo)則是通過改變滾轉(zhuǎn)角的符號來改變探測器的航向,減小橫程偏差。而由運(yùn)動學(xué)分析可知,以能量作為自變量時(shí),探測器的縱程由阻力加速度確定,因此軌跡跟蹤制導(dǎo)方法通常對阻力加速度進(jìn)行跟蹤。

        2.1 NMPC系統(tǒng)設(shè)計(jì)

        2.1.1 NMPC系統(tǒng)基本框架

        首先將探測器的縱向制導(dǎo)模型表示為如下所示的離散形式的動力學(xué)方程:

        (7)

        (8)

        模型預(yù)測控制是一種基于模型的閉環(huán)優(yōu)化控制策略,包括預(yù)測模型、滾動優(yōu)化和反饋校正3個(gè)部分[23]。其主要思想是利用預(yù)測模型預(yù)測系統(tǒng)的未來狀態(tài)量和輸出值,基于有限時(shí)域在線反復(fù)優(yōu)化的思想,在每一個(gè)采樣時(shí)刻在線求解帶有約束的二次規(guī)劃或非線性規(guī)劃問題,即相當(dāng)于求解開環(huán)最優(yōu)控制問題。每一次求解都能得到一個(gè)控制序列,但是只將第一個(gè)控制量作用于系統(tǒng)。然后更新系統(tǒng)實(shí)時(shí)狀態(tài)并重復(fù)上述過程,依次滾動向前進(jìn)行,最終實(shí)現(xiàn)閉環(huán)最優(yōu)控制。

        由于執(zhí)行機(jī)構(gòu)的限制和工程要求,探測器滾轉(zhuǎn)角的調(diào)整范圍限制在10°~80°,因此縱向制導(dǎo)動力學(xué)模型的控制輸入存在約束,給控制系統(tǒng)設(shè)計(jì)帶來一定困難。而MPC的顯著優(yōu)勢就是可在線處理控制量和狀態(tài)量約束,可以很好地改善滾轉(zhuǎn)角控制飽和的現(xiàn)象,同時(shí)也可以對飛行路徑進(jìn)行約束。對于本文研究的大氣進(jìn)入制導(dǎo)問題,NMPC制導(dǎo)系統(tǒng)框圖如圖1所示。

        圖1 非線性模型預(yù)測控制系統(tǒng)框圖Fig.1 Block diagram of nonlinear model predictive control system

        在當(dāng)前時(shí)刻k,有導(dǎo)航系統(tǒng)測量得到的探測器飛行狀態(tài)值x(k),構(gòu)建如下形式的帶約束的非線性規(guī)劃問題:

        (9)

        定義要優(yōu)化的目標(biāo)函數(shù)為

        (10)

        優(yōu)化過程需要滿足以下約束條件:

        cos(σmax)≤u(k+i|k)≤cos(σmin), 0≤i≤Nc-1

        (11)

        (12)

        (13)

        yc(k+i|k)≤yc max, 0≤i≤Np

        (14)

        Nc和Np分別是控制時(shí)域和預(yù)測時(shí)域,通常Nc≤Np。優(yōu)化問題的獨(dú)立變量Uk是從k時(shí)刻起控制時(shí)域內(nèi)所有時(shí)刻的控制量組成的控制序列:

        Uk[uk,uk+1, …,uk+Nc-1]T

        (15)

        而控制時(shí)域之外的控制量大小全部等于控制時(shí)域內(nèi)最后時(shí)刻優(yōu)化得到的控制量,即

        u(k+i|k)=u(k+Nc-1|k),Nc≤i≤Np-1

        (16)

        (17)

        預(yù)測值yp(k+i|k)和yc(k+i|k)通過求解下面預(yù)測模型的方程得到:

        (18)

        式中:x(k)為當(dāng)前k時(shí)刻測得的探測器實(shí)際飛行狀態(tài)量,作為預(yù)測模型開始進(jìn)行預(yù)測的初始狀態(tài);xp(k+i|k)為k時(shí)刻對k+i時(shí)刻狀態(tài)量的預(yù)測值。

        在每一個(gè)優(yōu)化時(shí)刻增加對預(yù)測誤差的校正環(huán)節(jié),提高控制系統(tǒng)克服不確定性的能力。定義k時(shí)刻預(yù)測輸出與實(shí)際輸出之間的誤差為

        (19)

        式中:yp(k|k-1)為k-1時(shí)刻對k時(shí)刻輸出的預(yù)測值。以對e(k)加權(quán)的方式修正未來輸出的預(yù)測:

        (20)

        最后利用優(yōu)化算法求解由式(9)和式(11)~式(14)構(gòu)成的NLP問題,只將得到的優(yōu)化序列的第一個(gè)最優(yōu)解作用于系統(tǒng),即當(dāng)前k時(shí)刻的最優(yōu)控制量為

        (21)

        由于求解出的最優(yōu)控制量只包含了滾轉(zhuǎn)角的大小信息,還需要通過橫向制導(dǎo)確定滾轉(zhuǎn)角的符號,得到最終的滾轉(zhuǎn)角指令σ(k)。到下一時(shí)刻,根據(jù)探測器的實(shí)際飛行狀態(tài),進(jìn)行對未來輸出的預(yù)測和校正,重復(fù)對上述NLP問題的求解,滾動向前優(yōu)化,實(shí)現(xiàn)閉環(huán)最優(yōu)控制。

        2.1.2 預(yù)測模型修正方法

        由于在實(shí)際大氣進(jìn)入過程中存在較大的氣動系數(shù)和大氣密度模型誤差,而預(yù)測模型式(18)沒有考慮這些誤差,因此計(jì)算得到的預(yù)測輸出值誤差較大,會降低校正環(huán)節(jié)的作用效果,使NMPC方法的魯棒性變差。故本文從產(chǎn)生預(yù)測誤差的源頭出發(fā),提出了一種基于誤差信息估計(jì)的預(yù)測模型修正方法。首先通過設(shè)計(jì)一階衰減記憶濾波器來獲取誤差估計(jì)信息。由式(2)、式(4)、式(5)和式(8)可知,氣動系數(shù)和大氣密度誤差僅通過改變阻力加速度和升力加速度的大小對系統(tǒng)的輸出和路徑約束輸出產(chǎn)生影響,因此將實(shí)際的阻力加速度和升力加速度與預(yù)測模型式(18)計(jì)算得到的相應(yīng)量的比值作為濾波器的狀態(tài),即

        (22)

        式中:L(k)表示k時(shí)刻實(shí)際的升力加速度;Dp(k|k-1)和Lp(k|k-1)分別表示k-1時(shí)刻預(yù)測模型式(18)對k時(shí)刻阻力加速度和升力加速度的預(yù)測值;z*(k)為濾波器的當(dāng)前狀態(tài)量。則一階衰減記憶濾波器如下所示:

        z(k)=z(k-1)+(1-ε)(z*(k)-z(k-1))

        (23)

        式中:z(k-1)表示濾波器上一時(shí)刻的狀態(tài)量;0<ε<1為增益系數(shù)。為了減小模型不確定性的影響,可適當(dāng)取較大的增益系數(shù)以增強(qiáng)濾波器的過去狀態(tài)量對當(dāng)前輸出值z(k)的修正作用,這里取ε=0.9。濾波器初始值z(0)取1。將濾波器的輸出z(k)作為預(yù)測模型式(18)的修正因子,對阻力加速度和升力加速度的進(jìn)行實(shí)時(shí)修正,即

        (24)

        (25)

        2.1.3 變預(yù)測時(shí)域策略

        對大氣進(jìn)入制導(dǎo)問題分析可知,進(jìn)入初始段的大氣密度很小,末段探測器的速度較小。由式(4)可知,這兩個(gè)階段的阻力加速度都很小,模型誤差等不確定因素對阻力加速度跟蹤效果的影響不大。因此進(jìn)入初始段和末段的預(yù)測時(shí)域Np可選取較小值,減小輸出預(yù)測的計(jì)算量;而在探測器中間段飛行狀態(tài)變化較快,阻力加速度較大,因此跟蹤誤差的變化比較劇烈,應(yīng)選取較大的Np以提高系統(tǒng)的魯棒性。故這里采用變預(yù)測時(shí)域策略,以實(shí)際輸出與期望輸出之間誤差變化率的大小作為判斷依據(jù),合理選擇不同飛行階段預(yù)測時(shí)域的大小,提高NMPC制導(dǎo)系統(tǒng)的性能。

        k時(shí)刻的預(yù)測時(shí)域Np通過下式確定:

        (26)

        式中:k1(k)和k2(k)分別為實(shí)際阻力加速度和其一階導(dǎo)數(shù)與期望值之間誤差的變化率;λ1和λ2為適當(dāng)?shù)淖兓书撝?預(yù)測時(shí)域N1

        通過上述兩種方法對NMPC系統(tǒng)進(jìn)行改進(jìn),表1為NMPC制導(dǎo)系統(tǒng)的設(shè)計(jì)參數(shù)。

        表1 NMPC制導(dǎo)系統(tǒng)參數(shù)

        采用序列二次規(guī)劃(sequence quadratic program, SQP)和粒子群優(yōu)化(particle swarm optimization,PSO)算法相結(jié)合的混合算法求解NLP問題[24]。PSO算法在迭代初期有著較強(qiáng)的全局優(yōu)化能力,能夠在控制量的約束范圍內(nèi)快速收斂到一個(gè)接近全局最優(yōu)解的位置,然后SQP算法將其作為優(yōu)化的初始值并在該位置附近搜索,從而收斂到全局最優(yōu)解。這種混合優(yōu)化算法很大程度上避免了SQP算法容易產(chǎn)生局部最優(yōu)解的問題,可以更快、更準(zhǔn)確地找到最優(yōu)解。

        本文橫向制導(dǎo)采用設(shè)置漏斗邊界的方法[25]。通過滾轉(zhuǎn)角翻轉(zhuǎn),調(diào)整航向角方向,將橫程限制在漏斗邊界內(nèi),使得到達(dá)進(jìn)入段終端位置時(shí)的橫程誤差盡可能小。

        2.2 基于NMPC的深度神經(jīng)網(wǎng)絡(luò)制導(dǎo)

        雖然設(shè)計(jì)的NMPC制導(dǎo)系統(tǒng)能實(shí)現(xiàn)高精度制導(dǎo),但仍然存在一些缺陷:在每一個(gè)制導(dǎo)周期都需要通過數(shù)值優(yōu)化算法求解一個(gè)復(fù)雜的NLP問題,耗費(fèi)較長時(shí)間才能迭代得到最優(yōu)解;由于利用預(yù)測模型計(jì)算預(yù)測輸出時(shí)要對動力學(xué)方程進(jìn)行數(shù)值積分,當(dāng)預(yù)測時(shí)域較大時(shí),會帶來較大的計(jì)算負(fù)擔(dān)。這些問題會造成控制指令具有較大的延遲輸出。為了克服這些缺陷,提高指令計(jì)算速度,本文利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)NMPC系統(tǒng)的輸入輸出特性并作為制導(dǎo)指令生成器,實(shí)現(xiàn)智能進(jìn)入制導(dǎo)。方法流程圖如圖2所示,包括樣本數(shù)據(jù)生成、網(wǎng)絡(luò)離線訓(xùn)練和在線智能制導(dǎo)3個(gè)步驟。

        圖2 智能制導(dǎo)方法流程圖Fig.2 Flow chart of intelligent guidance method

        2.2.1 樣本數(shù)據(jù)生成

        以上一節(jié)中設(shè)計(jì)的NMPC制導(dǎo)系統(tǒng)為制導(dǎo)模板,生成樣本數(shù)據(jù)。數(shù)據(jù)生成的過程如下:

        步驟 1設(shè)置標(biāo)稱進(jìn)入條件I=[x0,CL,CD,ρ]T,包括初始狀態(tài)x0(高度、速度、經(jīng)緯度、航跡角和航向角),氣動系數(shù)CL和CD以及大氣密度ρ;

        步驟 2引入誤差項(xiàng)pl=[Δx0,ΔCL,ΔCD,Δρ]T,其中l(wèi)=1,2,…,m,m為跟蹤軌跡條數(shù)。則系統(tǒng)的實(shí)際進(jìn)入條件為dl=I+pl;

        為保證訓(xùn)練精度并充分發(fā)揮深層網(wǎng)絡(luò)揭示數(shù)據(jù)內(nèi)在特征的能力,這里選取m=3 000,因此樣本集Q包含了大約6×107個(gè)“狀態(tài)量-最優(yōu)控制量”的數(shù)組對。最后將樣本集Q隨機(jī)劃分為訓(xùn)練集Q1和測試集Q2,比例設(shè)置為90%和10%。

        2.2.2 網(wǎng)絡(luò)離線訓(xùn)練

        DNN是指隱含層個(gè)數(shù)大于1的深層神經(jīng)網(wǎng)絡(luò),其隱含層個(gè)數(shù)和每層神經(jīng)元的個(gè)數(shù)對網(wǎng)絡(luò)的特性有很大的影響,因此本文考慮不同結(jié)構(gòu)網(wǎng)絡(luò)的性能。同時(shí)為了對比,也對只有一個(gè)隱含層的淺層網(wǎng)絡(luò)進(jìn)行了訓(xùn)練。雖然單隱含層的神經(jīng)網(wǎng)絡(luò)只要神經(jīng)元的數(shù)目足夠大,就能夠擬合任意精度的非線性函數(shù),但是其對于復(fù)雜問題的學(xué)習(xí)能力有限,而且易于過度擬合,泛化能力較差。與之相比,深層神經(jīng)網(wǎng)絡(luò)通過增加隱含層個(gè)數(shù),使網(wǎng)絡(luò)的復(fù)雜度以指數(shù)級別提高,學(xué)習(xí)數(shù)據(jù)特征的能力更強(qiáng),也具有更強(qiáng)的泛化能力。此外,神經(jīng)元的激活函數(shù)也是影響網(wǎng)絡(luò)性能的重要因素之一。因此隱含層和輸出層分別采用了不同的激活函數(shù)進(jìn)行訓(xùn)練。對于隱含層,線性修正單元(rectified linear unit, ReLU)函數(shù)相比于經(jīng)典的sigmoid函數(shù),除了計(jì)算量小、便于優(yōu)化外,其不會發(fā)生飽和的特性能夠很好地解決后者在訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)時(shí)出現(xiàn)的梯度消失問題,并且降低發(fā)生過擬合的概率。故本文將ReLU函數(shù)與具有較快收斂速度的雙曲正切S型函數(shù)tansig進(jìn)行比較。對于輸出層,采用線性傳遞函數(shù)purelin和函數(shù)tansig兩種。

        第j層的第i個(gè)神經(jīng)元的輸出如下所示:

        fij=G(wijfi-1+bij)

        (27)

        式中:wij為權(quán)值向量,bij為該神經(jīng)元對應(yīng)的閾值,fi-1為上一層神經(jīng)元的全部輸出,G為激活函數(shù)。

        訓(xùn)練過程就是通過誤差信息的反向傳播不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使式(28)所示的均方誤差函數(shù)最小。

        (28)

        網(wǎng)絡(luò)的訓(xùn)練算法采用具有動量的隨機(jī)梯度下降法(stochastic gradient descent, SGD)[26],相比于傳統(tǒng)SGD算法,可以獲得更快的收斂速度并減少擾動。設(shè)置學(xué)習(xí)率η=0.001和動量因子μ=0.9,按照如下形式進(jìn)行權(quán)值更新:

        (29)

        另外,本文采用l2正則化和dropout兩種深度學(xué)習(xí)中的常用技術(shù)來避免DNN容易出現(xiàn)模型過擬合即泛化能力差的問題[27-28]。l2正則化方法就是在目標(biāo)函數(shù)中引入額外的信息來懲罰過大的權(quán)重參數(shù),也稱作權(quán)重衰減。加上l2正則項(xiàng)的損失函數(shù)可以表示為

        (30)

        式中:λ為權(quán)值衰減系數(shù),控制正則項(xiàng)的大小。

        dropout是指在DNN訓(xùn)練過程中按照一定的概率將部分神經(jīng)元暫時(shí)從網(wǎng)絡(luò)中丟棄(激活函數(shù)輸出為0),減弱神經(jīng)元節(jié)點(diǎn)間的聯(lián)合適應(yīng)性,尤其在數(shù)據(jù)量較大時(shí)能有效緩解過擬合的發(fā)生,增強(qiáng)網(wǎng)絡(luò)泛化能力。設(shè)置節(jié)點(diǎn)的丟棄率為0.5。

        利用歸一化后的訓(xùn)練集Q1對不同結(jié)構(gòu)的DNN進(jìn)行訓(xùn)練。使用Xavier初始化方法[29]隨機(jī)設(shè)置初始權(quán)值,能夠避免訓(xùn)練深層網(wǎng)絡(luò)時(shí),后面層激活函數(shù)的輸出值趨于0的問題,更有利于提高模型性能和收斂速度。權(quán)值wij服從如下的均勻分布:

        (31)

        式中:ni和ni+1分別表示前一層和后一層神經(jīng)元的個(gè)數(shù),當(dāng)神經(jīng)元激活函數(shù)為ReLU函數(shù)時(shí),β=12;激活函數(shù)為tansig函數(shù)時(shí),β=6。網(wǎng)絡(luò)訓(xùn)練的目標(biāo)誤差設(shè)定為1×10-6,最大迭代次數(shù)設(shè)定為5 000。當(dāng)損失函數(shù)的值收斂到設(shè)定的誤差范圍或達(dá)到訓(xùn)練的最大迭代次數(shù)時(shí),即完成網(wǎng)絡(luò)模型的訓(xùn)練。利用測試集Q2中的數(shù)據(jù)對網(wǎng)絡(luò)性能進(jìn)行測試,通過多次實(shí)驗(yàn),得到對樣本特征學(xué)習(xí)效果相對更好的網(wǎng)絡(luò)結(jié)構(gòu),保存其相應(yīng)的網(wǎng)絡(luò)參數(shù),用于在線制導(dǎo)。

        雖然文獻(xiàn)[16]基于預(yù)測校正制導(dǎo)方法設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)制導(dǎo)器取得了不錯(cuò)的效果,但其局限性在于只利用較少的樣本數(shù)據(jù)和傳統(tǒng)的單層神經(jīng)網(wǎng)絡(luò)進(jìn)行離線訓(xùn)練,對復(fù)雜非線性特征的表示能力有限,泛化能力也受到一定制約。針對這一關(guān)鍵問題,本文基于NMPC模板得到的海量樣本數(shù)據(jù),采用深度神經(jīng)網(wǎng)絡(luò)來增強(qiáng)對非線性特征的學(xué)習(xí)能力,提升網(wǎng)絡(luò)精度的同時(shí)能夠避免過擬合現(xiàn)象,保證網(wǎng)絡(luò)良好的泛化能力,使其在訓(xùn)練集外也具有可靠性能,提高神經(jīng)網(wǎng)絡(luò)制導(dǎo)方法實(shí)際應(yīng)用的可行性。在下一節(jié)中進(jìn)行相應(yīng)的仿真驗(yàn)證。

        3 仿真結(jié)果及分析

        仿真的初始條件、進(jìn)入段終端參數(shù)以及參考軌跡的設(shè)計(jì)方法參考文獻(xiàn)[30],具體數(shù)據(jù)如表2和表3所示。生成樣本數(shù)據(jù)時(shí)設(shè)置的各項(xiàng)誤差分布范圍和形式如表4所示,包括初始狀態(tài)誤差、氣動系數(shù)以及大氣密度誤差,并將實(shí)際進(jìn)入條件的分布范圍記為A。

        表2 初始狀態(tài)參數(shù)

        表3 終端狀態(tài)參數(shù)

        表4 誤差參數(shù)

        本節(jié)首先通過對不同結(jié)構(gòu)的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,進(jìn)行深層與淺層網(wǎng)絡(luò)對非線性關(guān)系學(xué)習(xí)效果的對比,并分析了激活函數(shù)、網(wǎng)絡(luò)層數(shù)和神經(jīng)元個(gè)數(shù)對DNN性能的影響。然后對網(wǎng)絡(luò)的泛化能力進(jìn)行了分析,最后通過與其他方法進(jìn)行仿真對比,說明本文提出的制導(dǎo)方法的優(yōu)勢。

        3.1 網(wǎng)絡(luò)結(jié)構(gòu)的影響

        利用訓(xùn)練集Q1訓(xùn)練不同結(jié)構(gòu)的網(wǎng)絡(luò),然后通過測試集Q2對網(wǎng)絡(luò)進(jìn)行測試,通過訓(xùn)練均方誤差Etrain和測試均方誤差Etest進(jìn)行網(wǎng)絡(luò)性能的評估。表5為深度神經(jīng)網(wǎng)絡(luò)(4個(gè)隱含層、每層32個(gè)神經(jīng)元)在不同隱含層-輸出層激活函數(shù)下的網(wǎng)絡(luò)訓(xùn)練效果對比。

        由表5結(jié)果可知,ReLU函數(shù)作為隱含層激活函數(shù)時(shí)的Etrain和Etest均明顯小于tansig函數(shù),說明ReLU函數(shù)確實(shí)更有利于DNN的訓(xùn)練。同時(shí)可以得到輸出層為purelin時(shí)網(wǎng)絡(luò)能取得更好的性能,因此下面進(jìn)行DNN訓(xùn)練時(shí)均采用Relu-purelin結(jié)構(gòu)的激活函數(shù)。

        表5 不同激活函數(shù)的DNN訓(xùn)練效果

        表6為不同層數(shù)和神經(jīng)元個(gè)數(shù)網(wǎng)絡(luò)的訓(xùn)練效果對比,其中層數(shù)指隱含層和輸出層個(gè)數(shù)之和,神經(jīng)元數(shù)為各隱含層的神經(jīng)元個(gè)數(shù)。

        表6 不同層數(shù)和神經(jīng)元個(gè)數(shù)的網(wǎng)絡(luò)訓(xùn)練效果

        從表6可以看出,雖然淺層網(wǎng)絡(luò)(一個(gè)隱含層和一個(gè)輸出層)采用了足夠多的神經(jīng)元個(gè)數(shù)來提高擬合能力,但Etrain和Etest的減小并不明顯,訓(xùn)練效果的提升較小,說明淺層網(wǎng)絡(luò)對復(fù)雜特征的學(xué)習(xí)能力有限;在網(wǎng)絡(luò)參數(shù)個(gè)數(shù)大致相同的情況下,深層網(wǎng)絡(luò)的性能總是優(yōu)于淺層網(wǎng)絡(luò),而且隨著深度的增加,Etrain和Etest也基本上保持逐漸減小的趨勢,這表明增大網(wǎng)絡(luò)深度可以獲得更強(qiáng)的非線性關(guān)系學(xué)習(xí)能力,也體現(xiàn)了采用深度神經(jīng)網(wǎng)絡(luò)來獲得更佳學(xué)習(xí)效果的必要性。綜合考慮網(wǎng)絡(luò)復(fù)雜度和性能,這里選用具有5層16個(gè)神經(jīng)元的DNN結(jié)構(gòu)學(xué)習(xí)NMPC系統(tǒng)狀態(tài)-控制量之間的非線性關(guān)系。

        3.2 不同制導(dǎo)方法的比較

        為了驗(yàn)證訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)作為滾轉(zhuǎn)角控制量生成器用于進(jìn)入制導(dǎo)的有效性,首先將其與采用自抗擾控制(active disturbance rejection control, ADRC)理論設(shè)計(jì)跟蹤制導(dǎo)律的方法[7]進(jìn)行了對比,從樣本集中隨機(jī)選取一組實(shí)際誤差條件,單次仿真結(jié)果如圖3~圖6所示。

        圖3 滾轉(zhuǎn)角曲線Fig.3 Bank angle curve

        圖3和圖4分別為滾轉(zhuǎn)角變化曲線和漏斗邊界,在橫向制導(dǎo)作用下,滾轉(zhuǎn)角符號進(jìn)行了若干次改變,使得探測器保持在漏斗區(qū)間內(nèi)飛行,保證了橫程誤差盡可能小。阻力加速度變化曲線如圖5所示,相比ADRC方法,DNN方法對參考阻力加速度的跟蹤效果更好。圖6為經(jīng)緯度變化曲線,由結(jié)果可看出,兩種方法終端位置距離目標(biāo)點(diǎn)的誤差均小于5 km,其中ADRC方法的誤差為3.49 km,而DNN方法僅為1.35 km,制導(dǎo)精度明顯更高。

        圖4 漏斗邊界Fig.4 Funnel boundary

        圖5 阻力加速度曲線Fig.5 Drag acceleration curve

        圖6 經(jīng)緯度曲線Fig.6 Latitude and longitude curve

        然后從制導(dǎo)精度和計(jì)算耗時(shí)兩個(gè)方面考慮,通過多次仿真驗(yàn)證本文方法相比ADRC和NMPC方法的優(yōu)勢。使用不同方法進(jìn)行500次蒙特卡羅打靶仿真的結(jié)果如圖7所示,仿真結(jié)果統(tǒng)計(jì)如表7所示。

        表7 仿真結(jié)果

        圖7 蒙特卡羅仿真結(jié)果Fig.7 Results of Monte Carlo simulation

        3種方法終端位置誤差在5 km范圍內(nèi)的概率都達(dá)到了90%以上,能夠滿足基本的精度要求。但相比于ADRC方法,DNN和NMPC方法的平均誤差明顯更小,誤差在3 km范圍內(nèi)的概率也更高,能更好地滿足高精度制導(dǎo)需求。DNN的制導(dǎo)精度雖然略低于NMPC方法,但相差很小,這表明訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)很好地逼近了NMPC制導(dǎo)系統(tǒng)的特性。

        表7中統(tǒng)計(jì)了仿真一次的平均計(jì)算時(shí)間(仿真運(yùn)行環(huán)境為Windows 10,處理器為Intel Core i7-9750H 2.60 GHz)。由于每個(gè)制導(dǎo)周期都要通過數(shù)值優(yōu)化算法求解NLP問題以及進(jìn)行積分預(yù)測,NMPC方法指令計(jì)算的平均耗時(shí)最長。與NMPC方法相比,ADRC方法和DNN方法因?yàn)橛?jì)算復(fù)雜度低,平均耗時(shí)與NMPC相比減少了兩個(gè)數(shù)量級,能夠快速在線解算指令。這說明DNN除了具備強(qiáng)大的非線性特性學(xué)習(xí)能力外,與NMPC制導(dǎo)方法相比,其主要優(yōu)點(diǎn)是計(jì)算速度快。雖然訓(xùn)練過程比較耗時(shí),但DNN一旦訓(xùn)練完成,網(wǎng)絡(luò)在極短的時(shí)間內(nèi)就能計(jì)算出控制量,實(shí)現(xiàn)實(shí)時(shí)制導(dǎo)。

        3.3 網(wǎng)絡(luò)泛化能力的分析

        考慮到實(shí)際火星大氣過程的進(jìn)入初始狀態(tài)和模型誤差等進(jìn)入條件肯定存在與樣本集不一致的情況,這就需要分析本文DNN的泛化能力。

        為了更全面地對網(wǎng)絡(luò)性能進(jìn)行分析,本文考慮了實(shí)際進(jìn)入條件的隨機(jī)誤差按照范圍A分布和實(shí)際誤差大小超出范圍A的兩種情況。

        (1) 隨機(jī)誤差按照范圍A分布。用于在線制導(dǎo)的DNN是基于樣本數(shù)據(jù)事先離線訓(xùn)練好的,然而實(shí)際進(jìn)入條件通常是按照范圍A分布的隨機(jī)情況。因此,按范圍A隨機(jī)生成500組誤差并進(jìn)行仿真,同時(shí)為更全面地說明DNN制導(dǎo)的性能,也與其他方法進(jìn)行了對比,結(jié)果如表8所示,統(tǒng)計(jì)數(shù)據(jù)為終端位置誤差小于5 km的概率。

        表8 在范圍A之內(nèi)的仿真結(jié)果

        (2) 隨機(jī)誤差大小超出范圍A。盡管生成樣本集時(shí)設(shè)定的范圍A基本能夠覆蓋所有的誤差情況,但由于火星大氣環(huán)境存在較大的不確定性,實(shí)際進(jìn)入過程的各類誤差仍有可能超出該范圍。所以,有必要進(jìn)一步對實(shí)際進(jìn)入條件在范圍A之外時(shí)DNN制導(dǎo)方法的適應(yīng)性進(jìn)行分析。

        為了分析不同誤差情況下DNN的性能,將誤差分為初始狀態(tài)誤差和模型誤差兩類,即令誤差項(xiàng)pl=[Δx0,ΔCL,ΔCD,Δρ]T=[Δx0,Δmc]T。設(shè)置不同的誤差分布形式,如下式所示:

        (32)

        式中:A1為只考慮某一項(xiàng)初始狀態(tài)誤差超出范圍A的情況;A2為只考慮某一項(xiàng)模型誤差超出范圍A的情況;A3為考慮這兩種情況同時(shí)出現(xiàn);Pe為超出原誤差范圍的百分比,這里Pe的取值為30%。在各誤差情況下分別進(jìn)行500次仿真,結(jié)果如表9所示,統(tǒng)計(jì)數(shù)據(jù)為終端位置誤差小于5 km的概率。

        表9 在范圍A之外的仿真結(jié)果

        由上述結(jié)果可知,實(shí)際進(jìn)入條件在按照范圍A隨機(jī)選取的情況下,DNN仍然可以根據(jù)飛行狀態(tài)自主生成最優(yōu)控制指令,準(zhǔn)確地將探測器導(dǎo)引到目標(biāo)位置,誤差小于5 km的概率達(dá)到了98.2%。從表9可以看出,當(dāng)實(shí)際誤差超出范圍A時(shí),制導(dǎo)精度雖然有所下降,但3種誤差形式下的DNN也都能保持相對較高的性能。其中A2情況下DNN的制導(dǎo)精度最高,而在A1和A3情況下精度下降相對明顯,盡管終端位置誤差小于5 km的概率也都能在90%以上,但制導(dǎo)精度與NMPC方法的差距較大,相比ADRC方法的性能優(yōu)勢也有所降低。本節(jié)的仿真結(jié)果充分表明了當(dāng)實(shí)際進(jìn)入條件在生成樣本集的誤差范圍內(nèi)隨機(jī)分布時(shí),DNN能夠近似得到最優(yōu)解,一定程度上說明DNN通過深層次的非線性網(wǎng)絡(luò)結(jié)構(gòu)成功學(xué)習(xí)了NMPC系統(tǒng)的特征,體現(xiàn)出了良好的泛化能力。但DNN在不確定擾動的大小超出一定范圍尤其是初始狀態(tài)誤差較大時(shí),很難保持與NMPC方法相似的性能,和傳統(tǒng)方法相比也已不具有明顯的優(yōu)越性,這也是本文方法的局限性所在。雖然可以通過增大樣本覆蓋區(qū)域進(jìn)行改善,但無疑提高了網(wǎng)絡(luò)訓(xùn)練的難度和時(shí)間代價(jià)。

        綜合以上分析可知,本文提出的DNN制導(dǎo)方法不僅很好地兼顧了制導(dǎo)精度和計(jì)算耗時(shí)兩個(gè)方面的需求,實(shí)現(xiàn)高精度制導(dǎo)的同時(shí)具有很快的指令計(jì)算速度,而且能夠較好地適應(yīng)實(shí)際進(jìn)入條件存在各類不確定誤差的情況,一定程度上保證了其用于在線精確制導(dǎo)的可行性。雖然由于網(wǎng)絡(luò)訓(xùn)練本身的局限性,在誤差過大的情況下該方法的性能優(yōu)勢會有所下降,但仍然能夠滿足制導(dǎo)精度需求。

        4 結(jié) 論

        本文針對火星大氣進(jìn)入在線精確制導(dǎo)問題,提出了一種以非線性模型預(yù)測控制系統(tǒng)為制導(dǎo)模板,利用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)智能在線制導(dǎo)的策略。首先通過提出的基于誤差信息估計(jì)的預(yù)測模型修正方法和變預(yù)測時(shí)域策略,對NMPC系統(tǒng)進(jìn)行改進(jìn),增強(qiáng)了系統(tǒng)對模型誤差的魯棒性,改善了系統(tǒng)性能。然后利用DNN學(xué)習(xí)NMPC制導(dǎo)系統(tǒng)的特性,在每一個(gè)制導(dǎo)周期代替數(shù)值優(yōu)化求解復(fù)雜NLP問題以及積分求解預(yù)測輸出的過程,很大程度上克服了NMPC方法求解復(fù)雜度高的缺點(diǎn),減小了指令解算時(shí)間。最后,對不同結(jié)構(gòu)網(wǎng)絡(luò)的學(xué)習(xí)性能進(jìn)行了比較,并通過對DNN泛化能力的分析進(jìn)一步驗(yàn)證了方法的可行性,同時(shí)指出了局限性。仿真結(jié)果驗(yàn)證了DNN方法相比其它方法在制導(dǎo)精度和計(jì)算速度上的優(yōu)勢,表明本文提出的方法能夠?qū)崿F(xiàn)探測器大氣進(jìn)入段高精度在線智能制導(dǎo)。

        猜你喜歡
        制導(dǎo)神經(jīng)網(wǎng)絡(luò)誤差
        角接觸球軸承接觸角誤差控制
        哈爾濱軸承(2020年2期)2020-11-06 09:22:26
        Beidou, le système de navigation par satellite compatible et interopérable
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        壓力容器制造誤差探究
        基于MPSC和CPN制導(dǎo)方法的協(xié)同制導(dǎo)律
        基于在線軌跡迭代的自適應(yīng)再入制導(dǎo)
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        九十億分之一的“生死”誤差
        山東青年(2016年2期)2016-02-28 14:25:41
        帶有攻擊角約束的無抖振滑模制導(dǎo)律設(shè)計(jì)
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        久久女人精品天堂av影院麻| 国产免费网站看v片元遮挡| 久久久精品中文无码字幕| 国产视频在线观看一区二区三区| 日韩内射美女片在线观看网站 | 久久综合久久鬼色| 亚洲一级电影在线观看| 亚洲发给我的在线视频| 免费a级毛片18禁网站| 乱人伦中文无码视频| 欧美日韩精品一区二区三区高清视频 | 日本a片大尺度高潮无码| 无码任你躁久久久久久| 一个人免费观看在线视频播放| 亚洲一区二区av免费观看| 熟女体下毛荫荫黑森林| 无码少妇a片一区二区三区| 丝袜欧美视频首页在线| 久久久精品少妇—二区| 美国少妇性xxxx另类| 处破痛哭a√18成年片免费| 国产精品涩涩涩一区二区三区免费| 国产亚洲av综合人人澡精品| 黑人巨茎大战俄罗斯美女| 亚洲人成网站免费播放| 强d漂亮少妇高潮在线观看 | 日本一二三区在线观看视频| 国产免国产免费| 免费国产一级特黄aa大片在线| 人妻露脸国语对白字幕| √天堂资源中文www| 亚洲美国产亚洲av| 胳膊肘上有白色的小疙瘩| 国产一区二区三区在线蜜桃| 日本精品αv中文字幕| 国产美女一级做a爱视频| 中文字幕高清视频婷婷| 亚洲中文字幕无码中文字| 国产最新地址| 全程国语对白资源在线观看| 亚洲色大成网站www永久|