董春云,蔡遠利
(西安交通大學電子與信息工程學院, 710049, 西安)
ω=[0.091 9,0.046 0,0.165 9,0.110 0,
0.044 4,0.060 4,0.076 5,0.060 2,
0.068 9,0.068 9,0.206 9]T
?
高超聲速再入飛行器軌跡優(yōu)化算法評估策略
董春云,蔡遠利
(西安交通大學電子與信息工程學院, 710049, 西安)
針對高超聲速再入飛行器軌跡優(yōu)化算法種類多樣、決策者難以優(yōu)選的問題,提出了一種軌跡優(yōu)化算法綜合評估策略。該策略首先對算法本身的穩(wěn)定性、實時性以及優(yōu)化結果的可行性、安全性、過渡性、最優(yōu)性等性能進行指標建模,建立優(yōu)化算法綜合評估指標體系;然后基于層次分析法中的兩兩比較判斷矩陣,以歐氏距離與違例次數為精度衡量依據,將指標權重的計算轉化為一類優(yōu)化問題并利用遺傳算法求解;之后計算加權規(guī)范化決策矩陣,綜合算法數據與理想對照組在空間距離與曲線形狀兩方面的貼近度,提出一種灰色逼近理想解排序加權法,最終完成評估分析過程。仿真結果表明:該策略以客觀數據的形式實現了軌跡優(yōu)化算法的性能量化,形成了不同算法之間統(tǒng)一的對比評估標準,能夠幫助決策者快速遴選出適合任務需求的最優(yōu)算法,避免了過程中的盲目性與主觀性。
高超聲速再入;軌跡優(yōu)化;算法評估
飛行軌跡設計是高超聲速飛行器制導與控制領域中的核心問題,也是滑翔再入飛行器總體概念設計階段的一項重要工作,關系到飛行任務的成敗[1]。為了盡可能地提高飛行器的性能,需要通過一定的優(yōu)化方法設計出一條或一組安全可行的方案飛行軌跡,在真實飛行環(huán)境中由制導控制系統(tǒng)實時跟蹤最優(yōu)軌跡。由于高超聲速再入飛行固有的多狀態(tài)、時變、非線性和強約束等復雜特性,因此其軌跡優(yōu)化過程一般只能得到近似的數值最優(yōu)解。對于該類軌跡優(yōu)化問題,其求解算法多種多樣,性能也各有千秋。設計人員選用不同的算法,往往會得到一組不同的“最優(yōu)”飛行軌跡,如何對它們進行合理的評價進而選擇出最佳飛行方案及相應的軌跡優(yōu)化算法,是一個值得深入研究的問題。
近年來,飛行器制導控制領域的性能評估問題已逐漸成為新的熱點[2],國內外研究多集中在制導律和控制算法的性能評估問題上,如在可重復使用飛行器、載人探索飛行器等設計驗證過程中均采用一定的評估策略來確定其制導系統(tǒng)性能[3],為制導算法的改進與選擇提供理論和數據支撐[4-5]。然而,目前對于軌跡優(yōu)化算法的評估問題還處于起步階段,至今仍沒有形成公認、統(tǒng)一的理論方法。傳統(tǒng)方法對飛行器軌跡的評估多采用系統(tǒng)仿真和蒙特卡洛隨機打靶等策略,通常都是針對一種軌跡優(yōu)化設計算法進行評估,沒有對多種可能的優(yōu)化設計展開研究[6];在軌跡優(yōu)化設計相關文獻中,設計算例通常局限于特定算法的比較,有失公正和客觀。
針對上述高超聲速飛行器再入軌跡優(yōu)化算法的評估問題,本文從算法本身及其優(yōu)化結果兩方面建立綜合評估指標體系,利用遺傳算法將層次分析法的指標計算過程轉化為一類優(yōu)化求解問題,并綜合算法數據在空間距離與曲線形狀兩方面與對照組的貼近度,提出一種灰色逼近理想解排序(technique for order preference similarity to ideal solution, TOPSIS)加權法,形成完整的軌跡優(yōu)化算法綜合評估閉環(huán)流程,為算法優(yōu)選及改進提供充分的數據支撐。利用Chebyshev偽譜法與粒子群法進行實例仿真,實驗結果驗證了本文評估策略的有效性。
再入軌跡優(yōu)化算法的評估是一個典型的多目標決策問題,本文主要從算法本身特性以及對應方案軌跡的可行性、安全性、過渡性及最優(yōu)性等方面進行分析,以建立全面的綜合評估指標體系。
1.1 算法特性
軌跡優(yōu)化算法自身的品質特性是影響其工程應用的重要因素,本文主要從穩(wěn)定性(穩(wěn)定度)和實時性(實時度)兩方面進行量化考核。
(1)穩(wěn)定度。對同一算法在考慮隨機因素的情況下進行多次測試,分析其優(yōu)化結果的統(tǒng)計特性,以協方差矩陣的跡作為衡量其穩(wěn)定性的標準。文獻[7]提出了一種基于正交試驗設計的測試思路,本文作為設計參考,則算法穩(wěn)定度計算公式為
(1)
(2)實時度。對相同的軌跡優(yōu)化任務,可利用平臺的硬件執(zhí)行速度來比較不同算法的實時性,實時度的計算公式為
(2)
1.2 可行性
可行性是再入軌跡優(yōu)化需要滿足的基本條件。
(1)積分吻合度。在獲得最優(yōu)控制律后,可以利用數值積分近似理想開環(huán)飛行試驗,通過積分軌跡與設計軌跡的偏差大小評價軌跡優(yōu)化結果的控制精度,本文將該指標定義為積分吻合度,即
(3)
式中:I3(i)為算法i的積分吻合度;xi,L(k)為算法i第k時刻的積分狀態(tài)向量;xi(k)為算法i第k時刻的狀態(tài)向量,通常考察高度、經度及緯度等狀態(tài)。
(2)控制指令平滑度??刂浦噶畹膭×易兓瘯o系統(tǒng)造成實現上的困難,其平滑度是衡量軌跡性能的重要指標。相鄰時刻控制指令的差分代表了控制指令的平滑度,其計算公式為
(4)
式中:I4(i)為算法i的控制指令平滑度;ui(k)為算法i第k時刻的控制指令向量,通常包括攻角及傾側角。
1.3 安全性
(1)最大過載值。限于飛行器結構和彈載設備的承載能力,需對最大過載進行評估,最大過載值為
(5)
式中:ni(k)為算法i第k時刻的過載。
(2)最大動壓值。動壓若超過一定范圍,飛行器結構會受到嚴重影響,需要對其進行限制,最大動壓值為
(6)
式中:qi(k)為算法i第k時刻的動壓。
(3)最大熱流值。為了保證飛行器熱防護系統(tǒng)正常工作,需要對最大熱流密度進行評估,最大熱流值為
(7)
(4)總吸熱量。較小的吸熱量可以有效減輕熱防護系統(tǒng)的質量,從而提高有效載荷的設計裕量??偽鼰崃繛?/p>
(8)
1.4 過渡性
過渡性即飛行器的初始再入點和目標終點約束,意味著再入段和前后階段的銜接。
(1)再入點約束滿足度。再入點約束通常包括飛行器位置、速度等約束,再入點約束滿足度為
(9)
式中:xi,C(k)為k=1時算法i的初始狀態(tài)約束向量,I9(i)為再入點約束滿足度。
(2)終端約束滿足度。終端約束通常包括飛行器位置、速度等狀態(tài),終端約束滿足度為
I10(i)=∑|xi,C(k)-xi(k)|,k=Ki
(10)
式中:k=Ki時xi,C(k)為算法i的終端狀態(tài)約束向量,I10(i)為終端約束滿足度。
1.5 最優(yōu)性
最優(yōu)性是軌跡優(yōu)化問題關注的焦點,同時也是評估軌跡優(yōu)化效果的直觀依據。
(1)再入飛行時間。較短的飛行時間可以降低吸熱量,有效提高突防能力。再入飛行時間指標為
(11)
(2)優(yōu)化目標。目標函數的最優(yōu)性是判斷軌跡最優(yōu)性最直接的依據,同時也是判斷優(yōu)化算法性能的重要指標。算法i的優(yōu)化目標為
(12)
1.6 層次化綜合評估指標體系
本文指標體系如圖1所示,包括目標層、準則層及指標層,其中準則層元素為C=(Ci),i=1,…,5,指標層元素為I=(Ii),i=1,…,12。當同時參與評估的優(yōu)化算法為A={A1,A2,…,Am}時,根據評估指標集可獲得原始指標數據矩陣,即原始決策矩陣
(13)
式中:bij為算法i的第j個指標值;m由使用者決定,本文中n=12。
圖1 層次化綜合評估指標體系
為了避免指標類型與量綱差異對評估結果產生不利影響[8],同時方便決策者比較,本文通過規(guī)范化處理將式(13)原始決策矩陣映射到[0,100]區(qū)間,即
(14)
(15)
對于多指標綜合評估,需要根據指標的重要程度為其賦予相應的權重。目前,權重的確定方法主要有主觀賦權法、客觀賦權法及組合賦權法等[8]??紤]到高超聲速飛行器的模型復雜性與數據保密性等問題,利用客觀賦權法計算指標權重其合理性往往難以保證。因此,本文依據專家經驗,基于層次分析法(analytic hierarchy process, AHP)[9]計算指標權重,并利用遺傳算法改進其權重計算過程。
以AHP法中建立的兩兩比較判斷矩陣為依據,綜合考慮最小歐氏距離與最少違例準則,可將指標權重的計算問題轉化為一類多目標優(yōu)化問題[10]。
設S={aij|j>i}為判斷矩陣的上三角陣元素,指標權重向量ω=[ω1,…,ωn]T的可行解集Q可表示為
(16)
利用權重比值與判斷矩陣上三角陣對應元素的歐氏距離來衡量權重向量的近似精度,即
(17)
另一方面,為了保證權重優(yōu)先級與判斷矩陣信息保持一致,采用最少違例準則對權重進行約束
(18)
式中
(19)
權衡2種衡量標準,給定相應的權重系數,可將該多目標優(yōu)化問題變換為單目標優(yōu)化問題,即
(20)
式中:系數α∈[0,1],本文中α取為0.5。
采用遺傳算法求解式(20),即可獲得評估所需要的指標權重向量。通過權重逐層相乘,最終獲得底層指標對于評估目標的重要性排序,即綜合權重
(21)
3.1 加權規(guī)范化決策矩陣
利用式(15)規(guī)范化決策矩陣與式(21)底層指標綜合權重,即可構造評估所需要的加權規(guī)范化決策矩陣
(22)
在此基礎上,基于AHP法的評估可直接給出算法i的綜合評估值
(23)
AHP評估結果僅基于指標數值與對應權重的乘積求和,它并未從全局角度進行考察,只能得到優(yōu)化算法的抽象排序,無法說明再入軌跡的整體特征。針對這一不足,本節(jié)在式(22)加權規(guī)范化決策矩陣基礎上展開討論,綜合TOPSIS法[11]與灰色關聯分析(grey relational analysis, GRA)法[12]這2種算法的特點,提出了一種綜合排序方法。
3.2 灰色TOPSIS加權法
TOPSIS是一種逼近理想解的排序方法,依據被評估方案與正、負理想方案在空間距離上的遠近進行排序,TOPSIS一個明顯的缺點在于:當備選解與理想點歐氏距離更近時,可能與負理想點的歐氏距離也更近[13]。GRA基于灰色關聯度,側重分析數據序列的幾何關系和曲線形狀,將曲線之間的相似程度大小作為數據序列關聯程度的衡量標準。
本文綜合被評估方案在空間距離與曲線形狀上與理想方案的貼近度,提出一種新的多目標決策方法——灰色TOPSIS加權法(weighted grey TOPSIS, WGT),計算步驟如下。
(24)
(25)
(5)計算加權復合偏差矩陣
式中:γ∈(0,1)為加權系數,由設計者決定,體現了決策者對2種算法的偏好,本文取γ=0.5。
(6)計算各算法方案與正負理想解的綜合偏差
(28)
(29)
(7)計算各算法方案的綜合相對貼近度
(30)
(8)根據相對貼近度Ti對優(yōu)化算法進行排序,Ti越大對應的優(yōu)化算法性能越好,反之則越差。
WGT法從相對貼近度的構造角度對TOPSIS法進行了改進,在一定程度上彌補了TOPSIS法本身的不足。此外,由于評估指標的絕對正理想解與絕對負理想解不會受到參評數據的影響而產生變化,避免了逆序現象,從而降低了不確定性。
3.3 優(yōu)化算法綜合評估策略
本文綜合評估策略的原理流程如圖2所示,包括再入軌跡優(yōu)化、飛行仿真驗證、評估指標提取和算法性能評估4部分,形成了完整的閉環(huán)評估過程,具有良好的封裝性與通用性,評估輸出結果可以對不同的軌跡優(yōu)化算法進行綜合評價,同時也能為優(yōu)化算法自身的改進提供量化反饋信息。
為了驗證本文綜合評估策略的有效性,以Chebyshev偽譜法(Chebyshev pseudospectral method, CPM)[14]與粒子群法(particle swarm optimization,PSO)[15]為對象,在通用航空飛行器[16]三自由度動力學模型基礎上進行再入軌跡優(yōu)化實例仿真與評估分析。
4.1 仿真實驗條件
仿真平臺采用2.33 GB主頻CPU、2 GB內存的PC機,軟件環(huán)境為Matlab 2009。以再入飛行時間最短為軌跡優(yōu)化目標;初始狀態(tài)為高度100 km,速度7 200 m/s,經度160°,緯度25°,航跡角-2°,航向角58°;終端狀態(tài)約束為高度20 km,經度232°,緯度37°,速度1 km/s;過程約束中最大熱流密度為1 MW/m2,最大動壓為400 kPa,最大過載為6。
為了簡化計算過程,根據1.1節(jié)關于穩(wěn)定性的描述,以CPM與PSO分別產生5組彈道數據為例進行統(tǒng)計分析,以彈道數據協方差的跡作為穩(wěn)定性指標數據,以均值作為算法典型軌跡數據。經計算,2種算法的典型方案軌跡如圖3所示。
4.2 指標數據提取
獲得方案數據后,根據1.6節(jié)建立的評估指標數學模型進行計算處理,獲得的CPM與PSO算法評估指標數據如表1所示。需要指出,本例中優(yōu)化目標與最短飛行時間指標為同一指標。
4.3 指標權重計算
在AHP判斷矩陣基礎上基于遺傳算法計算指標權重,采用10位二進制編碼,種群數為500,迭代次數為200, 交叉概率為0.65, 變異概率為0.1,用輪盤算法進行選擇操作。指標層元素對于評估目標的綜合權重通過指標層權重與對應準則層權重相乘獲得。
圖2 軌跡優(yōu)化算法綜合評估策略流程圖
算法I1I2/sI3I4I5I6/kW·m-2I7/kPaI8/MJI9I10I11/sCPM43251275505239472539699138993133045421487PSO75401352396785261551544337483266034981485
圖3 CPM與PSO算法再入方案軌跡3D圖
本例中指標I11與I12相同,最終指標層元素綜合權重向量為
ω=[0.091 9,0.046 0,0.165 9,0.110 0,
0.044 4,0.060 4,0.076 5,0.060 2,
0.068 9,0.068 9,0.206 9]T
4.4 評估結果分析
利用式(14)對表1中的評估指標數據進行歸一化處理,并分別采用TOPSIS、GRA與本文提出的WGP方法對算例進行評估,結果如表2所示,評分越高算法性能越好,排序越靠前。
表2 軌跡優(yōu)化算法綜合評分結果
從表2可看出:3種算法給出的評估結果中,CPM算法的綜合性能評分均高于PSO算法;本文WGT方法與TOPSIS及GRA方法的評估結論保持了良好的一致性,說明本文WGT方法是合理的,能夠對不同優(yōu)化算法進行綜合排序;由于WGT方法對TOPSIS與GRA進行了融合,考察內容同時包含了算法數據在曲線形狀及空間距離上與理想最優(yōu)解的差距信息,評估角度更加全面,評估得分更為合理。
WGT方法步驟中式(27)為加權復合偏差矩陣,代表了被評估算法與負理想組的空間偏差以及與正理想組的關聯程度,其元素值越大說明評估指標與負理想組距離越遠且與正理想組關聯越強,亦即性能越好。分析其矩陣數據,可獲得符合常規(guī)評估習慣的算法細節(jié)信息,為算法的改進提供事實依據。本例中WGT方法的加權復合偏差矩陣折線圖如圖4所示。
從圖4可以看出,2種優(yōu)化算法的表現各有千秋。在算法穩(wěn)定性I1與實時性I2方面,PSO算法明顯落后于CPM算法,分析原因在于PSO算法是一種全局性的隨機搜索算法,需要大量的數據樣本和迭代計算,而CPM將問題轉化為參數的非線性規(guī)劃問題,并基于梯度信息尋優(yōu),求解效率更高。隨著彈載計算機硬件執(zhí)行速度的提升,加之以算法改進和代碼優(yōu)化等措施,CPM更有望發(fā)展成為一種在線軌跡優(yōu)化求解算法。
圖4 本文WGT方法加權復合偏差折線圖
CPM算法的積分吻合度指標I3不如PSO算法,原因在于CPM算法只在離散的配點處滿足動力學方程約束,而PSO算法在求解過程中將節(jié)點處的控制變量代入動力學方程并通過數值積分獲得狀態(tài)量,一定程度上使其滿足了積分軌跡與優(yōu)化軌跡的一致性。另一方面,CPM獲得的控制律平滑度I4明顯優(yōu)于PSO算法,更易于工程實現,這得益于CPM優(yōu)化算法在控制量變化率約束計算上的精度控制。
此外,由于均以起點狀態(tài)為求解基礎,2種算法的起點狀態(tài)偏差I9均得到了嚴格控制;CPM的終端狀態(tài)偏差I10雖略大于PSO,但仍在制導控制系統(tǒng)可調整范圍內。在最優(yōu)性方面,CPM與PSO算法獲得的最短再入飛行時間相差無幾,說明對于高超聲速飛行器最短再入時間軌跡優(yōu)化問題,2種算法均具有良好的尋優(yōu)性能。
綜合來看,CPM算法總體性能表現更出色,但其在可行性與過程約束控制上仍有改進的空間,而PSO算法的實時性是制約其實際應用的最大瓶頸,當不考慮求解效率時,仍不失為一種有效的軌跡優(yōu)化算法。
針對高超聲速再入飛行器軌跡優(yōu)化算法優(yōu)選的工程問題,建立了一套兼顧優(yōu)化算法特性和飛行軌跡質量的評估指標體系,利用遺傳算法與AHP法計算指標權重,提出了一種灰色TOPSIS加權排序法,建立了完整的再入軌跡優(yōu)化—飛行仿真驗證—算法性能評估閉環(huán)設計流程。對CPM算法和PSO算法的仿真實驗表明,本文評估策略實現了算法性能的量化過程,指標體系和評估方法科學有效,能夠為決策者快速遴選出適合任務需求的最優(yōu)算法,同時也為被評估算法的改進提供了具體的數據參考。
[1] ZHAO J, ZHOU R, JIN X. Progress in reentry trajectory planning for hypersonic vehicle [J]. Journal of Systems Engineering and Electronics, 2014, 25(4): 627-639.
[2] TANCREDI U, GRASSI M, CORRARO F, et al. Robustness analysis for terminal phases of reentry flight [J]. Journal of Guidance, Control, and Dynamics, 2009, 32(5): 1679-1683.
[3] HANSON J, JONES R, KRUPP D. Advanced guidance and control methods for reusable launch vehicles: test results [C]∥Proceedings of AIAA Guidance Navigation and Control Conference. Reston, VA, USA: AIAA, 2002: 4561-4569.
[4] BRUNNER C W, LU P. Comparison of fully numerical predictor-corrector and Apollo skip entry guidance algorithms [J]. The Journal of the Astronautical Sciences, 2012, 59(3): 517-540.
[5] 馬衛(wèi)華. 高超聲速飛行器制導與控制性能評估方法 [J]. 航天控制, 2012, 30(4): 7-12. MA Weihua. Research on evaluation method of guidance and control performance for hypersonic vehicle [J]. Aerospace Control, 2012, 30(4): 7-12.
[6] RINAT K, BEN-ASHER J Z. Worst-case distributions for performance evaluation of proportionally guided missiles [J]. Journal of Guidance, Control, and Dynamics, 2000, 23(5): 895-898.
[7] 董春云, 蔡遠利. 基于正交試驗設計的彈道優(yōu)化算法評估研究 [C]∥第32屆中國控制會議論文集. 北京: 中國自動化學會控制理論專業(yè)委員會, 2013: 8542-8545. DONG Chunyun, CAI Yuanli. Orthogonal design based evaluation for trajectory optimization algorithms [C]∥The 32nd Chinese Control Conference. Beijing: Technical Committee on Control Theory, Chinese Association of Automation, 2013: 8542-8545.
[8] 張杰, 唐宏, 蘇凱, 等. 效能評估方法研究 [M]. 北京: 國防工業(yè)出版社, 2009: 8-26.
[9] SAATY T L. Decision making with the analytic hierarchy process [J]. International Journal of Services Sciences, 2008, 1(1): 83-98.
[10]SIRAJ S, MIKHAILOV L, KEANE J A. Preference elicitation from inconsistent judgments using multi-objective optimization [J]. European Journal of Operational Research, 2012, 220(2): 461-471.
[11]OLSON D L. Comparison of weights in TOPSIS models [J]. Mathematical and Computer Modelling, 2004, 40(7): 721-727.
[12]WU H H. A comparative study of using grey relational analysis in multiple attribute decision making problems [J]. Quality Engineering, 2002, 15(2): 209-217.
[13]華小義, 譚景信. 基于“垂面”距離的TOPSIS法: 正交投影法 [J]. 系統(tǒng)工程理論與實踐, 2004, 24(1): 114-119. HUA Xiaoyi, TAN Jingxin. Revised TOPSIS method based on vertical projection distance: vertical projection method [J]. Systems Engineering: Theory & Practice, 2004, 24(1): 114-119.
[14]FAHROO F, ROSS I M. Direct trajectory optimization by a Chebyshev pseudospectral method [J]. Journal of Guidance, Control, and Dynamics, 2002, 25(1): 160-166.
[15]RAHIMI A, DEV KUMAR K, ALIGHANBARI H. Particle swarm optimization applied to spacecraft reentry trajectory [J]. Journal of Guidance, Control, and Dynamics, 2012, 36(1): 307-310.
[16]PHILLIPS T H. A common aero vehicle model, description and employment guide [R]. New York, USA: Schafer Corporation for AFRL and AFSPC, 2003.
(編輯 劉楊)
An Evaluation Strategy of Trajectory Optimization Algorithms for Hypersonic Reentry Vehicle
DONG Chunyun,CAI Yuanli
(School of Electronic and Information Engineering, Xi’an Jiaotong University, Xi’an 710049, China)
A comprehensive evaluation strategy is proposed to deal with the evaluation of various trajectory optimization algorithms for the hypersonic reentry vehicle. An integrated index system is established by taking the stability and real-time performance of each algorithm itself as well as the feasibility, security, transitivity and optimality of its optimization result into account. And the calculation of index weights is transformed into an optimization problem based on the pairwise judgement matrix of the analytic hierarchy process, and the Euclidean distance and the number of violations are used as precision measures. The genetic algorithm is used to solve the optimization problem. Then, the normalized decision matrix is obtained, and a weighted grey technique for order preference by similarity to ideal solution (TOPSIS) is proposed by synthesizing the nearness degree in both the space and curve between the algorithm data and the ideal control groups to achieve the final evaluation results. Simulation results show that the proposed strategy uses objective data to quantify the performance of trajectory optimization algorithms, and forms a comparative evaluation standard for various algorithms. The strategy can help designers quickly select an optimal algorithm according to different mission requirements and avoid blindness and subjectivity.
hypersonic reentry; trajectory optimization; algorithm evaluation
2015-08-08。 作者簡介:董春云(1989—),女,博士生;蔡遠利(通信作者),男,教授,博士生導師。 基金項目:國家自然科學基金資助項目(61463029,61308120,61202128);宇航動力學國家重點實驗室開放基金資助項目(2011ADL-JD0202)。
時間:2016-01-13
10.7652/xjtuxb201604005
TP29
A
0253-987X(2016)04-0028-07
網絡出版地址:http:∥www.cnki.net/kcms/detail/61.1069.T.20160113.2000.012.html