黃瑞松,李 浩,韋常柱,崔乃剛
(哈爾濱工業(yè)大學 航天學院,哈爾濱 150001)
隨著航天發(fā)射技術的逐漸成熟,迫于發(fā)射成本居高不下的現(xiàn)實,世界各國開始對亞軌道可重復使用飛行器(Sub-orbital Reusable Launch Vehicle, SRLV)進行了研究[1-4]。SRLV是繼航天飛機之后的第二代可重復使用飛行器,圖1示出了SRLV與一次性火箭的組合體?;鸺龑?00 kg的衛(wèi)星送入高度700 km的太陽同步軌道,而SRLV與火箭分離后則返回原場并自動著陸,實現(xiàn)重復使用。
圖1 火箭+SRLV組合體結構Fig.1 Structure of Rocket+SRLV system
SRLV在執(zhí)行飛行任務前需要事先進行大量的軌跡優(yōu)化設計工作,且SRLV的飛行時序多,飛行環(huán)境一般較為復雜[5-7]。運載器從地面起飛后,先經(jīng)歷助推爬升,到達一定的高度和速度后SRLV與火箭分離,然后火箭繼續(xù)飛行將衛(wèi)星送入預定軌道,而SRLV通過姿態(tài)翻轉、二次點火實現(xiàn)亞軌道再入,最后返回特定的著陸場[8]。分析可知,為了令衛(wèi)星精確入軌,同時使得SRLV安全返回,必須對整個飛行過程進行嚴格的設計,以滿足入軌和返航過程中的各項飛行約束(如過載、動壓等)。因此,軌跡優(yōu)化設計成為解決SRLV全程軌跡設計問題的一種有效解決途徑。
SRLV全程軌跡設計包含了兩方面內(nèi)容:總體參數(shù)設計與軌跡參數(shù)設計。傳統(tǒng)的優(yōu)化方法一般采用總體參數(shù)與軌跡參數(shù)分別設計,這樣會犧牲掉飛行器的部分性能[9-12],而對總體參數(shù)和軌跡參數(shù)進行一體化設計可以最大程度地挖掘SRLV的設計性能。傳統(tǒng)方法進行一體化優(yōu)化的難點在于難以保證全局收斂,為此研究人員對這個問題進行了深入研究[13-15]。
本文采用了具有全局收斂性的記憶優(yōu)化方法,該方法以記憶原理為基礎,使用記憶元來存儲試探解的狀態(tài),包括試探解矢量、試探解記憶值、更新時間、記憶狀態(tài)、遺忘狀態(tài)。每次進行隨機搜索時,記憶元會根據(jù)目標函數(shù)值的變化來確定試探解的優(yōu)劣,并通過增大或減小記憶值來更新試探解的記憶和遺忘狀態(tài)。隨著搜索的不斷進行,質(zhì)量差的試探解會被遺忘,因此剩下的試探解會越來越少,算法的收斂速度也將越來越快。
采用如圖1所示的SRLV作為研究對象,以此對本文給出的記憶優(yōu)化方法進行驗證。本文主要分為以下四個部分。
根據(jù)認知心理學的定義,記憶是對外部世界信息的分辨、保持、確認和回憶的過程[16],包括瞬時、短時、長時記憶三種,如圖2所示。
圖2 記憶的原理Fig.2 Principle of memory
瞬時記憶是大腦對外界信息進行識別和過濾后的最初形態(tài);短時記憶則是通過不斷的刺激進一步存儲在大腦中的信息;長時記憶是長期刺激的產(chǎn)物,是記憶的主要部分。生物體利用長時記憶完成對客觀世界的理解和認知,并以特定行為來處理類似的外界刺激。遺忘行為則可以有效地減少無用信息的存儲。
優(yōu)化問題可描述為:
其中,Rn表示n維歐幾里得空間,為控制矢量,S為搜索域,f(X)為目標函數(shù)為不等式約束為等式約束,I、E分別為不等式、等式約束個數(shù)。
優(yōu)化問題(1)的目標函數(shù)也可表示為
式中,F(xiàn)max為無窮大正數(shù),用于將不滿足約束的試探解與滿足約束的試探解區(qū)分開來。
所謂的人工記憶系統(tǒng)(Artificial Memory System,AMS)定義為N個記憶元的系統(tǒng),記憶元包含試探解特性和記憶殘留值。在求解空間S中任意挑選N個點作為優(yōu)化問題(1)的試探解,即每個點對應一個記憶元,即點Xi由記憶元Mi來描述。AMS利用瞬時、短時、長時記憶三個系統(tǒng)分別處理瞬時、短時、長時記憶系統(tǒng)。
AMS在優(yōu)化過程中不斷對各個點進行掃視。當掃視到點Xi時,記憶元Mi接收到刺激被激活,此時AMS對點Xi產(chǎn)生了瞬時記憶。點Xi產(chǎn)生的刺激有兩種類型:
1)有效刺激。此時點Xi的質(zhì)量很高,即目標函數(shù)值變小,記憶元Mi會加強關于點Xi的記憶。
2)無效刺激。此時點Xi的質(zhì)量一般,即目標函數(shù)值變大,記憶元Mi會減弱對于點Xi的記憶。
算法的工作原理如圖3所示。
圖3 記憶優(yōu)化算法工作原理圖Fig.3 Working principle of the memory-based optimization method
迚行第一次掃視,記憶元將點默認標記為瞬時記憶狀態(tài)。AMS在解空間內(nèi)不斷掃視各個點,會有越來越多的點被逐漸遺忘。記憶元Mi對點Xi選擇是否遺忘取決于記憶值是否低于遺忘閾值。點一旦被遺忘,AMS將不會再對其迚行狀態(tài)更新。若記憶值高于記憶閾值,點Xi會被標記為相應閾值的記憶狀態(tài)。
AMS不斷地對各個點迚行掃視,其中一些質(zhì)量較高的點會向全局最優(yōu)解位置逐漸地靠近,而其它點會被不斷遺忘。記憶元由試探解、記憶值、更新時間、記憶狀態(tài)、遺忘狀態(tài)這5個元素構成,即:
式中:為試探解;mi為記憶值,為更新時間;為記憶狀態(tài),當時,則說明點分別被標記為瞬時、短時或長時記憶狀態(tài);fi為遺忘狀態(tài),當反之則否。
下面對記憶優(yōu)化算法的試探解演化策略及其遺忘記憶模型迚行說明。
在優(yōu)化過程中,點的位置是跟其它點的狀態(tài)有一定關聯(lián)的,因此,在時期t-1,記此時各個點的位置為由于此時長時記憶系統(tǒng)已經(jīng)擁有了一定數(shù)量的記憶元,為了加快優(yōu)化速度,從中挑選出L個記憶元,記此時的試探解集合為為了保證搜索過程的隨機性,本文給出了三種試探解演化策略。
1)策略1
從長時記憶系統(tǒng)中隨機挑選的L個記憶元均為質(zhì)量很高的記憶元,此時點在下個時期t時的狀態(tài)值如式(4)所示:
式中:集合B從中隨機地挑出W個數(shù)字,且
2)策略2
為了避免足陷入局部最優(yōu)解,分別取mI個記憶元與其他個記憶元對應試探解迚行加權,保證Xi的靈活性。此時,點在下個時期t時的狀態(tài)值如式(5)所示:
式中:均為常數(shù),為參選取的記憶元數(shù),
3)策略3
在長時記憶系統(tǒng)中一定會有一個狀態(tài)不劣于當前記憶元Mi的記憶元則記憶元Mk滿足此時,點Xi在下個時期t時的狀態(tài)值如下所示:
通過直接繼承記憶元的部分特征,可以很好地改善的質(zhì)量。
以上每個策略在每次搜索時都僅僅更新Xi的一小部分變量的狀態(tài)值,不僅可以保證收斂的快速推迚,還允許系統(tǒng)具有很好的靈活性,不至于陷入局部最優(yōu)而導致優(yōu)化失敗。
在時期t,記憶元Mi對點Xi的記憶值為則記憶元Mi根據(jù)記憶值分別被標記為瞬時記憶狀態(tài)(I)、短時記憶狀態(tài)(S)或長時記憶狀態(tài)(L),即:
式中,分別為短時和長時記憶狀態(tài)閾值。
記憶是隨著時間而變化的。本文參考艾賓浩斯遺忘曲線設計遺忘模型,設記憶衰減函數(shù)為
式中:tΔ為時間變化量;初始時刻t=0;系數(shù)α為正數(shù),用于調(diào)節(jié)記憶衰減的速度。對于瞬時、短時和長時記憶,三者的記憶衰減速度不同,因此分別給出了
不難發(fā)現(xiàn),記憶衰減函數(shù)滿足:可見遺忘模型接近記憶的實際衰減模型。
記憶不僅可以逐漸衰減,也可以逐漸增強。典型刺激會增強記憶,令記憶值增量為目標函數(shù)變化越大,說明刺激越有利,具體體現(xiàn)為記憶值增量就越大,反之則否。表示為
式中,系數(shù)h為正數(shù),用于表征刺激的強度,稱為刺激調(diào)節(jié)系數(shù)。
記憶包括回憶和對刺激的反應,即:
結合記憶衰減函數(shù)可知,時期t下的真實記憶為:
式中:用于控制回憶衰減的速度;λ為一正常數(shù),其形式類似于α。
記憶的衰減速度隨時間的推進應越來越慢,與記憶出現(xiàn)的時期(或記憶值)成正比,且應滿足:
令函數(shù)其形式類似于α),式(13)可表示為
綜上所述,記憶更新模型表示為
令若給定時間增量tΔ,則β也變成一個常數(shù),且0<β<1,因此式(15)變?yōu)?/p>
根據(jù)飛行任務要求,SRLV將500 kg的衛(wèi)星送入700 km的SSO軌道,故飛行器兩級入軌彈道需滿足最終軌道高度為700 km、軌道速度為7510 m/s、彈道傾角約為0°以及軌道傾角為98.187°這4個條件。
一次性火箭(ELV)一級、二級結構質(zhì)量分別為2 700 kg、1 288 kg,其中整流罩為300 kg。發(fā)動機推力分別為1911 kN、150 kN,燃料秒耗量分別為688 kg/s、44.8 kg/s。SRLV結構質(zhì)量為16 900 kg。初始時刻經(jīng)緯度為100.298°、40.9605°,高度為0,速度為0。
本文選取的控制參數(shù)為總體參數(shù)與軌跡參數(shù),即試探解的元素有:
① 總體參數(shù):ELV一級燃料質(zhì)量(耗盡關機)、ELV二級燃料質(zhì)量、SRLV燃料質(zhì)量;
② 軌跡參數(shù):一級極值攻角、一級極值攻角系數(shù)、一級垂直上升時間、二級末程序角、二級第一次有動力飛行時間、二級無動力滑行時間、二級第二次有動力飛行時間、攻角剖面參數(shù)。
各項約束條件設置如表1所示。另外,記憶優(yōu)化算法中各項參數(shù)取值分別為:
表1 約束條件設置Tab.1 Settings of constraints
采用發(fā)射慣性坐標系建立飛行器的全程軌跡運動模[14],以燃料最省為優(yōu)化目標,分別采用序列二次規(guī)劃方法和記憶優(yōu)化方法進行軌跡優(yōu)化,前者不收斂,后者耗時1 382 s即得到收斂結果。軌跡/總體參數(shù)一體化優(yōu)化仿真結果如圖4~11所示。
圖4 ELV飛行高度變化曲線Fig.4 ELV’s height history
圖5 ELV飛行速度變化曲線Fig.5 ELV’s velocity history
圖6 ELV彈道傾角變化曲線Fig.6 ELV’s trajectory inclination angle history
圖7 ELV軌道傾角變化曲線Fig.7 ELV’s orbital inclination angle history
圖8 SRLV飛行軌跡曲線Fig.8 SRLV’s trajectory history
圖9 SRLV飛行速度變化曲線Fig.9 SRLV’s velocity history
圖10 SRLV動壓變化曲線Fig.10 SRLV’s dynamic pressure history
由仿真結果可知:1)ELV入軌高度700.04 km,速度7 510.5 m/s,彈道傾角0.000 3°,軌道傾角98.187 0°,滿足有效載荷入軌要求;2)SRLV最終高度3001.0 m,速度 148.6 m/s,彈道傾角–11.01°,距離著陸場 10.01 km,滿足返回原場要求;3)SRLV返回原場過程中,最大法向過載6.34g,最大動壓18.75kPa,滿足各項約束。
另外,試探解的最優(yōu)解見表2。由表2中數(shù)據(jù)可知,相比于初始的總體設計參數(shù),ELV一級可以少攜帶864.1 kg燃料,二級則減少了86.4 kg燃料,SRLV減少了69.6 kg,可見采用一體化優(yōu)化不僅可以滿足飛行任務要求,而且可以保證一定的總體性能余量。
需要說明的是,若事先在長時記憶庫中給出若干近似最優(yōu)解,則軌跡優(yōu)化耗時可以減少至10 s以內(nèi),因此該方法在收斂速度上也具有一定的優(yōu)勢。
表2 試探解的最優(yōu)解Tab.2 Final value of alternative solutions
圖11 SRLV法向過載變化曲線Fig.11 SRLV’s normal acceleration history
針對基于記憶原理的SRLV全程軌跡優(yōu)化設計方法開展研究,取得了如下具創(chuàng)新性的研究成果:
1)針對SRLV發(fā)射衛(wèi)星入軌同時能夠安全返回著陸場的要求,給出了“總體參數(shù)+軌跡參數(shù)”一體化的參數(shù)優(yōu)化軌跡設計方案,增強了飛行任務可實現(xiàn)性。
2)推導給出了基于記憶原理的軌跡優(yōu)化設計方法。與傳統(tǒng)的軌跡優(yōu)化方法相比,由于不依賴梯度信息,計算量大大減少。把遺忘的特性應用于試探解的篩選中,可以逐步減少試探解的數(shù)量,進而有效地提高收斂速度。
3)在標準記憶優(yōu)化方法的基礎上,通過對待求解的軌跡優(yōu)化問題進行初步優(yōu)化,可以得到一些近似最優(yōu)解,將其導入長時記憶系統(tǒng),可以有效減少優(yōu)化初期的搜索時間。仿真表明:采用包含長時記憶系統(tǒng)的記憶優(yōu)化方法能夠減少約95%的收斂時間,在快速軌跡規(guī)劃領域中具有一定的應用前景。
參考文獻(References):
[1] Mains R C. Suborbital reusable launch vehicles need reusable research payloads[C]//AIAA Space 2011 Conference & Exposition. Long Beach, California, 2011.
[2] Starkey R P, Cannella M, Brendel J, et al. Development of a pistonless rocket engine pump suborbital flight test demonstrator[C]//50th AIAA/ASME/SAE/ASEE Joint Propulsion Conference. Cleveland ,OH, 2014.
[3] Parhi A, Mahesh V, Kalluru K. Development of slowburning solid rocket booster for RLV-TD hypersonic experiment[J]. Current Science, 2018, 114(1): 74-83.
[4] Lu Yu, Wang X W, Gao C H. Progress and prospect of reusable launch vehicle technology[J]. Missiles and Space Vehicles, 2017, 356(5): 1-7.
[5] Guo J G, Wang G Q, Zhou J. Attitude control for reentry reusable launch vehicle[C]//Control & Decision Conference. Yinchuan, China, 2016.
[6] Tian B, Fan W, Su R, et al. Real-time trajectory and attitude coordination control for reusable launch vehicle in reentry phase[J]. IEEE Transactions on Industrial Electronics, 2015, 62(3): 1639-1650.
[7] Qiao H, Sun P , Li X G. United trajectory design method for return to launch site of suborbital reusable launch vehicle[C]//AIAA International Space Planes and Hypersonics Technologies Conference. Xiamen, China, 2017.
[8] Yoshinori M, Shinji I, Takashige M, et al. Design study on a small-sized patially reusable launch system[C]//AIAA/CIRA International Space Planes and Hypersonics Sysyems and Technologies Conference. Reston, VA, 2005.
[9] 黃國強, 陸宇平, 南英. 飛行器軌跡優(yōu)化數(shù)值方法綜述[J]. 中國科學技術科學, 2012, 42(9): 1016-1036.
Huang G Q, Lu Y P, Nan Y. A survey of numerical algorithms for trajectory optimization of flight vehicles[J].Science China Technological Sciences, 2012, 42(9): 1016-1036.
[10] Kodera M, Ogawa H, Tomioka S, et al. Multiobjective design and trajectory optimization of space transport systems with RBCC propulsion via evolutionary algorithms and pseudo spectral methods[C]//AIAA SciTech forum.2014: 6265-6278.
[11] Fujikawa T, Tsuchiya T, Tomioka S. Multidisciplinary design optimization of a two-stage-to-orbit reusable launch vehicle with ethanol-fueled rocket-based combined cycle engines[J]. Transactions of the Japan Society for Aeronautical and Spaceences, 2017, 60(5): 265-275.
[12] Winston N, Sherine J. Ascent trajectory optimiztion for the first stage of a two-stage-to-orbit reusable launch vehicle with load factor constraint during re-entry[J].International Journal of Computer Technology and Applications (IJCTA), 2016 : 223-230.
[13] 張寧寧, 閔昌萬, 劉輝. 臨近空間直接入軌運載火箭級間比/彈道一體化優(yōu)化設計[J]. 飛行力學, 2014, 32(3) :258-261.
Zhang N N, Min C W, Liu H. Integrated optimization design for mass distribution/trajectory of near space directly injecting carrier rocket[J]. Flight Dynamics, 2014,32(3): 258-261.
[14] 孫樂園, 賈如巖, 楊枝山, 等. 重型運載火箭軌跡/總體參數(shù)一體化優(yōu)化方法[J]. 西北工業(yè)大學學報, 2016,34(6): 1101-1107.
Sun L Y, Jia R Y, Yang Z S, et al. An integrated optimization method of trajectory/system parameters for heavy launch vehicles[J]. Journal of Northwestern Polytechnical University, 2016, 34(6) : 1101-1107.
[15] Cui N G, Zhao L N, Huang R,Wei C Z. Parameters and trajectory overall optimization design of the combined cycle engine reusable launch vehicle[J]. Aerospace China,2016, 17(4): 14-20.
[16] Huang G Q, Li T, Lu Q Q. Artifitial memory-based optimization[J]. Space Engineering Theory & Practice, 2014,34(11): 2900-2912.