林云松1,彭良福**2,傅 勇3,葉 睿
(1.電子科技大學(xué) 自動(dòng)化工程學(xué)院,成都 611731;2.西南民族大學(xué) 電氣信息工程學(xué)院,成都 610041;3.成都大學(xué) 電子信息工程學(xué)院,成都 610106;4.成都海姆達(dá)爾科技有限公司,成都 610051)
一種新的通用航空機(jī)載防撞邏輯設(shè)計(jì)方法*
林云松1,彭良福**2,傅 勇3,葉 睿4
(1.電子科技大學(xué) 自動(dòng)化工程學(xué)院,成都 611731;2.西南民族大學(xué) 電氣信息工程學(xué)院,成都 610041;3.成都大學(xué) 電子信息工程學(xué)院,成都 610106;4.成都海姆達(dá)爾科技有限公司,成都 610051)
由于機(jī)載防撞系統(tǒng)(TCAS)是針對(duì)具有較大垂直高度變化率的大型飛機(jī)設(shè)計(jì)的,系統(tǒng)設(shè)定條件和與之相關(guān)的解脫建議并不能適用于通航飛機(jī)。針對(duì)通用航空的防撞問題,提出了一種基于馬爾可夫決策過程(MDP)的防撞邏輯設(shè)計(jì)方法。首先,將飛機(jī)空中相遇過程的動(dòng)態(tài)模型轉(zhuǎn)換為離散轉(zhuǎn)移函數(shù);然后,基于防撞系統(tǒng)結(jié)果事件末端效用函數(shù)進(jìn)行MDP建模,采用動(dòng)態(tài)規(guī)劃方法導(dǎo)出了最優(yōu)防撞邏輯的迭代方程;最后,給出了通航飛機(jī)最優(yōu)化防撞邏輯的設(shè)計(jì)流程并對(duì)最優(yōu)防撞邏輯進(jìn)行了計(jì)算機(jī)仿真。仿真結(jié)果表明,通過調(diào)整效用比參數(shù)可以在保證安全性能的同時(shí)有效降低系統(tǒng)告警率。在垂直相遇高度小于30 m的相遇過程占比高達(dá)18%的情況下,當(dāng)告警率大于0.85時(shí)系統(tǒng)的碰撞概率僅為2.88×10-4左右。該設(shè)計(jì)方法對(duì)我國在低空空域通用飛機(jī)防撞系統(tǒng)的研究具有一定的參考價(jià)值。
通用航空;低空空域;機(jī)載防撞系統(tǒng);馬爾可夫決策過程;最優(yōu)防撞邏輯
防撞系統(tǒng)的主要設(shè)計(jì)難點(diǎn)在于如何根據(jù)飛機(jī)的當(dāng)前狀態(tài)(包括位置和速度等信息)對(duì)飛機(jī)未來的飛行軌跡做出準(zhǔn)確的預(yù)測(cè)。由于飛機(jī)本身的動(dòng)態(tài)過程和飛行員對(duì)解脫建議響應(yīng)的不確定性,因此很難準(zhǔn)確預(yù)測(cè)相遇過程中飛機(jī)的軌跡。包括機(jī)載防撞系統(tǒng)(Traffic Alert and Collision Avoidance System,TCAS)在內(nèi)的許多防碰撞系統(tǒng)都采用直線型預(yù)測(cè)模型,其預(yù)測(cè)結(jié)果是飛機(jī)未來最可能的位置,這種方法的缺點(diǎn)是不能明確地考慮到很低概率的空中碰撞情況。為保證系統(tǒng)對(duì)偏離預(yù)測(cè)航跡的場(chǎng)景具有足夠的穩(wěn)健性,TCAS的防撞邏輯使用了復(fù)雜的啟發(fā)式規(guī)則和參數(shù)設(shè)置。TCAS II的性能指標(biāo)是與民航客機(jī)的飛行性能相匹配的,直接修改TCAS II防撞邏輯使之適應(yīng)于通航飛機(jī)的性能需求會(huì)付出巨大的開發(fā)成本。文獻(xiàn)[1-3]中研究了將未來的空中防撞概念擴(kuò)展到通用航空領(lǐng)域,但目前還沒有一個(gè)商用的適用于通航飛機(jī)的機(jī)載防撞系統(tǒng)[4]。
基于概率的預(yù)測(cè)模型不僅可以預(yù)測(cè)出飛機(jī)所有可能的飛行軌跡,而且能夠計(jì)算出飛機(jī)未來每條軌跡的概率[5]。如果防撞邏輯在發(fā)出解脫建議時(shí)不僅考慮當(dāng)前的狀態(tài),也能夠考慮到未來每條可能的飛行軌跡的概率以及未來可能作出的解脫決策,那么防撞系統(tǒng)就能更加可靠地防止空中碰撞,同時(shí)能保持較低的告警率。馬爾科夫決策過程(Markov Decision Process,MDP)是解決這類決策問題的一種有效方法。在MDP過程中,系統(tǒng)的狀態(tài)是根據(jù)一個(gè)確定的動(dòng)態(tài)模型發(fā)生變化的,MDP過程的解是在某個(gè)性能指標(biāo)下獲得的最優(yōu)策略。
本文提出了一種基于MDP的通航飛機(jī)機(jī)載防撞邏輯設(shè)計(jì)方法。首先,給出基于概率模型的機(jī)載防撞系統(tǒng)架構(gòu),采用sigma-point采樣和多線性插值方法對(duì)連續(xù)狀態(tài)空間離散化,將飛機(jī)空中相遇過程的狀態(tài)預(yù)測(cè)模型轉(zhuǎn)換為離散化的狀態(tài)轉(zhuǎn)移概率函數(shù);然后,提出了基于效用函數(shù)對(duì)防撞系統(tǒng)的MDP建模方法,并給出了防撞系統(tǒng)結(jié)果事件末端效用函數(shù)的定義,采用動(dòng)態(tài)規(guī)劃方法導(dǎo)出了最優(yōu)防撞邏輯的迭代方程;針對(duì)通用航空飛機(jī)的飛行性能和應(yīng)用場(chǎng)景,給出了通航飛機(jī)最優(yōu)化防撞邏輯的設(shè)計(jì)流程;最后,對(duì)防撞邏輯進(jìn)行了計(jì)算機(jī)仿真和性能評(píng)估。
2.1機(jī)載防撞系統(tǒng)的結(jié)構(gòu)
狀態(tài)轉(zhuǎn)移函數(shù)T(s,a,s′)表示系統(tǒng)從當(dāng)前狀態(tài)s執(zhí)行動(dòng)作a后轉(zhuǎn)移到下一個(gè)狀態(tài)的概率。觀測(cè)函數(shù)O(s′,a,o)表示系統(tǒng)采取動(dòng)作a,進(jìn)入狀態(tài)s′時(shí)觀察到o的概率。動(dòng)作邏輯單元根據(jù)當(dāng)前的信任狀態(tài)bt(sRA)和預(yù)測(cè)模型選擇動(dòng)作a,之前已發(fā)出過的解脫建議狀態(tài)sRA也可以作為輸入。
圖1 機(jī)載防撞系統(tǒng)結(jié)構(gòu)框圖Fig.1 Structure diagram of airborne collision avoidance system
2.2動(dòng)態(tài)模型
假定空中相遇過程中飛機(jī)的運(yùn)動(dòng)狀態(tài)主要和飛機(jī)的垂直加速度有關(guān)。當(dāng)飛行員對(duì)系統(tǒng)發(fā)布的解脫建議沒有作出響應(yīng)或系統(tǒng)沒有發(fā)布解脫建議時(shí),飛機(jī)的加速度服從高斯白噪聲模型。當(dāng)飛行員執(zhí)行系統(tǒng)發(fā)出的解脫建議后,飛機(jī)以規(guī)定的加速度(如0.25g)加速到目標(biāo)垂直速度范圍。在每個(gè)監(jiān)視周期(時(shí)間步長Δt)對(duì)狀態(tài)變量x(t)進(jìn)行離散化得到離散馬爾科夫模型:
x(t+Δt)=f(x(t),w(t),a(t))。
(1)
式(1)表示的運(yùn)動(dòng)方程如下:
(2)
τ(t+Δt)=τ(t)-Δt,
(3)
(4)
(5)
其中:飽和函數(shù)φL(y)=max(-L,min(L,y)),表示垂直方向的速度不超過模型參數(shù)L,設(shè)L=300 m/min。飛機(jī)垂直加速度與解脫建議有關(guān),例如:
(6)
(7)
2.3離散狀態(tài)轉(zhuǎn)移模型
對(duì)MDP過程的求解,需要將動(dòng)態(tài)模型離散化并建立離散狀態(tài)轉(zhuǎn)移模型T(s,a,s′)。采用多線性插值方法建立離散狀態(tài)轉(zhuǎn)移模型[5]。首先定義P(s|x)是給定連續(xù)狀態(tài)x條件下離散狀態(tài)s的概率分布,然后為包圍連續(xù)狀態(tài)x的多維網(wǎng)格頂點(diǎn)對(duì)應(yīng)的離散狀態(tài)s分配概率,概率的大小與s和x的接近程度成線性關(guān)系。狀態(tài)s距離x越近,被分配的概率值越大。系統(tǒng)的離散狀態(tài)轉(zhuǎn)移概率為
(8)
(9)
給定加速度的N個(gè)采樣點(diǎn)(如上面的5個(gè)sigma-point采樣點(diǎn)),P(x′|s,a)可近似為
(10)
3.1基于效用函數(shù)的MDP過程
馬爾科夫決策過程由一個(gè)四元組構(gòu)成(S,A,T,R),S和A分別表示有限的狀態(tài)集和動(dòng)作集。T(s,a,s′)表示當(dāng)前狀態(tài)s∈S經(jīng)過動(dòng)作a∈A(s)作用后,狀態(tài)s轉(zhuǎn)移到狀態(tài)s′∈S的概率分布。R(s)是末端狀態(tài)回報(bào)函數(shù),在狀態(tài)s執(zhí)行動(dòng)作a時(shí)獲得的回報(bào)函數(shù)為R(s,a)。
(11)
(12)
3.2回報(bào)函數(shù)
假定在末端時(shí)刻(τ=0)入侵機(jī)與本機(jī)之間垂直距離在30 m內(nèi)即可發(fā)生近空碰撞(Near Mid-air Collision,NMAC),根據(jù)解脫建議是否成功和是否必要來進(jìn)一步確定防撞系統(tǒng)結(jié)果事件的效用函數(shù)(Utility Function)。沒有導(dǎo)致NMAC的告警建議則被視為成功解脫,發(fā)生了NMAC的告警建議被視為不成功解脫。防撞系統(tǒng)運(yùn)行過程中可能的結(jié)果事件的效用分類如圖2所示。
圖2 防撞系統(tǒng)結(jié)果事件的效用Fig.2 Utilities of collision avoidance system outcomes
設(shè)定以上所有結(jié)果事件效用的排列如下:
Uincident≡ULA=UIC=UMD,
(13)
USA≡UCD=UFA,
(14)
Uincident (15) 其中:Uincident表示發(fā)生NMAC的效用,USA表示成功解脫的效用。 非碰撞結(jié)果的效用與是否發(fā)出解脫建議有關(guān),表示解脫建議狀態(tài)的離散變量sRA可以確定系統(tǒng)最終的效用是UCR還是USA。另外,sRA同時(shí)也建立了解脫建議和動(dòng)作a之間的對(duì)應(yīng)關(guān)系。例如:解脫建議狀態(tài)變量sRA僅有3個(gè)狀態(tài)值:COC(Clear of conflict)、DES (Descend)和CL(Climb),COC表示當(dāng)前沒有發(fā)出解脫建議,CL和DES分別表示要求飛機(jī)作出爬升或下降的機(jī)動(dòng)。 圖3給出了狀態(tài)變量sRA對(duì)應(yīng)的狀態(tài)空間和結(jié)果事件效用,系統(tǒng)狀態(tài)轉(zhuǎn)移軌跡源于COC狀態(tài)平面。當(dāng)系統(tǒng)發(fā)出解脫建議后,狀態(tài)軌跡從COC轉(zhuǎn)移到DES(或CL)狀態(tài)平面,狀態(tài)轉(zhuǎn)移軌跡按照解脫機(jī)動(dòng)的動(dòng)態(tài)過程繼續(xù)在DES(或CL)平面內(nèi)移動(dòng)??梢钥闯觯绻┒藸顟B(tài)沒有發(fā)生NMAC且沒有解脫建議,那么末端回報(bào)函數(shù)對(duì)應(yīng)的結(jié)果效用為UCR。如果確實(shí)發(fā)出了解脫建議且末端狀態(tài)沒有發(fā)生NMAC,那么末端回報(bào)函數(shù)對(duì)應(yīng)的結(jié)果效用為USA。 圖3 狀態(tài)變量sRA描述的狀態(tài)空間Fig.3 State spaces with status variable sRA 3.3最優(yōu)解脫策略 (16) 根據(jù)貝爾曼方程(11)可得到距末端時(shí)刻k步時(shí)狀態(tài)s的最優(yōu)條件期望效用函數(shù) (17) 設(shè)Uincident= 0,UCR=1,并且定義 USA=r(sRA)UCR, (18) 效用比r(sRA)為解脫建議成功時(shí)末端狀態(tài)效用函數(shù)相對(duì)于正確拒絕告警末端狀態(tài)效用函數(shù)UCR的比值,那么就有 r(sRA=COC)=1,0 (19) 式(17)可改寫為以下的迭代方程: (20) (21) (22) 本文主要針對(duì)以下幾個(gè)方面對(duì)基于MDP的通航機(jī)載防撞邏輯進(jìn)行優(yōu)化設(shè)計(jì)。 4.1適應(yīng)通航飛機(jī)的動(dòng)態(tài)模型 4.2通航飛行員對(duì)解脫建議的響應(yīng) 通航飛行員的訓(xùn)練水平一般不如商用飛機(jī)的飛行員,通航飛行員對(duì)解脫建議響應(yīng)時(shí)間可能是不確定的,不同飛行員對(duì)建議作出響應(yīng)的延遲時(shí)間也會(huì)有很大不同。采用文獻(xiàn)[8]提出的飛行員響應(yīng)概率模型以及對(duì)信任狀態(tài)bt(sRA)的更新方法,飛行員要么響應(yīng)系統(tǒng)當(dāng)前發(fā)出的解脫建議,要么忽略該建議。這時(shí)狀態(tài)變量sRA不僅表示了系統(tǒng)發(fā)出的解脫建議,同時(shí)還表示飛行員對(duì)建議的響應(yīng)情況。sRA狀態(tài)的數(shù)量和解脫建議的數(shù)量成線性關(guān)系(sRA有13個(gè)離散狀態(tài))。 4.3適應(yīng)通航飛行性能的解脫建議 與TCAS不同的是,由于通航飛機(jī)的垂直速率限制,通航防撞系統(tǒng)不發(fā)出增強(qiáng)建議和預(yù)防性建議。通航防撞邏輯發(fā)布的解脫建議分為初始解脫建議和后續(xù)解脫建議,它們要求飛機(jī)采用不同的機(jī)動(dòng)能力(即垂直加速度)到達(dá)目標(biāo)速度。 表1列出了通航防撞系統(tǒng)發(fā)出的解脫建議。COC表示當(dāng)前沒有發(fā)出告警或者終止告警,帶有前綴“S”的建議表示后續(xù)解脫建議。初始解脫建議包括爬升(CL)、下降(DES)和平飛(LEV),初始建議對(duì)應(yīng)于TCAS發(fā)布的校正RA建議。表1中還表明了當(dāng)前的解脫建議可以在哪些狀態(tài)之后發(fā)出,例如:COC可以在任意解脫建議之后發(fā)出,SDES 可以在CL或LEV之后發(fā)出,這樣SDES則對(duì)應(yīng)于TCAS的反轉(zhuǎn)RA建議;LEV和SLEV建議要求飛機(jī)作出水平飛行機(jī)動(dòng)(飛機(jī)的目標(biāo)垂直速度保持在±30 m/min之間),它們對(duì)應(yīng)于TCAS針對(duì)多機(jī)的雙向否定RA建議。 表1 通航防撞系統(tǒng)的解脫建議Tab.1 Resolution advisory set of general aviation collision avoidance system 4.4解脫建議的效用比 初始解脫建議都具有相同的效用比r(Alert0)=0.999。初始解脫建議效用比r(Alert0)越接近1,防撞系統(tǒng)就會(huì)越早地發(fā)出解脫建議,但同時(shí)也增大了告警率。反轉(zhuǎn)解脫建議的效用比r(Alert1)=0.94。r(Alert1)取值較小,可以限制系統(tǒng)發(fā)布反轉(zhuǎn)建議的頻率使飛機(jī)對(duì)飛行高度的偏離最小。后續(xù)平飛解脫建議效用比r(Alert2)=1,以使飛機(jī)能盡量保持安全的飛行高度。r(COC)=1.000 01,取值略微大于1以便在沖突解除后能促使系統(tǒng)發(fā)出沖突消除建議。 4.5解脫建議的協(xié)調(diào) 如果兩架飛機(jī)都裝備了防撞系統(tǒng),這時(shí)它們發(fā)布的解脫建議必須是協(xié)調(diào)的以防止解脫建議的方向相同。一種可行的方法是直接將TCAS的解脫協(xié)調(diào)機(jī)制集成到通航防撞邏輯中,例如:當(dāng)系統(tǒng)收到一條“不要爬升”的協(xié)調(diào)消息,則應(yīng)該忽略邏輯表中所有與協(xié)調(diào)消息不一致的建議,只發(fā)布剩下的具有最高期望效用值的解脫建議。 4.6防撞邏輯優(yōu)化設(shè)計(jì)流程 Step2τ=τ+1,如果τ=40,停止;否則轉(zhuǎn)Step3。 Step3 對(duì)給定的τ遍歷離散狀態(tài)s: (1) 對(duì)每個(gè)有效的狀態(tài)/動(dòng)作對(duì)(s,a)進(jìn)行sigma-point采樣,根據(jù)式(9)更新下一時(shí)刻的狀態(tài)x′; (2) 對(duì)狀態(tài)x′進(jìn)行多線性插值,得到包圍連續(xù)狀態(tài)x′的離散狀態(tài)s′的概率P(s′|x′); (3) 由式(10)和式(8)求出離散狀態(tài)轉(zhuǎn)移概率T(s,a,s′); (4) 由式(20)計(jì)算狀態(tài)s的最優(yōu)期望效用。 Step4 返回Step2。 4.7最優(yōu)動(dòng)作邏輯圖 (a)=0 m/min,=0 m/min,sRA=COC (b)=0 m/min,=0 m/min,sRA=DES/DES圖4 最優(yōu)動(dòng)作邏輯示意圖Fig.4 Optimal action plots 圖4(a)中本機(jī)和入侵機(jī)的初始狀態(tài)都是平飛且沒有發(fā)出任何解脫建議,藍(lán)色區(qū)域表示系統(tǒng)將會(huì)發(fā)出一個(gè)下降建議,綠色區(qū)域表示系統(tǒng)將發(fā)出一個(gè)爬升建議。圖4(b)中的DES/DES表示當(dāng)前兩架飛機(jī)處于平飛狀態(tài),系統(tǒng)已經(jīng)發(fā)出下降建議并且飛行員對(duì)發(fā)出的建議作出了響應(yīng)。藍(lán)色區(qū)域表示飛行員執(zhí)行的最優(yōu)動(dòng)作是繼續(xù)執(zhí)行下降建議;在黑色區(qū)域,當(dāng)本機(jī)在入侵機(jī)上方時(shí),系統(tǒng)反轉(zhuǎn)之前發(fā)出的下降建議,發(fā)出反轉(zhuǎn)爬升建議SCL。當(dāng)入侵機(jī)在本機(jī)下方且相對(duì)高度比較大時(shí),最優(yōu)策略是保持平飛。 與真實(shí)空中相遇過程不同的是,上述仿真環(huán)境采用的是兩架飛機(jī)對(duì)頭飛行的二維模型。對(duì)于實(shí)際的三維空中相遇過程,需要增加飛機(jī)水平方向的動(dòng)態(tài)模型,根據(jù)MDP過程計(jì)算出兩機(jī)相遇時(shí)間τ的概率分布,然后再對(duì)邏輯表進(jìn)行實(shí)時(shí)的線性內(nèi)插計(jì)算。 5.1安全性能曲線 安全性能曲線能直觀地反映出改變系統(tǒng)參數(shù)對(duì)防撞系統(tǒng)安全性和告警率的影響。在改變初始效用比r(Alert0)而其余效用比不變的情況下可得如圖5所示的安全性能曲線,其中每個(gè)樣點(diǎn)從50萬次仿真結(jié)果的估計(jì)值得到。圖中右上角的曲線部分對(duì)應(yīng)的r(Alert0)接近于1,而左下角的曲線部分對(duì)應(yīng)的r(Alert0)接近于0.9。 圖5 安全性能曲線Fig.5 Safety performance curve 可以看出,系統(tǒng)的安全性隨著告警率的增加而顯著提高,當(dāng)告警率大于85%時(shí)系統(tǒng)可獲得很高的安全性能。性能曲線有助于在給定所需安全性能的條件下合理選擇系統(tǒng)參數(shù)。 5.2性能評(píng)估 在MDP防撞邏輯的設(shè)計(jì)中,效用比r(sRA)是基于當(dāng)前的解脫建議狀態(tài)和動(dòng)作的,而對(duì)于某些需要“記憶”的效用比則必須引入新的狀態(tài)變量。通過使用在線效用比可以實(shí)時(shí)地對(duì)某些解脫建議進(jìn)行獎(jiǎng)懲而無需增加狀態(tài)變量。實(shí)時(shí)計(jì)算中,首先從離線的最優(yōu)邏輯表中插值得到當(dāng)前狀態(tài)的期望效用值,再乘以相應(yīng)的在線效用比(見表2)。表3分別給出了50萬次相遇過程中沒有使用在線效用比和使用了在線效用比參數(shù)的仿真結(jié)果。 表2 在線效用比參數(shù)Tab.2 Online utility ratio parameters 表3 防撞邏輯的仿真結(jié)果Tab.3 Simulation results of collision avoidance logic 如表3所示,3種仿真結(jié)果的空中碰撞概率都在萬分之二左右。沒有使用在線效用比參數(shù),即直接使用離線防撞邏輯表給出解脫建議的告警率最高,P(Alert)=1,并且在相遇過程中解除告警后再次發(fā)布解脫建議的概率P(COC)=0.23。使用在線效用比參數(shù)2可有效降低告警率和再次告警率,但同時(shí)增大了發(fā)布反轉(zhuǎn)告警的概率。在線效用比參數(shù)1的初始告警效用比與離線邏輯單元的相同,因此告警率也為1。 從以上仿真結(jié)果可以看出,系統(tǒng)解除告警后有近1/4的概率再次發(fā)布解脫建議;減小在線初始告警效用比可降低告警率,從而減少不必要告警;調(diào)整發(fā)出初始解脫建議后在線參數(shù)激活時(shí)間可以有效降低系統(tǒng)的重復(fù)告警率;通過增大在線反轉(zhuǎn)建議效用比可以在降低重復(fù)告警率的同時(shí)保持較低的NMAC概率。 本文對(duì)空中防撞問題進(jìn)行MDP過程模型化,可以將防撞系統(tǒng)所需的性能指標(biāo)組合到不同解脫建議效用比的權(quán)重中,同時(shí)根據(jù)飛機(jī)空中相遇過程的動(dòng)態(tài)模型和飛行員響應(yīng)模型等關(guān)鍵因素對(duì)防撞系統(tǒng)進(jìn)行MDP建模。對(duì)MDP過程求解得到的防撞邏輯則是系統(tǒng)在防止空中碰撞同時(shí)保持低告警率的條件下獲得的最優(yōu)解脫策略?;贛DP過程設(shè)計(jì)的防撞系統(tǒng)需要調(diào)節(jié)的參數(shù)更少,開發(fā)周期短,特別適合低成本、快速發(fā)展的通航飛機(jī)的要求。即使空域模型或監(jiān)視系統(tǒng)發(fā)生改變,也只需要修改飛機(jī)相遇模型然后進(jìn)行優(yōu)化,而不需要采用TCAS算法中復(fù)雜的啟發(fā)式規(guī)則。美國聯(lián)邦航空局 (The United States Federal Aviation Administration,F(xiàn)AA)于2009年啟動(dòng)了下一代空中防撞系統(tǒng)(Airborne Collision Avoidance System X,ACAS X)的研究計(jì)劃,林肯實(shí)驗(yàn)室在2011~2013年關(guān)于ACAS X的研究報(bào)告中提出了基于決策理論的最優(yōu)化防撞邏輯[3-5]。本文提出的基于末端效用函數(shù)求解得到的最優(yōu)防撞邏輯與ACAS X中基于代價(jià)函數(shù)的最優(yōu)邏輯在理論上是等效的,并且能夠方便地推廣到解決多機(jī)沖突的基于效用函數(shù)融合的方法中。因此,本文的相關(guān)研究成果對(duì)我國在低空空域通用飛機(jī)防撞系統(tǒng)的研究具有一定的理論參考價(jià)值。 對(duì)于現(xiàn)實(shí)的空中交通環(huán)境中的飛機(jī)相遇場(chǎng)景,本文提出的MDP防撞邏輯還需在三維動(dòng)態(tài)模型、解脫建議的協(xié)調(diào)、多機(jī)沖突、傳感器噪聲等方面開展進(jìn)一步的研究。 [1] CHAMLOU R. Future airborne collision avoidance design principles,analysis plan and algorithm development [C]//Proceedings of 2009 IEEE/AIAA 28th Digital Avionics Systems Conference. Orlando,FL:IEEE/AIAA 2009:6.E.2-1-6.E.2-17. [2] LIN C E,WU Y Y. TCAS solution for low altitude flights [C]// Proceedings of 2010 Integrated Communications,Navigation,and Surveillance Conference. Herndon,VA:[s.n.],2010:I4-1-I4-9. [3] GABRIEL C. The future of collision avoidance-ACAS X[J]. International Journal of Engineering Trends and Technology,2016,39(5):284-287. [4] BILLINGSLEY T B,KOCHENDERFER M J,CHRYSSATHACOPOULOS J P. Collision avoidance for general aviation [J]. IEEE Aerospace and Electronic Systems Magazine,2012,27(7):4-12. [5] KOCHENDERFER M J,CHRYSSANTHACOPOULOS J P. Robust airborne collision avoidance through dynamic programming [R]//No. ATC-371. Lexington,MA:MIT Lincoln Laboratory,2011. [6] 彭良福,林云松. 機(jī)載防撞系統(tǒng)垂直防撞的物理模型[J]. 電訊技術(shù),2010,50(8):7-11. PENG Liangfu,LIN Yunsong. Physical model for vertical collision avoidance in traffic alert and collision avoidance system(TCAS) [J]. Telecommunication Engineering,2010,50(8):7-11. (in Chinese) [7] RUSSELL S,NORVIG P. Artificial intelligence:a modern approach [M]. 3rd ed. New York:Prentice Hall,2010:645-656. [8] CHRYSSANTHACOPOULOS J P,KOCHENDERFER M J. Collision avoidance system optimization with probabilistic pilot response models [C]//Proceedings of the 2011 American Control Conference. San Francisco,CA:IEEE,2011:2765-2770. ANewApproachtoDesignAirborneCollisionAvoidanceLogicforGeneralAviation LIN Yunsong1,PENG Liangfu2,FU Yong3,YE Rui4 Since the traffic alert and collision avoidance system (TCAS) was designed for large aircraft that can achieve greater vertical rates,the assumptions made by the system and the associated resolution advisories were not always appropriate for general aviation aircraft. In view of the collision avoidance system for general aviation,an approach based on the Markov decision process (MDP) to design the collision avoidance logic is proposed. Firstly,the dynamics of the aircraft involved in the encounter is discretized into a discrete transition function,and then the collision avoidance system is modeled with MDP based on the end-state utility function of its outcomes,the iterating equation for the optimal collision avoidance logic is derived by using dynamic programming. Finally,the design process of the optimal collision avoidance logic for general aviation is presented,and also the optimized logics are evaluated in computer simulation. The simulation results show that the collision avoidance logic can meet the current safety level while lowering the alert rate by adjusting the utility ratio parameters. In the circumstance that a significant fraction of encounters (about 18%) has a vertical miss distance of less than 30 m,the collision probability is approximately 2.88×10-4providing that the alert probability is greater than 0.85. The method has certain reference value for research on the collision avoidance system in low altitude airspace general aviation aircraft in China. general aviation;low altitude airspace;traffic alert collision avoidance system(TCAS);Markov decision process(MDP);optimal collision avoidance logic date:2017-05-09;Revised date:2017-08-16 國家自然科學(xué)基金資助項(xiàng)目(61374190) **通信作者:pengliangfu@126.com Corresponding author:pengliangfu@126.com V241;V328 A 1001-893X(2017)10-1114-08 林云松(1969—),男,四川成都人, 1999年于電子科技大學(xué)獲博士學(xué)位,現(xiàn)為副教授,主要從事機(jī)載防撞系統(tǒng)、自動(dòng)控制理論及工程應(yīng)用方面的研究; Email:yslin384@163.com 彭良福(1966—),男,四川成都人,1994年于電子科技大學(xué)獲博士學(xué)位,現(xiàn)為教授,主要從事機(jī)載防撞系統(tǒng)、信號(hào)與信息處理方面的研究; Email:pengliangfu@126.com 傅勇(1972—),男,重慶萬州人,1993年于華東師范大學(xué)獲學(xué)士學(xué)位,現(xiàn)為高級(jí)工程師,主要從事機(jī)載防撞系統(tǒng)、雷達(dá)信號(hào)處理等方面的研究; 葉睿(1976—),男,四川成都人,1999年于電子科技大學(xué)獲學(xué)士學(xué)位,主要從事TCAS II防撞系統(tǒng)和 S模式應(yīng)答機(jī)的設(shè)計(jì)工作。 10.3969/j.issn.1001-893x.2017.10.003 林云松,彭良福,傅勇,等.一種新的通用航空機(jī)載防撞邏輯設(shè)計(jì)方法[J].電訊技術(shù),2017,57(10):1114-1121.[LIN Yunsong,PENG Liangfu,FU Yong,et al.A new approach to design airborne collision avoidance logic for general aviation[J].Telecommunication Engineering,2017,57(10):1114-1121.] 2017-05-09; 2017-08-164 通航飛機(jī)的防撞邏輯
5 防撞邏輯的仿真結(jié)果
6 結(jié)束語
(1.College of Automation,University of Electronic Science and Technology of China,Chengdu 611731,China;2.College of Electrical Information Engineering,Southwest University for Nationalities,Chengdu 610041,China;3.School of Electronics and Information Engineering,Chengdu University,Chengdu 610106,China;4.Chengdu Heimdallr Technology Corporation Ltd.,Chengdu 610051,China)