亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于經(jīng)驗(yàn)直覺(jué)的無(wú)人機(jī)威脅規(guī)避機(jī)動(dòng)決策方法

        2022-03-17 07:26:34王盼盼吳慶憲邵書義
        關(guān)鍵詞:信息

        王盼盼,陳 謀,吳慶憲,邵書義

        (南京航空航天大學(xué)自動(dòng)化學(xué)院, 南京 211106)

        近年來(lái),無(wú)人機(jī)因具有戰(zhàn)場(chǎng)適應(yīng)能力強(qiáng)、生存能力強(qiáng)、低成本高效費(fèi)比、配置靈活等優(yōu)點(diǎn),迅速成為一種新型武器裝備。無(wú)人機(jī)為了有效完成不同任務(wù),須具有一定程度的自主決策和自主規(guī)避能力[1],能在保證自身安全的前提下,自主完成進(jìn)攻、防御和偵察等不同任務(wù)。因此,無(wú)人機(jī)應(yīng)具有自主認(rèn)知、自主決策、自主規(guī)劃和自主控制能力[2]。提高無(wú)人機(jī)的自主威脅規(guī)避決策能力是適應(yīng)現(xiàn)代化戰(zhàn)爭(zhēng)的必然趨勢(shì)[3]。

        依據(jù)人腦的行為認(rèn)知模式,美國(guó)空軍上校博伊德提出觀察?判斷?決策?行動(dòng)的循環(huán)模型[4]。傳統(tǒng)的威脅規(guī)避方法主要有預(yù)規(guī)劃的全局式規(guī)避和反應(yīng)式及時(shí)規(guī)避[5]。由于環(huán)境的變化,全局式威脅規(guī)避需要不斷地進(jìn)行重規(guī)劃,使得其應(yīng)用有很大的局限性;反應(yīng)式及時(shí)規(guī)避方法是通過(guò)雷達(dá)等傳感器實(shí)時(shí)獲取局部環(huán)境的變化并做出反應(yīng)動(dòng)作。文獻(xiàn)[6]提出一種可以提高無(wú)人機(jī)在動(dòng)態(tài)環(huán)境下態(tài)勢(shì)感知能力的速度障礙法,有助于生成規(guī)避威脅的機(jī)動(dòng)。文獻(xiàn)[7]提出基于混合時(shí)間集的脈沖微分包含模型,通過(guò)分析認(rèn)知無(wú)人機(jī)?環(huán)境系統(tǒng)狀態(tài)的運(yùn)動(dòng)模式,推導(dǎo)出系統(tǒng)防碰撞穩(wěn)定的條件。結(jié)合人腦的思維模式和思維過(guò)程,文獻(xiàn)[8]提出了基于知識(shí)庫(kù)來(lái)實(shí)現(xiàn)無(wú)人機(jī)自主決策的方法。文獻(xiàn)[9]提出了一種在非均勻結(jié)構(gòu)雷達(dá)威脅模型下基于改進(jìn)馬爾科夫決策過(guò)程模型的多無(wú)人機(jī)航路規(guī)劃算法,將航路威脅代價(jià)和航路綜合代價(jià)有效降低了25%。利用卷積神經(jīng)網(wǎng)絡(luò)(Recurrent neural networks,RNNs)模擬人類的運(yùn)動(dòng)皮層,文獻(xiàn)[10]在認(rèn)知地圖的基礎(chǔ)上進(jìn)行路徑規(guī)劃和控制決策,并用長(zhǎng)短時(shí)記憶(Long short term memory,LSTM)神經(jīng)網(wǎng)絡(luò)對(duì)交通數(shù)據(jù)、車輛狀態(tài)數(shù)據(jù)和車輛機(jī)動(dòng)行為集合進(jìn)行訓(xùn)練,輔助系統(tǒng)生成規(guī)劃路徑和決策。以上文獻(xiàn)從類腦智能規(guī)避決策的角度出發(fā),取得了一定的研究成果,但針對(duì)無(wú)人機(jī)威脅規(guī)避智能決策的研究仍處于初級(jí)階段,需要進(jìn)一步深入研究。

        無(wú)人機(jī)自主威脅規(guī)避決策是無(wú)人機(jī)自主控制系統(tǒng)的核心環(huán)節(jié),在無(wú)人機(jī)進(jìn)行威脅規(guī)避時(shí)快速做出合理的機(jī)動(dòng)決策對(duì)其安全具有至關(guān)重要的作用。受上述文獻(xiàn)啟發(fā),借鑒人類在現(xiàn)實(shí)中遇到威脅,能利用直覺(jué)結(jié)合經(jīng)驗(yàn)知識(shí)迅速做出適宜的判斷和決策,快速高效的決策結(jié)果能有效避免安全事故的發(fā)生。因此,本文提出一種基于經(jīng)驗(yàn)直覺(jué)的無(wú)人機(jī)威脅規(guī)避機(jī)動(dòng)決策方法,模擬人類進(jìn)行思維決策的過(guò)程,使無(wú)人機(jī)在面臨威脅時(shí)能像人一樣快速做出有效的威脅規(guī)避決策。

        1 問(wèn)題描述與預(yù)備知識(shí)

        1.1 無(wú)人機(jī)直覺(jué)威脅規(guī)避決策原理

        在復(fù)雜的飛行環(huán)境下,無(wú)人機(jī)不僅面臨地形威脅、探測(cè)威脅、氣象威脅,還面臨非合作飛行單位威脅等。為了提高無(wú)人機(jī)的生存能力,需要快速高效地對(duì)所面臨威脅做出規(guī)避決策。無(wú)人機(jī)通過(guò)模擬人類的直覺(jué)思維決策過(guò)程來(lái)進(jìn)行威脅規(guī)避機(jī)動(dòng),實(shí)現(xiàn)基于機(jī)器直覺(jué)決策原則[11]的無(wú)人機(jī)威脅規(guī)避決策,可以提高無(wú)人機(jī)的智能威脅規(guī)避能力。無(wú)人機(jī)基于直覺(jué)決策原理的威脅規(guī)避系統(tǒng)工作原理如圖1所示。

        圖1 無(wú)人機(jī)直覺(jué)威脅規(guī)避決策原理圖Fig.1 Schematic diagram of UAV threat avoidance decision-making based on intuitions

        無(wú)人機(jī)直覺(jué)決策首先要對(duì)外界環(huán)境進(jìn)行感知和處理,信息感知過(guò)程包括通過(guò)傳感器獲取外界環(huán)境中的原始信息并將原始數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理;然后對(duì)感知的信息進(jìn)行搜索匹配,包括情景記憶中相似情景的映射和對(duì)情景廣義特征的提??;最后根據(jù)提取的特征進(jìn)行機(jī)動(dòng)決策輸出。為了實(shí)現(xiàn)無(wú)人機(jī)有效威脅規(guī)避決策,本文選取無(wú)人機(jī)位置、速度、迎角、側(cè)滑角、航跡傾斜角、航跡滾轉(zhuǎn)角、航跡方位角、目標(biāo)點(diǎn)位置、威脅距離、威脅方位和威脅速度等共15 維數(shù)據(jù)信息作為廣義特征中的關(guān)鍵影響因素;接著對(duì)當(dāng)前態(tài)勢(shì)進(jìn)行直覺(jué)決策,直覺(jué)決策包含直覺(jué)啟發(fā)[11]規(guī)避和隱式直覺(jué)決策。隱式直覺(jué)決策是將本征抽象的廣義特征直接映射到?jīng)Q策結(jié)果的策略空間,即根據(jù)當(dāng)前態(tài)勢(shì)信息直接獲得決策結(jié)果。另外,直覺(jué)啟發(fā)會(huì)對(duì)直覺(jué)本原中存儲(chǔ)的知識(shí)進(jìn)行更新以獲得新知識(shí)并作用于策略空間,本文利用直覺(jué)啟發(fā)以輔助無(wú)人機(jī)進(jìn)行威脅規(guī)避決策。最后,通過(guò)隱式直覺(jué)決策出的結(jié)果和直覺(jué)啟發(fā)決策出的結(jié)果進(jìn)行博弈選擇,從而獲得最合適的決策結(jié)果。

        1.2 規(guī)避動(dòng)作描述

        在無(wú)人機(jī)飛行過(guò)程中,主要考慮無(wú)人機(jī)的前視區(qū)域威脅和機(jī)動(dòng)限制條件,忽略無(wú)人機(jī)前視區(qū)域之外的威脅。假設(shè)無(wú)人機(jī)的機(jī)載傳感器能夠準(zhǔn)確實(shí)時(shí)感知并獲取無(wú)人機(jī)狀態(tài)信息,并且機(jī)載雷達(dá)能準(zhǔn)確實(shí)時(shí)探測(cè)到如圖2 所示的前視錐形區(qū)域的威脅方位與威脅距離。由于雷達(dá)的原始數(shù)據(jù)是使用離散的點(diǎn)描述威脅信息,單個(gè)數(shù)據(jù)點(diǎn)不能準(zhǔn)確描述威脅的相關(guān)信息,所以需要先將雷達(dá)探測(cè)到的數(shù)據(jù)點(diǎn)進(jìn)行聚類處理。本文將無(wú)人機(jī)雷達(dá)掃描的前視錐形區(qū)域均等地劃分為若干個(gè)扇形棱錐區(qū)域,扇形棱錐區(qū)域劃分的越多,無(wú)人機(jī)威脅規(guī)避性能也就越靈活,但是計(jì)算量也會(huì)越大。綜合考慮,將無(wú)人機(jī)前視探測(cè)區(qū)域均等劃分成如圖2 所示的12 個(gè)扇形棱錐,從機(jī)頭正上方按照順時(shí)針?lè)较蛞来螛?biāo)記為S1,S2,…,S12。結(jié)合無(wú)人機(jī)威脅規(guī)避機(jī)動(dòng)決策需要對(duì)7 種基本操作庫(kù)[12]進(jìn)行擴(kuò)充并與12 種不同威脅規(guī)避區(qū)域相對(duì)應(yīng),如圖3 所示,除此之外無(wú)人機(jī)動(dòng)作庫(kù)中還有勻速前飛、減速前飛和加速前飛。

        圖2 雷達(dá)探測(cè)區(qū)域與目標(biāo)點(diǎn)距離示意圖Fig.2 Schematic diagram of the distance between the radar detection area and the target point

        圖3 改進(jìn)基本機(jī)動(dòng)動(dòng)作庫(kù)Fig.3 Improved basic maneuvers library

        2 無(wú)人機(jī)安全規(guī)避的直覺(jué)決策方法

        2.1 無(wú)人機(jī)感知數(shù)據(jù)處理

        威脅規(guī)避直覺(jué)決策模型中需要獲取無(wú)人機(jī)當(dāng)前態(tài)勢(shì)下的環(huán)境信息。從無(wú)人機(jī)自身角度出發(fā),需要準(zhǔn)確獲取無(wú)人機(jī)的位置信息、速度信息和姿態(tài)信息,包括無(wú)人機(jī)的位置、速度、迎角、側(cè)滑角、航跡傾斜角、航跡滾轉(zhuǎn)角和航跡方位角??紤]到復(fù)雜環(huán)境下無(wú)人機(jī)會(huì)遇到的地形威脅和非合作單位威脅,還需實(shí)時(shí)獲取威脅的位置、速度和方位信息。同時(shí)為了防止無(wú)人機(jī)進(jìn)行機(jī)動(dòng)規(guī)避時(shí)背離目標(biāo)點(diǎn)飛行,還需已知目標(biāo)點(diǎn)的位置。

        通過(guò)空速管、陀螺儀和機(jī)載雷達(dá)等傳感器獲取無(wú)人機(jī)的飛行參數(shù)和導(dǎo)航參數(shù)等如圖4 所示的態(tài)勢(shì)信息,將采集的連續(xù)12 幀[13]狀態(tài)信息作為特征向量。對(duì)原始數(shù)據(jù)進(jìn)行濾波,去除明顯錯(cuò)誤數(shù)據(jù),并修補(bǔ)缺失數(shù)據(jù)[13],再對(duì)數(shù)據(jù)進(jìn)行歸一化處理并編碼成特征向量,為直覺(jué)感知中的相似情景的映射和本征抽樣做準(zhǔn)備[11]。

        圖4 無(wú)人機(jī)態(tài)勢(shì)信息感知數(shù)據(jù)樹形圖Fig.4 Tree diagram of UAV situation perception data

        2.2 無(wú)人機(jī)直覺(jué)機(jī)動(dòng)決策結(jié)果標(biāo)簽化

        無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù)的建立,不僅需要將感知數(shù)據(jù)結(jié)構(gòu)化處理后作為輸入數(shù)據(jù),還需要輸出直覺(jué)決策的機(jī)動(dòng)動(dòng)作。為了便于情景與決策結(jié)果之間的映射,將機(jī)動(dòng)動(dòng)作決策結(jié)果與決策標(biāo)簽進(jìn)行對(duì)應(yīng)。

        根據(jù)飛行區(qū)域、法向過(guò)載和推力的改變,對(duì)無(wú)人機(jī)機(jī)動(dòng)動(dòng)作的7 種基本操作庫(kù)[12]進(jìn)行擴(kuò)充后分別為向上爬升、右上爬升1、右上爬升2、右轉(zhuǎn)彎、右下俯沖1、右下俯沖2、向下俯沖、左下俯沖1、左下俯沖2、左轉(zhuǎn)彎、左上爬升1、左上爬升2、勻速前飛、減速前飛和加速前飛15 種模式。針對(duì)這15 種機(jī)動(dòng)模式,分別設(shè)置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15 共15 個(gè)標(biāo)簽值與之對(duì)應(yīng),如圖5 所示。

        圖5 機(jī)動(dòng)動(dòng)作決策與模式解析標(biāo)簽對(duì)應(yīng)圖Fig.5 Maneuver decision modes and corresponding labels

        2.3 無(wú)人機(jī)直覺(jué)啟發(fā)規(guī)避

        無(wú)人機(jī)機(jī)動(dòng)決策是一個(gè)動(dòng)態(tài)的連續(xù)變化過(guò)程,在無(wú)人機(jī)機(jī)動(dòng)決策過(guò)程中,威脅信息、無(wú)人機(jī)的機(jī)動(dòng)狀態(tài)和目標(biāo)點(diǎn)的位置都有可能發(fā)生改變。為了使無(wú)人機(jī)在不同的飛行狀態(tài)下,面對(duì)復(fù)雜的飛行環(huán)境都能實(shí)時(shí)規(guī)避威脅,必須準(zhǔn)確感知無(wú)人機(jī)的態(tài)勢(shì)信息,模擬人腦的大局觀對(duì)當(dāng)前態(tài)勢(shì)信息進(jìn)行預(yù)測(cè)評(píng)估,從而對(duì)無(wú)人機(jī)下一幀機(jī)動(dòng)動(dòng)作做出決策。當(dāng)無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù)中情景匹配不成功時(shí),需要采用直覺(jué)啟發(fā)算法輔助無(wú)人機(jī)進(jìn)行規(guī)避決策。

        若無(wú)人機(jī)當(dāng)前時(shí)刻沒(méi)有感知到威脅信息,只需按照預(yù)定的飛行路線保持原飛行狀態(tài)繼續(xù)飛行,但當(dāng)無(wú)人機(jī)檢測(cè)到威脅信號(hào)時(shí),無(wú)人機(jī)需要改變?cè)w行狀態(tài),對(duì)機(jī)動(dòng)動(dòng)作選擇進(jìn)行實(shí)時(shí)迭代更新并進(jìn)行機(jī)動(dòng)規(guī)避。針對(duì)威脅信息的不同,需要選取不同的機(jī)動(dòng)動(dòng)作進(jìn)行安全規(guī)避。為確定威脅規(guī)避區(qū)域,本文綜合考慮威脅等級(jí)、目標(biāo)點(diǎn)的引導(dǎo)作用和無(wú)人機(jī)的機(jī)動(dòng)限制條件選擇無(wú)人機(jī)的規(guī)避區(qū)域及其對(duì)應(yīng)的機(jī)動(dòng)動(dòng)作,如圖6 所示。

        圖6 無(wú)人機(jī)直覺(jué)啟發(fā)規(guī)避區(qū)域選擇原理圖Fig.6 Schematic diagram of UAV intuition-inspired avoid?ance area selection

        外部威脅對(duì)無(wú)人機(jī)的機(jī)動(dòng)決策起到主要的影響作用,首先需要雷達(dá)準(zhǔn)確獲取威脅所在的方位、距離和速度信息?;诶走_(dá)探測(cè)所獲取的威脅距離和威脅速度,對(duì)威脅等級(jí)進(jìn)行評(píng)估判定。

        無(wú)人機(jī)在規(guī)避的過(guò)程中還要考慮到目標(biāo)點(diǎn)對(duì)無(wú)人機(jī)的引導(dǎo)作用,避免無(wú)人機(jī)為了規(guī)避威脅而逐漸偏離目標(biāo)點(diǎn)甚至背離目標(biāo)點(diǎn)飛行情況的發(fā)生,因此加入目標(biāo)點(diǎn)引導(dǎo)概率函數(shù)。假設(shè)任務(wù)目標(biāo)點(diǎn)的坐標(biāo)為Oobj(xobj,yobj,zobj),為了方便計(jì)算,將其轉(zhuǎn)化到機(jī)體坐標(biāo)系下有[14]:

        式中d為無(wú)人機(jī)前視區(qū)域的最大距離,p為無(wú)人機(jī)雷達(dá)的掃描角度。

        此外無(wú)人機(jī)的機(jī)動(dòng)限制條件也會(huì)影響其威脅規(guī)避動(dòng)作的選擇,所以要在無(wú)人機(jī)安全邊界保護(hù)系統(tǒng)的范圍內(nèi)進(jìn)行機(jī)動(dòng)動(dòng)作規(guī)避,以無(wú)人機(jī)安全飛行邊界為基準(zhǔn),對(duì)規(guī)避動(dòng)作進(jìn)行排除,綜合形成無(wú)人機(jī)直覺(jué)啟發(fā)輔助規(guī)避機(jī)動(dòng)決策結(jié)果。

        2.4 無(wú)人機(jī)隱式直覺(jué)決策

        LSTM 網(wǎng)絡(luò)是在RNN 網(wǎng)絡(luò)的基礎(chǔ)上引入人腦的記憶機(jī)制和遺忘機(jī)制,能有效克服RNN 網(wǎng)絡(luò)在訓(xùn)練過(guò)程中的梯度爆炸和梯度消失問(wèn)題,而且利用LSTM 模擬人腦的記憶機(jī)制和遺忘機(jī)制的過(guò)程符合人對(duì)突發(fā)威脅的預(yù)判規(guī)避機(jī)制[13],所以用LSTM 網(wǎng)絡(luò)訓(xùn)練無(wú)人機(jī)飛行數(shù)據(jù),威脅數(shù)據(jù)和目標(biāo)點(diǎn)數(shù)據(jù),并與相應(yīng)的機(jī)動(dòng)決策標(biāo)簽集形成對(duì)應(yīng)關(guān)系,從而建立無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù)。

        在無(wú)人機(jī)安全規(guī)避決策時(shí),需要考慮LSTM網(wǎng)絡(luò)在當(dāng)前時(shí)刻的決策輸出,然后通過(guò)softmax 函數(shù)[16]計(jì)算模型的輸出,softmax 函數(shù)如下式所示

        式中,A為無(wú)人機(jī)威脅規(guī)避的機(jī)動(dòng)決策集合,s為機(jī)動(dòng)決策集合A中的某個(gè)元素,y為機(jī)動(dòng)決策s的輸出概率,h為L(zhǎng)STM 網(wǎng)絡(luò)隱含層最后輸出,Wysh為邏輯回歸的權(quán)重系數(shù),by為邏輯回歸的偏置項(xiàng)。

        采用0?1損失函數(shù)計(jì)算樣本的平均輸出誤差[16],通過(guò)基于時(shí)間的誤差反向傳播算法(Back propaga?tion trough time,BPTT)[17],來(lái)訓(xùn)練LSTM 網(wǎng)絡(luò)。

        以無(wú)人機(jī)飛行過(guò)程中威脅機(jī)動(dòng)規(guī)避為研究背景,實(shí)驗(yàn)數(shù)據(jù)從某仿真系統(tǒng)[18]中提取。通過(guò)多次運(yùn)行該仿真系統(tǒng),得出無(wú)人機(jī)的態(tài)勢(shì)信息以及機(jī)動(dòng)決策信息,從中選取多組原始數(shù)據(jù),針對(duì)每組12×15 數(shù)據(jù)信息進(jìn)行濾波,去除明顯錯(cuò)誤數(shù)據(jù),并修補(bǔ)缺失數(shù)據(jù),再對(duì)數(shù)據(jù)進(jìn)行歸一化處理并編碼成特征向量[13],同時(shí)記錄下與之對(duì)應(yīng)的機(jī)動(dòng)決策標(biāo)簽集,形成映射關(guān)系并輸入到LSTM 網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,進(jìn)而獲得無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù),無(wú)人機(jī)隱式直覺(jué)決策基本框架如圖7 所示。

        圖7 無(wú)人機(jī)隱式直覺(jué)決策框架圖Fig.7 Framework of UAV’s implicit intuitive decision-making

        2.5 無(wú)人機(jī)威脅規(guī)避直覺(jué)決策算法

        本節(jié)結(jié)合2.3 節(jié)無(wú)人機(jī)直覺(jué)啟發(fā)規(guī)避和2.4 節(jié)無(wú)人機(jī)隱式直覺(jué)決策,提出無(wú)人機(jī)威脅規(guī)避直覺(jué)決策算法,進(jìn)而模擬有經(jīng)驗(yàn)的飛行員進(jìn)行直覺(jué)規(guī)避威脅。

        通過(guò)對(duì)無(wú)人機(jī)直覺(jué)啟發(fā)輔助規(guī)避決策和隱式直覺(jué)決策的研究,建立如圖8 所示的無(wú)人機(jī)威脅規(guī)避直覺(jué)決策算法。對(duì)無(wú)人機(jī)多種經(jīng)驗(yàn)?zāi)B(tài)的原始結(jié)構(gòu)化信息進(jìn)行訓(xùn)練,形成無(wú)人機(jī)情景記憶決策知識(shí)庫(kù)。首先獲取無(wú)人機(jī)的當(dāng)前飛行態(tài)勢(shì)數(shù)據(jù),判斷是否存在威脅,如果無(wú)威脅或威脅等級(jí)較低時(shí),無(wú)人機(jī)保持原計(jì)劃飛行;如果威脅等級(jí)處于中等但并不一定會(huì)對(duì)無(wú)人機(jī)造成實(shí)質(zhì)性的損傷,無(wú)人機(jī)減速前行;如果威脅等級(jí)較高時(shí),需要對(duì)無(wú)人機(jī)進(jìn)行機(jī)動(dòng)規(guī)避決策。然后提取并結(jié)構(gòu)化處理傳感器采集到的飛行數(shù)據(jù)、威脅數(shù)據(jù)和目標(biāo)點(diǎn)數(shù)據(jù)等,歸一化處理并編碼成特征向量同時(shí)進(jìn)行情景匹配,如果情景匹配成功,則對(duì)決策方案進(jìn)行預(yù)評(píng)估,并選取最優(yōu)決策方案到執(zhí)行環(huán)節(jié);如果沒(méi)有匹配到成功的情景模式,則需要根據(jù)直覺(jué)啟發(fā)輔助規(guī)避算法確定無(wú)人機(jī)的規(guī)避機(jī)動(dòng)決策給執(zhí)行環(huán)節(jié),并更新無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù)。

        圖8 無(wú)人機(jī)威脅規(guī)避直覺(jué)決策算法Fig.8 Intuitive decision-making algorithm for UAV threat avoidance

        3 驗(yàn)證與仿真

        3.1 數(shù)據(jù)準(zhǔn)備

        因?qū)嶋H地形過(guò)大,為便于仿真分析,將一個(gè)實(shí)際場(chǎng)景地形數(shù)據(jù)按照164∶1 的比例尺縮放到仿真三維地圖上,包含地形威脅數(shù)據(jù),則單個(gè)柵格長(zhǎng)、寬和高均記為164 m。后續(xù)為便于仿真分析,直接使用柵格坐標(biāo)。假設(shè)無(wú)人機(jī)起始柵格坐標(biāo)為(10,10,86),無(wú)人機(jī)的終止目標(biāo)柵格坐標(biāo)為(290,270,34)。非合作探測(cè)雷達(dá)威脅數(shù)據(jù)和氣象威脅數(shù)據(jù)如表1 所示,非合作飛行器威脅的起始柵格坐標(biāo)為(300,10,35),終止柵格坐標(biāo)為(10,300,20)。

        表1 雷達(dá)威脅和氣象威脅數(shù)據(jù)信息Table 1 Information of radar threats and weather threats

        3.2 無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù)訓(xùn)練

        將20 000 組特征向量隨機(jī)抽取80%作為訓(xùn)練集,剩下20%作為驗(yàn)證集。通過(guò)多次仿真實(shí)驗(yàn)得出效果最好的LSTM 網(wǎng)絡(luò)的參數(shù)如下:隱含層記憶單元數(shù)目N=100,分批訓(xùn)練mini_BatchSize=512,訓(xùn)練迭代次數(shù)為2 000,步長(zhǎng)α=0.001,超參數(shù)β1=0.900,β2=0.999,平滑項(xiàng)ε=10-8。圖9 為訓(xùn)練樣本在不同迭代次數(shù)下的訓(xùn)練準(zhǔn)確率,從圖中可以看出測(cè)試集準(zhǔn)確率大約在1 400 次迭代之后達(dá)到90%,在1 640 次之后逐漸穩(wěn)定在92%左右。圖10 為信息迭代過(guò)程中LSTM 網(wǎng)絡(luò)的損失函數(shù)的變化曲線,Mini?batch 損失收斂到0.35 附近。Adam算法[19]結(jié)合了Momentum 算法和RMSprop(Root mean square prop)算法的優(yōu)點(diǎn),能夠自適應(yīng)地調(diào)整學(xué)習(xí)率更新策略[20],對(duì)比使用SGDM 算法和RM?SProp 算法訓(xùn)練無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù)模型,使用Adam 算法具有更好的直覺(jué)機(jī)動(dòng)決策效果,如圖11 所示。對(duì)比3 種模型可知Adam 算法不僅收斂速度快,且測(cè)試集決策準(zhǔn)確度高于SGDM 和RMSProp 算法,所以基于Adam 算法的LSTM 網(wǎng)絡(luò)更適用于實(shí)現(xiàn)無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù)的建立。

        圖9 訓(xùn)練集和驗(yàn)證集決策準(zhǔn)確率變化曲線Fig.9 Curves of decision accuracy rate changing with itera?tion for the training set and the validation set

        圖10 Mini-batch 損失變化曲線Fig.10 Curve of the mini-batch loss changing with iteration

        圖11 不同優(yōu)化算法決策準(zhǔn)確率變化對(duì)比圖Fig.11 Comparison of changes in decision accuracy rates of different optimization algorithms

        3.3 經(jīng)驗(yàn)直覺(jué)模型決策準(zhǔn)確性驗(yàn)證實(shí)驗(yàn)

        將地形數(shù)據(jù)信息、威脅信息和目標(biāo)點(diǎn)信息經(jīng)歸一化處理并編碼成特征向量輸入到無(wú)人機(jī)直覺(jué)決策情景匹配數(shù)據(jù)庫(kù)中,無(wú)人機(jī)基于經(jīng)驗(yàn)直覺(jué)的機(jī)動(dòng)規(guī)避決策序列如表2 所示。

        表2 無(wú)人機(jī)直覺(jué)機(jī)動(dòng)決策表Table 2 UAV intuitive maneuver decisions

        航跡輸出結(jié)果如圖12~14 所示。其中綠色和黃色半球是不同威脅半徑的雷達(dá)威脅,紅色球體是氣象威脅,紅色曲線是非合作飛行器的飛行軌跡,綠色軌跡是無(wú)人機(jī)基于直覺(jué)決策平滑處理后的軌跡路線圖。圖12 是規(guī)避航跡俯視圖,從圖中可以看出無(wú)人機(jī)的飛行軌跡,實(shí)現(xiàn)了氣象威脅的規(guī)避,但該圖對(duì)無(wú)人機(jī)是否進(jìn)入非合作目標(biāo)探測(cè)雷達(dá)的探測(cè)區(qū)域不能清晰反映。從圖13 中可以清楚地看出無(wú)人機(jī)通過(guò)左轉(zhuǎn)彎有效地規(guī)避了非合作單位的威脅。結(jié)合圖13,14,可以看出無(wú)人機(jī)不僅規(guī)避了非合作雷達(dá)的探測(cè)區(qū)域,還實(shí)現(xiàn)了地形規(guī)避。綜上可知,無(wú)人機(jī)直覺(jué)決策算法成功規(guī)避多種威脅,確保航跡安全。

        圖12 多威脅情況下無(wú)人機(jī)直覺(jué)決策規(guī)避路徑俯視圖Fig.12 Top view of the UAV’s intuitive decision-making avoidance path in the multi-threat situation

        圖13 多威脅情況下無(wú)人機(jī)直覺(jué)決策規(guī)避路徑左視圖Fig.13 Left view of the UAV’s intuitive decision-making avoidance path in the multi-threat situation

        圖14 多威脅情況下無(wú)人機(jī)直覺(jué)決策規(guī)避路徑前視圖Fig.14 Front view of the UAV’s intuitive decision-making avoidance path in the multi-threat situation

        相同飛行環(huán)境下無(wú)人機(jī)直覺(jué)決策規(guī)避路徑與基于群智能算法的規(guī)避路徑進(jìn)行對(duì)比,如圖15 所示,其中黃色曲線是基于群智能算法的規(guī)避路徑。兩種方法均能實(shí)現(xiàn)無(wú)人機(jī)安全規(guī)避,從圖15(a)俯視圖中可以看出兩種方法規(guī)避路線沒(méi)有太大的區(qū)別,從圖15(b)的側(cè)視圖中可以看出直覺(jué)決策規(guī)避路徑曲線更為平滑,尤其是機(jī)動(dòng)5 到機(jī)動(dòng)8 直覺(jué)決策規(guī)避路徑比群智能優(yōu)化算法規(guī)避路徑的平滑性高。另外,對(duì)于具備成熟的情景決策知識(shí)庫(kù)的直覺(jué)決策算法時(shí)間復(fù)雜度為O(1),即直接輸出機(jī)動(dòng)決策,而群智能算法時(shí)間復(fù)雜度為O(n),主要與樣本的迭代次數(shù)相關(guān)。此時(shí)在時(shí)間復(fù)雜度上直覺(jué)決策算法優(yōu)于群智能算法,但是前期需要花費(fèi)大量的時(shí)間來(lái)建立和完善無(wú)人機(jī)情景決策知識(shí)庫(kù)。該仿真實(shí)驗(yàn)中直覺(jué)決策算法的航跡總長(zhǎng)度為68 671.72 m,群智能算法的航跡總長(zhǎng)度為71 812.32 m,可見(jiàn)在航跡代價(jià)上直覺(jué)決策算法略優(yōu)于群智能算法。

        圖15 兩種不同算法下的無(wú)人機(jī)航跡曲線側(cè)視圖Fig.15 Side view of UAV trajectory curve of the two differ?ent algorithms

        4 結(jié)論

        本文針對(duì)無(wú)人機(jī)在非博弈對(duì)抗飛行環(huán)境中安全規(guī)避威脅及智能機(jī)動(dòng)決策問(wèn)題,提出了一種基于經(jīng)驗(yàn)直覺(jué)的無(wú)人機(jī)威脅規(guī)避機(jī)動(dòng)決策方法。首先設(shè)計(jì)了無(wú)人機(jī)直覺(jué)啟發(fā)輔助規(guī)避決策算法,然后提出基于數(shù)據(jù)的無(wú)人機(jī)隱式直覺(jué)決策算法,選用Ad?am 梯度下降算法調(diào)整的LSTM 網(wǎng)絡(luò)對(duì)處理好的數(shù)據(jù)進(jìn)行訓(xùn)練,建立了無(wú)人機(jī)直覺(jué)情景決策知識(shí)庫(kù),應(yīng)用于無(wú)人機(jī)基于經(jīng)驗(yàn)直覺(jué)的機(jī)動(dòng)威脅規(guī)避決策。最終仿真結(jié)果表明該方法能準(zhǔn)確地對(duì)無(wú)人機(jī)威脅規(guī)避進(jìn)行直覺(jué)決策,進(jìn)一步驗(yàn)證了所提出的基于經(jīng)驗(yàn)直覺(jué)的無(wú)人機(jī)機(jī)動(dòng)規(guī)避方法的有效性。

        猜你喜歡
        信息
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        展會(huì)信息
        信息超市
        展會(huì)信息
        展會(huì)信息
        展會(huì)信息
        展會(huì)信息
        展會(huì)信息
        信息
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        无码一区二区三区中文字幕| 视频精品亚洲一区二区| 免费av一区男人的天堂| 亚洲综合精品中文字幕| 丰满人妻被黑人猛烈进入| 国产成人拍精品免费视频| av资源吧首页在线观看| 中文字幕一区二区中出后入| 国语对白嫖老妇胖老太| 日韩另类在线| 精品一区二区中文字幕| 丁香花五月六月综合激情| 日本丰满熟妇videossex8k| 国产91精选在线观看麻豆| 日韩色久悠悠婷婷综合| 久久精品熟女亚洲av麻| 白天躁晚上躁麻豆视频| 亚洲国产另类久久久精品小说| 国产人澡人澡澡澡人碰视频| 欧洲国产成人精品91铁牛tv| 国产一区二区三区不卡视频| 国精品人妻无码一区二区三区性色 | 国产伦人人人人人人性| 大地资源中文第三页| 风流少妇一区二区三区| 国产人成精品免费久久久| 丰满人妻被黑人猛烈进入| 国产午夜无码精品免费看动漫| 亚洲精品一区二区三区四区| 少妇被粗大的猛进出69影院| 免费av片在线观看网站| 老熟妇高潮av一区二区三区啪啪| 一本久道高清视频在线观看| 亚洲色在线v中文字幕| 免费二级毛片在线播放| 韩国三级黄色一区二区| 极品少妇小泬50pthepon| av中文字幕不卡无码| 男女视频在线观看一区二区 | 中国无码人妻丰满熟妇啪啪软件| 男女扒开双腿猛进入免费看污|