亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        雷達組網(wǎng)認知管控技術(shù)研究

        2017-04-27 15:57:45陸澤健劉筱秦永剛潘越
        科技創(chuàng)新與應用 2017年11期
        關(guān)鍵詞:認知管控

        陸澤健++劉筱++秦永剛++潘越

        摘 要:雷達組網(wǎng)協(xié)同探測是當前應對多種威脅目標的重要手段,文章將認知管控技術(shù)引入到組網(wǎng)探測系統(tǒng)中,通過賦予系統(tǒng)感知外部環(huán)境、學習、推理并做出有效判斷的能力,能夠使雷達網(wǎng)絡有效應對復雜多變的戰(zhàn)場環(huán)境,提升系統(tǒng)反應能力,最大化探測效能。

        關(guān)鍵詞:雷達組網(wǎng);認知;管控

        1 概述

        雷達組網(wǎng)探測利用探測系統(tǒng)在空域上空間分集、頻域上頻率分集、極化域上極化分集、時域上信息互補、信息域上信息融合的優(yōu)勢,來突破單一裝備對非合作目標探測存在的局限性。隨著組網(wǎng)探測系統(tǒng)在軍事預警探測領域的廣泛應用,如何有效的利用有限的雷達資源,實現(xiàn)對國土及邊境24小時不間斷監(jiān)測、快速應對突發(fā)事件,已經(jīng)成為雷達網(wǎng)絡系統(tǒng)面臨的重要挑戰(zhàn)之一。

        認知控制技術(shù)結(jié)合腦科學與人工智能技術(shù),能夠賦予雷達組網(wǎng)系統(tǒng)智能感知外部環(huán)境、學習、推理并做出有效決策判斷的能力,使雷達系統(tǒng)有效應對外部復雜的戰(zhàn)場環(huán)境[1-2]。與傳統(tǒng)雷達組網(wǎng)資源“開環(huán)管控”模式不同,認知管控強調(diào)“感知-學習-決策-行動”的反饋閉環(huán),同時賦予雷達網(wǎng)絡存儲、記憶的能力。近年來,Haykin教授在人腦認知的機理上,提出并發(fā)展了動態(tài)認知系統(tǒng)(Dynamic Cognitive System,DCS)概念[3],為認知系統(tǒng)的構(gòu)建提供了理論的支撐。一個典型的動態(tài)認知系統(tǒng)如圖1所示。

        2 雷達組網(wǎng)資源管控基本內(nèi)容

        雷達組網(wǎng)資源管控包括空間管理、模式管理、時間管理、能量管理、附屬資源管理等諸多方面的內(nèi)容[4]。在雷達組網(wǎng)預警探測系統(tǒng)中,雷達資源管控與信息融合是密切相關(guān)、互相對應的。JDL模型是數(shù)據(jù)和信息融合領域最通用的模型,它將數(shù)據(jù)和信息融合的級別分為威脅評估、態(tài)勢評估、目標評估以及信號評估四個層次[5]。與之相對應,雷達資源管控也可以分為四層:任務規(guī)劃、資源分配、激勵器調(diào)度和信號產(chǎn)生[6]。JDL模型與雷達資源管控模型的對應關(guān)系如圖2所示:

        雷達組網(wǎng)資源管控的基本內(nèi)容如下:(1)第3級管控(level3):頂層任務規(guī)劃,包括對資源優(yōu)化管理周期的設置、探測目標選擇、目標環(huán)境分析、保衛(wèi)資產(chǎn)設置、任務優(yōu)先級、資源狀態(tài)監(jiān)測與評估、探測效能評估等功能;(2)第2級管控(level2):多傳感器資源分配,主要指不同傳感器之間的資源調(diào)度與協(xié)同工作,包括資源優(yōu)化部署、多目標跟蹤中雷達選擇、目標分配、目標交接等;(3)第1級管控(level1):傳感器資源安排,主要包括探測空域設置、時域設置、工作模式設置、頻率設置等;(4)第0級管控(level0):針對單個雷達的波束調(diào)度、波形、調(diào)制樣式、極化方式、功率分配、脈沖寬度等參數(shù)進行管理和優(yōu)化設置。

        3 雷達組網(wǎng)認知管控系統(tǒng)架構(gòu)

        基于動態(tài)認知系統(tǒng)理論以及雷達組網(wǎng)資源管控的基本內(nèi)容,本文提出的雷達組網(wǎng)認知管控架構(gòu)如圖3所示。

        在認知管控架構(gòu)中,雷達網(wǎng)絡通過傳感器對物理環(huán)境的探測,形成對真實環(huán)境的描述,在此基礎上學習、分析得出感興趣的探測區(qū)域以及目標,結(jié)合傳感器狀態(tài)通過智能規(guī)劃自適應生成各類探測行動策略以及感知行動策略,完成資源管控閉環(huán)。系統(tǒng)各部分功能如下:

        感知組合:通過傳感器組合實現(xiàn)對物理環(huán)境的量測,同時基于量測數(shù)據(jù)生成目標運動狀態(tài)以及信息熵狀態(tài)。目標運動狀態(tài)表示目標運動物理軌跡,而信息熵狀態(tài)則描述外部環(huán)境的“不確定性”。必要的時候,感知組合接受認知控制模塊的調(diào)節(jié),完成認知雷達系統(tǒng)的“內(nèi)反饋”。在感知部分可調(diào)節(jié)的雷達資源包括目標運動模型、濾波模型、雜波模型、檢測門限等。

        存儲及記憶:雷達測量數(shù)據(jù)中往往包含著對環(huán)境的重要信息,這些信息可能給當前以及今后的探測提供重要的幫助,因此雷達網(wǎng)絡必須存儲這些信息。記憶是在存儲基礎上建立起的對環(huán)境、對系統(tǒng)自身工作的知識、規(guī)律的總結(jié),包括感知記憶以及行動記憶。前者表示對環(huán)境的認知(例如先驗檢測概率)以及對感知系統(tǒng)參數(shù)調(diào)節(jié)的記錄,后者表示對每一次調(diào)度策略及其效果的記錄。根據(jù)需要記憶又可以分為短期記憶以及長期記憶,后者主要是指各種算法、知識、規(guī)律等。

        認知控制:認知控制是認知雷達網(wǎng)絡系統(tǒng)的“大腦”,是完成反饋閉環(huán)的中樞。認知控制通過分析感知系統(tǒng)對物理環(huán)境的不確定性描述(信息熵),結(jié)合過去的“記憶”,把認知雷達網(wǎng)絡系統(tǒng)中有限的資源集中到感興趣的區(qū)域以及目標上,實現(xiàn)探測效能的最大化。認知控制主要包括學習、規(guī)劃以及評估三大功能。學習是基于探測的信息熵,確定感興趣的區(qū)域以及目標;規(guī)劃是通過各種智能算法對認知網(wǎng)絡有限的資源進行動態(tài)調(diào)度,生成或更新應對策略;評估是實時在線對生成的策略進行評估分析。認知控制可以實現(xiàn)對探測資源的管控(探測行動策略),也可以實現(xiàn)對感知資源的管控(感知行動策略),甚至還可以通過調(diào)整數(shù)據(jù)率等參數(shù)實現(xiàn)對系統(tǒng)網(wǎng)絡帶寬以及計算資源的管控。

        探測組合:探測組合接受認知控制生成的探測行為策略,調(diào)度合適的雷達資源對物理環(huán)境進行探測??梢怨芸氐馁Y源包括探測裝備的選擇、探測天線組合、雷達工作模式、波束分配、波形、頻率、功率等。

        4 雷達組網(wǎng)認知控制關(guān)鍵技術(shù)

        認知管控的目的是在不降低當前系統(tǒng)整體探測性能的前提下,自適應將系統(tǒng)有限的資源調(diào)度到感興趣或者重要的區(qū)域以及目標上,提高對重點區(qū)域或目標的探測能力。從上一節(jié)的分析可以看出,認知控制關(guān)鍵的步驟是要完成“感知-學習-決策-行動”的閉環(huán),而完成這一閉環(huán)的基礎在于對真實物理環(huán)境的恰當描述以及對環(huán)境、策略的反饋學習。

        4.1 對真實物理環(huán)境不確定性的描述

        在傳統(tǒng)的雷達組網(wǎng)系統(tǒng)中,每部雷達上傳的是目標的點跡或者航跡信息,而點跡、航跡等信息僅僅是對目標的物理描述,缺乏對真實世界“不確定性”的描述。為此,需要借助香農(nóng)理論從信息熵的角度描述傳感器網(wǎng)絡對于目標探測信息量的大小。傳感器網(wǎng)絡每次探測目標的信息增量 定義為:

        其中p、q分別為某事件的先驗概率、后驗概率,pi,i=1為N個事件的離散概率,則先驗概率對應的信息熵定義為:

        若pi=qi,則I(q,p)=0,表示本次量測沒有提供任何信息,若pi≠qi,則I(q,p)≠0,則說明本次量測提供了新的信息。傳感器的目的就是與目標環(huán)境互相作用,以進一步減小目標環(huán)境的“不確定性”。

        4.2 基于貝葉斯理論的目標環(huán)境狀態(tài)估計技術(shù)

        由于在雷達檢測跟蹤過程中不可避免的存在量測噪聲,因此需要對量測數(shù)據(jù)進行一定的處理,以準確估計目標環(huán)境狀態(tài)。貝葉斯理論能夠依據(jù)積累的經(jīng)驗值以及當前的量測值,準確估計目標的運動狀態(tài),因此被廣泛應用于多目標檢測跟蹤過程中。設定zk為量測的數(shù)據(jù)向量,xk為目標環(huán)境狀態(tài)向量,則依據(jù)貝葉斯理論有:

        貝葉斯理論表明了后驗概率與先驗概率以及當前量測值的關(guān)系。典型的貝葉斯濾波器是卡爾曼濾波器。卡爾曼濾波器精度高,并且具有一定的自適應特性,因而是跟蹤濾波中最常用的方法。但在實際系統(tǒng)中,觀測模型往往具有較強的非線性,且模型噪聲可能存在非高斯的情況,因而須使用非線性濾波方法。通過對量測數(shù)據(jù)的濾波,不僅能夠給出目標的運動軌跡,也能夠計算目標的信息熵,這是因為在濾波過程中協(xié)方差矩陣表示的是目標狀態(tài)的不確定性,通過對每一次觀測更新協(xié)方差矩陣,減少目標環(huán)境的不確定性,使信息量增加。

        4.3 傳感器網(wǎng)絡自主學習技術(shù)

        具備自主學習技術(shù)的傳感器網(wǎng)絡能夠根據(jù)每次量測的數(shù)據(jù)完成對目標環(huán)境的學習,在此基礎上采用合適的傳感器組合策略并對策略進行實時在線評估。本文采用增強學習方法實現(xiàn)雷達組網(wǎng)系統(tǒng)自主學習的能力。增強學習算法能夠使機器與環(huán)境進行自主交互,通過感知數(shù)據(jù)完成對目標環(huán)境學習、規(guī)劃與評估功能,因此十分適合于實現(xiàn)認知控制的反饋閉環(huán)。在認知系統(tǒng)中,目標環(huán)境通常可以建模為一個有限狀態(tài)的馬爾科夫決策過程(Markov Decision Process,MDP)。在MDP中,狀態(tài)轉(zhuǎn)移概率和獎勵概率在是隨機的但在問題求解過程中保持不變。增強學習的問題可以定義為:給定環(huán)境狀態(tài)集合S,認知系統(tǒng)行為集合A,獎勵集合R,求解一系列決策規(guī)則δt,t=1,...,T,使得當前的收益與期望的收益最小化。在t時刻,決策規(guī)則δt也稱為策略。

        基于增強學習的傳感器控制閉環(huán)如圖4所示。在第k個管控步驟,傳感器組合不斷的從目標環(huán)境獲取量測數(shù)據(jù),在此基礎上計算k時刻目標的信息熵Hk,并結(jié)合先驗的知識預測k+1時刻目標的信息熵Hk+1,信息增量模塊計算兩個時刻的信息增量Ik+1,作為增強學習的獎勵函數(shù)。傳感器控制模塊根據(jù)信息增量Ik+1來動態(tài)調(diào)整探測策略,選擇合適的傳感器組合對目標環(huán)境進行探測,從而完成“感知-學習-決策-行動”的管控閉環(huán)。

        5 結(jié)束語

        當前,世界上多個國家都在積極發(fā)展各種新型威脅武器,這些新型目標給傳統(tǒng)的防空雷達組網(wǎng)系統(tǒng)造成了很大的威脅。為有效應對這些新型非合作目標對我國領土的威脅,需要進一步提高傳統(tǒng)雷達網(wǎng)絡的智能協(xié)同能力,才能充分發(fā)揮體系作戰(zhàn)的力量。認知管控技術(shù)通過對感知信息的智能處理,可以協(xié)助幫助鑒定一系列的國土突發(fā)威脅,包括可疑目標行動、非法入境、低空飛行器以及自然災害等事件,同時實現(xiàn)雷達資源的自適應分配、調(diào)整,進而提升雷達組網(wǎng)探測網(wǎng)絡的整體作戰(zhàn)效能。本文結(jié)合雷達組網(wǎng)資源管控的基本內(nèi)容以及動態(tài)認知系統(tǒng)的基本理論,提出了一種雷達組網(wǎng)認知管控系統(tǒng)架構(gòu),并對認知控制的關(guān)鍵技術(shù)進行了研究,為雷達組網(wǎng)認知系統(tǒng)的構(gòu)建提供了理論依據(jù)。

        參考文獻

        [1]HaykinS., Cognitive radar: a way of the future[J].IEEE Signal Processing Magazine, 2006, 23(1):30-40.

        [2]HaykinS., Cognitive radar networks [C].Computational Advances in Multi-Sensor Adaptive Processing, 2005 1st IEEE International Workshop on, 2005:1-3.

        [3]HaykinS., FusterJ.M., On cognitive dynamic systems: Cognitive neuroscience and engineering learning from each other [J].Proc. IEEE, 2014, 102(4): 608-628.

        [4]葉朝謀,丁建江,等.雷達探測資源管理技術(shù)分析與評估[J].現(xiàn)代雷達, 2012, 34(3):6-11.

        [5]Steinberg, A., Bowman, C., Rethinking the JDL Data Fusion Levels[C].in Proc .National Symposium on Sensor Data Fusion, 2004.

        [6]Felix Smits, Albert Huizing, Wim van Rossum, Peter Hiemstra, A Cognitive Radar Network: Architecture and Application to Multiplatform Radar Management[C].Proceedings of the 5th European Radar Conference, 2008:312-315.

        作者簡介:陸澤健(1986,08-),男,2015年獲得北京郵電大學博士學位,目前為中電集團電子科學研究院在站博士后,主要研究方向為多傳感器信息融合、認知系統(tǒng)以及智能優(yōu)化理論和方法。

        猜你喜歡
        認知管控
        EyeCGas OGI在泄漏管控工作中的應用
        多端聯(lián)動、全時管控的高速路產(chǎn)保通管控平臺
        EPC總承包項目的設計管控探討
        管控老年高血壓要多管齊下
        有效管控保函風險
        中國外匯(2019年10期)2019-08-27 01:58:14
        詩性與個性:艾略特認知世界的建構(gòu)
        《紅樓夢》隱喻認知研究綜述
        人間(2016年26期)2016-11-03 16:01:13
        淺析當代形式下中國文化在德國的影響及滲透
        從社會認同淺談蕭峰之死
        農(nóng)戶安全農(nóng)產(chǎn)品生產(chǎn)意愿及其影響因素研究
        一本一道波多野结衣av中文| 欧美丰满熟妇bbbbbb| 三年在线观看免费大全下载| 亚洲免费黄色| 男男互吃大丁视频网站| 日产精品一区二区三区| 一级二级三一片内射视频| 久久精品国产亚洲av麻豆瑜伽| 亚洲欧美日韩国产精品一区二区| 亚洲产国偷v产偷v自拍色戒| 欧美视频九九一区二区 | 先锋影音av资源我色资源| AV中文字幕在线视| 一区二区三区四区亚洲免费 | 国产精品流白浆喷水| 久久综合久中文字幕青草| 久久精品国产亚洲超碰av| 亚洲av日韩专区在线观看| 亚洲成a∨人片在线观看无码| 老司机在线免费视频亚洲| 亚洲国产av无码精品| 日本无遮挡吸乳呻吟视频| 丰满少妇棚拍无码视频| 国产丝袜爆操在线观看| 国产精品永久免费| 国产精品一区二区在线观看99| 性一交一乱一乱一视频亚洲熟妇| 女色av少妇一区二区三区| 欧美日韩色另类综合| 久久国产国内精品对话对白| 在线看亚洲一区二区三区| 含紧一点h边做边走动免费视频| 这里有精品可以观看| 亚洲视频一区二区久久久| 少妇无套裸按摩呻吟无呜| 国产福利一区二区三区在线观看 | 色www永久免费视频| 香蕉视频一级| 中国av一区二区三区四区| 婷婷成人丁香五月综合激情| 内射后入在线观看一区|