唐 勇, 周典樂, 王 濤
(1.西北工業(yè)大學(xué) 民航學(xué)院,西安 710073; 2.中航(成都)無人機系統(tǒng)股份有限公司,成都 610097;3.國防科技大學(xué) 前沿交叉學(xué)科學(xué)院,長沙 410073; 4.中山大學(xué) 智能工程學(xué)院,廣州 510006;5.廣東省消防科學(xué)與智能應(yīng)急技術(shù)重點實驗室,廣州 510006)
容易想象到的是一個人的注意力容易被周圍的聲、光等影響分散注意力從而影響到工作,如何保持注意力集中有意識的控制自己在心理學(xué)領(lǐng)域稱為“注意力控制”或者“認(rèn)知控制”[1-4]。對于生物個體來所,其能夠?qū)碜圆煌兄ǖ?視覺、聽覺、觸覺等)的信息相互作用并整合為統(tǒng)一的、連貫的和有意義的知覺過程,這個過程被稱為多感覺整合調(diào)節(jié)[5]。
Posner等[6]將注意力分為兩類,包括內(nèi)源性注意(endogenous attention) 和外源性注意(exogenous attention)。外源性注意又被稱為被動性或刺激性驅(qū)動注意, 指的是個體以外信息引起的無意識注意或者叫下意識注意,這也可以看做是直覺性人工智能模型的驅(qū)動模型基礎(chǔ)。例如,在一個安靜的教室內(nèi), 有學(xué)生突然大聲吼會自然吸引其他人的注意。
無人系統(tǒng)的自主智能體現(xiàn)在對于環(huán)境的自主感知、認(rèn)知,再到行動規(guī)劃到控制決策的自主能力。針對未來無人作戰(zhàn)平臺要求高度自主化,吳德偉教授等[7-10]在認(rèn)知理論應(yīng)用于自主導(dǎo)航控制領(lǐng)域做了大量工作,并且提出了一種認(rèn)知導(dǎo)航框架及其類腦實現(xiàn)方法。韓崇昭等[11]從生物多模感知認(rèn)知啟發(fā)提出了新的多源異構(gòu)信息融合工程論方法,應(yīng)用于無人系統(tǒng)目標(biāo)識別。而J.D.Boskovic等[12]則認(rèn)為機器人自主控制涵蓋了在線感知、信息處理認(rèn)知以及控制方法重構(gòu)等內(nèi)容。申靜[13]研究了選擇注意機制與多感覺的整合對于人類自身運動認(rèn)知的影響。Lounis等[14]提出了一種全局混合反應(yīng)/認(rèn)知的多控制架構(gòu)用于機器人自主控制決策,執(zhí)行多種任務(wù)包括避障、目標(biāo)跟蹤定位以及路徑跟隨等。易長安等[15]提出了一種基于分析函數(shù)描述的認(rèn)知機器人的潛在動作模型。感知與行動密切相關(guān),注意機制成為構(gòu)建具有認(rèn)知能力和意識型系統(tǒng)的基礎(chǔ)。李岳明等[16]提出一種基于注意力機制和模糊邏輯的運動規(guī)劃控制方法。認(rèn)知架構(gòu)用于解決無人系統(tǒng)多樣化環(huán)境下的效率、功能性以及可集成性、可擴展性以及可維護性[17]。Lee等[18]研究用增強學(xué)習(xí)方法解決無人直升機在發(fā)動機故障場景下的自主旋轉(zhuǎn)問題。有關(guān)研究學(xué)者總結(jié)了有關(guān)移動機器人未知環(huán)境自主控制決策領(lǐng)域的相關(guān)研究成果并出版了一些論著[19-20]。劉箴[21]通過引入注意機制實現(xiàn)虛擬人這個自主智能體的環(huán)境感知認(rèn)知模型,從而增強虛擬人行動的真實性。劉揚等[22]參考Stevens視覺認(rèn)知模型和注意的神經(jīng)控制回路信息處理結(jié)構(gòu)提出一種視覺顯著性計算模型。趙一帆等[23]提出引入注意機制的人工勢場的路徑規(guī)劃方法,解決容易出現(xiàn)局部極小值的問題,應(yīng)用于機器人導(dǎo)航控制。段海濱等[23]提出一種基于仿鷹眼視皮層網(wǎng)絡(luò)認(rèn)知機制的無人受油機視覺位姿精確測量方法,實現(xiàn)無人機自主空中加油精確對接。孟憲宇等[25-26]利用多源注意力理論研究了人工魚自主行為驅(qū)動的多感知融合算法。高峰等[27]提出采用決策場理論和貝葉斯理論進行誘導(dǎo)信息下駕駛員路徑選擇行為決策建模用于描述行為決策的動態(tài)。Nelson等[28]人在研究近距離無人機空中格斗,使用經(jīng)典制導(dǎo)律和博弈論的方法進行自主決策并做決策效能評估。無人系統(tǒng)不僅要和外部環(huán)境進行智能交互認(rèn)知并進行決策控制,同樣需要無人系統(tǒng)自身環(huán)境的認(rèn)知控制決策[29-30]。胡曉峰等[31]更是創(chuàng)新的將多注意力機制融入到戰(zhàn)場的態(tài)勢感知與認(rèn)知過程從而達到執(zhí)行輔助決策。
多源注意力與多感覺調(diào)節(jié)與整合之間的存在極為重要的關(guān)聯(lián)作用機制,這對于未來無人系統(tǒng)尤其多無人系統(tǒng)協(xié)同作戰(zhàn)運用中涉及到的從跨域多源感知、協(xié)同任務(wù)規(guī)劃到體系聯(lián)合作戰(zhàn)決策都具有重要的參考價值。大多數(shù)學(xué)者的研究集中在選擇注意模型的構(gòu)建以及在視覺系統(tǒng)中的注意機制運用,一些研究人員[32-33]從心理學(xué)角度針對內(nèi)外源注意力整合多感覺線索已經(jīng)有一些研究,但是還沒有結(jié)合無人系統(tǒng)智能感知系統(tǒng)應(yīng)用內(nèi)外源注意力進行多感知調(diào)節(jié)與整合,從而為實現(xiàn)仿生智能無人系統(tǒng)提供重要的工程設(shè)計理論基礎(chǔ)。
許多研究結(jié)果發(fā)現(xiàn),人類的選擇注意系統(tǒng)存在兩種不同的注意機制,一種是受到意圖控制的內(nèi)源性選擇注意,另一種是取決于刺激特性不受意圖控制的外源性選擇注意,并且這兩種注意機制對感知信息加工的時間進程有所差異,這對智能無人系統(tǒng)感知信息的處理有著極大的設(shè)計參考價值:
1) 外源性選擇注意顯著存在重疊的對感知信息進行加工處理;
2) 外源性注意是對外援刺激能夠以快速、自動的、非隨意的方式吸引注意;
3) 內(nèi)源性注意對感知信息的則是一種緩慢的、受控制的和隨意的關(guān)注點分配;
4) 內(nèi)外源性注意對于感知空間中的選擇注意是一種全空間的注意分配。
基于上述內(nèi)外源注意對于感知系統(tǒng)信息處理的啟示,無人系統(tǒng)在于環(huán)境感知與行為決策控制之間自主協(xié)調(diào),而內(nèi)源性和外源性注意機制的混合作用能夠在關(guān)聯(lián)環(huán)境智能感知與行為決策控制上具有巨大的優(yōu)勢,成為解決智能無人系統(tǒng)關(guān)鍵技術(shù)的熱點之一。對于智能無人系統(tǒng)來說,內(nèi)外源注意機制與自主行為決策控制的關(guān)聯(lián)應(yīng)用總體架構(gòu)如圖 1所示。
圖1 無人系統(tǒng)內(nèi)外源注意機制的智能感知應(yīng)用架構(gòu)
簡單來說,這種內(nèi)外源注意機制發(fā)生作用都是源自于中樞神經(jīng)系統(tǒng)的神經(jīng)元和突觸的物理特性,并非是什么神秘的特征,而是一種電磁場或者量子效應(yīng)。尤其需要注意的是,構(gòu)建智能無人系統(tǒng)所需要的意識認(rèn)知能力經(jīng)常與這兩種選擇性注意緊密聯(lián)系在一起,內(nèi)源性注意形成直覺性的智能行為控制能力,外源性注意形成一種刺激-反應(yīng)性的智能行為能力。兩種模式的選擇性注意將無人系統(tǒng)的智能行為設(shè)計帶入到意識工程系統(tǒng)領(lǐng)域,并且也允許我們控制進入大腦的大量數(shù)據(jù)。
人的感知系統(tǒng)結(jié)構(gòu)及其鏈接關(guān)系是根據(jù)內(nèi)外源注意實現(xiàn)多感知的高效管理、感知信息融合以及過載信息過濾,圖 2為人的多感知與決策控制系統(tǒng)結(jié)構(gòu)示意圖。對于無人系統(tǒng)需要構(gòu)建可靠的智能感知系統(tǒng),其所裝備的多源同質(zhì)、多源異質(zhì)傳感器從而構(gòu)建仿人的多感知器,利用內(nèi)源性和外源性選擇注意機制的不同驅(qū)動模式以及相互約束作用關(guān)系建立智能環(huán)境感知模型,實現(xiàn)對多探測器的資源調(diào)度以及高效率的感知信息處理、存儲和決策應(yīng)用。
圖2 人的感知器與控制系統(tǒng)體系結(jié)構(gòu)示意圖
對于無人系統(tǒng)來說,多感知器融合必然要綜合利用不同傳感器如慣性傳感系統(tǒng)、紅外視覺、溫度傳感器、可見光視覺、聲納系統(tǒng)、雷達系統(tǒng)以及激光測距系統(tǒng)等(見圖3)內(nèi)外部環(huán)境感知器的互補或特征指引關(guān)系,結(jié)合內(nèi)外源選擇注意混合驅(qū)動模式,以便實現(xiàn)仿人的智能感知信息處理結(jié)構(gòu),在信息處理方式上實現(xiàn):
1) 對低層感知系統(tǒng)以并行處理方式進行,全感知空間加速感知信息處理速度;
2) 高層認(rèn)知系統(tǒng)以串行方式進行,通過刺激外源性特征和任務(wù)意圖內(nèi)源注意,對信息進行篩選處理,實現(xiàn)快速處理。
從工程實現(xiàn)角度理解無人系統(tǒng)的多感覺意識系統(tǒng),可以總結(jié)為:意識系統(tǒng)產(chǎn)生自一個高度互聯(lián)的復(fù)雜的集成系統(tǒng)的系統(tǒng),這些系統(tǒng)之間采用非線性脈沖神經(jīng)網(wǎng)絡(luò)用來對大量輸入感知覺數(shù)據(jù)進行數(shù)據(jù)融合進而進行學(xué)習(xí)、存儲記憶、思考以及控制一個復(fù)雜的動力子系統(tǒng)。一個意識工程系統(tǒng)必須具備能夠?qū)W習(xí)和理解真實世界的狀況,并且最為關(guān)鍵的是通過各種算法技術(shù)包括遺傳算法、機器學(xué)習(xí)、模糊邏輯、認(rèn)知結(jié)構(gòu)以及神經(jīng)網(wǎng)絡(luò)的突發(fā)行為研究。
圖3 無人系統(tǒng)的自主行為決策控制結(jié)構(gòu)示意圖
大腦無時無刻都在接受大量的環(huán)境感知信息輸入, 多感知整合能夠?qū)碜圆煌兄鞯男畔⒔M合并減少感知系統(tǒng)內(nèi)的干擾信息, 從而促進多感知器重要信息的檢測、識別和定位[34]。外源性注意能夠促進刺激的檢測、識別和定位,能夠增強同一位置相對應(yīng)的同構(gòu)探測器或異構(gòu)感知器的信息處理, 加快無人系統(tǒng)對環(huán)境變化刺激的應(yīng)變速度[35],同時對感知信息處理需求是臨時的,快速產(chǎn)生同時快速消失。而內(nèi)源性注意則有其空間定向效應(yīng),隨著任務(wù)需求的變化而變化,是一種信息持續(xù)搜索跟蹤的驅(qū)動源。因此有必要探討內(nèi)外源注意在感知調(diào)節(jié)中的作用原理,尤其針對無人系統(tǒng)智能感知系統(tǒng)應(yīng)用研究中的可以提供極具價值的設(shè)計參考。
目前研究選擇注意機制都集中于視覺信息處理,通過分析文獻資料總結(jié)人腦多種注意機制及其在多感知器與自主行為決策控制中所發(fā)揮的作用模式(見圖4),研究多選擇注意機制之間的約束作用關(guān)系,基于空間位置和時空信息、基于非空間特征的目標(biāo)客體等多種注意加工機制模型在感知與行為決策之間的關(guān)聯(lián)模式,分析其在基于多感覺注意機制的無人系統(tǒng)自主行為決策控制中的作用機理,建立在復(fù)雜環(huán)境下多感覺內(nèi)外源注意信息與動態(tài)行為決策反應(yīng)的關(guān)系模型。
圖4 注意機制關(guān)聯(lián)多感知器與行動決策控制的關(guān)系結(jié)構(gòu)
感知系統(tǒng)信息來源包括內(nèi)部和外部兩種環(huán)境,而對環(huán)境感知依靠多感知器生成相應(yīng)特征的感知信息,內(nèi)源性和外源性注意機制是一種混雜驅(qū)動作用,內(nèi)源性注意機制是面向無人系統(tǒng)任務(wù)目標(biāo)特征實現(xiàn)在線實時驅(qū)動,并對行為決策控制構(gòu)成一種全時工作閉環(huán)環(huán)路。外源性注意機制則通過一種臨時信息驅(qū)動機制,對行為決策與規(guī)劃產(chǎn)生局部的、短時效應(yīng)影響。比如,對于無人作戰(zhàn)裝備進行戰(zhàn)術(shù)偵察搜索任務(wù)來說,內(nèi)源性注意就是戰(zhàn)術(shù)敵方目標(biāo)信息驅(qū)動,而對于戰(zhàn)場環(huán)境中突發(fā)的槍炮聲臨近,這是一種外源性的注意驅(qū)動,對于無人系統(tǒng)執(zhí)行戰(zhàn)場生存行為規(guī)劃與決策至關(guān)重要,對于此類感知信息的應(yīng)用從而執(zhí)行掩體尋找定位,躲避路線規(guī)劃以及行動控制,這種依賴內(nèi)源和外源注意力驅(qū)動的智能感知、決策與規(guī)劃控制一體的閉環(huán)結(jié)構(gòu)是無人系統(tǒng)智能話能力的一種基本架構(gòu),而智能感知技術(shù)的重要依托就是仿生內(nèi)外源注意力模型的構(gòu)建與應(yīng)用。
對仿生視覺系統(tǒng)而言,內(nèi)外源注意力的視覺驅(qū)動使得人類可以選擇與自己正要進行的行為最相關(guān)的視覺信息。比如,駕駛員的安全駕駛關(guān)鍵依賴于行車過程中各種障礙的檢測和實時監(jiān)視停車標(biāo)志、交通燈,而每一種視覺環(huán)境都有其復(fù)雜性和信息量負(fù)荷過載的特征。為了應(yīng)對這樣一個潛在的信息過載問題,內(nèi)源和外源性注意機制扮演著兩種關(guān)鍵的角色:
1)內(nèi)源性注意用于選擇任務(wù)行為相關(guān)的信息并忽略不相關(guān)的或者妨礙信息;
2)外源性注意能夠根據(jù)感知狀態(tài)和目的加強所選擇的信息。
依照生物視覺注意機制存在非均勻采樣的特征,暨在注視區(qū)域內(nèi)保持高分辨率,或者可以保持實際輸入圖像的采樣率不變;而在注視區(qū)域四周,則可以按照距離注視中心區(qū)域的遠近按照逐級降低的采樣率進行采樣。設(shè)計一種矩形區(qū)域非均勻采樣模型(見圖5),這種非均勻采樣的方法有利于大幅減少信息傳輸對通信帶寬的需求,同時提高運算效率[36],并且信息過濾算法僅涉及加減以及少量的乘運算,非常有利于大幅降低對計算機硬件系統(tǒng)性能的需求,更便于實現(xiàn)智能無人系統(tǒng)低功耗、低成本和小型化的發(fā)展需要。
圖5 按矩形區(qū)域模擬非均勻采樣算法示意圖
圖中原圖像尺寸記作W×H,其中注意驅(qū)動的觀察窗口尺寸大小設(shè)置為:αW×αH,α作為注意區(qū)域大小確定參數(shù)是由外部指令或者檢測與識別目標(biāo)的尺寸決定,注視區(qū)域塊內(nèi)保持高圖像分辨率或者對輸入原始數(shù)據(jù)率不變,以盡可能保留更多的重要信息。而對于內(nèi)外源注意區(qū)以外的圖像采樣率,根據(jù)其相對注意焦點的距離,逐級降低采樣率。簡單來闡述,給定一個矩形窗口,按照行采樣,從注意區(qū)域第一層采樣開始,3個像素點存儲一個,第二層采樣點,增大矩形區(qū)域,5個采樣點存儲一個數(shù)據(jù)信息,第三層采樣點,再次增大矩形選擇區(qū)域,7個采樣點存儲一個數(shù)據(jù)。
根據(jù)以上描述,給出下面以采樣點距離注意區(qū)域中心的距離為參數(shù),設(shè)置非均勻采樣率。假設(shè)在第i個采樣層的矩形采樣區(qū)域大小為Wi×Hi,其大小設(shè)置要求滿足采樣率越高,那么采樣的矩形區(qū)域應(yīng)當(dāng)越小,并且在該采樣層內(nèi),在其采樣范圍內(nèi)按照均勻采樣進行。隨著視覺圖像距離注視區(qū)域的距離增加,相應(yīng)的矩形采樣區(qū)域增大,即存在如下關(guān)系:
Wi×Hi 這是對視覺信息的內(nèi)外源驅(qū)動形成的一種信息獲取應(yīng)用模式,暨視覺注意力應(yīng)用,圖6為按此方式仿真生成的一種仿真圖,視覺圖像中空中的物體以及色彩艷麗作為外源注意驅(qū)動實現(xiàn)注意信息的有效整合,并調(diào)節(jié)信息存儲等應(yīng)用。 圖6 非均勻采樣仿真結(jié)果前后對比圖 再以無人系統(tǒng)的健康狀態(tài)監(jiān)控與管理評估應(yīng)用來表明內(nèi)外源注意驅(qū)動的智能感知調(diào)節(jié)作用。在智能無人系統(tǒng)的實際應(yīng)用中,對照仿生智能尤其是人的任務(wù)目標(biāo)規(guī)劃,前提是對自身健康狀態(tài)的實時評估,其次對任務(wù)完成的能力進行評估,再做行動決策,進而執(zhí)行行為規(guī)劃和控制。 無人系統(tǒng)健康管理信息同樣受到內(nèi)源性和外源性注意驅(qū)動,并形成不同的信息獲取與處理模式: 1) 內(nèi)源性注意要求對無人系統(tǒng)自身的動力支持系統(tǒng)、行動控制能力以及探測感知系統(tǒng)的工作狀態(tài)、有效工作能力進行實時評測,作為內(nèi)環(huán)境感知的重要支撐; 2) 外源性注意的核心問題需要對無人系統(tǒng)自身各個組成分系統(tǒng)包括結(jié)構(gòu)系統(tǒng)、導(dǎo)航系統(tǒng)、控制系統(tǒng)、制導(dǎo)系統(tǒng)和動力系統(tǒng)等存在可能的突發(fā)故障進行實時的檢測診斷,這是無人系統(tǒng)智能化能力的基本表現(xiàn)。 內(nèi)源和外源性注意有助于無人系統(tǒng)實現(xiàn)智能感知信息控制處理,且內(nèi)源性和外源性注意與多感知器存在緊密的交互關(guān)系。具體總結(jié)為: 1)外源性注意通過自下而上的方式實現(xiàn)多感知器的信息調(diào)節(jié)與整合, 包括空間不確定性、感知敏感度和探測通道間信號強度差異3種理論假說。內(nèi)源性注意是通過自上而下實現(xiàn)對多感知器信息產(chǎn)生調(diào)節(jié)作用。 2)多感知信息的調(diào)節(jié)與整合同樣反作用調(diào)節(jié)內(nèi)源和外源性注意,多感知整合自下而上地調(diào)節(jié)外源性注意(多異構(gòu)探測器所產(chǎn)生的不同時間、空間和目標(biāo)等信息特征對外援注意反應(yīng)程度的排序等影響);多感知整合自上而下地調(diào)節(jié)內(nèi)源性注意(表現(xiàn)為無人系統(tǒng)任務(wù)目標(biāo)因應(yīng)環(huán)境和自身狀態(tài)的變化而實現(xiàn)動態(tài)變化) 已有的一些研究成果表明[37]:任務(wù)要求與目標(biāo)、注意負(fù)荷以及智能系統(tǒng)個體期望能影響內(nèi)源性注意對多感知器整合的調(diào)節(jié)效應(yīng);任務(wù)類型會影響外源性注意調(diào)節(jié)多感知器整合調(diào)節(jié)效應(yīng)的大小。 本文針對無人系統(tǒng)智能感知系統(tǒng)具有多源異構(gòu)特征,甚至未來多域協(xié)同無人系統(tǒng)要求具備跨域協(xié)同智能感知能力,存在時空不確定性、信息過載、通信帶寬有限、大數(shù)據(jù)量延遲、注意負(fù)載和個體與群體期望博弈等挑戰(zhàn)性問題,這些都對智能感知系統(tǒng)提出了新的研究課題。而仿生的內(nèi)外源注意機制,不僅對于個體同樣對于群體組織都具有非常巧妙地多感知信息整合與調(diào)節(jié)作用,并且通過內(nèi)源和外源注意的引入能夠?qū)崿F(xiàn)智能感知系統(tǒng)的構(gòu)建,對于實現(xiàn)復(fù)雜動態(tài)環(huán)境下有效應(yīng)用智能無人系統(tǒng)完成復(fù)雜任務(wù)具有重要的工程價值。通過本文的相關(guān)研究,主要得出以下主要結(jié)論: 1) 對內(nèi)源性和外源性注意機制的作用進行總結(jié),并結(jié)合無人系統(tǒng)多源異構(gòu)感知系統(tǒng)運用提出一種內(nèi)源和外源注意應(yīng)用模型,給出了仿人的無人系統(tǒng)多感覺信息融合架構(gòu)。 2) 對內(nèi)外源注意機制在觀察、判斷、決策到行動(OODA, observation, orientation,decision & action)環(huán)路的關(guān)聯(lián)模式進行了分析,通過結(jié)合具體應(yīng)用提出了內(nèi)外源注意力的多感知調(diào)節(jié)運用方法。 3) 本文僅初步探討了仿生內(nèi)外源注意對于構(gòu)建無人系統(tǒng)智能感知系統(tǒng)的基本理論、運用方法和模式,下一步還需在無人系統(tǒng)的實際環(huán)境感知信息處理應(yīng)用中來進行系統(tǒng)級架構(gòu)演示驗證和工程模型的研究。采用更加先進的傳感器和更加合理的傳感器信息管理結(jié)構(gòu),提高無人系統(tǒng)對于外部環(huán)境和自身狀態(tài)的感知和認(rèn)知能力,同樣借助于人的多感知內(nèi)外源注意機制構(gòu)建無人系統(tǒng)的多源異構(gòu)/同構(gòu)協(xié)同探測器的綜合管理系統(tǒng)。3 結(jié)束語