張 勝,胡學峰,劉 暢,李 娟
(1.安徽軍工集團控股有限公司,合肥 230051;2.北京理工大學機電學院,北京100081)
近年來,隨著計算機技術、大數據、人工智能、集成電路等領域的不斷發(fā)展與突破,無人系統(tǒng)技術得到了迅猛發(fā)展[1]。受單一平臺的能力約束,無人系統(tǒng)集群技術作為第三次抵消戰(zhàn)略的五大支撐技術之一,得到各國高度青睞[2-3]。對集群行為的研究最初起源于人們對自然界眾多生物集群行為的好奇和探索。20世紀50年代初期,學者 Grasse[4]通過對社會性昆蟲的行為進行研究觀察到:單個個體行為較為單一,其能力也十分有限;然而由大量昆蟲組成的集群則能表現出強大的能力, 能夠完成各種復雜高難度任務。大量簡單個體通過有序組合所表現出來的集群能力稱之為“群體智能(Swarm Intelligence, SI)”。
近年來,作為無人系統(tǒng)集群研究領域的關鍵問題之一,集群控制受到了大量學者的關注?,F有無人系統(tǒng)集群控制策略主要沿以下兩條思路進行。(1)根據任務需求將群體任務進行分解,通過個體間通信和協(xié)調完成特定隊形的保持和動態(tài)調整。合理的編隊飛行可以提高任務完成效率,抵御外來入侵,增加集群靈活性,進而保證系統(tǒng)穩(wěn)定性。(2)從仿生學的角度出發(fā),研究自然界中社會性群落的集群行為,分析其中原理機制,借鑒生物集群的主要思想,設計適用于無人系統(tǒng)集群的控制策略。以下分別針對這兩類研究思路進行相關文獻概述。
基于個體間協(xié)同的無人平臺編隊方法是當前集群協(xié)同的主流方法之一。關于此種無人機編隊控制方法已經發(fā)展出了幾種主流思想[5-7]。(1)基于行為法。通過定義和設計基本行為,如跟隨、避障、隊形變換等,進行集群控制。Balch等[8]開創(chuàng)性地提出將基于行為的編隊控制方法用于機器人編隊控制。基于行為法可以綜合隊形中其他個體的運動狀況,產生自身的運動決策,以保持整體隊形的穩(wěn)定性。然而,此控制方法主要通過預設信息和各種觸發(fā)條件來產生自身控制指令,不能明確地定義群體行為,在數學上對其行為進行分析和仿真的難度較大,保持隊形穩(wěn)定的耗費較大,編隊的適應性和靈活性也因此降低。(2)領航控制。集群中個體在遵守自身運動規(guī)則的前提下,令集群中的少數個體擁有更多的環(huán)境信息和運動信息,賦予其更強的信息處理能力和交互能力[10]。通過領航個體與其他個體的局部通信交換運動位置信息,最終實現群體按照特定隊形和方向運動。領航跟隨算法是目前編隊控制最常用的方法之一,具備較強的擴展性,然而可能存在系統(tǒng)中隊形反饋不明確、領航者失效等問題。(3)虛擬結構法。將編隊整體設想為一個物理上的剛體,依據集群系統(tǒng)的幾何中心或隊內虛擬或真實的長機標定個體的相對位置[9]。虛擬結構法避免了傳統(tǒng)領航編隊方法中領航無人機出現故障或失去功能時編隊無法繼續(xù)保持的缺點,并且可以很容易地指定機器人群體的行為并及時得到隊形反饋,能夠取得較高精度的軌跡跟蹤效果。然而,計算合成虛擬長機和獲取鄰機位置,需要較高的通信質量和較強的計算能力。(4)人工勢場法。通過勢函數對集群系統(tǒng)中的局部行為規(guī)則以及環(huán)境對單一個體的作用進行描述。每個個體在勢函數的約束下進行行為選擇[11]。然而,此類方法存在勢函數設計難等缺陷。除了上述幾種典型的集群編隊控制方法外,學者們還發(fā)展出圖論法、一致性法以及各類混合控制法,滿足了集群面對復雜環(huán)境的任務需求,增強了系統(tǒng)魯棒性。
無人系統(tǒng)的集群控制與生物群體智能行為較為相似[12]。換句話說,實現無人系統(tǒng)集群控制的一條重要思路是對自然界生物群體智能行為進行原理性探究。Reynolds[13]建立了一種模擬智能體的Boids模型,用于模擬鳥類等動物的群體運動。這些智能體不受任何中央控制,只依賴于每個智能體的個體行為和其局部的互動。互動由3個基本操作構成:聚集、分離以及對齊。匈牙利物理學家Vicsek等[14]從統(tǒng)計力學的角度提出了Vicsek模型,通過對集群密度與噪聲強度等參數的修改,對受生物啟發(fā)建立的數學模型進行了定量分析。Vicsek模型在自主控制機器人與分布式傳感器網絡中有著廣泛的應用。Spector等[15]在Boids模型的基礎上,對個體行為進行量化分析,并結合Reynolds基本規(guī)則,建立了Swarm模型。Kwong等[16]在此基礎上采用啟發(fā)式算法對模型的參數與集群行為涌現模式進行了研究。Wu等[17]在Swarm模型基礎上,引入了粒度的概念并建立了基于粒度的Swarm模型(Granular-Swarm模型),根據不同的粒度對該模型的涌現行為進行了研究。Jadbabaie等[18]針對 Vicsek模型非線性部分求解與分析困難的問題,對Vicsek模型進行了線性化。Cucker等[19]在 Vicsek模型基礎上,建立了所有個體速度方向均不相同的數學模型,并利用圖論中的連通性理論對模型所產生的集群涌現行為進行了分析,對涌現行為與模型參數之間的相互關系進行了證明。 Duna等[20]提出基于鴿群行為機制的多無人機自主編隊方法。Pearce等[21]提出了一種利用投影方式來模擬鳥群中信息傳遞的數學模型,該模型通過少量參數來控制鳥群的密度,進而模擬多種鳥群的飛行行為。姜龍亭等[22]針對集群執(zhí)行任務時的個體之間的防碰撞問題,提出了基于群智機理的集群防碰撞控制方法,提高了集群的集結效率。Charlesworth等[23]提出了一種基于未來狀態(tài)最大化原則的鳥群運動模型,盡管沒有明確設定聚集、散開、避碰等規(guī)則,但鳥群在運動中仍涌現出了這些行為。這一研究為揭示生物集群行為內在機理提供了一種新的思路。
綜上所述,現有集群控制策略大多采用基于上層規(guī)劃的方式,需要人為設定明確的行為規(guī)則供無人系統(tǒng)集群使用或遵守。這類方法的智能程度較低,可擴展性及環(huán)境適應性較差。當遇到未預先定義的場景或狀態(tài)時,無人系統(tǒng)則難以做出適當的行為,以有效應對出現的意外。此外,現有研究大多依賴于無人系統(tǒng)之間的雙向信息交互。當無人系統(tǒng)之間的通信受到環(huán)境或敵方干擾而無法正常工作時,集群協(xié)同效能將受到極大的影響。本文從仿生角度出發(fā),建立基于單體視覺投影的集群控制模型,實現大規(guī)模集群行為自組織涌現。此外,設計避障機制實現對入侵者的檢測和規(guī)避,探究集群隊形的變化特性。
生物學家的研究表明:鳥群僅依靠視覺信息輸入便能夠保持自身與群體其他個體的相對位置關系,進而保持整個群體隊形的有序性。在生物集群運動過程中,絕大多數的單體因其移動速度快、距離遠,很難被追蹤到,甚至在整個群體中很難被辨別出來。一個在天空中飛行或海洋中游泳的鳥群或魚群結合其活動背景會體現出強烈的視覺反差,將集群中的單體看成視域中快速移動的黑影,將天空看成較為單一的光背景,這就形成了類似于鳥類視網膜中的投影,稱作視覺投影模型[22]。圖1展示了其他單體在一個單體視網中的投影情況。其中,黑色圓盤代表個體agenti(i= 1 ,2,…,N)及其視覺感知鄰域中的友方個體,N表示集群規(guī)模,θij(i= 1,2,… ,N;j= 1 ,2,…,11)代表鄰域個體在個體agenti鄰域中的視覺投影角度信息。
圖1 單體視覺投影示意圖Fig.1 Illustration of vision projection
基于上述視覺投影輸入信息,個體agenti的速度和位置的更新方程為
每個個體通過視覺感知可獲得其感知范圍(即感知鄰域)內個體的方位角信息θij(i= 1 ,2,…,k= 1 ,2,… ,N}為個體agenti的感知鄰域集合,d(xi,xk)表示agenti和agentk之間的距離,r為感知半徑,|·|表示集合的勢。為了便于后續(xù)進行計算,在指定的坐標系下,通過下式將θij限制在區(qū)間[0 °,360°]內。
綜上,鄰域投影個體的方位角信息對每個個體帶來的投影項可描述為
投影項對應于動物集群中單體傾向于向黑影-光亮邊界尋找最佳方向的行為。需要說明的是,該項中不僅包含了群體內個體的投影,當有集群外個體進入后也會產生投影,這類信息如何使用和集群的任務是緊密相關的。在第3節(jié)中將以避障為典型案例闡述當其他個體運動信息被探測到后個體當如何反應。另外,這一模型也同樣可擴展到三維的場景,二維平面的投影圖也會變成一個球體域,投影項pi也會變?yōu)槿S向量。
通過對感知鄰域N(i)中個體速度朝向信息的獲取,形成最近鄰居個體速度的平均值,即列隊項
列隊項保證每個個體與其感知到的其他個體的速度方向保持匹配,如此便能將產生集群列隊飛行的集群行為。
最后,在每次單體坐標更新的迭代算法中加入了隨機的擾動項ni,且每個步長所遭受的擾動量均不相同。噪聲擾動的加入使得群體間的無序性增強,來自于對昆蟲集群行為的成功模擬。噪聲項的引入給集群帶來的干擾,但是仍能保持良好的聚集性。
在自然界中,社會性群居生物必須具備抵御入侵者(捕食者)干擾(攻擊)的能力,才能給予群體中個體足夠的保護。每個個體有序且快速地躲避入侵者,對于在沖突中減少群體損失起到重要作用。入侵避障功能要求入侵者向群體中某個位置或某個個體任意時刻發(fā)起攻擊時,處在集群中的每個個體要在入侵者進入到自己的感知范圍內時能及時做出正確的響應,且響應必須保證自己和群體的安全。
通過設計一個朝向質心的入侵者模型,使得群體隊形受到較為強烈的擾動。具體地,假設入侵者以兩倍群體運動速度從群體外任一點開始攻擊,且始終朝向群體質心運動。入侵者速度和位置變化公式為
式中,表示群體質心速度的歸一量,即群體質心速度方向??紤]到已有的群體內的投影圖規(guī)則模型約束,通過設置每個個體的警戒范圍rattack,使得rattack范圍內的個體受到入侵者和投影圖規(guī)則的雙重影響而改變自身速度和位移,即個體速度轉向與入侵者速度朝向垂直的方向以兩倍于群體飛行速度進行逃逸;對于rattack范圍外的個體,除了繼續(xù)受單一的集群機制控制之外,還會根據附近是否有入侵者進行協(xié)調,可以通過公式進行調整
加入該項的影響過后,集群中單體速度和位置的更新公式變?yōu)?/p>
最終希望看到的效果是,入侵者撤退或穿出群體隊形,并逐漸遠離群體,離開每個個體的探測范圍,群體重新處于安全狀態(tài),正常飛行。同時,群體內部逐漸恢復聚集。在后續(xù)的數值實驗中,本文將探究不同的警戒范圍、不同入侵者影響范圍、不同個體探測距離對于群體行為的影響。
(1)群體重心
為了直觀地展現出群體的飛行軌跡和在飛行過程中的群體的有序性和隊形保持的穩(wěn)定性,給出群體重心C的計算公式為
式中,N為群體規(guī)模,xi為個體位置坐標。
(2)速度偏差相關度[23]
通過定義群體中個體間的速度(朝向)偏差以及相關程度,來反映群體間的協(xié)調性度量。
首先求出每個個體與群速度的偏差
式中,vi為agenti的速度;v表示群體質心速度,此處可以理解為群體速度的平均值;ui為個與群體的速度差。個體之間的速度偏差的相關函數C(d)定義為
式中,N為群體規(guī)模,dij為兩個個體之間的距離;d為距離閾值;δ(d-dij)為狄拉克函數;c0作為比例因子,本文將它定義為c0=1;C(d)衡量了在距離d時速度偏差的平均內積。較高的C(d)值表示在一定的距離內的所有成員之間的速度(朝向)具有很強的相關性,此時群體表現出高度一致的狀態(tài),即所有單體的飛行方向基本統(tǒng)一。
(3)群體極化函數[24]
群體的極化現象一般分為全局(Global Polarization)的極化和局部極化(Local Polarization)兩個方面來考量[24]。此處考慮全局極化函數
式中,N為群體規(guī)模,vi為agenti的速度;v表示群體質心速度,此處可以理解為群體速度的平均值。群體極化函數Φ是基于單位向量的點積,其取值范圍為 0~1。較大的Φ值意味著群體有更強的極化效果,群體更加有序。
為了探究在不同參數(wp,wa,wn)組合下,自組織集群所表現出來的不同集群形態(tài),本文設置了如表1所示的參數組合進行實驗驗證。wp代表投影圖的權重;wa代表最近鄰鄰居的平均項權重,即群體一致性的重要權重;wn則表示施加在群體里的擾動,wn值越大,則群體的無序性相應加強。
表1 三組測試算例下的不同權重設置Table 1 Parameter settings for three test cases
在仿真過程中,設計不同的模塊來分別表達速度的調整以及位置的調整,通過迭代進行輸入的變換,進而實現位置、速度的更新。這里設置群體規(guī)模為100,迭代總步長為1000次,單體探測范圍(鄰居交互機制中的最大范圍)為r=10。初始的個體位置坐標和速度朝向均為隨機設置。
圖2~4展示了3組權重下集群行為情況及相關指標隨迭代步長的變化。群體運動全程的系統(tǒng)穩(wěn)定性可以用群體質心的運動軌跡來進行考察,通過對每次迭代后的隊形求質心坐標并記錄,得到群體的質心運動結果。從圖2可以看出,質心運動軌跡較為平滑,未出現明顯的劇烈震蕩,說明群體具有較高的穩(wěn)定性,群體質心在按照群體決策穩(wěn)定運動。此外,速度偏差相關度大多數情況為正,可見群體處于相對緊耦合的狀態(tài),群體間速度偏差不大,群體飛行過程中的協(xié)調性較高。最后,通過分析群體極化函數曲線可知,群體表現出先從松耦合到緊耦合約束然后再逐漸放松耦合程度的過程,即函數先增后減,并且此趨勢具有一定的不規(guī)則的周期性。這一現象符合自然界動物集群的約束過程,即集群內部存在某種反饋機制,可以糾正某些速度與整個群體相差較大的個體的運動行為,從而達到群體的高度一致性。
圖2 組合1集群行為示意圖及相關指標Fig.2 Illustration of swarm behavior and related metrices for case 1
組合2的情形提高了投影項的權重,降低了列隊項的權重,則群體將更多地依賴投影項進行控制,同時,噪聲擾動項有所下降。在此權重規(guī)則組合的情況下,群體仍能保持很好的有序性和一致性,具體表現在較平滑的群體運動軌跡(群體質心軌跡),如圖3所示。從圖中可以看出,在經過大約200次迭代后,速度偏差相關度逐漸趨近于0,與組合1(圖2)的速度偏差相關度函數變化趨勢相差明顯。這一現象可能由于群體間的擾動而有所減少。
圖3 組合2集群行為示意圖及相關指標Fig.3 Illustration of swarm behavior and related metrices for case 2
自然界中,昆蟲類群體的主要表現為較高的無序性和混亂性,本模型可以很好地對昆蟲的集群行為進行模擬。具體可以通過減小投影項權重,增加噪聲項擾動實現,如圖4所示。噪聲項擾動的增加使得群體中的個體不再具有較高的一致性,個體速度方向呈現出多向化趨勢。值得一提的是,在仿蟲群的過程中,由于噪聲項的引入,會隨即發(fā)生群體中個體丟失的狀況,這也是群體無序性的一個重要體現,表現在評價指標里則會出現群體質心嚴重波動的情形。與前面兩組實驗相比,組合3集群的速度相關性更加離散。同時,群體間形成的全局極化不夠穩(wěn)定,極化函數出現較為嚴重的波動。
圖4 組合3集群行為示意圖及相關指標Fig.4 Illustration of swarm behavior and related metrices for case 3
經過以上3組的仿真可以看出,在噪聲項wn較低的水平下,wa項在群體中有著強制性矯正的作用。隨著wa項的降低,在極化函數上則表現為上升過程的緩慢,群體一致性的演化過程變得緩慢,但是因為wp項的增加,使得群體間通過視網膜投影進行協(xié)調演化的規(guī)則得到增強,群體的極化程度在達到一定值后,能表現出更好的穩(wěn)定性。
基于4.2節(jié)的實驗,考慮在組合2情形下探究存在外來入侵者情形下群體的避障行為。在此,設置集群中個體警戒范圍為r=10,入侵者以兩倍群體速度,即2v0,從原點出發(fā)追擊運動過程中的集群。對于群體避障任務,該過程中會出現入侵者穿透集群和入侵者撤出集群兩種情形。圖5~6分別展示了兩種情形下集群行為以及指標隨迭代次數變化情況,圖中紅色個體代表集群中的個體,黑色個體代表入侵者。
從圖5可以觀察到,黑色入侵者朝向群體重心進行入侵,當其行為被最外圍單體探測到后,群體由外到內依次做出響應。原本聚集的個體由于遭受入侵者的沖擊,迅速散開,群體保持散開隊形并與入侵者保持安全距離持續(xù)飛行。需要注意的是,這里很多內圈的個體并沒有看到入侵者,而是被其他個體的行為所影響。
圖5 入侵者穿透集群行為示意圖及相關指標(入侵者預警范圍 ra t tack = 1 0,個體的探測范圍r=5)Fig.5 Illustration of swarm behavior and related metrices when the attacker penetrate the swarm(invasion rangera t tack = 1 0, detection ranger=5)
入侵者飛行固定時間步長后認定為入侵失敗,隨機做出穿透集群的撤退行為,處于相應區(qū)域的個體迅速做出響應,持續(xù)了一段時間的新隊形再次被局部沖散,入侵者撤出群體后,集群內再次逐漸形成新的集群。群體質心曲線在入侵者侵入群體過程中存在一段明顯的波動,其表現是個體存在較大幅度的位置變化,在短暫的波動后,質心又回歸平緩且保持穩(wěn)定,系統(tǒng)回歸穩(wěn)定狀態(tài)。如圖5所示,在入侵至恢復時段(200~400步),相關函數值表現異常,400步長之后,系統(tǒng)回歸穩(wěn)定。
在這一過程中,當個體做出逃竄動作時,群體極化程度急劇減小,表現為個體間速度朝向的巨大差異性;而當系統(tǒng)恢復穩(wěn)定性后,極化函數又近似回歸為 1,表明系統(tǒng)協(xié)調一致性的恢復良好。這一點和位置關系展示的結果是一致的,這也說明了這一函數能夠在一定程度上反應集群內部個體之間的差異大小。
最后,本文探究當入侵者侵入后原方向撤出時系統(tǒng)在避障之后的隊形恢復情況。為了增強對比效果,設置本次入侵者所引起的預警范圍rattack=5,為上組實驗的一半;同時,將個體的探測范圍提高一倍,r=10。在此參數組合下的群體避障效果如圖6所示。
圖6 入侵者撤出集群行為示意圖及相關指標(入侵者預警范圍 ra t tack = 5 ,個體的探測范圍r=10)Fig.6 Illustration of swarm behavior and related metrices when the attacker escape from the swarm(invasion rangera t tack = 5 , detection ranger=10)
實驗結果呈現出群體無論是在入侵者侵入隊形后還是完全撤出隊形前,集群系統(tǒng)都能保持很好的聚集性,甚至出現個體將入侵者包圍的情況。當個體探測能力增強時,意味著個體可以更好地通過調節(jié)自身來增強系統(tǒng)的一致性,也可以說是系統(tǒng)的協(xié)調性增強。這一現象可以參考圖6的速度偏差相關度函數,其震蕩表明了系統(tǒng)不斷通過個體自適應調整而調整,從而使群體呈現出能夠對抗來自入侵者干擾、系統(tǒng)固有噪聲項干擾所帶來的不穩(wěn)定性和混亂。
同時,群體極化函數也能反映出系統(tǒng)的自適應調節(jié)過程。在入侵者入侵時對極化函數造成劇烈沖擊之后,極化函數一直可以維持在中等較高水平,這主要是群體個體通過不斷調整速度朝向,最終趨于穩(wěn)定,也意味著系統(tǒng)最終獲得穩(wěn)定。
由此可見,集群系統(tǒng)能夠依靠自組織模型順利躲避攻擊,并且基本恢復穩(wěn)定的隊形集群。同時,系統(tǒng)中個體的感知能力增強,群體則表現出更強的穩(wěn)定性,對突如其來的威脅表現出可靠的反應能力。
本文沿襲智能集群領域的仿生學思路,通過引入基于單體的視覺投影模型,實現了群體的自組織集群控制。通過設置不同的參數,實現了不同類型的集群行為,且得出有效結論:當噪聲項wn過高時,會造成集群隊形的混亂,使群體失去一致性和協(xié)調性;列隊項wa具有矯正的作用,在wa較高的情況下,群體的一致性更強,單體速度朝向更加一致,隊形更加整齊;wp為視覺膜投影產生特征方向的權重,局部范圍內影響個體的運動決策。此外,通過設計對群體具有威脅性的入侵者行為,侵入群體內表現出很好的避障效果,群體通過設計合適的通信能力以及合適的預警范圍,可以實現入侵者入侵過后群體較好程度的恢復。