馬特,鄭致遠,趙軍虎
(火箭軍工程大學,陜西 西安 710025)
多無人機(unmanned aerial vehicles,UAVs)系統(tǒng)的編隊隊形控制問題多年來一直是研究熱點[1-3]。對于多無人機編隊問題,分布式控制方法相較于集中式的控制有很大的優(yōu)勢[4],主要體現在:①實現“去中心化”,每個智能體和鄰居智能體進行單向或者雙向通信,不需要一個中心智能體,因此,節(jié)約了通信成本。②每個智能體都能進行獨立計算并決策,具有良好的自主性,同時保護了個體隱私。③系統(tǒng)具有良好的拓展性和魯棒性。在軍事斗爭中,甚至單個智能體遭到破壞,其他智能體仍然能夠照常完成目標任務。④單個智能體都可以獨立控制自身行為,因而系統(tǒng)具有很好的適應性。近年來,為了實現多智能體的自主編隊,不少學者提出了分布式控制算法。例如,文獻[5]研究了只需要測量相對位置實現多智能體編隊的分布式控制算法;文獻[6]研究了有限時間多智能體系統(tǒng)的一致性分布式控制算法;文獻[7]利用相對位置反饋實現縮放尺寸的分布式編隊控制算法;文獻[8]研究了多機器人的分布式自適應一致性追蹤控制算法。以上研究都針對編隊問題展開,實際上,多無人機的編隊可以轉化為分布式博弈問題來解決。
近年來,由于其在金融[9]、環(huán)境工程[10]、能源領域[11]以及軍事斗爭領域[12]的廣泛應用,博弈問題即納什均衡點(Nash equilibrium)的求解問題得到了廣泛關注。很多學者在博弈問題的理論研究和工程實踐應用都做出了相關的研究。例如,文獻[13]研究了博弈論在投標決策過程中的影響;文獻[14]結合神經網絡研究了博弈論在數字土壤映射中的應用。文獻[15]基于博弈論研究了艦載無人機編隊協同目標分配問題;文獻[16]基于納什議價研究了無人機自主編隊自主重構控制方法。
目前,很少有人將多無人機的編隊隊形問題與博弈論相結合的研究。本文研究了多無人機的編隊隊形控制問題,將無人機的編隊問題轉化為博弈問題即納什均衡點的求解問題,基于狀態(tài)反饋控制和梯度下降,設計了分布式控制算法。在飛行編隊中,每個無人機個體并不需要其他所有無人機的位置信息,只需要鄰居無人機的信息,最終實現無人機的編隊。
考慮架四旋翼無人機系統(tǒng)的編隊隊形控制問題,其中無人機的動態(tài)系統(tǒng)可以表示為
(1)
無人機編隊控制的目的是設計無人機的控制輸入ui,實現多無人機的自主編隊。
在分布式博弈中,博弈個體之間存在博弈關系,每個博弈個體的目標不但和自己有關還和其他博弈個體相關,每個博弈個體都想通過改變自己的決策來達到自己的目的。
1.2.1 圖論
1.2.2 博弈問題描述
在博弈問題中,每一個博弈個體都有一個代價函數,這個代價函數不但和自己的行為決策有關,還和其他所有的博弈個體的行為決策有關。Ji(qi,q-i)∶RNm→R表示個體i的代價函數,其中qi∈Rm代表個體i的決策,q-i=col(q1,q2,…,qi-1,qi+1,…qN)代表其他博弈個體的決策,每一個博弈個體的目標都是最小化:
(2)
(3)
從式(3)可以得出,當博弈個體處于納什平衡點的時候,任意一方個體都不能單獨改變自己的決策來減小自己的代價函數,也就是說每個博弈個體都處于最差情況下的最優(yōu)狀態(tài)。
1.2.3 問題轉化
多旋翼無人機系統(tǒng)(1)的編隊使多無人機的位置達到理想值,而博弈問題的目標在于通過分布式算法使決策收斂到納什均衡點。那么通過為無人機設計合理的目標函數使得納什均衡點為無人機編隊飛行的解。具體為無人機如下目標方程:
(4)
(5)
定理1.在無向連通圖的通信拓撲下,q*=col(q1,q2,…,qN)是博弈問題(2)的納什均衡點,當且僅當下列條件成立:
(6)
定理2.博弈問題(2)的解,即納什均衡點滿足多無人機理想編隊要求,且編隊的幾何中心為
證.根據目標方程式(4)以及定理1,納什均衡點滿足
(7)
首先,旋翼無人機的動態(tài)模型可以被寫成歐拉-拉格朗日系統(tǒng)的形式[19],即
(8)
式中:gi(qi)=[0,0,mig,0,0,0]T,τi=[Fi,Ni]T∈R6,Fi=R[0,0,ui]T,
(9)
R為由機體系轉變到慣性系的轉換矩陣,可以表達為
綜上所述,無人機的動態(tài)模型轉化為歐拉拉格朗日形式為
其中,Ez=[0,0,1]T。
基于狀態(tài)反饋和梯度下降為多無人機系統(tǒng)設計如下分布式控制算法:
(10)
式中:k1,k2為控制增益;yij為輔助變量;y-i=col(yi1,yi2,…,yi(i-1),yi(i+1),…,yiN)。
定理3.旋翼無人機系統(tǒng)式(1)通過分布式控制算法式(10)可以實現博弈問題(2)的納什均衡點的求解,即實現理想的編隊。
證.首先,結合無人機系統(tǒng)式(1)和分布式控制算法式(10),得到:
(11)
寫成緊湊的形式如下:
(12)
當系統(tǒng)達到平衡點的時候,得到:
(13)
考慮6架旋翼無人機理想編隊問題。通信拓撲選擇環(huán)形圖1所示。
圖1 通信拓撲圖Fig.1 Communication topology
即它的拉普拉斯矩陣為
(14)
6架無人機的系統(tǒng)參數如表1所示。
表1 旋翼無人機系統(tǒng)參數Table 1 Parameters of the six quadrotor UAVs
6架無人機的初始位置和初始歐拉角如表2所示。
Δ1=[-2.5,-2.5,-2.5,0,0,0]T,
Δ2=[-2.5,2.5,-2.5,0,0,0]T,
Δ3=[-2.5,2.5,2.5,0,0,0]T,Δ4=[-2.5,-2.5,2.5,0,0,0]T,
Δ5=[22.5,0,0,0,0,0]T,
Δ6=[10,0,0,0,0,0]T.
表2 無人機的初始位置和初始歐拉角Table 2 Initial positions and attitudes
理想的編隊模型如圖2所示。
圖2 理想編隊模型Fig.2 Desired formation
如圖3所示為6架無人機由初始位置運動到編隊位置的軌跡。圖4~6分別為無人機的滾動、偏航、俯仰角。仿真結果顯示無人機姿態(tài)角幅值變化均未超出一般旋翼無人機的姿態(tài)角的約束要求。6架旋翼無人機從初始位置出發(fā),通過改變姿態(tài)角運動至理想編隊位置,而后姿態(tài)角恢復為0并保持此平衡狀態(tài)。仿真結果充分驗證了本文提出算法的有效性。
圖3 旋翼無人機的編隊飛行軌跡Fig.3 Position trajectories of UAVs
圖4 無人機的滾轉角Fig.4 Roll angles of UAVs
圖5 無人機的偏航角Fig.5 Yaw angles of UAVs
圖6 旋翼無人機的俯仰角Fig.6 Pitch angles of UAVs
為了進一步驗證算法的拓展性和魯棒性,本文進一步考慮在編隊過程中,任意通信中斷情況下(無人機通信拓撲仍然滿足無向連通的要求),無人機群完成理想編隊的情況。
考慮原始無人機群理想編隊問題,但在編隊過程中時間t=25 s時,編號1,6的無人機之間的通信中斷,在此狀況下驗證無人機群能否仍然完成理想編隊任務。
仿真結果如圖7所示,在時間t=25 s時,編號1,6的無人機之間的通信中斷,雖然仿真實驗中無人機的軌跡存在微弱抖動,但無人機群仍然較好完成了編隊任務,證明了算法的魯棒性。
圖7 部分通信中斷下旋翼無人機的編隊飛行軌跡Fig.7 Position trajectories of UAVs under communication interruption
針對多無人機的編隊問題,本文將分布式控制與博弈論相結合,提出一種基于博弈的分布式控制算法。將多無人機的編隊問題轉化成博弈問題,利用一致性方法實現對多無人機的全局信息進行估計,通過梯度下降實現納什均衡點的求解,最終實現理想編隊。文中給出的仿真實例說明了該方法的有效性。