亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

航天器姿態(tài)控制群體博弈分布式分配方法

2024-05-27 06:46:48劉浩然葉東肖楠孫兆偉

宇航學(xué)報 2024年3期

關(guān)鍵詞：分配策略

劉浩然，葉東，肖楠，孫兆偉

（哈爾濱工業(yè)大學(xué)航天學(xué)院，哈爾濱 150001）

0 引言

隨著微小衛(wèi)星技術(shù)的不斷發(fā)展，人們對小型化、集成化的衛(wèi)星產(chǎn)生了較濃厚的興趣，這種衛(wèi)星可批量生產(chǎn)與快速響應(yīng)［1］。但是這種小衛(wèi)星由于體積與質(zhì)量的限制，有時不能達(dá)到任務(wù)需求的性能指標(biāo)。人們進(jìn)而將注意力轉(zhuǎn)移至由微小衛(wèi)星構(gòu)成的細(xì)胞星組合體。這種細(xì)胞星組合體由結(jié)構(gòu)相同的眾多獨立細(xì)胞星組成，可根據(jù)任務(wù)的需要進(jìn)行在軌組裝［2］，并通過重構(gòu)來替換功能失效的細(xì)胞星。細(xì)胞星組合體不僅可以組合成為一個新的個體執(zhí)行任務(wù)，還能夠附著在無法進(jìn)行姿態(tài)控制衛(wèi)星上，利用細(xì)胞星的執(zhí)行機(jī)構(gòu)進(jìn)行姿態(tài)輔助控制［3-4］。這一功能有效地延長了失效衛(wèi)星的使用壽命，使有效載荷能夠發(fā)揮更大的效益。

每個細(xì)胞星自身都具有執(zhí)行機(jī)構(gòu)，如飛輪、推力器等。因此在對細(xì)胞星組合體進(jìn)行姿態(tài)控制的時候，產(chǎn)生控制力矩的執(zhí)行機(jī)構(gòu)數(shù)目大于航天器的自由度［5］。這是一種冗余的力矩控制，這種控制方式具有魯棒性強(qiáng)、提供的控制力矩大等優(yōu)點。但是隨著組合體中細(xì)胞星數(shù)目的增多，組合體結(jié)構(gòu)不斷變化，細(xì)胞星通間訊鏈路也愈加復(fù)雜，需要設(shè)計一種能夠適應(yīng)組合體結(jié)構(gòu)變化的分布式力矩優(yōu)化分配方法。

常用的冗余力矩控制分配法有：廣義逆法，這種方法將執(zhí)行機(jī)構(gòu)構(gòu)型矩陣的逆矩陣作為分配矩陣，是力矩最小的分配策略；鏈?zhǔn)竭f增法，這種分配方式考慮了執(zhí)行機(jī)構(gòu)的最大力矩輸出限制［6］。另外，郭延寧等［7］研究了在執(zhí)行機(jī)構(gòu)最大力矩限制條件下的能量最優(yōu)情況；何光宇等［8］使用遺傳算法解決了力矩分配最優(yōu)問題；張眾正［9］在考慮能量消耗的同時，優(yōu)化了執(zhí)行機(jī)構(gòu)的角動量裕度。近年來，博弈論方法也被用于多智能體的控制分配問題：Xiao等［10］將冗余控制力矩分配問題轉(zhuǎn)化為多個模塊衛(wèi)星之間的微分博弈問題，通過求解二次優(yōu)化問題實現(xiàn)力矩分配；柴源等［11］通過李雅普諾夫迭代法求解耦合狀態(tài)相關(guān)黎卡提方程，組得到狀態(tài)反饋控制器，從而實現(xiàn)及控制力矩分配；韓楠等［12］和羅建軍等［13］通過各細(xì)胞星之間的合作博弈，達(dá)到了控制失效衛(wèi)星的目的；常海濤等［14］提出了一種分布式能量均衡的冗余力矩分配方式，解決了集中通信信息負(fù)載大等問題；劉偉星等［15］給出了一種考慮飛輪角動量均衡的細(xì)胞星分布式力矩分配方法。上述分布式分配方法中，只考慮能量或角動量均衡度單一優(yōu)化指標(biāo)，并未考慮細(xì)胞星力矩輸出能力。在本文構(gòu)造非合作博弈的分布式群體博弈分配方法中，每個細(xì)胞星都輸出相對較小的力矩使總輸出力矩達(dá)到要求，并在分配過程中考慮到了輸出能力及角動量裕度的限制。

不同于一般博弈，群體博弈不研究單個博弈參與者的策略選擇，而是研究整個群體中的策略選擇分布［16］。近年來它的主要研究領(lǐng)域是優(yōu)化控制器設(shè)計［17］和資源分配問題［18］。例如，在無線通信網(wǎng)絡(luò)中，在提供客戶滿意的服務(wù)質(zhì)量的同時，盡量減少功耗［19］。同時群體博弈的動態(tài)資源分配方法還被廣泛應(yīng)用到城市供水系統(tǒng)［20］與電網(wǎng)系統(tǒng)的資源分配中［21］。Nash 均衡（NE）描述了群體中沒有一方愿意單方面改變其策略的狀態(tài)。群體博弈的最終目標(biāo)是求解群體Nash 均衡，常用群體動力學(xué)求解群體博弈Nash 均衡。常用的群體動力學(xué)有復(fù)制器動力學(xué)、Smith動力學(xué)以及l(fā)ogit動力學(xué)。群體動力學(xué)充分利用了群體博弈中群體質(zhì)量不變這一特點，能夠?qū)Ψ峙淇偭窟M(jìn)行限制，但是無法直接對選擇每種策略的群體質(zhì)量進(jìn)行限制。Sandholm［22］系統(tǒng)地總結(jié)了群體動力學(xué)與Nash 均衡之間的關(guān)系。Barreiro-Gomez等［23］建立了分布式群體動力學(xué)的廣義形式，在分布式群體動力學(xué)下，群體博弈的Nash 均衡仍然是穩(wěn)定的。Tan等［24］介紹了基于圖論拓?fù)涞膹?fù)制動力學(xué)，總結(jié)了分布式Smith 動力學(xué)和logit 動力學(xué)的平衡點與Nash 均衡點之間的聯(lián)系。群體博弈是解決分布式分配問題的一個有效手段。

本文將細(xì)胞星組合體力矩分配問題建模為群體博弈問題，提出一種基于群體動力學(xué)解決細(xì)胞星冗余力矩分配問題的方法。相較于傳統(tǒng)群體博弈只利用群體質(zhì)量對分配總量進(jìn)行限制，本文通過收益函數(shù)的設(shè)計增加對每個策略分配量的限制，在考慮能量消耗的同時利用細(xì)胞星輸出力矩能力與角動量裕度對細(xì)胞星分配到的力矩進(jìn)行限制。同時本文設(shè)計的分布式力矩分配方法可以適應(yīng)細(xì)胞星數(shù)目變化的情況。

1 組合體運動學(xué)與動力學(xué)

為方便后續(xù)描述引入如下坐標(biāo)系：OΙXΙYΙZΙ表示慣性坐標(biāo)系，是固連于慣性空間的坐標(biāo)系；OiXiYiZi表示第i個細(xì)胞星的本體系；ObXbYbZb表示組合體本體系，即計算力較強(qiáng)的動力學(xué)計算衛(wèi)星的本體系。

本文采用四元數(shù)對姿態(tài)進(jìn)行描述，四元數(shù)q=[q0]∈R4表示每個航天器相對慣性系的姿態(tài)。qv∈R3是單位四元數(shù)矢量部分，q0∈R是標(biāo)量部分。星群組合體的姿態(tài)運動方程為：

四元數(shù)qd=[q0]∈R4表示組合體期望姿態(tài)四元數(shù)，ω=[ωx ωy ωz]Τ為組合體慣性系下角速度。q×為q的叉乘算子，表示為：

引入誤差四元數(shù)qe=[qe0]∈R4，計算公式如下：

式中：A為星群體系相對于期望系的坐標(biāo)變換矩陣，

細(xì)胞星組合體動力學(xué)方程描述為組合體繞其質(zhì)心轉(zhuǎn)動的方程，每個細(xì)胞星都是剛體，引入剛體運動歐拉方程：

式中：ω×為ω的叉乘算子；J∈R3×3代表星群組合體的慣性矩陣；Ci∈R3×3表示由各細(xì)胞星參考系到慣性系的坐標(biāo)變化矩陣；ui∈R3表示細(xì)胞星i提供的控制力矩。推導(dǎo)得出基于誤差四元數(shù)的動力學(xué)與運動學(xué)方程：

為了實現(xiàn)細(xì)胞星組合體的姿態(tài)控制，本文設(shè)計了如圖1的雙層細(xì)胞星組合體姿態(tài)控制方案。

圖1 姿態(tài)控制及力矩分配過程圖Fig.1 Attitude control and torque distribution process

第1 層為控制力矩計算層，由1 個計算能力較強(qiáng)的衛(wèi)星擔(dān)任，它根據(jù)控制律計算出星群姿態(tài)控制所需要的總力矩uc。第2 層為基于群體博弈的冗余力矩分配層，該層對計算得到的總力矩依據(jù)衛(wèi)星通信拓?fù)溥B接關(guān)系進(jìn)行群體博弈力矩分配。每個細(xì)胞星只需向與其有連接關(guān)系的衛(wèi)星傳遞總力矩uc、當(dāng)前細(xì)胞星收益f、當(dāng)前細(xì)胞星的群體狀態(tài)p。

本文的重點為對冗余力矩分配方法的探討，在控制律計算時采用基于PD控制的組合體控制律：

式中：kp，kd分別為PD控制的比例和微分參數(shù)。

2 力矩分配層群體博弈模型的建立

不同于傳統(tǒng)形式的博弈，在群體博弈中，每一個參與者不被單獨地對待，他們被視為組成一個連續(xù)的群體的一部分。在建立群體博弈模型時，本文將力矩分配系數(shù)作為博弈參與者，這個群體的總數(shù)用群體質(zhì)量m=1 表示。細(xì)胞星作為策略集，用S={1，2，…，n}表示。系數(shù)分布作為群體狀態(tài)，用矢量p=[p1，…，pn]Τ表示，其中p1，p2，…，pn為非負(fù)的標(biāo)量，pi表示分配到細(xì)胞星i∈S的系數(shù)。選擇每一個細(xì)胞星都有一定的收益，fi(p)表示選擇細(xì)胞星i∈S的收益，那么群體博弈的收益非負(fù)向量表示為F(p)=[f1(p)，…，fn(p)]Τ。每一個細(xì)胞星是一個策略，分配系數(shù)在不同的細(xì)胞星之間進(jìn)行選擇，最后達(dá)到Nash 均衡。群體博弈模型與力矩分配概念關(guān)系如表1所示。

表1 群體博弈與力矩分配概念對照表Table 1 Concept comparison table of population game and torque distribution

當(dāng)細(xì)胞星數(shù)目多的時候，并不是每個細(xì)胞星都能與其它所有細(xì)胞星進(jìn)行通信。在群體博弈模型構(gòu)建中，用帶有策略限制的群體博弈模型來描述部分細(xì)胞星間存在通信障礙的情況。策略的限制可以用無向圖G={ν，ε}來表示，其中節(jié)點集合v表征著可用的策略集，即v=S。邊的集合ε?ν×ν描述了可以進(jìn)行策略互動的策略。也就是說，若(i，j) ∈ε，則選擇細(xì)胞星i的參與者可以與選擇細(xì)胞星j的參與者進(jìn)行博弈互動，反之則不能。

在本文所討論的方案中，姿態(tài)控制力矩在時刻變化，導(dǎo)致群體博弈模型時刻變化。為了使群體更長時間處于Nash 均衡狀態(tài)且減少細(xì)胞星間通信量，設(shè)計姿態(tài)控制力矩計算層，以一個T周期的時間間隔更新力矩。或者說，本地博弈模型的改變要有一定的時間間隔，在這個間隔內(nèi)，總控制力矩大小不變，博弈模型不變。

群體博弈的收益函數(shù)是連續(xù)的。本文在設(shè)計收益函數(shù)時依據(jù)實際的應(yīng)用，綜合考慮了力矩輸出裕度、能量消耗和飛輪角動量裕度。

首先，考慮飛輪力矩輸出能力：

式中：pi表示分配到此細(xì)胞星的力矩分配系數(shù)為細(xì)胞星i坐標(biāo)系到組合體坐標(biāo)系下的坐標(biāo)轉(zhuǎn)換矩陣；uc為控制力矩計算層計算得到的所需總力矩；λi為分配增益系數(shù)；uimax為此力矩執(zhí)行機(jī)構(gòu)能夠提供的最大力矩值；ucil為當(dāng)前細(xì)胞星本體系下3 個軸中提供力矩的最大值。

其次，考慮飛輪能量的消耗：

式中：ki為一個足夠大的常數(shù)，保證fi2(uci)的值始終大于0。λ2i表征該細(xì)胞星能量轉(zhuǎn)換效率，值越大表明產(chǎn)生單位力矩所需能量越大，能量轉(zhuǎn)化效率越低。

最后，考慮飛輪角動量裕度：隨著力矩的產(chǎn)生，飛輪的角動量時刻變化，收益函數(shù)會產(chǎn)生一個關(guān)于群體狀態(tài)的積分項，Nash 均衡值時刻變化，導(dǎo)致最后的群體狀態(tài)在演化過程中無法達(dá)到Nash 均衡。用力矩更新時刻的角動量代替整個控制周期的角動量可以解決這個問題，設(shè)計的收益函數(shù)如下：

式中：Li表示控制力矩更新時的角動量絕對值；Limax代表飛輪最大的角動量；ci為確定正常數(shù)。第1 個式子表示的[0，Lu]段為期望工作范圍，其收益是一個確定常數(shù)ci；第2 個式子表示的是飛輪角動量在一個比較大的區(qū)間中，收益隨著角動量的增大而減小。當(dāng)飛輪角動量達(dá)到最大值Limax，飛輪不能繼續(xù)提供力矩，φi=0 可以有效避免這種情況。在一個控制周期0.5 s內(nèi)，若飛輪以最大力矩輸出，其角動量變化量為ΔLi，令Lui≤Lmaxi-ΔLi即可保證在該0.5 s 控制周期內(nèi)角動量不能從期望工作范圍達(dá)到飽和。

綜合多個收益，令每個策略的收益函數(shù)為：

設(shè)計如式（11）的收益函數(shù)，可以避免輸出力矩大于最大輸出限制，以及角動量飽和等問題。

此外，細(xì)胞星在軌通常有數(shù)目及構(gòu)型的變化，針對此情況，在細(xì)胞星數(shù)目增多時，可直接進(jìn)行博弈分配；但當(dāng)細(xì)胞星數(shù)目減少時，直接分離會導(dǎo)致該細(xì)胞星帶走部分群體質(zhì)量，導(dǎo)致分配系數(shù)的和小于1。故在細(xì)胞星脫離整體前，該細(xì)胞星的收益變?yōu)楣潭ㄖ? 而不是通過公式（8）-（11）計算得到，在此基礎(chǔ)上細(xì)胞星再脫離組合體。

3 群體博弈模型的求解

本文利用群體動力學(xué)求解Nash 均衡，利用演化的思想求解群體博弈模型。群體動力學(xué)中一個重要的概念就是修訂協(xié)議。修訂協(xié)議可以看作一組允許參與者做出決定的規(guī)則，或者說，修訂協(xié)議確定了個體改變其策略的條件。修訂協(xié)議用ρ=[ρij]表示，它表示了不同策略之間的條件轉(zhuǎn)換速率。給定一個群體狀態(tài)p和一個收益向量F(p)，ρij(F(p)，p)表示了由策略i到策略j的條件轉(zhuǎn)化率?？梢缘玫竭@個群體狀態(tài)的動力學(xué)方程：

等號右邊第1項表示流入策略i的人數(shù)（從其他策略轉(zhuǎn)化為策略i），第2 項表示從策略i中流出的總?cè)藬?shù)（從策略i轉(zhuǎn)化到其它策略）。兩者之差表示了策略i的群體狀態(tài)變化量。根據(jù)不同的修訂協(xié)議，群體動力學(xué)的微分方程也不一樣。常用的群體動力學(xué)有Smith動力學(xué)和復(fù)制器動力學(xué)。

3.1 基于分布式Smith動力學(xué)的博弈模型求解方法

Smith動力學(xué)是兩策略比較動力學(xué)，也就是在得到博弈機(jī)會時，隨機(jī)選擇一個策略進(jìn)行比較，更改策略的速度只與策略之間的收益之差有關(guān)。換言之，只要對方策略的收益比當(dāng)前策略收益大，那么博弈參與者就有機(jī)會改變其策略。Smith 動力學(xué)的修訂協(xié)議為：

式中：[·]+=max(·，0)。將上述修訂協(xié)議代入公式（1）中，得到關(guān)于此修訂協(xié)議的動力學(xué)方程：

本文中，每個細(xì)胞星，即每個策略之間不是都相互連通的，采用限制策略的群體動力學(xué)方程變?yōu)椋?/p>

式中：Ni={j∈S：(i，j) ∈ε} 表示在拓?fù)鋱D中與策略i可以進(jìn)行互動的策略。那么分布式Smith 動力學(xué)表示為：

引理1［23］.在Smith 動力學(xué)下，如果沒有限制的群體動力學(xué)是漸近穩(wěn)定的，同時策略之間拓?fù)潢P(guān)系是連通的，那么有策略限制的動力學(xué)也是漸近穩(wěn)定的。且當(dāng)動力學(xué)穩(wěn)定時，當(dāng)前群體狀態(tài)就為群體博弈的Nash均衡解。

定理1.針對以式（8）-（11）為收益函數(shù)構(gòu)建的群體博弈冗余力矩分配模型，基于Smith 動力學(xué)的修訂協(xié)議構(gòu)建如式（16）的分布式群體動力學(xué)，該動力學(xué)穩(wěn)定且收斂于群體博弈的Nash均衡。

證.首先構(gòu)造Lyapunov函數(shù)：

對Lyapunov函數(shù)求導(dǎo)：

為了描述?Ψ(p)，給出下式：

式（19）表示Lyapunov 函數(shù)對pl求導(dǎo)。將式（19）代入式（18），得到：

式中：D(p)為fi1fi2的雅可比矩陣，形式為：

所以，D(i，i) ＜0，式（20）左側(cè)第1 項小于0。在第2項中，根據(jù)修訂協(xié)議ρji=[fi-fj]+，如果fi＞fj，那么fk-fi＜fk-fj恒成立；如果fi＜fj，那么修訂協(xié)議ρji=[fi-fj]+=0。因此Lyapunov函數(shù)（p) ＜0，這個群體動力學(xué)是漸近穩(wěn)定的。根據(jù)引理1，本文構(gòu)造的收益函數(shù)所形成的分布式Smith 動力學(xué)是穩(wěn)定的，且穩(wěn)定值是群體博弈的Nash均衡解。

3.2 基于分布式復(fù)制器動力學(xué)的博弈模型求解方法

復(fù)制器動力學(xué)修訂協(xié)議：

與式（13）相比，復(fù)制器動力學(xué)的修訂協(xié)議不僅考慮不同衛(wèi)星間收益函數(shù)之差，還考慮分配到對方衛(wèi)星的力矩分配系數(shù)大小，也就是分配到更多分配系數(shù)的衛(wèi)星更適合提供控制力矩。這個修訂協(xié)議也被叫做兩策略模仿。將上述修訂協(xié)議帶入群體動力學(xué)中得到關(guān)于此修訂協(xié)議的動力學(xué)方程為：

采用策略限制的復(fù)制器動力學(xué)方程可以表示為：

引理2［22］.對于任意的x，y∈P，都滿足(x-y)(fi(x) -fi(y)) ＜0 的群體博弈稱為穩(wěn)定博弈，穩(wěn)定博弈以復(fù)制器動力學(xué)為群體動力學(xué)時，存在可收斂到唯一的Nash均衡解p*。

引理3［23］.在復(fù)制器動力學(xué)下，如果沒有限制的群體動力學(xué)是漸近穩(wěn)定的，同時策略之間拓?fù)潢P(guān)系是連通的，那么有策略限制的動力學(xué)也是漸近穩(wěn)定的，且有策略限制動力學(xué)收斂于Nash均衡解。

定理2.針對以式（8）～（11）為收益函數(shù)構(gòu)建的群體博弈冗余力矩分配模型，基于復(fù)制器動力學(xué)的修訂協(xié)議構(gòu)建如式（25）的分布式群體動力學(xué)，該動力學(xué)穩(wěn)定且收斂于群體博弈的Nash均衡。

證.由式（11）及式（22）可得：

收益函數(shù)是關(guān)于群體質(zhì)量負(fù)相關(guān)函數(shù)。對于任意的x，y∈P，都有(x-y)(fi(x) -fi(y)) ＜0，根據(jù)引理2 構(gòu)造的群體博弈是一個穩(wěn)定博弈，存在唯一的Nash 均衡解p*，并且該博弈策略之間的拓?fù)潢P(guān)系是連通的。根據(jù)引理3，所構(gòu)造的群體博弈在有策略限制的復(fù)制器動力學(xué)下是漸近穩(wěn)定的，且收斂于Nash均衡。

4 仿真校驗

以分配系數(shù)作為群體質(zhì)量，針對不同種類動力學(xué)修訂協(xié)議進(jìn)行仿真。考慮如圖2的衛(wèi)星拓?fù)鋱D。

圖2 衛(wèi)星連接拓?fù)鋱DFig.2 Communicate topology among cellsats

系統(tǒng)總體轉(zhuǎn)動慣量為：

細(xì)胞星的安裝矩陣為：

給定初始姿態(tài)四元數(shù)為q1=[0.801 3 0.272 7 0.514 5 -0.136 9]T；初始角速度ω0=[0.01 0.02-0.03]Trad s；給定期望四元數(shù)qd=[1 0 0 0]T；期望角速度ωd=[0 0 0]T。力矩計算層更新力矩的周期為0.5 s；分配層各星之間通信間隔為0.02 s；給定各衛(wèi)星最大輸出力矩分別為6、5.5、6.5、6、7 N·m；飛輪角動量裕度分別為35、30、40、35、45 N·m·s；Lu=80%Lmax，λi=1，λ2i=1，ki=100，ci=1，kp=40，kd=90。1 號細(xì)胞星負(fù)責(zé)控制力矩計算。組合體輸出力矩仿真結(jié)果如圖3 所示，1 號細(xì)胞星輸出力矩如圖4所示。

圖3 組合體輸出力矩Fig.3 Torque of combined body

為進(jìn)一步剖析不同動力學(xué)對群體博弈收斂情況的影響，本文采用分布式Smith 動力學(xué)與分布式復(fù)制器動力學(xué)分別求解Nash 均衡，并對其進(jìn)行比較。圖5、圖6 分別為復(fù)制器動力學(xué)與Smith 動力學(xué)求解過程中各個細(xì)胞星策略中的收益及其局部放大圖。

圖5 復(fù)制器動力學(xué)下收益Fig.5 Benefits under replicator dynamics

圖6 Smith動力學(xué)下收益Fig.6 Benefits under Smith dynamics

由圖像可以看出Smith 動力學(xué)與復(fù)制器動力學(xué)都收斂于同一個收益值，即同一Nash 均衡。但是兩者的收斂速度有明顯區(qū)別：在Smith 動力學(xué)下，收斂到Nash 均衡的時間要遠(yuǎn)遠(yuǎn)小于復(fù)制器動力學(xué)的時間。這是因為，在其它條件都相同的情況下，兩種動力學(xué)的唯一區(qū)別就是二者的修訂協(xié)議不同，Smith動力學(xué)的修訂協(xié)議為ρij=[]fj(p) -fi(p)+，復(fù)制器動力學(xué)的修訂協(xié)議為ρij=pj[fj(p) -fi(p)]+。修訂協(xié)議可以看作一個博弈參與者在得到博弈機(jī)會時改變其策略的驅(qū)動力，驅(qū)動力與改變策略的概率成正比，即兩者之間收益之差越大，這個驅(qū)動力越大，其策略改變的概率就越大，收斂越快。根據(jù)上述理論，Smith 動力學(xué)只需要考慮兩者之間的收益之差，在一定范圍內(nèi)這個差越大收斂速度越快。而復(fù)制器動力學(xué)的收益不僅考慮策略間的收益差，同時還要考慮選擇策略的群體，群體數(shù)多的策略可能更優(yōu)，是一種從眾模仿狀態(tài)。本論文群體博弈中群體質(zhì)量為分配系數(shù)，滿足群體質(zhì)量的和為1。所以對于任意pj＜1，在相同收益差的時候，驅(qū)動力減小會導(dǎo)致收斂速度變慢。另外由于可能存在次優(yōu)策略有較多群體的情況，也會導(dǎo)致復(fù)制器動力學(xué)收斂速度較慢。

圖7 是各細(xì)胞星分配系數(shù)與時間的關(guān)系，可以看出在前15 s 由于需要總力矩較大，收益函數(shù)之間差較大，細(xì)胞星會提供較大的驅(qū)動力。群體動力學(xué)收斂較快，分配系數(shù)變化明顯。在15 s 后由于總力矩較小，各個細(xì)胞星分配到的力矩較小，導(dǎo)致收益函數(shù)之差較小，分配系數(shù)變化不明顯。

圖7 各細(xì)胞星分配系數(shù)Fig.7 Distribution coefficient of each cellsat

為了體現(xiàn)本文方法的先進(jìn)性，將本文算法與集中式能量最優(yōu)的偽逆法和文獻(xiàn)［14］的算法對比。相較于集中式能量最優(yōu)算法，本方法細(xì)胞星在計算分配時只和與它相連的部分細(xì)胞星做信息交流，不用知道所有細(xì)胞星的狀態(tài)信息，降低集中控制通信壓力與通信延遲帶來的誤差。文獻(xiàn)［14］給出了一種能量均衡的分布式控制力矩分配方法，通過優(yōu)化能量平衡因子實現(xiàn)分布式力矩分配。評價細(xì)胞星提供控制力矩消耗能量指標(biāo)為：

式中：ui為細(xì)胞星i輸出力矩。在上述仿真條件下3種分配方法能量消耗指標(biāo)如圖8所示。

圖8 3種分配方式能量指標(biāo)圖Fig.8 Energy index of three distribution methods

由仿真結(jié)果可以看出，在滿足力矩輸出能力限制的條件下，采用本文提出的方法與文獻(xiàn)［14］所提出的方法能量消耗都近似于集中式能量最優(yōu)分配方法，且在本文的工況下，本文方法的能量消耗小于文獻(xiàn)［14］的分配方法。本方法相較于集中式能量最優(yōu)方法能量多消耗0.41%，因為所設(shè)計博弈收益函數(shù)（11）利用力矩輸出能力與角動量裕度對能量消耗進(jìn)行加權(quán)，可以根據(jù)細(xì)胞星輸出能力與角動量裕度對分配力矩大小進(jìn)行限制，在滿足限制的前提下，當(dāng)消耗相同能量時，由可產(chǎn)生較大力矩的細(xì)胞星輸出更多的力矩。而文獻(xiàn)［14］與能量最優(yōu)分配方法都沒有考慮細(xì)胞星輸出力矩的限制，細(xì)胞星分配到力矩存在大于最大輸出力矩的情況，導(dǎo)致期望力矩與實際輸出力矩間存在誤差，定義細(xì)胞星組合體控制力矩輸出誤差：

式中：τ為細(xì)胞星組合體實際輸出力矩?？紤]細(xì)胞星間執(zhí)行機(jī)構(gòu)的差異，當(dāng)1 號細(xì)胞星只能提供最大1.2 N·m 的力矩時，其它條件不變，圖9、圖10、圖11分別為文獻(xiàn)［14］、能量最優(yōu)方法、本文方法細(xì)胞星組合體控制力矩輸出誤差圖。

圖9 文獻(xiàn)［14］方法力矩誤差圖Fig.9 Torque error of the method in reference ［14］

圖10 能量最優(yōu)方法力矩誤差圖Fig.10 Torque error of energy optimal method

圖11 本文方法力矩誤差圖Fig.11 Torque error of the method in this paper

由仿真結(jié)果可以看出，文獻(xiàn)［14］及能量最優(yōu)方法都未考慮細(xì)胞星輸出力矩能力限制，組合體中存在輸出能力較差的細(xì)胞星時，會存在較大的輸出力矩誤差。本文方法的仿真結(jié)果誤差是由于初始化分配系數(shù)過大，1 號細(xì)胞星初始期望力矩大于u1max帶來的力矩輸出誤差，但是在博弈過程中該細(xì)胞星的期望輸出力矩快速減小。此外，文獻(xiàn)［15］給出另一種分布式力矩分配方法，該方法在分配過程中以角動量均衡作為優(yōu)化指標(biāo)，考慮了飛輪卸載速度問題，但是同樣在分配時沒有考慮到飛輪輸出能力的限制。當(dāng)細(xì)胞星輸出能力差異較大或?qū)?xì)胞星有嚴(yán)格的輸出力矩要求時，會導(dǎo)致較大的輸出力矩誤差，本方法可以有效地解決這類問題。

接下來仿真細(xì)胞星數(shù)目變化的情況，設(shè)立如下場景：基于前文的仿真條件，在控制開始5 s后，第5顆細(xì)胞星脫離組合體，不參與力矩分配。第5 s時令5號細(xì)胞星收益為0，所得到的期望控制力矩如圖12所示。

圖12 5號細(xì)胞星期望輸出力矩示意圖Fig.12 Expect torque of No.5 cellsat

可以看出5號細(xì)胞星期望輸出力矩很快降到0，實現(xiàn)了細(xì)胞星數(shù)目減少的目的。同理，此種方式也可適用于細(xì)胞星控制力矩執(zhí)行機(jī)構(gòu)失效的問題。在這種情況下，將失效細(xì)胞星收益調(diào)為恒定值0。

5 結(jié)論

本文主要研究了細(xì)胞星組合體的姿態(tài)控制力矩分配問題。

1）提出一種基于群體博弈的冗余力矩分布式分配方法，在對輸出力矩?zé)o限制要求的前提下，能量消耗近似集中式能量最優(yōu)分配方法，當(dāng)組合體中細(xì)胞星輸出力矩能力差異較大或存在輸出能力較小的細(xì)胞星時，提出方法在分配時有較小的輸出誤差。

2）分析了求解力矩分配問題時，比較和模仿兩種不同的演化策略，兩種演化策略形成的不同的群體動力學(xué)可以收斂到同一Nash 均衡值。但在力矩分配系數(shù)之和為1的前提下，基于Smith動力學(xué)的分配收斂速度快于基于復(fù)制器動力學(xué)分配收斂速度。