喬德治,于 丹,王 勇,2
作為地球唯一的天然衛(wèi)星,月球對地球和人類的重要性不言而喻.阿波羅飛船開展了載人手動控制交會對接之后至今,從未規(guī)劃并實施月球軌道交會對接任務[1].在阿波羅交會對接過程中,人的智能在交會監(jiān)視和對接中發(fā)揮了重要作用.以人的充分訓練為代價,降低了對制導、導航與控制系統(tǒng)智能化要求.自主交會需要制定高精度、高可靠,高安全交會策略,對制導、導航與控制系統(tǒng)的性能和智能化水平要求更高[2].
借鑒手動控制交會對接中人的經(jīng)驗,考慮在探月三期月球軌道自主交會對接任務的地面飛行控制過程中,利用追蹤器導航監(jiān)視相機的可見光遙測信息對目標器圖像進行特征匹配、提取和目標分類.設計一種面向工程應用的輔助預報系統(tǒng),能夠提升飛行控制的智能化水平,有效協(xié)助地面人員進行數(shù)據(jù)監(jiān)視與任務決策,提高任務成功率.
圖1 自主交會對接系統(tǒng)組成Fig.1 Autonomous rendezvous and docking system
本文第1部分明確了任務目標,對需求和難點開展了分析,第2部分提出人機協(xié)同安全性自主判斷框架,給出了系統(tǒng)的功能劃分和設計方案,第3部分為系統(tǒng)的實驗驗證情況,第4部分為結論.
在月球軌道進行交會對接期間,采用追蹤器上配置的導航監(jiān)視相機,對兩飛行器交會對接過程進行監(jiān)視與觀測.當進入地面測控弧段后,利用遙測下傳的監(jiān)視相機圖像,對已知目標器特征點提取、跟蹤和匹配及安全性預測,需解決以下問題:
1)不確定環(huán)境下的圖像特征檢測與匹配.利用圖像信息進行目標捕獲及相關特征點提取,進一步可計算兩飛行器的相對位置、姿態(tài)[3];
2)對接過程的安全性預測與判別.構建安全性判斷知識庫,并預測當前位姿狀態(tài)下可能的對接過程,評估對接成功的概率.
3)可視化數(shù)據(jù),輔助飛行控制人員開展狀態(tài)分析和任務決策.不僅需要輸出交會安全性判斷結果,還要將安全性判斷依據(jù)與準則直觀顯示.
空間交會對接光學導航采用合作目標視覺測量方法得到目標器坐標系和追蹤器之間的相對位置和姿態(tài)[4-5],計算方法為線形變換法或空間后方交會法[6].文獻[7-9]中說明,在空間環(huán)境中對目標進行特征提取與識別,不確定性及影響因素來自成像噪聲、幾何畸變、場景復雜度3個方面.成像噪聲可以通過地面測試,尋找恰當?shù)膱D像濾波去噪算法.
幾何畸變是影響測量精度的關鍵問題,考慮到發(fā)射前后成像環(huán)境的變化,這種畸變難以在地面進行準確標定,需要在測量過程中,根據(jù)成像目標的結構信息進行自適應標定,可以在一定程度上克服畸變影響.
如何區(qū)分目標前景與復雜多變的背景是目標識別研究的一個重要問題.空間目標所處的場景相對來說比較簡單,目標前景與背景之間存在著明顯的區(qū)分.但空間目標在場景中的尺度和姿態(tài)變化較大.在飛行器交會對接過程中,目標器在場景中的距離可以從幾千千米變化到不到1米之內(nèi),且目標的亮度受太陽方向、視線方向、目標表面法線方向以及自遮擋影響,呈現(xiàn)出大范圍、不均勻的亮度變化.另一方面,由于空間環(huán)境、功耗和體積等因素的約束,組成航天器上計算平臺的器件和處理器的可靠性高,但工作頻率低.為滿足控制系統(tǒng)實時性,對圖像處理和分析算法的效率有很高的要求.
交會對接安全性自主判斷流程分為兩個部分,即安全性知識庫構建和安全性預報.
安全性知識庫構建是知識庫的學習過程,訓練樣本生成主要依據(jù)航天器相對動力學模型生成的六自由度相對位置和姿態(tài).對于月球軌道交會對接,仿真過程中在理想情況下,主要建立了多體航天器姿態(tài)動力學模型和月球軌道動力學模型.在每一個相對位置、姿態(tài)條件下,根據(jù)相機的內(nèi)參數(shù)和目標器對接面的機械結構生成圖像序列.經(jīng)過特征選擇與匹配后,得到可以用于安全性知識庫決策樹訓練用的規(guī)則集合,訓練得到安全性判斷知識庫.
安全性預報過程中,將相機拍攝的圖像特征與模擬圖像特征形成匹配,經(jīng)對特征匹配進行人工評估,如果有多于6個特征點形成有效匹配,則用這些特征和安全性知識庫判斷交會對接安全性等級.
交會對接安全性自主判斷框架如圖2所示.
由圖2可知,對目標圖像特征提取和選擇是系統(tǒng)設計的一個關鍵問題.監(jiān)視相機為單目無標定可見光相機.相機分辨率2048pixel×2048pixel,像元尺寸5.5 um×5.5 um,焦距20mm,視場20°×20°,每秒10幀,在成像過程中,能夠根據(jù)被測對象的已知結構模型進行自標定.目標相對工作距離100~0.3 m,速度0.3 m/s.由于景深限制,相機對距離20 m以外可用于計算的目標特征不明顯,因此通過傳統(tǒng)的幾何點線面提取方法,難以保證匹配精度.
圖2 交會對接安全性自主判斷框架Fig.2 Self evaluation framing for safety of RVD
對此,本文將從航天器整體出發(fā),目標器圖像上的特征提取、匹配及其應用包括以下幾個步驟:
1)在目標器端面的機械結構模型上人工選擇若干個位置點,這些位置點在機械結構圖紙上有精確的坐標,并能夠被SIFT(scale-invariant feature transform)特征提??;
2)將在機械結構圖紙上指定的位置點,用動力學仿真數(shù)據(jù)生成的旋轉矩陣和位移向量轉換到模擬圖像上的(子)像素位置;
3)在試驗環(huán)境中采集的圖像和模擬圖像上提取SIFT特征,并形成特征點對;
4)在試驗環(huán)境中采集的圖像和模擬圖像中,以精確匹配點對為聚類中心,將人工指定的特征點按距離分配在各聚類中.在兩圖像的對應聚類中尋找人工指定位置特征點的對應,即恢復人工指定位置的特征點匹配
在試驗過程中采集的圖像和模擬圖像之間用SIFT特征-聚類方法得到的特征點對應,在試驗過程中采集的圖像中特征點的數(shù)量和位置在追蹤器接近目標器的過程中是變化的,而且這些特征點的位置在目標器坐標系下的坐標位置已知(由機械結構設計和加工安裝精度保障),使用這些特征點可以精確計算目標器與追蹤器之間的相對6自由度.
圖3 追蹤器向目標器接近過程中,用特征聚類檢測和匹配的特征點(圖片經(jīng)過馬賽克處理)Fig.3 The feature points are detected and matched feature clustering in the process of tracking the target closer to the target (the pictures are processed by mosaic)
構建安全性判斷知識庫包括兩個步驟,分別是安全性等級劃分和決策樹訓練.
1)安全性等級劃分
利用航天器動力學仿真生成軌跡序列和交會對接結果偏差,其中交會對接結果偏差包括3個位移偏差和3個姿態(tài)角度偏差.假設這6個隨機量分別服從不同參數(shù)的正態(tài)分布,將這6個偏差量根據(jù)其分布的標準差設置為4個等級,l1,2,3,4.航天器動力學仿真得到1500組交會對接偏差及其±σ,±2σ,±3σ范圍如圖4和圖5所示,各偏差量的均值和標準差于表1中.
交會對接結果的6自由度的安全等級l1,2,3,4由下式計算:
(1)
取最大值得到交會對接的安全等級:
L=max(lex,ley,lez,lef,leq,leY)
(2)
圖4 交會對接結果X偏差分布及±σ,±2σ,±3σ范圍Fig.4 X deviation of rendezvous and docking results and distribution of ±σ,±2σ,±3σ
圖5 交會對接結果滾動角度偏差分布及±σ,±2σ,±3σ范圍Fig.5 Roll angle deviation of rendezvous and docking results and distribution of ±σ,±2σ,±3σ
6自由度偏差量分布均值分布標準差ex-0.4520.010ey0.3710.007ez0.0190.007eφ0.0210.400eθ0.0080.393eφ0.2390.201
2)決策樹訓練
通過對航天器動力學仿真輸出6自由度序列驅動下生成的圖像序列提取特征,得到與軌跡和交會對接結果偏差對應的特征-偏差序列,將偏差用式(1)轉換為安全性等級,形成特征-安全性等級作為決策樹訓練樣本集合,其過程見式(3)所示.
{[(I1,1,I1,2,…,I1,tn)?e1],[(I2,1,I2,2,…,I2,tn)?e2],…[(In,1,In,2,…,In,tn)?en]}
↓(1)
{[(F1,1,F1,2,…,F1,tn)?e1],[(F2,1,F2,2,…,F2,tn)?e2],…[(Fn,1,Fn,2,…,Fn,tn)?en]}
↓(2)
{[(F1,1,F1,2,…,F1,tn)?L1],[(F2,1,F2,2,…,F2,tn)?L2],…[(Fn,1,Fn,2,…,Fn,tn)?Ln]}
(3)
其中,式(1)為特征提??;式(2)安全等級映射.
由式(3)中的最后一個表達式構造安全判斷知識庫.在交會對接實驗中,安裝在追蹤器上的安全監(jiān)視相機拍攝到目標器對接面圖像后,經(jīng)過特征提取后,用安全性判斷知識庫判斷當前狀態(tài)對應的安全性等級.
安全判斷知識庫使用OBCT(ordinary binary classification tree)構造.將樣本集分為訓練集(90%)和驗證集(10%),在決策樹的構建過程中使用交叉驗證技術作為分支停止準則,直到對于驗證集的分類誤差最小化為止.在訓練時使用熵不純度下降(信息增益)最大策略來選擇最優(yōu)的特征分量.在決策樹的節(jié)N處熵不純度為i(N),選用特征Fij得到的信息增益為Δi(N).
(4)
Δi(N)=i(N)-PLi(NL)-(1-PL)i(NR)
(5)
其中P(Lj)表示在節(jié)點N處屬于Lj類別的樣本占總樣本數(shù)的頻度,NL,NR分別是節(jié)點N的左右子節(jié)點,i(NL),i(NR)是相應的不純度,PL是選用特征Fij時,樹由N生長到NL的概率.
決策樹訓練的算法流程如下:
圖6 決策樹訓練算法流程Fig.6 Decision tree training algorithm process
利用九自由度轉臺系統(tǒng)模擬兩飛行器相對距離30 m至0.3 m的接近過程,實驗系統(tǒng)組成如圖7所示.
圖7 半物理試驗系統(tǒng)組成Fig.7 Diagram of a semi-physical experiment system
將目標器對接面模型安裝至目標臺上,相機安裝在追蹤臺上,圖像信號通過光端機傳輸至控制計算機,控制計算機實時將收到的視頻數(shù)據(jù)模擬飛行控制網(wǎng)絡協(xié)議進行封裝后再采用局域網(wǎng)絡轉發(fā)到輔助預報計算機.此外,實驗中模擬真實環(huán)月軌道下的陽光入射角,采用帶有三自由度伺服的太陽模擬器產(chǎn)生平行光,照射整個目標器平面.
數(shù)據(jù)顯示與人機交互界面如圖8所示.圖中綠色區(qū)域是數(shù)學仿真得到的交會對接過程中各個時刻的6自由度偏差數(shù)據(jù).當一次交會對接操作結束(無論正常結束還是異常結束)時,得到的一個交會對接偏差,在對應式(3)中第一個表達式的ei.在交會對接過程中每個時刻數(shù)學仿真輸出的6自由度,根據(jù)小孔成像模型和相機的內(nèi)參數(shù),由目標器端面機械模型生成仿真圖像,對應式(3)中第一個表達式的Ii,j,Ii,j表示在第i次交會對接操作中第j時刻的仿真圖像,經(jīng)過特征提取得到的式(3)中第二個表達式的Fij.由式(2)將交會對接偏差ei映射為安全等級lk(k=1,2,3,4),得到式(3)中的第三個表達式,用這個表達式訓練決策樹,實現(xiàn)從圖像Ii,j到交會對接安全性等級Ik的變換.在實驗時,監(jiān)視相機拍攝目標器的圖像,如圖8左側所示,作為決策樹的輸入,決策樹預測交會對接的安全等級,用文字顯示在圖8中,4個安全性等級分別對應“正?!?、“預警”、“警告”、“異常”.為了直觀地顯示交會對接的實時狀態(tài),將半物理試驗系統(tǒng)轉臺6自由度輸出用紅色十字在圖8中.
使用九自由度轉臺運行了50組交會對接軌跡,用上述方法進行安全性判斷的結果見表2.
圖8 數(shù)據(jù)顯示與人機交互頁面Fig.8 Data display and human-computer interaction page
驗證試驗次數(shù)L=1的次數(shù)L=2的次數(shù)L=3的次數(shù)L=4的次數(shù)5045(90.0%)2(4.0%)3(6.0%)0(0%)
本文設計一種基于人機協(xié)同框架的月球軌道自主交會對接過程輔助預報系統(tǒng):可在飛行控制環(huán)節(jié)利用監(jiān)視相機遙測信息,對目標器進行特征捕獲及目標跟蹤,并對追蹤器與目標器的相對關系進行辨識,分析飛行器相對位置及姿態(tài)是否滿足對接安全范圍,輔助預報對接過程的安全性.
通過相關地面實驗表明該系統(tǒng)可直觀、全面的指示兩飛行器相對關系,提高飛行控制環(huán)節(jié)的人機協(xié)同效果,有效協(xié)助GNC系統(tǒng)地面飛行控制人員進行狀況分析與任務決策.