吳慈航, 閆建國, 程龍, 王嘉偉, 郭一鳴, 邢小軍
(1.西北工業(yè)大學 自動化學院, 陜西 西安 710072; 2.中央軍委裝備發(fā)展部, 北京 100000;3.中國航空工業(yè)集團公司 洛陽電光設備研究所, 河南 洛陽 471000)
空中加油是加油機在飛行過程中向受油機補給燃油的技術,可在無需降落的情況下讓受油機擴大航程、延長航時和提高載重能力,有效提升了受油機性能,具有重要的軍事戰(zhàn)略意義[1-2]。
為了完成受油機與加油錐套的對接,國內外研究者從加油機和受油機兩端都提出了解決方案。從加油機端考慮,可通過調整軟管收放或在錐套前端增加翼面的方法抑制錐套擺動,從而穩(wěn)定錐套以促進對接。文獻[3]提出了基于軟管-錐套偏微分方程模型的反步法控制策略,結果表明所提出的方法在不同繩長、不同飛行速度和考慮輸入飽和的情況下均可使系統(tǒng)狀態(tài)收斂到原點附近的小鄰域內,可有效抑制擺動。不過,該方法是基于虛擬控制信號設計的,沒有指明實際的控制機構。文獻[4]提出使用永磁同步伺服電機驅動加油吊艙絞盤的收放,將軟管的擺動抑制問題轉化為PMSM的角度控制問題。但是,這種方法需要在現有吊艙中引入新設備,具有一定實現難度。與控制絞盤的策略不同,給錐套增加翼面可主動產生氣動力和氣動力矩,直接抵消復雜干擾對軟管錐套組合體的動力學影響[5]。可是,為了在空中實現這一策略,需考慮翼面驅動的能量供應、翼面的收放裝置和在暴露環(huán)境下的可靠性等問題,工程實現性有待討論。
從受油機端考慮,研究人員的側重點在于設計先進的受油機控制律。受油機通過量測得到錐套的當前位置并反饋受油管和錐套間的相對位置差,利用控制律消除位置偏差,將受油管精準插入錐套中。在這一思路下,研究人員提出了自抗擾對接控制器[6]、l1自適應控制器[7]、動態(tài)逆控制器[8]等控制方法,并通過仿真驗證了這些方法的控制效果。盡管如此,這些控制律設計的前提是受油機在對接過程中有足夠的能力追得上飄擺的錐套,進而才能迅速消除位置偏差完成對接。然而,直接跟蹤式控制策略在實際中難以取得好的效果。首先,對質量和慣性較大的飛機而言(如轟運型飛機),其響應速度和機動性與質量輕慣性小的錐套相比仍有較大差距,直接跟蹤可能會有明顯的相位滯后。其次,北大西洋公約組織公布的ATP-56(B)標準中指出,直接控制受油機追逐錐套容易導致過操縱,造成安全隱患。在受油機不斷追蹤、靠近錐套的過程中,頭波效應會進一步對錐套運動產生干擾,造成“飛機越追錐套越跑”的情形。文獻[9]提出用迭代學習策略解決錐套與受油機之間快慢動態(tài)不匹配的問題,然而迭代學習策方法要求系統(tǒng)擁有重復的初始條件,且系統(tǒng)的動態(tài)結構在每次運行中保持不變。考慮到軟管錐套組合體的復雜動力學響應和多流場的復雜干擾,保持恒定的實驗工況具有一定困難。受到人類飛行員經驗的啟發(fā),在對接過程中若首先觀察并分析錐套的運動軌跡,隨后基于歷史軌跡對錐套的后期位置做預測,最終實現攔截式插入對提升對接成功率有積極作用[10]。在這種預瞄式對接策略中,準確又高效的錐套軌跡預測是核心問題。
近些年來,機器學習在許多領域都得到了廣泛應用,并取得了良好效果[11]。由于軟管錐套組合體是剛性柔性的混合體,同時外部流場復雜,難以從物理層面精準建模進而預測軌跡,在視覺跟蹤迅速發(fā)展的背景下,建立數據驅動的預測模型有潛力成為一種有效方案。針對時間序列類型的錐套軌跡數據,本文提出了一種基于多頭卷積長短期記憶網絡的預測模型。首先,通過多頭卷積殘差網絡提取擴維后錐套軌跡數據的特征信息,并對不同自網絡提取的特征進行融合得到高層信息。其次,建立長短期記憶網絡(long short-term memory network,LSTM)對提取的前序特征進行學習,進一步挖掘特征間時序關聯,描述數據中的內在動力學特性。最后,通過計算機仿真和地面半物理實驗平臺對方法進行了驗證,表明了數據驅動方法在空中加油對接任務中潛在可行性。
錐套運動的軌跡數據是一種在絕對空間中隨時間、飛行條件和加/受油機影響,相對空間內具有有限互動、復雜耦合關聯,在總體確定性中包含局部不確定性位置特征的一系列數據,是內部動力學和外部擾動綜合影響下的表觀體現。然而,對于三維錐套軌跡中的任一維而言,采集到的錐套數據樣本為一維時間序列。若只通過一維目標值進行預測,序列的許多細節(jié)信息可能被忽略,導致預測精度不足。為了解決這一問題,本文利用相空間重構技術,將反映軟管錐套非線性系統(tǒng)局部特性的時間序列在高維空間展開,進而在重構的高維空間中進行序列分析和預測,提升預測準確性。具體而言,將序列中的某一分量及它的若干時間序列中的延遲點組合作為新的多維相空間上的一點,在不同的時間點上重復操作即可得到完整的多維相空間。根據塔肯斯定理,當選擇了合適的嵌入維度m及時間延遲τ后,可重構得到與原系統(tǒng)具有相同拓撲性質的動力學系統(tǒng)。對于標量時間序列{x1,x2,…,xn-1,xn},其重構后的相空間可表示為
(1)
式中,N=n-(m-1)τ為重構后的序列長度。
嵌入維度m和時間延遲τ是相空間重構的關鍵參數。本文采用平均相互信息法求解延遲τ,用虛假鄰點法求解相空間維度[12]。以錐套的側向軌跡為例,圖1~3展示了原始時序曲線、平均相互信息曲線和虛假鄰點百分比曲線。從曲線可知,適應于錐套時間序列重構的時間延遲為τ=7,m=3 ?;谠搮担ㄟ^(1)式可得重構后的錐套運動數據。
圖1 錐套側向軌跡曲線 圖2 平均相互信息曲線圖3 虛假鄰點百分比曲線
在神經網絡訓練過程中,如果不同維度輸入數據的分布存在較大差異,梯度值將不能有效被反向傳播,不利于模型收斂。為了提高模型的特征提取能力,保證輸入數據的各個維度擁有近似的分布,降低網絡的訓練難度,此處對輸入數據實施最大最小歸一化。對于時序數據{y1,y2,…,yn-1,yn},有
(2)
(3)
卷積神經網絡以其局部感知和權值共享的特點,在數據的特征提取方面具有較大優(yōu)勢。在卷積的映射下,網絡利用結構上的深度從輸入中提取深層的語義信息,作為準確預測的基礎。針對經相空間重構和歸一化處理后錐套時序數據,本文設計了多頭神經網絡對3個維度上的數據進行獨立處理,隨后對提取后的特征進行拼接,得到融合特征。然而,為了提高卷積神經網絡的特征提取性能,常規(guī)做法是進行卷積層堆疊實現深度提升。但這種做法可能出現梯度消失/爆炸或網絡退化現象,導致深度網絡無法訓練。深度殘差結構通過跳過一個或多個連接的方式,有效解決了深層網絡訓練中的梯度消失/爆炸問題,加速了深度模型的訓練,有效提高了模型性能。殘差網絡的輸入為x,經過恒等映射后直接疊加至求和端口,而神經網絡需要擬合的映射從傳統(tǒng)的復雜函數關系變?yōu)榱藲埐钤隽俊埐钅K的數學描述為
H(x)=F(x)+x
(4)
式中:F(x)是殘差;H(x)是殘差結構輸出。相較于直接映射H(x),殘差特征F(x)更易學習。
含殘差結構的多頭神經網絡結構如圖4所示。經相空間重構和歸一化的三維輸入數據分別傳入多頭卷積殘差網絡的對應分支,經過2層卷積后與殘差模塊相連。殘差模塊的輸出經過最大池化層(移動步長為2)后通過拉平層實現特征一維化,最終對3個分支的特征進行拼接,形成融合特征,作為后續(xù)時間序列預測的基礎。
圖4 多頭卷積殘差網絡結構
LSTM模型是一類特殊的循環(huán)神經網絡模型,通過引入門單元結構有效地解決了傳統(tǒng)循環(huán)神經網絡訓練時的梯度消失問題,能夠更好地捕捉時間序列間的長期依賴。
在t時刻,網絡當前輸入xt、上一時刻的隱藏層輸出ht-1和上一時刻的細胞層輸出Ct-1共同輸入LSTM單元,隨后更新得到當前時刻的ht和Ct。在LSTM單元中,起到重要作用的是輸入門(it)、輸出門(ot)和遺忘門(ft),其中輸入門決定有多少信息被添加至當前的細胞狀態(tài)中,遺忘門決定了上一時刻的細胞狀態(tài)有多少被遺忘,輸出門定義了當前時刻的細胞狀態(tài)在最終輸出中的比例[13]。
LSTM單元不斷朝著梯度下降的方法更新單元中的權值和門單元數值,有效提取序列數據中的時序關聯以提高預測精度。為了適應LSTM單元中的時序結構,訓練時采用隨機時間反向傳播(BPTT)算法,沿著時間和網絡層2個方向反向傳播誤差。
考慮到錐套運動在y-z平面內較為顯著,因此此處軌跡預測指y-z平面內的預測,需要建立2個具有相同結構的預測模型分別處理y方向和z方向數據。錐套在空中的運動是多重影響因素下的共同結果,錐套的軌跡預測可視為多變量多步的時間序列預測問題。時間序列的多步預測包括迭代預測和直接預測2種方式。在迭代預測中,當前步的輸出將作為下一步的輸入,循環(huán)往復直到達到既定的預測步長。然而,這種預測方法將在迭代中逐漸積累誤差,造成精度下降。直接預測是在給定輸入序列后直接一次給出確定步長的預測值,直接構建歷史輸入和預測輸出間的直接映射關系。此時,預測步長將作為預測網絡中的超參數,對模型的預測效果產生影響。本文采用直接預測法。
考慮到錐套軌跡數據同時具有時間和空間特征,卷積神經網絡以其結構的稀疏性連接、卷積核參數共享、具有縮放/平移/傾斜不變性等特性,適應于提取軌跡數據中的空間特征。通過引入殘差模塊,可進一步提升模型深度和訓練效率,提高模型性能?;谏弦还?jié)的描述,本文采用多頭卷積殘差網絡作為空間特征編碼器,對高維輸入數據進行處理,通過子模型分別提取每個維度的特征,拼接后得到融合特征。LSTM網絡作為解碼器,從多頭卷積殘差網絡的編碼結果中充分挖掘時序特征,學習預測位置和序列數據間的隱含關聯。
結合以上2種模型的優(yōu)勢,本文建立了多頭殘差循環(huán)神經網絡預測模型。該模型首先采用3個帶有殘差結構的卷積神經網絡處理高維輸入,提取空間特征。通過特征一維化操作拼接3個子模型的特征,將其構建為序列數據后作為循環(huán)神經網絡的輸入。此處采用堆疊LSTM模塊的策略提升時序特征提取深度,使用3層具有不同維度的LSTM單元依次處理上層信息,實現對歷史軌跡數據的特征提取和運動模式的學習。最終,通過全連接層解釋提取出的深層語義特征,輸出預測值。多頭殘差循環(huán)神經網絡的結構如圖5所示。
圖5 錐套軌跡預測模型
為了驗證本文提出的錐套軌跡預測模型的效果及其可信性,在臺式計算機和地面實驗平臺上分別進行了實驗。仿真實驗的計算機采用64位Windows操作系統(tǒng),處理器為Intel Core(TM) i5-4590 CPU @ 3.30 GHz,顯卡8 GB,顯卡型號為AMD Radeon HD 8350。錐套軌跡預測模型通過Keras框架實現。地面試驗平臺的結構如圖6所示,縮比錐套受十字滑軌的驅動在背板范圍內運動,表征錐套在y-O-Z平面的軌跡??紤]到固定翼飛機體型較大、占用空間較多,實驗中用機械臂模擬受油機的運動,并在機械臂的前端固連縮比受油桿。為增加前進方向的運動自由度,將機械臂安裝至第七軸上,對接沖刺時由伺服電機驅動滑軌運動,進而帶動機械臂前進。錐套軌跡預測所需的歷史數據由傳感子系統(tǒng)獲取(雙目相機)。
圖6 地面試驗平臺
為了評估模型的預測精度,本文選擇均方根誤差σRMSE作為評價指標
(11)
目前尚無公開的錐套軌跡標準數據集可供使用,這為本文提出的錐套軌跡預測模型的訓練帶來困難。為了保證實驗的順利進行,首先將上位機中存儲的錐套軌跡文件導入十字滑軌控制臺,由十字滑軌模擬錐套的運動。隨后,將機械臂固定在離錐套運動平臺水平方向2.5 m處的位置,保持受油桿與錐套運動平面中心對齊,觀察錐套運動。經標定后的雙目視覺相機搭配CamShift算法,每隔0.1 s采集y-z平面內的一個數據點。經過3 min的觀測,共采集到1 800個數據點用于訓練。
對多頭卷積長短期記憶網絡模型,不同的網絡超參數對模型的預測效果會產生較大影響。本文采用網格搜索法尋找最優(yōu)超參數組合。由圖5可得,模型的核心超參數包括卷積神經網絡的卷積核數量、LSTM單元的維度、全連接層的節(jié)點數、批處理量大小(batchsize)和訓練輪次(epochs)。為了縮小搜尋空間同時又不失一般性,此處假設多頭卷積神經網絡中2個卷積層的卷積核的數量相等(計為Nc)且Nc∈{16,32,64}、3個LSTM單元的維度相同(計為D)且D∈{32,64,96,128}、2個全連接層的節(jié)點數分別為NF1和NF2且NF1∈{150,200}及NF2∈{50,100}、批處理數b∈{8,32,64}、訓練輪次為30。此外,在生成序列數據時,還包括滑窗尺寸T和預測時間步L,它們分別表示以當前時間步為基準輸入前T步的序列數據,預測后L步的結果。此處選擇T∈{50,100,200},L∈{30,60,90},則共有3×4×2×2×3×3=1 296種訓練模型待選擇。值得說明的是,滑窗尺寸T和預測時間步L與對接任務密切相關。由于此處的采樣時間為0.1 s,若T=100,L=60,即代表網絡的最終目的是根據前10 s的軌跡,預測6 s后的位置。同時,為了避免過擬合現象,在網絡訓練中引入Dropout技術(比例為0.1)。訓練過程中,訓練集、驗證集和測試集的比例分別為70%,20%和10%。
表1展示了在測試集和訓練集上取得前10名性能的超參數組合(使用y方向數據訓練)。由結果可知,在效果較好的模型中滑窗尺寸均為T=200,即在待選擇的空間T∈{50,100,200}中,更大的滑窗尺寸意味著更長時間的歷史軌跡將用作預測(由于采樣時間為0.1 s, 表示前20 s的歷史數據將用于預測),更多關于錐套運動規(guī)律信息被捕捉,實現預測精度的提升。在預測步長上,后3 s預測(L=30)和后6 s預測(L=60)在本文的數據集上都可取得不錯效果。考慮到在實際任務中,更長的預測步長可以給受油機更多的準備和姿態(tài)/位置調整時間,更有利于任務完成。在卷積核的數量選擇上,更多的卷積核數量雖然有潛力提取更多的空間信息,但同樣會造成計算量增大及過擬合問題。針對本文的運動數據,Nc=16是一個合適的參數。LSTM單元的維度實質上代表隱含層狀態(tài)維度,根據表1結果排名前10的網絡中隱含層維度至少為64,其中96維占據絕大多數。相較于較低維度隱含層(32維),更大的隱含層容量有助于改善訓練精度。后續(xù)的2個全連接層目的是做深度回歸,此處選擇網絡節(jié)點數為NF1=200和NF2=100。批處理數量對模型中每個輪次的訓練時間及梯度反向傳播有較大影響,在本文所提的預測模型中b=64是最優(yōu)選擇。在錐套運動的z方向上,不獨立進行網絡設計,直接采用y方向網絡的結構。
表1 神經網絡訓練結果
基于最優(yōu)化的超參數,本文將所設計的多頭卷積循環(huán)神經網絡與時間序列預測中常用的方法相比,包括差分自回歸移動平均模型(autoregressive integrated moving average model,ARIMA)、循環(huán)神經網絡(recurrent neural network,RNN)、常規(guī)LSTM網絡相比較,對比結果如圖7所示。
圖7 不同方法預測性能對比(y軸)
ARIMA模型通常假設時間序列數據是線性系統(tǒng)運動規(guī)律的映射,若系統(tǒng)存在強烈非線性因素,預測效果將難以保證??紤]到軟管-錐套連接體是剛性-柔性的組合體,其動力學本質就是非線性的。同時,在外部風場的作用下,軟管-錐套組合體的運動更加復雜,這也是ARIMA模型預測效果相對較差的原因。RNN模型通過循環(huán)單元,可捕捉數據間隱含的動力學特性,取得稍好的預測效果。但制約RNN網絡性能的重要因素是其在訓練時難以有效反向傳播梯度,尤其是處理長序列的訓練時容易出現梯度消失的問題。因此,相較于ARIMA模型,RNN網絡預測效果雖有提升,但不太明顯。在引入3個門單元后,LSTM網絡可以有效解決RNN網絡難以訓練的弊端,有效地使用梯度更新網絡權值,因此在性能上較ARIMA和RNN網絡有明顯提升。但傳統(tǒng)LSTM網絡僅使用原始的時間序列訓練,沒有充分挖掘原始數據中的時空特征。本文構建了多頭卷積殘差網絡對時間序列數據進行預處理,利用深度卷積網絡提取序列數據中的空間信息,引入殘差模塊降低訓練難度,輔助提升卷積網絡的效果,最終得到了高精度的預測結果。
此外,相空間重構技術的引用提高了原始數據維度,更有利于網絡捕捉細節(jié)性信息。圖8展示了有無使用相空間重構技術的預測性能對比,當預測開始后,紅色虛線(使用相空間重構技術)能夠更好地捕捉原始軌跡中的局部特征和長期趨勢,而藍色虛線(未使用相空間重構技術)雖然同樣能習得周期性規(guī)律,但在局部波動的刻畫能力上稍遜一籌。相空間重構技術的引入使得網絡的預測效果更好,預測軌跡和實際軌跡更貼近,證明了方法的有效性。
圖8 軌跡預測效果對比
為了進一步驗證預瞄式對接策略的有效性,開展了地面半物理驗證。首先需要明確的是,考慮到未來機載化的需求,小型化的機載計算機僅進行離線預測和數據收集,消耗算力和時間的在線訓練過程將放在地面計算機上。在這樣的架構下,所建立的多頭卷積長短期記憶網絡及其優(yōu)化后的網絡參數被裝載至上位計算機中(A計算機,模擬機載計算機)。另一臺上位計算機(B計算機)將錐套的測試集軌跡數據通過UDP協議發(fā)送至十字滑軌驅動程序,使錐套以測試集中的運動規(guī)律循環(huán)運行。利用雙目視覺量測的錐套軌跡數據,A計算機將存儲并進行錐套軌跡的離線預測。當達到了給定的預測窗口后,A計算機通過UDP協議將預測的6 s后位置作為控制指令發(fā)送至機械臂控制系統(tǒng),機械臂模擬受油機在期望的對接點截獲錐套,實現預瞄式對接。
圖9 地面對接實驗過程
圖9展示了機械臂和縮比錐套的對接過程,在到達錐套的運動平面時機械臂上的受油頭在錐套的直徑范圍內,對接成功。實驗結果表明,本文提出的多頭卷積長短期記憶網絡可在地面環(huán)境下完成預瞄式對接,有潛力用于空中加油對接任務。
本文針對軟式空中加油對接問題,提出了一種基于多頭卷積長短期記憶網絡的錐套軌跡預測模型。相空間重構技術的引入可提升原始序列數據的維度,刻畫出更豐富的運動信息。多頭卷積殘差網絡可有效提取高維數據的空間特征,形成高層語義信息作為序列預測的基礎。LSTM模型可最終捕獲融合特征的時序性和非線性關系。仿真實驗和地面半物理實驗結果表明,本文設計的錐套軌跡預測模型較常規(guī)的時間序列預測模型有更高的精度,在空中加油任務的工程應用上具有一定的參考價值。
在未來,為了適應軍工行業(yè)對軟硬件平臺“自主、可控”的需求,以及加快機械化信息化智能化融合發(fā)展的戰(zhàn)略思想,我們將嘗試把基于開源框架的預測模型移植成可在國產操作系統(tǒng)和國產處理器上運行的版本,以更好地貼近工程實用要求,在軍事智能化發(fā)展議題上做出潛在嘗試。