梁 浩, 何 婕, 陳善秋, 郭 毓, 趙興法, 陸煜明
(1. 南京理工大學(xué)自動(dòng)化學(xué)院,江蘇 南京 210094; 2. 北京航天時(shí)代激光導(dǎo)航技術(shù)有限責(zé)任公司,北京 100094;3. 空軍裝備部駐北京地區(qū)第五軍事代表室,北京 101300)
作為捷聯(lián)慣導(dǎo)[1-2]的代表,激光陀螺慣性導(dǎo)航系統(tǒng)(激光慣導(dǎo))以其低成本、高精度、環(huán)境適應(yīng)性強(qiáng)、數(shù)字輸出等優(yōu)點(diǎn)在航天、航空、航海等領(lǐng)域得到了廣泛的應(yīng)用。溫度是影響激光慣性導(dǎo)航系統(tǒng)精度和穩(wěn)定性的重要因素[3]。
在激光陀螺溫度補(bǔ)償?shù)难芯糠矫?,歐陽(yáng)義國(guó)等[4]采用逐步回歸分析方法,建立了激光陀螺進(jìn)行零偏系數(shù)多項(xiàng)式模型。于旭東等[5]提出了一種改進(jìn)的人工魚群尋優(yōu)算法,對(duì)多項(xiàng)式參數(shù)進(jìn)行尋優(yōu),并將之用于激光陀螺的溫度零偏補(bǔ)償中。史震等[6]提出了一種基于自組織競(jìng)爭(zhēng)型神經(jīng)網(wǎng)絡(luò)和正交最小二乘算法的改進(jìn)徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)方法,并將其用于單陀螺的溫度補(bǔ)償中。在系統(tǒng)級(jí)別的溫度補(bǔ)償方面Wei Guo等[7]針對(duì)系統(tǒng)零偏的非線性漂移,提出了一種基于最小二乘支持向量機(jī)的激光陀螺零偏系統(tǒng)級(jí)溫度補(bǔ)償方案。李漢舟等[8]提出了采用溫度控制與溫度補(bǔ)償相結(jié)合的方法,對(duì)激光陀螺進(jìn)行溫度補(bǔ)償。以上研究多集中于單陀螺的溫度補(bǔ)償以及陀螺零偏參數(shù)的補(bǔ)償,而在實(shí)際系統(tǒng)中,包含多種傳感器,且影響系統(tǒng)輸出的參數(shù)多達(dá)十幾個(gè)。在系統(tǒng)溫度變化時(shí),這些參數(shù)往往互相產(chǎn)生耦合,并且呈現(xiàn)出較復(fù)雜的非線性變化。目前,在系統(tǒng)級(jí)多參數(shù)溫度補(bǔ)償方面的研究還不夠,尤其是對(duì)于慣導(dǎo)系統(tǒng)參數(shù)耦合以及呈現(xiàn)非線性變化時(shí)的多參數(shù)溫度補(bǔ)償方法研究很少,值得進(jìn)一步開展研究工作。
針對(duì)溫度影響激光陀螺慣導(dǎo)系統(tǒng)性能問題,本文建立了激光陀螺和加速度計(jì)慣導(dǎo)系統(tǒng)溫度補(bǔ)償模型,采用異構(gòu)核相關(guān)向量機(jī)[9-11](relevance vector machine,RVM)對(duì)模型中標(biāo)度因子和零偏進(jìn)行擬合回歸,并采用蟻獅優(yōu)化算法[12](ant lion optimizer,ALO)對(duì)相關(guān)向量機(jī)的參數(shù)進(jìn)行尋優(yōu),以提高相關(guān)向量機(jī)的性能,并進(jìn)行慣導(dǎo)實(shí)物溫度試驗(yàn)以驗(yàn)證算法的有效性。
溫度是影響激光慣導(dǎo)輸出精度和啟動(dòng)時(shí)間的重要因素,其對(duì)系統(tǒng)的影響主要表現(xiàn)為三方面:1)溫度對(duì)激光陀螺的諧振腔長(zhǎng)及共面性、抓卡系統(tǒng)、朗繆爾流動(dòng)、放電對(duì)稱性等產(chǎn)生影響,從而引起激光陀螺標(biāo)度因子和零偏的變化。2)加速度計(jì)溫度的波動(dòng)會(huì)使加速度計(jì)中差動(dòng)電容傳感器生成較大的電流波動(dòng),并對(duì)磁性材料、力矩線圈、支臂形變產(chǎn)生影響,從而影響加速度計(jì)標(biāo)度因子和零偏的穩(wěn)定性。3)激光陀螺和加速度計(jì)固定在基座上,基座的幾何結(jié)構(gòu)隨溫度變換產(chǎn)生微小的變化,這種變化也會(huì)反應(yīng)在單個(gè)傳感器儀表的參數(shù)漂移上。
總之,溫度對(duì)慣導(dǎo)系統(tǒng)的影響是多方面和復(fù)雜的,逐步分析和補(bǔ)償這些因素非常困難,因此采用系統(tǒng)級(jí)補(bǔ)償方法對(duì)所有影響因素進(jìn)行整合,直接進(jìn)行建模和補(bǔ)償。
典型的激光慣導(dǎo)系統(tǒng)包括3個(gè)正交的激光陀螺和3個(gè)正交的加速度計(jì)。其中激光陀螺的測(cè)量模型為[13]:
式中:Ng——3個(gè)激光陀螺在采樣周期內(nèi)的輸出脈沖向量
Kg3個(gè)激光陀螺的標(biāo)度因子矩陣,=diag(Kgx,Kgy,Kgz);
Dg-3個(gè)激光陀螺的零偏矩陣,
加速度計(jì)的測(cè)量方程如下:
式中:Na——3個(gè)加速度計(jì)在采樣周期內(nèi)的輸出脈沖量
Ka- 3個(gè)激光陀螺的標(biāo)度因子矩陣;=
對(duì)于激光慣組來(lái)說(shuō),其溫度的影響主要集中在激光陀螺以及加速度計(jì)的標(biāo)度因子和零位上,因此,考慮溫度T的變化因素,式(1)和(2)可分別表示為:
式中:Kg(T)-3個(gè)陀螺的標(biāo)度因子的溫度擬合回歸模型矩陣,
Ka(T)——3個(gè)陀螺零偏的溫度擬合回歸模型矩陣,
Dg(T)-3個(gè)加速度計(jì)的標(biāo)度因子的溫度擬合回歸模型矩陣,
Da(T)-3個(gè)加速度計(jì)的標(biāo)度因子的零偏的回歸模型矩陣,
每個(gè)陀螺和加速度計(jì)都安裝有溫度傳感器,因此對(duì)于每個(gè)傳感器的溫度變量進(jìn)行區(qū)分。
假設(shè)e為需要補(bǔ)償?shù)降哪繕?biāo)溫度,通過回歸模型,可以得到陀螺、加速度計(jì)在溫度e時(shí)的標(biāo)度因子陣與零位陣
將式(5)和(6)分別代入式(1)和(2),可以得到將陀螺和加速度計(jì)輸出補(bǔ)償?shù)綔囟萫的溫度補(bǔ)償模型:
式(7)和(8)即為慣導(dǎo)系統(tǒng)的溫度補(bǔ)償模型,通過模型的計(jì)算,可以將所有溫度下的陀螺和加速度計(jì)的脈沖輸出補(bǔ)償至目標(biāo)溫度下的輸出,從而實(shí)現(xiàn)系統(tǒng)的溫度補(bǔ)償??梢钥吹?,對(duì)于慣導(dǎo)系統(tǒng)激光陀螺和加速度計(jì)的溫度補(bǔ)償上,起決定因素的是溫度擬合回歸模型的回歸精度,由于慣導(dǎo)系統(tǒng)內(nèi)部結(jié)構(gòu)復(fù)雜,部件眾多,因此其溫度環(huán)境非常復(fù)雜,會(huì)導(dǎo)致陀螺和加速度計(jì)的標(biāo)度因子和零位隨溫度產(chǎn)生復(fù)雜的非線性變化,需要采用對(duì)非線性變化有較強(qiáng)擬合回歸能力的方法來(lái)提高系統(tǒng)補(bǔ)償能力。
3.1.1 相關(guān)向量機(jī)理論
機(jī)器學(xué)習(xí)在復(fù)雜非線性擬合回歸方面具有強(qiáng)大的能力。Tipping[14]提出了基于貝葉斯框架的相關(guān)向量機(jī)。相關(guān)向量機(jī)使用較少的向量,具有較強(qiáng)的稀疏性,能夠在訓(xùn)練樣本較少的情況下,保證良好的泛化能力,且其核函數(shù)不必滿足Mercer條件,放寬了核函數(shù)的選擇范圍,其基本算法如下:
從試驗(yàn)中獲得的樣本數(shù)據(jù)集[15]如下:
式中:N——數(shù)據(jù)樣本數(shù);
考慮目標(biāo)是疊加了噪聲的數(shù)據(jù)樣本,則目標(biāo)可以表示為:
全部數(shù)據(jù)集的似然估計(jì)表示為:
對(duì) P (t|α,σ)采用極大似然法得到其邊際似然函數(shù)在最大化時(shí)所對(duì)應(yīng)的 αMP,σ2MP后,對(duì)于新的輸入,可以計(jì)算輸出預(yù)測(cè)分布[17]:
3.1.2 異構(gòu)核函數(shù)
對(duì)于相關(guān)向量機(jī),其核函數(shù)的構(gòu)造和選擇對(duì)于模型預(yù)測(cè)精度影響很大。相關(guān)向量機(jī)只使用單核函數(shù)會(huì)造成性能單一且局限性較強(qiáng),而采用異構(gòu)核函數(shù)能夠提高其性能[11,18-19]。高斯核函數(shù)具有良好的非線性映射能力,但其作用是局部的,當(dāng)空間中一點(diǎn)遠(yuǎn)離中心點(diǎn)時(shí)函數(shù)取值很小,Sigmoid核函數(shù)是具有全局特性的核函數(shù),結(jié)合二者可以同時(shí)提升學(xué)習(xí)能力和泛化能力。定義異構(gòu)核函數(shù)如下:
蟻獅優(yōu)化算法[20]是一種群體智能算法,通過對(duì)自然界中蟻獅的狩獵機(jī)制,不斷進(jìn)行種群的迭代,從而獲得系統(tǒng)的最優(yōu)解,其尋優(yōu)效率優(yōu)于傳統(tǒng)的遺傳算法[21-22]和粒子群算法[23]。ALO算法主要分為以下步驟[24-25]:
1)螞蟻的隨機(jī)行走
ALO算法模擬陷阱中蟻獅和螞蟻之間的相互作用。為了模擬這種相互作用,螞蟻需要在搜索空間中移動(dòng)。由于螞蟻在尋找食物時(shí)會(huì)在自然界中隨機(jī)移動(dòng),因此選擇隨機(jī)行走來(lái)模擬螞蟻的移動(dòng)[26],如下式所示:
式中:cumsum——累加和;
p——迭代次數(shù)。
2)構(gòu)建陷阱
為了模擬蟻獅的狩獵能力,通過蟻獅的適應(yīng)性使用輪盤賭方式來(lái)選擇蟻獅并構(gòu)筑陷阱。
3)螞蟻進(jìn)入陷阱
螞蟻進(jìn)入陷阱的過程, 可以看作螞蟻圍繞修筑陷阱的蟻獅行走,行走邊界受蟻獅位置的影響:
4)螞蟻滑落
一旦蟻獅發(fā)現(xiàn)到陷阱里有螞蟻,它們就會(huì)從坑中心向外刨出沙子,使試圖逃跑的螞蟻圍繞蟻獅的行走半徑不斷減小。該過程的數(shù)學(xué)描述如下:
式中:p——當(dāng)前迭代次數(shù);
M——最大迭代次數(shù)。
5)陷阱重構(gòu)
如果螞蟻種群中出現(xiàn)了適應(yīng)度高于蟻獅的個(gè)體,則將該螞蟻將作為蟻獅,并在其位置修筑陷阱,即:
式中:p——當(dāng)前迭代數(shù);
f ——適應(yīng)度函數(shù)。
6)蟻獅精英化
精英化允許算法在優(yōu)化過程的任何階段保持獲得的最佳解。ALO算法中,每次迭代中獲得最優(yōu)適應(yīng)度的蟻獅被視為精英蟻獅,它能夠在迭代過程中影響所有螞蟻的運(yùn)動(dòng)。假設(shè)每只螞蟻同時(shí)受到輪盤賭選出的蟻獅和精英蟻獅的影響隨機(jī)行走:
為了獲得RVM模型的最佳核函數(shù)寬度參數(shù),每個(gè)蟻獅表示一個(gè)可能的核函數(shù)寬度參數(shù)。設(shè)置搜索范圍、種群數(shù)、最大迭代次數(shù)和初始位置。
從試驗(yàn)中獲得的數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集。訓(xùn)練集用于RVM建模,測(cè)試集用于測(cè)試模型的預(yù)測(cè)精度。每個(gè)蟻獅對(duì)應(yīng)模型的預(yù)測(cè)精度作為每個(gè)其適應(yīng)度,定義為:
圖1為采用RVM建模及采用ALO對(duì)RVM進(jìn)行優(yōu)化的流程圖。首先初始化蟻獅算法參數(shù),每一個(gè)螞蟻和蟻獅都可作為一對(duì)RVM核函數(shù)的參數(shù),通過螞蟻的隨機(jī)行走,生成每只螞蟻和蟻獅對(duì)應(yīng)參數(shù)的RVM,對(duì)所有RVM采用訓(xùn)練集進(jìn)行訓(xùn)練,并采用測(cè)試集進(jìn)行精度測(cè)試,根據(jù)測(cè)試結(jié)果,更新精英蟻獅,直到最大迭代次數(shù)位置,獲得此時(shí)的核函數(shù)參數(shù)。
圖1 建模及優(yōu)化流程圖
如圖2所示,為了獲得變溫條件下激光陀螺和加速度計(jì)的溫度特性,將慣導(dǎo)安裝至溫箱中的轉(zhuǎn)動(dòng)裝置上,并對(duì)溫箱的溫度進(jìn)行控制。每個(gè)陀螺和加速度計(jì)都安裝有鉑電阻Pt1000,通過電橋電路可以測(cè)量其溫度。測(cè)試設(shè)備對(duì)慣導(dǎo)進(jìn)行供電,并對(duì)溫度和脈沖數(shù)據(jù)進(jìn)行記錄。通過轉(zhuǎn)動(dòng)裝置溫箱中進(jìn)行不間斷標(biāo)定,以獲得3個(gè)陀螺儀和加速度計(jì)在不同溫度下的標(biāo)定數(shù)據(jù)。
圖2 試驗(yàn)裝置圖
1)將慣導(dǎo)安裝至溫箱中,將溫箱的溫度設(shè)置為-5 ℃,保溫 4 h 使慣導(dǎo)溫度穩(wěn)定。
2)將溫度箱終止溫度設(shè)為65 ℃。在溫度變化過程中,對(duì)慣導(dǎo)系統(tǒng)連續(xù)標(biāo)定,共獲得175組標(biāo)定數(shù)據(jù),于此同時(shí)記錄所有陀螺和加速度計(jì)的溫度。
3)對(duì)每組標(biāo)定數(shù)據(jù)進(jìn)行離線處理,分別得到3個(gè)陀螺和3個(gè)加速度計(jì)的標(biāo)度因子和零偏數(shù)據(jù)集,共12個(gè)數(shù)據(jù)集。由于進(jìn)行了175組標(biāo)定,因此每個(gè)數(shù)據(jù)集有175組數(shù)據(jù)。
4)將12個(gè)數(shù)據(jù)集都分為訓(xùn)練集和測(cè)試集,采用3.3中的建模及優(yōu)化流程建立12個(gè)相關(guān)向量機(jī)模型,12個(gè)標(biāo)度因子和零偏的模型可表示如下:
式(29)所示的模型,即通過RVM學(xué)習(xí)后所建立的各參數(shù)與溫度的擬合回歸模型。共有包括了三個(gè)陀螺和三個(gè)加速度計(jì)的標(biāo)度因子以及零偏的12個(gè)擬合模型,即對(duì)應(yīng)于式(3)和式(4)中的Kgx(Tgx),Kgy(Tgy),Kgz(Tgz),Kax(Tax),Kay(Tay),Kaz(Taz),Dgx(Tgx),Dgy(Tgy),Dgz(Tgz),Dax(Tax),Day(Tay),Daz(Taz),其中,每個(gè)模型中的和代表此模型經(jīng)過ALO優(yōu)化后的核函數(shù)的參數(shù)。在RVM學(xué)習(xí)的過程中,可以獲得式(15)中關(guān)于輸入樣本的與,并可通過式(20)實(shí)現(xiàn)數(shù)據(jù)回歸。
5)設(shè)定50 ℃作為補(bǔ)償?shù)哪繕?biāo)溫度,根據(jù)式(29)、(23)建立的模型回歸計(jì)算出此溫度下的標(biāo)度因子陣,與零位陣、。
為了驗(yàn)證補(bǔ)償效果,采用本文提出的方法將所有溫度下的標(biāo)定數(shù)據(jù)補(bǔ)償?shù)?0 ℃。將補(bǔ)償后的數(shù)據(jù)用于離線標(biāo)定,以獲得補(bǔ)償后的三個(gè)陀螺和三個(gè)加速度計(jì)的標(biāo)度因子和零偏。如圖3所示,三個(gè)陀螺和三個(gè)加速度計(jì)的標(biāo)度因子和零偏補(bǔ)償后的曲線在所有溫度下都是比較穩(wěn)定的,與補(bǔ)償前的曲線在50 ℃下時(shí)相交,表明所有溫度下的參數(shù)都已補(bǔ)償?shù)?50 ℃ 下。
圖3 三陀螺和三加速度計(jì)標(biāo)度因子和零偏補(bǔ)償圖
為了測(cè)試在系統(tǒng)上的補(bǔ)償效果,將慣導(dǎo)在室溫環(huán)境下采用靜態(tài)通電4 h。
表1中列出了補(bǔ)償前及補(bǔ)償后輸出穩(wěn)定性的對(duì)比數(shù)據(jù)。可以看出,輸出穩(wěn)定性較補(bǔ)償前提高了一個(gè)數(shù)量級(jí)。
表1 慣導(dǎo)系統(tǒng)靜態(tài)輸出穩(wěn)定性(1σ)
為了減小溫度對(duì)激光慣導(dǎo)的影響,本文提出了一種采用蟻獅優(yōu)化的異構(gòu)核相關(guān)向量機(jī)方法對(duì)激光慣導(dǎo)系統(tǒng)進(jìn)行溫度補(bǔ)償,主要工作如下:
1)分析了溫度對(duì)于慣導(dǎo)系統(tǒng)帶來(lái)的影響,并根據(jù)慣導(dǎo)數(shù)學(xué)模型,推導(dǎo)了系統(tǒng)的溫度補(bǔ)償模型。
2)提出了一種采用異構(gòu)核函數(shù)的相關(guān)向量機(jī)對(duì)系統(tǒng)的標(biāo)度因數(shù)和零偏建立擬合模型的方法,采用蟻獅算法對(duì)核參數(shù)優(yōu)化以提高模型的擬合回歸精度,給出了建模及優(yōu)化流程。
3)通過實(shí)物溫度試驗(yàn)對(duì)所提方法進(jìn)行了驗(yàn)證。結(jié)果表明,采用本文方法可以對(duì)系統(tǒng)多參數(shù)的非線性變化進(jìn)行補(bǔ)償,補(bǔ)償后的各傳感器通電穩(wěn)定性較補(bǔ)償前提高了一個(gè)數(shù)量級(jí)。
本文中采用了高斯核函數(shù)與Sigmoid核函數(shù)的線性疊加構(gòu)建異構(gòu)核函數(shù),下一步將研究不同核函數(shù)組合及其構(gòu)建方式對(duì)溫補(bǔ)性能的影響,以及進(jìn)一步降低算法的計(jì)算復(fù)雜度。