徐海祥, 胡 聰, 余文曌,*, 姚國全
(1. 武漢理工大學(xué)高性能艦船技術(shù)教育部重點實驗室, 湖北 武漢 430063;2. 武漢理工大學(xué)船海與能源動力工程學(xué)院, 湖北 武漢 430063)
無人水下航行器(unmanned underwater vehicle, UUV)廣泛應(yīng)用于水下勘探、地圖構(gòu)建及各種水下軍事任務(wù)[1]。出于安全考慮,UUV一般設(shè)置為正浮力狀態(tài)。但其自備動力,能源有限,欠驅(qū)動配置的UUV必須在航行時保持一定的攻角以平衡剩余浮力。在該運動狀態(tài)下,UUV航行阻力將會增加,同時低速航行時的水動力性能下降,將導(dǎo)致自身的剩余浮力難以平衡[2]。對于配置垂向推進(jìn)器的UUV,雖然具有良好的機(jī)動能力,但難以保證較低的能源消耗[3]。而浮力調(diào)節(jié)式UUV通過改變自身重量或者排水體積的方式實現(xiàn)深度、縱搖角的控制,且能耗需求低,因此相較于其他類型的UUV在長期大范圍任務(wù)場景下更具優(yōu)勢。但浮力調(diào)節(jié)機(jī)構(gòu)不同于螺旋槳等執(zhí)行機(jī)構(gòu),對控制輸入的約束更加嚴(yán)格。如果在設(shè)計控制系統(tǒng)的同時不考慮浮力調(diào)節(jié)機(jī)構(gòu)的限制,將會影響系統(tǒng)動態(tài)性能、穩(wěn)態(tài)精度,甚至導(dǎo)致系統(tǒng)失穩(wěn)[4]。因此,研究輸入約束下的浮力調(diào)節(jié)式UUV變深控制對其長期大范圍場景下的應(yīng)用具有重要的意義。
針對浮力調(diào)節(jié)式UUV的變深控制問題,國內(nèi)外學(xué)者進(jìn)行了大量的研究。張勛等人[5]基于簡化的UUV 垂直面運動模型,設(shè)計了基于比例-積分-微分(proportional, integral, differential, PID) 和均衡系統(tǒng)的深度、縱傾和浮態(tài)的控制方法,該方法能有效控制UUV的垂向運動。Sylvester等人[6]基于Bang-Bang控制方法設(shè)計了兩種反饋控制器,并通過仿真證明了基于模型的Bang-Bang控制能實現(xiàn)更精準(zhǔn)的浮力調(diào)節(jié)。王雨等人[7]在UUV的運動模型中,考慮深度變化對浮力的影響,采用模糊自適應(yīng)PID控制方法對UUV深沉運動進(jìn)行研究,該方法在超調(diào)量、調(diào)節(jié)時間及抗干擾方面都有較好的控制效果。孫慶剛等人[8]考慮能源以及溫度對浮力調(diào)節(jié)系統(tǒng)的影響,基于無模型自適應(yīng)控制方法,解決了UUV 定深懸浮控制問題,且該方法能滿足工程實際需要。Zavislak等人[9]設(shè)計了一種比例微分加速度反饋控制器,實現(xiàn)了浮力調(diào)節(jié)式UUV的垂直面控制,對小擾動的抑制有較好的效果。Tiwari等人[10]采用線性二次調(diào)節(jié)狀態(tài)反饋控制器,研究了不同浮力狀態(tài)下UUV的控制性能, 結(jié)果表明該方法在調(diào)節(jié)浮力、控制和保持深度、控制升沉速度等方面具有良好的效果。
此外,執(zhí)行機(jī)構(gòu)動態(tài)特性及物理約束對控制系統(tǒng)設(shè)計的影響不容忽視[11]。近年來形成了兩種方法來解決這一問題,即一步法和兩步法[12]。一步法是在控制器設(shè)計的同時滿足標(biāo)稱控制性能與執(zhí)行機(jī)構(gòu)飽和約束,使系統(tǒng)達(dá)到閉環(huán)穩(wěn)定的效果。具體的做法是:輸入飽和問題視為扇區(qū)非線性問題,采用不變集[13-14]、模型預(yù)測控制[15-16]、有界反推法[17]等理論進(jìn)行設(shè)計,保證控制輸入一直處于執(zhí)行機(jī)構(gòu)的可行域內(nèi)。而兩步法在控制器設(shè)計的時候,一部分功能滿足標(biāo)稱的控制性能,一部分處理執(zhí)行機(jī)構(gòu)的約束。其具體做法是:基于不考慮飽和約束的標(biāo)稱控制器,設(shè)計抗飽和補(bǔ)償器來處理飽和約束。通過在標(biāo)稱控制器中引入抗飽和補(bǔ)償器確保(發(fā)生飽和時)控制系統(tǒng)的穩(wěn)定,并且在執(zhí)行機(jī)構(gòu)未達(dá)到飽和時,不影響標(biāo)稱控制器的性能[18-20]。 由于一步法的保守性和計算復(fù)雜性[21-22],實際工程應(yīng)用仍以兩步法為主,實現(xiàn)UUV控制系統(tǒng)穩(wěn)定的同時降低系統(tǒng)在輸入飽和狀態(tài)下的性能損失。
因此,本文將基于浮力調(diào)節(jié)系統(tǒng)的UUV垂直面變深控制視為輸入約束下的控制問題,建立考慮浮力調(diào)節(jié)機(jī)構(gòu)動態(tài)特性的UUV數(shù)學(xué)模型,引入線性擴(kuò)張狀態(tài)觀測器(linear extended state observer, LESO)對UUV狀態(tài)進(jìn)行估計,并采用非線性跟蹤微分器處理反步法虛擬控制量求導(dǎo)問題,執(zhí)行機(jī)構(gòu)的未知動態(tài)參數(shù)由自適應(yīng)律獲取。在此基礎(chǔ)上,設(shè)計正交神經(jīng)網(wǎng)絡(luò)飽和補(bǔ)償器,并基于李雅普諾夫穩(wěn)定性理論設(shè)計了權(quán)值自適應(yīng)律,最后分析閉環(huán)系統(tǒng)的穩(wěn)定性。仿真結(jié)果驗證了本文所提方法的有效性。
為了描述UUV的運動狀態(tài),建立如圖1所示的固定坐標(biāo)系({N}坐標(biāo)系)和體坐標(biāo)系({B}坐標(biāo)系),詳細(xì)說明見文獻(xiàn)[23]。
圖1 UUV固定坐標(biāo)系與體坐標(biāo)系Fig.1 UUV fixed corrdinate system and body coordinate system
本文研究UUV浮力調(diào)節(jié)機(jī)構(gòu)對控制輸入的約束問題,因此忽略水平運動的影響,建立如下UUV垂直面三自由度數(shù)學(xué)模型:
(1)
式中:η=[x,z,θ]T為{N}坐標(biāo)系下的北向位置、深度、縱搖角;v=[u,w,q]T為{B}坐標(biāo)系下的縱向、垂向、縱搖角速度;τ=[τx,τz,τq]T表示{B}坐標(biāo)系下飽和約束下的控制輸入;b表示{N}坐標(biāo)系下的環(huán)境干擾;M為系統(tǒng)慣性矩陣;C(v)為科里奧利矩陣;D表示系統(tǒng)阻尼矩陣;各模型參數(shù)矩陣[23]具體為
J(η)為坐標(biāo)轉(zhuǎn)換矩陣,具體為
g(η)為重力與浮力產(chǎn)生的力與力矩,由于垂向及縱搖方向的分量為被控對象的控制輸入,因此具體表示如下:
式中:G為UUV的重量;B為UUV受到的浮力。
浮力調(diào)節(jié)機(jī)構(gòu)的動態(tài)特性可以近似為一階慣性環(huán)節(jié)[5],同時可以采用非線性飽和函數(shù)描述控制輸入的幅值約束[4]。因此,浮力調(diào)節(jié)機(jī)構(gòu)的模型可以描述為
(2)
其中,l1為艏部油囊與浮心的距離;l2為艉部油囊與浮心的距離。sat(uc)表示控制輸入的飽和約束,具體為
(3)
因此,控制輸入的飽和特性可以描述為
δ=sat(uc)-uc
(4)
此外,理想的控制律應(yīng)該為τ=sat(uc),處于飽和約束界內(nèi)。
對考慮垂直面三自由度運動的UUV模型,在輸入飽和約束下,設(shè)計合適的控制輸入τ,垂直面輸出狀態(tài)能收斂到指定的縱向速度ud、深度zd、縱搖角θd,并保證閉環(huán)系統(tǒng)的所有誤差信號一致最終有界。
如圖2所示,所設(shè)計的控制系統(tǒng)由以下4個部分組成:LESO、指令濾波器、自適應(yīng)動態(tài)面控制器、正交神經(jīng)網(wǎng)絡(luò)飽和補(bǔ)償器。首先設(shè)計LESO對UUV的運動狀態(tài)進(jìn)行在線估計;其次設(shè)計指令濾波器對反步法設(shè)計的虛擬控制律進(jìn)行平滑、求導(dǎo);然后設(shè)計自適應(yīng)動態(tài)面控制器,實現(xiàn)控制目標(biāo)的同時處理執(zhí)行機(jī)構(gòu)的未知動態(tài)特性,而模型動態(tài)不確定性和浮力變化產(chǎn)生的干擾,采用LESO進(jìn)行估計補(bǔ)償;最后,設(shè)計正交神經(jīng)網(wǎng)絡(luò)飽和補(bǔ)償器處理輸入飽和問題??刂葡到y(tǒng)的詳細(xì)設(shè)計以及圖中各符號含義將在以下4個小節(jié)中分別進(jìn)行介紹。
圖2 控制系統(tǒng)結(jié)構(gòu)Fig.2 Structure of control system
由于UUV為時變非線性系統(tǒng),系統(tǒng)的模型參數(shù)與外部干擾難以實時精確地獲得,因此本節(jié)設(shè)計LESO,將包括模型不確定性、浮力變化干擾在內(nèi)的“總擾動”估計出來,以實現(xiàn)控制系統(tǒng)良好的抗干擾性能[24]。
因此,定義系統(tǒng)的干擾狀態(tài):
(5)
結(jié)合和,UUV垂向三自由度模型可重新寫為[25]
(6)
根據(jù)式(6),所設(shè)計的LESO為
(7)
為了解決反步法設(shè)計控制器帶來的“微分爆炸”問題,同時平衡系統(tǒng)快速性與控制超調(diào)間的矛盾,避免控制器輸出量的突變,引入非線性跟蹤微分器進(jìn)行指令濾波器設(shè)計。
采用文獻(xiàn)[26]提出的正切sigmoid函數(shù)作為加速度函數(shù),以單輸入單輸出系統(tǒng)為例,建立如下非線性跟蹤微分器:
(8)
其中,x表示任意變量。
(9)
式中:ζ1為微分跟蹤器給出的位置指令;H為投影矩陣,具體為
因此,設(shè)計速度的虛擬控制律:
α1=-RT(η)(C1z1+D1z1)+RT(η)ζ2
(10)
式中:C1、D1為正定對稱矩陣,D1為引入鎮(zhèn)定觀測誤差的參數(shù)矩陣[27];ζ2為速度指令。由于本文縱向采用速度控制,令α1(1)=ud。
對z2求導(dǎo),等式兩邊同乘M0,得
(11)
考慮到浮力機(jī)構(gòu)的動態(tài)特性,執(zhí)行機(jī)構(gòu)的虛擬控制律可以表示為
(12)
對z3求導(dǎo),等式兩邊同乘時間矩陣Tn,得
(13)
因此,最終的控制律為
(14)
(15)
式中:γ2為正常數(shù)。
由于執(zhí)行機(jī)構(gòu)的輸出信號很難直接獲取,本文利用神經(jīng)網(wǎng)絡(luò)良好的非線性逼近能力,估計出δ[4,28]。而正交神經(jīng)網(wǎng)絡(luò)具有良好收斂能力和較低計算復(fù)雜度,適合用于執(zhí)行機(jī)構(gòu)飽和函數(shù)δ的近似:
δ=WTP(ξ)+εδ
(16)
式中:m為神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點數(shù);激活函數(shù)g(ξ)=1/[1+exp(-σ∑ξ)]。
實際應(yīng)用中,理想的神經(jīng)網(wǎng)絡(luò)模型通過在線學(xué)習(xí)或者離線學(xué)習(xí)等方式獲取。因此,理想的神經(jīng)網(wǎng)絡(luò)模型的近似為
(17)
(18)
式中:
其中,06×6為零矩陣,I6×6為單位矩陣。
假設(shè) 1系統(tǒng)的擾動狀態(tài)χ對其所有自變量是連續(xù)可微的;
證明對于給定正定矩陣QT=Q,存在正定矩陣P,滿足如下李雅普諾夫方程[25]:
(19)
因此,構(gòu)造觀測誤差相關(guān)的李雅普諾夫函數(shù):
(20)
可知V1≥0恒成立,當(dāng)且僅當(dāng)e1=0時等號成立。
由式(19)、式(20)和Young不等式[15],式(20)關(guān)于時間的導(dǎo)數(shù)為
(21)
即
(22)
對式(22)求解,并化簡為
(23)
證畢
假設(shè) 3ζ1、ζ2、ζd對于變量t均有界可積。
假設(shè) 4輸入信號ζd的一階導(dǎo)及二階導(dǎo)有界。
引理 1[26]對于如下系統(tǒng):
(24)
在變量z1=0和z2=0處漸進(jìn)收斂,其中b1、b2為正常數(shù)。
定理 2對于系統(tǒng),如果滿足k1、a1、a2均為正數(shù),則對于任意的可積函數(shù)ζd,T>0,該系統(tǒng)的解滿足:
(25)
即系統(tǒng)漸進(jìn)收斂至ζd。
(26)
即
(27)
證畢
(28)
假設(shè) 5(逼近誤差有界)理想神經(jīng)網(wǎng)絡(luò)的逼近誤差εδ滿足
假設(shè) 6(理想神經(jīng)網(wǎng)絡(luò)權(quán)值有界)理想神經(jīng)網(wǎng)絡(luò)的最優(yōu)權(quán)值W滿足
在一些實際系統(tǒng)中,如果知道其變量的上界,上述假設(shè)的界限是可以計算出的[4,28]。
(29)
式中:κ(·)表示κ類函數(shù)。
定理 3正交神經(jīng)網(wǎng)絡(luò)的權(quán)值滿足如下自適應(yīng)律:
(30)
控制律滿足:
證明構(gòu)造LESO輸入下的控制系統(tǒng)的李雅普諾夫函數(shù):
(31)
根據(jù)式(9)、式(11)及式(13),式(31)關(guān)于時間的導(dǎo)數(shù)為
(32)
(33)
(34)
(35)
根據(jù)文獻(xiàn)[30]和文獻(xiàn)[27],選取合適的正定矩陣Λ1、Λ2,有如下不等式關(guān)系成立:
(36)
(37)
因此,綜上式(17)、式(28)、式(33)~式(35),并在式(32)中代入:
(38)
(39)
則式(32)可簡化為
(40)
根據(jù)定理1、定理2、引理2及式(15)、式(30),有
其中,Qi(i=1,2,3)為Q=diag(Q1,Q2,Q3)的子矩陣。
進(jìn)一步,定義參數(shù):
證畢
本文采用南安普頓大學(xué)的Delphin2號作為仿真試驗的UUV模型[23],采用文獻(xiàn)[3]的油囊模型作為真實浮力調(diào)節(jié)系統(tǒng)模型,具體布局如圖3所示,浮力調(diào)節(jié)機(jī)構(gòu)參數(shù)l1=l2=0.4 m。
圖3 浮力調(diào)節(jié)機(jī)構(gòu)布局圖Fig.3 Layout of buoyancy regulating mechanism
UUV初始深度為0 m,縱搖角0°,采樣周期為0.5 s,仿真時長為2 000 s。速度指令為0.2 m/s,深度指令為8 m(0~600 s)、16 m(600~1 300 s)、24 m(1 300~2 000 s),并在深度下降過程保持初始縱搖角不變。
為了充分驗證本文所提方法的有效性,本節(jié)設(shè)計了相應(yīng)的仿真試驗。首先將每個浮力調(diào)節(jié)機(jī)構(gòu)的上限設(shè)為±3 N,凈浮力為-5 N(向下為正),然后采用文獻(xiàn)[31]中基于LESO的動態(tài)面控制(后面用傳統(tǒng)動態(tài)面控制代指),和本文所提方法進(jìn)行仿真對比驗證。
LESO和動態(tài)面控制器參數(shù)為
正交神經(jīng)網(wǎng)絡(luò)參數(shù)為γ1=0.01diag(2,2,2,10,10);KW=0.000 2;初始權(quán)值矩陣為
跟蹤微分器參數(shù)a1=0.015,a2=0.25,k1=8;自適應(yīng)律參數(shù)γ2=5。
圖4~圖8為UUV在浮力調(diào)節(jié)機(jī)構(gòu)約束條件下的仿真結(jié)果。圖4表明,在輸入幅值飽和約束場景下,執(zhí)行機(jī)構(gòu)的物理限制會明顯影響UUV的垂直面控制效果,UUV的速度及縱搖角均存在小幅震蕩,而垂向由于存在較大浮力與阻力,震蕩不明顯,但動態(tài)調(diào)整過程較長。同時可以看出,加入正交神經(jīng)網(wǎng)絡(luò)抗飽和補(bǔ)償器的方法,無論是穩(wěn)態(tài)精度還是動態(tài)調(diào)整速度均要優(yōu)于傳統(tǒng)動態(tài)面控制。這是因為執(zhí)行機(jī)構(gòu)的飽和將降低系統(tǒng)的動態(tài)性能,如果不能及時退出飽和狀態(tài),將導(dǎo)致閉環(huán)系統(tǒng)的失穩(wěn)。
圖4 兩種情況下的期望縱向速度、深度、姿態(tài)響應(yīng)結(jié)果Fig.4 Response results of expected surge velocity, depth and attitude in two cases
圖5為執(zhí)行機(jī)構(gòu)的控制輸入變化曲線。由圖5可知,由于沒有抗飽和補(bǔ)償器的作用,傳統(tǒng)動態(tài)面控制輸入變化幅度更大。進(jìn)一步地,由圖6和圖7的浮力調(diào)節(jié)機(jī)構(gòu)的響應(yīng)情況可以發(fā)現(xiàn),兩種方法均會導(dǎo)致執(zhí)行機(jī)構(gòu)飽和,但在抗飽和補(bǔ)償器的作用下,會使控制輸入較快地退出過飽和狀態(tài),從而避免控制效果的進(jìn)一步下降,甚至導(dǎo)致系統(tǒng)的失穩(wěn)。
圖5 控制輸入變化曲線Fig.5 Changing curve of control input
圖6 考慮抗飽和補(bǔ)償?shù)膱?zhí)行機(jī)構(gòu)響應(yīng)Fig.6 Actuator response considering anti saturation compensation
圖7 未考慮抗飽和補(bǔ)償?shù)膱?zhí)行機(jī)構(gòu)響應(yīng)Fig.7 Actuator response without considering anti saturation compensation
圖8為LESO對干擾的估計情況,圖中藍(lán)色實線表示UUV受到的實際干擾,紅色實線表示所設(shè)計的LESO對干擾的估計值,結(jié)果表明,除初始狀態(tài)和執(zhí)行機(jī)構(gòu)飽和情況外,LESO實現(xiàn)了對干擾的良好估計,在執(zhí)行機(jī)構(gòu)飽和時,存在較小的估計偏差,這是因為輸入約束限制了LESO的帶寬。
圖8 LESO對干擾的估計情況Fig.8 Estimation of interference by LESO
針對UUV垂直面運動模型存在非線性、不確定性等特點,并考慮到浮力調(diào)節(jié)機(jī)構(gòu)的物理限制,提出了基于正交神經(jīng)網(wǎng)絡(luò)飽和補(bǔ)償和LESO干擾補(bǔ)償?shù)淖赃m應(yīng)動態(tài)面控制方法。該方法結(jié)構(gòu)簡單,易于工程實現(xiàn):
(1) 所設(shè)計的正交神經(jīng)網(wǎng)絡(luò)抗飽和補(bǔ)償器,有效降低了輸入飽和狀態(tài)下浮力調(diào)節(jié)式UUV控制性能的損失;
(2) 考慮浮力調(diào)節(jié)機(jī)構(gòu)動態(tài)特性并采用自適應(yīng)律對未知參數(shù)進(jìn)行估計,有效避免了建模誤差導(dǎo)致的參數(shù)不確定性問題;
(3) 設(shè)計合適的仿真對比試驗,結(jié)果表明,輸入飽和約束下,該方法在快速性、穩(wěn)定性方面均優(yōu)于傳統(tǒng)動態(tài)面方法。