董 鑫,張傳林
(上海電力大學自動化工程學院,上海 200090)
本文主要研究具有如下形式的一類含不匹配干擾的非線性系統(tǒng)的跟蹤問題:
1Ni→j={i,i+1,···,j},?i,j ∈N,i≤j.
針對不確定系統(tǒng)(1),現(xiàn)有文獻中已有諸多控制策略用來求解系統(tǒng)的干擾抑制與跟蹤控制問題.比較常見的方案是通過選取較大的控制增益來抑制干擾的不良影響,如非線性H∞控制[1]、齊次壓制控制[2]、幾乎干擾解耦方法(almost disturbance decoupling)[3]等.但是這類方法在理論上無法實現(xiàn)系統(tǒng)輸出的精確跟蹤,且需要消耗較大的控制能量.
當系統(tǒng)(1)中的干擾di存在于外源系統(tǒng)時,非線性輸出調(diào)節(jié)控制策略常用來解決此情況下系統(tǒng)的精確跟蹤控制問題,見文獻[4–7]等.而當干擾外源模型完全未知或誤差較大時,這類方法無法重構干擾模型以及獲取干擾的不穩(wěn)定信息結構,因此難以設計出有效的輸出調(diào)節(jié)律[8].另一方面,在干擾滿足一定的有界性假設條件時,基于干擾觀測技術的復合控制策略可以有效地補償干擾對系統(tǒng)性能的影響,從而提升控制精度.這類方法已經(jīng)得到了學術界的廣泛關注,例如,文獻[9]提出了一系列基于主動抗干擾技術的控制策略,可用于解決系統(tǒng)(1)的精確跟蹤問題.針對一個具有穩(wěn)定零動態(tài)、可反饋線性化的非線性系統(tǒng),文獻[10]提出了一個擴張高增益觀測器,通過選取合適的觀測器增益,能夠實現(xiàn)標稱模型的性能恢復.基于誤差放大策略和雙極限齊次估計理論,文獻[11]給出了一個固定時間收斂的干擾觀測器.上述僅舉幾例,衍生出的理論及工程應用文章可見于文獻[12–15]等.
從反饋控制設計的角度來說,結合上述的干擾軟測量及前饋補償策略,基于反步法(或擴展反步法等)的遞歸控制設計策略是解決系統(tǒng)(1)的跟蹤控制問題較為常見的方法,如文獻[16–19]等.但是以此類遞歸方法來解決受擾系統(tǒng)的控制問題有一些明顯的弊端,主要可歸結于如下兩點:1)遞歸控制過程中產(chǎn)生的虛擬控制器包含了數(shù)量龐大且復雜的偏導數(shù)項,造成了所謂的“維數(shù)爆炸”問題,在高階系統(tǒng)的控制器設計過程中該現(xiàn)象尤為明顯,極大地增加了控制器的設計難度,導致工程上難以實現(xiàn).2)鑒于遞歸設計需要基于Lyapunov函數(shù)的遞歸分析,因此無法實現(xiàn)穩(wěn)定性分析與控制設計的本質性分離,這就容易造成設計參數(shù)或自適應更新機制選取較為復雜等問題.
為避免遞歸控制帶來的上述問題,針對非線性系統(tǒng)如何能夠提出一種簡潔易用的非遞歸控制設計框架成為了近年來控制領域的熱點.然而,現(xiàn)有文獻中,值得參考的相關工作還較少.例如當系統(tǒng)(1)中di=0,i ∈N1→n而存在模型參數(shù)不確定時,文獻[20]提出了一個自適應的輸出反饋設計思路,通過引入一個自適應調(diào)節(jié)的增益函數(shù),優(yōu)化了動態(tài)性能的同時,非遞歸的設計框架保證了設計過程的簡潔性.文獻[21]提出了一個帶有雙層自適應參數(shù)更新機制的控制律,結合自調(diào)節(jié)預測周期,提升了控制系統(tǒng)的動態(tài)性能,緩解了受控系統(tǒng)魯棒性冗余的問題.針對系統(tǒng)(1),通過結合主動抗擾技術與齊次系統(tǒng)理論,文獻[22]提出了一個簡潔有效的非遞歸有限時間精確跟蹤控制器設計方案.文獻[23]結合了神經(jīng)網(wǎng)絡和高增益干擾觀測技術,實現(xiàn)了非遞歸自適應的輸出反饋控制.而值得注意的是,上述文獻主要是在魯棒控制或自適應控制的單一視角下提出具體的控制設計方案,其在具有一定優(yōu)勢的同時,也存在一些難以解決的問題.一般而言,魯棒控制設計步驟較為簡單,但鑒于其保守的設計特性,通常在處理工況變換復雜的情況時,系統(tǒng)的動態(tài)性能難以得到保障.而相較于魯棒控制,自適應控制的設計過程稍顯復雜,同時響應受擾動的影響較大,但其處理復雜工況時,可以自適應調(diào)節(jié)控制帶寬以優(yōu)化控制系統(tǒng)的動態(tài)性能.那么從面向工程實用的角度來說,一個自然的猜想便是:在非遞歸控制的設計框架下,是否存在一種能夠融合魯棒控制與自適應控制的設計方案,可以通過切換一體化控制器的工作模式以應對各類型復雜工況? 簡而言之即是:針對系統(tǒng)不同的復雜工況,在控制律形式完全一致的情形下,僅需要切換帶寬因子的選取方式便能夠得到其魯棒或自適應控制律,并實現(xiàn)系統(tǒng)輸出軌跡的精確跟蹤.
為初步給出上述猜想的解決方案,本文針對系統(tǒng)(1),在非遞歸框架下,首次提出了魯棒/自適應融合的無靜差跟蹤控制策略.首先采用高階滑模干擾觀測器(higher order sliding mode disturbance observer,HOSMDO)對系統(tǒng)不匹配干擾項的各階導數(shù)信息進行精確估計,結合前饋補償技術實現(xiàn)在有限時間內(nèi)恢復不匹配受擾系統(tǒng)的性能;其次,通過求解一系列輸出調(diào)節(jié)方程及巧妙設計狀態(tài)變換函數(shù),給出系統(tǒng)化的非遞歸復合控制構建框架;隨后,分別在不同類型的工況下給出帶寬因子的配置方案,即對應魯棒/自適應控制律;最后,基于半全局穩(wěn)定性目標,本文分別給出了魯棒情形及自適應情形下閉環(huán)系統(tǒng)嚴格的穩(wěn)定性分析.相較于現(xiàn)有的相關方案,本文的主要貢獻可以概括為:
1) 結合前饋補償與反饋控制的設計思路,通過僅一步的坐標變換,本質實現(xiàn)了同框架下魯棒/自適應融合的一體化控制器構建.
2) 基于非遞歸控制設計框架,使控制器設計過程與穩(wěn)定性分析分離開來,本質上避免了遞歸控制方法中常見的“維數(shù)爆炸”的問題.同時,控制參數(shù)選取有簡潔明確的指導機制,更易于工程實現(xiàn).
本文旨在提出1個魯棒/自適應融合的非遞歸復合控制律,實現(xiàn)系統(tǒng)(1)的無靜差軌跡跟蹤控制目標,即首先,針對系統(tǒng)(1)做如下假設.
假設1輸出參考信號yr及其n階導數(shù)都是分段連續(xù),完全已知且有界的.
假設2干擾di(t)滿足i ∈N1→n,j ∈N0→n?i+1,且D是一個正常數(shù).
本文所提控制器是基于基準控制律u=U(L,K,x,x?),切換帶寬因子的選取法則,具體表述為
其中:K為系統(tǒng)的控制參數(shù),x?=為系統(tǒng)的穩(wěn)態(tài)參考信號,為與系統(tǒng)非線性項相關的中間估計量,L(·),ψ(·)為兩個恒正的函數(shù),具體表達式將在文章后續(xù)給出.L0表示帶寬因子L的初始值.
本節(jié)將逐步給出所提非遞歸融合控制器構建步驟.
假設系統(tǒng)(1)中的干擾項di完全已知且給定參考輸出yr時,定義輔助狀態(tài)變量=(?1?2··· ?i)T,i ∈N1→n+1,?i滿足以下等式:
注1值得一提的是現(xiàn)有文獻中有諸多干擾觀測器用以實現(xiàn)干擾軟測量,如非線性干擾觀測器(nonlinear disturbance observer,NDO),擴張狀態(tài)觀測器(extended state observer,ESO),廣義比例積分觀測器(generalized proportional integral observer,GPIO)等.與這些觀測器相比,本文所采用的HOSMDO僅需滿足假設2,而無需對干擾外源模型進行辨識,即可在有限時間內(nèi)獲取系統(tǒng)干擾及其高階導數(shù)的精確估計信息,便于后續(xù)設計的精確前饋解耦,從而有效地提高了閉環(huán)系統(tǒng)的收斂速度及跟蹤精度.
為了引入非遞歸控制框架,結合高增益控制技術,作如下形式的坐標變換:
其中:L可以是正常數(shù),也可以是一個滿足L0=1,˙L≥0的函數(shù),其設計規(guī)則在后續(xù)控制設計過程中給出,?>0為設計參數(shù),υ為中間控制器.
考慮L為動態(tài)增益時,定義矩陣P=PT>0,且(A ?BK)TP+P(A ?BK)≤?In,其中(A,B)為可控標準型矩陣對,K=(k1,k2···kn)是Hurwitz多項式H(s)=sn+knsn?1+···+k1的對應系數(shù),In為n階單位陣,Θ?diag{0,1,···,n ?1}.?滿足如下約束條件:
根據(jù)式(6),可得如下與式(1)等價的系統(tǒng)形式:
其中:
當L為靜態(tài)增益時,即式(7)中=0,L為一個充分大的定常帶寬因子,此時?可以為任意正常數(shù),同樣地,可以得出下列與式(1)等價的系統(tǒng)形式:
至此,無需遞歸化Lyapunov函數(shù)設計,本文已經(jīng)能夠給出系統(tǒng)(1)的非遞歸控制律.具體地,具有魯棒/自適應一體化融合結構的非遞歸控制器可以表述為如下形式,其設計流程可見于圖1.
其詳細證明可見于附錄.
注2顯而易見地,所提非遞歸魯棒/自適應融合控制是建立在同一個變換下,根據(jù)一步法提出的前饋補償加反饋控制結合的輸出調(diào)節(jié)控制策略,做到了控制器設計與穩(wěn)定性分析的本質分離.值得一提地,非遞歸自適應控制通過采用具有自調(diào)節(jié)能力的帶寬增益函數(shù),實現(xiàn)控制系統(tǒng)在不同工況下能夠達到無靜差跟蹤控制目標,進一步改進了控制器參數(shù)選取機制.
本文首先考慮一個簡單的二階系統(tǒng),其表達式如下所示:
其中d1,d2分別為系統(tǒng)的不匹配干擾與匹配干擾.為實現(xiàn)該系統(tǒng)的跟蹤控制目標,文獻[19]通過將非線性干擾觀測器與反步法相結合,提出一個主動抗干擾控制策略,其核心思想是將干擾估計值引入虛擬控制器的每一步設計過程中,在遞歸地彌補受擾系統(tǒng)性能的同時,實現(xiàn)高精度跟蹤控制目標.基于該文方法,其復合控制器可被表述為以下形式:
隨后,由所提的非遞歸一體化復合控制設計框架,首先利用HOSMDO對干擾進行估計,具體可描述為
隨后在控制器(12)形式保持不變的情況下,將L設計為動態(tài)模式,可以得到非遞歸自適應控制的雙層動態(tài)更新機制,具體可以表述為如下形式:
在后續(xù)仿真中,通過設定yr=1+0.5 cos(t+π/4)并選取干擾動態(tài)為d1=sin(0.5t+π/3),d2=cost+sin(0.5t),分別使用兩種不同的控制策略(遞歸與非遞歸算法),可以得到如下的仿真結果,如圖2(a)(b)所示.其中遞歸控制器參數(shù)為:[k1,k2,q1,q2]=[6,10,28,32].非遞歸控制器參數(shù)為:高階滑模干擾觀測器參數(shù):[l1,0,l1,1,l1,2,λ1]=[12,13,14,1],[l2,0,l2,1,λ2]=[12,13,1].魯棒控制器參數(shù):[k1,k2,L,?]=[25,18,3,1].自適應控制器參數(shù):[k1,k2,?]=[25,18,1].
從圖2(a)(b)可以看出,兩種控制策略都可以實現(xiàn)系統(tǒng)(10)的精確跟蹤控制目標.而值得關注的是:通過比較式(11)與式(12)–(13),可以清晰地看出控制律(12)–(13)具有更為簡潔的形式,且非遞歸控制器主要依賴與系統(tǒng)的標稱模型,而非線性項及其偏微分項等并不直接體現(xiàn)在控制律中,這與反步法等遞歸控制算法具有本質的區(qū)別.
圖2 遞歸控制與非遞歸控制的輸出響應及控制輸入曲線Fig.2 The output responses and control inputs of system controlled by recursive control law and non-recursive
本小節(jié)考慮一個單連桿機械手的無靜差跟蹤控制問題,用以闡明所提控制器的有效性.其具體包含了機電動態(tài)和干擾項,動態(tài)方程可表述為[25]
其中:q,,分別代表連接位置,速度及加速度.τ是由電氣系統(tǒng)產(chǎn)生的扭矩,τd1對應著扭矩干擾,為系統(tǒng)可測數(shù)據(jù)的測量誤差,u是系統(tǒng)的控制輸入,通常是指機電扭矩.D=1 kg·m2是機械慣量.B=1 N·m·s·rad?1為粘性摩擦系數(shù).N=10 是一個正常數(shù),其值與載荷質量與重力系數(shù)相關.M=1 H為電樞電抗.Hm=1.0 ? 是電樞電阻.Km=0.2 N·m·A?1為反電動勢系數(shù).
接下來,令x1=q,x2=,x3=τ,那么系統(tǒng)(14)可被改寫成下面的形式:
根據(jù)圖3和圖5可以清晰地看出,本文所提的控制器可以保證系統(tǒng)全狀態(tài)對應地無靜差跟蹤至其預期參考信號進一步地,通過對不同幅值的干擾進行比較,闡明了所提的非遞歸自適應控制器的增益更新機制,對于系統(tǒng)所受的大小信號干擾,L收斂的上界也會發(fā)生變化,這是由系統(tǒng)狀態(tài)軌跡與參考軌跡的誤差大小不同導致的,小信號干擾使上述誤差相對小,L的收斂值為2.18左右;而隨著干擾信號增大,L的收斂值又隨之變?yōu)榱?.48 左右;而對于一個幅值在二者之間的時變干擾,增益L又收斂至2.2左右.圖5(d)則表明相較于非遞歸魯棒控制,非遞歸自適應控制可以在消耗較低控制能量的情形下,即實現(xiàn)系統(tǒng)的控制目標.
圖3 常值干擾下單連桿機械手系統(tǒng)Fig.3 The response curves of one-link manipulator with constant disturbance cases
圖4 單連桿機械手系統(tǒng)時變干擾信號曲線Fig.4 The time-varying disturbance curves of one-link manipulator
圖5 時變干擾情況下單連桿機械手系統(tǒng)Fig.5 The state curves of one-link manipulator with time-varying disturbance case
注3對于參數(shù)選取,主要可遵循以下幾個原則或步驟:1)通過極點配置得出控制增益K,將閉環(huán)系統(tǒng)的極點配置至期望極點處.2)求線性矩陣不等式(A ?BK)TP+P(A?BK)≤?In,從而獲取正定對稱陣P.3)根據(jù)參數(shù)?的選取準則,確定其范圍.κ1,κ2,κ3,κ4則根據(jù)其對應的選取準則求出范圍,并通過“試錯法”,選取滿足性能指標要求的值.4)魯棒控制的增益L滿足充分大的條件,但是需要指出的是,隨著L的增大,系統(tǒng)可能會出現(xiàn)魯棒性冗余.因此,類似地使用“試錯法”,選擇滿足性能要求的L值.自適應控制情形下,L可在不同實際工況下自適應地收斂于不同的值,以此來緩解控制增益選取過大帶來的魯棒性冗余,并且提升控制系統(tǒng)的動態(tài)性能.
本文主要提出了一種針對含不匹配干擾的非線性系統(tǒng)的魯棒/自適應一體化非遞歸控制設計框架.相較于以往的結果,該非遞歸復合控制框架有以下的幾點貢獻:首先,所提復合控制律具有更為簡潔的表達形式和一定的可移植性,非線性項約束條件也更為寬松,設計思路更加多元.一步法的設計框架將控制器設計與穩(wěn)定性分析本質性分離開,極大地方便了工程實際應用.未來旨在解決多類型的非線性系統(tǒng)的跟蹤問題,例如對于離散系統(tǒng)、狀態(tài)受限的非線性系統(tǒng)等,運用本文所提控制框架,如何實現(xiàn)精確跟蹤.
附錄
為便于后續(xù)的穩(wěn)定性證明,首先提供一下引理.
緊接著,將對狀態(tài)η的有界性進行闡述.即是證明對于任意非零的初始狀態(tài)滿足η?(0)∈?η?,任意η(t)的軌跡將在?內(nèi).
為了更好地闡述,假設η(t)在系統(tǒng)漸近穩(wěn)定過程中出現(xiàn)逃逸.那么根據(jù)有限時間逃逸理論,存在一個時刻t1≥0,使得