程福亨, 龍達峰
(惠州學院 電子信息與電氣工程學院,廣東 惠州 516007)
調(diào)節(jié)器設計是控制領域的基本問題,經(jīng)過幾十年發(fā)展,相關理論和方法日漸完善[1-2].隨著優(yōu)化控制的發(fā)展,線性二次調(diào)節(jié)器(Linear quadratic regulator, LQR)設計理論為調(diào)節(jié)器設計提供了一種很好的方案.最近十幾年,不少研究圍繞改進現(xiàn)有的調(diào)節(jié)器設計方法或者把這些方法應用于某些特殊系統(tǒng)[3-5].在離散時間線性系統(tǒng)的LQR設計理論中,優(yōu)化目標是各時刻狀態(tài)、輸入的二次函數(shù)之和,因此不能用于優(yōu)化諸如最大狀態(tài)范數(shù)等單個值的情況.
超調(diào)量最早見于經(jīng)典控制理論,并被用于度量階躍跟蹤時最大輸出與最終輸出的差相對最終輸出的大小,人們曾經(jīng)對線性系統(tǒng)階躍跟蹤時的超調(diào)優(yōu)化問題進行了大量研究[6-11].在調(diào)節(jié)器設計中,對于任意非零初態(tài),要求設計合適的控制輸入,使得系統(tǒng)狀態(tài)逐漸趨近于原點.顯然,從0時刻開始趨于原點的過程中,系統(tǒng)狀態(tài)的范數(shù)一般呈現(xiàn)非單調(diào)變化.若把此過程中狀態(tài)最大范數(shù)與初始狀態(tài)范數(shù)之比稱為系統(tǒng)狀態(tài)調(diào)節(jié)過程中的超調(diào)量,并作為優(yōu)化目標,這是完全不同于LQR設計方案和跟蹤控制的超調(diào)優(yōu)化問題,并且具有理論和實際意義.
近年來,復雜非線性系統(tǒng)的優(yōu)化問題是一個研究熱點[12-14].但是,線性系統(tǒng)的優(yōu)化問題仍是基本問題,并在一定意義上有助于非線性系統(tǒng)優(yōu)化研究.本文在研究固定α法特性的基礎上,把該方法應用于離散時間線性時不變系統(tǒng)狀態(tài)調(diào)節(jié)過程中的超調(diào)優(yōu)化,并給出了相應的設計過程.隨著狀態(tài)的演變,對于不同的當前狀態(tài),若α取使得下個時刻狀態(tài)范數(shù)最小的值,或許可以進一步優(yōu)化狀態(tài)超調(diào)量,從而提出了動態(tài)α法,并且,以一類4階系統(tǒng)為例,研究了采用動態(tài)α法必然比采用固定α法可以獲得更小超調(diào)的數(shù)學條件.
文中用到的符號說明如下:
?:實數(shù)集;
?n:n維實向量集或n×1實矩陣集;
?n×n:n×n實矩陣集;
PT:矩陣P的轉置矩陣;
P-1:可逆矩陣P的逆陣;
xT:向量x∈?n的轉置向量;
xi: 向量x∈?n的第i個分量;
‖x‖:向量x的2-范數(shù);
0:合適維數(shù)各元素都為0的列向量;
E:合適階數(shù)的單位矩陣.
考慮下式描述的n-階單輸入可控離散時間線性時不變系統(tǒng):
其中,x k ∈?n是系統(tǒng)狀態(tài),u k ∈?是系統(tǒng)輸入,A∈?n×n和B∈?n×1分別是系統(tǒng)矩陣和輸入矩陣.
我們用狀態(tài)2-范數(shù)度量系統(tǒng)(1)狀態(tài)調(diào)節(jié)期間的超調(diào)量.由于2-范數(shù)的齊次性,只需要考慮n維單位球面上初態(tài)的超調(diào)量,則系統(tǒng)(1)在狀態(tài)調(diào)節(jié)期間的狀態(tài)超調(diào)優(yōu)化設計問題描述如下:
對于n維單位球面上的給定初態(tài)x 0 ,設計一個控制輸入u k ,使得系統(tǒng)狀態(tài)向原點趨近過程中的最大狀態(tài)2-范數(shù)最小化,即
定義1 對于某個給定的初態(tài)x 0 ,如果有一個控制輸入u kx0,使得
則稱系統(tǒng)(1)在初態(tài)x 0 可以無狀態(tài)超調(diào);否則,稱 η-1 ×100%為系統(tǒng)在初態(tài)x 0 的狀態(tài)超調(diào)量,所有的無超調(diào)初態(tài)形成系統(tǒng)的無超調(diào)區(qū)域,如果系統(tǒng)的無超調(diào)區(qū)域覆蓋整個狀態(tài)空間,則系統(tǒng)是狀態(tài)無超調(diào)的,否則稱
為系統(tǒng)的狀態(tài)超調(diào)量.
對于系統(tǒng)(1),令
其中,μ1、μ2、…,μn-1是如下特征多項式的系數(shù),
其中
直接計算可知:
進一步,如果
因此,控制輸入(8)使得系統(tǒng)狀態(tài)2-范數(shù)隨著時間廣義單調(diào)遞減. 隨后,把這個方法稱為固定α法.
為了設計一個控制輸入使得狀態(tài)調(diào)節(jié)過程中的超調(diào)量盡可能小,下面研究固定α法的一些特性.
定理1對于一個n階系統(tǒng)(1),自0時刻起,如果每n個連續(xù)時刻視為一個周期,那么2個相鄰周期相應時刻的狀態(tài)2-范數(shù)具有如下關系
證明:顯然,
同時,把控制輸入(8)式代入系統(tǒng)的可控標準型(5)式,可得,
把式(11)代入式(10)并簡化即得結論. 證畢.
根據(jù)定理1,當k→+∞時,‖x k ‖的最大值必然出現(xiàn)在k∈ 0,1,…,n-1 . 因此,為了使得系統(tǒng)(1)在狀態(tài)調(diào)節(jié)期間的狀態(tài)超調(diào)最小,只需
定理2對于一個給定初態(tài)x 0 ,如果系統(tǒng)(1)的控制輸入如式(8)所示,那么當k=1,2,…,n-1時,‖x k ‖2是常數(shù),或者是關于α的開口向上的二次函數(shù).
證明:根據(jù)向量的加法特性,有
因此,
對于給定系統(tǒng)及初態(tài),akTPTPak、akTPTPbk和bkTPTPbk都是常數(shù),因此,從數(shù)學形式上看,‖x k ‖2是關于α的開口向上的二次函數(shù).
同時,對于給定的非零初態(tài)x 0 ,xˉ 0 =P-1x 0 也是非零向量.
此外,由于矩陣PTP正定,則這些二次函數(shù)的圖像開口都向上. 證畢.
結合固定α法及其性質,可以構造出系統(tǒng)(1)的一種狀態(tài)超調(diào)優(yōu)化設計方案.
對于給定的系統(tǒng)(1)及初態(tài)x 0 , ‖x 0 ‖2隨之確定,但是,當k∈ 1,2,…,n-1 時,‖x k ‖2是一個常數(shù)或者關于α的二次函數(shù). 如果存在某個α,使得
則根據(jù)定義1和定理1,系統(tǒng)在狀態(tài)調(diào)節(jié)期間一直無超調(diào).
如果
那么系統(tǒng)對于初態(tài)x 0 必然存在調(diào)節(jié)超調(diào)量. 在這種情況下,為了實現(xiàn)最小超調(diào),α應該取使得
綜合上述分析,可以給出基于固定α法的狀態(tài)超調(diào)優(yōu)化設計步驟如下:
步驟1:對于給定初態(tài)x 0 ,依次算出‖x k ‖的表達式,其中k∈ 1,2,…,n-1 .
步驟2:根據(jù)定理2,有如下2種情況:
情況(i):當α∈Θ1? -1,1 時,‖x k ‖2≤‖x 0 ‖2成立,則系統(tǒng)(1)在初態(tài)x 0 下采用式(8)所示的控制輸入時無超調(diào). 此時,為了使得狀態(tài)盡快收斂,取|α|盡量小的α值.
情況(ii):
成立,則該初態(tài)時系統(tǒng)(1)采用式(8)所示的控制輸入時存在超調(diào). 此時,為使得狀態(tài)盡快收斂,也取|α|盡量小的α值.
步驟3:把步驟2中得到的α代入式(8),即得到實現(xiàn)超調(diào)優(yōu)化的控制輸入.
在步驟2中,直接人工確定Θ1、Θ2和找到最優(yōu)的α頗有難度,Matlab軟件提供的多目標優(yōu)化函數(shù)fminimax可以方便的用于解決這個問題. 但是在使用fminimax時必須特別注意,該函數(shù)是在閉區(qū)間[-1,1]上搜索最優(yōu)的α,如果找到的最優(yōu)α為1或者-1,此時盡管采用式(8)所示的控制輸入使得超調(diào)最小,但是狀態(tài)2-范數(shù)呈現(xiàn)等幅振蕩,這顯然是不合期望的,因此,式(8)中的α應該取接近于所搜索到的1或者-1,但是絕對值稍微小于1的數(shù),這將使得系統(tǒng)超調(diào)稍微增加一些,但是能保證狀態(tài)最終向原點收斂.
在固定α法中,參數(shù)α的值與初態(tài)密切相關,并且在整個狀態(tài)調(diào)節(jié)期間是常數(shù). 通常,狀態(tài)隨著時間演變,在不同的當前狀態(tài),如果式(8)所示的控制輸入中的α取使得下一時間狀態(tài)2-范數(shù)最小的值,系統(tǒng)狀態(tài)超調(diào)可能進一步下降,而且系統(tǒng)狀態(tài)可能更快收斂,這個方法稱為動態(tài)α法. 顯然,該法屬于“貪婪算法”. 下面以四階可控系統(tǒng)為例來討論在什么情況下,動態(tài)α法可以比固定α法獲得更小的狀態(tài)超調(diào)量.
對于一個給定的四階可控系統(tǒng)及初態(tài)x 0 ,令αc表示采用固定α法時參數(shù)α的值,‖x k ‖2表示固定α法中k時刻狀態(tài)2-范數(shù)的平方,而αk和則依次表示采用動態(tài)α法時k時刻參數(shù)α的值和該時刻狀態(tài)2-范數(shù)的平方. 則有
根據(jù)αc和α1的定義,可得,
對于四階可控系統(tǒng),有如下計算結果,
在固定α法中,‖x k ‖2是常數(shù)或者關于α0的二次函數(shù).根據(jù)定理2的證明過程可知,‖x k ‖2是常數(shù),當且僅當0 =0 =…=0 =0,并且,如果‖x k ‖2是常數(shù),則當i=1,2,…,k-1時,‖x i ‖2都是常數(shù).
假設1:p14=p34=0,|p24|<|p44|.
根據(jù)實對稱正定矩陣的性質,p44>0. 當k=1,2,…,6時,的對稱軸依次為,
據(jù)以上規(guī)律,當k≥7時,可以猜想出αk的表達式,并用數(shù)學歸納法證明,在此省略.
命題1在假設1的條件下,
證明:對于任意給定的初始狀態(tài)x 0 , 根據(jù)式(21)可以得到α1和α2. 令,根據(jù)假設1,|β|<1. 當k=1,2,…時,令αk與αk+2相乘,可得αk+2=-β2∈ -1,0 . 證畢.
在固定α法中,為了使得狀態(tài)2-范數(shù)收斂到原點,αc∈ -1,1 是個常數(shù). 然而在動態(tài)α法中,參數(shù)αk隨著當前狀態(tài)發(fā)生變化, 其中一些|αk|可能大于或者等于1,但是不可能所有的|αk|都大于或者等于1,正如上面推導所示,|α1|和|α2|可能大于或等于1,而當k≥3時,|αk|∈ -1,1 , 這是隨后命題3證明中用到的一個關鍵條件.
假設2:p13==p23=p24=p33=0,-2p24α02β2-p22α02+p22β4≤2p24α0β2.
命題2在假設1和假設2的條件下,
證明:根據(jù)式(16)和假設1,可得
并且,此時假設2中的不等式變?yōu)?/p>
假設3:p12=0, p44β2-2p24β+p11>0.
命題3在假設2和假設3的條件下,當k≥3時,
證明:首先,當k≥3時,一方面,在命題1中,已經(jīng)證明,αk=-β2∈ -1,1 是常數(shù),另一方面,根據(jù)定理1,此時. 因此,只需要證明當k=3,4,5,6時命題中的不等式成立. 令ρ=p44β2-2p24β+p11, 可依次算得如下結果,
式(28)~(29)子等號右側部分都大于或者等于0,因此,當k≥3時,. 證畢.
綜合命題2和命題3,可得
可見,對于滿足以上3個假設的四階可控系統(tǒng),動態(tài)α法比固定α法可以獲得更小的調(diào)節(jié)超調(diào)量.
考慮具有如下系統(tǒng)矩陣和輸入矩陣的系統(tǒng)(1),對于本系統(tǒng),對應的PTP為
不難驗證,3個假設都成立,對于如下2個給定初態(tài),
依次采用固定α法和動態(tài)α法時的控制輸入和狀態(tài)-2范數(shù)分別如圖1、圖2所示,可見,對于這2個初態(tài),動態(tài)α法都比固定α法可以獲得更小的調(diào)節(jié)超調(diào)量.并且,對于初態(tài)x 02,為了獲得小的調(diào)節(jié)超調(diào)量,固定α法使得狀態(tài)2-范數(shù)呈現(xiàn)等幅振蕩,而動態(tài)α法不僅獲得更小的超調(diào)量,還能使得狀態(tài)快速收斂.
圖1 初態(tài)為x 0 1時的控制輸入及狀態(tài)2-范數(shù)演變過程
圖2 初態(tài)為x 0 2時的控制輸入及狀態(tài)2-范數(shù)演變過程
對于離散時間線性時不變系統(tǒng)的調(diào)節(jié)超調(diào)量優(yōu)化問題,固定α法具有一些非常漂亮的特性,基于這些特性可以設計出調(diào)節(jié)超調(diào)量優(yōu)化的控制輸入.盡管動態(tài)α法是一種“貪婪算法”,但是對于滿足一定條件的四階可控系統(tǒng),動態(tài)α法在降低調(diào)節(jié)超調(diào)量和提高收斂的快速性方面優(yōu)于固定α法.