孫晉坤 楊恒占
(西安工業(yè)大學(xué)電子信息工程學(xué)院 西安 710021)
實際工業(yè)生產(chǎn)過程中總是存在各種不確定性。除了噪聲的不確定性外,往往還存在測量設(shè)備參數(shù)的不確定性。在這種背景下,從20世紀(jì)70年代起,隨著計算機(jī)技術(shù)的快速發(fā)展,基于對偶控制思想的多模型對偶控制(Multi-Model Dual Control,MMDC)得到了深入的研究和發(fā)展[1~4]。多模型對偶控制根據(jù)系統(tǒng)的實際變化情況和控制要求,將系統(tǒng)在不同情況下的系統(tǒng)結(jié)構(gòu)和參數(shù)采用不同的辨識模型描述,針對各個子辨識模型分別設(shè)計對應(yīng)的子控制器[5],符合解決復(fù)雜問題的基本規(guī)律,因而受到國際控制界的廣泛重視和深入研究[6]。
現(xiàn)有的多模型統(tǒng)計特征控制大都屬于模型的組合切換方式,或多或少都存在著切換過程不夠平滑的問題。本文在系統(tǒng)參數(shù)的后驗概率加權(quán)方法的基礎(chǔ)上,將各個模型使用協(xié)調(diào)變量進(jìn)行融合歸一,利用歸一后的模型對系統(tǒng)進(jìn)行控制,改善了控制過程的平滑性。
其中,z(k)為n維狀態(tài)向量,u(k)為q維控制向量,y(k)為 p維量測向量,w(k)為n維過程噪聲,v(k)為 p維量測噪聲;h為n維非線性函數(shù),f為p維非線性函數(shù)。該系統(tǒng)中,f的參數(shù)均為全部未知或部分未知,或者雖然已知但是過于復(fù)雜,無法
考慮如下離散時間隨機(jī)系統(tǒng):用傳統(tǒng)方法進(jìn)行有效量測。
衡量控制器控制效果的性能指標(biāo)采用如下的加權(quán)二次型性能函數(shù):
為表述簡單,本文僅討論A、B、C為定常矩陣的情況。
式(2)中,k為控制時間,假定從0到N-1。對于隨機(jī)系統(tǒng)(1),在k時刻,可以收集到的信息集?k為
實際上,?k也是k時刻能夠知道的所有信息。因此,控制器u(k)約束為:u(k)=μk(?k)。
本文的目的就是確定一個形式為上式的控制函數(shù)u(k),使式(2)所表述的性能指標(biāo)J在統(tǒng)計意義下取得最小值,即:
本文采用一組子模型覆蓋被控系統(tǒng)的不同工作狀況。假設(shè)共有s個工作狀況,分別對應(yīng)s個子模型,則該組模型的數(shù)學(xué)描述如下:
MG={ }Mi|i=1,2,…,s
MG為s個子模型組成的集合。假設(shè)第i個子模型為
上式中,zi(k)為第i個子模型Mi的狀態(tài)向量,ui(k)為第i個子模型的控制向量;Ri為具有適當(dāng)維數(shù)的矩陣,表示不同工作狀況下量測系數(shù)。zi(k)的初始狀態(tài)為zi(0),zi(0)和過程噪聲w(k)、量測噪聲v(k)互不相關(guān)且都為高斯白噪聲,它們服從的分布特征分別為:zi(0)~N(zˉ0, F0)、w(k)~N(0 ,W ) 、v(k)~N(0 ,V ) 。
針對式(2)所示的性能指標(biāo) J,在第i個子模型已知的情況下,由于模型參數(shù)都是已知的,該問題就是標(biāo)準(zhǔn)的LQG控制問題,相應(yīng)的成熟解法已經(jīng)存在。但是,本文討論的問題存在著系統(tǒng)當(dāng)前量測參數(shù)未知即當(dāng)前子模型未知的困難。針對該困難,本文將各模型的后驗概率作為協(xié)調(diào)變量,凝聚出單一的融合模型,再使用LQG成熟方法得到合適的控制律u(k),使控制器既能辨識出合適的模型,又能保持良好的控制性能。
在k時刻,可以收集到的信息集為?k。假若時刻k系統(tǒng)的真實模型為第i個子模型,則狀態(tài)zi(k )基于 ?k的估計值 z?i(k |k)為
由Kalman濾波方程,z?i(k|k)的遞推式子為
其中
上式中,邊界條件為 z?i(0 |0)=z?(0)及Fi(0 |0)=F0。
k時刻系統(tǒng)的真實模型為第i個子模型Mi,根據(jù)動態(tài)規(guī)劃原理,由標(biāo)準(zhǔn)的LQG控制算法,最優(yōu)控制ui(·)的遞推式子為
其中
首先計算各子模型的后驗概率。假設(shè)第i個子模型Mi在k時刻的后驗概率為 ρki,即
其中
在初始k=0時刻,對每個模型的偏好是一樣的。在k時刻,各個子模型對應(yīng)的各自的濾波器并行工作,因此能夠得到各自的后驗概率。
令
考慮如下最優(yōu)控制問題:
對于該最優(yōu)控制問題來說,其系統(tǒng)模型就是通過后驗概率將模型集MG中各個子模型凝聚而成的融合模型。
針對該單一融合模型,本文利用Bellman動態(tài)規(guī)劃思想求解控制律u(k)。令
轉(zhuǎn)換上式形式,有
且
劃方程。式(21)對應(yīng)的最優(yōu)控制律u(k)為
其中
相關(guān)遞推式子的初始值為S(N)=A??刂圃鲆鍷(k)采用動態(tài)規(guī)劃的方法獲得。
考慮如式(5)所示隨機(jī)系統(tǒng),兩個子模型分別為
控制總步數(shù)N為100。在時間1~50內(nèi),系統(tǒng)的真實模型為M1;在時間51系統(tǒng)的真實模型發(fā)生突變,由子模型M1切換到子模型M2,且一直保持到到 時 間 100。 其 中 μ(x),η(x)=0.242exp(x-0.5x2),初始狀態(tài)x(0)~N(0.5 ,?0.25) 。性能指標(biāo)函數(shù)為
與最優(yōu)控制進(jìn)行比較,如圖1所示??梢钥闯鲭m然多模型控制的性能指標(biāo)比最優(yōu)控制要差一些,主要是模型辨識階段性能指標(biāo)較差,但在對真實模型的辨識基本完成后,兩者的性能指標(biāo)變化趨勢基本一致。
圖1 多模型低階統(tǒng)計特征對偶控制與最優(yōu)控制
本文分析了參數(shù)未知多模型系統(tǒng)的參數(shù)辨識和控制問題,應(yīng)用分解-協(xié)調(diào)思想,提出了一種多模型對偶控制方法。該方法體現(xiàn)了對偶控制參數(shù)學(xué)習(xí)與目標(biāo)跟蹤的雙重作用,也改善了子模型硬切換導(dǎo)致的系統(tǒng)震蕩問題。用后驗概率把多個子模型融合為單一模型,具有明顯的優(yōu)點。