楊恒占,高 韻,錢富才
(1.西安工業(yè)大學(xué) 電子信息工程學(xué)院,西安710021;2.西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,西安710048)
?
雙重不確定系統(tǒng)對(duì)偶控制與RLS辨識(shí)控制比較分析
楊恒占1,高 韻1,錢富才2
(1.西安工業(yè)大學(xué) 電子信息工程學(xué)院,西安710021;2.西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,西安710048)
為了辨識(shí)雙重不確定性系統(tǒng)未知參數(shù),跟蹤系統(tǒng)目標(biāo)輸出值,本文對(duì)未知參數(shù)隨機(jī)系統(tǒng)分別進(jìn)行了對(duì)偶控制和最小二乘(RLS)辨識(shí)控制.提出了雙重不確定隨機(jī)系統(tǒng)對(duì)偶控制和最小二乘辨識(shí)控制策略.通過(guò)雙重不確定隨機(jī)系統(tǒng)仿真,比較分析了對(duì)偶控制和最小二乘辨識(shí)控制策略的性能.結(jié)果表明:該對(duì)偶控制策略用于雙重不確定性隨機(jī)系統(tǒng)參數(shù)辨識(shí)時(shí)實(shí)時(shí)性和穩(wěn)定性優(yōu)于最小二乘辨識(shí)控制;隨機(jī)系統(tǒng)在運(yùn)行過(guò)程中未知參數(shù)變化時(shí),對(duì)偶控制策略仍可有效跟蹤系統(tǒng)目標(biāo)輸出值,且對(duì)偶控制跟蹤誤差和切換之前保持一致,而RLS辨識(shí)控制不能有效跟蹤系統(tǒng)目標(biāo)輸出值,跟蹤失效.
雙重不確定系統(tǒng);對(duì)偶控制;辨識(shí)控制;實(shí)時(shí)性
隨著生產(chǎn)系統(tǒng)愈加復(fù)雜,不確定性增加,分析和研究系統(tǒng)所建立的數(shù)學(xué)模型也愈加困難.事實(shí)上,生產(chǎn)過(guò)程的數(shù)學(xué)模型都只是實(shí)際系統(tǒng)運(yùn)行過(guò)程的近似[1],不僅受到隨機(jī)噪聲干擾,而且系統(tǒng)模型本身也可能存在不確定性,即系統(tǒng)存在雙重不確定性.對(duì)于雙重不確定性系統(tǒng),需要對(duì)模型中未知參數(shù)進(jìn)行辨識(shí),對(duì)采集到的信息進(jìn)行一定的算法處理,構(gòu)造出最接近實(shí)際的模型.對(duì)于雙重不確定性系統(tǒng),傳統(tǒng)方法首先對(duì)系統(tǒng)進(jìn)行激勵(lì),收集系統(tǒng)運(yùn)行信息,然后對(duì)收集的信息進(jìn)行處理,辨識(shí)出未知參數(shù),最后再依據(jù)辨識(shí)結(jié)果進(jìn)行控制.在這個(gè)過(guò)程中,冀望不僅通過(guò)辨識(shí)參數(shù)來(lái)減少系統(tǒng)的不確定性,而且能有效跟蹤目標(biāo)[2-4].因此,迫切需要尋找一種有效的控制方法,把對(duì)參數(shù)進(jìn)行辨識(shí)的學(xué)習(xí)系統(tǒng)與對(duì)系統(tǒng)進(jìn)行目標(biāo)跟蹤的控制系統(tǒng)結(jié)合起來(lái)作為整體進(jìn)行考慮.文獻(xiàn)[5]提出對(duì)偶控制思想:跟蹤理想輸出;學(xué)習(xí)未知參數(shù).由于控制系統(tǒng)要求控制量要盡可能的小以獲得好的控制效果,而學(xué)習(xí)系統(tǒng)則要求控制量要盡可能的大以對(duì)系統(tǒng)的狀態(tài)和參數(shù)進(jìn)行有效辨識(shí),兩種作用互相沖突.因此需要在控制與辨識(shí)之間實(shí)現(xiàn)權(quán)衡[6-9],文獻(xiàn)[10]通過(guò)引入新息序列方差的方法,在控制和辨識(shí)方面有良好的權(quán)衡,而學(xué)習(xí)因子具有開(kāi)環(huán)特性,因此受到一定限制.文獻(xiàn)[11]對(duì)各種次優(yōu)對(duì)偶控制方法進(jìn)行了分析,取得了一定成果.由于把控制時(shí)間分割為若干個(gè)單一的階段,控制器具有主動(dòng)學(xué)習(xí)性能.為了闡明對(duì)偶控制的良好性能,本文針對(duì)雙重不確定性隨機(jī)系統(tǒng),在系統(tǒng)參數(shù)發(fā)生變化的情況下,分別采用遞推最小二乘(Recursive Least Square,RLS)辨識(shí)控制和對(duì)偶控制,通過(guò)雙重不確定隨機(jī)系統(tǒng)仿真,對(duì)最小二乘辨識(shí)控制和對(duì)偶控制策略的性能進(jìn)行比較分析,以實(shí)現(xiàn)雙重不確定性系統(tǒng)未知參數(shù)的辨識(shí),系統(tǒng)目標(biāo)輸出值的跟蹤.
1.1 問(wèn)題描述
考慮如下離散隨機(jī)動(dòng)態(tài)系統(tǒng)
C(z-1)x(k+1)=D(z-1)u(k)+e(k+1)
(1)
式中:u(k)為控制量;x(k)為系統(tǒng)輸出;e(k)為高斯白噪聲;k為離散時(shí)間;α1,α2,…,αn,β0,β1,…,βn為系統(tǒng)參數(shù);C(z-1)和D(z-1)為n階多項(xiàng)式,z-1為系統(tǒng)的延遲函數(shù),且有
C(z-1)=1+α1z-1+α2z-2+…+αnz-n;
D(z-1)=β0+β1z-1+β2z-2+…+βnz-n
當(dāng)系統(tǒng)參數(shù)已知時(shí),只有一種不確定性,即系統(tǒng)外部噪聲帶來(lái)的不確定性.若系統(tǒng)中存在未知參數(shù),或運(yùn)行過(guò)程中參數(shù)發(fā)生變化,系統(tǒng)就具備了雙重不確定性特征:①不受控制的系統(tǒng)外部噪聲;②系統(tǒng)中可通過(guò)學(xué)習(xí)進(jìn)行逼近的未知參數(shù).本文考慮具有雙重不確定性的系統(tǒng),控制器設(shè)計(jì)既要能夠?qū)ξ粗獏?shù)進(jìn)行辨識(shí)學(xué)習(xí),又要能夠跟蹤控制目標(biāo).
考慮離散隨機(jī)動(dòng)態(tài)系統(tǒng)最優(yōu)跟蹤控制問(wèn)題,即
(2)
式中:J為系統(tǒng)性能指標(biāo);xr(k+1)為系統(tǒng)設(shè)定的目標(biāo)值,不失一般性,取值為零;E(·)為期望.對(duì)離散隨機(jī)動(dòng)態(tài)系統(tǒng),控制器在k時(shí)刻除了知道系統(tǒng)的先驗(yàn)信息,k時(shí)刻之前系統(tǒng)的控制量{u(0),u(1),…,u(k-1)}也可知道,以及直到k時(shí)刻的測(cè)量量{x(1),x(2),…,x(k)}.這些信息是控制器在k時(shí)刻進(jìn)行設(shè)計(jì)的基礎(chǔ),可記為以下集合形式,即
I(k)={u(0),…,u(k-1),x(1),…,x(k)}
其中I(k)為系統(tǒng)的信息集合.
對(duì)于動(dòng)態(tài)未知隨機(jī)系統(tǒng),分別采用RLS辨識(shí)控制方法和對(duì)偶控制方法求控制量u(k),使性能指標(biāo)J最?。?/p>
1.2 RLS辨識(shí)控制
辨識(shí)控制通過(guò)最小二乘方法辨識(shí)出未知參數(shù)的估計(jì)值,把辨識(shí)出的參數(shù)替代未知參數(shù),系統(tǒng)成為已知系統(tǒng),再使用常規(guī)隨機(jī)控制方法進(jìn)行控制.最小二乘辨識(shí)過(guò)程中,通過(guò)偽隨機(jī)序列對(duì)系統(tǒng)進(jìn)行激勵(lì),根據(jù)系統(tǒng)輸出信息對(duì)未知參數(shù)進(jìn)行辨識(shí).
用最小二乘法對(duì)未知參數(shù)進(jìn)行辨識(shí),系統(tǒng)可改寫為
(3)
θ=[α1,…,αn,β0,…,βn]T.
用偽隨機(jī)序列產(chǎn)生N個(gè)輸入信號(hào)u(k)(k= 0,1,…,N-1),依次施加到實(shí)際系統(tǒng)上,測(cè)量系統(tǒng)對(duì)應(yīng)的輸出,可得
xN=ΦNθ+eN
(4)
式中:ΦN為辨識(shí)信息矩陣;xN為輸出矩陣;eN為高斯白噪聲矢量;N為辨識(shí)總次數(shù),且有
xN=[x(1),x(2),…,x(N)]T;
eN=[e(1),e(2),…,e(N)]T.
已知xN和ΦN,求θ使估計(jì)準(zhǔn)則H最小,即
參數(shù)估計(jì)值為
(5)
(6)
其中f0,f1,…,fn為最小方差控制的系數(shù).
RLS辨識(shí)控制把對(duì)未知參數(shù)的辨識(shí)學(xué)習(xí)和對(duì)系統(tǒng)的目標(biāo)跟蹤分為完全隔離的兩個(gè)階段,第一階段進(jìn)行單純的參數(shù)辨識(shí),第二階段則依據(jù)辨識(shí)的結(jié)果進(jìn)行單純的目標(biāo)跟蹤控制.
1.3 對(duì)偶控制
對(duì)偶控制能夠在對(duì)系統(tǒng)未知參數(shù)進(jìn)行辨識(shí)的同時(shí),對(duì)目標(biāo)進(jìn)行跟蹤.對(duì)偶控制原理如下:①給未知參數(shù)賦初值,系統(tǒng)運(yùn)行產(chǎn)生輸出;②根據(jù)系統(tǒng)輸入、輸出信息通過(guò)卡爾曼濾波對(duì)參數(shù)進(jìn)行辨識(shí);③用辨識(shí)的參數(shù)設(shè)計(jì)控制器對(duì)系統(tǒng)進(jìn)行控制;④重復(fù)②、③步驟.
系統(tǒng)模型由差分形式轉(zhuǎn)化成狀態(tài)方程,即
(7)
式中:x(k+1)為系統(tǒng)輸出;Φ(k)為控制信息;y(k+1)為系統(tǒng)參數(shù);e(k+1)為高斯白噪聲.且有
Φ(k)=[u(k),…,u(k-m),-x(k),…,-x(k-n)];
y(k)=[β0(k),β1(k),…,βn(k),α1(k),α2(k),…,αn(k)]T;其中β0(k),β1(k),…,βn(k),α1(k),α2(k),…,αn(k)為系統(tǒng)未知參數(shù).
通過(guò)Kalman濾波,可得狀態(tài)方程中參數(shù)y(k)的遞推估計(jì)為
(8)
為系統(tǒng)實(shí)現(xiàn)一邊控制,一邊學(xué)習(xí),根據(jù)動(dòng)態(tài)規(guī)劃方程,對(duì)性能指標(biāo)加入學(xué)習(xí)權(quán)重λ(k),且大于1,則性能指標(biāo)為
(9)
對(duì)式(9)求導(dǎo)容易得出最小性能指標(biāo),因此,使得性能指標(biāo)最小的控制量為
(10)
單輸入-單輸出隨機(jī)系統(tǒng)為
x(k)+α1x(k-1)+α2x(k-2)=β0u(k-1)+β1u(k-2)+e(k)
(11)
式中:e(k)為高斯白噪聲,且e(k)~N(0,0.05);定義Ω為參數(shù)集合,且有
Ω={β0,β1,α1,α2}.
假定系統(tǒng)參數(shù)真值在20步發(fā)生切換:
20步前參數(shù)真值Ω1={1,0.5,-1.7,0.7};
20步后參數(shù)真值Ω2={0.5,-1,1,-1}.
2.1 RLS辨識(shí)控制仿真
采用最小二乘對(duì)參數(shù)進(jìn)行辨識(shí),經(jīng)過(guò)20步后對(duì)參數(shù)辨識(shí)的結(jié)果見(jiàn)表1.可以看出辨識(shí)結(jié)果已經(jīng)接近真值.圖1為對(duì)目標(biāo)值的跟蹤控制情況.在系統(tǒng)參數(shù)切換前,通過(guò)最小方差控制對(duì)其進(jìn)行控制,可以看出,系統(tǒng)輸出值很快趨近目標(biāo)值.第20步參數(shù)發(fā)生切換,由于系統(tǒng)運(yùn)行過(guò)程中仍然使用最初的辨識(shí)參數(shù)值,最小方差控制最小方差控制無(wú)法對(duì)系統(tǒng)進(jìn)行有效的控制.
2.2 對(duì)偶控制仿真
圖2為對(duì)偶控制對(duì)未知參數(shù)的辨識(shí),其中實(shí)線是參數(shù)真值,虛線是系統(tǒng)參數(shù)辨識(shí)值.由圖2可以看出,在系統(tǒng)參數(shù)切換前,參數(shù)辨識(shí)值逐漸逼近參數(shù)真值;系統(tǒng)參數(shù)切換后,參數(shù)辨識(shí)值仍然能夠逐漸逼近真值.
表1 最小二乘參數(shù)辨識(shí)結(jié)果
Tab.1Parameteridentificationresultsofrecursiveleastsquares
參數(shù)值β0β1α1α2辨識(shí)值1.0910.521-1.6950.695真值1.0000.500-1.7000.700
圖1 RLS辨識(shí)控制目標(biāo)跟蹤
圖2 對(duì)偶控制參數(shù)辨識(shí)
圖3為對(duì)目標(biāo)值的跟蹤控制情況.在系統(tǒng)參數(shù)切換前,系統(tǒng)輸出值經(jīng)過(guò)短暫動(dòng)蕩后(對(duì)應(yīng)參數(shù)辨識(shí)最初階段)很快趨近目標(biāo)值.第20步參數(shù)發(fā)生切換后,系統(tǒng)輸出值經(jīng)過(guò)短暫動(dòng)蕩后(對(duì)應(yīng)新參數(shù)辨識(shí)最初階段)很快又趨近目標(biāo)值.RLS辨識(shí)控制盡管在系統(tǒng)新啟動(dòng)情況下初期階段控制效果好于對(duì)偶控制,但是付出的是前期系統(tǒng)專用于參數(shù)辨識(shí)的代價(jià),系統(tǒng)運(yùn)行過(guò)程匯總參數(shù)發(fā)生漂移或切換,就無(wú)法達(dá)到控制目標(biāo).而無(wú)論是系統(tǒng)新啟動(dòng)或參數(shù)發(fā)生切換時(shí),對(duì)偶控制均能夠重新調(diào)整控制策略,對(duì)控制目標(biāo)進(jìn)行良好跟蹤.
圖3 對(duì)偶控制系統(tǒng)目標(biāo)跟蹤
1) 本文針對(duì)雙重不確定性隨機(jī)系統(tǒng),分別進(jìn)行對(duì)偶控制和遞推最小二乘辨識(shí)控制,提出了雙重不確定隨機(jī)系統(tǒng)對(duì)偶控制和最小二乘辨識(shí)控制策略.仿真實(shí)驗(yàn)表明,該控制策略穩(wěn)定性、實(shí)時(shí)性優(yōu)于傳統(tǒng)辨識(shí)控制.
2) 系統(tǒng)在運(yùn)行過(guò)程中參數(shù)發(fā)生突變時(shí),對(duì)偶控制可進(jìn)行系統(tǒng)參數(shù)有效辨識(shí),而RLS辨識(shí)控制難以有效跟蹤系統(tǒng)目標(biāo)輸出值.
3) 文中針對(duì)線性系統(tǒng),而對(duì)于非線性系統(tǒng)的未知參數(shù)辨識(shí)和目標(biāo)輸出值跟蹤誤差還有待深入研究和討論.
[1]PIEREL,MICHAELA,DAVIDAK.SomePropertiesoftheDualAdaptiveStochasticControlAlgorithm[J].IEEETransonAutomaticControl,1981,26(2):1001.
[2]TSEE,BARS.AnActiveAdaptiveControlforLinearSystemswithRandomParametersviaDualControlApproach[J].IEEETransonAutomaticControl,1973,18(11):109.
[3]FELDBAUMAA.DualControlTheory:I[J].AutomationandRemoteControl,1960,21(2):874.
[4]FELDBAUMAA.DualControlTheory:II[J].AutomationandRemoteControl,1960,21(3):1033.
[5]FELDBAUMAA.DualControlTheory:III[J].AutomationandRemoteControl,1961,22(2):12.
[6]QIANFC,XIEG,LIUD,etal.OptimalControlofLQGProblemwithanExplicitTrade-offBetweenMeanandVariance[J].InternationalJournalofSystemsScience,2011,42(2):1957.
[7]LID,QIANFC,FUPL.VarianceMinimizationApproachforaClassofDualControlProblems[J].IEEETransAutomaticControl,2002,47(12):2010.
[8]BRIANDO.Twenty-fiveSeminalPapersinControl[J].IEEEControlSystemsMagazine,2002,20(1):69.
[9] 郭尚來(lái).隨機(jī)控制[M].北京:清華大學(xué)出版社,1999.
GUOShanglai.RandomControl[M].Beijing:TsinghuaUniversityPress,1999.(inChinese)
[10] 李鵬波,胡德文.系統(tǒng)辨識(shí)基礎(chǔ)[M].北京:中國(guó)水利水電出版社,2006.
LIPengbo,HUDewen.SystemIdentificationBasis[M].Beijing:ChinaWaterConservancyandHydropowerPress,2006.(inChinese)
[11] 鄭大鐘.線性系統(tǒng)理論[M].北京:清華大學(xué)出版社,2002.
ZHENGDazhong.TheLinearSystemTheory[M].Beijing:TsinghuaUniversityPress,2002.
(inChinese)
(責(zé)任編輯、校對(duì) 張 超)
Comparative Analysis of Dual Control and RLS Identification Control for System with Dual Uncertainties
YANGHengzhan1,GAOYun1,QIANFucai2
(1.School of Electronic Information Engineering,Xi’an Technological University,Xi’an 710021,China;2.School of Automation and Information Engineering,Xi’an University of Technology,Xi’an 710048,China)
In order to identify unknown parameters and to track system target output value in dual uncertainty system,dual control and recursive least squares (RLS) identification control are presented for the stochastic system.The control strategy of double dual control and the recursive least squares identification controland is put forward.Through dual uncertain stochastic system simulation, the dual control and least squares identification performance of the control strategy are comparatively analyzed.The results show: The dual control strategy is used for dual uncertainty parameter identification of stochastic system,its realtime performance and stability are better than the least squares identification control; When the unknown parameters of stochastic system change in the running process,dual control strategy can still be effective track system for the target output value,and the tracking error is consistent with the value before switching;RLS identification control cannot effectively track system output value,and fails to track.
dual uncertainties system;dual control; identification control;real-time
10.16185/j.jxatu.edu.cn.2016.10.013
2015-11-23
國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(61533014);國(guó)家自然科學(xué)基金(61273127; 61304204);陜西省國(guó)際科技合作重點(diǎn)項(xiàng)目(2015KW-024);陜西省教育廳專項(xiàng)科學(xué)研究計(jì)劃項(xiàng)目(16JK1364)
楊恒占(1976-),男,西安工業(yè)大學(xué)講師,主要研究方向?yàn)殡S機(jī)系統(tǒng)、最優(yōu)控制.E-mail:yanghengzhan@xatu.edu.cn.
TP13
A
1673-9965(2016)10-0843-05