侯曉秋,陳志學
(1.黑龍江科技學院電氣與信息工程學院,黑龍江哈爾濱150027;2.中國兵器工業(yè)第205研究所,陜西西安710065)
自 1982 年 Billings等提出 NARMAX 模型[1]以來,針對于NARMAX模型的辨識和控制問題的研究已形成Billings學派,因人工神經(jīng)網(wǎng)絡可逼近任意非線性系統(tǒng),已提出許多控制算法,采用多模型逼近NARMAX模型的多模型自適應控制算法,我國學者韓志剛,侯忠生提出的無模型控制,各種采用時變線性模型逼近NARMAX模型的控制算法,采用動態(tài)切平面逼近NARMAX模型的控制算法等。文獻[2]給出的基于一步時滯情形的NARMAX模型的最小預測誤差自適應預測控制器的準則函數(shù)具有局限性,致使算法存在穩(wěn)態(tài)偏差,文獻[3]對文獻[2]的準則函數(shù)進行改進,所提出的控制算法無穩(wěn)偏,文獻[4]研究了NARMAX模型的多重時滯情形,文獻[2-4]的算法只適用于確定性情形,本文研究多重時滯隨機性NARMAX模型的自適應預測控制問題。
Billings等提出NARMAX模型:
其中:y(t)為系統(tǒng)輸出,y(t)∈R1;U(t)為系統(tǒng)的m 維輸入,U(t)∈Rm;ξ(t)為系統(tǒng)干擾量,ξ(t)∈R1;Y(t+d-1)為系統(tǒng) t+1 時刻至 t+d-1 時刻輸出的集合;Y(t)為系統(tǒng)到t時刻為止的輸出的集合,U(t-1)為系統(tǒng)到t-1時刻為止的輸入的集合;ξ(t+d)為系統(tǒng)止t+d時刻的干擾量的集合;θ為未知參數(shù);d為系統(tǒng)時滯,f(…)表示一般的非線性函數(shù)。因ξ(t)一般是無法測量的,故其在f(…)中出現(xiàn)的形式難以確定,所以上式NARMAX模型實用性差,這里將NARMAX模型的各種隨機干擾等效在系統(tǒng)的輸出端,當?shù)刃У母蓴_為平穩(wěn)隨機序列時,基于文獻[5]線性濾波和譜分解定理及成型濾波器原理構(gòu)成一非線性隨機系統(tǒng)模型:
其中:η(t)為平穩(wěn)隨機序列,且
其中:e(t)為零均值,方差為 σ2的白噪聲序列,而
這里假設n2,nc已知,A2(q-1)和C(q-1)為穩(wěn)定多項式。
假設1:系統(tǒng)(1)式輸入輸出可觀測的,可控制的,即對某一系統(tǒng)有界的期望輸出信號,存在有界的可行控制輸入信號,使得系統(tǒng)在此控制輸入信號的驅(qū)動下,其輸出等于系統(tǒng)的期望輸出。
假設2:f(…)關(guān)于Y(t+d-1)及U(t)的偏導數(shù)是連續(xù)的,且各偏導數(shù)有界。
假設3:由泰勒展開公式,在工作點Y0(t+d-1),U0(t)處用線性的動態(tài)切平面去逼近一般的非線性系統(tǒng)式(1)時,假設有:
其中:
這里,假設3中的y0(t),U0(t)一般可為:
假設 4:d、n2、nc,已知。
假設1-3對多數(shù)非線性系統(tǒng)成立的分析見文獻[4]。
在工作點Y0(t+d-1),U0(t)處對式(1)的非線性系統(tǒng)用動態(tài)切平面逼近,由一階泰勒展開公式得:
其中:
而
整理寫成,
其中:
而
這里,D(t)在t時刻是一個已知的量。
將式(2)代入式(8)整理得:
其中:
對于式(12),定義輔助輸出 s(t+d)為,
其中:
可用如下引理闡述廣義最優(yōu)預測:
引理1:廣義最優(yōu)預測,滿足預測誤差方差,
其中:G(q-1)、F(q-1)滿足以下阿斯特羅姆恒等式,
式中:
證明:參考文獻[6]可證。
控制輸入準則函數(shù)為,
而
且
定理1:對于非線性隨機系統(tǒng)式(1),滿足假設條件1-4,基于式(24)控制輸入準則函數(shù)的預測控制器算法為:
其中
證明:參考文獻[2、3、4、6]證明如下:
上式等價于如下準則函數(shù):
由 J*[U(t)]對 U(t)求偏導,
由式(19)得:
整理得:
得:
可得:
[7]的矩陣反演公式得:
式(34)代入式(33)即得式(28)算法。
當式(1)模型參數(shù)未知時,可采用文獻[8]的非線性參數(shù)估計算法估計其值,結(jié)合引理1的廣義最優(yōu)預測算法和定理1的預測控制算法,構(gòu)成自適應預測控制。
已知系統(tǒng)的形式為:
其中:θ1,θ2,a1的真值為:
U0(t),y0(t)選取如下:
參考輸入為:
結(jié)合現(xiàn)階段工程造價工作的信息化發(fā)展,雖然已經(jīng)得到了絕大部分企業(yè)的認同,也積極進行了多方面的嘗試,但是在具體落實中卻同樣也存在著多方面的缺陷和不足,具體問題表現(xiàn)如下。
u1(t)及u2(t)的限幅為:
白噪聲,
參考文獻[3,4]的魯棒控制策略,使系統(tǒng)無穩(wěn)偏,且控制輸入收斂于以原點為中心的變化域內(nèi),
采用文[8]的參數(shù)估計算法,仿真結(jié)果如圖1、圖2、圖3所示。由圖1可知系統(tǒng)的輸出響應曲線在0≤t≤100時不理想,這是由于算法開始時系統(tǒng)未知參數(shù)偏離其真值過大造成的,但系統(tǒng)能穩(wěn)定運行,說明算法的魯棒性好。
圖1 輸出響應曲線
圖2 控制信號u1(t)的變化曲線
圖3 控制信號u2(t)的變化曲線
文中研究了一類非線性隨機系統(tǒng)的控制問題,所提出的模型較Billings等提出NARMAX模型具有實用性,控制算法適用于時變隨機系統(tǒng),且系統(tǒng)無穩(wěn)態(tài)偏差,控制輸入收斂于以原點為中心的變化域內(nèi),具有應用參考價值,進一步可研究其自適應廣義預測控制算法和多變量情形。
參考文獻:
[1]Billings,S.A.,and Leontaritis,I.J.Parmeter estimation techniques for nonlineat systems [J],6th IFAC Symp.Ident,and Syst.Par.Est.,1982:427-433.
[2]侯忠生.非參數(shù)模型及其自適應控制[M].北京:科學出版社,1999,98-101.
[3]侯曉秋.非線性確定性系統(tǒng)的魯棒自適應控制器[J].黑龍江科技學院學報,2003,13(2):54-57.
[4]侯曉秋.多重時滯非線性系統(tǒng)的自適應預測控制[J].黑龍江科技學院學報,2008,18(2):137-139.
[5]韓曾晉.自適應控制[M].北京:清華大學出版社,1995.70-76.
[6]Clarke D W ,Gawthrop P J.Self-tuning controller[J].Proc.IEE,1975,122(9):929-934.
[7]方崇智,蕭德云.過程辨識[M].北京:清華大學出版社,1994.146-147.
[8]侯曉秋.非線性隨機系統(tǒng)的具有遺忘因子的遞推最小二乘法[J].黑龍江科技學院學報,2008,18(4):306-309.