摘" 要: 使用具有輔助變量的全格式動(dòng)態(tài)線性化方法逼近系統(tǒng),構(gòu)建了神經(jīng)網(wǎng)絡(luò)監(jiān)督控制預(yù)測(cè)模型。利用線性跟蹤-微分器建立過(guò)渡過(guò)程,應(yīng)用線性擴(kuò)張狀態(tài)觀測(cè)器估計(jì)輸出預(yù)測(cè)值及其微分,給出了線性PID控制算法。根據(jù)對(duì)角回歸神經(jīng)網(wǎng)絡(luò)構(gòu)成直接逆控制,提出了改進(jìn)的控制目標(biāo)函數(shù)。依據(jù)非線性遞推最小二乘法在線優(yōu)化了PID控制參數(shù)和對(duì)角回歸神經(jīng)網(wǎng)絡(luò)的連接權(quán)。當(dāng)系統(tǒng)控制誤差大于一定值時(shí),重置PID控制參數(shù)。最后提出了在線優(yōu)化參數(shù)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)監(jiān)督控制,克服了已有的神經(jīng)網(wǎng)絡(luò)監(jiān)督控制存在建模難的問(wèn)題。仿真研究結(jié)果表明控制算法的響應(yīng)具有理想性能。
關(guān)鍵詞: 神經(jīng)網(wǎng)絡(luò)監(jiān)督控制;非線性系統(tǒng);線性PID控制;全格式動(dòng)態(tài)線性化方法;對(duì)角回歸神經(jīng)網(wǎng)絡(luò);非線性遞推最小二乘法
中圖分類號(hào): TP273
文獻(xiàn)標(biāo)識(shí)碼: A" 文章編號(hào): 2096-3998(2024)02-0038-07
收稿日期:2023-05-16" 修回日期:2023-07-13
作者簡(jiǎn)介:侯小秋(1965—),男,黑龍江雙城人,碩士,副教授,主要研究方向?yàn)榉蔷€性控制、預(yù)測(cè)控制、自適應(yīng)控制、智能PID控制、無(wú)模型控制、神經(jīng)網(wǎng)絡(luò)控制。
引用格式:侯小秋.在線優(yōu)化參數(shù)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)監(jiān)督控制.陜西理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,40(2):38-44.
近年來(lái)許多學(xué)者對(duì)神經(jīng)網(wǎng)絡(luò)監(jiān)督控制進(jìn)行了研究,劉昱等認(rèn)為氣動(dòng)比例位置系統(tǒng)具有很強(qiáng)的非線性控制問(wèn)題,容易受環(huán)境因素的影響,當(dāng)使用常規(guī)PID控制時(shí),很難使系統(tǒng)具有良好的控制性能,考慮到神經(jīng)網(wǎng)絡(luò)具有很好的函數(shù)逼近特性,引入了RBF神經(jīng)網(wǎng)絡(luò)監(jiān)督控制進(jìn)行仿真分析,神經(jīng)網(wǎng)絡(luò)直接逆控制采用RBF神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),神經(jīng)網(wǎng)絡(luò)監(jiān)督控制采用PID控制。胡春洋等基于RBF神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)PID控制器結(jié)合對(duì)船舶進(jìn)行非線性控制的方法,提出了基于RBF神經(jīng)網(wǎng)絡(luò)控制算法進(jìn)行監(jiān)督控制的解決方法,并且結(jié)合船舶模型實(shí)現(xiàn)仿真研究。劉啟兵等提出了基于RBF神經(jīng)網(wǎng)絡(luò)的監(jiān)督控制算法,因RBF神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、自適應(yīng)等能力,此方法能通過(guò)RBF神經(jīng)網(wǎng)絡(luò)的特點(diǎn)自調(diào)整系統(tǒng)的控制參數(shù),實(shí)現(xiàn)被控系統(tǒng)的智能控制。李東等研究了水泥分解爐溫度控制難題,利用某水泥廠實(shí)際生產(chǎn)的數(shù)據(jù)在MATLAB系統(tǒng)辨識(shí)工具箱中辨識(shí)出了分解爐溫度和分解爐喂煤量的一階延時(shí)加滯后的系統(tǒng)模型,采用RBF徑向基神經(jīng)網(wǎng)絡(luò)監(jiān)督控制算法對(duì)分解爐溫度進(jìn)行了控制。陳浩廣等研究了一類不確定性非線性系統(tǒng)控制,利用神經(jīng)網(wǎng)絡(luò)的萬(wàn)能逼近性能,給出了一種帶有監(jiān)督控制的神經(jīng)網(wǎng)絡(luò)自適應(yīng)跟蹤控制設(shè)計(jì)算法;該算法基于RBF神經(jīng)網(wǎng)絡(luò)來(lái)逼近非線性系統(tǒng)的未知不確定函數(shù),并采用監(jiān)督控制器來(lái)保證系統(tǒng)的狀態(tài)有界;在控制器的設(shè)計(jì)過(guò)程中根據(jù)李雅普諾夫穩(wěn)定性原理,確定了RBF神經(jīng)網(wǎng)絡(luò)的權(quán)值自適應(yīng)律的學(xué)習(xí)算法,并通過(guò)理論分析證明了系統(tǒng)的狀態(tài)跟蹤誤差收斂于零。已有的神經(jīng)網(wǎng)絡(luò)監(jiān)督控制存在無(wú)預(yù)測(cè)性能,目標(biāo)函數(shù)具有局限性,且無(wú)PID控制參數(shù)在線優(yōu)化等問(wèn)題,導(dǎo)致PID控制輸入在穩(wěn)態(tài)時(shí)不向零趨近。
本文研究在線優(yōu)化參數(shù)的對(duì)角回歸神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)監(jiān)督控制算法,由具有輔助變量的全格式動(dòng)態(tài)線性化方法的泛模型構(gòu)成的預(yù)測(cè)模型給出輸出預(yù)測(cè)值,用線性擴(kuò)張狀態(tài)觀測(cè)器觀測(cè)輸出預(yù)測(cè)值,使控制算法具有預(yù)測(cè)控制性能。
1" 泛模型逼近
NARMA模型為
y(t)=u(t-d-1),…,u(t-d-nu+1)〗,
式中,y(t)為輸出,u(t)為輸入,ny、nu為階數(shù),d為時(shí)滯,(…)為非線性函數(shù)。
逼近系統(tǒng)的具有輔助變量的全格式動(dòng)態(tài)線性化方法的泛模型為
Δym(t)=A(q-1)Δy(t-1)+q-dB(q-1)Δu(t)+v(t),(1)
式中,Δ=1-q-1為加權(quán)網(wǎng)絡(luò),ym(t)為泛模型輸出,v(t)為輔助變量,A(q-1)=a1+a2q-1+…+aLyq-Ly+1,B(q-1)=b0+b1q-1+…+bLu-1q-Lu+1,Ly、Lu為偽參數(shù)。參數(shù)ai、bj的意義見(jiàn)文獻(xiàn),輔助變量v(k)的意義見(jiàn)文獻(xiàn),因式(1)具有最小二乘格式,其參數(shù)估計(jì)算法可采用文獻(xiàn)中的許多參數(shù)估計(jì)算法。
預(yù)測(cè)模型可由迭代算法確定:
(t+j/t)=A^(q-1)Δ(t+j-1/t)+B^(q-1)Δu(t-d+j)+(t)+(t+j-1/t),(2)
式中,(t+j/t)為j步預(yù)測(cè)值,A^(q-1)、B^(q-1)、(t)為估計(jì)值。
2" 線性PID控制器
2.1" 線性跟蹤-微分器
為了使算法具有預(yù)測(cè)功能,需跟蹤超前設(shè)定值:
fh=-R2-2Rv2(t-1),
v1(t)=v1(t-1)+hv2(t-1),
v2(t)=v2(t-1)+hfh,
式中,R為速度因子,r(t+d-1)為超前參考輸入,v1(t)為r(t+d-1)的跟蹤信號(hào),v2(t)為r(t+d-1)的跟蹤微分信號(hào), fh為線性函數(shù),h為采樣周期。
2.2" 線性擴(kuò)張狀態(tài)觀測(cè)器
為了使算法具有預(yù)測(cè)功能,觀測(cè)輸出預(yù)測(cè)值:
e(t-1)=z1(t-1)-(t+d-1/t),
z1(t)=z1(t-1)+h,
z2(t)=z2(t-1)+h,
z3(t)=z3(t-1)+h,
式中各量的意義見(jiàn)文獻(xiàn)。
2.3" PID控制
比例誤差:
ep(t)=v1(t)-z1(t),
微分誤差:
ed(t)=v2(t)-z2(t),
積分誤差:
ei(t)=ei(t-1)+hep(t),
PID控制律:
up(t)=kpep(t)+kded(t)+kiei(t),(3)
式中,kp、kd、ki分別為比例增益、微分增益、積分增益。
3" 對(duì)角回歸神經(jīng)網(wǎng)絡(luò)的直接逆控制
對(duì)角回歸神經(jīng)網(wǎng)絡(luò)的五維輸入為
I1(t)=v1(t)," I2(t)=v2(t)," I3(t)=-z1(t)," I4(t)=-z2(t)," I5(t)=un(t-1)
隱層和輸出層的作用函數(shù)為S型函數(shù):
Sj(t)=5i=1wIijIi(t),(4)
S′j(t)=Sj(t)+wDjXj(t-1),(5)
式中,Sj(t)為第j個(gè)回歸元的輸入,wIij為輸入加權(quán)系數(shù),S′j(t)為第j個(gè)回歸元的輸入和,wDj為第j個(gè)回歸元的加權(quán)系數(shù),Xj(t-1)為第j個(gè)回歸元的輸出,且
Xj(t)=′j(t)〗,(6)
式中,(…)為S型作用函數(shù)。則
o(t)=qj=1wojXj(t),(7)
式中,o(t)為輸出,woj為輸出連接權(quán)系數(shù)。
故直接逆控制的控制輸出為
un(t)=A,(8)
式中,A為限幅值,且
(x)=ex-e-xex+e-x。(9)
4" 控制參數(shù)在線優(yōu)化
4.1" un(t)和up(t)關(guān)于η的梯度
監(jiān)督控制參數(shù)向量ηT=,式(3)對(duì)kp、kd、ki求偏導(dǎo),
up(t)kp=ep(t),(10)
up(t)kd=ed(t),(11)
up(t)ki=ei(t),(12)
由式(3)可知,up(t)關(guān)于η的其他分量的偏導(dǎo)數(shù)為零。則由式(10)—(12)得up(t)η。
由式(4)—(8)得,
un(t)kp=un(t)kd=un(t)ki=0,(13)
式(7)—(9)對(duì)woj求偏導(dǎo):
un(t)woj=un(t)o(t)·o(t)woj,(14)
un(t)o(t)=12A1-un(t)A〗2,(15)
o(t)woj=Xj(t),(16)
式(5)—(9)對(duì)wDj求偏導(dǎo):
un(t)wDj=un(t)o(t)·o(t)wDj,(17)
o(t)wDj=wojXj(t)wDj=wojPj(t),(18)
Pj(t)=Xj(t)wDj=Xj(t)S′j(t)·S′j(t)wDj,(19)
Xj(t)S′j(t)=12,(20)
S′j(t)wDj=Xj(t-1)+wDjXj(t-1)wDj=Xj(t-1)+wDjPj(t-1),(21)
且
Pj(0)=0。(22)
式(5)—(9)對(duì)wIij求偏導(dǎo):
un(t)wIij=un(t)o(t)·o(t)wIij,(23)
o(t)wIij=wojXj(t)wIij=wojQij(t),(24)
Qij(t)=Xj(t)wIij=Xj(t)S′j(t)·S′j(t)wIij,(25)
S′j(t)wIij=Ii(t)+wDjXj(t-1)wIij=Ii(t)+wDjQij(t-1),(26)
且
Qij(0)=0。(27)
式(8)對(duì)A求偏導(dǎo):
un(t)A==un(t)A。(28)
則由式(13)—(28)可得un(t)η。
4.2" (t+d/t)關(guān)于η的梯度
在式(2)中令j=d得
"(t+d/t)=A^(q-1)Δ(t+d-1/t)+B^(q-1)Δu(t)+(t)+(t+d-1/t),(29)
當(dāng)前控制律
u(t)=un(t)+up(t),(30)
由式(30)得
u(t)η=un(t)η+up(t)η,
由式(29)得
(t+d/t)η=b0u(t)η。
4.3" η的在線優(yōu)化
監(jiān)督控制改進(jìn)的目標(biāo)函數(shù),
J(t,η)=12ti=0{μt-i〈(i+d/i)-r(i+d)〗2+α2+
β2〉}+12‖λ(t)η-(t-1)〗‖2,(31)
式中,μ為遺忘因子,α、β為加權(quán)因子,λ(t)為權(quán)重對(duì)角矩陣,(t-1)為η在t-1時(shí)刻的優(yōu)化學(xué)習(xí)值。且
λ(t)=diag(t)〗。
式(31)中的α2項(xiàng)使un(t)向u(t)趨近,β2項(xiàng)使up(t)向零趨近,致使控制算法起監(jiān)督控制的作用。
η的在線優(yōu)化算法為
(t)=(t-1)-P-1(t-1)(t+d/t)-r(t+d)〗(t+d/t)ηη=(t-1)+
αun(t)ηη=(t-1)
+βup(t)up(t)ηη=(t-1),(32)
P(t-1)=μP(t-2)+(t+d/t)ηη=(t-1)〗
(t+d/t)ηη=(t-1)〗T+
αun(t)ηη=(t-1)〗
un(t)ηη=(t-1)〗T+
βup(t)ηη=(t-1)〗
up(t)ηη=(t-1)〗T+λ2(t)。(33)
式(32)、(33)的矩陣求逆和克服算法病態(tài)的λ(t)確定使用文獻(xiàn)的算法計(jì)算。
當(dāng)|r(t)-y(t)|gt;δ成立時(shí),說(shuō)明系統(tǒng)產(chǎn)生了變化,應(yīng)該引入PID控制,故重置kp、kd、ki為適當(dāng)?shù)臄?shù)值。
5" 仿真研究
被控對(duì)象y(t)=0.8y(t-1)1+0.3y2(t-1)+u3(t-4)+0.6signu2(t-5)設(shè)定值r(t)=(-1)round(t/500)泛模型偽階數(shù)Ly=Lu=1,參數(shù)估計(jì)初始值
A^1(0)=0.6,b^0(0)=0.5,(0)=0,且R=20,h=0.002 5,β01=10,β02=β03=1,k^p(0)=2,k^d(0)=0.1,k^i(0)=0.009 1,o1(0)=0.3,D1(0)=0.1,I11(0)=0.71,A^(0)=2,P(-2)=10-6I,μ=0.98,α=β=1。回歸元q=3。
利用MATLAB7語(yǔ)言編制m文件程序進(jìn)行仿真,響應(yīng)曲線如圖1所示。圖1(a)為無(wú)優(yōu)化的響應(yīng)曲線,up(t)在穩(wěn)態(tài)時(shí)不趨向于零,算法是神經(jīng)網(wǎng)絡(luò)復(fù)合控制,且調(diào)節(jié)時(shí)間長(zhǎng),PID控制起主導(dǎo)作用;圖1(b)為有優(yōu)化的響應(yīng)曲線,up(t)在穩(wěn)態(tài)時(shí)趨向于零,算法是神經(jīng)網(wǎng)絡(luò)監(jiān)督控制。圖2為部分參數(shù)優(yōu)化曲線,k^i(t)在穩(wěn)態(tài)時(shí)趨向于零,o1(t)等參數(shù)在優(yōu)化時(shí)其值在向優(yōu)值變化。
6" 結(jié)論
1)本文采用線性PID控制和基于對(duì)角回歸神經(jīng)網(wǎng)絡(luò)的直接逆控制構(gòu)成監(jiān)督控制。
2)線性跟蹤-微分器跟蹤超前設(shè)定值,線性擴(kuò)張狀態(tài)觀測(cè)器觀測(cè)輸出預(yù)測(cè)值,使控制算法具有預(yù)測(cè)控制性能。
3)提出改進(jìn)的控制目標(biāo)函數(shù),同時(shí)在線優(yōu)化PID控制參數(shù)和對(duì)角回歸神經(jīng)網(wǎng)絡(luò)的連接權(quán),使對(duì)角回歸神經(jīng)網(wǎng)絡(luò)直接逆控制起主導(dǎo)作用,使PID控制在對(duì)角回歸神經(jīng)網(wǎng)絡(luò)直接逆控制起主導(dǎo)作用時(shí),起微弱的作用或無(wú)作用,當(dāng)系統(tǒng)運(yùn)行狀態(tài)偏離設(shè)定值一定程度時(shí),重置PID控制參數(shù),使其重新參與控制。
4)關(guān)于up(t)的PID控制算法的討論:
Ⅰ 當(dāng)ki=0時(shí),系統(tǒng)進(jìn)入穩(wěn)態(tài)后,若無(wú)穩(wěn)偏,則up(t)自然向零趨近,優(yōu)化時(shí)kp、kd不向零趨近。
Ⅱ 當(dāng)ki≠0時(shí),系統(tǒng)進(jìn)入無(wú)穩(wěn)偏穩(wěn)態(tài),這時(shí)因積分控制的存在,up(t)不向零趨近,由式(30)可知,不是對(duì)角回歸神經(jīng)網(wǎng)絡(luò)直接逆控制獨(dú)自作用的監(jiān)督控制。算法引入優(yōu)化參數(shù)后,因目標(biāo)函數(shù)中β2項(xiàng)的存在,up(t)向零趨近,則參數(shù)ki向零趨近。而kp、kd在優(yōu)化時(shí)的變化趨勢(shì)為系統(tǒng)進(jìn)入無(wú)穩(wěn)偏穩(wěn)態(tài)后,因ep=ed=0則優(yōu)化時(shí)不要求kp、kd向零趨近,由式(10)、(11)得up(t)kp=up(t)kd=0,則kp、kd停止變化。
[" 參" 考" 文" 獻(xiàn)" ]
劉昱,彭鋒,趙國(guó)新,等.氣動(dòng)3-UPU機(jī)器人的神經(jīng)網(wǎng)絡(luò)監(jiān)督控制仿真.計(jì)算機(jī)仿真,2021,38(10):338-343.
胡春洋,李松霖,楊樹(shù)仁,等.RBF神經(jīng)網(wǎng)絡(luò)監(jiān)督控制在船舶自動(dòng)舵中的研究與應(yīng)用.自動(dòng)化應(yīng)用,2019(8):1-3.
劉啟兵,吳逍.基于RBF神經(jīng)網(wǎng)絡(luò)的監(jiān)督控制.電腦知識(shí)與技術(shù),2018,14(13):176-178.
李東,艾紅.水泥分解爐溫度的RBF神經(jīng)網(wǎng)絡(luò)監(jiān)督控制.傳感器世界,2018,24(12):25-32.
陳浩廣,王銀河,王東曉.一類帶有監(jiān)督控制的神經(jīng)網(wǎng)絡(luò)自適應(yīng)跟蹤設(shè)計(jì).工業(yè)控制計(jì)算機(jī),2017,30(9):58-60.
侯忠生,金尚泰.無(wú)模型自適應(yīng)控制理論及應(yīng)用.北京:科學(xué)出版社,2013:43-46.
侯小秋.在線優(yōu)化參數(shù)的變時(shí)滯無(wú)模型自適應(yīng)單值預(yù)測(cè)控制.陜西理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,37(2):42-47.
丁鋒.系統(tǒng)辨識(shí)新論.北京:科學(xué)出版社,2013.
周輝.電動(dòng)四旋翼飛行控制技術(shù)研究.南京:南京航空航天大學(xué),2021.
劉登基.輪轂式異步電機(jī)直接轉(zhuǎn)矩控制研究.湘潭:湘潭大學(xué),2016:43-36.
侯小秋.多變量系統(tǒng)的變時(shí)滯無(wú)模型預(yù)測(cè)濾波PID控制.黑龍江科技大學(xué)學(xué)報(bào),2019,29(5):614-620.
侯小秋.隨機(jī)多變量NARMAX模型的非線性遞推最小二乘算法.廈門理工學(xué)院學(xué)報(bào),2019,27(3):8-14.
[責(zé)任編輯:李 莉]
Neural network supervisory control with parameter optimization on line
HOU Xiaoqiu
School of Electronics and Controlling Engineering, Heilongjiang University of Science and Technology, Harbin 150022, China
Abstract:" Using the full-state dynamic linearization with auxiliary variables, the nonlinear system is approximated, and a neural network supervised control prediction model was built. The model parameter was estimated by nonlinearity recursive least squares method. Transient process was built by linear tracking differentiator. Using linear expanded observer to estimate output predicative value and its differential, a linear PID control algorithm was obtained. Modified control object function by direct inverse control built from diagonal regression neural network. The parameter of PID control and connect weight of the diagonal regression neural network were optimized on line by nonlinearity recursive least squares method. When error of system control is greater than setting value, parameter of PID control would be resettled. In summary of study above, an algorithm of neural network supervisory control with parameter optimization on line has been developed, which overcomes the problem presented in the already present neural network supervisory." Simulation result indicates that response of the algorithm has excellent performance.
Key words:" neural network supervised control; nonlinear system; linear PID control; full from dynamic linearization; diagonal regression neural network; nonlinearity recursive least squares method