郭旭暉,姚志易,馬維軍
(寧夏大學(xué) 信息工程學(xué)院, 寧夏 銀川 750021)
近年來(lái),遞歸神經(jīng)網(wǎng)絡(luò)在組合優(yōu)化、模式識(shí)別等領(lǐng)域得到了廣泛的應(yīng)用[1-3],引起了人們的廣泛關(guān)注.由于神經(jīng)網(wǎng)絡(luò)的動(dòng)力學(xué)行為常常受到隨機(jī)和時(shí)滯等因素的影響,導(dǎo)致系統(tǒng)失穩(wěn)或震蕩.然而在工程應(yīng)用中要求網(wǎng)絡(luò)必須是穩(wěn)定的,因此對(duì)于具有時(shí)變時(shí)滯的隨機(jī)遞歸神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性研究,無(wú)論是在理論研究還是實(shí)際應(yīng)用中都十分重要.很多學(xué)者對(duì)隨機(jī)遞歸神經(jīng)網(wǎng)絡(luò)進(jìn)行了大量研究[4-5],然而關(guān)于其優(yōu)化問(wèn)題的研究結(jié)果相對(duì)較少.到目前為止,還沒(méi)有關(guān)于具有時(shí)變時(shí)滯的隨機(jī)遞歸神經(jīng)網(wǎng)絡(luò)逆最優(yōu)控制的相關(guān)研究成果.本文基于逆最優(yōu)方法和Lyapunov函數(shù),針對(duì)一類具有時(shí)變時(shí)滯的隨機(jī)遞歸神經(jīng)網(wǎng)絡(luò)模型,討論了其全局漸近穩(wěn)定性問(wèn)題.
考慮如下具有時(shí)變時(shí)滯的隨機(jī)遞歸神經(jīng)網(wǎng)絡(luò)模型
(1)
其中,x(t)=(x1(t),x2(t),…,xn(t))T∈Rn表示狀態(tài)向量,A=diag(δ1,δ2,…,δn)是一對(duì)角矩陣且δi>0,i=1,2,…,n,B=(bij)n×n和C=(cij)n×n分別表示反饋矩陣和時(shí)滯反饋矩陣,τ(t)表示時(shí)變時(shí)滯,f(x(t))=(f1(x1(t)),f2(x2(t)),…,fn(xn(t)))T∈Rn表示非線性激勵(lì)函數(shù),E是具有適當(dāng)維數(shù)的控制輸入矩陣,u(t)為控制輸入,σ(t,x(t),x(t-τ(t)))∈Rn×n表示噪聲強(qiáng)度函數(shù),ω(t)∈Rn是一個(gè)n維獨(dú)立標(biāo)準(zhǔn)的Wiener過(guò)程.
假設(shè)激勵(lì)函數(shù)fj(xj(t)),時(shí)變時(shí)滯τ(t)和噪聲強(qiáng)度函數(shù)σ(t,x(t),x(t-τ(t)))滿足以下條件.
(A1)?x,y∈R,?kj>0,使得|fj(yj)-fj(xj)|≤kj|yj-xj|;j=1,2,…,n.
(A2)σ(t,x(t),x(t-τ(t)))是全局Lipschitz連續(xù)且滿足Tr{σ(t,x(t),x(t-τ(t)))Tσ(t,x(t),x(t-τ(t)))}≤‖M1x(t)‖2+‖M2x(t-τ(t))‖2,其中,Tr表示矩陣的跡,M1∈Rn×n和M2∈Rn×n為矩陣.
(A3)fj(0)=0;σij(t,0,0)=0;i,j=1,2,…,n.
定義[6]對(duì)于一般的隨機(jī)非線性系統(tǒng)
dx=F(x)dt+G1(x)udt+G2(x)dω,
(2)
其中,x∈Rn表示n維狀態(tài),u∈Rp表示狀態(tài)輸入,ω∈Rq是一個(gè)獨(dú)立標(biāo)準(zhǔn)的Wiener過(guò)程.
如果存在滿足以下Hamilton-Jacobi-Bellman(HJB)方程的正最優(yōu)值函數(shù)V(x)
(3)
則
(4)
是可以最小化性能函數(shù)的最優(yōu)穩(wěn)定控制
(5)
其中,對(duì)于所有的x,q(x)≥0和R(x)≥0.
在開(kāi)始證明定理之前,先對(duì)Lyapunov函數(shù)進(jìn)行簡(jiǎn)單計(jì)算.
對(duì)系統(tǒng)(1)構(gòu)造如下Lyapunov函數(shù)
(6)
由假設(shè)(A1-A4)及不等式2xy≤xTx+yTy,利用It可得
≤-δxT(t)x(t)+xT(t)Eu(t)+
(7)
選擇控制輸入如下
(8)
將(8)代入(7)可得
LV≤-δxT(t)x(t)≤0.
因此,控制輸入(8)是一個(gè)穩(wěn)定控制.
根據(jù)非線性最優(yōu)控制,將Lyapunov函數(shù)(6)作為最優(yōu)值函數(shù)代入HJB方程(3)可得
(9)
在穩(wěn)定控制輸入(8)的基礎(chǔ)上,定義了一個(gè)新的控制(即對(duì)控制輸入(8)進(jìn)行簡(jiǎn)單修正),
(10)
其中,λ>2是一個(gè)常數(shù).
由(3)和(7)可得
(11)
則
xT(t)[-Ax(t)+Bf(x(t))+Cf(x(t-τ(t)))+Eu(t)]-
(12)
定理對(duì)于系統(tǒng)(1),存在正定函數(shù)q(x)(12)和嚴(yán)格正函數(shù)R(x)(11),使系統(tǒng)(1)通過(guò)反饋控制律
(13)
在原點(diǎn)達(dá)到全局逆最優(yōu),并使性能函數(shù)最小化
(14)
因此,最優(yōu)控制律(即控制輸入)能使系統(tǒng)(1)達(dá)到全局漸近穩(wěn)定.
證明根據(jù)Lyapunov函數(shù)(6),系統(tǒng)(1)的無(wú)窮小生成元為
(15)
將控制輸入(13)代入(15)可得
≤0,?x≠0.
(16)
系統(tǒng)(1)通過(guò)控制器(13)在x=0處達(dá)到全局漸近穩(wěn)定狀態(tài).
下面,對(duì)q(x)和R(x)進(jìn)行討論.
由(12)可得
(M2x(t-τ(t)))-xT(t)[-Ax(t)+Bf(x(t))+Cf(x(t-τ(t)))+Eu(t)]-
(17)
在上述中可知,δ>0,λ>2.則q(x)是正定的和徑向無(wú)界的.
由(11)可得
(18)
如果|E|≠0,則ETE>0,R(x)>0.通過(guò)選擇q(x)(12)和R(x)(11),LV可表示為
LV=-q(x)-uTR(x)u+(u-u*)TR(x)(u-u*).
(19)
由文獻(xiàn)[7]可得
(20)
根據(jù)(16)可得,最優(yōu)控制u=u*是有意義的成本函數(shù)J的最優(yōu)解.
備注1 本文通過(guò)構(gòu)造適當(dāng)?shù)腖yapunov函數(shù),給出了穩(wěn)定控制(10).由于控制器的設(shè)計(jì)與參數(shù)有很大關(guān)系,在實(shí)際應(yīng)用中,當(dāng)激勵(lì)函數(shù)的權(quán)值和Lipschitz系數(shù)均為常數(shù)時(shí),通過(guò)選擇合適的參數(shù)λ,使(11)中的R(x)變?yōu)槌?shù),則控制輸入(11)就變成了易實(shí)現(xiàn)的常數(shù)狀態(tài)反饋控制器.
備注2 在控制工程應(yīng)用中,最優(yōu)系統(tǒng)具有許多良好的特性,如穩(wěn)定性、魯棒性、降低靈敏度等[8].然而一般隨機(jī)非線性系統(tǒng)(2)的HJB方程(3)的解很難求得,在很多情況下,HJB方程沒(méi)有解或不存在唯一解.因此,逆最優(yōu)方法為求解非線性系統(tǒng)的最優(yōu)控制問(wèn)題提供了可能,這種方法的優(yōu)點(diǎn)是不需要求解HJB方程.
備注3 文獻(xiàn)[9]和文獻(xiàn)[10]中指出,逆最優(yōu)控制方法是仿生學(xué)神經(jīng)網(wǎng)絡(luò)領(lǐng)域最有效的方法之一.然而,在特定任務(wù)中優(yōu)化確切的成本函數(shù)并不總是清楚的.因此,如何設(shè)計(jì)合適的控制器使所考慮的系統(tǒng)達(dá)到穩(wěn)定狀態(tài),并使系統(tǒng)的成本函數(shù)達(dá)到最優(yōu),是研究非線性系統(tǒng)穩(wěn)定性與控制十分重要的課題之一.
本文對(duì)一類具有時(shí)變時(shí)滯的隨機(jī)遞歸神經(jīng)網(wǎng)絡(luò)提出了一種新的全局漸近穩(wěn)定控制方法.因?yàn)榍蠼釮JB方程十分困難,很難設(shè)計(jì)出反饋控制器來(lái)實(shí)現(xiàn)非線性系統(tǒng)的穩(wěn)定性.本文基于Lyapunov函數(shù)和逆最優(yōu)方法,我們得到了在逆最優(yōu)控制下的具有時(shí)變時(shí)滯的隨機(jī)遞歸神經(jīng)網(wǎng)絡(luò)的全局漸近穩(wěn)定控制的充分條件.此外,本文的方法也可以推廣到文獻(xiàn)[5]的模型.