亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

正則系統(tǒng)在Lebesgue-p范數(shù)意義下的快速迭代學(xué)習(xí)控制

2018-10-16 08:29:08李艷東王妍瑋

計(jì)算機(jī)應(yīng)用 2018年9期

曹偉，李艷東，王妍瑋

(1.齊齊哈爾大學(xué) 計(jì)算機(jī)與控制工程學(xué)院，黑龍江齊齊哈爾 161006； 2.哈爾濱石油學(xué)院機(jī)械工程學(xué)院，哈爾濱 150027)

0 引言

迭代學(xué)習(xí)控制算法與神經(jīng)網(wǎng)絡(luò)和自適應(yīng)控制等其他學(xué)習(xí)類算法不同，迭代學(xué)習(xí)控制是針對在有限時(shí)間區(qū)間上具有重復(fù)運(yùn)行特性的被控系統(tǒng)，利用系統(tǒng)存儲的跟蹤誤差對控制輸入進(jìn)行逐次修正，從而實(shí)現(xiàn)完全跟蹤期望軌跡的目的。由于不需要精確模型信息便可以設(shè)計(jì)迭代學(xué)習(xí)控制器，且結(jié)構(gòu)簡單等優(yōu)點(diǎn)，因此迭代學(xué)習(xí)控制[1]自提出以來，無論是在理論研究方面還是在實(shí)際應(yīng)用中都取得了大量研究成果[2-3]。

到目前為止，關(guān)于迭代學(xué)習(xí)控制大多數(shù)相關(guān)文獻(xiàn)都是在λ范數(shù)度量意義下研究算法的收斂性，并指出在λ足夠大時(shí)算法的收斂性才能夠得到保證[4-5]。由于λ范數(shù)是有上確界的負(fù)指數(shù)函數(shù)型范數(shù)，因此不能客觀量化誤差的本質(zhì)特征。文獻(xiàn)[6]研究發(fā)現(xiàn)，當(dāng)λ參數(shù)值取得較大時(shí)，雖然學(xué)習(xí)算法在理論上是收斂的，但在系統(tǒng)運(yùn)行初始階段誤差的上確界值往往會超出實(shí)際工程允許的誤差范圍。為避免λ范數(shù)上述缺陷，文獻(xiàn)[7]在上確界范數(shù)度量意義下對比例微分(Proportional-Derivative, PD)型迭代學(xué)習(xí)控制算法的收斂性進(jìn)行了研究，發(fā)現(xiàn)學(xué)習(xí)算法只能在系統(tǒng)運(yùn)行時(shí)間區(qū)間的某個(gè)子區(qū)間內(nèi)是收斂的。文獻(xiàn)[8]為使迭代學(xué)習(xí)控制算法在上確界范數(shù)度量意義下是收斂的，研究了運(yùn)行時(shí)間區(qū)間可調(diào)整和學(xué)習(xí)律可子區(qū)間化進(jìn)行修正的算法，但算法結(jié)構(gòu)相當(dāng)復(fù)雜，在實(shí)際工程系統(tǒng)中很難得到應(yīng)用。進(jìn)一步，由于Lebesgue-p范數(shù)同時(shí)考慮了函數(shù)f在整個(gè)時(shí)間區(qū)間上的上確界值和各個(gè)運(yùn)行時(shí)刻函數(shù)值的p次方積分，因此Lebesgue-p范數(shù)在量化和反應(yīng)函數(shù)f的性態(tài)方面顯得更為合理?；诖宋墨I(xiàn)[9]利用Lebesgue-p范數(shù)討論了迭代學(xué)習(xí)控制的跟蹤性能，但沒有涉及算法的收斂性。文獻(xiàn)[10]研究了多狀態(tài)時(shí)滯線性系統(tǒng)迭代學(xué)習(xí)控制的穩(wěn)定性，并利用Lebesgue-2 范數(shù)來評估學(xué)習(xí)算法的跟蹤性能。文獻(xiàn)[11]針對線性時(shí)不變系統(tǒng)，在Lebesgue-p范數(shù)度量意義下對具有反饋信息的PD型迭代學(xué)習(xí)控制進(jìn)行了收斂性分析。文獻(xiàn)[12-13]在Lebesgue-p范數(shù)意義下分析了分?jǐn)?shù)階迭代學(xué)習(xí)控制律的收斂性。文獻(xiàn)[14]針對一類線性系統(tǒng)在Lebesgue-p范數(shù)意義下，分析了加速修正初態(tài)誤差的迭代學(xué)習(xí)控制算法的收斂性。進(jìn)一步，文獻(xiàn)[15]在Lebesgue-p范數(shù)意義下，討論了變增益迭代學(xué)習(xí)控制算法的收斂性。分析文獻(xiàn)[10-15]可以發(fā)現(xiàn)，雖然這些研究成果避免了采用λ范數(shù)度量跟蹤誤差的缺陷，但這些研究成果都是針對D=0的完全非正則系統(tǒng)進(jìn)行收斂性分析的，其結(jié)論不適用于D≠0的正則系統(tǒng)。原因就在于，對于完全非正則系統(tǒng)，迭代學(xué)習(xí)控制律中必須有跟蹤誤差的導(dǎo)數(shù)，即微分(Derivative, D)型或比例積分微分(Proportional-Integration-Derivative, PID)型迭代學(xué)習(xí)律，而對于正則系統(tǒng)則只能使用跟蹤誤差來修正控制律，即比例(Proportional, P)型迭代學(xué)習(xí)律。由于傳統(tǒng)P型迭代學(xué)習(xí)算法只利用以往跟蹤誤差來修正控制律，因此跟蹤速度較低。為提高傳統(tǒng)P型迭代學(xué)習(xí)算法的收斂速度，文獻(xiàn)[16]提出了一種迭代學(xué)習(xí)控制算法，但對其收斂性分析仍然采用了λ范數(shù)。

鑒于以上分析，本文針對一類正則系統(tǒng)，為提高傳統(tǒng)P型迭代學(xué)習(xí)算法的收斂速度，同時(shí)克服采用λ范數(shù)度量跟蹤誤差的缺陷，提出了一種充分利用系統(tǒng)以往存儲的跟蹤誤差和當(dāng)前跟蹤誤差信息以及迭代軸上相鄰兩次誤差的差分信號，對控制輸入進(jìn)行逐次修正的快速迭代學(xué)習(xí)控制算法，給出了Lebesgue-p范數(shù)意義下的收斂條件。

1 問題描述

考慮如下一類具有重復(fù)運(yùn)行特性的正則系統(tǒng)：

(1)

其中：k為迭代次數(shù)，t∈[0,T]為系統(tǒng)運(yùn)行的有限時(shí)間，xk(t)∈Rn為系統(tǒng)第k次運(yùn)行時(shí)的狀態(tài)向量，uk(t)∈Rr和yk(t)∈Rm分別為系統(tǒng)第k次運(yùn)行時(shí)的控制輸入向量和輸出向量，A、B、C、D為適當(dāng)維數(shù)的矩陣。

假設(shè)1 每次迭代時(shí)系統(tǒng)初始狀態(tài)與期望初始狀態(tài)保持一致，即xk(0)=xd(0)，k=0,1,2,…。

假設(shè)2 存在唯一的理想輸入ud(t)使式(2)成立:

(2)

其中：yd(t)為期望軌跡，xd(t)為期望狀態(tài)。

1.1 控制目標(biāo)

本文的控制目標(biāo)：針對正則系統(tǒng)(1)，為克服傳統(tǒng)P型迭代學(xué)習(xí)控制算法收斂速度較低的不足，設(shè)計(jì)出一種快速迭代迭代學(xué)習(xí)控制算法，同時(shí)利用Lebesgue-p范數(shù)對其收斂性進(jìn)行分析，克服采用λ范數(shù)度量跟蹤誤差的缺陷。

針對這一控制目標(biāo)，快速迭代學(xué)習(xí)控制算法設(shè)計(jì)如下：

uk+1(t)=uk(t)+Lp1ek(t)+Ld1Δek(t)+Lp2ek+1(t)+

Ld2Δek+1(t)

(3)

其中：ek(t)=yd(t)-yk(t)為第k次運(yùn)行的跟蹤誤差，ek+1(t)=yd(t)-yk+1(t)為第k+1次運(yùn)行的跟蹤誤差。Δek(t)=ek-1(t)-ek(t)和Δek+1(t)=ek(t)-ek+1(t)為迭代軸上相鄰兩次誤差的差分信號，其中Δek(t)稱為上一次的差分信號，Δek+1(t)稱為當(dāng)前次的差分信號。Lp1為第k次跟蹤誤差的學(xué)習(xí)增益，Lp2為第k+1次跟蹤誤差的反饋增益，Ld1和Ld2分別為差分信號的學(xué)習(xí)增益和反饋增益。

由算法(3)可知，當(dāng)Lp2和Ld2取零時(shí)，算法(3)即為開環(huán)迭代學(xué)習(xí)控制算法：

uk+1(t)=uk(t)+Lp1ek(t)+Ld1Δek(t)

(4)

當(dāng)Ld1、Lp2和Ld2都取零時(shí)，算法(3)則變?yōu)閭鹘y(tǒng)P型迭代學(xué)習(xí)控制算法：

uk+1(t)=uk(t)+Lp1ek(t)

(5)

現(xiàn)在的問題是針對正則系統(tǒng)(1)，采用算法(3)控制，當(dāng)Ld1、Lp2和Ld2滿足什么條件時(shí)，系統(tǒng)是收斂的。

1.2 數(shù)學(xué)基礎(chǔ)

為便于分析控制算法的收斂性，給出如下定義和引理：

定義1 向量值函數(shù)f:[0,T] →Rn的λ范數(shù)定義[1]為:

向量值函數(shù)f的上確界范數(shù)[10]和Lebesgue-p范數(shù)[21]定義為：

文獻(xiàn)[17]中給出了一個(gè)重要結(jié)論就是：上確界范數(shù)是Lebesgue-p范數(shù)的特例，即：

引理1[17]如果向量值函數(shù)g,h:[0,T] →R是Lebesgue可積的，那么推廣的卷積Young不等式為:

‖(g*h)(·)‖r≤‖g(·)‖q‖h(·)‖p

2 收斂性分析

定理1 利用設(shè)計(jì)的算法(3)控制滿足假設(shè)條件1～2的系統(tǒng)(1)，如果下列條件滿足：

1)ρ-1>0；

證明由系統(tǒng)(1)可知:

ek+1(t)=yd(t)-yk+1(t)=ek(t)-[Cexp(At)xk+1(0)-

(6)

根據(jù)假設(shè)1，并把式(3)代入式(6)可得:

D(Ld1Δek(t)+Lp2ek+1(t)+Ld2Δek+1(t))=

(7)

整理式(7)可得:

(8)

式(8)兩邊取Lebesgue-p范數(shù)，并應(yīng)用Young不等式，則得:

‖I+DK2‖‖ek+1(·)‖p≤‖I-DK1‖‖ek(·)‖p+‖Cexp(A·(·))BLd1‖1‖ek-1(·)‖p+‖Cexp(A·(·))BK1‖1‖ek(·)‖p+

‖Cexp(A·(·))BK2‖1‖ek+1(·)‖p+

‖DLd1‖‖ek-1(·)‖p

(9)

整理式(9)得:

(‖I+DK2‖-‖Cexp(A·(·))BK2‖1)‖ek+1(·)‖p≤(‖DLd1‖+‖Cexp(A·(·))BLd1‖1)‖ek-1(·)‖p+(‖I-

DK1‖+‖Cexp(A·(·))BK1‖1)‖ek(·)‖p

(10)

即:

ρ‖ek+1(·)‖p≤ρ1‖ek-1(·)‖p+ρ2‖ek(·)‖p≤

(ρ1+ρ2)max{‖ek-1(·)‖p,‖ek(·)‖p}

(11)

整理式(11)可得:

‖ek+1(·)‖p≤ρ-1(ρ1+ρ2)max{‖ek-1(·)‖p,

‖ek(·)‖p}

(12)

3 仿真實(shí)驗(yàn)

為驗(yàn)證本文算法的有效性，考慮如下一類線性正則系統(tǒng)

(13)

其中，t∈[0,2]。利用算法(3)控制系統(tǒng)(13)，設(shè)期望軌跡yd(t)=sin(5t)，系統(tǒng)初始狀態(tài)為x1(0)=0，x2(0)=0，初始控制取u(t)=0，在滿足收斂條下分別取LP1=0.3，Ld1=0.1，LP2=0.2，Ld2=0.1。為驗(yàn)證本文提出算法(3)的有效性，分別與開環(huán)算法(4)和傳統(tǒng)P型算法(5)進(jìn)行仿真比較，仿真結(jié)果如圖1～3所示。其中：圖1為算法(3)控制時(shí)不同迭代次數(shù)的輸出跟蹤曲線；圖2為在上確界范數(shù)和Lebesgue-2范數(shù)意義下跟蹤誤差曲線；圖3為在Lebesgue-2范數(shù)意義下算法(3)和算法(4)及算法(5)的跟蹤誤差曲線。

圖1 期望軌跡為正弦時(shí)算法(3)的跟蹤效果

圖2 控制算法(3)的跟蹤誤差曲線

圖3 控制算法(3)、(4)和(5)的跟蹤誤差曲線

從圖1可以看出，在第20次迭代后，系統(tǒng)輸出在有限時(shí)間內(nèi)已經(jīng)完全跟蹤上了期望軌跡。由圖2可看出算法(3)的Lebesgue-2范數(shù)和上確界范數(shù)都收斂于0。而從圖3可看出，算法(3)的收斂速度最高，算法(4)次之，算法(5)的收斂速度最低。其原因就在于，算法(4)是在算法(5)的基礎(chǔ)上增加了相鄰兩次迭代時(shí)誤差的差分信號；算法(3)則是當(dāng)前誤差和以前誤差構(gòu)成差分信號，而算法(4)只是利用以前誤差構(gòu)成差分信號，算法(3)相比算法(4)充分利用了當(dāng)前誤差信息。為更好說明本文設(shè)計(jì)的算法(3)的有效性，下面給出算法(3)、算法(4)和算法(5)在不同迭代次數(shù)下跟蹤誤差的數(shù)值，如表1所示。

由表1可以看出，算法(3)、算法(4)和算法(5)在第1次迭代時(shí)跟蹤誤差都是0.999 6，經(jīng)過20次迭代后，算法(5)的誤差為0.029 9，算法(4)的誤差為0.002 0，算法(3)的誤差為0.001 8。從表1的列向數(shù)據(jù)來看，隨迭代次數(shù)增加這3種算法的跟蹤誤差也都能逐次減小，但從表1的橫向數(shù)據(jù)來看，在相同迭代次數(shù)下，算法(3)的跟蹤誤差最小，其次是算法(4)，算法(5)的跟蹤誤差最大。因此，由表1可看出本文設(shè)計(jì)的快速迭代學(xué)習(xí)控制算法(3)的收斂速度明顯高于算法(4)和算法(5)的收斂速度。

表1 算法(3)、(4)和(5)在不同迭代次數(shù)下的跟蹤誤差

圖4 期望軌跡為方波時(shí)算法(3)的跟蹤效果

由圖1和圖4可以看出對于緩變和突變的期望軌跡，本文設(shè)計(jì)的控制算法(3)，隨迭代次數(shù)的增加都能在有限時(shí)間區(qū)間內(nèi)實(shí)現(xiàn)對不同期望軌跡的完全跟蹤。

4 結(jié)語

本文針對一類具有輸入輸出直接傳輸項(xiàng)的線性正則系統(tǒng)，提出了一種快速迭代學(xué)習(xí)控制算法，并在Lebesgue-p范數(shù)意義下證明了算法的收斂性，給出了使算法收斂的范數(shù)形式的充分條件。該算法不僅取得了比傳統(tǒng)P型算法較高的收斂速度，而且還避免了采用λ范數(shù)度量跟蹤誤差的缺陷，增大了學(xué)習(xí)增益選取的自由度。本文也存在一定的不足之處，由于受引理1的卷積限制，本文算法只適用于線性正則系統(tǒng)。因此，在以后研究工作中，可進(jìn)一步分析非線性正則系統(tǒng)在Lebesgue-p范數(shù)意義下的收斂性。

[14] 蘭天一, 林輝. Lebesgue-p范數(shù)意義下對初態(tài)誤差進(jìn)行加速修正的迭代學(xué)習(xí)控制[J]. 控制與決策, 2016, 31(3): 429-434.(LAN T Y, LIN H. Accelerated modify approach for initial state error iterative learning control in sense of Lebesgue-pnorm [J]. Control and Decision, 2016, 31(3): 429-434.)

[15] 蘭天一, 林輝. Lebesgue-p范數(shù)意義下區(qū)間可調(diào)節(jié)的變增益加速迭代學(xué)習(xí)控制[J]. 控制與決策, 2017, 32(11): 2071-2075.(LAN T Y, LIN H. Accelerated iterative learning control algorithm with variable gain and adjustment of interval in sense of Lebesgue-pnorm [J]. Control and Decision, 2017, 32(11): 2071-2075.)

[16] 王洪斌,王艷.機(jī)械臂帶角度修正的開閉環(huán)迭代學(xué)習(xí)軌跡跟蹤控制[J].自動化學(xué)報(bào),2010,36(12):1758-1765.(WANG H B, WANG Y. Open-closed loop ILC corrected with angle relationship of output vectors for tracking control of manipulator [J]. Acta Automatica Sinica, 2010, 36(12): 1758-1765.)

[17] PINSKY M A. Introduction to Fourier Analysis and Wavelets [M]. Pacific Grove: Brooks/Cole, 2002: 169-175.