亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        正則系統(tǒng)在Lebesgue-p范數意義下的快速迭代學習控制

        2018-10-16 08:29:08李艷東王妍瑋
        計算機應用 2018年9期
        關鍵詞:收斂性范數正則

        曹 偉,李艷東,王妍瑋

        (1.齊齊哈爾大學 計算機與控制工程學院,黑龍江 齊齊哈爾 161006; 2.哈爾濱石油學院 機械工程學院,哈爾濱 150027)

        0 引言

        迭代學習控制算法與神經網絡和自適應控制等其他學習類算法不同,迭代學習控制是針對在有限時間區(qū)間上具有重復運行特性的被控系統(tǒng),利用系統(tǒng)存儲的跟蹤誤差對控制輸入進行逐次修正,從而實現完全跟蹤期望軌跡的目的。由于不需要精確模型信息便可以設計迭代學習控制器,且結構簡單等優(yōu)點,因此迭代學習控制[1]自提出以來,無論是在理論研究方面還是在實際應用中都取得了大量研究成果[2-3]。

        到目前為止,關于迭代學習控制大多數相關文獻都是在λ范數度量意義下研究算法的收斂性,并指出在λ足夠大時算法的收斂性才能夠得到保證[4-5]。由于λ范數是有上確界的負指數函數型范數,因此不能客觀量化誤差的本質特征。文獻[6]研究發(fā)現,當λ參數值取得較大時,雖然學習算法在理論上是收斂的,但在系統(tǒng)運行初始階段誤差的上確界值往往會超出實際工程允許的誤差范圍。為避免λ范數上述缺陷,文獻[7]在上確界范數度量意義下對比例微分(Proportional-Derivative, PD)型迭代學習控制算法的收斂性進行了研究,發(fā)現學習算法只能在系統(tǒng)運行時間區(qū)間的某個子區(qū)間內是收斂的。文獻[8]為使迭代學習控制算法在上確界范數度量意義下是收斂的,研究了運行時間區(qū)間可調整和學習律可子區(qū)間化進行修正的算法,但算法結構相當復雜,在實際工程系統(tǒng)中很難得到應用。進一步,由于Lebesgue-p范數同時考慮了函數f在整個時間區(qū)間上的上確界值和各個運行時刻函數值的p次方積分,因此Lebesgue-p范數在量化和反應函數f的性態(tài)方面顯得更為合理?;诖宋墨I[9]利用Lebesgue-p范數討論了迭代學習控制的跟蹤性能,但沒有涉及算法的收斂性。文獻[10]研究了多狀態(tài)時滯線性系統(tǒng)迭代學習控制的穩(wěn)定性,并利用Lebesgue-2 范數來評估學習算法的跟蹤性能。文獻[11]針對線性時不變系統(tǒng),在Lebesgue-p范數度量意義下對具有反饋信息的PD型迭代學習控制進行了收斂性分析。文獻[12-13]在Lebesgue-p范數意義下分析了分數階迭代學習控制律的收斂性。文獻[14]針對一類線性系統(tǒng)在Lebesgue-p范數意義下,分析了加速修正初態(tài)誤差的迭代學習控制算法的收斂性。進一步,文獻[15]在Lebesgue-p范數意義下,討論了變增益迭代學習控制算法的收斂性。分析文獻[10-15]可以發(fā)現,雖然這些研究成果避免了采用λ范數度量跟蹤誤差的缺陷,但這些研究成果都是針對D=0的完全非正則系統(tǒng)進行收斂性分析的,其結論不適用于D≠0的正則系統(tǒng)。原因就在于,對于完全非正則系統(tǒng),迭代學習控制律中必須有跟蹤誤差的導數,即微分(Derivative, D)型或比例積分微分(Proportional-Integration-Derivative, PID)型迭代學習律,而對于正則系統(tǒng)則只能使用跟蹤誤差來修正控制律,即比例(Proportional, P)型迭代學習律。由于傳統(tǒng)P型迭代學習算法只利用以往跟蹤誤差來修正控制律,因此跟蹤速度較低。為提高傳統(tǒng)P型迭代學習算法的收斂速度,文獻[16]提出了一種迭代學習控制算法,但對其收斂性分析仍然采用了λ范數。

        鑒于以上分析,本文針對一類正則系統(tǒng),為提高傳統(tǒng)P型迭代學習算法的收斂速度,同時克服采用λ范數度量跟蹤誤差的缺陷,提出了一種充分利用系統(tǒng)以往存儲的跟蹤誤差和當前跟蹤誤差信息以及迭代軸上相鄰兩次誤差的差分信號,對控制輸入進行逐次修正的快速迭代學習控制算法,給出了Lebesgue-p范數意義下的收斂條件。

        1 問題描述

        考慮如下一類具有重復運行特性的正則系統(tǒng):

        (1)

        其中:k為迭代次數,t∈[0,T]為系統(tǒng)運行的有限時間,xk(t)∈Rn為系統(tǒng)第k次運行時的狀態(tài)向量,uk(t)∈Rr和yk(t)∈Rm分別為系統(tǒng)第k次運行時的控制輸入向量和輸出向量,A、B、C、D為適當維數的矩陣。

        假設1 每次迭代時系統(tǒng)初始狀態(tài)與期望初始狀態(tài)保持一致,即xk(0)=xd(0),k=0,1,2,…。

        假設2 存在唯一的理想輸入ud(t)使式(2)成立:

        (2)

        其中:yd(t)為期望軌跡,xd(t)為期望狀態(tài)。

        1.1 控制目標

        本文的控制目標:針對正則系統(tǒng)(1),為克服傳統(tǒng)P型迭代學習控制算法收斂速度較低的不足,設計出一種快速迭代迭代學習控制算法,同時利用Lebesgue-p范數對其收斂性進行分析,克服采用λ范數度量跟蹤誤差的缺陷。

        針對這一控制目標,快速迭代學習控制算法設計如下:

        uk+1(t)=uk(t)+Lp1ek(t)+Ld1Δek(t)+Lp2ek+1(t)+

        Ld2Δek+1(t)

        (3)

        其中:ek(t)=yd(t)-yk(t)為第k次運行的跟蹤誤差,ek+1(t)=yd(t)-yk+1(t)為第k+1次運行的跟蹤誤差。Δek(t)=ek-1(t)-ek(t)和Δek+1(t)=ek(t)-ek+1(t)為迭代軸上相鄰兩次誤差的差分信號,其中Δek(t)稱為上一次的差分信號,Δek+1(t)稱為當前次的差分信號。Lp1為第k次跟蹤誤差的學習增益,Lp2為第k+1次跟蹤誤差的反饋增益,Ld1和Ld2分別為差分信號的學習增益和反饋增益。

        由算法(3)可知,當Lp2和Ld2取零時,算法(3)即為開環(huán)迭代學習控制算法:

        uk+1(t)=uk(t)+Lp1ek(t)+Ld1Δek(t)

        (4)

        當Ld1、Lp2和Ld2都取零時,算法(3)則變?yōu)閭鹘y(tǒng)P型迭代學習控制算法:

        uk+1(t)=uk(t)+Lp1ek(t)

        (5)

        現在的問題是針對正則系統(tǒng)(1),采用算法(3)控制,當Ld1、Lp2和Ld2滿足什么條件時,系統(tǒng)是收斂的。

        1.2 數學基礎

        為便于分析控制算法的收斂性,給出如下定義和引理:

        定義1 向量值函數f:[0,T] →Rn的λ范數定義[1]為:

        向量值函數f的上確界范數[10]和Lebesgue-p范數[21]定義為:

        文獻[17]中給出了一個重要結論就是:上確界范數是Lebesgue-p范數的特例,即:

        引理1[17]如果向量值函數g,h:[0,T] →R是Lebesgue可積的,那么推廣的卷積Young不等式為:

        ‖(g*h)(·)‖r≤‖g(·)‖q‖h(·)‖p

        2 收斂性分析

        定理1 利用設計的算法(3)控制滿足假設條件1~2的系統(tǒng)(1),如果下列條件滿足:

        1)ρ-1>0;

        證明 由系統(tǒng)(1)可知:

        ek+1(t)=yd(t)-yk+1(t)=ek(t)-[Cexp(At)xk+1(0)-

        (6)

        根據假設1,并把式(3)代入式(6)可得:

        D(Ld1Δek(t)+Lp2ek+1(t)+Ld2Δek+1(t))=

        (7)

        整理式(7)可得:

        (8)

        式(8)兩邊取Lebesgue-p范數,并應用Young不等式,則得:

        ‖I+DK2‖‖ek+1(·)‖p≤‖I-DK1‖‖ek(·)‖p+‖Cexp(A·(·))BLd1‖1‖ek-1(·)‖p+‖Cexp(A·(·))BK1‖1‖ek(·)‖p+

        ‖Cexp(A·(·))BK2‖1‖ek+1(·)‖p+

        ‖DLd1‖‖ek-1(·)‖p

        (9)

        整理式(9)得:

        (‖I+DK2‖-‖Cexp(A·(·))BK2‖1)‖ek+1(·)‖p≤(‖DLd1‖+‖Cexp(A·(·))BLd1‖1)‖ek-1(·)‖p+(‖I-

        DK1‖+‖Cexp(A·(·))BK1‖1)‖ek(·)‖p

        (10)

        即:

        ρ‖ek+1(·)‖p≤ρ1‖ek-1(·)‖p+ρ2‖ek(·)‖p≤

        (ρ1+ρ2)max{‖ek-1(·)‖p,‖ek(·)‖p}

        (11)

        整理式(11)可得:

        ‖ek+1(·)‖p≤ρ-1(ρ1+ρ2)max{‖ek-1(·)‖p,

        ‖ek(·)‖p}

        (12)

        3 仿真實驗

        為驗證本文算法的有效性,考慮如下一類線性正則系統(tǒng)

        (13)

        其中,t∈[0,2]。利用算法(3)控制系統(tǒng)(13),設期望軌跡yd(t)=sin(5t),系統(tǒng)初始狀態(tài)為x1(0)=0,x2(0)=0,初始控制取u(t)=0,在滿足收斂條下分別取LP1=0.3,Ld1=0.1,LP2=0.2,Ld2=0.1。為驗證本文提出算法(3)的有效性,分別與開環(huán)算法(4)和傳統(tǒng)P型算法(5)進行仿真比較,仿真結果如圖1~3所示。其中:圖1為算法(3)控制時不同迭代次數的輸出跟蹤曲線;圖2為在上確界范數和Lebesgue-2范數意義下跟蹤誤差曲線;圖3為在Lebesgue-2范數意義下算法(3)和算法(4)及算法(5)的跟蹤誤差曲線。

        圖1 期望軌跡為正弦時算法(3)的跟蹤效果

        圖2 控制算法(3)的跟蹤誤差曲線

        圖3 控制算法(3)、(4)和(5)的跟蹤誤差曲線

        從圖1可以看出,在第20次迭代后,系統(tǒng)輸出在有限時間內已經完全跟蹤上了期望軌跡。由圖2可看出算法(3)的Lebesgue-2范數和上確界范數都收斂于0。而從圖3可看出,算法(3)的收斂速度最高,算法(4)次之,算法(5)的收斂速度最低。其原因就在于,算法(4)是在算法(5)的基礎上增加了相鄰兩次迭代時誤差的差分信號;算法(3)則是當前誤差和以前誤差構成差分信號,而算法(4)只是利用以前誤差構成差分信號,算法(3)相比算法(4)充分利用了當前誤差信息。為更好說明本文設計的算法(3)的有效性,下面給出算法(3)、算法(4)和算法(5)在不同迭代次數下跟蹤誤差的數值,如表1所示。

        由表1可以看出,算法(3)、算法(4)和算法(5)在第1次迭代時跟蹤誤差都是0.999 6,經過20次迭代后,算法(5)的誤差為0.029 9,算法(4)的誤差為0.002 0,算法(3)的誤差為0.001 8。從表1的列向數據來看,隨迭代次數增加這3種算法的跟蹤誤差也都能逐次減小,但從表1的橫向數據來看,在相同迭代次數下,算法(3)的跟蹤誤差最小,其次是算法(4),算法(5)的跟蹤誤差最大。因此,由表1可看出本文設計的快速迭代學習控制算法(3)的收斂速度明顯高于算法(4)和算法(5)的收斂速度。

        表1 算法(3)、(4)和(5)在不同迭代次數下的跟蹤誤差

        圖4 期望軌跡為方波時算法(3)的跟蹤效果

        由圖1和圖4可以看出對于緩變和突變的期望軌跡,本文設計的控制算法(3),隨迭代次數的增加都能在有限時間區(qū)間內實現對不同期望軌跡的完全跟蹤。

        4 結語

        本文針對一類具有輸入輸出直接傳輸項的線性正則系統(tǒng),提出了一種快速迭代學習控制算法,并在Lebesgue-p范數意義下證明了算法的收斂性,給出了使算法收斂的范數形式的充分條件。該算法不僅取得了比傳統(tǒng)P型算法較高的收斂速度,而且還避免了采用λ范數度量跟蹤誤差的缺陷,增大了學習增益選取的自由度。本文也存在一定的不足之處,由于受引理1的卷積限制,本文算法只適用于線性正則系統(tǒng)。因此,在以后研究工作中,可進一步分析非線性正則系統(tǒng)在Lebesgue-p范數意義下的收斂性。

        [14] 蘭天一, 林輝. Lebesgue-p范數意義下對初態(tài)誤差進行加速修正的迭代學習控制[J]. 控制與決策, 2016, 31(3): 429-434.(LAN T Y, LIN H. Accelerated modify approach for initial state error iterative learning control in sense of Lebesgue-pnorm [J]. Control and Decision, 2016, 31(3): 429-434.)

        [15] 蘭天一, 林輝. Lebesgue-p范數意義下區(qū)間可調節(jié)的變增益加速迭代學習控制[J]. 控制與決策, 2017, 32(11): 2071-2075.(LAN T Y, LIN H. Accelerated iterative learning control algorithm with variable gain and adjustment of interval in sense of Lebesgue-pnorm [J]. Control and Decision, 2017, 32(11): 2071-2075.)

        [16] 王洪斌,王艷.機械臂帶角度修正的開閉環(huán)迭代學習軌跡跟蹤控制[J].自動化學報,2010,36(12):1758-1765.(WANG H B, WANG Y. Open-closed loop ILC corrected with angle relationship of output vectors for tracking control of manipulator [J]. Acta Automatica Sinica, 2010, 36(12): 1758-1765.)

        [17] PINSKY M A. Introduction to Fourier Analysis and Wavelets [M]. Pacific Grove: Brooks/Cole, 2002: 169-175.

        猜你喜歡
        收斂性范數正則
        Lp-混合陣列的Lr收斂性
        剩余有限Minimax可解群的4階正則自同構
        類似于VNL環(huán)的環(huán)
        數學雜志(2018年5期)2018-09-19 08:13:48
        END隨機變量序列Sung型加權和的矩完全收斂性
        基于加權核范數與范數的魯棒主成分分析
        矩陣酉不變范數H?lder不等式及其應用
        行為ND隨機變量陣列加權和的完全收斂性
        松弛型二級多分裂法的上松弛收斂性
        有限秩的可解群的正則自同構
        一類具有準齊次核的Hilbert型奇異重積分算子的范數及應用
        欧美成人三级网站在线观看| 欧美成人午夜免费影院手机在线看 | 精品国产中文久久久免费| 精品亚洲成a人在线观看| 精品国产人妻一区二区三区| 亚洲人成精品久久久久| 国产自产在线视频一区| 精品国产一区二区三区av| 人人爽久久涩噜噜噜av| 女人色熟女乱| 国产福利姬喷水福利在线观看| 激情 一区二区| 国产成人激情视频在线观看 | 国产精品无码制服丝袜| 亚洲人成网网址在线看| 亚洲色无码播放| 国产真实伦视频在线视频| 亚洲中文字幕一区精品| 蜜臀亚洲av无码精品国产午夜.| 又硬又粗又大一区二区三区视频| 免费看奶头视频的网站| 日本二区三区视频在线观看| 天天躁夜夜躁狠狠躁婷婷| 男女一边摸一边做爽爽的免费阅读| 日韩精品网| 蜜桃噜噜一区二区三区| 男人和女人做爽爽视频| av无码精品一区二区三区四区| 91久久精品一二三区蜜桃| 粉嫩极品国产在线观看免费一区| 欧美一区二区三区久久综| 国产av成人精品播放| 日本在线观看一区二区视频| 亚洲av无码一区二区三区鸳鸯影院| 一本大道无码av天堂| 中文字幕一区韩国三级| 那有一级内射黄片可以免费看| 精品少妇人妻av无码专区| 在线观看国产一区亚洲bd| 一区二区亚洲精品国产精| 色偷偷av一区二区三区|