亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        正則系統(tǒng)在Lebesgue-p范數(shù)意義下的快速迭代學(xué)習(xí)控制

        2018-10-16 08:29:08李艷東王妍瑋
        計(jì)算機(jī)應(yīng)用 2018年9期
        關(guān)鍵詞:收斂性范數(shù)正則

        曹 偉,李艷東,王妍瑋

        (1.齊齊哈爾大學(xué) 計(jì)算機(jī)與控制工程學(xué)院,黑龍江 齊齊哈爾 161006; 2.哈爾濱石油學(xué)院 機(jī)械工程學(xué)院,哈爾濱 150027)

        0 引言

        迭代學(xué)習(xí)控制算法與神經(jīng)網(wǎng)絡(luò)和自適應(yīng)控制等其他學(xué)習(xí)類算法不同,迭代學(xué)習(xí)控制是針對在有限時(shí)間區(qū)間上具有重復(fù)運(yùn)行特性的被控系統(tǒng),利用系統(tǒng)存儲的跟蹤誤差對控制輸入進(jìn)行逐次修正,從而實(shí)現(xiàn)完全跟蹤期望軌跡的目的。由于不需要精確模型信息便可以設(shè)計(jì)迭代學(xué)習(xí)控制器,且結(jié)構(gòu)簡單等優(yōu)點(diǎn),因此迭代學(xué)習(xí)控制[1]自提出以來,無論是在理論研究方面還是在實(shí)際應(yīng)用中都取得了大量研究成果[2-3]。

        到目前為止,關(guān)于迭代學(xué)習(xí)控制大多數(shù)相關(guān)文獻(xiàn)都是在λ范數(shù)度量意義下研究算法的收斂性,并指出在λ足夠大時(shí)算法的收斂性才能夠得到保證[4-5]。由于λ范數(shù)是有上確界的負(fù)指數(shù)函數(shù)型范數(shù),因此不能客觀量化誤差的本質(zhì)特征。文獻(xiàn)[6]研究發(fā)現(xiàn),當(dāng)λ參數(shù)值取得較大時(shí),雖然學(xué)習(xí)算法在理論上是收斂的,但在系統(tǒng)運(yùn)行初始階段誤差的上確界值往往會超出實(shí)際工程允許的誤差范圍。為避免λ范數(shù)上述缺陷,文獻(xiàn)[7]在上確界范數(shù)度量意義下對比例微分(Proportional-Derivative, PD)型迭代學(xué)習(xí)控制算法的收斂性進(jìn)行了研究,發(fā)現(xiàn)學(xué)習(xí)算法只能在系統(tǒng)運(yùn)行時(shí)間區(qū)間的某個(gè)子區(qū)間內(nèi)是收斂的。文獻(xiàn)[8]為使迭代學(xué)習(xí)控制算法在上確界范數(shù)度量意義下是收斂的,研究了運(yùn)行時(shí)間區(qū)間可調(diào)整和學(xué)習(xí)律可子區(qū)間化進(jìn)行修正的算法,但算法結(jié)構(gòu)相當(dāng)復(fù)雜,在實(shí)際工程系統(tǒng)中很難得到應(yīng)用。進(jìn)一步,由于Lebesgue-p范數(shù)同時(shí)考慮了函數(shù)f在整個(gè)時(shí)間區(qū)間上的上確界值和各個(gè)運(yùn)行時(shí)刻函數(shù)值的p次方積分,因此Lebesgue-p范數(shù)在量化和反應(yīng)函數(shù)f的性態(tài)方面顯得更為合理?;诖宋墨I(xiàn)[9]利用Lebesgue-p范數(shù)討論了迭代學(xué)習(xí)控制的跟蹤性能,但沒有涉及算法的收斂性。文獻(xiàn)[10]研究了多狀態(tài)時(shí)滯線性系統(tǒng)迭代學(xué)習(xí)控制的穩(wěn)定性,并利用Lebesgue-2 范數(shù)來評估學(xué)習(xí)算法的跟蹤性能。文獻(xiàn)[11]針對線性時(shí)不變系統(tǒng),在Lebesgue-p范數(shù)度量意義下對具有反饋信息的PD型迭代學(xué)習(xí)控制進(jìn)行了收斂性分析。文獻(xiàn)[12-13]在Lebesgue-p范數(shù)意義下分析了分?jǐn)?shù)階迭代學(xué)習(xí)控制律的收斂性。文獻(xiàn)[14]針對一類線性系統(tǒng)在Lebesgue-p范數(shù)意義下,分析了加速修正初態(tài)誤差的迭代學(xué)習(xí)控制算法的收斂性。進(jìn)一步,文獻(xiàn)[15]在Lebesgue-p范數(shù)意義下,討論了變增益迭代學(xué)習(xí)控制算法的收斂性。分析文獻(xiàn)[10-15]可以發(fā)現(xiàn),雖然這些研究成果避免了采用λ范數(shù)度量跟蹤誤差的缺陷,但這些研究成果都是針對D=0的完全非正則系統(tǒng)進(jìn)行收斂性分析的,其結(jié)論不適用于D≠0的正則系統(tǒng)。原因就在于,對于完全非正則系統(tǒng),迭代學(xué)習(xí)控制律中必須有跟蹤誤差的導(dǎo)數(shù),即微分(Derivative, D)型或比例積分微分(Proportional-Integration-Derivative, PID)型迭代學(xué)習(xí)律,而對于正則系統(tǒng)則只能使用跟蹤誤差來修正控制律,即比例(Proportional, P)型迭代學(xué)習(xí)律。由于傳統(tǒng)P型迭代學(xué)習(xí)算法只利用以往跟蹤誤差來修正控制律,因此跟蹤速度較低。為提高傳統(tǒng)P型迭代學(xué)習(xí)算法的收斂速度,文獻(xiàn)[16]提出了一種迭代學(xué)習(xí)控制算法,但對其收斂性分析仍然采用了λ范數(shù)。

        鑒于以上分析,本文針對一類正則系統(tǒng),為提高傳統(tǒng)P型迭代學(xué)習(xí)算法的收斂速度,同時(shí)克服采用λ范數(shù)度量跟蹤誤差的缺陷,提出了一種充分利用系統(tǒng)以往存儲的跟蹤誤差和當(dāng)前跟蹤誤差信息以及迭代軸上相鄰兩次誤差的差分信號,對控制輸入進(jìn)行逐次修正的快速迭代學(xué)習(xí)控制算法,給出了Lebesgue-p范數(shù)意義下的收斂條件。

        1 問題描述

        考慮如下一類具有重復(fù)運(yùn)行特性的正則系統(tǒng):

        (1)

        其中:k為迭代次數(shù),t∈[0,T]為系統(tǒng)運(yùn)行的有限時(shí)間,xk(t)∈Rn為系統(tǒng)第k次運(yùn)行時(shí)的狀態(tài)向量,uk(t)∈Rr和yk(t)∈Rm分別為系統(tǒng)第k次運(yùn)行時(shí)的控制輸入向量和輸出向量,A、B、C、D為適當(dāng)維數(shù)的矩陣。

        假設(shè)1 每次迭代時(shí)系統(tǒng)初始狀態(tài)與期望初始狀態(tài)保持一致,即xk(0)=xd(0),k=0,1,2,…。

        假設(shè)2 存在唯一的理想輸入ud(t)使式(2)成立:

        (2)

        其中:yd(t)為期望軌跡,xd(t)為期望狀態(tài)。

        1.1 控制目標(biāo)

        本文的控制目標(biāo):針對正則系統(tǒng)(1),為克服傳統(tǒng)P型迭代學(xué)習(xí)控制算法收斂速度較低的不足,設(shè)計(jì)出一種快速迭代迭代學(xué)習(xí)控制算法,同時(shí)利用Lebesgue-p范數(shù)對其收斂性進(jìn)行分析,克服采用λ范數(shù)度量跟蹤誤差的缺陷。

        針對這一控制目標(biāo),快速迭代學(xué)習(xí)控制算法設(shè)計(jì)如下:

        uk+1(t)=uk(t)+Lp1ek(t)+Ld1Δek(t)+Lp2ek+1(t)+

        Ld2Δek+1(t)

        (3)

        其中:ek(t)=yd(t)-yk(t)為第k次運(yùn)行的跟蹤誤差,ek+1(t)=yd(t)-yk+1(t)為第k+1次運(yùn)行的跟蹤誤差。Δek(t)=ek-1(t)-ek(t)和Δek+1(t)=ek(t)-ek+1(t)為迭代軸上相鄰兩次誤差的差分信號,其中Δek(t)稱為上一次的差分信號,Δek+1(t)稱為當(dāng)前次的差分信號。Lp1為第k次跟蹤誤差的學(xué)習(xí)增益,Lp2為第k+1次跟蹤誤差的反饋增益,Ld1和Ld2分別為差分信號的學(xué)習(xí)增益和反饋增益。

        由算法(3)可知,當(dāng)Lp2和Ld2取零時(shí),算法(3)即為開環(huán)迭代學(xué)習(xí)控制算法:

        uk+1(t)=uk(t)+Lp1ek(t)+Ld1Δek(t)

        (4)

        當(dāng)Ld1、Lp2和Ld2都取零時(shí),算法(3)則變?yōu)閭鹘y(tǒng)P型迭代學(xué)習(xí)控制算法:

        uk+1(t)=uk(t)+Lp1ek(t)

        (5)

        現(xiàn)在的問題是針對正則系統(tǒng)(1),采用算法(3)控制,當(dāng)Ld1、Lp2和Ld2滿足什么條件時(shí),系統(tǒng)是收斂的。

        1.2 數(shù)學(xué)基礎(chǔ)

        為便于分析控制算法的收斂性,給出如下定義和引理:

        定義1 向量值函數(shù)f:[0,T] →Rn的λ范數(shù)定義[1]為:

        向量值函數(shù)f的上確界范數(shù)[10]和Lebesgue-p范數(shù)[21]定義為:

        文獻(xiàn)[17]中給出了一個(gè)重要結(jié)論就是:上確界范數(shù)是Lebesgue-p范數(shù)的特例,即:

        引理1[17]如果向量值函數(shù)g,h:[0,T] →R是Lebesgue可積的,那么推廣的卷積Young不等式為:

        ‖(g*h)(·)‖r≤‖g(·)‖q‖h(·)‖p

        2 收斂性分析

        定理1 利用設(shè)計(jì)的算法(3)控制滿足假設(shè)條件1~2的系統(tǒng)(1),如果下列條件滿足:

        1)ρ-1>0;

        證明 由系統(tǒng)(1)可知:

        ek+1(t)=yd(t)-yk+1(t)=ek(t)-[Cexp(At)xk+1(0)-

        (6)

        根據(jù)假設(shè)1,并把式(3)代入式(6)可得:

        D(Ld1Δek(t)+Lp2ek+1(t)+Ld2Δek+1(t))=

        (7)

        整理式(7)可得:

        (8)

        式(8)兩邊取Lebesgue-p范數(shù),并應(yīng)用Young不等式,則得:

        ‖I+DK2‖‖ek+1(·)‖p≤‖I-DK1‖‖ek(·)‖p+‖Cexp(A·(·))BLd1‖1‖ek-1(·)‖p+‖Cexp(A·(·))BK1‖1‖ek(·)‖p+

        ‖Cexp(A·(·))BK2‖1‖ek+1(·)‖p+

        ‖DLd1‖‖ek-1(·)‖p

        (9)

        整理式(9)得:

        (‖I+DK2‖-‖Cexp(A·(·))BK2‖1)‖ek+1(·)‖p≤(‖DLd1‖+‖Cexp(A·(·))BLd1‖1)‖ek-1(·)‖p+(‖I-

        DK1‖+‖Cexp(A·(·))BK1‖1)‖ek(·)‖p

        (10)

        即:

        ρ‖ek+1(·)‖p≤ρ1‖ek-1(·)‖p+ρ2‖ek(·)‖p≤

        (ρ1+ρ2)max{‖ek-1(·)‖p,‖ek(·)‖p}

        (11)

        整理式(11)可得:

        ‖ek+1(·)‖p≤ρ-1(ρ1+ρ2)max{‖ek-1(·)‖p,

        ‖ek(·)‖p}

        (12)

        3 仿真實(shí)驗(yàn)

        為驗(yàn)證本文算法的有效性,考慮如下一類線性正則系統(tǒng)

        (13)

        其中,t∈[0,2]。利用算法(3)控制系統(tǒng)(13),設(shè)期望軌跡yd(t)=sin(5t),系統(tǒng)初始狀態(tài)為x1(0)=0,x2(0)=0,初始控制取u(t)=0,在滿足收斂條下分別取LP1=0.3,Ld1=0.1,LP2=0.2,Ld2=0.1。為驗(yàn)證本文提出算法(3)的有效性,分別與開環(huán)算法(4)和傳統(tǒng)P型算法(5)進(jìn)行仿真比較,仿真結(jié)果如圖1~3所示。其中:圖1為算法(3)控制時(shí)不同迭代次數(shù)的輸出跟蹤曲線;圖2為在上確界范數(shù)和Lebesgue-2范數(shù)意義下跟蹤誤差曲線;圖3為在Lebesgue-2范數(shù)意義下算法(3)和算法(4)及算法(5)的跟蹤誤差曲線。

        圖1 期望軌跡為正弦時(shí)算法(3)的跟蹤效果

        圖2 控制算法(3)的跟蹤誤差曲線

        圖3 控制算法(3)、(4)和(5)的跟蹤誤差曲線

        從圖1可以看出,在第20次迭代后,系統(tǒng)輸出在有限時(shí)間內(nèi)已經(jīng)完全跟蹤上了期望軌跡。由圖2可看出算法(3)的Lebesgue-2范數(shù)和上確界范數(shù)都收斂于0。而從圖3可看出,算法(3)的收斂速度最高,算法(4)次之,算法(5)的收斂速度最低。其原因就在于,算法(4)是在算法(5)的基礎(chǔ)上增加了相鄰兩次迭代時(shí)誤差的差分信號;算法(3)則是當(dāng)前誤差和以前誤差構(gòu)成差分信號,而算法(4)只是利用以前誤差構(gòu)成差分信號,算法(3)相比算法(4)充分利用了當(dāng)前誤差信息。為更好說明本文設(shè)計(jì)的算法(3)的有效性,下面給出算法(3)、算法(4)和算法(5)在不同迭代次數(shù)下跟蹤誤差的數(shù)值,如表1所示。

        由表1可以看出,算法(3)、算法(4)和算法(5)在第1次迭代時(shí)跟蹤誤差都是0.999 6,經(jīng)過20次迭代后,算法(5)的誤差為0.029 9,算法(4)的誤差為0.002 0,算法(3)的誤差為0.001 8。從表1的列向數(shù)據(jù)來看,隨迭代次數(shù)增加這3種算法的跟蹤誤差也都能逐次減小,但從表1的橫向數(shù)據(jù)來看,在相同迭代次數(shù)下,算法(3)的跟蹤誤差最小,其次是算法(4),算法(5)的跟蹤誤差最大。因此,由表1可看出本文設(shè)計(jì)的快速迭代學(xué)習(xí)控制算法(3)的收斂速度明顯高于算法(4)和算法(5)的收斂速度。

        表1 算法(3)、(4)和(5)在不同迭代次數(shù)下的跟蹤誤差

        圖4 期望軌跡為方波時(shí)算法(3)的跟蹤效果

        由圖1和圖4可以看出對于緩變和突變的期望軌跡,本文設(shè)計(jì)的控制算法(3),隨迭代次數(shù)的增加都能在有限時(shí)間區(qū)間內(nèi)實(shí)現(xiàn)對不同期望軌跡的完全跟蹤。

        4 結(jié)語

        本文針對一類具有輸入輸出直接傳輸項(xiàng)的線性正則系統(tǒng),提出了一種快速迭代學(xué)習(xí)控制算法,并在Lebesgue-p范數(shù)意義下證明了算法的收斂性,給出了使算法收斂的范數(shù)形式的充分條件。該算法不僅取得了比傳統(tǒng)P型算法較高的收斂速度,而且還避免了采用λ范數(shù)度量跟蹤誤差的缺陷,增大了學(xué)習(xí)增益選取的自由度。本文也存在一定的不足之處,由于受引理1的卷積限制,本文算法只適用于線性正則系統(tǒng)。因此,在以后研究工作中,可進(jìn)一步分析非線性正則系統(tǒng)在Lebesgue-p范數(shù)意義下的收斂性。

        [14] 蘭天一, 林輝. Lebesgue-p范數(shù)意義下對初態(tài)誤差進(jìn)行加速修正的迭代學(xué)習(xí)控制[J]. 控制與決策, 2016, 31(3): 429-434.(LAN T Y, LIN H. Accelerated modify approach for initial state error iterative learning control in sense of Lebesgue-pnorm [J]. Control and Decision, 2016, 31(3): 429-434.)

        [15] 蘭天一, 林輝. Lebesgue-p范數(shù)意義下區(qū)間可調(diào)節(jié)的變增益加速迭代學(xué)習(xí)控制[J]. 控制與決策, 2017, 32(11): 2071-2075.(LAN T Y, LIN H. Accelerated iterative learning control algorithm with variable gain and adjustment of interval in sense of Lebesgue-pnorm [J]. Control and Decision, 2017, 32(11): 2071-2075.)

        [16] 王洪斌,王艷.機(jī)械臂帶角度修正的開閉環(huán)迭代學(xué)習(xí)軌跡跟蹤控制[J].自動化學(xué)報(bào),2010,36(12):1758-1765.(WANG H B, WANG Y. Open-closed loop ILC corrected with angle relationship of output vectors for tracking control of manipulator [J]. Acta Automatica Sinica, 2010, 36(12): 1758-1765.)

        [17] PINSKY M A. Introduction to Fourier Analysis and Wavelets [M]. Pacific Grove: Brooks/Cole, 2002: 169-175.

        猜你喜歡
        收斂性范數(shù)正則
        Lp-混合陣列的Lr收斂性
        剩余有限Minimax可解群的4階正則自同構(gòu)
        類似于VNL環(huán)的環(huán)
        END隨機(jī)變量序列Sung型加權(quán)和的矩完全收斂性
        基于加權(quán)核范數(shù)與范數(shù)的魯棒主成分分析
        矩陣酉不變范數(shù)H?lder不等式及其應(yīng)用
        行為ND隨機(jī)變量陣列加權(quán)和的完全收斂性
        松弛型二級多分裂法的上松弛收斂性
        有限秩的可解群的正則自同構(gòu)
        一類具有準(zhǔn)齊次核的Hilbert型奇異重積分算子的范數(shù)及應(yīng)用
        亚洲免费人成在线视频观看| 国语对白福利在线观看| 国产精品区一区二区三在线播放| 亚洲av无码精品色午夜| 精品亚洲午夜久久久久| 天堂av一区二区在线| 久久精品国产亚洲av麻豆瑜伽| 欧美俄罗斯40老熟妇| 在线成人福利| 日韩精品中文字幕免费人妻| 人妻少妇中文字幕久久| 日本怡春院一区二区三区| 专区国产精品第一页| 国产一区二区三区视频了| 宅男亚洲伊人久久大香线蕉| 18禁无遮拦无码国产在线播放| 日韩AVAV天堂AV在线| 亚洲综合一区二区三区蜜臀av| 国产av久久在线观看| 亚洲avav天堂av在线网毛片| 一本大道香蕉视频在线观看| 亚洲成人黄色av在线观看| 日本女优在线一区二区三区 | 国产精品又湿又黄九九九久久嫩草| av免费不卡国产观看| 亚洲av有码在线天堂| 国产三级黄色的在线观看| 人妻制服丝袜中文字幕| 国产成人亚洲综合色婷婷| 无码免费人妻超级碰碰碰碰| 日本小视频一区二区三区| 亚洲精品乱码久久久久蜜桃| 亚洲欧美日韩综合久久久| 素人激情福利视频| 国产精品狼人久久影院软件介绍| 国偷自产一区二区免费视频| 91久久国产精品视频| 国产精品自拍网站在线| 欧美成人www在线观看| 偷窥村妇洗澡毛毛多| 黄片午夜免费观看视频国产|