亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于積分強化學(xué)習的連續(xù)線性不確定系統(tǒng)最優(yōu)控制分析

        2020-12-06 10:48:36陳昱
        河南科技 2020年28期
        關(guān)鍵詞:魯棒性不確定性

        陳昱

        摘 要:針對系統(tǒng)模型參數(shù)未知的連續(xù)系統(tǒng),本文主要分析和驗證魯棒積分強化學(xué)習的必要性。該方法不要求連續(xù)線性系統(tǒng)參數(shù)完全已知,也不需要對動態(tài)模型參數(shù)進行進一步估計。首先,采用優(yōu)化性能的最優(yōu)控制問題,基于動態(tài)規(guī)劃方法得到代數(shù)黎卡提方程;然后,利用積分強化學(xué)習方法,得到迭代貝爾曼方程,進一步利用積分強化學(xué)習算法,分析此算法在針對不確定系統(tǒng)時是否有效;最后,算例仿真驗證在是否考慮不確定性存在狀態(tài)下對連續(xù)線性不確定系統(tǒng)的影響。

        關(guān)鍵詞:積分強化學(xué)習;連續(xù)系統(tǒng);魯棒性;不確定性

        中圖分類號:O232文獻標識碼:A文章編號:1003-5168(2020)28-0012-03

        Optimal Control Analysis of Continuous Linear Uncertain Systems

        Based on Integral Reinforcement Learning

        CHEN Yu

        (College of Innovation and Entrepreneurship, Liaoning University of Petroleum and Chemical Technology,F(xiàn)ushun Liaoning 113000)

        Abstract: For continuous systems with unknown model parameters, the necessity of robust integral reinforcement learning was analyzed and verified in this paper. The method does not require that the parameters of the continuous linear system are completely known, and it does not require further estimation of the parameters of the dynamic model. Firstly, the algebraic Riccati equation was obtained by using the optimal control problem of optimal performance based on dynamic programming. Then, the iterative Bellman equation was obtained by using the integral reinforcement learning method, and the integral reinforcement learning algorithm was further used to analyze whether the algorithm is effective for uncertain systems. Finally, an example was given to verify the influence on the continuous linear uncertain system with or without considering the existence state of uncertainty.

        Keywords: integral reinforcement learning;continuous system;robustness;uncertainty

        1 研究背景

        強化學(xué)習(Reinforcement Learning)又稱再勵學(xué)習、評價學(xué)習或增強學(xué)習,是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習方式,以使獎勵信號(強化信號)函數(shù)值最大??刂葡到y(tǒng)在試錯過程中,外界會針對試錯結(jié)果進行一定的反饋,此過程中強化學(xué)習算法可以調(diào)節(jié)相關(guān)參數(shù)以獲得更好的控制結(jié)果。該算法利用系統(tǒng)的部分或完全動力學(xué)知識來強化學(xué)習系統(tǒng)的控制器。然而,對于許多實際問題很難得到系統(tǒng)動力學(xué)知識。積分強化學(xué)習是針對系統(tǒng)模型參數(shù)未知的連續(xù)系統(tǒng),且無須估計動態(tài)模型參數(shù)的一種強化學(xué)習方法。近年來,隨著對不確定連續(xù)系統(tǒng)研究的深入,研究者們致力于發(fā)展積分強化學(xué)習方法,以獲得不確定動態(tài)系統(tǒng)的最優(yōu)控制器。

        目前,越來越多的研究開始涉獵積分強化學(xué)習并將其應(yīng)用于自動控制領(lǐng)域,其中在連續(xù)線性系統(tǒng)中應(yīng)用較多。采用積分強化學(xué)習方法,不完全依賴系統(tǒng)模型參數(shù),而是利用數(shù)據(jù)學(xué)習狀態(tài)反饋來判斷控制策略是否最優(yōu)。優(yōu)化控制系統(tǒng)性能的研究成果有很多,如研究線性系統(tǒng)最優(yōu)調(diào)節(jié)[1]、近似動態(tài)規(guī)劃最優(yōu)控制[2]、自適應(yīng)容錯控制[3]等。策略學(xué)習(on-policy)指獲取數(shù)據(jù)的動作和最終策略的動作是一致的,非策略學(xué)習(off-policy)即獲取數(shù)據(jù)的動作和最終策略的動作不一致。積分強化學(xué)習涉及兩個關(guān)鍵流程:一是選擇用來獲取數(shù)據(jù)的動作,二是最終用來選擇動作的策略。因此本文采用策略學(xué)習進行動作。從線性連續(xù)系統(tǒng)的相關(guān)文獻[4]來看,其并未考慮不確定性的存在,控制器是否能在存在不確定性的前提下有效使用值得我們深入探究和驗證。

        本論文驗證了一種基于積分強化學(xué)習算法的控制器用以解決連續(xù)線性系統(tǒng)部分參數(shù)未知的線性問題。首先,給出具有不確定性的優(yōu)化問題模型,假設(shè)該系統(tǒng)不存在不確定性,然后給出基于積分強化學(xué)習的數(shù)據(jù)驅(qū)動的算法,以保證系統(tǒng)穩(wěn)定并且優(yōu)化控制器相關(guān)性能指標。之后通過實驗分析表明,在系統(tǒng)存在不確定性并且該不確定性不可忽略的條件下,控制器作用無效即不能保證該線性連續(xù)系統(tǒng)的穩(wěn)定性。最后通過仿真實驗驗證了所提算法對最優(yōu)控制解的收斂程度。

        2 問題闡述

        考慮如下線性連續(xù)時間系統(tǒng):

        猜你喜歡
        魯棒性不確定性
        法律的兩種不確定性
        法律方法(2022年2期)2022-10-20 06:41:56
        武漢軌道交通重點車站識別及網(wǎng)絡(luò)魯棒性研究
        荒漠綠洲區(qū)潛在生態(tài)網(wǎng)絡(luò)增邊優(yōu)化魯棒性分析
        基于確定性指標的弦支結(jié)構(gòu)魯棒性評價
        英鎊或繼續(xù)面臨不確定性風險
        中國外匯(2019年7期)2019-07-13 05:45:04
        基于時差效用的雙目標資源約束型魯棒性項目調(diào)度優(yōu)化
        具有凸多面體不確定性的混雜隨機微分方程的鎮(zhèn)定分析
        具有不可測動態(tài)不確定性非線性系統(tǒng)的控制
        基于非支配解集的多模式裝備項目群調(diào)度魯棒性優(yōu)化
        非接觸移動供電系統(tǒng)不同補償拓撲下的魯棒性分析
        麻豆激情视频在线观看| 国产露脸精品产三级国产av| 五月婷婷激情小说| 亚洲av乱码一区二区三区女同| 国内精品国产三级国产| 性饥渴的农村熟妇| 国产精品对白交换视频| yw193.can尤物国产在线网页| 毛片成人18毛片免费看| 99无码熟妇丰满人妻啪啪| 精品国产18久久久久久| 国产极品视觉盛宴在线观看| 亚洲天堂av一区二区三区不卡| 日本精品少妇一区二区三区| 欧美性xxxx狂欢老少配| 久久久高清免费视频| 国产高清一区二区三区三州| 日韩av无码久久一区二区| 一卡二卡三卡视频| 亚洲va精品va国产va| 亚洲一区二区三区中文字幕网| 精品国产一二三产品区别在哪| 国产一及毛片| 97中文字幕一区二区| 中出人妻希奇杰卡西av| 欧洲freexxxx性少妇播放| 波霸影院一区二区| 中文字幕人妻av四季| 久久久久久欧美精品se一二三四| 伊人色综合九久久天天蜜桃 | 婷婷色婷婷开心五月四房播播| 久久青青热| 成av人片一区二区三区久久| 黄色av一区二区在线观看| 公粗挺进了我的密道在线播放贝壳| 亚洲国产精品午夜电影| 久久九九精品国产不卡一区| 国产国产人免费人成免费视频| 国产v视频| av免费在线观看在线观看| 国产精品久久国产精品99 gif|