亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的控制器設(shè)計研究

        2022-04-07 03:43:10楊恩平薛棟吉
        計算機與數(shù)字工程 2022年3期
        關(guān)鍵詞:深度系統(tǒng)

        楊恩平 薛棟吉

        (南京理工大學(xué)計算機科學(xué)與工程學(xué)院 南京 210000)

        1 引言

        從2006 年,深度學(xué)習(xí)泰斗Hinton[1]提出深度置信網(wǎng)絡(luò)和新的訓(xùn)練方法,克服了神經(jīng)網(wǎng)絡(luò)遇到的瓶頸,到2013 年深度學(xué)習(xí)位列十大突破性科技之首,再到后來AlphaGo 橫空出世擊敗了人類的圍棋大師,到現(xiàn)在人工智能的廣泛運用。這些都是深度學(xué)習(xí)帶給我們的改變。深度學(xué)習(xí)目前在圖像識別、語音識別、文本處理和大數(shù)據(jù)分析方面已經(jīng)被廣泛應(yīng)用,在控制領(lǐng)域方面,深度學(xué)習(xí)也有一定的嘗試。不過目前主要突出的是對控制目標(biāo)識別和狀態(tài)特征提取方面,對于控制領(lǐng)域最核心也是最基礎(chǔ)的控制策略上,深度學(xué)習(xí)目前成果不多。

        深度學(xué)習(xí)是由機器學(xué)習(xí)和多層神經(jīng)網(wǎng)絡(luò)發(fā)展而來,其作為機器學(xué)習(xí)的一個重要的分支存在。在機器學(xué)習(xí)算法中,EM 算法[2]是對自動控制領(lǐng)域方面具有重大貢獻的算法。有了該算法,就可以很方便地使用高斯混合模型(GMM)[3]來表示隱馬爾科夫模型(HMM)狀態(tài)與輸入之間的關(guān)系,從而開發(fā)新的控制系統(tǒng)。在深度學(xué)習(xí)出來之前就有人通過多層神經(jīng)網(wǎng)絡(luò)實現(xiàn)了自適應(yīng)模糊邏輯控制系統(tǒng)[4]。

        作為機器學(xué)習(xí)的分支,深度學(xué)習(xí)擁有更多的隱藏層和神經(jīng)元,并且提高了學(xué)習(xí)性能,通過深度學(xué)習(xí)算法可以解決很多常規(guī)神經(jīng)網(wǎng)絡(luò)解決不了的復(fù)雜問題。本文就是來探索深度學(xué)習(xí)在控制策略上的應(yīng)用。目前韓國慶北大學(xué)的Cheon K[5]等用DBN網(wǎng)絡(luò)來代替PID 控制器進行過研究,證明了深度學(xué)習(xí)算法可以用來代替PID 控制器來控制空載的直流電機。Levine S[6]等分別比較了單層、多層網(wǎng)絡(luò)和RNN 網(wǎng)絡(luò)在粗糙地形運動系統(tǒng)中的作用,研究表明,隨著實驗樣本的增加,多層網(wǎng)絡(luò)和RNN 網(wǎng)絡(luò)性能均優(yōu)于單層神經(jīng)網(wǎng)絡(luò),證明了深度學(xué)習(xí)算法在控制策略中的優(yōu)勢。中科院自動化研究所的王飛躍[7]提出了一種計算智能最優(yōu)控制:自適應(yīng)動態(tài)規(guī)劃,其中利用了DNN網(wǎng)絡(luò)結(jié)構(gòu)作為其核心結(jié)構(gòu)。

        本人由于研究無人機控制系統(tǒng),想探討將深度學(xué)習(xí)應(yīng)用于無人機控制[8~9]上的可能性,參考了機器人運動控制的資料[10],故本文研究了用深度置信網(wǎng)絡(luò)來模擬PID 控制器來控制帶負載的直流電機,以仿真無人機懸停在空中的時候旋翼的控制。本文采用了Matlab/Simulink 進行了仿真,證明了使用深度學(xué)習(xí)算法可以代替?zhèn)鹘y(tǒng)PID 控制器來控制帶負載的直流電機。

        2 深度學(xué)習(xí)

        深度學(xué)習(xí)是常規(guī)神經(jīng)網(wǎng)絡(luò)的擴展算法,其中隱藏層的數(shù)量和神經(jīng)元的數(shù)量比常規(guī)神經(jīng)網(wǎng)絡(luò)的要多。在控制系統(tǒng)中,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)已得到充分證明,并用作控制器設(shè)計,系統(tǒng)目標(biāo)識別,自動調(diào)優(yōu)和狀態(tài)特征提取的工具。盡管深度學(xué)習(xí)比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)更有效,但目前深度學(xué)習(xí)在控制領(lǐng)域的應(yīng)用還不普及,尤其是在大數(shù)據(jù)中。

        目前有很多的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),比較常見的有基于受限玻爾茲曼機(RBM)的深度置信網(wǎng)絡(luò)(DBN)[11]、基于自動編碼器(AE)的堆疊自動編碼器(SAE)[12]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)[13]、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[14]等,在本實驗中由于訓(xùn)練條件以及控制系統(tǒng)的特性決定選擇深度置信網(wǎng)絡(luò)(DBN)。

        深度置信網(wǎng)絡(luò)(DBN)是有多個RBM 堆疊而成。把RBM 隱藏層的層數(shù)增加,可以得到深度玻爾茲曼機(DBM),當(dāng)把靠近可視層部分的網(wǎng)絡(luò)換成貝葉斯置信網(wǎng)絡(luò),而最遠離可視層的部分使用RBM的時候,就可以得到DBN。

        不同于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò),DBN算法的訓(xùn)練過程分為兩個過程,即預(yù)訓(xùn)練和全局微調(diào)。DBN算法包括三個步驟如下,其中步驟1 和步驟2 是預(yù)訓(xùn)練過程,步驟3是微調(diào)過程。

        步驟1:輸入數(shù)據(jù)進入RBM 的可視層,然后考慮第一權(quán)重值,數(shù)據(jù)將被傳輸?shù)诫[藏層。

        步驟2:第一層隱藏層成為第二層可視層,并通過考慮第二權(quán)重值將數(shù)據(jù)傳輸?shù)降诙[藏層。同樣,第二隱藏層成為第三可視層,并將數(shù)據(jù)傳輸?shù)降谌[藏層。以此類推,逐層訓(xùn)練,直到將所有的RBM訓(xùn)練完畢。

        步驟3:全局微調(diào)階段,以訓(xùn)練好的RBM 之間的權(quán)重和偏置作為深度信念網(wǎng)絡(luò)的初始權(quán)重和偏置,以數(shù)據(jù)的標(biāo)簽作為監(jiān)督信號計算網(wǎng)絡(luò)誤差,利用BP 算法計算各層誤差,使用梯度下降法完成各層權(quán)重和偏置的調(diào)節(jié)。

        在預(yù)訓(xùn)練階段,只使用了輸入數(shù)據(jù),沒有使用數(shù)據(jù)標(biāo)簽,屬于無監(jiān)督的學(xué)習(xí),另外,在微調(diào)階段,是有監(jiān)督的學(xué)習(xí),可以根據(jù)具體的應(yīng)用場景換成不同的分類器模型,不必是BP 網(wǎng)絡(luò)。具體的算法框架如圖1所示,這里采用的是三層的RBM。

        圖1 深度置信網(wǎng)絡(luò)框架

        3 深度學(xué)習(xí)控制器設(shè)計

        本次實驗設(shè)計主要分為三個部分,第一部分是深度學(xué)習(xí)控制器的設(shè)計,主要是包括了數(shù)據(jù)采集過程和控制器設(shè)計過程;第二部分是直流電機的說明,主要包括直流電機簡單的建模過程;第三部分是深度學(xué)習(xí)控制器系統(tǒng)的介紹。

        3.1 深度學(xué)習(xí)控制器

        傳統(tǒng)的PID控制器控制直流電機的過程如圖2所示,系統(tǒng)的輸入為電壓v,輸出為轉(zhuǎn)速w,其中在期望電壓輸入到PID 控制器之前,會與之前的反饋值進行做差,得到e(t)作為控制偏差再輸入到PID控制器中。本實驗中,會對傳統(tǒng)PID 控制器系統(tǒng)進行數(shù)據(jù)采集,采集對象為PID 控制器的輸入信號和PID 控制器輸出到直流電機的信號,采集到的數(shù)據(jù)用于深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練。

        圖2 PID控制器控制直流電機過程圖

        在得到了訓(xùn)練數(shù)據(jù)之后分別把PID 的輸入/輸出數(shù)據(jù)作為深度學(xué)習(xí)算法的輸入/目標(biāo)數(shù)據(jù),將深度學(xué)習(xí)控制器調(diào)整為能夠替換原始PID 控制器,如圖3所示。

        圖3 深度學(xué)習(xí)控制器學(xué)習(xí)代替PID過程

        最后再把PID 控制器去掉,使用訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò)來控制直流電機,并與PID 控制器的系統(tǒng)響應(yīng)圖做對比。

        本文中采用DBN 網(wǎng)絡(luò)作為替代PID 控制器的深度學(xué)習(xí)網(wǎng)絡(luò),本網(wǎng)絡(luò)是基于Masayuki Tanaka[15]開發(fā)的Deep Neural Network 工具箱的搭建的,由于原本該工具箱中的DBN 網(wǎng)絡(luò)是用作模式識別的工具,而本文中用來作為控制器工具,所以,在原來的基礎(chǔ)上進行了一些修改,其中隱藏層由3 層組成,每層包含了50個神經(jīng)元。迭代次數(shù)設(shè)置的200次,學(xué)習(xí)率為0.01,丟失率為0.4。

        在RBM 的選擇上,工具箱里面提供了多種RBM 可供選擇,包括:BBPRBM(Beta-Bernoulli 過程RBM)[16],GBRBM(Gaussian-Bernoulli RBM)和BBRBM(Bernoulli-Bernoulli RBM)。本文選擇了GBRBM 結(jié)構(gòu)的RBM,因為GBRBM 中加入了高斯噪音的連續(xù)值,其可視層可以處理連續(xù)實值隨機變量。本文使用ReLU函數(shù)作為激活函數(shù)。

        3.2 直流電動機說明

        本文采用的直流電動機,其動力學(xué)方程如下:

        其中,J是轉(zhuǎn)子的慣性矩,Kt是電動機轉(zhuǎn)矩常數(shù),i是電樞電流,b是電動機粘性摩擦常數(shù),L是電感,R是電阻,Ke是電動勢常數(shù)。具體直流電動機的參數(shù)值如表1所示。

        表1 直流電動機參數(shù)表

        3.3 系統(tǒng)介紹

        本文在Matlab/Simulink 中進行了系統(tǒng)設(shè)計,如圖4,是給出了在Maltab/Simlink 環(huán)境下,深度學(xué)習(xí)控制器控制帶負載的直流電機系統(tǒng)圖。其中包含了轉(zhuǎn)矩擾動模塊、傳感器噪音模塊,模數(shù)轉(zhuǎn)換器模塊、深度學(xué)習(xí)控制器模塊和直流電機模塊。

        圖4 深度學(xué)習(xí)控制器系統(tǒng)

        4 實驗結(jié)果與分析

        本實驗在Matlab/Simlink R2018b 中完成。一次實驗過程的時間是t=10s,系統(tǒng)在第1s、第5s、第7s 發(fā)生變化,將10s 實驗過程分割成3 段。在第1s的時候,系統(tǒng)的期望轉(zhuǎn)速從0變成了2,在第5s的時候,給系統(tǒng)加上了0.2 的轉(zhuǎn)矩擾動,即為負載,在第7s 的時候,期望轉(zhuǎn)速從2 變成了-2,以測試在階躍信號下控制器的性能。

        實驗中,經(jīng)過反復(fù)調(diào)試計算,得到了比較滿意的PID 控制器的系統(tǒng)響應(yīng),如圖5,然后DBN 算法學(xué)習(xí)了該PID 控制器,從而得到了深度學(xué)習(xí)控制器,深度學(xué)習(xí)控制器系統(tǒng)響應(yīng)如圖6,為了更詳細地比較,在圖7 中顯示了PID 控制器和深度學(xué)習(xí)控制器的殘差圖,并在表2 中展示了在0~5s、5s~7s 和7s~10s 這3 個階段中,PID 控制器和深度學(xué)習(xí)控制器的RMSE值。

        從圖5 和圖6 中可以看出,深度學(xué)習(xí)控制器可以模仿的與PID 控制器的效果幾乎一模一樣,肉眼已經(jīng)看不出來區(qū)別,可以得到在訓(xùn)練次數(shù)足夠的情況下,深度學(xué)習(xí)控制器可以代替PID 控制帶負載的直流電機。從圖7 中,可以發(fā)現(xiàn),在系統(tǒng)發(fā)生變化的過渡階段,深度學(xué)習(xí)控制器與PID 控制器的殘差相對較大,但是1.2s 之后殘差就都為零。另外,從表2 中可以得到,在任何階段,兩個控制器控制效果之間的RMSE變化都非常小,都是10-2數(shù)量級,因此也可以證明深度學(xué)習(xí)控制器很好的控制帶負載的直流電機。

        圖5 PID控制器的系統(tǒng)響應(yīng)

        圖6 深度學(xué)習(xí)控制器的系統(tǒng)響應(yīng)

        圖7 PID控制器和深度學(xué)習(xí)控制器殘差變化

        表2 PID控制器和深度學(xué)習(xí)控制器RMSE值

        5 結(jié)語

        本文設(shè)計了一種基于DBN 算法的深度學(xué)習(xí)控制器,用來控制帶負載的直流電機,以探索在用深度學(xué)習(xí)控制器來代替PID 控制器的可能性。本文對PID 控制器和深度學(xué)習(xí)控制之間進行了比較。事實證明,深度學(xué)習(xí)控制器在性能上與PID 控制器性能一樣優(yōu)秀,可以用來代替PID 控制器。本文研究的是增加了一個固定的負載,來模擬無人機懸停狀態(tài)下的工作狀態(tài),但是無人機的飛行過程中姿態(tài)是經(jīng)常變化的,而且控制算法中PID 也只是其中比較經(jīng)典的一種,未來可以研究深度學(xué)習(xí)控制器在面對線性負載和非線性負載的時候來代替?zhèn)鹘y(tǒng)控制器的可能性。

        猜你喜歡
        深度系統(tǒng)
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無人機系統(tǒng)
        ZC系列無人機遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        深度理解一元一次方程
        基于PowerPC+FPGA顯示系統(tǒng)
        半沸制皂系統(tǒng)(下)
        深度觀察
        深度觀察
        深度觀察
        深度觀察
        国产亚洲欧洲aⅴ综合一区| 色窝综合网| 久久99国产精品久久99密桃| 色佬精品免费在线视频| 少妇aaa级久久久无码精品片| 岛国av无码免费无禁网站下载| 91极品尤物在线观看播放| 国产av丝袜熟女丰满一区二区| 精品无人码麻豆乱码1区2区| 日韩精品一区二区亚洲av| 丰满熟妇人妻av无码区| 日韩精品一区二区亚洲观看av| 久久性爱视频| 久久久久麻豆v国产精华液好用吗 欧美性猛交xxxx乱大交丰满 | 国产精品国产三级国产剧情| 精品乱人伦一区二区三区| 狠狠躁夜夜躁人人爽天天天天97| 亚洲香蕉毛片久久网站老妇人| 免费视频亚洲一区二区三区| 无码小电影在线观看网站免费| 美女大量吞精在线观看456| 高潮社区51视频在线观看| 日本亚洲系列中文字幕| 久久精品亚洲一区二区三区浴池| av大片在线无码免费| 亚洲国产av一区二区三| 免费黄片小视频在线播放| 少妇av射精精品蜜桃专区| 久久精品国产91久久性色tv| 国产精品黄色av网站| 欧美颜射内射中出口爆在线| 国产一区二区三区影院 | 久久深夜中文字幕高清中文| 久久国产精品一区二区三区| 国产精品无码a∨精品影院| 丁香六月久久| 一区二区三区亚洲视频| 欧洲美女黑人粗性暴交| 国产AV无码一区精品天堂| 91精品福利一区二区三区| 久久亚洲日韩精品一区二区三区|