摘要:討論了強(qiáng)化學(xué)習(xí)模型,以及基于進(jìn)化學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,在此基礎(chǔ)上結(jié)合強(qiáng)化學(xué)習(xí)的自適應(yīng)能力,通過神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí)對(duì)船舶模型速度進(jìn)行跟蹤控制,并以強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)出神經(jīng)網(wǎng)絡(luò)控制器,最終取得對(duì)船舶模型航行速度的自適應(yīng)控制。經(jīng)過仿真研究,將開發(fā)與訓(xùn)練好的自學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)控制器用于對(duì)船舶模型速度跟蹤控制,所開發(fā)的基于強(qiáng)化學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)控制器具有良好的速度跟蹤性能,控制效果明顯。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);強(qiáng)化學(xué)習(xí);船模速度;自適應(yīng)控制