韓軍政 馬軍 桑和成
摘 要
針對傳統(tǒng)PID控制不能實(shí)現(xiàn)移動機(jī)器人在避障中參數(shù)的自整定、響應(yīng)慢等問題,本文提出一種BP神經(jīng)網(wǎng)絡(luò)PID控制方法,利用BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法實(shí)現(xiàn)了PID三個(gè)參數(shù)的在線自整定。仿真實(shí)驗(yàn)表明,BP神經(jīng)網(wǎng)絡(luò)PID控制具有更快的響應(yīng)速度、無明顯超調(diào)、控制精度高,能滿足機(jī)器人避障運(yùn)動的控制要求。
關(guān)鍵詞
避障;自整定;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號: TP183;TP242 文獻(xiàn)標(biāo)識碼: A
DOI:10.19694/j.cnki.issn2095-2457.2020.03.014
0 引言
隨著智能機(jī)器人技術(shù)的快速發(fā)展,移動機(jī)器人得到了廣泛的應(yīng)用。移動機(jī)器人在進(jìn)行避障時(shí)選擇的算法不同,文獻(xiàn)[1]提出了一種神經(jīng)網(wǎng)絡(luò)控制的機(jī)器人避障運(yùn)動方法,用于障礙物識別和避障;文獻(xiàn)[2]提出了一種BP神經(jīng)網(wǎng)絡(luò) PID 控制器設(shè)計(jì)的方法,可以實(shí)現(xiàn)參數(shù)的在線自我調(diào)整,控制效果優(yōu)于傳統(tǒng)方法。根據(jù)移動機(jī)器人在避障過程中的實(shí)際需求,傳統(tǒng)控制算法很難達(dá)到精確控制,本文給出了一種BP神經(jīng)網(wǎng)絡(luò)PID的控制方法,為移動機(jī)器人實(shí)時(shí)避障提供了一種新的控制方法。
1 BP神經(jīng)網(wǎng)絡(luò)PID控制器設(shè)計(jì)
PID控制器是使用最廣泛的控制器,它操作簡單方便,控制精度較高。而移動機(jī)器人避障系統(tǒng)是一個(gè)復(fù)雜的控制對象,無法建立精確的數(shù)學(xué)模型,傳統(tǒng)PID控制就不能滿足實(shí)際需要。針對移動機(jī)器人避障運(yùn)動復(fù)雜性特點(diǎn),將神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)PID控制相結(jié)合,既能體現(xiàn)神經(jīng)網(wǎng)絡(luò)的靈活性強(qiáng)和自適應(yīng)學(xué)習(xí)能力好的一面,又具有PID控制器精度高的優(yōu)勢,在一定程度上能增強(qiáng)避障運(yùn)動系統(tǒng)的自適應(yīng)能力。BP神經(jīng)網(wǎng)絡(luò)PID控制器由兩部分構(gòu)成:(1)傳統(tǒng)PID控制器,它是一個(gè)閉環(huán)控制系統(tǒng),根據(jù)被控對象反饋的信息逐步減小誤差,使輸出量滿足期望值;(2)BP神經(jīng)網(wǎng)絡(luò):有著很好的自學(xué)習(xí)能力,能實(shí)時(shí)調(diào)整PID控制器的輸出參數(shù),不斷地學(xué)習(xí)、減小誤差,可以實(shí)現(xiàn)輸出量的最優(yōu)化,即PID控制器的三個(gè)參數(shù)Kp,Ki,Kd。神經(jīng)網(wǎng)絡(luò)經(jīng)過自身的在線學(xué)習(xí)、權(quán)值系數(shù)不斷地修正,使得運(yùn)動控制系統(tǒng)能在很短的時(shí)間內(nèi)達(dá)到穩(wěn)定狀態(tài)。
2 移動機(jī)器人避障運(yùn)動控制策略
移動機(jī)器人按一定的速度直線行走,當(dāng)位于前端的傳感器檢測到正前方有障礙物時(shí),路況信息會反饋給機(jī)器人,其控制模塊的微處理器會產(chǎn)生新的PWM信號,通過電動機(jī)驅(qū)動模塊來控制電動機(jī)的速度和轉(zhuǎn)向。電機(jī)轉(zhuǎn)動后,霍爾傳感器將會檢測到電機(jī)的脈沖數(shù)并將其重新傳輸?shù)娇刂颇K,控制模塊計(jì)算出車輪的實(shí)際轉(zhuǎn)速,再把實(shí)際轉(zhuǎn)速與預(yù)定轉(zhuǎn)速的差值輸入到神經(jīng)網(wǎng)絡(luò)PID控制器中,經(jīng)神經(jīng)網(wǎng)絡(luò)PID算法學(xué)習(xí)后,給控制器輸出新的PWM占空比再次控制電機(jī),使輸出的實(shí)際轉(zhuǎn)速與預(yù)定轉(zhuǎn)速一致。神經(jīng)網(wǎng)絡(luò)PID控制的基本思想是將閉環(huán)系統(tǒng)反饋回來的實(shí)際運(yùn)動速度與預(yù)定速度進(jìn)行比較,并將其速度偏差作為輸入量送入BP神經(jīng)網(wǎng)絡(luò)PID控制器中,經(jīng)過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法訓(xùn)練后,系統(tǒng)會快速的響應(yīng)達(dá)到穩(wěn)定狀態(tài),在此狀態(tài)下輸出最優(yōu)的控制參數(shù),從而實(shí)現(xiàn)參數(shù)的在線自我整定。這種模型控制方法大大提高了機(jī)器人避障的靈活性和精確性,對移動機(jī)器人直線運(yùn)動的精度有了很大的改善。
3 仿真與分析
仿真實(shí)驗(yàn)時(shí),初始化每個(gè)參數(shù),對神經(jīng)網(wǎng)絡(luò)的輸入、輸出權(quán)值進(jìn)行賦值。在多次訓(xùn)練后,選取慣性系數(shù)α=0.1,學(xué)習(xí)速率η=0.25;設(shè)置采樣周期ts=0.001s,步長k=1000。根據(jù)達(dá)到設(shè)置誤差的時(shí)間長短來判斷神經(jīng)網(wǎng)絡(luò)的訓(xùn)練步數(shù)。本文以無刷直流電機(jī)的二階傳遞函數(shù)為被控對象,電機(jī)的傳遞函數(shù)為:
G(s)=
對PID控制器的各個(gè)參數(shù)系數(shù)賦值,kp=0.05、ki=0.03、kd=0.01。Matlab仿真結(jié)果如圖1-2所示。對比圖1和圖2,可以得出BP神經(jīng)網(wǎng)絡(luò)PID的控制效果好于傳統(tǒng)的PID控制。根據(jù)系統(tǒng)達(dá)到穩(wěn)定的時(shí)間判斷訓(xùn)練步數(shù)可知,BP神經(jīng)網(wǎng)絡(luò)PID控制在第50步時(shí)響應(yīng)值為1,無明顯超調(diào);傳統(tǒng)PID控制的系統(tǒng)振蕩了兩次,最大超調(diào)量為21%,并在第100步時(shí)達(dá)到響應(yīng)值為1。從誤差曲線中可以看出,系統(tǒng)達(dá)到穩(wěn)定時(shí),BP神經(jīng)網(wǎng)絡(luò)控制器響應(yīng)較快,誤差變化率較小。因此得出結(jié)果,BP神經(jīng)網(wǎng)絡(luò)PID控制算法具有較高的響應(yīng)速度和較強(qiáng)的在線學(xué)習(xí)適應(yīng)能力。
4 結(jié)論
文中提出的基于BP神經(jīng)網(wǎng)絡(luò)PID控制方法克服了傳統(tǒng)PID控制效果不良及參數(shù)整定困難等缺陷,實(shí)現(xiàn)了BP神經(jīng)網(wǎng)絡(luò)PID控制的快速高效、參數(shù)實(shí)時(shí)整定和最優(yōu)的控制輸出;能滿足移動機(jī)器人避障運(yùn)動的控制要求,具有一定的現(xiàn)實(shí)應(yīng)用價(jià)值。
參考文獻(xiàn)
[1]張素芹.機(jī)器人BP神經(jīng)網(wǎng)絡(luò)避障控制模型構(gòu)建及仿真[J].西安工業(yè)大學(xué)學(xué)報(bào),2015,35(08):678-682.
[2]張永振,蘇寒松,劉高華,廖澤龍.基于BP神經(jīng)網(wǎng)絡(luò)的PID控制器參數(shù)調(diào)整[J].南開大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,51(03):26-30.