亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于雙參數(shù)自適應(yīng)優(yōu)化的無人履帶車輛軌跡跟蹤控制

        2023-05-23 01:41:44盧佳興劉海鷗關(guān)海杰李德潤陳慧巖劉龍龍
        兵工學(xué)報 2023年4期
        關(guān)鍵詞:模型

        盧佳興, 劉海鷗, 關(guān)海杰, 李德潤, 陳慧巖, 劉龍龍

        (北京理工大學(xué) 機(jī)械與車輛學(xué)院, 北京 100081)

        0 引言

        近年來,地面無人平臺在港口運(yùn)輸、疫情防控、野外搜救以及戰(zhàn)場環(huán)境中得到了越來越多的應(yīng)用,軌跡跟蹤控制作為無人駕駛的關(guān)鍵技術(shù),其發(fā)展也得到了越來越多學(xué)者的關(guān)注,其中以模型預(yù)測的控制算法應(yīng)用較多[1-4]。然而,目前大多數(shù)都是基于定參數(shù)的軌跡跟蹤控制算法,很難保證車輛在復(fù)雜多變工況下的跟蹤精度和穩(wěn)定性?;诖?有學(xué)者提出自適應(yīng)參數(shù)調(diào)整算法,包括更精確的車輛模型參數(shù)在線估計、更合理的控制系統(tǒng)結(jié)構(gòu)設(shè)計以及更高效的優(yōu)化算法架構(gòu)設(shè)計等。Zhao等[5]結(jié)合瞬時轉(zhuǎn)向中心模型提出履帶車輛滑動參數(shù)實(shí)時估計算法,對越野工況下的履帶車輛軌跡跟蹤進(jìn)行了探究。但由于越野工況下地面-履帶的相互作用關(guān)系難以精確表征,因此基于車輛模型參數(shù)在線估計的方法很難為系統(tǒng)提供穩(wěn)定、可靠的輸入,且在線估計對系統(tǒng)的實(shí)時資源配置要求較高。Pereida等[6]提出了將模型預(yù)測控制(MPC)與底層控制器相結(jié)合的框架。Yuan等[7]基于模糊推理、預(yù)瞄模型、預(yù)瞄點(diǎn)搜索算法建立了自適應(yīng)軌跡跟蹤控制系統(tǒng),提升了不同速度下軌跡跟蹤的工況適應(yīng)性。李睿等[8]基于自動駕駛履帶車輛的運(yùn)動學(xué)與動力學(xué)耦合模型,采用自適應(yīng)控制方法對模型進(jìn)行前饋補(bǔ)償。Wang等[9]基于多層感知機(jī)(MLP)神經(jīng)網(wǎng)絡(luò)和貝葉斯優(yōu)化相結(jié)合的算法,提升了控制性能。這些研究成果證明了以MPC為基本框架,通過增加前饋、數(shù)據(jù)學(xué)習(xí)等方式提升軌跡跟蹤性能的有效性,但是缺乏在實(shí)際高速履帶平臺的驗(yàn)證。

        模型預(yù)測軌跡跟蹤算法中,影響控制效果的控制參數(shù)主要包括代價函數(shù)中的各權(quán)重系數(shù)、控制時域中的相關(guān)參數(shù)等,其中控制時域長度和控制時間步長影響較大[7,10]?;趯W(xué)習(xí)的控制參數(shù)自適應(yīng)軌跡跟蹤算法的主要建模過程包括最優(yōu)參數(shù)組合評價與提取、在線最優(yōu)控制參數(shù)預(yù)測兩部分。在最優(yōu)參數(shù)提取方面,可變慣性權(quán)重的改進(jìn)粒子群優(yōu)化(PSO)算法已被學(xué)者廣泛應(yīng)用。趙新等[11]基于改進(jìn)PSO算法建立引信與戰(zhàn)斗部配合威力計算模型,實(shí)現(xiàn)了更高精度的最大殺傷面積計算和更快的收斂速度。譚頓等[12]將改進(jìn)PSO算法用于尋找同步控制系統(tǒng)的最優(yōu)PID系數(shù),有效減小了系統(tǒng)超調(diào)與同步控制誤差,提升了系統(tǒng)響應(yīng)速度。在線最優(yōu)參數(shù)預(yù)測方面,常用的算法有高斯混合回歸、支持向量機(jī)[13]、分類與回歸決策樹[14]、神經(jīng)網(wǎng)絡(luò)[15]等。其中,基于神經(jīng)網(wǎng)絡(luò)的算法應(yīng)用較廣。牛江川等[16]利用盾構(gòu)施工案例的大量歷史數(shù)據(jù)作為樣本數(shù)據(jù),基于PSO-反向傳播(BP)神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,實(shí)現(xiàn)盾構(gòu)刀具配置方案的合理推薦,在計算精度和訓(xùn)練時間上實(shí)現(xiàn)了較大的提升。但未見在無人履帶車輛方面的研究成果。

        本文基于改進(jìn)PSO-MLP算法,以控制時域長度tl和控制時間步長ts為優(yōu)化目標(biāo),以離線和在線相結(jié)合的方式,設(shè)計一種雙參數(shù)自適應(yīng)優(yōu)化的無人履帶車輛軌跡跟蹤控制算法,總體框架如圖1所示。離線部分,首先對不同控制參數(shù)下的履帶車輛軌跡跟蹤響應(yīng)狀態(tài)信息進(jìn)行提取,得到包含運(yùn)動基元類型、參考軌跡Sr、軌跡跟蹤響應(yīng)信息、車輛狀態(tài)ξ(k)以及控制參數(shù)的車輛歷史數(shù)據(jù)集合DH;然后,基于改進(jìn)PSO算法得到不同運(yùn)動基元下的最優(yōu)控制參數(shù)組合,并構(gòu)建訓(xùn)練數(shù)據(jù)集,利用學(xué)習(xí)率自適應(yīng)優(yōu)化算法完成對MLP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練。在線部分,首先對運(yùn)動基元類型和車輛狀態(tài)進(jìn)行特征匹配,基于MLP神經(jīng)網(wǎng)絡(luò)對控制時間步長ts和控制時域長度tl進(jìn)行預(yù)測,為軌跡跟蹤控制模塊提供自適應(yīng)雙參數(shù)輸入。然后,結(jié)合自適應(yīng)參數(shù)輸入、車輛模型、約束條件C以及代價函數(shù)等建立軌跡跟蹤控制器,得到最優(yōu)控制量u,實(shí)現(xiàn)雙側(cè)獨(dú)立電驅(qū)動履帶平臺的自適應(yīng)軌跡跟蹤控制。

        圖1 總體框架Fig.1 Overall framework

        1 履帶車輛模型

        本文基于履帶車輛運(yùn)動學(xué)模型生成MPC控制器的狀態(tài)空間。同時,為彌補(bǔ)車輛運(yùn)動學(xué)模型往往忽略車輛動力學(xué)特性的缺陷,引入履帶車輛動力學(xué)模型,為運(yùn)動學(xué)模型提供安全邊界。

        1.1 履帶車輛運(yùn)動學(xué)模型

        本文的研究對象為雙側(cè)獨(dú)立電驅(qū)動履帶車輛,根據(jù)履帶車輛的差速轉(zhuǎn)向特性,為了與規(guī)劃模塊生成的參考軌跡的坐標(biāo)方向保持統(tǒng)一,建立圖2所示的履帶車輛運(yùn)動學(xué)模型。

        圖2 履帶車輛運(yùn)動學(xué)模型Fig.2 Kinematics model of a tracked vehicle

        圖2中:OXY為固連于地面的慣性坐標(biāo)系,坐標(biāo)軸OX、OY所在平面與路面重合;oxy為固連于履帶車輛并隨履帶車輛共同運(yùn)動的牽連坐標(biāo)系,o(x0,y0)位于履帶車輛的幾何中心,ox為車輛的橫向方向,oy為車輛的縱向方向,且ox、oy所在平面與路面平行;vx、vy分別為車輛的橫向速度、縱向速度,ωz為車輛的橫擺角速度,定義逆時針為正,φ為車輛的航向角;o′(x′0,y′0)為慣性坐標(biāo)系中履帶車輛的瞬時轉(zhuǎn)向中心,oL(x′L,y′L)、oH(x′H,y′H)分別為低速側(cè)履帶、高速側(cè)履帶接地面的瞬時轉(zhuǎn)向中心(轉(zhuǎn)向極),三者中心在一條垂直于車輛縱向?qū)ΨQ面的直線上;vqL、vqH分別為低速側(cè)和高速側(cè)履帶上PL、PH點(diǎn)的牽連速度;vjL、vjH分別為低速側(cè)和高速側(cè)履帶的卷繞速度。

        履帶車輛通過調(diào)整兩側(cè)履帶的速差實(shí)現(xiàn)轉(zhuǎn)向操控,在固連于地面的空間笛卡爾坐標(biāo)系下,車輛的狀態(tài)向量可以表示為ξ(x0,y0,φ),由車輛位置坐標(biāo)和車輛航向角組成,則履帶車輛的運(yùn)動學(xué)模型可以描述為

        (1)

        基于傳統(tǒng)的運(yùn)動學(xué)模型,當(dāng)履帶的卷繞速度為0 m/s時,無法通過表達(dá)式反求出履帶的卷繞速度,基于瞬時轉(zhuǎn)向中心的運(yùn)動學(xué)模型可以很好地解決這個問題[17]。根據(jù)圖2中建立的履帶車輛運(yùn)動學(xué)模型坐標(biāo)系體系,結(jié)合文獻(xiàn)[17]中的模型建立過程,推導(dǎo)得到如式(2)所示的基于瞬時轉(zhuǎn)向中心的履帶車輛運(yùn)動學(xué)微分方程:

        (2)

        1.2 履帶車輛動力學(xué)模型

        履帶車輛特殊的驅(qū)動方式,導(dǎo)致履帶和地面的相互作用關(guān)系的復(fù)雜性,為簡化建模,進(jìn)行如下所示的假設(shè)[18]:

        1)車輛在轉(zhuǎn)向過程中,不考慮履帶的沉陷作用和推土作用;

        2)履帶載荷沿著履帶長度方向均勻分布;

        3)在進(jìn)行阻力分析時,忽略空氣阻力的作用;

        4)在轉(zhuǎn)向過程中的行駛阻力系數(shù)與直駛過程相同。

        圖3所示為履帶車輛的動力學(xué)模型。圖3中:C為車輛的重心;P為牽連坐標(biāo)系中車體轉(zhuǎn)向中心;L為履帶接地段長度;B為履帶中心距;xC、yC分別為履帶車輛的重心與幾何中心的橫向、縱向距離;λC為由離心力作用產(chǎn)生的轉(zhuǎn)向中心縱向偏移量;R′為履帶車輛的穩(wěn)態(tài)轉(zhuǎn)向半徑;R為慣性坐標(biāo)系中履帶車輛的瞬時轉(zhuǎn)向中心與車輛重心的垂直距離;FC為車輛轉(zhuǎn)向時產(chǎn)生的離心力;FCx、FCy分別為離心力的橫向分量、縱向分量;FrL、FrH分別為低速側(cè)、高速側(cè)履帶接地段所受的地面變形阻力;FyL、FyH分別為低速側(cè)履帶制動力、高速側(cè)履帶驅(qū)動力;FxL、FxH分別為低速側(cè)、高速側(cè)履帶所受橫向阻力的合力;MμL、MμH分別為低速側(cè)、高速側(cè)履帶所受的轉(zhuǎn)向阻力矩,μ表示轉(zhuǎn)向阻力系數(shù)。

        圖3 履帶車輛動力學(xué)模型Fig.3 Dynamic model of a tracked vehicle

        基于達(dá)朗貝爾原理,在oxy坐標(biāo)系中對車輛幾何中心建立履帶車輛動力學(xué)方程組:

        (3)

        式中:m為履帶車輛的整車質(zhì)量;δ為履帶車輛旋轉(zhuǎn)質(zhì)量換算系數(shù);Mμ為轉(zhuǎn)向阻力矩,Mμ=MμL+MμH;J為履帶車輛繞z′軸的轉(zhuǎn)動慣量。

        考慮履帶車輛在轉(zhuǎn)彎時,由于離心力作用導(dǎo)致的車輛轉(zhuǎn)向中心前移、載荷轉(zhuǎn)移,根據(jù)履帶車輛動力學(xué)方程組式(3),將FyL、FyH、λC作為未知量,車輛在進(jìn)行平地轉(zhuǎn)向時為勻速轉(zhuǎn)向,在已知規(guī)劃路徑曲率特征、縱向規(guī)劃速度以及車輛的結(jié)構(gòu)參數(shù)、性能參數(shù)等的情況下,對上述的3個未知量進(jìn)行求解,可得

        (4)

        2 基于模型預(yù)測的軌跡跟蹤控制器

        MPC模塊根據(jù)規(guī)劃模塊提供的參考路徑曲率特征以及參考速度、車輛狀態(tài)信息,結(jié)合雙參數(shù)自適應(yīng)優(yōu)化與預(yù)測模塊輸出的控制時域長度、時間步長,考慮車輛運(yùn)動學(xué)邊界和電機(jī)外特性,進(jìn)行最優(yōu)控制序列的迭代求解,并將第1個時域內(nèi)的控制量下發(fā)給執(zhí)行器,實(shí)現(xiàn)最優(yōu)控制。

        2.1 目標(biāo)函數(shù)

        在進(jìn)行軌跡跟蹤控制器的設(shè)計時,系統(tǒng)可以表達(dá)為

        (5)

        式中:u=[vjL,vjH]。由式(2)可知,要實(shí)現(xiàn)對車輛狀態(tài)的準(zhǔn)確預(yù)測,還需要得到車輛瞬時中心的位置,該參數(shù)通過狀態(tài)觀測模塊提供給MPC控制器,在此不作贅述。

        對式(5)中的連續(xù)系統(tǒng)模型進(jìn)行離散化,可得

        (6)

        式中:ξ(k)、u(k)分別為k時刻的車輛狀態(tài)向量、控制輸入向量,k≥0;yc(k)為k時刻的控制輸出向量;yb(k)為k時刻約束輸出向量??刂屏?、控制量增量Δu(k)約束以及輸出約束分別為

        (7)

        式中:umin、umax分別為控制量下限值、上限值;Δumin、Δumax分別為控制量變化率的下限值、上限值;ymin(k+j)、ymax(k+j)分別為k+j時刻約束輸出的下限值、上限值。

        在進(jìn)行代價函數(shù)的構(gòu)建時,需要綜合軌跡的跟蹤精度、穩(wěn)定性。在k時刻,基于離散非線性模型的MPC優(yōu)化問題可以描述為

        (8)

        (9)

        式中:J(ξ(k),Uk)為目標(biāo)函數(shù)

        (10)

        le、he、v分別為軌跡跟蹤的橫向偏差、航向偏差、實(shí)際車速,ldesired、hdesired、vdesired分別為期望橫向偏差、期望航向偏差以及期望車速,Q、R、P、M、N分別為對應(yīng)項(xiàng)的權(quán)重系數(shù)矩陣;Np、Nc分別為預(yù)測時域、控制時域的個數(shù),且Nc≤Np。

        2.2 約束設(shè)置

        為保證履帶車輛不發(fā)生側(cè)翻,車速需要滿足:

        (11)

        式中:kr為側(cè)翻閾值系數(shù);β為車輛的側(cè)傾角度;hg為車輛重心高度。

        為了保證車輛在轉(zhuǎn)彎時不發(fā)生失控的情況,車輛的轉(zhuǎn)向中心縱向偏移量需要滿足:

        (12)

        整理得:

        (13)

        式中:ks為側(cè)滑閾值系數(shù);fφ為路面附著系數(shù);α車輛俯仰角度。

        在規(guī)劃軌跡已知的條件下,在入彎之前對車輛轉(zhuǎn)向的轉(zhuǎn)矩需求進(jìn)行預(yù)測:

        (14)

        (15)

        T(vy,ρ)=max [TL,TH]

        (16)

        式中:TL、TH分別為低速側(cè)、高速側(cè)履帶轉(zhuǎn)矩需求;η為機(jī)械傳動效率;i為綜合傳動比;r為驅(qū)動輪半徑;T為基于規(guī)劃軌跡的電機(jī)最大轉(zhuǎn)矩需求;ρ為路徑的曲率。

        電機(jī)外特性是影響電機(jī)性能的邊界條件,圖4為本文履帶平臺的電機(jī)外特性。在基于轉(zhuǎn)速控制的軌跡跟蹤研究中,如果在當(dāng)前電機(jī)轉(zhuǎn)速下,實(shí)際車輛行駛的轉(zhuǎn)矩需求達(dá)到或接近電機(jī)外特性曲線上的轉(zhuǎn)矩極限值,車輛的轉(zhuǎn)矩調(diào)節(jié)范圍就會受到約束,在當(dāng)前轉(zhuǎn)速下的轉(zhuǎn)向能力就會得到制約,難以滿足車輛軌跡跟蹤控制的性能要求,嚴(yán)重時甚至?xí)?dǎo)致軌跡不可控。

        圖4 電機(jī)外特性Fig.4 External characteristics of the motor

        將電機(jī)的轉(zhuǎn)矩和功率作為約束輸出,并設(shè)置轉(zhuǎn)矩保護(hù)系數(shù)kT和后備功率保護(hù)系數(shù)kP,可得

        T(vy,ρ)kT≤Tmax(vy)

        (17)

        P(vy,T)kP≤Pmax(vy)

        (18)

        式中:Tmax(vy)、Pmax(vy)分別為當(dāng)前電機(jī)轉(zhuǎn)速下電機(jī)可以提供的最大轉(zhuǎn)矩和最大功率;P(vy,T)為當(dāng)前工況下電機(jī)功率的需求。

        3 雙參數(shù)自適應(yīng)優(yōu)化與預(yù)測模塊

        雙參數(shù)自適應(yīng)優(yōu)化和預(yù)測模塊基于運(yùn)動基元類型進(jìn)行車輛歷史數(shù)據(jù)的提取,歷史數(shù)據(jù)集基于實(shí)驗(yàn)室現(xiàn)有的雙側(cè)獨(dú)立電驅(qū)動無人履帶平臺,以機(jī)器人操作系統(tǒng)(ROS)作為通信系統(tǒng)完成對越野工況下車輛狀態(tài)信息的記錄和儲存[4]。通過離線優(yōu)化和在線預(yù)測,為MPC控制器提供自適應(yīng)最優(yōu)控制參數(shù)輸入。

        3.1 算法總體介紹

        模塊以履帶車輛歷史數(shù)據(jù)集合為輸入,主要基于改進(jìn)PSO-MLP算法,完成最優(yōu)參數(shù)組合的離線提取和最優(yōu)控制參數(shù)的在線預(yù)測。基于上述算法得到了運(yùn)動基元類型與軌跡跟蹤最優(yōu)控制參數(shù)(控制時域長度、控制時間步長)之間的映射關(guān)系,MPC控制器通過軌跡點(diǎn)匹配,實(shí)現(xiàn)實(shí)時工況下控制參數(shù)的自適應(yīng)調(diào)整,以提高履帶車輛在復(fù)雜多變工況下的軌跡跟蹤精度和穩(wěn)定性。具體的算法原理,如圖5所示。

        圖5 改進(jìn)PSO-MLP算法偽代碼

        3.2 運(yùn)動基元提取

        基于真實(shí)駕駛數(shù)據(jù)對運(yùn)動基元進(jìn)行提取和再生成,以表征不同工況下車輛-道路之間復(fù)雜的耦合關(guān)系,是提升無人駕駛車輛系統(tǒng)適用性的重要途徑之一[19-20]。

        本文在文獻(xiàn)[19]中的運(yùn)動基元提取思想基礎(chǔ)上,在離線狀態(tài)下基于最優(yōu)控制理論,根據(jù)大量無人履帶車輛在實(shí)際越野場景下的歷史數(shù)據(jù),進(jìn)行運(yùn)動基元庫的生成。在線狀態(tài)下,根據(jù)感知模塊提供的柵格地圖、全局規(guī)劃的參考路徑以及運(yùn)動基元庫,針對典型工況,軌跡模塊基于A*搜索算法進(jìn)行運(yùn)動基元的實(shí)時拼接和平滑過渡,以得到具備車輛位姿信息以及運(yùn)動語義信息的參考軌跡:

        Sr=[sx,sy,sz,syaw,spitch,sroll,sv,sρ,stype]

        (19)

        式中:sx、sy、sz為參考軌跡點(diǎn)在車體坐標(biāo)下的坐標(biāo);syaw、spitch、sroll為參考軌跡的車輛三維姿態(tài)信息;sρ為參考軌跡的曲率;sv為車輛的參考速度;stype為履帶車輛運(yùn)動基元的類型。

        針對環(huán)境中具備的幾種典型越野工況,規(guī)劃模塊生成的參考軌跡中主要由以下4種運(yùn)動基元組成:類直線運(yùn)動基元PS、類小曲率轉(zhuǎn)向運(yùn)動基元PG、類單移線運(yùn)動基元PC、類U形彎運(yùn)動基元PU。圖6所示為本文進(jìn)行軌跡跟蹤控制的參考軌跡。

        圖6 參考路徑圖Fig.6 Diagram of the reference path

        3.3 基于改進(jìn)PSO算法的最優(yōu)參數(shù)組合提取

        對于已經(jīng)提取出來的包含運(yùn)動語義信息、車輛狀態(tài)信息、以及軌跡跟蹤響應(yīng)信息的歷史數(shù)據(jù)集DH,采用改進(jìn)PSO算法,進(jìn)行不同運(yùn)動基元類型下的最優(yōu)控制參數(shù)組合提取,為MLP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練提供數(shù)據(jù)基礎(chǔ)。將輸入到MPC模型的控制時域長度和時間步長大小作為粒子,則粒子的位置可以表達(dá)為

        (20)

        對粒子的位置和速度進(jìn)行初始化:

        (21)

        越野工況下,惡劣的環(huán)境條件使得硬件處于不良的工作狀態(tài),導(dǎo)致MPC的控制量求解時間極不穩(wěn)定。如果在一個控制周期內(nèi),MPC求解器無法求解出最新控制量,會嚴(yán)重威脅行車安全。因此,在對每種運(yùn)動基元內(nèi)的最優(yōu)控制參數(shù)進(jìn)行提取時,PSO算法中適應(yīng)度函數(shù)的設(shè)置需要綜合考慮車輛的軌跡跟蹤精度、穩(wěn)定性以及計算時間成本。跟蹤精度代價項(xiàng)通過橫向偏差和航向偏差體現(xiàn),跟蹤穩(wěn)定性代價項(xiàng)由控制量變化率體現(xiàn),而計算時間成本代價項(xiàng)則由MPC求解器的迭代求解時間確定,一般來說,迭代求解時間隨著控制參數(shù)的變化而變化[10]。根據(jù)粒子的位置信息,結(jié)合履帶車輛歷史數(shù)據(jù)集合DH,可以匹配到相應(yīng)的車輛軌跡跟蹤響應(yīng)狀態(tài)信息,為適應(yīng)度函數(shù)的評價提供依據(jù)。適應(yīng)度函數(shù)的表達(dá)形式為

        (22)

        (23)

        式中:t、t+1為迭代次數(shù);vp(t)、vp(t+1)分別為第p個粒子在第t、t+1輪迭代的速度;w(t)為第t輪迭代的慣性因子,w(t)>0;c1、c2為學(xué)習(xí)因子,分別代表認(rèn)知系數(shù)和社會系數(shù),通常c1=c2∈(0,4);r1、r2為(0,1)之間的隨機(jī)數(shù);Pp(t)為第p個粒子累計到第t輪迭代的局部最優(yōu)值;xp(t)、xp(t+1)分別為第p個粒子在第t、t+1輪迭代的位置;G(t)為粒子群內(nèi)所有粒子累計到第t輪迭代的全局最優(yōu)值。為解決算法早熟以及迭代后期易在最優(yōu)解附近振蕩的情況,這里采用線性可變權(quán)重系數(shù)的方法進(jìn)行權(quán)重系數(shù)的設(shè)置:

        (24)

        式中:wmax、wmin分別為權(quán)重系數(shù)的最大值和最小值;tmax為最大迭代次數(shù)。

        在進(jìn)行狀態(tài)更新時,需要對位置和速度進(jìn)行越界修正:

        (25)

        (26)

        式中:vmax為粒子的最大速度;xmin、xmax分別為粒子位置的最小值和最大值。

        3.4 基于MLP的最優(yōu)控制參數(shù)預(yù)測

        圖7 MLP算法原理圖Fig.7 Schematic diagram of the MLP algorithm

        本文采用學(xué)習(xí)率自適應(yīng)優(yōu)化算法進(jìn)行MLP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,具體流程如圖8所示。

        MLP神經(jīng)網(wǎng)絡(luò)具體算法流程如下:

        步驟1初始化網(wǎng)絡(luò)深度l、模型權(quán)重系數(shù)矩陣W(q)、模型的偏置參數(shù)b(q)等參數(shù),q∈{1,…,l}。模型的激活函數(shù)選擇tanh 函數(shù):

        (27)

        步驟2基于模型輸入、模型參數(shù)進(jìn)行模型輸出的求解,并得到損失函數(shù)L(,y),y為輸入x時的神經(jīng)網(wǎng)絡(luò)輸出真值,為輸入x時的神經(jīng)網(wǎng)絡(luò)輸出預(yù)測值。

        圖8 學(xué)習(xí)率自適應(yīng)優(yōu)化算法流程偽代碼表

        h(0)=xh(0)=x
        h(k)=f(b(k)+W(k)h(k-1)),k∈{1,…,l}
        =h

        (28)

        式中:h(k)為第k層隱藏單元的向量。

        步驟3反向傳播更新。

        未達(dá)到迭代終止條件時,需要根據(jù)誤差的梯度方向?qū)Σ煌W(wǎng)絡(luò)深度的權(quán)重系數(shù)矩陣和偏置參數(shù)進(jìn)行更新,然后再重復(fù)步驟2,直至達(dá)到迭代收斂條件。

        將改進(jìn)PSO算法優(yōu)化得到的數(shù)據(jù)集劃分為訓(xùn)練集和測試集。訓(xùn)練集的數(shù)據(jù)用于基于學(xué)習(xí)率自適應(yīng)優(yōu)化算法的MLP神經(jīng)網(wǎng)絡(luò)的模型訓(xùn)練,測試集數(shù)據(jù)用于對模型的精度進(jìn)行評價,得到如圖9所示的預(yù)測結(jié)果。圖9中tstep為時間步長標(biāo)簽值,step為時間步長預(yù)測值,tlr為時域長度標(biāo)簽值,lr為時域長度預(yù)測值,step、lr可以對tstep、tlr進(jìn)行良好預(yù)測?;诟倪M(jìn)PSO-MLP算法,以當(dāng)前車輛狀態(tài)、運(yùn)動基元類型等作為輸入,可以對最優(yōu)控制參數(shù)組合進(jìn)行較好預(yù)測。

        圖9 MLP神經(jīng)網(wǎng)絡(luò)預(yù)測效果Fig.9 Prediction of the MLP neural network results

        4 試驗(yàn)驗(yàn)證

        為了驗(yàn)證本文提出的算法框架的有效性,分別進(jìn)行仿真實(shí)驗(yàn)和實(shí)車試驗(yàn)。仿真實(shí)驗(yàn)由ROS-VREP聯(lián)合仿真環(huán)境測試完成,而實(shí)車試驗(yàn)則通過一輛雙側(cè)獨(dú)立電驅(qū)動中型無人履帶平臺完成。試驗(yàn)過程中的平臺結(jié)構(gòu)、性能參數(shù)如表1所示。

        表1 各平臺試驗(yàn)參數(shù)表

        4.1 ROS-VREP聯(lián)合仿真

        仿真實(shí)驗(yàn)是對算法初步的功能性驗(yàn)證,用于保證實(shí)車測試的安全性,場景如圖10所示,平臺的具體參數(shù)如表1所示,仿真所需的參考軌跡為圖6所示的軌跡,仿真過程中的最高車速為20 km/h。為了體現(xiàn)數(shù)據(jù)真實(shí)規(guī)律,每組實(shí)驗(yàn)重復(fù)3次,并選擇其中特征最明顯的一組作為對照組。

        圖10 ROS-VREP聯(lián)合仿真環(huán)境Fig.10 ROS-VREP co-simulation environment

        基于算法的收斂效果以及軌跡跟蹤響應(yīng)狀態(tài),設(shè)置對照組如下所示:對照組1設(shè)置為tl=2.7 s、ts=0.15 s;對照組2設(shè)置為tl=1.2 s、ts=0.10 s;對照組3設(shè)置為tl=0.54 s、ts=0.06 s。其中對照組1的時域長度和時間步長最大,計算成本也最大;對照組2與基于雙參數(shù)自適應(yīng)優(yōu)化算法的時間成本相同;對照組3的時域長度和時間步長最小,時間成本最小。

        圖11 仿真實(shí)驗(yàn)軌跡跟蹤效果Fig.11 Simulated trajectory tracking performance

        表2 仿真實(shí)驗(yàn)軌跡跟蹤效果統(tǒng)計表

        結(jié)合圖11和表2對軌跡跟蹤效果的統(tǒng)計可以看出,對照組1雖然轉(zhuǎn)角狀態(tài)量變化最為穩(wěn)定,但軌跡跟蹤的精度差,計算載荷大,本文提出的自適應(yīng)參數(shù)優(yōu)化法相比于對照組1分別降低橫向偏差48.9%,降低航向偏差31.4%,節(jié)省計算成本23.4%。對照組2的計算時間成本和轉(zhuǎn)角變化率均值幾乎一致,但本文算法的軌跡跟蹤精度較高,橫向偏差和航向偏差僅為對照組2的66.9%、81.7%。對照組3的計算成本最低,跟蹤精度也最高,但是車輛的轉(zhuǎn)角平均變化率為本文算法的2.3倍,尤其在PU、PS的運(yùn)動基元路段,車輛的轉(zhuǎn)角出現(xiàn)了較大的波動,軌跡跟蹤處于失穩(wěn)的狀態(tài)。本文算法在軌跡跟蹤的精度、行駛穩(wěn)定性、時間成本上做到了較好的均衡?;赗OS-VREP的聯(lián)合仿真對算法進(jìn)行了初步的驗(yàn)證,為實(shí)車試驗(yàn)的設(shè)計提供了重要的參考。

        4.2 實(shí)車驗(yàn)證

        實(shí)車試驗(yàn)基于如圖12所示的雙側(cè)獨(dú)立電驅(qū)動中型無人履帶平臺開展,平臺的具體結(jié)構(gòu)、性能參數(shù)如表3所示。平臺裝配的設(shè)備包括:光雷達(dá)、GNSS接收機(jī)、慣性導(dǎo)航系統(tǒng)、感知工控機(jī)、規(guī)控工控機(jī)以及驅(qū)動電機(jī)等。搭載的規(guī)控工控機(jī)的處理器型號為八核八線程的Intel Core i7-9700,GPU型號為Nvidia RTX 2080Ti,內(nèi)存32 GB,操作系統(tǒng)為Ubuntu 16.04。

        圖12 無人駕駛履帶車輛試驗(yàn)平臺Fig.12 Experimental platform of the unmanned tracked vehicle

        同樣地,對軌跡跟蹤控制過程中的不同運(yùn)動基元的橫向偏差均值、航向偏差均值、轉(zhuǎn)角狀態(tài)量變化率均值以及迭代求解時間進(jìn)行提取,得到如圖13和表3所示的軌跡跟蹤效果及數(shù)據(jù)統(tǒng)計。

        圖13 履帶車輛試驗(yàn)軌跡跟蹤效果Fig.13 Track performance for the unmanned tracked vehicle

        表3 實(shí)車試驗(yàn)軌跡跟蹤效果統(tǒng)計表

        通過對不同算法的軌跡跟蹤效果的統(tǒng)計分析可以看到,對照組1在全程的轉(zhuǎn)角狀態(tài)量變化率的均值最小,反映出該組實(shí)驗(yàn)的軌跡跟蹤穩(wěn)定性最好,但本文算法在橫向跟蹤誤差、航向跟蹤誤差以及時間成本上相對于對照組1分別降低34.6%、15.3%、2.7%。

        對照組2的時間成本與本文算法相近,但軌跡跟蹤的精度和穩(wěn)定性均較差。本文算法相對于對照組2,橫向偏差均值、航向偏差均值以及轉(zhuǎn)角變化率均值可以分別降低30.5%、17.2%、7.8%。對照組3的時間成本最低,軌跡跟蹤的精度也最高,但是軌跡跟蹤的穩(wěn)定性是最差的,尤其在PU路段,車輛為了達(dá)到較高的跟蹤精度,出現(xiàn)了多次擺尾的情況,這無疑將嚴(yán)重影響履帶車輛的行車安全。綜上,本文提出的算法,在保證車輛具有較高的行駛穩(wěn)定性、較為經(jīng)濟(jì)的計算成本前提下,實(shí)現(xiàn)了對參考軌跡的精準(zhǔn)跟蹤。

        5 結(jié)論

        本文針對模型預(yù)測軌跡跟蹤控制算法定參數(shù)輸入下軌跡跟蹤效果不穩(wěn)定的情況,建立了雙參數(shù)自適應(yīng)優(yōu)化與預(yù)測模塊,為軌跡跟蹤控制模塊提供自適應(yīng)參數(shù)輸入,并進(jìn)行了ROS-VREP仿真實(shí)驗(yàn)、實(shí)車試驗(yàn)的算法驗(yàn)證。得出主要結(jié)論如下:

        1)通過對運(yùn)動基元類型、軌跡跟蹤響應(yīng)狀態(tài),車輛狀態(tài)以及控制參數(shù)進(jìn)行數(shù)據(jù)提取,基于改進(jìn)PSO優(yōu)化算法,實(shí)現(xiàn)了最優(yōu)參數(shù)組合數(shù)據(jù)集的構(gòu)建。

        2)基于學(xué)習(xí)率自適應(yīng)優(yōu)化算法,結(jié)合最優(yōu)參數(shù)組合數(shù)據(jù)集進(jìn)行MLP神經(jīng)網(wǎng)絡(luò)的模型訓(xùn)練,根據(jù)規(guī)劃模塊實(shí)時信息和車輛狀態(tài)實(shí)時反饋,對最優(yōu)控制參數(shù)組合進(jìn)行了良好的預(yù)測,實(shí)現(xiàn)了為軌跡跟蹤控制模塊提供時變自適應(yīng)的控制時域長度、控制時間步長的雙參數(shù)輸入。

        3)通過ROS-VREP、實(shí)車試驗(yàn)的結(jié)果分析,本文提出的算法在保證車輛具有較好軌跡跟蹤穩(wěn)定性、計算成本經(jīng)濟(jì)性的前提下,實(shí)現(xiàn)了較高的軌跡跟蹤精度。實(shí)車試驗(yàn)中,與相同計算成本下的定參數(shù)軌跡跟蹤控制算法相比,橫向偏差均值、航向偏差均值以及轉(zhuǎn)角變化率均值可以分別降低30.5%、17.2%、7.8%,驗(yàn)證了本文提出算法框架的有效性和可行性。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        国产在亚洲线视频观看| 国产a级三级三级三级| 亚洲av日韩精品久久久久久久| 亚洲精品无码久久久影院相关影片| 亚洲av无码一区二区三区观看| 少妇对白露脸打电话系列| 国产农村三片免费网站| 精品久久一区二区av| 伊人久久大香线蕉av五月| 国产欧美日韩精品专区| 亚洲欧美日韩精品高清| 亚洲性爱区免费视频一区| 国产人妻久久精品二区三区老狼| 偷拍一区二区视频播放器| 国产av丝袜旗袍无码网站| 91香蕉视频网| 精品国精品自拍自在线| 亚洲成人中文字幕在线视频 | 女人被狂躁c到高潮视频| 丰满人妻妇伦又伦精品国产| 亚洲中字幕永久在线观看| 国产伦理一区二区久久精品| 亚洲中文字幕久久精品蜜桃| 男女肉粗暴进来120秒动态图| 久久99精品久久久久久齐齐百度| 国产男女做爰猛烈视频网站| 国产综合开心激情五月| 中文无码精品a∨在线观看不卡 | 东京热无码人妻中文字幕| 亚洲熟女乱一区二区三区| 国产精品亚洲综合色区| 国产亚洲欧美成人久久片| 国产啪啪视频在线观看| 又硬又粗进去好爽免费| 亚洲欧美日韩人成在线播放| 亚洲中文字幕久爱亚洲伊人| 亚洲精品一区二区网站| 日本一本之道高清不卡免费| 欧美老熟妇又粗又大| 一区二区三区在线观看视频| 欧洲美熟女乱又伦av影片|