張團(tuán)善,李文真
(西安工程大學(xué)電子信息學(xué)院,陜西西安710048)
單輪自平衡機(jī)器車的系統(tǒng)建模與最優(yōu)控制
張團(tuán)善,李文真
(西安工程大學(xué)電子信息學(xué)院,陜西西安710048)
針對(duì)高階次、多變量、非線性、欠驅(qū)動(dòng)的單輪自平衡車系統(tǒng),提出了一種改進(jìn)的最優(yōu)控制算法.首先采用拉格朗日方程推導(dǎo)出力學(xué)模型,線性化后,得到系統(tǒng)的線性化方程,然后分別利用線性二次型最優(yōu)控制算法和基于對(duì)稱根軌跡的最優(yōu)控制算法實(shí)現(xiàn)了單輪機(jī)器車的平衡控制和動(dòng)態(tài)穩(wěn)定.通過比較可以看出,基于對(duì)稱根軌跡的最優(yōu)控制算法較傳統(tǒng)的最優(yōu)控制算法有更好的穩(wěn)定性和魯棒性,仿真結(jié)果驗(yàn)證了力學(xué)模型的正確性和反饋線性化控制算法的有效性.
單輪自平衡機(jī)器車;拉格朗日方程;線性二次型;對(duì)稱根軌跡
單輪自平衡機(jī)器車作為一種新型的環(huán)保輕型代步工具以其體積小、功耗低、易于控制、適應(yīng)地形變化能力強(qiáng)等特點(diǎn),引起了許多業(yè)內(nèi)研究者的興趣.與其他類型的機(jī)器車相比,自平衡機(jī)器車最主要的特征是要在各種狀態(tài)下保持機(jī)器車的姿態(tài)平衡[1].單輪自平衡機(jī)器車的工作原理是通過收集外部采集的數(shù)據(jù),設(shè)計(jì)平衡控制算法和反饋調(diào)節(jié)器使系統(tǒng)達(dá)到動(dòng)態(tài)平衡.Salerno等人根據(jù)倒立擺特性,以機(jī)器車車體的旋轉(zhuǎn)角度為變量得到了雙輪自平衡機(jī)器車的動(dòng)力學(xué)方程,并通過應(yīng)用微分幾何方法對(duì)系統(tǒng)各種控制器參數(shù)的狀態(tài)變量進(jìn)行了分析[2];Vos等人針對(duì)典型的倒立擺自平衡機(jī)器車系統(tǒng)提出了一種自適應(yīng)控制算法,實(shí)現(xiàn)了機(jī)器車的平衡控制,但沒有實(shí)現(xiàn)其運(yùn)動(dòng)控制[3];美國加州大學(xué)的學(xué)生研制出了一款帶豎直飛輪和行走輪的自平衡機(jī)器車,利用極點(diǎn)配置算法實(shí)現(xiàn)了自身的平衡[4];郭磊等人研究了一種帶水平飛輪和運(yùn)動(dòng)配重機(jī)構(gòu)的自平衡機(jī)器車,并根據(jù)線性理論MIMO方法設(shè)計(jì)了控制算法并進(jìn)行了測(cè)試[5].由于上述研究中的自平衡機(jī)器車結(jié)構(gòu)復(fù)雜、非線性程度高,其良好的控制效果是建立在精確數(shù)學(xué)模型的基礎(chǔ)上,用簡單的PID調(diào)節(jié)器和狀態(tài)反饋控制器難以實(shí)現(xiàn)機(jī)器車的動(dòng)態(tài)平衡,需要設(shè)計(jì)復(fù)雜的非線性控制器,成本較高,故本文對(duì)只保留行走輪的單輪機(jī)器車進(jìn)行了數(shù)學(xué)建模并使用傳統(tǒng)的線性二次型最優(yōu)控制算法和基于對(duì)稱根軌跡的最優(yōu)控制算法分別進(jìn)行控制,實(shí)現(xiàn)了機(jī)器車的動(dòng)態(tài)鎮(zhèn)定和自平衡,同時(shí)兼顧了系統(tǒng)響應(yīng)的快速性和穩(wěn)定性.這樣的設(shè)計(jì)簡化了機(jī)器車的結(jié)構(gòu),增加了實(shí)用性,降低了控制難度并提高了線性控制算法的可靠性.仿真結(jié)果表明,在一定角度范圍內(nèi),兩種控制算法均能使系統(tǒng)達(dá)到穩(wěn)定平衡狀態(tài),而SRL最優(yōu)控制算法比傳統(tǒng)的最優(yōu)控制算法更有利于提高機(jī)器車的動(dòng)態(tài)性能.
1.1 結(jié)構(gòu)特點(diǎn)及運(yùn)動(dòng)原理
單輪自平衡機(jī)器車的機(jī)械結(jié)構(gòu)由車輪本體,內(nèi)嵌的伺服電機(jī)和輪軸外側(cè)的踏板組成;控制系統(tǒng)主要包括驅(qū)動(dòng)器、傳感器和控制板,如圖1所示.
單輪自平衡機(jī)器車是個(gè)結(jié)構(gòu)不穩(wěn)定的系統(tǒng),具有靜不平衡性,必須采用動(dòng)態(tài)平衡的策略,即讓機(jī)器車在平衡點(diǎn)附近不停地運(yùn)動(dòng)進(jìn)行調(diào)節(jié).如果將人等效為直立的車體,則對(duì)單輪機(jī)器車的運(yùn)動(dòng)控制最終表現(xiàn)為對(duì)車輪位移和車體傾角的控制,即通過檢測(cè)裝置將傾角和位置信息反饋給執(zhí)行電機(jī),產(chǎn)生作用轉(zhuǎn)矩,對(duì)系統(tǒng)的狀態(tài)進(jìn)行實(shí)時(shí)的反饋調(diào)節(jié),使機(jī)器車按照給定的速度運(yùn)動(dòng),同時(shí)保證車體的轉(zhuǎn)角為零.
1.2 模型建立及參數(shù)說明
將直立的人等效為直立的車體,當(dāng)人站立在輪軸兩側(cè)的踏板上時(shí),整個(gè)系統(tǒng)的重心位于輪子上方,而車輪只有一個(gè)支點(diǎn)與地面接觸,如圖2所示.建立模型前,假設(shè)以下條件:(1)車輪、車體均為剛體;(2)不考慮機(jī)器車和車體所受的外界干擾力;(3)不考慮車體與輪子之間的滑動(dòng)摩擦力; (4)車輪與地面不打滑.建立如圖3所示直角坐標(biāo)系,規(guī)定機(jī)器車的前進(jìn)方向?yàn)閤軸正方向,與y軸垂直,輪子的軸線方向?yàn)閦軸方向.
設(shè)車輪質(zhì)量為m,車體質(zhì)量為M,車輪半徑為R,輪心到車體質(zhì)心的距離為L,車輪繞z軸的轉(zhuǎn)角為θR,車體繞y軸的轉(zhuǎn)角為θP,電機(jī)對(duì)車輪的轉(zhuǎn)矩為C,車輪的位移為xR,車體對(duì)Y軸的轉(zhuǎn)動(dòng)慣量為Jpθ,車輪對(duì)Z軸的轉(zhuǎn)動(dòng)慣量為JR.
圖1 單輪自平衡機(jī)器車實(shí)物照片
圖2 單輪機(jī)器車結(jié)構(gòu)圖
圖3 系統(tǒng)坐標(biāo)系和幾何參數(shù)含義
自平衡機(jī)器車有車輪位移、車體轉(zhuǎn)角兩個(gè)自由度,但只有一個(gè)控制輸入(電機(jī)的作用轉(zhuǎn)矩),是典型的欠驅(qū)動(dòng)系統(tǒng).嚴(yán)格地講,它和倒立擺一樣,是一種欠驅(qū)動(dòng)連桿系統(tǒng),其中車輪是主動(dòng)關(guān)節(jié),車體屬于被動(dòng)執(zhí)行機(jī)構(gòu),車輪位移與車體轉(zhuǎn)角兩變量之間存在耦合關(guān)系[6].由于欠驅(qū)動(dòng)連桿系統(tǒng)具有多變量、強(qiáng)耦合的特性,用牛頓力學(xué)的分析方法為其建立準(zhǔn)確的數(shù)學(xué)模型將十分復(fù)雜,因此本文選用拉格朗日方程從能量學(xué)的角度對(duì)系統(tǒng)進(jìn)行動(dòng)力學(xué)建模.其中數(shù)學(xué)表達(dá)式為
式中T為系統(tǒng)的總動(dòng)能,q為系統(tǒng)的廣義坐標(biāo),Q為系統(tǒng)的廣義力.
選取車輪轉(zhuǎn)角和車體轉(zhuǎn)角作為系統(tǒng)的運(yùn)動(dòng)狀態(tài)變量,由這兩個(gè)相互獨(dú)立的狀態(tài)變量可以惟一確定系統(tǒng)的位置,在此坐標(biāo)系下,車輪轉(zhuǎn)角對(duì)應(yīng)的廣義力等于電機(jī)對(duì)車輪的作用轉(zhuǎn)矩,而車體轉(zhuǎn)角對(duì)應(yīng)的廣義力等于車體重力與電機(jī)對(duì)車體的作用轉(zhuǎn)矩,即
系統(tǒng)的動(dòng)能包括車輪的平動(dòng)動(dòng)能T1,車輪繞z軸的轉(zhuǎn)動(dòng)動(dòng)能T2,車體的平動(dòng)動(dòng)能T3,車體繞過其質(zhì)心且平行于z軸的轉(zhuǎn)動(dòng)動(dòng)能T4,表達(dá)式如下
系統(tǒng)總動(dòng)能為
為簡化模型和局部線性化,對(duì)車體的轉(zhuǎn)角做如下約束:在平衡點(diǎn)附近時(shí)令sinθp≈θp,cosθp≈1.將式(2)~(7)代入式(1),可得以下線性方程組:
整理式(8),并代入系統(tǒng)參數(shù)可得到線性化的數(shù)學(xué)模型:
系統(tǒng)參數(shù)見表1(注:為了方便后期系統(tǒng)模型的制作與硬件調(diào)試,在建立參考模型時(shí)對(duì)整個(gè)系統(tǒng)進(jìn)行了適當(dāng)?shù)目s小).
表1 系統(tǒng)參數(shù)
由系統(tǒng)的狀態(tài)方程知,該系統(tǒng)是單輸入多輸出的欠驅(qū)動(dòng)系統(tǒng),但各個(gè)狀態(tài)變量之間存在耦合,結(jié)合能量傳遞的思想,對(duì)不可驅(qū)動(dòng)狀態(tài)變量的控制可以通過對(duì)可驅(qū)動(dòng)狀態(tài)變量的控制來間接達(dá)到.因此,可以通過狀態(tài)反饋實(shí)現(xiàn)對(duì)整個(gè)欠驅(qū)動(dòng)系統(tǒng)的實(shí)時(shí)控制.
用拉格朗日方程建立模型的方法是從總體能量的角度考慮,故在模型建立的過程中可以忽略系統(tǒng)內(nèi)部之間的作用力,通過選擇不同的狀態(tài)量和輸出量達(dá)到不同的控制效果[7],為了達(dá)到全面的控制效果,將系統(tǒng)的4個(gè)狀態(tài)量均選為輸出量,對(duì)系統(tǒng)實(shí)施全反饋控制.
結(jié)合能控性判別矩陣M=[B,AB,A2B,A3B],經(jīng)MATLAB計(jì)算得rank(M)=4,系統(tǒng)能控;同理,由系統(tǒng)能觀性矩陣N=[C,CA,CA2,CA3]T可知,rank(N)=4,系統(tǒng)能觀.
1.3 系統(tǒng)的穩(wěn)定性分析
線性定常系統(tǒng)穩(wěn)定的充要條件是其全部特征根均具有負(fù)實(shí)部[8].因本文將單輪自平衡機(jī)器車近似為不隨時(shí)間改變的線性系統(tǒng),故可以通過線性定常系統(tǒng)的穩(wěn)定性判據(jù)對(duì)系統(tǒng)進(jìn)行判穩(wěn).
由特征值方程
可得系統(tǒng)的特征值為
從式(11)可以看出,系統(tǒng)有一個(gè)正特征值和兩個(gè)零特征值,不滿足勞斯穩(wěn)定的必要條件,而且無論怎樣調(diào)節(jié)系統(tǒng)的參數(shù),都無法使之達(dá)到穩(wěn)定的狀態(tài).反饋控制可以將閉環(huán)系統(tǒng)的極點(diǎn)配置在根平面上所期望的位置,使系統(tǒng)達(dá)到穩(wěn)定狀態(tài),而任意配置極點(diǎn)的充要條件是系統(tǒng)能控能觀[9],這是上文判斷能控能觀性的意義所在.
圖4是系統(tǒng)的開環(huán)階躍響應(yīng),可以看出此時(shí)系統(tǒng)是不穩(wěn)定的,這與上述穩(wěn)定性分析的結(jié)果一致.
圖44 個(gè)狀態(tài)量的開環(huán)階躍響應(yīng)
2.1 LQR控制器設(shè)計(jì)
單輪機(jī)器車的平衡問題,是一個(gè)狀態(tài)正定問題,目標(biāo)是在行走時(shí)使車體保持直立的狀態(tài),由于單輪自平衡機(jī)器車是一個(gè)高階系統(tǒng),使用傳統(tǒng)的PI調(diào)節(jié)器進(jìn)行控制時(shí)位移和速度曲線的振蕩較為嚴(yán)重,甚至出現(xiàn)系統(tǒng)失控的現(xiàn)象[10].因此本文選擇了線性最優(yōu)控制理論來設(shè)計(jì)反饋控制算法,目標(biāo)是在車體的傾角為零,位移和速度穩(wěn)定在固定值的基礎(chǔ)上,使系統(tǒng)的性能指標(biāo)達(dá)到極小.根據(jù)無限時(shí)間的線性二次型最優(yōu)狀態(tài)調(diào)節(jié)器理論,當(dāng)tf趨于無窮時(shí),最優(yōu)控制問題等效為尋找一個(gè)控制量u(t)=-kx(t)使得以下的二次型性能指標(biāo)[11]達(dá)到極小值:
式中x(t)為n維狀態(tài)向量;u(t)為r維控制向量;Q矩陣是半正定m×m實(shí)對(duì)稱矩陣;R是正定r×r實(shí)對(duì)稱矩陣.
其中P(t)可由方程(14)解出;u(t)為主動(dòng)控制力方程.
求解式(14)需要給定兩個(gè)重要參數(shù),即Q矩陣和R矩陣.其中,Q矩陣代表狀態(tài)向量的權(quán)重,R矩陣則代表控制量的權(quán)重,它們分別表示系統(tǒng)運(yùn)動(dòng)過程中動(dòng)態(tài)跟蹤誤差的總度量和能量消耗的總度量.在平衡控制中穩(wěn)定的動(dòng)態(tài)性能是首要要求,低能耗是次要要求,故取R=1.Q矩陣中的非零元素代表在控制過程中系統(tǒng)對(duì)各個(gè)狀態(tài)的誤差要求,經(jīng)反復(fù)測(cè)試,并參照控制中車體和輪子的位移大小,取Q=[1000 0 0 0;0 0 0 0;0 0 100 0;0 0 0 0].
因?yàn)镽iccati方程較為復(fù)雜難解,在得知Q、R矩陣的前提下可以利用MATLAB函數(shù)庫中的lqr函數(shù)幫助求解式(13)和式(14),得到系統(tǒng)的最優(yōu)反饋增益矩陣
LQR控制方法的simulink仿真模型如圖5所示.經(jīng)MATLAB仿真可得,在此控制方案下,系統(tǒng)4個(gè)狀態(tài)量的階躍響應(yīng)如圖6所示.由圖6可以看出,給系統(tǒng)加入階躍擾動(dòng)時(shí),系統(tǒng)能夠較快地達(dá)到平衡狀態(tài),在此過程中位移的超調(diào)量約為30mm,傾角的超調(diào)量約為0.02rad,調(diào)節(jié)時(shí)間約為2s,穩(wěn)態(tài)誤差、上升時(shí)間也符合穩(wěn)態(tài)要求.在此基礎(chǔ)上,如果再增加Q矩陣中的某些元素,系統(tǒng)的動(dòng)態(tài)性能響應(yīng)還會(huì)有所改善,但控制量也會(huì)上升,在保證控制量足夠小,兼顧其他動(dòng)態(tài)響應(yīng)指標(biāo)的基礎(chǔ)上,此時(shí)的系統(tǒng)性能已經(jīng)能夠滿足要求.
圖5 LQR仿真模型
圖6 LQR控制下的系統(tǒng)仿真曲線
2.2 基于SRL的最優(yōu)控制器設(shè)計(jì)
針對(duì)高階次的系統(tǒng),采用極點(diǎn)配置實(shí)現(xiàn)狀態(tài)反饋的方法雖簡單直觀,但對(duì)期望極點(diǎn)位置的選擇十分復(fù)雜,且無法確定期望極點(diǎn)的最優(yōu)或較優(yōu),傳統(tǒng)的LQR調(diào)節(jié)器雖通過確定加權(quán)矩陣的方法找到了最優(yōu)的反饋增益矩陣,但確定加權(quán)矩陣Q和R的普遍方法是仿真試湊法,即先初步選取Q和R,如果符合要求就求出最優(yōu)增益矩陣K.進(jìn)行仿真實(shí)驗(yàn),如果不符合須重新選取,直至符合系統(tǒng)的性能指標(biāo)要求[12],矩陣中因數(shù)的選擇主要依賴于設(shè)計(jì)者的經(jīng)驗(yàn)和調(diào)試,具有較大的盲目性.因此,本文根據(jù)對(duì)稱根軌跡(SRL)的原理,把最優(yōu)控制和極點(diǎn)配置的思想結(jié)合起來,選擇了一個(gè)新的性能指標(biāo)函數(shù),用于得到期望的最優(yōu)閉環(huán)極點(diǎn),即,將傳統(tǒng)的最優(yōu)控制規(guī)律簡化描述成如下的性能指標(biāo)[13]
對(duì)如下的系統(tǒng)能夠最小,即
其中式(16)中的z2(t)為系統(tǒng)跟蹤誤差的權(quán)值,u2(t)為系統(tǒng)控制量的權(quán)值,ρ是加權(quán)系數(shù)又稱根軌跡參數(shù),用于權(quán)衡跟蹤誤差對(duì)于控制量的相對(duì)損耗.以下是對(duì)稱根軌跡方程的解:
使J(u)最小化的控制規(guī)律由線性反饋u=-kx得到,這里k的最優(yōu)值即以上對(duì)稱根軌跡方程中穩(wěn)定根位置上的k值.可以看出s和-s對(duì)式(18)的影響是相同的,對(duì)于式(18)的任意根s0,必將對(duì)應(yīng)一個(gè)根-s0,因此稱所得的根軌跡為對(duì)稱根軌跡,對(duì)稱的含義是此根軌跡關(guān)于原點(diǎn)對(duì)稱.最優(yōu)主導(dǎo)極點(diǎn)可以由SRL中參數(shù)ρ所對(duì)應(yīng)的穩(wěn)定極點(diǎn)得到,在此根軌跡下選取的穩(wěn)定極點(diǎn)具有使性能指標(biāo)式(16)極小的特點(diǎn),文獻(xiàn)[13-14]給出了SRL的產(chǎn)生過程和SRL上的穩(wěn)定極點(diǎn)使性能指標(biāo)式(16)極小的證明,在此不做闡述.
利用SRL設(shè)計(jì)最優(yōu)控制器的過程是先選定矩陣H(H決定了系統(tǒng)的跟蹤誤差,需保持一個(gè)很小的值),再根據(jù)式(18)畫出SRL曲線,在曲線中選取適當(dāng)?shù)摩阎?它平衡了跟蹤誤差和控制量對(duì)系統(tǒng)的重要性),并找出與之對(duì)應(yīng)的極點(diǎn),然后將這些極點(diǎn)用于極點(diǎn)配置的運(yùn)算中,得到反饋增益K,對(duì)系統(tǒng)進(jìn)行反饋控制.
在上述理論基礎(chǔ)上結(jié)合系統(tǒng)對(duì)位置和角度的輸入要求,取跟蹤誤差矩陣H為
代入式(17)可得系統(tǒng)跟蹤輸出與控制輸入的傳遞函數(shù)
圖7給出了由式(18)所得的對(duì)稱根軌跡.
由于最優(yōu)的閉環(huán)極點(diǎn)一定是穩(wěn)定的,所以選擇左半S平面上的極點(diǎn).經(jīng)MATLAB計(jì)算得:當(dāng)ρ=1時(shí),對(duì)應(yīng)的極點(diǎn)為-4.14+0.24i,-4.14-0.24i,選擇這兩個(gè)極點(diǎn)作為主導(dǎo)極點(diǎn),在此基礎(chǔ)上,取-20+i和-20-i作為輔助極點(diǎn),它們位于主導(dǎo)極點(diǎn)的左側(cè),距離虛軸的距離是主導(dǎo)極點(diǎn)的5倍,對(duì)系統(tǒng)的影響較小.故期望的閉環(huán)極點(diǎn)為[-20+i,-20-i,-4.14+0.24i,-4.14-0.24i].
結(jié)合MATLAB的狀態(tài)反饋函數(shù):K=acker(A,B,P)得出反饋增益矩陣,其中,P為各個(gè)期望極點(diǎn)的值,即
將新的最優(yōu)反饋矩陣K代入圖5的Simulink仿真模型中,可以得出在此控制方案下,4個(gè)狀態(tài)量的階躍響應(yīng),SRL控制下的系統(tǒng)仿真曲線如圖8所示.
由圖8可以看出,改進(jìn)后系統(tǒng)的調(diào)節(jié)時(shí)間大約是0.5s,比傳統(tǒng)的LQR控制器的調(diào)節(jié)時(shí)間縮短了1.5s,響應(yīng)速度變快,超調(diào)量也明顯減小,動(dòng)態(tài)穩(wěn)定性有所提高.結(jié)果表明,參數(shù)ρ的選擇是合理的.
圖7 機(jī)器車系統(tǒng)的對(duì)稱根軌跡
圖8 SRL控制下的系統(tǒng)仿真曲線
在選擇期望極點(diǎn)時(shí),應(yīng)該考慮系統(tǒng)的動(dòng)態(tài)性能和閉環(huán)極點(diǎn)對(duì)于控制量的影響,否則容易導(dǎo)致控制量過高.傳統(tǒng)的最優(yōu)控制算法雖使控制量達(dá)到了一個(gè)較小的值,卻無法建立起性能指標(biāo)與系統(tǒng)誤差之間的聯(lián)系,并且確定權(quán)矩陣是很困難的,必須經(jīng)過多次實(shí)驗(yàn)找到合適的加權(quán)矩陣.而基于參數(shù)的SRL最優(yōu)控制方法在一定程度上抑制了選擇加權(quán)矩陣時(shí)對(duì)系統(tǒng)的主觀影響,使控制方法更易把握,并用參數(shù)ρ平衡了輸入量與跟蹤誤差對(duì)系統(tǒng)的影響,實(shí)現(xiàn)了最優(yōu)和穩(wěn)定的統(tǒng)一.
參數(shù)ρ的選取有一定的限制條件.當(dāng)ρ→0時(shí),被控對(duì)象處于“高代價(jià)控制”情況,不利于控制能量的利用,很低的控制使用在系統(tǒng)的跟蹤輸出量z上產(chǎn)生了很大的誤差;而當(dāng)ρ→∞時(shí),被控對(duì)象處于“廉價(jià)控制”的情況,在這種情況下,反饋增益矩陣K是無界的,同樣不利于實(shí)際系統(tǒng)的控制.因此,本文在選取參數(shù)ρ時(shí)全面考慮了系統(tǒng)根的位置、時(shí)間響應(yīng)、反饋增益、阻尼比等因素,并進(jìn)行了大量的實(shí)驗(yàn),最終達(dá)到了控制量、跟蹤誤差與控制效果之間的動(dòng)態(tài)平衡.
綜上所述,SRL法既得到了理想的最優(yōu)閉環(huán)極點(diǎn)進(jìn)而保證了良好的控制性能,又能在系統(tǒng)誤差與控制量之間達(dá)到動(dòng)態(tài)平衡,綜合了最優(yōu)控制理論和反饋控制方案,達(dá)到了控制量與控制效果的統(tǒng)一.較之傳統(tǒng)的LQR控制,對(duì)稱根軌跡法控制的超調(diào)量小、控制方法簡單、響應(yīng)速度快,在實(shí)際中具有更高的應(yīng)用價(jià)值.
單輪自平衡機(jī)器車是非線性、欠驅(qū)動(dòng)、高階次系統(tǒng)的典型代表之一,本文在局部線性化的基礎(chǔ)上用全狀態(tài)反饋實(shí)現(xiàn)了對(duì)欠驅(qū)動(dòng)狀態(tài)變量的間接控制,并采取構(gòu)造不同的線性二次型最優(yōu)性能指標(biāo)函數(shù)的方法,設(shè)計(jì)了平衡控制算法.仿真結(jié)果表明,基于LQR的最優(yōu)控制方法和基于SRL的最優(yōu)控制方法都可以使單輪自平衡機(jī)器車系統(tǒng)達(dá)到穩(wěn)定狀態(tài),而基于SRL的最優(yōu)控制方法既消除了LQR控制算法中選取Q,R矩陣的不確定性,又利用參數(shù)ρ的選擇,找出了系統(tǒng)響應(yīng)與期望極點(diǎn)的位置、時(shí)間響應(yīng)及反饋增益之間的關(guān)系,控制方法簡單、響應(yīng)速度快、超調(diào)量小,因此在實(shí)際中具有更高的應(yīng)用價(jià)值.
[1]阮曉剛.兩輪自平衡機(jī)器人的研究與設(shè)計(jì)[M].北京:科學(xué)出版社,2012:10-17.
[2]A SALERNOA,J Nonlinear.On the nonlinear controllability of a quasiholonomic mobile robot[C]//Proc of IEEE ICRA,Taiwan,2003:3379-3384.
[3]VOS D W,Von FLOTOW A H.Dynamics and nonlinear adaptive control of an autonomous unicycle:Theory and experiment[C].IEEE,USA:1990:182-187.
[4]常文超.自平衡獨(dú)輪機(jī)器人控制系統(tǒng)的研究[D].河北:河北科技大學(xué),2012.
[5]郭磊.單輪車機(jī)器人的動(dòng)力學(xué)建模與非線性控制[J].系統(tǒng)仿真學(xué)報(bào),2009,21(9):2730-2733.
[6]孫寧.一類欠驅(qū)動(dòng)系統(tǒng)的控制方法綜述[J].智能系統(tǒng)學(xué)報(bào),2011,6(3):200-203.
[7]阮曉剛.兩輪自平衡機(jī)器人動(dòng)力學(xué)建模及其平衡控制[J].計(jì)算機(jī)應(yīng)用研究,2009,26(1):99-103.
[8]劉豹.現(xiàn)代控制理論[M].北京:機(jī)械工業(yè)出版社,2001:157-177.
[9]鄭大鐘.線性系統(tǒng)理論[M].北京:清華大學(xué)出版社,2002:281-283.
[10]FAIZAN F,F(xiàn)ARID F,REHAN M.Implementation of discrete PID on inverted pendulum[J].Education Technology and Computer,2010,70(11):48-51.
[11]吳受章.應(yīng)用最優(yōu)控制[M].西安:西安交通大學(xué)出版社,1987:10-20.
[12]POWELL J David.動(dòng)態(tài)系統(tǒng)的反饋控制[M].朱齊丹,譯.北京:電子工業(yè)出版社,2004:138-190.
[13]T Kailath.Linear systems[M].Englewood Cliffs:Prentice Hall,1980:158-258.
[14]ROB Hoogendijk,A J Den Hamer,GEORGO Angelis,et al.Frequency response data based optimal control using the data based symmetric root Locus[C]//2010 IEEE International Conference on Control Applications,Yokohama,Japan,2010: 1010-1015.
System modeling and optimal control for the self-balancing unicycle
ZHANG Tuan-shan,LI Wen-zhen
(School of Electronics and Information,Xi'an Polytechnic University,Xi'an 710048,China)
An improved optimal approach is proposed for the high order,multivariate,typical nonlinear underactuated unicycle.The dynamical model is firstly established based on Lagrangian formulation.The tangent linearization of the model at its equilibrium yields to the linearization nominal model.Then respectively using LQR optimal algorithm and SRL optimal control algorithm to achieve dynamic balancing and motion control of the unicycle.By the simulation comparisons,SRL optimal control algorithm has a better anti-jamming and robustness than LQR optimal control algorithm.Computer simulation verifies the validity of the dynamic model,the effect of the controller is testified by simulation experiments.
self-balancing unicycle;Lagrangian equations;linear quadratic regulator(LQR);symmetrical root locus(SRL)
TP 242
A
1674-649X(2014)01-0077-07
Lagrange乘子進(jìn)行求解,可以得到
編輯:武暉;校對(duì):孟超
2013-08-04
張團(tuán)善(1971-),男,湖北省隨州市人,西安工程大學(xué)副教授,碩士生導(dǎo)師.E-mail:zz102@sina.com