滿艷鵬,孟慶浩,王佳瑛,羅 冰,曾 明(天津大學(xué)電氣與自動化工程學(xué)院機器人與自主系統(tǒng)研究所,天津300072)
計算與測試
用于二維源搜索的梯度自適應(yīng)極值搜索算法*
滿艷鵬,孟慶浩,王佳瑛,羅冰,曾明
(天津大學(xué)電氣與自動化工程學(xué)院機器人與自主系統(tǒng)研究所,天津300072)
基于正弦擾動的二維源極值搜索算法存在著適應(yīng)性差和快速性與準(zhǔn)確性相互制約的缺點。針對這一問題,提出一種基于梯度估計的參數(shù)自適應(yīng)極值搜索算法,該算法在傳統(tǒng)極值搜索算法基礎(chǔ)上,通過三個歷史采樣點估計當(dāng)前區(qū)域的梯度,并依據(jù)當(dāng)前區(qū)域梯度值自適應(yīng)調(diào)整反饋增益參數(shù)。此外,利用平均值理論對所提算法進行了理論分析和收斂性證明。不同環(huán)境下的仿真對比表明本方法提高了源搜索效率和對復(fù)雜梯度環(huán)境的適應(yīng)性。
極值搜索;源搜索;梯度自適應(yīng)
極值搜索算法是一種不依賴對象數(shù)學(xué)模型的自適應(yīng)控制算法[1]。20世紀(jì)80年代,線性自適應(yīng)控制理論取得突破之后,極值搜索算法以其優(yōu)越的極值搜索能力而受到人們的重視[2]?;诨5臉O值搜索控制[3]曾成功應(yīng)用于ABS中。1999年,Krstic M[4]提出了快速自適應(yīng)極值搜索算法理論,通過加入動態(tài)補償裝置,提高系統(tǒng)的反應(yīng)速度和動態(tài)性能。左斌等人[5]將多變量極值搜索與神經(jīng)網(wǎng)絡(luò)相結(jié)合,推廣了極值搜索算法的應(yīng)用范圍。Sahneh F D等人[6]對時變的極值情況進行了研究,郭曉軍等人[7]提出了多單元半全局極值搜索算法。
Ghods N等人[8]將極值搜索算法應(yīng)用到了二維源搜索中。極值搜索算法相對于其他搜索算法具有僅依靠檢測的信號強度,不需要自機器人位置信息優(yōu)勢?;跀_動的極值搜索可采用正弦擾動和隨機擾動[9]。文獻[10]中則采用角速度不變與控制線速度的方式,用基于正弦擾動的極值搜索算法來搜索源位置,并在顏色漸變信號場中進行了實驗。
但文獻[10]中機器人向源趨近速度受信號場梯度的影響,對梯度復(fù)雜情況適應(yīng)性較差。本文在其算法即定值極值搜索算法基礎(chǔ)上,根據(jù)梯度估計值對反饋增益進行自適應(yīng)調(diào)整,提出了梯度自適應(yīng)極值搜索算法,并進行了理論分析和收斂性證明。最后進行了仿真實驗對比,新算法提高了梯度小情況下快速性和復(fù)雜梯度適應(yīng)性。
梯度自適應(yīng)極值搜索算法的結(jié)構(gòu)如圖1所示,其中,v為機器人的線速度,ω為擾動信號的角頻率,h為洗出濾波器的特征常量,J代表測得的信號場強度值,代表將高通濾波器應(yīng)用于傳感器的測量值,a為擾動信號幅值,c為反饋增益。其中,非完整性機器人模型[10],可描述為
式中(xc,yc)為機器人的位置,θ為方向角,ω0為機器人的角速度。參數(shù)c隨著估計梯度自動調(diào)整,其表示如下
式中Q為定值,決定整體收斂速度(分析由下文給出),G(·)為低通濾波,Δ為估計梯度的大小。
梯度通過兩個歷史位置與當(dāng)前位置的信息進行估計。z軸的值代表信號強度差,(x,y)為兩個歷史點相對于當(dāng)前點的坐標(biāo),從而得到兩個向量(x1,y1,z1)和(x2,y2,z2),則這兩個向量確定一個三維平面的梯度大小為其中
此梯度估計方法僅需知道最近三個采樣點的相對位置信息和信號強度,相對位置信息可通過機器人航位推算得到且無累積誤差。這種梯度推算方法保持了傳統(tǒng)極值搜索方法無需復(fù)雜定位系統(tǒng)的優(yōu)勢。
圖1 梯度自適應(yīng)極值搜索算法框圖Fig 1 Block diagram of gradient adaptive extremum seeking algorithm
不失一般性,令目標(biāo)函數(shù)為單極值連續(xù)函數(shù),同時在點(x*,y*)鄰域內(nèi),J=f(x,y)有到n+1階連續(xù)偏導(dǎo)數(shù),對此鄰域內(nèi)任一點(xe,ye)進行泰勒展開并且忽略高次項有
式中(x*,y*)為機器人在信號場中的參考位置,f(x*,y*)為參考位置的信號強度;(xe,ye)為測量位置,在(x*,y*)的鄰域內(nèi),J為測量位置信號強度。
以極大值信號場為例,當(dāng)(x*,y*)為極大值點時,f*= f(x*,y*)為信號場極大值,有
假設(shè)(x*,y*)為機器人的當(dāng)前位置,(x1,y1),(x2,y2)為兩個歷史位置相對于當(dāng)前位置的坐標(biāo),由式(4)可得
式中ξx∈(x*,x*+x1),ξy∈(y*,y*+y1)。z2,e2同理,將式(7)代入式(3)可以得到
作如下坐標(biāo)轉(zhuǎn)換,其中由于角速度一定,有θ1≠θ2
采用文獻[10]類似方法,對式(4)坐標(biāo)變換如下
令ω=kω0(k為大于等于3的正整數(shù)),τ=ωt,式(11)對τ求導(dǎo)可得
同理可以得到
以周期為2πk應(yīng)用均值理論,其中,c(t)低通濾波后變化頻率遠(yuǎn)小于ω0,在2πk的周期內(nèi)約為定值,用表示
同理,可得
這里,分兩種情況討論:(1)當(dāng)(x*,y*)為信號場中非極大值的參考位置時,由于(xe,ye)在(x*,y*)的鄰域內(nèi),相對于一階偏導(dǎo)較小,由式(17),式(18)可得
梯度自適應(yīng)極值搜索算法趨近速度主要受參數(shù)a,Q影響,約為常數(shù),所以,算法能夠以較一致的速度向極值點趨近。
2)當(dāng)(x*,y*)為極大值點時,函數(shù)的一階偏導(dǎo)數(shù)為0,二階偏導(dǎo)數(shù)小于0。唯一平衡點為。選擇李雅普諾夫函數(shù),對其求導(dǎo)有
第一項趨于0,第二項為O(1/ω),第三項為O(a),所以
可以看出:極值搜索控制算法可以收斂到極值點的一個很小的鄰域內(nèi),收斂區(qū)域大小受擾動幅值等影響。
本文分別在二次解析信號場(具有一般性)和簡化的Rosenbrock函數(shù)信號場(有較復(fù)雜梯度環(huán)境)中進行了仿真。二次解析場公式為f(x,y)=1-((xc-x*)2+(ycy*)2/k,其中,k=1,(xc,yc)為測量點位置,(x*,y*)為源位置。簡化Rosenbrock函數(shù)為f(x,y)=-(1-x)2-10(yx2)2。
實驗的終止條件為機器人到達(dá)極值點附近超過1000次迭代(成功)或迭代次數(shù)超過30000仍未接近極值點(失?。?。
在二次解析信號場中,極值搜索算法參數(shù)為a=0.05,h=0.1,ω0=ω/5=0.02π,Q=900。為滿足穩(wěn)定性要求,機器人應(yīng)按照近似五角星型軌跡前進。由圖2(a),(b)看出,定值(c=3,c=5)極值搜索算法隨著梯度變小收斂緩慢,圖2(b)在起點處因參數(shù)過大產(chǎn)生軌跡發(fā)散現(xiàn)象;而圖2(c)梯度自適應(yīng)極值搜索算法基本以一致的收斂速度向氣味源靠近,圖2(d)為參數(shù)隨迭代步數(shù)(代表時間)的自適應(yīng)變化曲線。由表1可看出同樣條件下,本文的算法用時較短,提高了整體效率。
表1 兩種極值搜索算法效率對比Tab 1 Efficiency contrast of two kinds of extremum seeking algorithms
在簡化的Rosenbrock函信號場中,其中,a=0.01其他參數(shù)與二次解析場中相同。圖3(a),(b),(c)對比可得出與二次場中相同的結(jié)論。定值的極值搜索都未能在有限迭代時間內(nèi)到達(dá)極值點附近,而梯度自適應(yīng)極值搜索算法成功。
圖3 簡化的Rosenbrock函數(shù)中實驗對比Fig 3 Experimental contrast in simplified Rosenbrock function
實驗對比可以得出:梯度自適應(yīng)極值搜索算法克服了定值極值搜索方法在梯度較大時易發(fā)散,梯度小時收斂緩慢與效率低的不足。同時,梯度自適應(yīng)極值搜索算法增強了對于梯度較復(fù)雜的函數(shù)的適應(yīng)性。
本文在基于正弦擾動的二維極值搜索方法基礎(chǔ)上,提出了基于梯度估計的參數(shù)自適應(yīng)極值搜索方法。同時,應(yīng)用平均值理論對改進算法進行了理論分析,尤其針對非極值點鄰域內(nèi)的情況,得到改進算法有較一致趨近速度的結(jié)論,并通過李雅普諾夫法證明了算法的收斂性。最終通過在對稱二次解析信號場和簡化Rosenbrock函數(shù)信號場兩種環(huán)境下的仿真對比,說明該方法提高了源搜索效率,并且增強了對于梯度相對較復(fù)雜環(huán)境的適應(yīng)性。
[1]Astrom K J,Wittenmark B.Adaptive control[M].2nd ed.北京:科學(xué)出版社,2003.
[2]左斌,胡云安,施建洪.極值搜索算法的研究與進展[J].海軍航空工程學(xué)院學(xué)報,2006,21(6):611-617.
[3]Drakunov S,Ozguner U,Dix P,et al.ABS control using optimum search via sliding mode[J].IEEE Transactions on Control Systems Technology,1995,3(1):79-85.
[4]Krstic M.Toward faster adaptation in extremum seeking control[C]∥Proceeding of the 39th IEEE Conference on Decision and Control,Phoenix,1999:4766-4771.
[5]左斌,李靜.控制增益未知的多變量極值搜索系統(tǒng)神經(jīng)網(wǎng)絡(luò)自適應(yīng)協(xié)同控制[J].控制理論與應(yīng)用,2013,30(4):405-416.
[6]Sahneh F D,Hu G,Xie L.Extremum seeking control for systems with time-varying extremum[C]∥2012 31st Chinese Control Conference(CCC),IEEE,2012:225-231.
[7]郭曉軍,胡云安,張雷.單變量多單元半全局極值搜索算法仿真研究[J].系統(tǒng)仿真學(xué)報,2013(8):1901-1905,1911.
[8]Ghods N.Extremum seeking for mobile robots[D].Sandiego:University of California,2011.
[9]Liu S J,F(xiàn)rihauf P,Krstic M.Stochastic source seeking with tuning of forward velocity[C]∥Proceedings of the 31st Chinese Control Conference,2012:4424-4429.
[10]Zhang C,Arnold D,Ghods N,et al.Source seeking with non-holonomic unicycle without position measurement and with tuning of forward velocity[J].Systems&Control Letters,2007,56(3):245-252.
控制,氣味源搜索,機器人控制。
Gradient adaptive extremum seeking algorithm for 2D source searching*
MAN Yan-peng,MENG Qing-hao,WANG Jia-ying,LUO Bing,ZENG Ming
(Institute of Robotics and Autonomous Systems,School of Electrical Engineering and Automation,Tianjin University,Tianjin 300072,China)
Sinusoidal-perturbation-based two-dimensional source extremum searching methods have the drawbacks of poor adaptability and mutual restriction between rapidity and accuracy.Aiming at this problem,a gradientestimation-based parameter adaptive extremum seeking algorithm is proposed.On the basis of traditional extremum seeking algorithm,this algorithm estimates gradient of the local area with three historical sample points and adjusts feedback gain parameter adaptively according to the gradient value.Moreover,the average value theory is used to theoretically analyze and prove the convergence of the proposed algorithm.Simulation comparison in different environments show that the proposed algorithm increase source search efficiency and adaptability to complicated gradient environments.
extremum-seeking;source searching;gradient adaptive
TP273.2
A
1000—9787(2016)06—0109—04
10.13873/J.1000—9787(2016)06—0109—04
2015—10—09
國家自然科學(xué)基金資助項目(61271321,61473207,61401303);教育部博士點基金資助項目(20120032110068);天津市科技支撐計劃資助項目(14ZCZDSF00025)
滿艷鵬(1990-),男,天津人,碩士研究生,研究方向為自適應(yīng)