陳浩廣,王銀河
(廣東工業(yè)大學 自動化學院,廣州 510006)
基于擴展BP神經網絡的一類非線性系統(tǒng)自適應控制設計
陳浩廣*,王銀河
(廣東工業(yè)大學 自動化學院,廣州 510006)
(*通信作者電子郵箱haoguang_chen@sina.cn)
針對單輸入單輸出非線性系統(tǒng)的不確定性問題,提出了一種新型的基于擴展反向傳播(BP)神經網絡的自適應控制方法。首先,采用離線數據來訓練BP神經網絡的權值向量;然后,通過在線調節(jié)伸縮因子和逼近精度估計值的更新律,從而來達到控制整個系統(tǒng)的目的。在控制器的設計過程中,利用李亞普諾夫穩(wěn)定性分析原理,保證了閉環(huán)系統(tǒng)的所有狀態(tài)一致終極有界(UUB)。相比傳統(tǒng)的BP神經網絡自適應控制,所提方法能有效地減少在線調節(jié)的參數數目、減輕計算負擔。仿真結果表明,該方法能夠使閉環(huán)系統(tǒng)的所有狀態(tài)都趨于零,即系統(tǒng)達到穩(wěn)定狀態(tài)。
非線性系統(tǒng);自適應控制;反向傳播神經網絡;一致終極有界;穩(wěn)定性
近年來,神經網絡自適應控制已成為控制理論與工程應用領域中的一個研究熱點,其研究成果為解決非線性不確定系統(tǒng)控制設計問題提供了重要方法[1-6]。這些成果的共同特點是:基于神經網絡的萬能逼近性能,利用神經網絡逼近非線性系統(tǒng)中的未知不確定函數,然后采用自適應控制技術設計系統(tǒng)的控制器。在控制器的設計過程中,反向傳播(Back Propagation, BP)神經網絡因其強大的逼近性能、并行處理能力和強的魯棒特性而被廣泛采用。如文獻[7]利用BP神經網絡對被控對象進行在線辨識和控制,并結合常規(guī)的比例積分微分(Proportion Integration Differentiation, PID)控制器,提出了一種基于BP神經網絡的自適應PID控制器。文獻[8] 采用BP神經網絡來逼近非線性離散系統(tǒng)中的未知動態(tài)項,通過結合一個死區(qū)算法來更新網絡中的權值向量,保證了整個控制系統(tǒng)的穩(wěn)定性和收斂性。文獻[9]針對一類帶有未知動態(tài)項或者噪聲干擾項的仿射非線性系統(tǒng),利用BP神經網絡的萬能逼近性能,提出了一種新型的控制律,并應用到氣動伺服系統(tǒng)的位置跟蹤控制,取得了良好的控制效果。雖然上述文獻在自適應控制方面取得了不少突破,但它們仍舊沒辦法解決BP神經網絡收斂速度慢的問題[10],特別是當神經元的數目較多時,在線調節(jié)的自適應參數數目將大量增加,這樣容易導致學習時間過長,使得控制效果不佳。另外,BP神經網絡是一種局部尋優(yōu)方法,權值是沿著局部改善的方向逐漸調整的。當它要解決一個全局的復雜非線性自適應控制問題時,很容易陷入局部極小值[11],從而導致控制的失敗。
為解決以上問題,不少學者針對BP神經網絡自適應控制作了很多研究。文獻[12]利用BP神經網絡的誤差反向傳播機制,解決了控制器中的權值修正問題,使得該控制器具有良好的控制效果。文獻[13]結合粒子群優(yōu)化算法和BP神經網絡的萬能逼近特性,提出了一種新型的自適應控制方法。該方法不僅可以提高全局搜索能力,而且能夠加快收斂。文獻[14]提出了一種混合訓練算法,其中輸入層和隱層的權值訓練采用的是自組織學習算法,隱層和輸出層的權值訓練采用的是梯度下降法,這種混合算法能夠起到減少網絡訓練時間的作用。盡管以上方法在一定程度上減少自適應控制過程中參數的在線調節(jié)時間,但目前仍舊沒有給出一種統(tǒng)一的、有規(guī)律可循的方法來解決這個問題。因此,本文提出了一種具有普遍性,能夠適合任何一種神經網絡類型(本文以BP神經網絡為例)的解決方法。該方法在神經網絡的輸入輸出端加載伸縮器和飽和器,先利用離線數據來訓練神經網絡的權值向量,再通過調節(jié)在線的自適應參數,最后實現了控制整個系統(tǒng)的目的。伸縮器和飽和器的加入,使得該方法在控制器的設計過程中,只需要調節(jié)伸縮因子和神經網絡的逼近精度估計值,這樣可以有效地減少在線的調節(jié)參數、減輕計算負擔,并且能夠保證整個閉環(huán)系統(tǒng)的所有狀態(tài)一致終極有界。
定義3 在一個BP神經網絡的輸入端加載一個伸縮器和一個飽和器,并在其輸出端加載一個伸縮器,結構如圖1所示,稱之為k階擴展的BP神經網絡系統(tǒng)(k-order extended BP neural network system),記為ENS(N,k)。
圖1 擴展的BP神經網絡結構
圖1中,擴展的BP神經網絡ENS(N,k)的輸出為:
(1)
當‖z/ξ‖≤?時,有:
(2)
BP神經網絡的輸出為:
(3)
引理1 考慮在Rn上連續(xù)的k次齊次函數γ(z),也即對于任意正實數λ滿足γ(λz)=λkγ(z)。如果存在一個BP神經網絡N和正實數M,在緊致域z∈{z|‖z‖≤?}上滿足:
(4)
那么擴展的BP神經網絡ENS(N,k)的輸出滿足:
(5)
證明 由齊次函數的定義有γ(z)-ξkγ(z/ξ)=0,因此當z∈{z|‖z‖≤|ξ|?}時,以下不等式成立:
|γ(z)-ξkN(z/ξ)|=|γ(z)-ξkγ(z/ξ)+ξk[γ(z/ξ)-N(z/ξ)]|= |ξ|k|γ(z/ξ)-N(z/ξ)|≤|ξ|kM
(6)
考慮如下非線性系統(tǒng):
(7)
假定1 矩陣(A,B)是可控的,因此存在1×n階矩陣K使A+BK是Hurwitz矩陣,并且對于任意給定的正定矩陣Q,下列Lyapunov方程有唯一正定矩陣解P:
(A+BK)TP+P(A+BK)=-Q
(8)
(9)
由引理1和假定3,可以得到下面不等式:
j=0,1,…,s
(10)
(11)
(12)
(13)
(14)
情況a 當‖z‖>|ξ|?時,利用神經網絡Nj逼近連續(xù)齊次函數Δj,同時采用如下的控制輸入和更新律:
u=0
(15)
(16)
(17)
其中:λ和β是可調的正常數。
(18)
根據文獻[15]和式(18),可以知道閉環(huán)系統(tǒng)的狀態(tài)能在有限的時間內到達曲面s=0,即{Z|s=0}?D。
引理2得證。
情況b 當‖z‖≤|ξ|?時,設計控制器:
u=u1+u2
(19)
(20)
(21)
伸縮因子和逼近精度估計值的更新律分別是:
(22)
(23)
(24)
(25)
由式(25)得到不等式:
(26)
(27)
(28)
(29)
引理3得證。
結合以上兩種情況,可以得出下面定理。
整個神經網絡自適應控制的設計流程如圖2所示。
圖2 神經網絡自適應控制設計流程
考慮如下二階系統(tǒng):
(30)
根據假定2~3,需要離線數據訓練三個BP神經網絡N0、N1、N2來逼近未知的連續(xù)齊次函數Δ0=-Kz、Δ1=h1(z)、Δ2=h2(z),其中K=(-3,-4)。在訓練過程中,采用的算法是梯度下降法。神經網絡的層數是3層,隱層的神經元個數為6,網絡結構是:1—6—1。訓練完成后,將可以得到相應的網絡權值,并保持這些權值不變。
圖3 不同參數的時間相應曲線
本文利用李亞普諾夫穩(wěn)定性分析原理,設計了一種基于擴展BP神經網絡的自適應穩(wěn)定控制器。該控制器結合了離線訓練與在線調節(jié),很好地解決了傳統(tǒng)BP神經網絡收斂速度慢的缺點,并通過在線調節(jié)伸縮因子和逼近精度估計值的更新律,來保證閉環(huán)系統(tǒng)的所有狀態(tài)達到一致終極有界。但是,該控制器在設計過程中,需要假定被控系統(tǒng)的未知函數能分解成連續(xù)的齊次函數。因此,其應用范圍受到了一定的限制。在今后的研究中,可以考慮是否通過引進Lipschitz條件,來消除這個局限。
)
[1] 吳玉香,王聰.不確定機器人的自適應神經網絡控制與學習[J].控制理論與應用,2013,30(8):990-997.(WUYX,WANGC.Adaptiveneuralnetworkcontrolandlearningforuncertainrobot[J].ControlTheoryandApplications, 2013, 30(8): 990-997.)
[2]ZUOY,WANGYN,LIUXZ.NeuralnetworkrobustH∞-trackingcontrolstrategyforrobotmanipulators[J].AppliedMathematicalModeling, 2010, 34(7):1823-1838.
[3]CHANGYC,YENHM.Robusttrackingcontrolforaclassofuncertainelectricallydrivenrobots[J].IETControlTheory&Applications, 2009, 3(5): 519-532.
[4]CHENB,ZHANGHG,LINC.Observer-basedadaptiveneuralnetworkcontrolfornonlinearsystemsinnonstrict-feedbackform[J].IEEETransactionsonNeuralNetworksandLearningSystems, 2016, 27(1): 89-98.
[5]SAHOOA,XUH,JAGANNATHANS.Adaptiveneuralnetwork-basedevent-triggeredcontrolofsingle-inputsingle-outputnonlineardiscrete-timesystems[J].IEEETransactionsonNeuralNetworksandLearningSystems, 2016, 27(1): 151-164.
[6]GAOSG,DONGHR,NINGB,etal.NeuraladaptivecontrolforuncertainMIMOsystemswithconstrainedinputviainterceptedadaptationandsinglelearningparameterapproach[J].NonlinearDynamics, 2015, 82(3): 1109-1126.
[7] 譚永紅.基于BP神經網絡的自適應控制[J].控制理論與應用,1994,11(1):84-88.(TANYH.AdaptivecontrolbasedonBPneuralnetwork[J].ControlTheoryandApplications, 1994, 11(1): 84-88.)
[8]LIXL,LIUDX,LIJY,etal.Robustadaptivecontrolfornonlineardiscrete-timesystemsbyusingmultiplemodels[J].MathematicalProblemsinEngineering, 2013(8): 1-10.
[9]LUL,LIUFG,SHIWX.Neural-networkadaptivecontrollerfornonlinearsystemsanditsapplicationinpneumaticservosystems[J].JournalofControlTheoryandApplications, 2008, 6(1): 97-103.
[10] 張昭昭,喬俊飛,楊剛.一種功能分區(qū)的BP神經網絡結構設計方法[J].控制與決策,2011,26(11):1659-1664.(ZHANGZZ,QIAOJF,YANGG.Structuremodeloffunction-dividingdesignforBPneuralnetwork[J].ControlandDecision, 2011, 26(11): 1659-1664.)
[11] 馮立穎.改進的BP神經網絡算法及其應用[J].計算機仿真,2010,27(12):172-175.(FENGLY.OptimizedBPneuralnetworksalgorithmanditsapplication[J].ComputerSimulation, 2010, 27(12): 172-175.)
[12] 沈瑛,張翠芳.基于BP神經網絡的模型參考自適應控制[J].西南交通大學學報,2001,36(5):553-556.(SHENY,ZHANGCF.ModelreferenceadaptivecontrolbasedonBPneuralnetworks[J].JournalofSouthwestJiaotongUniversity, 2001, 36(5): 553-556.)
[13]ZHANGJR,ZHANGJ,LOKTM,etal.Ahybridparticleswarmoptimization-back-propagationalgorithmforfeedforwardneuralnetworktraining[J].AppliedMathematicsandComputation, 2007, 185(2): 1026-1037.
[14]NASRMB,CHTOUROUM.Neuralnetworkcontrolofnonlineardynamicsystemsusinghybridalgorithm[J].AppliedSoftComputing, 2014, 24: 423-431.
[15]SLOTINEJE,LIW.AppliedNonlinearControl[M].UpperSaddleRiver,NJ:Prentice-Hall, 1991: 251-253.
[16]WANGM,WANGC,LIUXP.Dynamiclearningfromadaptiveneuralcontrolwithpredefinedperformanceforaclassofnonlinearsystems[J].InformationSciences, 2014, 279: 874-888.
ThisworkispartiallysupportedbytheNationalNaturalScienceFoundationofChina(61273219, 61673120),theSpecializedResearchFundfortheDoctoralProgramofHigherEducationofChina(20134420110003).
CHEN Haoguang, born in 1986, Ph. D. candidate. His research interests include neural network, fuzzy control.
WANG Yinhe, born in 1962, Ph. D., professor. His research interests include complex network, nonlinear control.
Adaptive control design for a class of nonlinear systems based on extended BP neural network
CHEN Haoguang*, WANG Yinhe
(SchoolofAutomation,GuangdongUniversityofTechnology,GuangzhouGuangdong510006,China)
Aiming at the uncertainty of Single-Input-Single-Output (SISO) nonlinear systems, a novel adaptive control design based on extended Back Propagation (BP) neural network was proposed. Firstly, the weight vectors of BP neural network were trained via the offline data. Then, the scaling factor and estimation parameter of approximate accuracy were adjusted online to control the whole system by update law. In the design process of controller, with the Lyapunov stability analysis, the adaptive control scheme was proposed to guarantee that all the states of the closed-loop system were Uniformly Ultimately Bounded (UUB). Compared with the traditional adaptive control method of BP neural network, the proposed method can effectively decrease the parameter number of online adjustment and reduce the burden of computation. The simulation results show that the proposed method can make all the states of the closed-loop system tend to be zero, which means the system reaches the steady state.
nonlinear system; adaptive control; Back Propagation (BP) neural network; uniformly ultimately bounded; stability
2016- 12- 05;
2017- 03- 02。
國家自然科學基金資助項目(61273219,61673120); 教育部高等學校博士學科點專項科研基金資助項目(20134420110003)。
陳浩廣(1986—),男,廣東汕頭人,博士研究生,主要研究方向:神經網絡、模糊控制; 王銀河(1962—),男,內蒙古包頭人,教授,博士,主要研究方向:復雜網絡、非線性控制。
1001- 9081(2017)06- 1670- 04
10.11772/j.issn.1001- 9081.2017.06.1670
TP183; TP273
A