鐘婧佳,趙 洪,佟澤友,蔣明明,黃建友
基于RBF神經(jīng)網(wǎng)絡(luò)的控制器參數(shù)優(yōu)化設(shè)計研究
鐘婧佳,趙 洪,佟澤友,蔣明明,黃建友
(中國運載火箭技術(shù)研究院,北京,100076)
以單輸入單輸出控制系統(tǒng)為研究對象,為快速完成控制器參數(shù)整定及優(yōu)化,提升系統(tǒng)動態(tài)性能和穩(wěn)態(tài)性能,提出了一種基于RBF(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)的控制器參數(shù)優(yōu)化方法。利用RBF神經(jīng)網(wǎng)絡(luò)的局部逼近能力和自學(xué)習(xí)能力,構(gòu)造出控制系統(tǒng)辨識與控制器參數(shù)優(yōu)化雙網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)了對被控對象的在線辨識及增量式不完全微分PID控制器參數(shù)的在線迭代,快速完成控制器參數(shù)的整定,在保證系統(tǒng)動態(tài)特性的同時,大幅提升穩(wěn)定精度。
控制系統(tǒng);參數(shù)優(yōu)化;RBF神經(jīng)網(wǎng)絡(luò);系統(tǒng)辨識
模糊控制和自適應(yīng)控制是智能控制的兩個重要分支,在實際應(yīng)用中,對于非完全已知的系統(tǒng)和難建立精確數(shù)學(xué)模型的系統(tǒng)能起到較傳統(tǒng)控制理論更為優(yōu)越的控制性能。由于神經(jīng)網(wǎng)絡(luò)具有逼近任意非線性關(guān)系的自學(xué)習(xí)能力,在現(xiàn)代控制領(lǐng)域中得到越來越多的應(yīng)用。PID控制及不完全微分PID控制由于其算法簡便、魯棒性強的特點,是經(jīng)典控制中的主要方法,但是控制器的參數(shù)整定方法仍存在較大優(yōu)化空間。因而將經(jīng)典控制和神經(jīng)網(wǎng)絡(luò)相結(jié)合,以便改進傳統(tǒng)經(jīng)典控制方法的控制性能,成為各領(lǐng)域單輸入單輸出控制系統(tǒng)設(shè)計的研究熱點[1~6]。
本文以平臺穩(wěn)定回路控制系統(tǒng)為研究對象,提出一種基于徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法,利用RBF神經(jīng)網(wǎng)絡(luò)的局部逼近能力和自學(xué)習(xí)能力,構(gòu)建了被控對象的模糊系統(tǒng)辨識網(wǎng)絡(luò)及控制器參數(shù)優(yōu)化網(wǎng)絡(luò),實現(xiàn)增量式不完全微分PID控制器參數(shù)的在線整定,在滿足系統(tǒng)動態(tài)特性要求的同時,大幅提升系統(tǒng)穩(wěn)定精度。
由于復(fù)雜系統(tǒng)的數(shù)學(xué)模型建立存在近似性,且存在設(shè)備老化等引起的參數(shù)漂移問題,因而無法準確建立被控對象的數(shù)學(xué)模型,這對控制器參數(shù)的整定帶來較大誤差。因此設(shè)計一種既能完成復(fù)雜系統(tǒng)模型辨識,又能快速實現(xiàn)參數(shù)整定、提升系統(tǒng)動態(tài)性能和穩(wěn)態(tài)性能的自適應(yīng)控制器具有一定的工程意義。
神經(jīng)網(wǎng)絡(luò)是通過人工模擬人腦的工作機理來實現(xiàn)智能辨識,具有很強的自學(xué)習(xí)能力和非線性逼近能力,不僅可以實現(xiàn)線性系統(tǒng)的辨識,還可以用來解決復(fù)雜的非線性、時變性、不確定的系統(tǒng)辨識問題。神經(jīng)網(wǎng)絡(luò)是一種具有自適應(yīng)和自學(xué)習(xí)功能的系統(tǒng)辨識方法,它可以通過在線或離線的方式,對訓(xùn)練樣本的輸入和輸出進行學(xué)習(xí)并不斷調(diào)整內(nèi)部參數(shù),使輸出值可以無限逼近于理想值,因此可以在不了解系統(tǒng)內(nèi)部機理的情況下進行系統(tǒng)辨識[7~11]。
RBF神經(jīng)網(wǎng)絡(luò)是一種3層結(jié)構(gòu)的局部逼近式學(xué)習(xí)網(wǎng)絡(luò),其中輸入層的神經(jīng)元個數(shù)與被辨識系統(tǒng)的輸入信號維數(shù)相同,隱含層單元數(shù)由辨識對象的結(jié)構(gòu)和需要決定,第3層為輸出層,是模型對輸入信號做出的響應(yīng),一般為1個,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
RBF神經(jīng)網(wǎng)絡(luò)利用高斯基函數(shù)在有限范圍內(nèi)為非零值的特點,以一種局部逼近的方式大大加快學(xué)習(xí)速度并避免多層前饋網(wǎng)絡(luò)(Back Propagation,BP)是網(wǎng)絡(luò)等存在的局部極小問題[12]。它模擬了人腦中局部調(diào)整、相互覆蓋接受域的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),利用高斯基函數(shù)值在輸入空間的有限范圍內(nèi)為非零值,實現(xiàn)局部逼近。RBF神經(jīng)網(wǎng)絡(luò)因徑向基函數(shù)的結(jié)構(gòu)特點,由輸入到隱含層的映射是非線性的,而從隱含層到輸出層只是加權(quán)形式的線性運算,因此它具有逼近任意連續(xù)函數(shù)的優(yōu)勢。此外,它具有局部逼近的特點,可以對手動整定的控制器參數(shù)進行進一步的學(xué)習(xí)優(yōu)化,得到控制精度更高的控制器參數(shù)。且不同于其他神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其局部參數(shù)調(diào)整的特點可以大大加快控制器參數(shù)的學(xué)習(xí)速度,提高效率,其逼近原理框圖如圖2所示。
圖2 RBF神經(jīng)網(wǎng)絡(luò)逼近原理
不論系統(tǒng)的模型是否已知,RBF神經(jīng)網(wǎng)絡(luò)都可以通過不斷地自學(xué)習(xí)使網(wǎng)絡(luò)輸出無限逼近于實際系統(tǒng)輸出。因此可以利用其這一特點來復(fù)現(xiàn)被控對象并通過不斷迭代更新,將控制系統(tǒng)的參數(shù)進行優(yōu)化。特別的是,RBF神經(jīng)網(wǎng)絡(luò)既可以對已知模型的系統(tǒng)進行控制參數(shù)優(yōu)化,又可以根據(jù)實際系統(tǒng)輸入輸出逼近未知模型的復(fù)雜系統(tǒng)并完成控制參數(shù)優(yōu)化。
針對已知系統(tǒng)模型的系統(tǒng),單憑經(jīng)驗對控制器的各參數(shù)進行調(diào)試難免不能兼顧所有技術(shù)指標。通過不斷調(diào)試仿真得到的控制器參數(shù)可以大致使響應(yīng)曲線的超調(diào)量及調(diào)節(jié)時間達到要求,但很難兼顧穩(wěn)定精度這一指標達到最優(yōu),因此本節(jié)利用RBF神經(jīng)網(wǎng)絡(luò)的局部逼近原理對控制器參數(shù)進行進一步優(yōu)化,在滿足其他動態(tài)性能要求的同時,提高系統(tǒng)的穩(wěn)定精度。其原理如圖3所示。
圖3 基于RBF神經(jīng)網(wǎng)絡(luò)的PID自校正控制
從圖3可見,利用RBF的逼近能力和自學(xué)習(xí)特點與不完全微分PID自校正控制器、控制參數(shù)調(diào)節(jié)器、被控對象共同組成一個神經(jīng)網(wǎng)絡(luò)自校正控制系統(tǒng),從而實現(xiàn)對象參數(shù)自動整定的自適應(yīng)控制技術(shù)。自校正控制系統(tǒng)是由兩大部分組成:a)神經(jīng)網(wǎng)絡(luò)辨識器與控制參數(shù)調(diào)節(jié)器的設(shè)計,這是兩個并行的學(xué)習(xí)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)辨識器以系統(tǒng)的控制器輸出與被控對象的輸出作為RBF網(wǎng)絡(luò)的輸入,通過不斷迭代的網(wǎng)絡(luò)輸出值可以無限逼近系統(tǒng)輸出。每次更新迭代生成的Jacobian信息實時地傳遞給控制參數(shù)調(diào)節(jié)器,從而進行第2個學(xué)習(xí)網(wǎng)絡(luò),迭代更新各參數(shù)的變化量最終傳遞給不完全微分PID自校正控制器進行參數(shù)優(yōu)化。b)以不完全微分PID自校正控制器與被控對象構(gòu)成的反饋回路,自校正控制器根據(jù)控制參數(shù)調(diào)節(jié)器在每個采樣周期內(nèi)的變化量進行參數(shù)的不斷更新優(yōu)化,使系統(tǒng)響應(yīng)輸出朝著高穩(wěn)定精度的方向發(fā)展。
由于不完全微分PID的數(shù)字控制器在每一個采樣周期的輸出都與過去狀態(tài)有關(guān),且每次計算都會對系統(tǒng)誤差量進行累計,大大增加了數(shù)字控制器的計算量。因此這里選用增量式不完全微分PID控制算法,即數(shù)字控制器的輸出是控制量的增量。其中不完全微分PID的數(shù)字控制器在第個采樣周期的輸出為
根據(jù)遞推原理可得:
因此,得到控制增量:
其中,控制器參數(shù)依據(jù)梯度下降法進行迭代更新,更新量可以表示為
Jacobian信息是通過神經(jīng)網(wǎng)絡(luò)辨識器進行在線逼近得到的,可以看出,當控制器的輸入誤差量小到一定程度時,控制器4個參數(shù)是基本保持穩(wěn)定的,又因為RBF神經(jīng)網(wǎng)絡(luò)是局部逼近的,因此可以在保證系統(tǒng)動態(tài)性能不變的情況下提高穩(wěn)定精度。
為驗證RBF神經(jīng)網(wǎng)絡(luò)對控制器參數(shù)的優(yōu)化效果,根據(jù)2.3節(jié)的推導(dǎo)公式,利用RBF神經(jīng)網(wǎng)絡(luò)對被控對象輸出進行實時逼近,并對被控系統(tǒng)的不完全微分PID控制器的各參數(shù)進行不斷迭代更新,用最終得到的控制器參數(shù)對系統(tǒng)進行校正,并與原系統(tǒng)輸出進行對比,驗證參數(shù)優(yōu)化的效果。
通過仿真實驗,得到模型辨識網(wǎng)絡(luò)的預(yù)測輸出與辨識對象的實際輸出對比圖,以及網(wǎng)絡(luò)的逼近誤差收斂曲線,如圖4所示。
圖4 模型辨識網(wǎng)絡(luò)輸出逼近結(jié)果
由圖4可知,由RBF神經(jīng)網(wǎng)絡(luò)組成的模型辨識網(wǎng)絡(luò)的輸出在迭代更新不到50次就可以無限逼近于實際輸出,其逼近精度達到10-8,因此其提供給參數(shù)優(yōu)化網(wǎng)絡(luò)的Jacobian信息較為精確,有利于參數(shù)優(yōu)化的水平。隨著不斷迭代更新,Jacobian信息、不完全微分控制器參數(shù)都慢慢趨于平穩(wěn),其參數(shù)更新曲線以及自校正系統(tǒng)誤差曲線分別如圖5所示。圖5中縱坐標為無量綱響應(yīng)輸出。
圖5 不完全微分控制器參數(shù)曲線
從圖5可以看出,提供給調(diào)節(jié)控制器的Jacobian信息最終趨于平穩(wěn),自校正系統(tǒng)的控制器參數(shù)最終也趨于穩(wěn)定,并且系統(tǒng)的誤差曲線是收斂于0的。從參數(shù)賦值到趨于平穩(wěn)整個過程可以在不到0.1 s的時間內(nèi)完成,可以看出RBF神經(jīng)網(wǎng)絡(luò)的局部逼近和學(xué)習(xí)能力很強。進一步對比分析RBF神經(jīng)網(wǎng)絡(luò)優(yōu)化控制器參數(shù)的優(yōu)劣,這里將原校正參數(shù)與優(yōu)化后參數(shù)分別帶入控制器對原系統(tǒng)進行校正,對比二者的控制效果,如圖6所示。
圖6 控制器參數(shù)優(yōu)化前后系統(tǒng)輸出曲線
由仿真結(jié)果可知,經(jīng)RBF神經(jīng)網(wǎng)絡(luò)優(yōu)化后的控制器參數(shù)可以很好地保證系統(tǒng)響應(yīng)輸出的動態(tài)特性,且最終穩(wěn)定精度可以由10-3提升到10-5量級,因此驗證了基于RBF神經(jīng)網(wǎng)絡(luò)的自校正控制方法的可行性。這種方法不僅可以適用于模型已知的系統(tǒng)參數(shù)優(yōu)化,還可以適用于模型未知的在線參數(shù)優(yōu)化。
針對以單輸入單輸出為代表的控制系統(tǒng)控制器參數(shù)整定問題,利用RBF神經(jīng)網(wǎng)絡(luò)的局部逼近能力和快速學(xué)習(xí)能力可構(gòu)建模糊對象的在線模型辨識網(wǎng)絡(luò)及控制器參數(shù)優(yōu)化網(wǎng)絡(luò)雙網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)復(fù)雜控制系統(tǒng)的控制參數(shù)在線整定,進而大幅提升控制系統(tǒng)的動態(tài)性能和穩(wěn)態(tài)性能。此外,由于RBF神經(jīng)網(wǎng)絡(luò)具有局部逼近任意非線性特性的特點,因而這種復(fù)合控制方法適用于尋求控制器參數(shù)的局部最優(yōu)解,可作為控制器參數(shù)粗調(diào)整后的精細化優(yōu)化手段。
[1] 魏宗康. 動調(diào)陀螺四軸平臺系統(tǒng)建模及其智能控制設(shè)計[D]. 北京: 中國運載火箭技術(shù)研究院, 2001.
Wei Zongkang. Modeling and intelligent control design of dynamically tuned gyroscope four axis platform system[D]. Beijing: China Launch Vehicle Technology Research Institute, 2001.
[2] 付常亮, 王瑋. 三軸旋轉(zhuǎn)式慣導(dǎo)平臺框架控制耦合問題研究[J]. 微型機與應(yīng)用, 2015, 34(4): 79-82.
Fu Changliang, Wang Wei. Research on control coupling of three axisrotary inertial navigation platform frame[J]. Microcomuter and Its Application, 2015, 34(4): 79-82.
[3] 徐江華. 自整定PID控制的理論、軟件及應(yīng)用研究[D]. 上海: 上海交通大學(xué), 2004.
Xu Jianghua. Research on theory, software and application of self tuning PID control[D]. Shanghai: Shanghai Jiaotong University, 2004.
[4] Simon O, Andreas K, Phillip T. Observer-based nonlinear control strategies for Hardware-in the Loop simulations of multiaxial suspension test rigs[J]. Mechatronics, 2017(10): 7-20
[5] 宋金來, 甘作新, 韓京清. 自抗擾控制技術(shù)濾波特性的研究[J]. 控制與決策, 2003, 18(1): 110-119.
Song Jinlai, Gan Zuoxin, Han Jingqing. Study on the filtering characteristics of auto disturbance rejection control[J]. Control and Decision, 2003, 18(1): 110-119.
[6] Kravaris C, Sotiropoulos V, Georgiou C, et al. Nonlinear observer design for state and disturbance estimation[C]. MA, USA: American Control Conference, 2004.
[7] Abdo M M, Vali A R, Toloei A R, et al. Stabilization loop of a two axes gimbal system using self-tuning PID type fuzzy controller[J]. ISA Trans., 2014, 53(2): 591-602.
[8] 朱明超, 劉慧, 張鑫, 賈宏光. 慣性穩(wěn)定平臺自適應(yīng)前饋控制[J]. 光學(xué)精密工程, 2015, 23(1): 141-148.
Zhu Mingchao, Liu Hui, Zhang Xin, Jia Hongguang. Adaptive feedforward control for inertial stabilized platform[J]. Optical Precision Engineering, 2015, 23(1): 141-148.
[9] Astrom K J, Hagglund T. PID controllers: theory, design and tuning[M]. North Carolina: Instrument Society of America, 1995.
[10] 舒駿逸. 兩軸四框架跟蹤平臺伺服控制系統(tǒng)的設(shè)計與實現(xiàn)[D]. 北京: 北京理工大學(xué), 2016.
Shu Junyi. Design and implementation of servo control system for two axis and four frame tracking platform[D]. Beijing: Beijing Institute of Technology, 2016.
[11] 劉金琨. 系統(tǒng)辨識理論及MATLAB仿真[M]. 北京: 電子工業(yè)出版社,2013.
Liu Jinkun. System identification theory and MATLAB simulation[M]. Beijing: Beijing Electronic Industry Press, 2013.
Research on Optimal Design of Controller Parameters Based on RBF Neural Network
Zhong Jing-jia, Zhao Hong, Tong Ze-you, Jiang Ming-ming, Huang Jian-you
(China Academy of Launch Vehicle Technology, Beijing, 100076)
Taking single input single output control system as research object, a controller parameter optimization method based on RBF neural network is presented to quickly complete controller parameter tuning and optimization and to improve system dynamic performance and steady-state performance. Using the local approximation ability and self-learning ability of the RBF neural network, a control system identification and controller parameter optimization dual network structure is constructed. Taking this method, the online identification of the controlled object and the online iteration of the parameters of the incremental incomplete differential PID controller is realized. It can quickly complete parameter tuning, while ensuring the dynamic characteristics of the system, greatly improve the stability accuracy.
control system; parameter optimization; RBF neural network; system identification
1004-7182(2020)03-0076-05
10.7654/j.issn.1004-7182.20200314
V448
A
鐘婧佳(1994-),女,助理工程師,主要研究方向為導(dǎo)航、制導(dǎo)與控制。
趙 洪(1988-),男,工程師,主要研究方向為導(dǎo)航、制導(dǎo)與控制。
佟澤友(1984-),男,高級工程師,主要研究方向為飛行器總體設(shè)計。
蔣明明(1990-),男,工程師,主要研究方向為導(dǎo)航、制導(dǎo)與控制。
黃建友(1990-),男,工程師,主要研究方向為導(dǎo)航、制導(dǎo)與控制。
2020-04-13;
2020-04-27