張 超 ,孫啟鳴
(1.河南工學(xué)院電氣工程與自動(dòng)化學(xué)院,河南新鄉(xiāng) 453003;2.南京林業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院,江蘇南京 210037)
非線性控制領(lǐng)域的發(fā)展涉及3個(gè)主要問題[1]:需要處理越來越復(fù)雜的系統(tǒng),涉及被控對(duì)象的噪聲、時(shí)變和不確定非線性等特性;需要在缺少被控對(duì)象及其環(huán)境精確先驗(yàn)知識(shí)的情況下達(dá)到控制要求;需要滿足日益增長的高實(shí)時(shí)性應(yīng)用要求.盡管在非線性系統(tǒng)控制領(lǐng)域取得了一些成果,但它們并沒有綜合考慮系統(tǒng)的不確定性、時(shí)變特性以及測(cè)量噪聲.同時(shí),所采用的控制算法和結(jié)構(gòu)應(yīng)足夠簡(jiǎn)單且易于實(shí)現(xiàn).設(shè)計(jì)的控制方案應(yīng)具有非線性、魯棒性、靈活性和學(xué)習(xí)能力.此外,如果不做處理,對(duì)象噪聲和隨機(jī)干擾就會(huì)不受抑制地出現(xiàn)在前饋控制器的輸入端,這將大大降低自適應(yīng)過程的穩(wěn)定性以及嚴(yán)重影響控制精度.因此,如何在確保實(shí)時(shí)性能的前提下將隨機(jī)因素、時(shí)變特性和不確定非線性的影響一同最小化是具有重要意義的.
隨著未知參數(shù)增加帶來的復(fù)雜度激增、初始狀態(tài)不穩(wěn)定、未考慮測(cè)量噪聲等隨機(jī)因素以及一般不適合高實(shí)時(shí)性應(yīng)用場(chǎng)合,這些自適應(yīng)控制方法的不足[2-4]迫使工程師尋求其他解決方案.同時(shí),隨著解決被控對(duì)象不確定性和復(fù)雜性的智能控制技術(shù)的迅速發(fā)展,神經(jīng)網(wǎng)絡(luò)計(jì)算架構(gòu)的大規(guī)模并行計(jì)算、自然容錯(cuò)性和隱式編程規(guī)則,都表明其可能是實(shí)現(xiàn)實(shí)時(shí)自適應(yīng)控制器的選擇之一[5].在過去的20年里,一些神經(jīng)網(wǎng)絡(luò)模型和神經(jīng)網(wǎng)絡(luò)訓(xùn)練方案被應(yīng)用于系統(tǒng)控制器的設(shè)計(jì).然而,神經(jīng)網(wǎng)絡(luò)仍然存在學(xué)習(xí)速度慢、泛化能力弱和魯棒性不強(qiáng)等缺點(diǎn)[6].此外,在解決噪聲和干擾問題時(shí),通常采用固定的低通濾波器來消除系統(tǒng)測(cè)量和其他部分的高頻干擾,由于濾波器參數(shù)在整個(gè)消噪過程中保持不變[7],噪聲消除算法不適應(yīng)系統(tǒng)的時(shí)間變化,容易出現(xiàn)過調(diào).可見,具有噪聲干擾的不確定非線性時(shí)變系統(tǒng)控制問題需更好地解決和處理.
多維泰勒網(wǎng)(multi-dimensional Taylor network,MTN)及其最優(yōu)控制思想是由東南大學(xué)嚴(yán)洪森教授于2010年提出的[8],如圖1所示.該模型可以很好地代替?zhèn)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)進(jìn)行動(dòng)態(tài)系統(tǒng)建模和控制,其本質(zhì)上是多項(xiàng)式型的非線性自回歸滑動(dòng)平均模型,借助于抽頭延遲映射來表示動(dòng)態(tài)系統(tǒng).目前一些學(xué)者正對(duì)該模型在模型預(yù)測(cè)[9]、系統(tǒng)辨識(shí)[10]、災(zāi)害預(yù)測(cè)[11]、電機(jī)控制[12]以及非線性控制[13-15]等領(lǐng)域的應(yīng)用進(jìn)行研究,但并未考慮不確定性、時(shí)變特性及測(cè)量噪聲等綜合因素.MTN具有結(jié)構(gòu)簡(jiǎn)單、運(yùn)算速度快的優(yōu)點(diǎn).同時(shí),研究發(fā)現(xiàn)PID控制器是MTN控制器的特殊形式,其參數(shù)可作為后者的初始參數(shù),詳細(xì)說明見第4節(jié).
文獻(xiàn)[16]強(qiáng)調(diào)不應(yīng)該把所有問題都孤注一擲地寄托在“反饋”環(huán)節(jié)上.在大多數(shù)情況下,一個(gè)最佳的控制結(jié)構(gòu)應(yīng)該是每次只給反饋部分較小的改變.基于此考慮,本文研究工作在以下方面展開:1)對(duì)于系統(tǒng)辨識(shí),辨識(shí)器所需參數(shù)越少越好,因?yàn)閰?shù)越多,對(duì)模型的隨機(jī)影響越大.并且由于實(shí)時(shí)性是控制系統(tǒng)應(yīng)用的關(guān)鍵,MTN辨識(shí)器(multi-dimensional Taylor network identifier,MTNI)需要在相對(duì)較少的節(jié)點(diǎn)數(shù)下收斂.為此,采用改進(jìn)的靈敏度計(jì)算方法[17]來剪除網(wǎng)絡(luò)冗余輸入項(xiàng)和冗余中間層回歸項(xiàng);2)由于被控對(duì)象一般都是未知的,控制器訓(xùn)練所需的動(dòng)力學(xué)特性信息通常是不可取的.許多應(yīng)用中只是簡(jiǎn)單地使用對(duì)象響應(yīng)符號(hào)變化.由于已可通過MTNI得到被控對(duì)象精確的模型更新信息,故MTN控制器(multi-dimensional Taylor network identifier controller,MTNC)的權(quán)值調(diào)整相對(duì)于無法得到動(dòng)力學(xué)特性的情況就變得更加平滑;3)引入MTN濾波器(multi-dimensional Taylor network identifier filter,MTNF)并利用自適應(yīng)噪聲消除[18]來消除控制干擾和測(cè)量噪聲,以獲得期望的控制精度和穩(wěn)定性.更加重要的是,基于MTN控制方案的收斂性需嚴(yán)格證明.對(duì)于MTNI和MTNC,過高的學(xué)習(xí)率會(huì)導(dǎo)致系統(tǒng)不穩(wěn)定,而較低的學(xué)習(xí)率又可能會(huì)減慢學(xué)習(xí)過程.因此,本文采用穩(wěn)定的自適應(yīng)學(xué)習(xí)率來保證收斂性,即根據(jù)Lyapunov穩(wěn)定性理論尋找學(xué)習(xí)率邊界,進(jìn)而獲得最優(yōu)學(xué)習(xí)率.此外,為了確保MTNF的穩(wěn)定性,推導(dǎo)出濾波器步長的約束條件.
綜上所述,3個(gè)多維泰勒網(wǎng)模型分別用來構(gòu)造MTNI,MTNC和MTNF.首先,基于被控對(duì)象的開環(huán)輸入輸出數(shù)據(jù),離線設(shè)計(jì)并訓(xùn)練MTNI和MTNC.當(dāng)訓(xùn)練完成時(shí),其初始權(quán)值和網(wǎng)絡(luò)結(jié)構(gòu)可同時(shí)確定.然后,通過MTNI實(shí)現(xiàn)不確定非線性時(shí)變系統(tǒng)辨識(shí),提供模型信息在線更新MTNC.而后,設(shè)計(jì)用于消除隨機(jī)干擾的MTNF以實(shí)現(xiàn)精確控制,其權(quán)值通過改進(jìn)的歸一化最小均方算法(least mean square,LMS)算法進(jìn)行調(diào)整.最終,將自適應(yīng)控制方案應(yīng)用于具有噪聲干擾的不確定非線性時(shí)變系統(tǒng),整體MTN控制方案具有學(xué)習(xí)和適應(yīng)能力.
考慮不確定非線性時(shí)變離散系統(tǒng),可用輸入輸出差分方程表示為
其中:f(·)為非線性標(biāo)量函數(shù);y(k)∈R為系統(tǒng)輸出;u(k)∈R為系統(tǒng)輸入;k=1,2,···;dy和du為相應(yīng)的最大延遲.
如果被控對(duì)象所處的環(huán)境存在噪聲干擾,也就是被控對(duì)象受到噪聲的作用,或者說被控對(duì)象受到噪聲的污染,那么在式(1)中應(yīng)加入相應(yīng)的項(xiàng),可得到
其中噪聲干擾為不能用時(shí)間函數(shù)明確表示的一種隨機(jī)過程.根據(jù)其來源[19],可分為如下幾類:1)聲音噪聲;2)熱噪聲和散粒噪聲;3)電磁噪聲;4)靜電噪聲;5)信道失真、回波和衰落等. v(k)為噪聲,可以是模型噪聲,也可以是測(cè)量噪聲.為了更好地模擬未知的真實(shí)噪音,v(k)取高斯白噪聲.具有噪聲干擾的非線性時(shí)變系統(tǒng)就是其擾動(dòng)可用隨機(jī)過程表示的受控動(dòng)力學(xué)時(shí)變系統(tǒng),為描述方便,具有噪聲干擾的非線性時(shí)變系統(tǒng)簡(jiǎn)稱成含噪聲非線性時(shí)變系統(tǒng).因此,式(2)被稱為含噪聲非線性時(shí)變系統(tǒng).
本文提出了一種通用的多維泰勒網(wǎng)模型,如圖1所示.根據(jù)多元泰勒公式的原理,如果某函數(shù)在某點(diǎn)鄰域處m+1階可導(dǎo),則該函數(shù)在該點(diǎn)展開式為變量冪級(jí)數(shù)不大于m次的形式.因此,基于多維泰勒網(wǎng)模型,可將n維系統(tǒng)的一般動(dòng)力學(xué)方程表示為
其中:f(·)表示用MTN模型描述的非線性函數(shù),其基本思想是用簡(jiǎn)單函數(shù)逼近復(fù)雜函數(shù);wt是第t個(gè)變量乘積項(xiàng)之前的權(quán)值;N(n,m)是該展開式的總項(xiàng)數(shù);λt,i是第t個(gè)變量乘積項(xiàng)中變量xi的冪次,且≥m,即f是由其各變量的冪次之和小于等于m的變量乘積項(xiàng)加權(quán)之和組成的.
正如所見,多維泰勒網(wǎng)采用前向單中間層結(jié)構(gòu),包括輸入層、中間層和輸出層.只要N(n,m)足夠大,它就能夠以足夠的精度逼近任意模型[11,20].盡管式(3)是系統(tǒng)輸入輸出的非線性函數(shù),但模型參數(shù)是線性關(guān)系的.通過抽頭延遲將系統(tǒng)的動(dòng)力學(xué)特性引入到網(wǎng)絡(luò)輸入端,可形成動(dòng)態(tài)的網(wǎng)絡(luò)化控制器.
本部分利用網(wǎng)絡(luò)學(xué)習(xí)策略,通過改進(jìn)的梯度下降學(xué)習(xí)算法實(shí)現(xiàn)MTN辨識(shí)器權(quán)值快速更新.
目標(biāo)函數(shù)為
其中:eI(k)=ye(k)?yI(k),ye(k)和yI(k)分別表示系統(tǒng)輸出和MTN模型輸出,可調(diào)參數(shù)wI代表MTN模型權(quán)值.將相對(duì)于可調(diào)參數(shù)wI的目標(biāo)函數(shù)最小化:
更新方程為
其中ηI為MTNI的學(xué)習(xí)率.
為追求更快的收斂速度,滿足時(shí)變系統(tǒng)建模要求,解決采用步長固定的梯度下降法時(shí)收斂速度慢的缺陷,引入增量梯度法[21]用于系統(tǒng)辨識(shí),在每步學(xué)習(xí)時(shí)都尋求最優(yōu)步長.
由于
其中u(k)為MTN辨識(shí)器輸入向量.
從而
權(quán)值修正后的yI(k+1)可展開為一階泰勒級(jí)數(shù)
將式(8)(?wI(k)的修正公式)代入式(10),有
最優(yōu)步長為
精簡(jiǎn)的MTNI和MTNC將大大減少迭代學(xué)習(xí)時(shí)間并簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu),這有助于工程實(shí)踐和硬件實(shí)現(xiàn).對(duì)于任意復(fù)雜的非線性函數(shù),10個(gè)左右的中間層分量足以,因此在離線階段的網(wǎng)絡(luò)規(guī)模簡(jiǎn)化十分必要[10].
靈敏度計(jì)算方法是一種獲取最佳泛化能力和最小結(jié)構(gòu)的剪枝算法.在網(wǎng)絡(luò)訓(xùn)練時(shí),計(jì)算節(jié)點(diǎn)(輸入變量和中間節(jié)點(diǎn))對(duì)網(wǎng)絡(luò)誤差的貢獻(xiàn)(靈敏度),刪除那些貢獻(xiàn)最小的節(jié)點(diǎn)和權(quán)值.該方法不僅可以剪除冗余的中間節(jié)點(diǎn),還可以計(jì)算每個(gè)輸入的靈敏度估計(jì)(也能剪除不重要的輸入變量).文獻(xiàn)[22]提出以下測(cè)度:
其中E為網(wǎng)絡(luò)對(duì)訓(xùn)練樣本集的誤差.
式(13)是一種直接的相關(guān)性測(cè)度.但是,當(dāng)刪除某個(gè)輸入/中間節(jié)點(diǎn)時(shí),需對(duì)整個(gè)網(wǎng)絡(luò)重新訓(xùn)練,這要很大的計(jì)算量.因此,應(yīng)設(shè)計(jì)快速計(jì)算ρi的方法.基于此考慮,本部分對(duì)每個(gè)輸入變量或中間節(jié)點(diǎn)都引入一個(gè)系數(shù)αi,αi表示對(duì)第i個(gè)節(jié)點(diǎn)的輸出進(jìn)行懲罰,即節(jié)點(diǎn)的重視程度為
其中:oi表示第i個(gè)中間節(jié)點(diǎn)的輸出,oj表示第j個(gè)輸出節(jié)點(diǎn)的輸出,wji表示第i個(gè)中間節(jié)點(diǎn)到第j個(gè)輸出節(jié)點(diǎn)的連接權(quán)值.
如果αi=0,節(jié)點(diǎn)i對(duì)網(wǎng)絡(luò)的其余部分沒有影響,相當(dāng)于刪除了該中間節(jié)點(diǎn);如果αi=1,節(jié)點(diǎn)i就是一個(gè)傳統(tǒng)的節(jié)點(diǎn).于是式(13)可改寫為
利用誤差目標(biāo)函數(shù)對(duì)αi的導(dǎo)數(shù)信息來逼近ρi:
對(duì)式(16)做工程近似,即當(dāng)γ=0時(shí)依然成立,則
于是便可得ρi的逼近表達(dá)式
步驟1使用一階慣性濾波,即
步驟2使用歸一化靈敏度計(jì)算方法.令當(dāng)前時(shí)刻同一層(輸入層或中間層)內(nèi)各節(jié)點(diǎn)靈敏度的絕對(duì)和為S(k)=,則歸一化靈敏度為
歸一化后,各節(jié)點(diǎn)靈敏度值將介于?1 ~1.
步驟3采用穩(wěn)態(tài)時(shí)的靈敏度值.在一段時(shí)間內(nèi)某節(jié)點(diǎn)歸一化靈敏度的均值和標(biāo)準(zhǔn)差為
注1αi并不是MTN的參數(shù),只是為方便表示而引入.由于計(jì)算ρi時(shí)αi=1,因此αi和ρi的計(jì)算并不會(huì)影響網(wǎng)絡(luò)權(quán)值調(diào)整.
如圖2所示,隨著調(diào)節(jié)MTNI參數(shù)wI使得辨識(shí)模型輸出yI(k)準(zhǔn)確描述對(duì)象輸出ye(k),自適應(yīng)控制的目標(biāo)函數(shù)JC為調(diào)節(jié)MTNC參數(shù)wC以使系統(tǒng)輸出ye(k)實(shí)時(shí)跟蹤期望軌跡yd(k).由此,MTNI向MTNC提供模型更新信息,使其“光滑”自適應(yīng).
為了保證初始狀態(tài)下自適應(yīng)控制系統(tǒng)穩(wěn)定,離線MTNC設(shè)計(jì)(離線逆建模)是在線MTNC重要且必不可少的階段.離線實(shí)驗(yàn)需要大量的訓(xùn)練樣本,以確保自適應(yīng)MTNC能覆蓋整個(gè)工作范圍.
離線MTNC設(shè)計(jì)采用直接逆方法[23],如圖3所示,即利用對(duì)象的輸入輸出數(shù)據(jù)直接建立對(duì)象的逆模型.具體來說,該方法將對(duì)象的輸出作為MTN的輸入,使得MTN的輸出逼近對(duì)象的輸入.它的原理很簡(jiǎn)單,但其訓(xùn)練不是以目標(biāo)為導(dǎo)向的,所以這種結(jié)構(gòu)只能用于離線訓(xùn)練.
注2因離線階段無實(shí)時(shí)性的要求,為了理想的實(shí)時(shí)性能,在訓(xùn)練階段引入靈敏度計(jì)算方法以確保MTNC具有最佳泛化能力和最小網(wǎng)絡(luò)結(jié)構(gòu).
圖2 基于MTN的控制系統(tǒng)結(jié)構(gòu)圖Fig.2 Block diagram of MTN based control system
圖3 離線逆建模結(jié)構(gòu)圖Fig.3 Schema of off-line inverse modeling
權(quán)值可通過最小化以下瞬時(shí)目標(biāo)函數(shù)來訓(xùn)練:
其中m(k)為第k時(shí)刻的建模信號(hào).
在MTNC離線學(xué)習(xí)過程,wC的調(diào)整式為
其中?wC-off=?可通過梯度下降法獲得,利用由式(18)-(21)表示的靈敏度計(jì)算方法來剪除冗余的輸入和權(quán)值.訓(xùn)練結(jié)束后,可得精簡(jiǎn)的MTNC網(wǎng)絡(luò)及初始權(quán)值.
眾所周知,典型的離散PID控制器可表示為
由于式(24)采用全量輸出,所以每次輸出均與過去的狀態(tài)有關(guān),計(jì)算時(shí)要對(duì)e(k)進(jìn)行累加,控制量u(k)對(duì)應(yīng)的是執(zhí)行機(jī)構(gòu)的實(shí)際位置偏差,如果位置傳感器出現(xiàn)故障,u(k)可能會(huì)出現(xiàn)大幅度變化,進(jìn)而引起執(zhí)行結(jié)構(gòu)位置的劇烈變化.為避免這種情況,式(24)可轉(zhuǎn)化成增量式的形式:
由圖1得,MTN可作為前饋控制器.當(dāng)n=3,m=1,且MTNC的輸入為
那么,MTNC的輸出可表示為
對(duì)比式(25)-(26),PID控制器恰為輸入為3、冪次為1的MTN控制器的一種特殊形式.在工業(yè)應(yīng)用中,如果選擇的參數(shù)(kP,kI和kD)是最優(yōu)的,那么就可得到滿意的跟蹤性能.然而,當(dāng)系統(tǒng)具有強(qiáng)非線性、隨機(jī)因素和時(shí)變特性時(shí),選擇這些參數(shù)是困難的.針對(duì)此問題,本文通過在線學(xué)習(xí)MTN控制器來更新其與PID控制器參數(shù)對(duì)應(yīng)的權(quán)值.
自適應(yīng)MTNC的權(quán)值沿給定誤差函數(shù)的負(fù)梯度方向進(jìn)行更新.
通常,M=1且權(quán)值修正與負(fù)梯度成正比,即
利用梯度下降學(xué)習(xí)算法,獲得權(quán)值自適應(yīng)律
由MTNI和MTNC的輸入輸出關(guān)系,可得
可進(jìn)一步推導(dǎo)出以下遞歸形式:
其中:ds表示MTNI和MTNC的第s個(gè)輸入延遲;xi和xt分別表示MTNI的輸入和中間層輸出;UI和YI分別表示MTNI輸入變量u和ye的集合;qi和qt分別表示MTNC的輸入和中間層輸出;UC表示MTNC控制變量u的集合.
此外,針對(duì)被控對(duì)象的時(shí)變特性,需對(duì)在線學(xué)習(xí)算法進(jìn)行深入的研究.當(dāng)采用固定步長的梯度下降法時(shí),可能會(huì)出現(xiàn):收斂速度慢和易陷入局部極小值.因此,本部分通過設(shè)計(jì)線性再勵(lì)的自適應(yīng)變步長算法來改善這些缺陷.線性再勵(lì)的自適應(yīng)變步長算法的基本思想是利用強(qiáng)化學(xué)習(xí)的理論[24],尋求自適應(yīng)變步長算法,實(shí)現(xiàn)步長的自動(dòng)選擇,加快算法的收斂速度,減少迭代次數(shù).該算法的實(shí)現(xiàn)步驟如下:1)如果連續(xù)兩次迭代,使得梯度方向?EC的符號(hào)相反,意味著下降過頭,步長太大,應(yīng)減少步長;2)如果連續(xù)兩次迭代,梯度方向?EC的符號(hào)相同,意味著下降慢了,還沒有到達(dá)極小點(diǎn),應(yīng)增加步長.該算法可表示為
其中ξ為常數(shù),其范圍是0.001~0.003.本質(zhì)上講,該算法是利用并記憶梯度方向?EC的符號(hào)變化信息,方向相反時(shí)對(duì)其罰,方向相同時(shí)對(duì)其獎(jiǎng).
在噪聲相關(guān)信息未知時(shí),自適應(yīng)濾波器可利用有用信號(hào)之間的相關(guān)性以及噪聲信號(hào)之間的不相關(guān)性來達(dá)到噪聲消除的目的,其基本原理如圖4所示.這是因?yàn)樵肼曉诿總€(gè)采樣點(diǎn)都是不相關(guān)的,自適應(yīng)MTN濾波器不能對(duì)白噪聲進(jìn)行估計(jì),所以MTNF的輸出ye是對(duì)有用信號(hào)最好的估計(jì).
圖4 參考噪聲未知的自適應(yīng)噪聲消除Fig.4 Adaptive noise cancellation with unknown reference noise
非線性自適應(yīng)MTNF可表示為
推導(dǎo)LMS算法的標(biāo)準(zhǔn)方法是利用瞬時(shí)平方誤差作為均方誤差(mean square error,MSE)的估計(jì)值.
采用LMS算法使目標(biāo)函數(shù)最小化,即
如果提高LMS算法的收斂速度而不利用輸入信號(hào)相關(guān)矩陣的估計(jì)值,采用可變收斂因子就成為合適的選擇方案.
其中μ(k)的選取必須實(shí)現(xiàn)更快收斂的目標(biāo).
此外,在更新方程中為了控制失調(diào)量,需要引入一個(gè)固定收斂因子μ0,這是因?yàn)樗型茖?dǎo)過程都是基于瞬時(shí)平方誤差而不是MSE得到的.同時(shí),為了避免當(dāng)(k)yv(k)很小時(shí)出現(xiàn)很大的步長,還應(yīng)該增加一個(gè)參數(shù)φ.最后,式(38)可改寫為
式(39)表示的算法稱為改進(jìn)的歸一化LMS算法.
離散Lyapunov函數(shù)可表示為
于是,訓(xùn)練過程中Lyapunov函數(shù)的變化可由下式計(jì)算:
訓(xùn)練的誤差差值為
其中?w表示任意權(quán)值向量的變化.
1)MTNI的穩(wěn)定性分析.
由式(6)和式(12)的更新規(guī)則,可得
其中wI和ηI分別表示MTNI的權(quán)值和對(duì)應(yīng)學(xué)習(xí)率.
定理1令MTNI權(quán)值的學(xué)習(xí)率為ηI,定義
其中αI(k)=且‖·‖為常規(guī)歐幾里得范數(shù).如果ηI的邊界條件由式(44)確定,則由式(3)及更新規(guī)則(6)和(12)所組成的關(guān)于系統(tǒng)(2)的辨識(shí)方案是穩(wěn)定的.
證由式(40)-(42),可得
因?yàn)樵谒袝r(shí)刻k都有V(k)>0,只要滿足式(44),學(xué)習(xí)算法收斂性?V(k)<0可以保證,即ηI(2?ηI0)>0 或>0.這意味著對(duì)于任何ηI0,0<ηI0<1都能保證收斂.進(jìn)而,保證最快收斂的最大學(xué)習(xí)率為ηI0=1,即,這對(duì)應(yīng)于式(44)的上界,這表明任何大于的學(xué)習(xí)率并不能保證更快的收斂速度.
2)MTNC的穩(wěn)定性分析.
根據(jù)式(28)和式(33)的更新規(guī)則,則
定理2令MTNC權(quán)值的學(xué)習(xí)率為ηC,定義
其中αC(k)=且ξmax=maxk‖yu(k)‖.如果ηC的邊界條件由式(49)確定,則由系統(tǒng)(2)、控制律(26)及更新規(guī)則(28)和(33)所構(gòu)成的閉環(huán)控制系統(tǒng)是穩(wěn)定的.
證由式(40)-(42),可得
比較式(46)和式(51)表明,除了需要在MTNC中加入靈敏度yu(k),這兩個(gè)條件是相似的.由式(29)可得
其中ξmax是靈敏度函數(shù)的上限,由式(32)和估計(jì).
由MTNI的情況可見,式(49)可以保證MTNC學(xué)習(xí)算法的收斂性.同時(shí),最優(yōu)學(xué)習(xí)率為
顯見,定理1與定理2描述的穩(wěn)定性為大范圍漸近穩(wěn)定.由式(44)和式(49),選取適當(dāng)?shù)膶W(xué)習(xí)率可獲得訓(xùn)練過程中快速收斂和穩(wěn)定收斂之間的平衡.
3)MTNF的收斂性分析.
除非嚴(yán)格的條件限制濾波器步長μ,否則由式(39)表示的MTN 濾波器更新方程并不能確保穩(wěn)定收斂.
定理3令MTNF權(quán)值的學(xué)習(xí)率為μ.如果μ的邊界條件由式(53)確定,則濾波器收斂可以保證.
證關(guān)于MTNF,對(duì)式(35)進(jìn)行關(guān)于wF(k)求導(dǎo),則可得
將式(54)代入到式(39)中,可得
其中IN是N ×N單位矩陣.則基于NLMS算法的MTNF更新方程可改寫為
根據(jù)文獻(xiàn)[26],可得wopt,F(k)=R?1P,其中
其中Ryvyv=由于可被看作一個(gè)正交映射操作到由yv(k)衍生的線性空間上,因此,矩陣IN?μ·的特征為
從而,均方收斂的必要條件是|1?μ|<1,即0<μ<2.
本節(jié)通過對(duì)由式(60)表示的含噪聲非線性時(shí)變系統(tǒng)的仿真實(shí)驗(yàn),來驗(yàn)證所提方法的有效性.
其中v(k)為均值為0、標(biāo)準(zhǔn)差為0.05的高斯白噪聲.
1)基于MTN的系統(tǒng)辨識(shí).
在實(shí)際工程應(yīng)用中,通常并不知道模型的階次,因此不僅要確定MTN的中間節(jié)點(diǎn)規(guī)模,還要同時(shí)完成非線性系統(tǒng)的定階,即選擇合適的模型輸入,這在模型辨識(shí)領(lǐng)域也是極為重要的問題.
對(duì)于式(61)的非線性系統(tǒng)辨識(shí)問題,假定預(yù)先不知道模型階次,因而選擇u(k?1),y(k?1),u(k?2),y(k?2),u(k?3)和y(k?3)作為模型輸入并且m=3,于是得到初始結(jié)構(gòu)為6-84-1的MTN.顯見,這是一個(gè)龐大的網(wǎng)絡(luò),因此必須精簡(jiǎn)網(wǎng)絡(luò)規(guī)模,以滿足期望的實(shí)時(shí)性要求.
訓(xùn)練和測(cè)試樣本:輸入信號(hào)u(k)取[?1,1]內(nèi)均勻分布的隨機(jī)值;設(shè)定輸出信號(hào)初始值yv(0)=0,按式(60)生成300個(gè)樣本,前200個(gè)樣本用于學(xué)習(xí),后100個(gè)樣本用于測(cè)試.
MTNI學(xué)習(xí)參數(shù)設(shè)置如下:初始權(quán)值為[?0.1,0.1]內(nèi)均勻分布的隨機(jī)值,最大訓(xùn)練次數(shù)為10000,初始學(xué)習(xí)率為0.0005,當(dāng)訓(xùn)練誤差小于4.5時(shí)開始剪枝,L=50,判斷中間節(jié)點(diǎn)和輸入變量的剪枝條件分別為β1=0.02和β2=0.005.說明:由于MTN 為自回歸網(wǎng)絡(luò),其輸入變量比中間節(jié)點(diǎn)敏感的多,故需設(shè)定β1>>β2.
圖5為一次剪枝過程中去除冗余中間節(jié)點(diǎn)的學(xué)習(xí)曲線,圖6為各輸入單元的輸入靈敏度變化曲線.通過式(6)(12)以及式(18)-(21)的充分訓(xùn)練,可獲得結(jié)構(gòu)為4-10-1的精簡(jiǎn)MTN.網(wǎng)絡(luò)的訓(xùn)練誤差為1.5534,測(cè)試誤差2.6013.
由圖5可見,當(dāng)使用靈敏度計(jì)算方法精簡(jiǎn)MTN網(wǎng)絡(luò)(剪除冗余輸入變量和中間節(jié)點(diǎn))時(shí)訓(xùn)練誤差不會(huì)發(fā)生較大波動(dòng).
圖6記錄了學(xué)習(xí)過程中6個(gè)輸入變量的靈敏度變化情況.可見在訓(xùn)練誤差較大或刪除冗余中間節(jié)點(diǎn)時(shí),各輸入變量靈敏度波動(dòng)很大;隨著網(wǎng)絡(luò)權(quán)值和訓(xùn)練誤差逐漸穩(wěn)定,各輸入變量靈敏度也逐漸平緩.剪枝結(jié)束后,只留下4個(gè)輸入變量(u(k?1),y(k?1),u(k?2)和y(k?2)),其中2 個(gè)重要輸入u(k?1)和y(k?1)的靈敏度值變得較大.測(cè)試誤差驗(yàn)證了該方法的有效性.
圖5 剪除中間節(jié)點(diǎn)的學(xué)習(xí)曲線(MSE)Fig.5 Learning curve of removing redundant middle nodes
圖6 各輸入變量的靈敏度變化曲線Fig.6 Sensitivity change curve of each input nodes
2)基于MTN控制系統(tǒng)性能.
在系統(tǒng)辨識(shí)完成后,由式(28)(30)(32)-(33)和式(39),利用自適應(yīng)MTN來實(shí)現(xiàn)含噪聲不確定非線性時(shí)變系統(tǒng)控制.
MTNC參數(shù)設(shè)置如下:輸入層變量數(shù)、中間層節(jié)點(diǎn)數(shù)和輸出層節(jié)點(diǎn)數(shù)分為4,8(通過式(18)-(21)和式(22)-(23)學(xué)習(xí)后確定)和1.初始學(xué)習(xí)因子為0.05.
圖7給出了自適應(yīng)MTN控制跟蹤階躍信號(hào)的跟蹤性能和誤差,并與RBF-PID控制方法[28]進(jìn)行性能比較.圖8比較了兩種控制方法跟蹤正弦信號(hào)的響應(yīng)和誤差.
圖7 兩種控制方法跟蹤階躍信號(hào)響應(yīng)和誤差比較Fig.7 Comparison of step signal tracking by different control methods
圖8 兩種控制方法跟蹤正弦信號(hào)響應(yīng)和誤差比較Fig.8 Comparison of sinusoidal signal tracking by different control methods
顯見,基于MTN的自適應(yīng)控制是快速且穩(wěn)定的,與RBF-PID方法相比對(duì)跟蹤信號(hào)變化有更強(qiáng)的適應(yīng)性,而且在穩(wěn)態(tài)運(yùn)行時(shí)幾乎無靜態(tài)誤差,它可實(shí)現(xiàn)復(fù)雜被控對(duì)象精確控制.
圖9比較了含噪聲的原始反饋信號(hào)和自適應(yīng)MTN濾波器輸出,結(jié)果表明MTNF在基于MTN的自適應(yīng)控制方案中起著重要作用,其中MTNF權(quán)值由NLMS算法訓(xùn)練,μ0=0.005.
圖9 含噪聲的原始反饋信號(hào)和MTN濾波器輸出比較Fig.9 Comparison between original feedback signal with noise and adaptive MTNF output
本文提出了一種自適應(yīng)MTN控制方案,其中3個(gè)MTN分別被用來實(shí)現(xiàn)系統(tǒng)辨識(shí)、自適應(yīng)控制和非線性濾波.MTN模型不僅具有動(dòng)態(tài)映射能力,還比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需更少權(quán)系數(shù),泛化能力更強(qiáng).在控制方案中,MTN濾波器用于消除測(cè)量噪聲等隨機(jī)干擾,MTN辨識(shí)器提供被控對(duì)象動(dòng)態(tài)特性的實(shí)時(shí)信息給MTN控制器使其“光滑”自適應(yīng)控制.結(jié)果表明,基于MTN的綜合控制方案可顯著提高具有噪聲干擾的不確定非線性時(shí)變系統(tǒng)控制性能.