王思君
(云南省煤礦安全技術(shù)培訓(xùn)中心,云南昆明 650205)
磁懸浮以不接觸方式實現(xiàn)對象物體在目標(biāo)位置的懸浮控制。因為沒有機械接觸,所以具有功耗低、污染小的優(yōu)勢。該技術(shù)在交通運輸、航空航天以及工業(yè)生產(chǎn)中有可觀的應(yīng)用前景[1-2]。電磁場的分布特征使得對象系統(tǒng)具有明顯的非線性和建模不確定性[3-4]。因此,懸浮控制策略的適應(yīng)性改進是一個值得長期研究的問題。
從既有結(jié)論可見,PID方案控制結(jié)構(gòu)簡單,易于實現(xiàn),但控制精度不高,對環(huán)境適應(yīng)性差,于是相應(yīng)改進方案成為關(guān)注方向。比如,以神經(jīng)網(wǎng)絡(luò)逼近、模糊控制等智能化方法得到控制律,可減小模型不確定性的影響[5];采用LQ優(yōu)化測算控制參數(shù),可降低控制參數(shù)選擇對調(diào)試經(jīng)驗的依賴程度[6]。將智能優(yōu)化算法與反饋控制相結(jié)合,采用分數(shù)階控制可改進控制精度[7]。系統(tǒng)運行時的干擾因素是無法準(zhǔn)確測量的,這里考慮如何在確保系統(tǒng)穩(wěn)定性和魯棒性的同時,提高系統(tǒng)的控制精度和自適應(yīng)能力。
針對擾動不確定時的控制參數(shù)不容易整定問題,基于神經(jīng)網(wǎng)絡(luò)監(jiān)督,采用前饋加反饋的監(jiān)督控制方法確保系統(tǒng)具有良好的性能,提出基于RBF網(wǎng)絡(luò)監(jiān)督的神經(jīng)網(wǎng)絡(luò)監(jiān)督控制(NNSC)。監(jiān)督網(wǎng)絡(luò)通過權(quán)值學(xué)習(xí)整定成為主控方式,而當(dāng)系統(tǒng)出現(xiàn)干擾時,傳統(tǒng)反饋控制器重新起作用,確保系統(tǒng)的穩(wěn)定性和魯棒性。以固高GML1001試驗裝置參數(shù)為基礎(chǔ)數(shù)據(jù),通過Matlab仿真驗證并分析了所得方案的性能。
單自由度磁懸浮試驗裝置的基本原理如圖1所示。通過電磁線圈輸入電流的調(diào)節(jié)來控制磁場引力F(i,x),當(dāng)懸浮小球受到向上的電磁引力與其所受重力達到平衡時,小球便能懸浮在目標(biāo)位置。從系統(tǒng)輸入(輸入電流i)到系統(tǒng)輸出(懸浮距離x)之間的數(shù)學(xué)關(guān)系可以通過小球的力學(xué)分析和線圈的電磁分析得到。
圖1 懸浮裝置原理分析
在圖1所示系統(tǒng)中,忽略小球受到的不確定干擾力,則被控對象小球在此系統(tǒng)中只受電磁引力和自身重力的影響,其在豎直方向的動力學(xué)方程為:
式中:x為小球質(zhì)心與電磁鐵磁極之間的氣隙(以磁極面為零點);m為小球的質(zhì)量;g為重力加速度,g=9.8 m/s2。
假設(shè)電磁鐵未工作在磁飽和狀態(tài)下,且每匝線圈中通過的磁通量都是相同的,則瞬時繞組線圈電感為:
式中:μ0為空氣磁導(dǎo)率,μ0=4π×10-7;S為電磁鐵橫截面積;N為線圈繞組匝數(shù)。
那么,磁場的能量為:
定義K=μ0SN2/2,則小球受到的電磁引力為:
可知,電磁引力與氣隙是非線性的反比關(guān)系,這也是磁懸浮系統(tǒng)不穩(wěn)定的根源所在。
當(dāng)小球處于平衡狀態(tài)(i0,x0)時,它所受合力為零,即:
在平衡位置對式(4)進行線性化處理,略去高階項后,可得電磁鐵繞組中的瞬時電流i、氣隙x之間的關(guān)系模型為:
下面設(shè)計控制方案,實現(xiàn)調(diào)節(jié)控制電流使小球穩(wěn)定懸浮在平衡位置的目的。
以式(6)為受控系統(tǒng)的基礎(chǔ)模型,進行磁懸浮控制律的設(shè)計。
利用系統(tǒng)線性化模型,可以通過時域設(shè)計方式得到PD控制律[8]。記串聯(lián)PD控制器的傳遞函數(shù)為:
通過穩(wěn)定性判據(jù),可知保持磁懸浮系統(tǒng)穩(wěn)定須有:Kp<-0.113 3,Kd<0。
再考慮系統(tǒng)過渡過程性能,即超調(diào)量和調(diào)節(jié)時間要求,以欠阻尼閉環(huán)穩(wěn)定為設(shè)計目標(biāo),通過模型匹配方法,可得到控制參數(shù):Kp=-20,Kd=-0.072 8。
磁懸浮系統(tǒng)網(wǎng)絡(luò)監(jiān)督控制結(jié)構(gòu)如圖2所示。圖中所示的控制環(huán)節(jié)由兩部分組成:傳統(tǒng)PD控制和基于RBF網(wǎng)絡(luò)的監(jiān)督控制。系統(tǒng)啟動初始以PD控制實現(xiàn)閉環(huán)運行。同時,前饋RBF神經(jīng)網(wǎng)絡(luò)控制器以PD控制器的輸出信息進行網(wǎng)絡(luò)權(quán)值的學(xué)習(xí),通過迭代調(diào)整逐步減弱反饋控制輸入,實現(xiàn)RBF網(wǎng)絡(luò)控制器從訓(xùn)練到主控的轉(zhuǎn)變。事實上,此處RBF網(wǎng)絡(luò)的本質(zhì)是模擬了被控對象的逆模型[9]。但是,當(dāng)外部干擾信號d顯著變化時,反饋控制器會再次起主導(dǎo)作用。
圖3為前饋RBF網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)。由于圖2所示結(jié)構(gòu)中的網(wǎng)絡(luò)輸入是一維的,所以,在圖3中僅有一個輸入。RBF網(wǎng)絡(luò)只需要調(diào)節(jié)網(wǎng)絡(luò)權(quán)向量W=[w1,…,wm]T,因而具有算法簡單、運行快的優(yōu)點。
圖3 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)輸入為系統(tǒng)輸入r(k),網(wǎng)絡(luò)的徑向基向量為H=[h1,…,hm]T,其中hj為高斯基函數(shù),即:
式中:Cj為網(wǎng)絡(luò)第j個節(jié)點的中心向量,Cj=[c11,…,c1m]T;bj為節(jié)點j的基寬參數(shù),bj>0,j=1,…,m;并記B=[b1,…,bm]T為高斯函數(shù)的基寬參數(shù)。
則RBF網(wǎng)絡(luò)的輸出為:
式中:m為RBF網(wǎng)絡(luò)隱層神經(jīng)元的個數(shù)。
此時,所得控制律為:
式中:upd(k)和un(k)分別為PD控制器和RBF網(wǎng)絡(luò)控制的輸出分量(圖2)。
根據(jù)神經(jīng)網(wǎng)絡(luò)監(jiān)督控制原理,要想使得神經(jīng)網(wǎng)絡(luò)控制器占主導(dǎo)地位,設(shè)網(wǎng)絡(luò)調(diào)整的性能指標(biāo)為:
為實現(xiàn)神經(jīng)網(wǎng)絡(luò)權(quán)值的優(yōu)化,進一步嘗試采用搜索效率高、容易得到全局最優(yōu)解的布谷鳥算法完成式(9)中網(wǎng)絡(luò)權(quán)值的調(diào)整。
選擇目標(biāo)函數(shù)為:
記網(wǎng)絡(luò)權(quán)值W=[w1,…,wm]T為巢穴位置,以式(12)為適應(yīng)值,布谷鳥算法以迭代方式搜索最優(yōu)巢穴,即為最優(yōu)解。下面對最優(yōu)解(巢穴)的搜索算法進行說明。
Step1,初始化。對巢穴位置初始化并作為最優(yōu)位置向量,記g0=[W1(0),W2(0),…,Wn(0)]T。
Step2,位置更新。保留上一代最優(yōu)巢穴位置分量Wb(k-1),進行全局隨機探索游走,其搜索公式為:
這里,α為網(wǎng)絡(luò)權(quán)值學(xué)習(xí)率,隨機萊維飛行服從的分布為Levy~u=t-1-β,(0<β≤2)。
得到新巢穴的位置后,對其測試,并與上一代的巢穴gk-1=[W1(k-1),W2(k-1),…,Wn(k-1)]T進行對比,用適應(yīng)值較好的巢穴位置替換較差的巢穴位置,從而得到較優(yōu)的新的巢穴位置gk=[W1(k),W2(k),…,Wn(k)]T。
Step3,新解評估。用隨機數(shù)r表示宿主鳥發(fā)現(xiàn)外來者的概率,并與預(yù)設(shè)概率pa比較,若r>pa,則隨機重置Wp(k+1),反之保持,最后保留測試值較好的一組巢穴位置Wp(k+1)。測試這組巢穴,用較好的巢穴位置替代較差的巢穴位置,得到一組新的巢穴位置:gk=[W1(k),W2(k),…,Wn(k)]T。
Step4,迭代優(yōu)化。找出最后得到的gk中最優(yōu)的一個巢穴位置Wb(k)和最優(yōu)值fmin。若達到預(yù)定的迭代次數(shù)或精度要求,則輸出全局最優(yōu)值fmin和對應(yīng)的全局最優(yōu)位置Wb(k)。反之,返回Step2繼續(xù)迭代更新。
在Matlab/Simulink軟件環(huán)境下對所得系統(tǒng)的性能進行仿真分析,檢驗所得懸浮控制系統(tǒng)的有效性。系統(tǒng)分析重點為兩個目標(biāo):
1)懸浮小球?qū)崿F(xiàn)對目標(biāo)位置的穩(wěn)定快速跟蹤;
2)在干擾存在時,系統(tǒng)具有一定的魯棒性和自適應(yīng)能力。
并通過比較分析反饋PD控制和網(wǎng)絡(luò)監(jiān)督控制的作用。
以固高GML1001磁懸浮試驗裝置參數(shù)構(gòu)建對象仿真模型,其主要參數(shù)由表1給出。
表1 懸浮系統(tǒng)主要參數(shù)列表
結(jié)合第1部分的模型分析,可得被控對象為:
取采樣時間為1 ms,采用z變換進行離散化,經(jīng)過變換后的離散化對象為:
設(shè)定目標(biāo)信號為在平衡點上下浮動5 mm的位置,指令信號為幅值為0.005的方波信號。網(wǎng)絡(luò)隱層神經(jīng)元個數(shù)取為4,網(wǎng)絡(luò)結(jié)構(gòu)為1-4-1,網(wǎng)絡(luò)的初始權(quán)值取0~1的隨機值,高斯函數(shù)的參數(shù)值取Cj=[-2 -1 1 2]T,B=[0.5 0.5 0.5 0.5]T。采用控制律(10)和權(quán)值調(diào)整算法(13),網(wǎng)絡(luò)權(quán)值學(xué)習(xí)率為α=0.05,預(yù)設(shè)概率pa=0.25。對所得系統(tǒng)進行仿真分析。權(quán)值搜索迭代設(shè)定為300,布谷鳥算法的迭代過程如圖4所示。
圖4 布谷鳥算法迭代過程
對目標(biāo)方波信號進行跟蹤,模擬隨機干擾信號的影響,在控制分量中加入相當(dāng)于控制信號強度10%的隨機干擾,圖5給出了系統(tǒng)的仿真輸出。從圖中可見,實線表示的小球懸浮位置準(zhǔn)確跟蹤了虛線表示的目標(biāo)信號。在0.4 s對懸浮小球施加脈沖干擾(觸碰),控制律能夠很快消除不確定干擾所造成的影響。
圖5 隨機干擾性的位置跟蹤
圖6 給出的是系統(tǒng)運行0.5 s時間內(nèi)的控制律,同時給出反饋控制分量和前饋網(wǎng)絡(luò)控制分量。從圖中可以看出,當(dāng)系統(tǒng)穩(wěn)定運行時,前饋網(wǎng)絡(luò)控制分量起主要作用,而當(dāng)目標(biāo)信號發(fā)生變化或者出現(xiàn)干擾時,反饋控制分量重新恢復(fù)作用,以此保證系統(tǒng)的穩(wěn)定性及自適應(yīng)能力。這正是網(wǎng)絡(luò)監(jiān)督控制的優(yōu)勢。
圖6 隨機干擾下的控制律
進一步分析神經(jīng)網(wǎng)絡(luò)監(jiān)督控制(NNSC)相對于PD反饋控制的優(yōu)勢。僅在0.1—0.2 s施加上述干擾,并在0.4 s模擬外部觸碰脈沖。分別獨立采用兩種控制方案進行仿真,所得控制結(jié)果如圖7所示。
從圖中可見,僅用反饋控制時,系統(tǒng)對干擾信號仍具有較好的魯棒性,能夠克服其影響而保持穩(wěn)定運行;但系統(tǒng)目標(biāo)跟蹤準(zhǔn)確性受到影響,存在穩(wěn)態(tài)誤差。實線表示的網(wǎng)絡(luò)監(jiān)督控制方案NNSC則不存在穩(wěn)態(tài)誤差,僅僅在干擾影響下產(chǎn)生小幅波動。
表2比較了圖7中兩個輸出信號的典型性能指標(biāo),可見增加了前饋監(jiān)督的NNSC控制方案在過渡過程穩(wěn)定性和跟蹤精度方面都優(yōu)于PD反饋控制。
表2 控制性能比較列表
圖8對控制律分量進行了比較分析,PD控制量在0.25 s跟蹤信號變化時短暫切換為主要控制信號。需要說明的是,PD控制量相對于網(wǎng)絡(luò)控制量具有更好的快速性,其原因在于RBF網(wǎng)絡(luò)權(quán)值的調(diào)整是基于反饋控制進行的。也就是說,NNSC控制的網(wǎng)絡(luò)監(jiān)督作用需要通過對系統(tǒng)前饋控制器的學(xué)習(xí)才能逐步成為主導(dǎo),是網(wǎng)絡(luò)的自學(xué)習(xí)過程。
圖8 圖7對應(yīng)的控制律
磁懸浮技術(shù)在一些領(lǐng)域已經(jīng)具有了一定試驗性應(yīng)用基礎(chǔ)。目前,以提高系統(tǒng)控制精度、改良其容錯性為目標(biāo)的控制方案的研究成為值得長期關(guān)注的問題。結(jié)合試驗數(shù)據(jù),總結(jié)如下:
1)針對不確定干擾影響下的磁懸浮位置控制問題,提出基于前饋網(wǎng)絡(luò)監(jiān)督的NNSC控制方案,仿真結(jié)果驗證了所得方案的有效性。以22 g小球為控制對象,0.04 s內(nèi)實現(xiàn)了5 mm的位移控制,且對不確定干擾具有一定魯棒性。
2)監(jiān)督網(wǎng)需要對原有反饋控制器進行學(xué)習(xí),以完成其網(wǎng)絡(luò)權(quán)值的調(diào)整,這使得網(wǎng)絡(luò)監(jiān)督控制完全起主導(dǎo)作用需要一個過渡過程。
3)在擬合復(fù)雜非線性控制信號的問題中,神經(jīng)網(wǎng)絡(luò)的大規(guī)模并行計算、冗余性、自學(xué)習(xí)以及自適應(yīng)能力可為控制理論帶來生機。