宋玉寶,趙國新,劉昌龍,2,劉 昱
(1.北京石油化工學(xué)院機(jī)械工程學(xué)院,北京102617;2.北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京100029)
神經(jīng)網(wǎng)絡(luò)、滑??刂?、魯棒控制等智能控制算法被應(yīng)用于氣動(dòng)伺服系統(tǒng)的壓力控制。文獻(xiàn)[2]將神經(jīng)網(wǎng)絡(luò)和辨識器結(jié)合應(yīng)用于氣動(dòng)伺服系統(tǒng),有效消除了氣體的壓縮性和摩擦力時(shí)變性帶來的非線性影響。但該神經(jīng)網(wǎng)絡(luò)算法輸入項(xiàng)過多,訓(xùn)練過程長,算法復(fù)雜度較高。文獻(xiàn)[3]將混沌粒子群算法與滑模干擾觀測器結(jié)合,提出一種改進(jìn)的滑??刂破饔糜谟糜跉鈩?dòng)伺服系統(tǒng),仿真表明,該改進(jìn)控制策略對氣動(dòng)伺服系統(tǒng)的時(shí)滯和非線性表現(xiàn)出了較好的抑制能力,氣動(dòng)系統(tǒng)控制性能良好。文獻(xiàn)[4]利用自適應(yīng)學(xué)習(xí)和滑??刂圃O(shè)計(jì)了一種自適應(yīng)魯棒控制器,通過在線參數(shù)估計(jì)減小了模型參數(shù)的不確定性和參數(shù)估計(jì)誤差。針對氣動(dòng)伺服系統(tǒng)非線性特點(diǎn)各智能控制算法進(jìn)行算法融合與改進(jìn),雖然取得了一定的控制效果,但算法實(shí)現(xiàn)過程過于比較復(fù)雜,只針對其控制對象較為有效,而對其他對象適用性差,因此,針對氣動(dòng)伺服控制系統(tǒng),尋找一種算法復(fù)雜度低,實(shí)現(xiàn)過程相對簡單,而控制效果較好的控制算法是研究重點(diǎn)。
大腦情感學(xué)習(xí)模型(Brain Emotion Learning Controller,BELC)在20 世紀(jì)末被提出[5],隨后迅速發(fā)展并應(yīng)用于控制工程,文獻(xiàn)[6]將BELC 用于參數(shù)時(shí)變的步進(jìn)電機(jī)運(yùn)動(dòng)控制,系統(tǒng)表現(xiàn)出較強(qiáng)的干擾抑制能力。文獻(xiàn)[7]將BELC 應(yīng)用于轉(zhuǎn)臺伺服系統(tǒng),對非線性影響因素有較強(qiáng)的抵抗能力。這些研究應(yīng)用表明BELC 在非線性系統(tǒng)控制中的優(yōu)良性能和巨大潛能?;谝陨涎芯楷F(xiàn)狀,提出將BELC 用于氣動(dòng)伺服系統(tǒng)的壓力控制,結(jié)合氣動(dòng)系統(tǒng)非線性和BELC 控制特性,對BELC 進(jìn)行算法改進(jìn),采用模糊控制在線調(diào)整BELC 權(quán)值學(xué)習(xí)率。
氣動(dòng)伺服系統(tǒng)結(jié)構(gòu)原理圖,整個(gè)控制系統(tǒng)分為五部分,分別為氣源、控制閥、傳感器、執(zhí)行元件以及控制器,如圖1 所示。氣源由氣泵,儲(chǔ)氣罐,濾清器,減壓閥組成,控制閥選用三位五通比例流量電磁閥,傳感器為用于檢測氣缸內(nèi)壓力的氣體壓力傳感器,執(zhí)行元件為無摩擦氣缸,控制器由數(shù)據(jù)采集板卡和工控機(jī)組成,數(shù)據(jù)采集板卡用于接收傳感器的電信號并將工控機(jī)信號傳送到比例閥,工控機(jī)則實(shí)現(xiàn)氣動(dòng)系統(tǒng)信號處理、氣動(dòng)系統(tǒng)控制算法編寫等。
圖1 氣動(dòng)伺服系統(tǒng)結(jié)構(gòu)原理圖Fig.1 Structure Principle of Pneumatic Servo System
氣動(dòng)伺服系統(tǒng)的本質(zhì)是氣體的壓力控制。氣缸壓力為系統(tǒng)的控制目標(biāo),建立壓力控制系統(tǒng)二階模型:
式中:k1、k2、kL—待定系數(shù);R—理想氣體常數(shù);k—?dú)怏w比熱比;
u—?dú)怏w流動(dòng)速度;V0、Ac—?dú)飧椎臒o效容積和有效截面積;
物流行業(yè)的發(fā)展在邁向未來的過程中必將逐漸走向智能化,特別是在倉儲(chǔ)管理領(lǐng)域中表現(xiàn)的更為明顯。勞動(dòng)強(qiáng)度大、重復(fù)性較強(qiáng)、危險(xiǎn)大的復(fù)雜勞動(dòng)都可由智能機(jī)器人來出色完成。但是,我國對專門從事物流工作的智能機(jī)器人研究才剛剛起步。本文主要是對智能倉儲(chǔ)機(jī)器人的運(yùn)用現(xiàn)狀進(jìn)行調(diào)查,分析其對提升倉儲(chǔ)物流效率有何作用,列出其優(yōu)缺點(diǎn)并提出改善建議。
T—?dú)怏w溫度;Cf—流量系數(shù);Pu、Pd—?dú)饬魍ǖ狼昂髩毫Γ?/p>
Av—閥口節(jié)流面積;Pc—?dú)飧讐毫?;φ(Pu,Pd)—流量函數(shù)。
定義狀態(tài)變量X=[x1,x2]T=[pc,c]T,令y=Pc,作為系統(tǒng)輸出變量,對輸出壓力進(jìn)行微分得到系統(tǒng)的狀態(tài)方程:
式中:Vc—?dú)飧子行莘e;m0—待定系數(shù);d0—系統(tǒng)干擾和模型不確定系數(shù);d—系統(tǒng)的總不確定量參數(shù),yc及其一階導(dǎo)數(shù)、二階導(dǎo)數(shù)分別表示氣缸活塞的運(yùn)動(dòng)位移、速度和加速度。
BELC 是一個(gè)有監(jiān)督的網(wǎng)絡(luò)算法。該控制器為無模型控制,且具有快速響應(yīng)和干擾抑制的能力。它模仿大腦中負(fù)責(zé)情感處理部分的杏仁核、眶額皮質(zhì)、丘腦和感官輸入。從根本上講,BELC是一種基于感官輸入和情緒線索的行動(dòng)生成機(jī)制。BELC 模型的基本結(jié)構(gòu),如圖2 所示。
圖2 BELC 模型基本結(jié)構(gòu)Fig.2 Basic Structure of BELC Model
BELC 首先通過丘腦接收感官輸入信號,經(jīng)丘腦預(yù)處理后,將輸入信號發(fā)送給杏仁體和感覺皮層。杏仁體和眶額皮質(zhì)則處理從周圍環(huán)境獲得的信號,計(jì)算各自處理結(jié)果值。最后控制器輸出由杏仁體和眶額皮質(zhì)的處理結(jié)果值作差得到。
在模型中,對于每一個(gè)感官輸入信號Si,杏仁體都有一個(gè)用向量表示的節(jié)點(diǎn)輸出值A(chǔ)i與之對應(yīng)。其中,Ath表示杏仁體接收到的來自丘腦的最大刺激信號節(jié)點(diǎn)輸出值。丘腦與杏仁體之間的這條路徑稱為丘腦連接。該刺激信號可以使杏仁體做出最快但不一定是最正確的響應(yīng)。
每一個(gè)杏仁體的節(jié)點(diǎn)輸出值A(chǔ)i都等于預(yù)置可變連接權(quán)重Vi與相應(yīng)輸入信號Si的乘積。而在眶額皮質(zhì)中也有與杏仁體節(jié)點(diǎn)輸出值A(chǔ)i類似的眶額皮質(zhì)節(jié)點(diǎn)輸出值Oi。其節(jié)點(diǎn)輸出值等于其連接權(quán)重Wi與相應(yīng)輸入信號Si的乘積。綜上,兩者的節(jié)點(diǎn)輸出值,如式4 所示。
杏仁體節(jié)點(diǎn)調(diào)節(jié)律,如式5 所示。獎(jiǎng)勵(lì)信號REW 和杏仁體節(jié)點(diǎn)差值決定了杏仁體連接權(quán)重Vi的更新,進(jìn)而促使杏仁體學(xué)習(xí)過程的進(jìn)行。學(xué)習(xí)速率是由常數(shù)α 決定。式中max 表示連接權(quán)重Vi不能減少,該定義表明:一旦杏仁體學(xué)習(xí)到特定賦值,就會(huì)保持下去。
眶額皮質(zhì)節(jié)點(diǎn)調(diào)節(jié)律,如式8 所示??纛~皮質(zhì)的自適應(yīng)權(quán)重Wi與杏仁核的更新規(guī)則類似。只是眶額皮質(zhì)的權(quán)重可以減小或增大,以調(diào)整杏仁體不合適的響應(yīng)。參數(shù)β 為眶額皮質(zhì)的學(xué)習(xí)速率常數(shù)。其中E*表示不含有丘腦連接信號的杏仁體輸出與眶額皮質(zhì)的差值。
最終的模型輸出的結(jié)果值為杏仁體節(jié)點(diǎn)輸出值和眶額皮質(zhì)節(jié)點(diǎn)輸出值的差值,如式8 所示。
由以上分析可知,BELC 通過丘腦連接產(chǎn)生最快的響應(yīng),在杏仁體中根據(jù)獎(jiǎng)勵(lì)信號進(jìn)行學(xué)習(xí)預(yù)測,并保持學(xué)習(xí)結(jié)果。在眶額皮質(zhì)中根據(jù)預(yù)測值和獎(jiǎng)勵(lì)信號的差值對控制器的輸出進(jìn)行抑制,最終使模型做出快速而準(zhǔn)確的響應(yīng)。
圖3 不同學(xué)習(xí)率下的階躍響應(yīng)Fig.3 Step Response Under Different Learning Rates
BELC 的權(quán)值學(xué)習(xí)率包括杏仁體權(quán)值學(xué)習(xí)率α 和眶額皮質(zhì)權(quán)值學(xué)習(xí)率β。前者決定了杏仁體權(quán)值學(xué)習(xí)過程的快慢,進(jìn)而影響到系控制效果。而后者則直接影響眶額皮質(zhì)權(quán)值學(xué)習(xí)過程的快慢,進(jìn)而影響控制器輸出的自身校正。取α 和β 不同數(shù)值進(jìn)行0.1MPa 下的壓力階躍響應(yīng)仿真實(shí)驗(yàn),取值1:α=0.08,β=0.06;取值2:α=0.07,β=0.06;取值3:α=0.06,β=0.05;取值4:α=0.06,β=0.04;取值5:α=0.05,β=0.03;取值6:α=0.04,β=0.02;實(shí)驗(yàn)響應(yīng)結(jié)果,如圖3 所示。
不同權(quán)值學(xué)習(xí)率對應(yīng)不同的階躍響應(yīng)結(jié)果。為提高系統(tǒng)控制性能,采用模糊控制對權(quán)值學(xué)習(xí)率進(jìn)行在線調(diào)整。針對不同權(quán)值學(xué)習(xí)率下的系統(tǒng)響應(yīng)結(jié)果進(jìn)行分析,制定權(quán)值學(xué)習(xí)率和系統(tǒng)壓力誤差e及壓力誤差變化率ec之間的模糊控制關(guān)系,將權(quán)值學(xué)習(xí)率和系統(tǒng)壓力誤差e及壓力誤差變化率ec之間的關(guān)系轉(zhuǎn)化為用自然語言表述的控制策略,再依照該控制策略進(jìn)行權(quán)值學(xué)習(xí)率的調(diào)節(jié),實(shí)現(xiàn)權(quán)值學(xué)習(xí)率的模糊控制。
結(jié)合模糊控制的輸出變量Δα 和Δβ,則權(quán)值學(xué)習(xí)率的在線調(diào)整公式為:
式中:α0、β0—設(shè)定的初始權(quán)值學(xué)習(xí)率,起始時(shí)令α0=0.06,β0=0.04,通過模糊控制獲得在線調(diào)整的α 和β 的數(shù)值用于BELC 的實(shí)際壓力控制。
將BELC 用于氣動(dòng)伺服系統(tǒng)的壓力控制,針對氣動(dòng)伺服系統(tǒng)特點(diǎn),選取基于誤差形式的感官輸入信號(SI)函數(shù)和獎(jiǎng)勵(lì)信號(REW)函數(shù),對兩者設(shè)定如下:
式中:e—壓力誤差;
K1~K5—調(diào)節(jié)系數(shù)。
基于BELC 的氣動(dòng)伺服控制系統(tǒng)圖,如圖4 所示。根據(jù)給定壓力值和實(shí)際壓力反饋值獲得壓力誤差,壓力誤差進(jìn)而傳遞到選取的感官輸入信號函數(shù)和獎(jiǎng)勵(lì)信號函數(shù)中,同時(shí),壓力誤差及其變化率經(jīng)模糊控制后,獲得BELC 相應(yīng)的權(quán)值學(xué)習(xí)率,用于BELC的學(xué)習(xí)過程。經(jīng)BELC 模型處理后得到的比例閥的控制電壓用于氣動(dòng)伺服系統(tǒng)的控制。
圖4 基于BELC 的氣動(dòng)伺服控制系統(tǒng)圖Fig.4 Pneumatic Servo Control System Based on BELC
搭建氣動(dòng)伺服系統(tǒng)實(shí)驗(yàn)平臺,分別采用PID,BELC 以及BELC改進(jìn)算法進(jìn)行壓力控制實(shí)驗(yàn)。
圖5 0.1MPa 下的階躍響應(yīng)Fig.5 Step Response Under 0.1MPa
圖6 0.1MPa 下的階躍響應(yīng)誤差Fig.6 Step Response Error Under 0.1MPa
PID 的穩(wěn)態(tài)時(shí)間約為19.8s,穩(wěn)態(tài)誤差約為1750Pa;BELC 的穩(wěn)態(tài)時(shí)間約為16.2s,穩(wěn)態(tài)誤差約為937Pa;IBELC 的達(dá)穩(wěn)態(tài)時(shí)間約為15.3s,穩(wěn)態(tài)誤差約為411Pa,如圖5、圖6 所示。BELC 較PID 的穩(wěn)態(tài)時(shí)間縮短了18.2%;穩(wěn)態(tài)誤差降低了46.5%;IBELC 較PID 的穩(wěn)態(tài)時(shí)間縮短了22.7%,穩(wěn)態(tài)誤差降低了76.5%;IBELC 較BELC 到達(dá)穩(wěn)態(tài)時(shí)間減少了5.6%,穩(wěn)態(tài)誤差降低了56.1%。在42s 時(shí)給予一瞬態(tài)突變擾動(dòng),PID 產(chǎn)生最大超調(diào)為116.32KPa,再次到達(dá)穩(wěn)態(tài)的時(shí)間為10.1s;BELC 產(chǎn)生最大超調(diào)為106.76KPa,再次到達(dá)穩(wěn)態(tài)的時(shí)間為8.6s,IBELC 產(chǎn)生最大超調(diào)為102.15KPa,再次到達(dá)穩(wěn)態(tài)時(shí)間使用了6.3s,如圖7 所示。BELC較PID 超調(diào)量降低了8.21%,再次達(dá)到穩(wěn)態(tài)的時(shí)間減少了14.85%,IBELC 較PID 超調(diào)量降低了12.18%,再次達(dá)到穩(wěn)態(tài)的時(shí)間減少了37.62%。在跟蹤幅值為0.1MPa,頻率0.04Hz 的正弦跟蹤響應(yīng)中,PID在(35~60)s 的周期內(nèi)幅值衰減了11.81%,相位滯后了1.24s,如圖8 所示。BELC 在(35~60)s 的周期內(nèi)幅值超調(diào)了8.73%,相位滯后了0.83s。IBELC 在(35~60)s 的周期內(nèi)幅值超調(diào)了3.57%,相位滯后了0.52s。
圖7 0.1MPa 下的42s 處階躍擾動(dòng)Fig.7 Step Disturbance at 42s Under 0.1MPa
圖8 幅值0.1MPa,頻率0.04Hz 的正弦響應(yīng)Fig.8 Sinusoidal Response of Amplitude 0.1MPa and Frequency 0.04Hz
將BELC 用于氣動(dòng)伺服系統(tǒng)的非線性壓力控制,采用模糊控制對BELC 權(quán)值學(xué)習(xí)率進(jìn)行在線調(diào)整。實(shí)驗(yàn)結(jié)果表明:BELC 改進(jìn)算法較PID 在響應(yīng)速度和穩(wěn)態(tài)精度上有明顯提高。穩(wěn)態(tài)誤差穩(wěn)定在(400~500)Pa 之間,存在擾動(dòng)時(shí),穩(wěn)態(tài)時(shí)間降低了30%以上,BELC 改進(jìn)算法具有更強(qiáng)的魯棒性。在動(dòng)態(tài)跟蹤中,幅值變化和相位滯后小,跟蹤效果更好。綜上研究表明BELC 改進(jìn)算法的可行性和在氣動(dòng)控制方面的良好適應(yīng)能力。