楚彭子,虞 翊,林 輝,袁建軍,姜 西
1.同濟大學 道路與交通工程教育部重點實驗室,上海201804
2.同濟大學 磁浮交通工程技術研究中心,上海201804
3.同濟大學 上海市磁浮與軌道交通協(xié)同創(chuàng)新中心,上海201804
4.中鐵第四勘察設計院集團有限公司,武漢430063
列車的運行控制屬于閉環(huán)控制。作為列車運行自動控制系統(tǒng)(Automatic Train Control,ATC)的關鍵子系統(tǒng),列車自動運行(Automatic Train Operation,ATO)系統(tǒng)不間斷地接收來自列車自動防護(Automatic Train Protection,ATP)系統(tǒng)以及列車自動監(jiān)控(Automatic Train Supervision,ATS)系統(tǒng)的信息,實施列車自動運行。ATO系統(tǒng)是實現(xiàn)列車無人駕駛及全自動運行的關鍵,對于ATO系統(tǒng)速度控制算法的研究逐步豐富。
傳統(tǒng)PID 控制算法用于ATO 系統(tǒng)存在著響應速度慢、適應性差、能耗大等缺點[1-4]。PID 算法對控制參數(shù)的依賴性強,當控制對象出現(xiàn)偏差或者控制過程受到干擾,容易導致振蕩甚至失穩(wěn)。由于智能算法能夠通過增強PID算法自適應能力達到更好的控制效果,此類智能控制技術被廣泛討論。針對列車速度控制,劉浩[2]和Utomo[5]等探討了模糊自適應PID 控制算法的適用性。借助遺傳算法對控制參數(shù)的優(yōu)化,任林杰等[3]分析了模糊PID 控制算法的應用效果?;诹熊囘\行目標曲線的跟蹤測試,孟建軍等[4]討論了模糊預測PID 控制算法的可行性。張馳等[6]將分數(shù)階PID算法用于ATO系統(tǒng)速度控制,顯示出比傳統(tǒng)PID 控制算法更好的控制效果。馬曉娜等[7]研究了一種結合灰色預測和模糊PID的控制算法。Chen 等[8]檢驗了單神經(jīng)元PID 算法在ATO 系統(tǒng)中的應用效果。針對ATO 系統(tǒng)的智能控制,F(xiàn)u[9]設計了一種基于B 樣條神經(jīng)網(wǎng)絡和粒子群(Particle Swarm Optimization,PSO)算法的PSO-B-BP-PID 控制算法。此外,部分研究還關注了其他控制算法和控制策略。陸小紅等[1]基于模型預測控制技術提出了預測型灰色控制的列車運行速度控制算法。冷勇林等[10]結合優(yōu)秀司機駕駛經(jīng)驗,探討了應用數(shù)據(jù)驅動推理控制算法的可行性。胡震等[11]研究了隨機驅動的全局粒子群(Randomnessdriven Global Particle Swarm Optimization,R-dPSO)算法在列車控制策略中的應用。
PID算法的優(yōu)化途徑多樣,采用模糊數(shù)學理論優(yōu)化是一種可靠的途徑[2-3,5,7],但常規(guī)的模糊PID算法依賴專家經(jīng)驗且模糊規(guī)則較多。相比之下,模糊免疫PID(Fuzzy Immune PID,F(xiàn)IPID)算法能夠基于少量模糊規(guī)則達到可觀的控制效果[12-14],且該算法在ATO系統(tǒng)中的應用尚未得到充分討論。同時,采用固定的控制參數(shù)通常難以應對復雜情形[3-4],而FIPID有多個固定的控制參數(shù)。基于此,本文探討了FIPID算法應用于ATO系統(tǒng)速度控制的可行性,并將BP 神經(jīng)網(wǎng)絡算法用于FIPID 算法控制參數(shù)的在線自整定,對比了原始算法與拓展算法的控制效果。
當抗原侵入機體時,淋巴細胞中的輔助細胞TH、抑制細胞Ts以及B 細胞相互協(xié)作,使得免疫反饋系統(tǒng)趨于平衡。基于該機理,令ε(k)代表第k 代抗原數(shù)量,p1代表TH細胞的促進因子,p2代表Ts細胞的抑制因子,f(·)為細胞抑制刺激能力的非線性函數(shù),則TH細胞的輸出TH(k)為p1ε(k),Ts細胞對B 細胞的影響Ts(k)為p2f(S(k)-ΔS(k))ε(k),B 細胞接受的總刺激為S(k)=TH(k)-Ts(k)[14]。進一步將抗原數(shù)量ε(k) 抽象為誤差e(k),將系數(shù)p1視為控制反應速度K ,作為控制穩(wěn)定效果η,S(k)抽象為控制輸入u(k),進一步結合增量式PID 算法和模糊數(shù)學原理,形成了模糊免疫PID 控制算法[12-14]。模糊免疫PID控制器結構如圖1所示,其反饋控制律u(k)為:
其中,f(·)為模糊邏輯函數(shù),ki′ 和kd′ 分別為積分和微分系數(shù)。
圖1 模糊免疫PID控制器結構
對于模糊邏輯函數(shù),將輸入變量模糊化為“正”(P)和“負”(N),輸出變量模糊化為“正”(P)、“零”(Z)和“負”(N),并將隸屬度函數(shù)定義在整個(-∞,+∞)區(qū)間。其中,f(u,Δu)所采用的規(guī)則為:如果u 為正,且Δu 為正,則f(·)為負;如果u 為正,且Δu 為負,則f(·)為零;如果u 為負,且Δu 為正,則f(·)為零;如果u 為負,且Δu 為負,則f(·)為正。此時,對各規(guī)則使用Zadeh的模糊邏輯AND操作,進一步采用mon反模糊化方法即可得到f(·)[12,14]。
模糊免疫PID 控制算法的四個主要控制參數(shù)為反應速度K ,穩(wěn)定效果η,積分和微分系數(shù)ki′ 和kd′ 。其中K 和η 是實施控制的關鍵參數(shù),且ki′和kd′在控制律中與這兩項參數(shù)相互耦合?;陬A實驗發(fā)現(xiàn)同時在線整定這四項參數(shù)的效果并不理想。對此,以免疫參數(shù)促進因子p1和抑制因子p2為著眼點,對這兩項參數(shù)的自適應調整進行研究。
BP 神經(jīng)網(wǎng)絡是一種應用廣泛的人工神經(jīng)網(wǎng)絡,具有任意非線性表達能力,對于處理因果關系復雜的非確定性推理、判斷、識別及分類等問題有著較強的適用性?;诖?,本文借助BP 神經(jīng)網(wǎng)絡實時調整FIPID 中的p1和p2,記為BP-FIPID。
參考文獻[12,15],設置BP 神經(jīng)網(wǎng)絡結構如圖2 所示,即4個輸入、2個輸出和5個隱含層節(jié)點的網(wǎng)絡。同時,引入輸入x=[r,y,e,1]、權重,并令j 取1至4,i 取1 至5,l 取1 至2,令上標(1)、(2)、(3)分別代表網(wǎng)絡的輸入層、隱含層與輸出層,則有網(wǎng)絡輸入為:
隱含層的輸入與輸出為:
隱含層神經(jīng)元的活化函數(shù)?。?/p>
同時,輸出層的輸入與輸出為:
圖2 BP神經(jīng)網(wǎng)絡結構
網(wǎng)絡權重的優(yōu)化是獲取理想控制參數(shù)的前提,取性能指標函數(shù)為:
根據(jù)梯度下降法優(yōu)化網(wǎng)絡的權重,即根據(jù)E(k)對權重系數(shù)的負梯度方向搜索調整。為使搜索快速收斂全局極小,引入學習速率β 和慣性系數(shù)α。
采用BP神經(jīng)網(wǎng)絡拓展FIPID算法時,根據(jù)式(2)和式(5)有:
同理,網(wǎng)絡隱含層權重系數(shù)的學習算法可表示為:
結合圖1 所示的模糊免疫PID 控制器和BP 神經(jīng)網(wǎng)絡可知,BP-FIPID 控制器包括增量式PID 控制器、免疫控制器、模糊控制器、BP 神經(jīng)網(wǎng)絡控制器以及數(shù)據(jù)單元,如圖3 所示。其中K、η 由BP 神經(jīng)網(wǎng)絡在線輸出的p1和p2整定,而ki′ 和kd′ 與原始模糊免疫PID 控制器一樣,并非在線整定。
圖3 BP-FIPID控制器結構
此時,BP-FIPID算法的流程可概述為:
步驟1 初始化。設置初始誤差、輸入、輸出與控制律(均取0)、模糊規(guī)則,以及BP 神經(jīng)網(wǎng)絡的層數(shù)、節(jié)點數(shù)、初始權重、學習速率和慣性系數(shù)等。
步驟2 采樣得到輸入、輸出以及誤差。計算該時刻的輸入輸出偏差,得到誤差數(shù)據(jù)。
步驟3 執(zhí)行神經(jīng)網(wǎng)絡的計算。根據(jù)輸入、輸出、誤差、權重等,計算隱含層的輸入輸出以及輸出層的輸入輸出,得到所需的兩個免疫參數(shù)。
步驟4 計算當前控制律。
步驟5 執(zhí)行神經(jīng)網(wǎng)絡的學習。在線調整神經(jīng)網(wǎng)絡的權重系數(shù)。
步驟6 判斷是否結束。若是任務結束,則停止。否則,更新各個參數(shù),返回步驟2。
為了檢驗所設計算法的可行性,將列車運行控制模型作為控制對象,將階躍信號和列車運行速度-時間曲線分別作為輸入信號,分析與對比傳統(tǒng)FIPID控制算法及BP-FIPID控制算法的輸出效果。列車運行控制模型采用已辨識的具有延遲特性的傳遞函數(shù)模型[3]:
其中,σ 為傳輸延時,牽引工況取1,制動工況取0.8。
在控制性能指標方面,對于階躍信號,分析不同控制算法輸出的上升時間、調節(jié)時間、峰值時間以及超調量。同時,涉及的評價指標還包括一系列誤差性能指標:平方誤差積分性能指標(Integral of Square Error,ISE)、絕對誤差積分性能指標(Integral of Absolute Error,IAE)、時間乘平方誤差積分性能指標(Integral of Time Multiplied by Squared Error,ITSE)以及時間與絕對誤差乘積的積分性能指標(Integral of Time Multiplied by Absolute Error,ITAE)[6,16]。
對于ATO 系統(tǒng)性能指標,現(xiàn)有研究多從運行速度不超過緊急制動防護曲線、運行準點率、停車精準度、運行舒適度、節(jié)能性、牽引及制動切換頻繁度、追溯性等方面進行討論[2,17-19]。
運行速度不超過緊急制動防護曲線的要求與ATO系統(tǒng)控制器關聯(lián)較大。列車運行的目標速度曲線位于緊急制動防護曲線之下,但列車實際運行曲線的波動范圍可能會超出緊急制動防護曲線而觸發(fā)ATP 緊急制動。這種性能決定著目標速度曲線的冗余空間和列車運行效率,對ATO 系統(tǒng)控制器的目標速度曲線跟蹤性能要求較高。實質上是要求列車實際運行速度盡可能貼近目標速度,即良好的追溯性[2,19]。兩者內涵接近,均可由誤差指標進行度量。追溯性反映出的復雜工況適應能力與抗干擾特性,也是列車速度控制算法穩(wěn)定性與智能性的體現(xiàn)。
牽引及制動切換頻繁度、運行準點率與停車精準度由目標速度曲線與ATO系統(tǒng)控制器共同決定。節(jié)能性與運行舒適度也同樣由目標速度曲線與ATO系統(tǒng)共同決定。可由能耗指標Ke[17]和最大沖擊率Kj分別評估。沖擊率代表加速度的變化率,應小于0.75 m/s3[18]。
其中,v 和a 分別為速度和加速度,S~ 代表列車運行距離。
仿真中,使用Win10 系統(tǒng)、Intel i7 處理器和16 GB內存的筆記本電腦,以Matlab 為仿真平臺,以階躍信號為輸入,將式(12)列車運行控制模型作為被控對象,取列車運行控制傳輸延時σ 為1。采樣時間為0.2 s,仿真時間為40 s,即200 個采樣周期,并在第100 個和第110個周期設置干擾(對控制律u(k)加0.1)以觀察不同控制算法的抗干擾能力。在控制參數(shù)設置方面,F(xiàn)IPID中ki′和kd′ 均取0.3,K 取0.3,η 取0.8[12],即p1和p2分別取0.3和0.24。BP-FIPID中ki′和kd′與FIPID取值一致,學習速率β 和慣性系數(shù)α 均取0.001,大小為5×4 的隱含層初始權重和大小為5×2 的輸出層初始權重均于[-0.5,0.5]之間[12,15],取值見表1。
表1 初始權重
FIPID 和BP-FIPID 的階躍響應曲線如圖4 所示??梢?,F(xiàn)IPID和BP-FIPID均能取得較好的響應結果。其中,BP-FIPID 的超調量較大,F(xiàn)IPID 相對更小。在上升時間與峰值時間方面,F(xiàn)IPID 較長,BP-FIPID 則相對更短。兩者的調節(jié)時間較為接近。同時,在抗干擾方面,BP-FIPID能更好更快地應對干擾,而FIPID的抗干擾能力相對較弱。
圖4 過程中的誤差性能指標ISE、IAE、ITSE 以及ITAE如表2所示。FIPID的四項指標均大于BP-FIPID,BP-FIPID 的各項指標均較優(yōu),即該算法在整體上能夠較好地跟蹤階躍信號,抵抗干擾信號。
圖4 階躍信號響應和抗干擾情況
表2 階躍信號跟蹤性能指標
在具有先進ATC系統(tǒng)功能的列車運行控制系統(tǒng)中,ATO系統(tǒng)能夠根據(jù)目標速度曲線不斷地執(zhí)行牽引、惰行與制動等任務[2-4,7]。以目標速度曲線為輸入的仿真測試相對于階躍響應更為復雜,面臨的工況更多,對控制算法的魯棒性要求更高。借鑒文獻[4,7],同樣采用跟蹤測試的方式分析上述兩種控制算法在ATO系統(tǒng)中的應用效果。
在目標曲線跟蹤的仿真過程中,采用與階躍響應測試中相同的控制參數(shù),輸入為具有2 175 個采樣周期的速度-時間曲線(采樣時間為0.2 s)。在1 470~1 560 和1 810及其之后的采樣時段內,列車運行控制傳輸延時σ取0.8,其他時段均統(tǒng)一取1。將FIPID和BP-FIPID分別作為列車運行控制模型的控制算法,從追溯性、舒適性和節(jié)能性三方面進行性能分析。運用同樣的仿真環(huán)境,F(xiàn)IPID 和BP-FIPID 的仿真時間消耗分別為33.571 s 和36.017 s,這與BP-FIPID相比FIPID增設了BP神經(jīng)網(wǎng)絡控制器有關。
(1)追溯性
仿真輸出的速度-時間曲線如圖5所示??梢姡現(xiàn)IPID算法和BP-FIPID算法均能較好地跟蹤目標曲線。根據(jù)圖5 中的子圖,在初始階段和工況切換階段,F(xiàn)IPID 和BP-FIPID 的跟蹤效果較為接近,但BP-FIPID 較FIPID的響應速度更快,且更貼近目標速度曲線。
表3 進一步展示了誤差性能指標,以及最大誤差、最小誤差與相應的采樣周期k??梢姡煌刂扑惴ㄝ敵龅淖畲蟾櫰罴性谄鹗茧A段和臨近終止階段,表現(xiàn)為起始階段的輸出小于輸入,終止階段的輸出大于輸入,這與被控對象本身為延遲系統(tǒng)有關。同時,與FIPID相比,BP-FIPID的誤差性能指標均相對更小。這表明,針對更復雜的輸入信號,BP-FIPID 算法的跟蹤性能在整體上明顯更優(yōu),即追溯性更好。
圖5 目標曲線的跟蹤情況
表3 速度-時間曲線追溯性指標
(2)舒適性與節(jié)能性
圖6 展示了控制算法跟蹤曲線及目標曲線的最大沖擊率和能耗指標。結果顯示,不同曲線的沖擊率均小于0.75 m/s3,滿足軌道交通列車運行的舒適性要求。其中,基于FIPID輸出的最大沖擊率相對更?。?.065 62 m/s3),但該數(shù)值與目標曲線的最大沖擊率(0.091 82 m/s3)偏差較大,而BP-FIPID 的偏差更小。盡管沖擊率越小代表舒適性越好,但與目標曲線的偏差也反映了跟蹤性能的優(yōu)良程度。同時,在能耗方面,目標能耗指標為0.074 73,BP-FIPID 能耗指標為0.077 96,F(xiàn)IPID 能耗指標為0.068 96。即BP-FIPID能耗指標相對較大,但該數(shù)據(jù)與目標值的偏差為0.003 23,而FIPID 能耗數(shù)值與目標值的偏差為0.005 77。需要說明的是,盡管不同控制算法輸出的舒適性與節(jié)能性指標存在差異,但均較為接近。這兩項性能指標與不同算法較好的追溯性和目標曲線自身的平穩(wěn)性有關。
圖6 舒適性和節(jié)能性指標
采用階躍信號和速度-時間曲線對兩種控制算法進行仿真測試,結果顯示FIPID和BP-FIPID均能夠有效地跟蹤目標曲線,BP-FIPID在FIPID的基礎上表現(xiàn)出更好的跟蹤性能,反應速度相對較快,抗干擾性能也相對較好。需要說明的是,BP 神經(jīng)網(wǎng)絡對于初始權重較為敏感[9],但其抗干擾能力和良好的跟蹤性能也是BP-FIPID的優(yōu)點。免疫參數(shù)的自適應變化有助于提高FIPID 的魯棒性。
FIPID 和BP-FIPID 算法均可用于列車ATO 系統(tǒng)的運行測試。FIPID 和BP-FIPID 在追溯性和舒適性等方面均十分理想,且BP-FIPID 的大部分指標顯著優(yōu)于FIPID,尤其在追溯性方面有明顯的改進?;诖?,列車的運行準點率與停車精度有了更大的保障。同時,追溯性的提高也使得列車運行的目標速度曲線與防護曲線之間的冗余需求進一步降低,這有助于提高列車的運行效率。此外,在控制算法方面,BP-FIPID的初始權重與學習算法的優(yōu)化也有待進一步分析。
為了分析傳統(tǒng)模糊免疫PID算法以及基于BP神經(jīng)網(wǎng)絡自適應調整免疫參數(shù)的模糊免疫PID 拓展算法(BP-FIPID)在ATO 系統(tǒng)速度控制中的適用性,結合列車運行控制模型、階躍信號和目標速度曲線進行了仿真測試,對比分析了不同算法的穩(wěn)態(tài)特性、抗干擾特性、追溯性與舒適性等性能?;贐P神經(jīng)網(wǎng)絡自適應調整免疫參數(shù)是優(yōu)化模糊免疫PID 的一種有效方法,能夠為ATO系統(tǒng)速度控制提供參考。