任鋮銘 姚遠(yuǎn) 鐘曉波 李廣
(1.西南交通大學(xué) 牽引動(dòng)力國家重點(diǎn)實(shí)驗(yàn)室,成都 610031)(2.中車株洲電力機(jī)車有限公司轉(zhuǎn)向架研發(fā)部,株洲 412001)
隨著控制技術(shù)的發(fā)展,主動(dòng)或半主動(dòng)懸掛系統(tǒng)在軌道交通車輛中的應(yīng)用將越來越普遍.現(xiàn)有的車輛主動(dòng)或半主動(dòng)懸掛系統(tǒng)研究大多基于車輛動(dòng)力學(xué)模型仿真計(jì)算以優(yōu)化控制參數(shù),而輪軌車輛作為極其復(fù)雜的系統(tǒng),其輪軌界面、軌道不平順和外部環(huán)境都具有一定的不確定及時(shí)變特性,基于車輛動(dòng)力學(xué)模型的控制參數(shù)優(yōu)化存在一定的局限性.迭代自適應(yīng)控制技術(shù)作為控制理論的重要分支,將其應(yīng)用到車輛系統(tǒng)動(dòng)力學(xué)控制具有一定理論意義和工程應(yīng)用價(jià)值.Arimoto等[1]首次提出一個(gè)在有限區(qū)間上重復(fù)運(yùn)行的系統(tǒng),經(jīng)過有限次迭代后收斂到期望運(yùn)動(dòng)軌跡,迭代學(xué)習(xí)控制利用多次重復(fù)運(yùn)行的信息來產(chǎn)生能夠達(dá)到期望運(yùn)動(dòng)軌跡的控制輸入,從而提高控制精度,由此迭代學(xué)習(xí)控制引起廣泛關(guān)注和研究.時(shí)至今日,控制領(lǐng)域中已有多種迭代學(xué)習(xí)控制算法[2-4],但目前相關(guān)應(yīng)用主要集中于高速列車的速度跟蹤和軌跡跟蹤等列車自動(dòng)駕駛技術(shù),在車輛系統(tǒng)動(dòng)力學(xué)性能控制方面的研究仍然較少.
橫向平穩(wěn)性是高速列車動(dòng)力學(xué)性能評價(jià)中的一項(xiàng)重要指標(biāo).過去的數(shù)十年間,多種先進(jìn)控制策略被用于高速列車動(dòng)力學(xué)性能控制研究中[5,6],但迭代學(xué)習(xí)控制鮮少被用于改善列車橫向動(dòng)力學(xué)性能.現(xiàn)有研究采用開環(huán)式D型、PD型迭代學(xué)習(xí)策略以改善列車曲線通過性能和動(dòng)力學(xué)指標(biāo)[7-8].考慮到列車運(yùn)行時(shí)復(fù)雜的外界條件,設(shè)計(jì)改進(jìn)式的迭代學(xué)習(xí)控制方式,以提高安全性[9].已有相關(guān)研究卻少有關(guān)于迭代參數(shù)的優(yōu)化及時(shí)滯對控制性能的影響.
本文提出一種參數(shù)優(yōu)化的PD型閉環(huán)迭代學(xué)習(xí)控制器,考慮輪軌接觸狀態(tài)演變工況,通過多目標(biāo)優(yōu)化匹配最優(yōu)前沿迭代參數(shù),并結(jié)合控制系統(tǒng)時(shí)滯分析橫向動(dòng)力學(xué)性能指標(biāo),探究了機(jī)車橫向平穩(wěn)性與控制參數(shù)、時(shí)滯變化之間存在的規(guī)律,對迭代控制技術(shù)在鐵道車輛上的應(yīng)用做出嘗試.
為研究機(jī)車橫向動(dòng)力學(xué)性能,建立了簡化的某型機(jī)車橫向動(dòng)力學(xué)模型,如圖1所示,其主要結(jié)構(gòu)參數(shù)見表1.該模型包含1個(gè)車體,2個(gè)構(gòu)架,4個(gè)輪對,4個(gè)橫向彈性懸掛電機(jī),共11個(gè)剛體.車體和構(gòu)架具有橫移、搖頭及側(cè)滾自由度,輪對具有橫移和搖頭自由度,電機(jī)具有橫移自由度.輪對與構(gòu)架之間一系懸掛由橫向、縱向和垂向定位剛度組成,模型同時(shí)考慮到一系轉(zhuǎn)臂定位結(jié)構(gòu).車體與構(gòu)架之間設(shè)有橫向、縱向和垂向二系懸掛剛度和阻尼,主動(dòng)控制作動(dòng)器采用與彈簧并聯(lián)的形式設(shè)置在車體與構(gòu)架間二系懸掛處,同側(cè)前后位置各設(shè)置一個(gè).考慮到減振器串聯(lián)節(jié)點(diǎn)剛度對車輛動(dòng)力學(xué)性能的影響,抗蛇行減振器及二系橫向減振器采用彈簧和阻尼串聯(lián)的Maxwell等效模型.該機(jī)車動(dòng)力學(xué)模型共29自由度.本文針對機(jī)車進(jìn)行基于線性系統(tǒng)隨機(jī)響應(yīng)的頻域平穩(wěn)性[10]分析,輪軌接觸幾何采用等效錐度來表示,輪軌切向力采用線性Kalker線性理論計(jì)算.機(jī)車動(dòng)力學(xué)模型如下:
(1)
式(1)中,x是系統(tǒng)的自由度矢量,M,C,K,Q和B分別為系統(tǒng)的質(zhì)量,阻尼,剛度,激勵(lì)和反饋?zhàn)饔昧仃?,f(t)為激勵(lì)向量,u(t)為控制力輸入.
表1 模型部分參數(shù)Table 1 Partial parameters of model
圖1 機(jī)車橫向動(dòng)力學(xué)模型Fig.1 Lateral dynamic model of locomotive
虛擬激勵(lì)法是我國學(xué)者近年來提出的一種針對復(fù)雜結(jié)構(gòu)系統(tǒng)的隨機(jī)振動(dòng)響應(yīng)分析的新方法.該方法將復(fù)雜結(jié)構(gòu)受到的振動(dòng)分解為平穩(wěn)和非平穩(wěn)隨機(jī)振動(dòng)兩種形式,并將二者以簡諧振動(dòng)和逐步積分分別代替表示,將復(fù)雜的平穩(wěn)及非平穩(wěn)隨機(jī)振動(dòng)響應(yīng)問題簡單化,方法簡便、高效且計(jì)算量小.以線性時(shí)不變系統(tǒng)為例,簡述虛擬激勵(lì)法原理.
(2)
系統(tǒng)虛擬響應(yīng)為:
(3)
(4)
當(dāng)軌道激擾的自功率譜密度為SFF,其對應(yīng)虛擬激勵(lì)為:
(5)
針對軌道交通領(lǐng)域中,列車與鋼軌間有n個(gè)接觸點(diǎn)的狀況,考慮到各點(diǎn)所受的不平順是相同的,區(qū)別僅在于時(shí)間延遲,因此可進(jìn)一步構(gòu)造虛擬激勵(lì)
(6)
將式(6)代入式(1)后,得到虛擬位移響應(yīng):
(7)
根據(jù)式(4)可得虛擬位移響應(yīng)的自功率譜
(8)
近年來,虛擬激勵(lì)法逐漸應(yīng)用于鐵道車輛領(lǐng)域中,但現(xiàn)有研究主要集中于車-線耦合、車-線-橋耦合等系統(tǒng)模型的隨機(jī)振動(dòng)響應(yīng)和動(dòng)態(tài)載荷研究[11],目前車輛系統(tǒng)橫向動(dòng)力學(xué)領(lǐng)域?qū)μ摂M激勵(lì)法的應(yīng)用較少.本文運(yùn)用虛擬激勵(lì)法計(jì)算機(jī)車橫向動(dòng)力學(xué)模型車體部分的虛擬位移響應(yīng)及虛擬加速度響應(yīng),從而得到機(jī)車在不同等效錐度下前后測點(diǎn)的橫向平穩(wěn)性指標(biāo),以此作為高速機(jī)車橫向動(dòng)力學(xué)性能指標(biāo)對迭代學(xué)習(xí)控制及存在時(shí)滯的控制效果做分析和研究.
機(jī)車投入使用后,會(huì)有很長一段時(shí)間在相同線路上往復(fù)運(yùn)營,其間車載檢測設(shè)備會(huì)存儲(chǔ)大量機(jī)車運(yùn)行相關(guān)信息,如機(jī)車橫向位移、速度等周期數(shù)據(jù),且考慮到機(jī)車在運(yùn)營過程中,由于踏面磨耗會(huì)導(dǎo)致輪軌接觸等效錐度逐漸變化,因此可以利用這些準(zhǔn)周期數(shù)據(jù),通過迭代學(xué)習(xí)方法實(shí)現(xiàn)針對不同輪軌接觸等效錐度的自適應(yīng)主動(dòng)控制,其流程如圖2所示.
圖2 自適應(yīng)主動(dòng)控制系統(tǒng)框圖Fig.2 Block diagram of adaptive active control system
通過對機(jī)車重復(fù)運(yùn)營中采集到信息的預(yù)處理,可以將機(jī)車各部分的橫向位移、速度等信息傳至控制決策系統(tǒng),輪軌接觸信息則傳至優(yōu)化后控制參數(shù)庫進(jìn)行匹配,針對運(yùn)營過程中等效錐度變化,選擇最優(yōu)反饋系數(shù),以達(dá)到更好的主動(dòng)控制效果.
機(jī)車模型轉(zhuǎn)化為狀態(tài)空間方程的形式表示為:
(9)
其中狀態(tài)反饋控制器U可表示為如下形式:
U=-K1X
(10)
式中,K1為狀態(tài)控制反饋系數(shù)矩陣,X為系統(tǒng)的狀態(tài)向量.為使控制器達(dá)到穩(wěn)定,將式(10)代入式(9)中,有
(11)
對式(11)中的線性狀態(tài)空間模型,應(yīng)用多目標(biāo)優(yōu)化方法[12]篩選最優(yōu)迭代參數(shù),設(shè)置機(jī)車前后轉(zhuǎn)向架橫向加速度ayt1、ayt2及車體橫向平穩(wěn)性Wy為優(yōu)化目標(biāo),同時(shí)針對迭代參數(shù)C1、C2進(jìn)行優(yōu)化.可將該多目標(biāo)問題表示如下:
min{Wy,ayt1,ayt2}
(12)
考慮到NSGA-Ⅱ算法在解決多目標(biāo)優(yōu)化問題上具有能夠保留種群多樣性,計(jì)算速度快的優(yōu)勢.因此本文選擇帶有精英策略的快速非支配排序遺傳算法優(yōu)化求解.
以低錐度工況為例,圖3為等效錐度λ=0.05時(shí)三種優(yōu)化目標(biāo)的Pareto前沿,縱軸橫軸分別為前、后轉(zhuǎn)向架處橫向加速度ayt1、ayt2,散點(diǎn)顏色代表車體橫向平穩(wěn)性指標(biāo),顏色越淺表示機(jī)車橫向平穩(wěn)性指標(biāo)Wy值越小,表明系統(tǒng)平穩(wěn)性越好.根據(jù)計(jì)算結(jié)果,選取ayt1,ayt2分別小于6.22m/s2及3.36m/s2,Wy小于2.36作為符合機(jī)車動(dòng)力學(xué)性能的條件,對應(yīng)于圖中紅圈部分,根據(jù)該范圍可提取對應(yīng)迭代參數(shù),存儲(chǔ)于控制參數(shù)庫.以此類推參數(shù)庫內(nèi)其他輪軌接觸狀態(tài)時(shí)對應(yīng)的參數(shù)值,進(jìn)而實(shí)現(xiàn)自適應(yīng)控制.
圖3 動(dòng)力學(xué)性能多目標(biāo)優(yōu)化Pareto前沿Fig.3 Pareto frontier for multi-objective optimization of dynamic performance
迭代學(xué)習(xí)控制是通過對往次運(yùn)行信息的處理來修正當(dāng)前次運(yùn)行的控制數(shù)據(jù),進(jìn)而實(shí)現(xiàn)在逐次迭代中實(shí)際輸出向期望數(shù)據(jù)的逼近.
合適的控制律能減少迭代次數(shù)并加快收斂速度,針對線性時(shí)變連續(xù)的機(jī)車系統(tǒng),本文選取PD型閉環(huán)迭代學(xué)習(xí)控制律,分別以車體前后司機(jī)室位置處作為反饋信號(hào)來源,控制律的拉氏變換表達(dá)式如下:
Uk+1(s)=Uk(s)+[C1(s)+sC2(s)]Ek+1(s)
(13)
Ek(s)的收斂條件為:
‖1-p(s)q(s)‖∞<1
其中Uk+1(s)、Uk(s)分別為第k+1次和第k次迭代周期中控制力,Ek+1(s)為第k+1次迭代周期中跟蹤誤差,被視為k+1次迭代中對第k次輸入向量Uk(s)的修正項(xiàng).通過上一節(jié)中多目標(biāo)優(yōu)化算法的選取,C1=1488,C2=864為定常學(xué)習(xí)增益.
PD型迭代學(xué)習(xí)控制的閉環(huán)圖如圖4所示,其中S-Function1模塊表示軌道不平順為德國高干擾下的高速機(jī)車模型.將最優(yōu)反饋參數(shù)庫中匹配的反饋參數(shù)代入PD學(xué)習(xí)控制的S-Function模塊中.控制力向量uk(t)由式(13)計(jì)算,并作為S-Function1模塊的輸入來抑制車體的橫向加速度波動(dòng),其中uk-1(t)是存儲(chǔ)于前一次迭代后的數(shù)據(jù).
圖4 PD型閉環(huán)迭代學(xué)習(xí)控制圖Fig.4 PD type closed-loop iterative learning control diagram
為驗(yàn)證利用虛擬激勵(lì)法處理下高速機(jī)車模型的自適應(yīng)主動(dòng)控制迭代效果,采用頻域平穩(wěn)性指標(biāo)表征其迭代過程中的橫向動(dòng)力學(xué)性能,在MATLAB中建立機(jī)車及控制模型進(jìn)行仿真.軌道不平順選用德國高干擾軌道譜,仿真驗(yàn)證中考慮機(jī)車運(yùn)行速度為200 km/h,采用PD型ILC方法在頻域內(nèi)對高速機(jī)車橫向平穩(wěn)性進(jìn)行了十次迭代,圖5和圖6分別為是否考慮運(yùn)營過程中輪軌接觸等效錐度變化的兩種工況.圖中橫軸分別為迭代次數(shù)和運(yùn)營中等效錐度值變化,縱軸為橫向平穩(wěn)性指標(biāo).
由圖5和圖6可知:在PD型迭代學(xué)習(xí)控制律下不考慮等效錐度變化的機(jī)車橫向平穩(wěn)性指標(biāo)在迭代過程中得到明顯改善并在第6次迭代基本收斂,橫向頻域平穩(wěn)性指標(biāo)由被動(dòng)控制下的2.35降至2.06.考慮等效錐度變化時(shí),圖6中可明顯看出,當(dāng)?shù)刃уF度隨著運(yùn)營里程不斷增加,其橫向平穩(wěn)性也逐漸惡化,但施加迭代學(xué)習(xí)控制可以顯著改善橫向平穩(wěn)性,且自適應(yīng)迭代學(xué)習(xí)策略控制效果要優(yōu)于非自適應(yīng)迭代學(xué)習(xí).通過三種控制策略對比,本文提出的自適應(yīng)控制參數(shù)選取方案較之于被動(dòng)控制和迭代學(xué)習(xí)策略對控制效果的改善具有明顯優(yōu)勢.
本文運(yùn)用一種PD型迭代學(xué)習(xí)控制器,該控制器為具有反饋環(huán)節(jié)的閉環(huán)控制系統(tǒng),因此由執(zhí)行器的檢測和處理所引起的時(shí)滯及延遲是不可避免的.時(shí)間延遲對系統(tǒng)動(dòng)態(tài)性能的影響顯而易見,本節(jié)采用一種變式的連續(xù)時(shí)間近似(CTA)方法分析了時(shí)滯對文中所提出的迭代學(xué)習(xí)控制器的影響.
圖5 低錐度工況橫向平穩(wěn)性指標(biāo)Fig.5 Lateral riding index in low equivalent conicity condition
圖6 三種控制策略下隨輪軌接觸錐度變化的平穩(wěn)性指標(biāo)Fig.6 Riding index varied with wheel-rail contact conicity under three control strategies
通過遵循半離散化的思想,離散劃分時(shí)延τ,將狀態(tài)變量擴(kuò)展為涵蓋所有時(shí)延分量時(shí)刻的形式:
X(t)=[x(t),x(t-τ1),…,x(t-τN)]T
(14)
此時(shí)可以將系統(tǒng)的狀態(tài)空間表達(dá)式在考慮時(shí)滯的情況下可以寫成如下形式:
(15)
I為與A維度相同的單位矩陣.
根據(jù)經(jīng)驗(yàn),時(shí)滯會(huì)惡化系統(tǒng)控制效果.閉環(huán)迭代學(xué)習(xí)控制系統(tǒng)中,機(jī)車的控制輸入與作動(dòng)器產(chǎn)生控制力之間必定存在時(shí)滯,因而無法準(zhǔn)確對運(yùn)行過程中每一時(shí)刻精確施加控制,此時(shí)需要控制延遲時(shí)間在可接受范圍內(nèi).
本節(jié)以機(jī)車模型為研究對象,運(yùn)用連續(xù)時(shí)間近似方法,將200 km/h低錐度工況下的橫向平穩(wěn)性指標(biāo)Wy作為評價(jià)指標(biāo),以時(shí)滯100 ms、300 ms為例,采用自適應(yīng)迭代學(xué)習(xí)控制流程進(jìn)行仿真.仿真結(jié)果對比見圖7,圖中橫軸和縱軸分別為等效錐度變化和橫向平穩(wěn)性指標(biāo).
圖7中,藍(lán)色和紅色曲線分別為時(shí)滯100 ms和300 ms時(shí)自適應(yīng)迭代控制策略下橫向平穩(wěn)性指標(biāo)隨等效錐度的變化;黑色曲線作為對比,為無控制平穩(wěn)性指標(biāo).由圖可知,時(shí)滯300 ms時(shí)迭代學(xué)習(xí)控制無法保證輪軌接觸錐度增加至0.19后的機(jī)車橫向平穩(wěn)性;而時(shí)滯100 ms時(shí)該方法仍能改善橫向平穩(wěn)性指標(biāo)至少3.55%.因此文中提出的迭代學(xué)習(xí)控制方法在一定范圍內(nèi)的時(shí)滯仍能起到對平穩(wěn)性的改善作用.故當(dāng)系統(tǒng)不可避免的產(chǎn)生時(shí)滯時(shí),應(yīng)當(dāng)盡可能減少時(shí)滯到可接受范圍內(nèi),以改善控制性能.
圖7 時(shí)滯對自適應(yīng)迭代學(xué)習(xí)控制效果影響Fig.7 Effect of time delay on adaptive iterative learning control
為探究迭代學(xué)習(xí)控制器下,線性時(shí)滯系統(tǒng)的時(shí)間延遲對系統(tǒng)頻域平穩(wěn)性的影響規(guī)律,采用CTA方法進(jìn)一步分析.在這部分研究中,狀態(tài)向量的延遲部分被擴(kuò)展到10等分,對時(shí)間延遲分布在1 ms至10 s范圍內(nèi)的兩種輪軌接觸等效錐度工況進(jìn)行分析,結(jié)果如圖8、圖9所示.
圖8 低錐度工況橫向平穩(wěn)性受控制時(shí)滯影響Fig.8 Effect of lateral riding index on time delay in low equivalent conicity condition
圖8和圖9分別為低錐度和高錐度工況下平穩(wěn)性指標(biāo)隨時(shí)延增大變化的結(jié)果,橫軸為控制系統(tǒng)時(shí)滯,縱軸為經(jīng)過十次迭代后機(jī)車橫向平穩(wěn)性指標(biāo).兩種工況下的變化規(guī)律基本一致.高錐度工況下,當(dāng)延遲τ小于100 ms,機(jī)車橫向平穩(wěn)性略微改善,Wy由2.49降低至2.47;當(dāng)延遲大于100 ms,Wy突增至3.11,系統(tǒng)橫向平穩(wěn)性迅速惡化.低錐度工況下,Wy在時(shí)延100 ms的時(shí)間內(nèi)由2.03降低至2.01,當(dāng)延遲超過100 ms,Wy突增至3.43.
圖9 高錐度工況橫向平穩(wěn)性受控制時(shí)滯影響Fig.9 Effect of lateral riding index on time delay in high equivalent conicity condition
由此可知,無論高低錐度工況,一定范圍內(nèi)時(shí)滯的增加對系統(tǒng)橫向平穩(wěn)性具有改善作用,但時(shí)滯過大會(huì)導(dǎo)致橫向平穩(wěn)性急劇惡化,因此避免時(shí)滯過大即可保證高速機(jī)車運(yùn)行時(shí)的橫向平穩(wěn)性.
本文主要針對含有時(shí)滯的高速機(jī)車二系橫向主動(dòng)閉環(huán)自適應(yīng)迭代學(xué)習(xí)控制策略問題進(jìn)行分析,主要結(jié)論如下:
(1) 結(jié)合虛擬激勵(lì)法計(jì)算頻域平穩(wěn)性指標(biāo),基于迭代學(xué)習(xí)方法的二系橫向主動(dòng)自適應(yīng)控制能夠明顯改善機(jī)車橫向平穩(wěn)性指標(biāo).在輪軌接觸等效錐度隨運(yùn)營里程變化的工況下,主動(dòng)自適應(yīng)控制策略對橫向平穩(wěn)性指標(biāo)的改善明顯優(yōu)于定參數(shù)的迭代學(xué)習(xí)策略.
(2) 在考慮控制時(shí)滯時(shí),仿真結(jié)果表明:在一定控制時(shí)滯范圍內(nèi),自適應(yīng)迭代學(xué)習(xí)控制方案仍能夠提供較好的控制效果,對于高低錐度工況、時(shí)滯工況均具有良好的適應(yīng)性.
(3) 高低兩種錐度工況下,控制系統(tǒng)時(shí)滯在100 ms以內(nèi),時(shí)滯對控制性能影響較小,當(dāng)時(shí)滯超過100 ms時(shí),控制性能將明顯惡化.