馬永娟 尹燕莉 馬什鵬
(重慶交通大學機電與車輛工程學院)
近年來,有越來越多的學者應(yīng)用模型預(yù)測控制(Model Predictive Control,MPC)來解決混合動力汽車能量管理優(yōu)化問題[1-11]。它的主要原理是可以通過提前預(yù)測獲取未來有限時間內(nèi)的車輛運行信息,然后實施轉(zhuǎn)矩的優(yōu)化分配??刹捎弥笖?shù)預(yù)測[12]、馬爾科夫鏈[13]等方法預(yù)測未來時間內(nèi)的車輛運行狀態(tài),然后優(yōu)化算法[14-17]對預(yù)測信息進行求解。本文以超輕度混合動力汽車為研究對象,提出基于動態(tài)規(guī)劃(DP)求解的隨機模型預(yù)測控制能量管理策略。
本文對一款具有并聯(lián)結(jié)構(gòu)的超輕度混合動力汽車展開研究。其主要部件除了發(fā)動機、電動機及電池外,增加了一個回流式無級自動變速傳動系統(tǒng)實現(xiàn)動力源之間的傳遞。該車具有純發(fā)動機驅(qū)動、純電機驅(qū)動、行車充電及制動能量回收4個工作模式。結(jié)構(gòu)簡圖如圖1所示。
圖1 超輕度混合動力汽車結(jié)構(gòu)簡圖
汽車在行駛的過程中,需要克服滾動阻力、空氣阻力以及加速阻力(本文不考慮坡度阻力)。車輛在任意工況下的整車縱向動力學模型如式(1):
式中:Tq——車輛需求轉(zhuǎn)矩,N·m;
m——整車質(zhì)量,kg;
g——重力加速度,m/s2;
f、Cd、δ——車輛的輪胎滾動阻力系數(shù)、空氣阻力
系數(shù)、旋轉(zhuǎn)質(zhì)量換算系數(shù);
A——迎風面積,m2;
d v/d t——車輛加速度,m/s2;
r——車輪半徑,m。
2.1.1 模型預(yù)測控制原理
模型預(yù)測控制(MPC)是一種先進的控制方法,在工業(yè)控制中得到廣泛應(yīng)用。它主要以不同預(yù)測模型為基礎(chǔ),預(yù)測系統(tǒng)未來輸出,采用滾動優(yōu)化原則,在有限時域內(nèi)反復(fù)在線優(yōu)化得到最優(yōu)的控制量。模型預(yù)測控制的框架結(jié)構(gòu)如圖2所示,可以分為3個部分:預(yù)測模型、滾動優(yōu)化及反饋校正。其基本思想可以概括為:在每一個采樣時刻,利用預(yù)測模型結(jié)合當前測量信息,采用優(yōu)化算法在線滾動求解一個有限時域的優(yōu)化問題,并將所得優(yōu)化解的第1個元素作用于被控系統(tǒng),將實際輸出值反饋給預(yù)測模型修正預(yù)測值,并刷新優(yōu)化問題重新求解[18]。,然后在下一采樣時刻重復(fù)此過程直到有限時域結(jié)束。
圖2 模型預(yù)測控制總體框架圖
2.1.2 動態(tài)規(guī)劃原理
動態(tài)規(guī)劃作為一種全局優(yōu)化算法,本質(zhì)是求解多階段的決策問題。假設(shè)將待求解的問題看作是一個整體,把整體劃分為有限個相互關(guān)聯(lián)又具有獨立性的個體,通過直接求解各個個體之間的決策問題,會得到多個決策序列,能夠使整體的效果達到最優(yōu)的決策序列就是動態(tài)規(guī)劃算法所求出的問題的解。
動態(tài)規(guī)劃的求解過程可概括為:逆向計算、正向?qū)?yōu)。逆向計算就是通過將待求問題分解為n個階段,從最后1個階段n開始,依次向前直至第1個階段,迭代計算每個階段每一狀態(tài)下的最優(yōu)目標函數(shù)值,從而得到與之相對應(yīng)的最優(yōu)控制變量。正向?qū)?yōu)就是基于逆向計算的結(jié)果,給定1個初始值,通過狀態(tài)轉(zhuǎn)移方程插值得到第1階段至最后1個階段的最優(yōu)控制變量序列。動態(tài)規(guī)劃原理如圖3所示。
圖3 動態(tài)規(guī)劃原理圖
利用模型預(yù)測控制對混合動力汽車進行能量管理,就是對未來一段時間內(nèi)的電機轉(zhuǎn)矩和發(fā)動機轉(zhuǎn)矩進行最優(yōu)分配。首先基于馬爾可夫模型預(yù)測出有限時域內(nèi)的加速度信息,然后采用DP算法進行優(yōu)化求解,獲得轉(zhuǎn)矩分配序列。利用反饋機制實現(xiàn)閉環(huán)控制,獲得最優(yōu)的分配結(jié)果。
2.2.1 基于馬爾可夫模型的加速度預(yù)測
預(yù)測模型相當于整個MPC能量管理策略框架中的“基石”,通過預(yù)測模型提前獲知混合動力汽車未來一段時間內(nèi)的運行狀態(tài),如車速、加速度及需求功率等信息,便可以根據(jù)當前時刻車輛的運行狀態(tài)在預(yù)測時域內(nèi)運用優(yōu)化算法控制車輛性能達到該時域內(nèi)的最優(yōu)狀態(tài),從而獲得更高的燃油經(jīng)濟性。
在車輛運行時,加速度的變化具有隨機性,能夠準確描述汽車的實際行駛過程,且未來某一時刻的加速度只取決于當前時刻的加速度,與歷史加速度信息無關(guān),具有馬爾可夫性質(zhì),因此,可建立馬爾可夫加速度預(yù)測模型對加速度進行預(yù)測。
構(gòu)建馬爾可夫加速度預(yù)測模型的關(guān)鍵是計算加速度的轉(zhuǎn)移概率矩陣,轉(zhuǎn)移概率矩陣的每一個元素代表汽車加速度從當前狀態(tài)轉(zhuǎn)移到下一狀態(tài)的概率,如式(2)。選取概率最大的值作為加速度的實際值,從而確定下一時刻的加速度變化。
式中:a(k)、a(k+1)——當前時刻和下一時刻的加速度;
Pi,j——加速度由當前狀態(tài)i轉(zhuǎn)移到下一狀態(tài)j的概率。
可根據(jù)式(3)來計算轉(zhuǎn)移概率矩陣。
式中:Si——加速度由當前狀態(tài)i轉(zhuǎn)移的總次數(shù);
Si,j——在預(yù)測時域p內(nèi),加速度由當前時刻狀態(tài)i轉(zhuǎn)移到下一狀態(tài)j的次數(shù)。
選取ECE_EUDC、UDDS2種工況來提取加速度信息。將加速度(-1.5~1.5 m/s2)按一定間隔離散,采樣步長取1 s,預(yù)測時域為p。根據(jù)以上所建立的馬爾可夫加速度預(yù)測模型,對加速度進行預(yù)測。
圖4表示車速為40 km/h時加速度的轉(zhuǎn)移概率。由圖中可以看出,加速度的轉(zhuǎn)移概率基本呈對角線分布,分布較集中。這是因為在1 s的時間范圍內(nèi),實際駕駛時通常不會改變行駛狀態(tài),所以加速度涵蓋的變化信息較少,相差不大,使得下一時刻加速度與當前時刻加速度分布在相近區(qū)間。
圖4 v=35 km/h時加速度的轉(zhuǎn)移概率
2.2.2 基于DP求解的滾動優(yōu)化過程
根據(jù)馬爾可夫模型預(yù)測獲得的加速度信息,通過式(1)求解獲得預(yù)測時域內(nèi)的需求轉(zhuǎn)矩。將燃油消耗作為優(yōu)化目標,選取電機轉(zhuǎn)矩Tm為控制變量,電池SOC為狀態(tài)變量,采用DP求解有限時域內(nèi)最優(yōu)的轉(zhuǎn)矩分配。
1)目標函數(shù)和約束條件
通過等效因子將電池能量變化等效為燃油消耗,構(gòu)建以整車等效燃油消耗量最小以為目標的回報函數(shù),如式(4)所示:
式中:mfuel(k)——當前k時刻發(fā)動機燃油消耗量,g;
mele(k)——當前k時刻電池等效燃油能量,g。
在優(yōu)化過程中,每一階段的決策之后,會引起狀態(tài)的轉(zhuǎn)移,狀態(tài)轉(zhuǎn)移方程如式(5):
式中:SOC(k)、SOC(k+1)——表示當前k時刻和下一時刻的荷電狀態(tài);
Esoc——當前狀態(tài)下的電動勢;
Rsoc——表示當前狀態(tài)下的內(nèi)阻;
Qbat——電池容量;
Pbat(k)——當前k時刻的電池功率。
同時,為防止轉(zhuǎn)矩、轉(zhuǎn)速等因素對優(yōu)化結(jié)果造成干擾,因此,在預(yù)測時域k~k+p對相關(guān)變量做如下約束:
式中:ne(k)——k時刻的發(fā)動機轉(zhuǎn)速,r/min;
ne_max(k)、ne_min(k)為k時刻發(fā)動機轉(zhuǎn)速的最大、最小值,r/min;
Tm(k)——k時刻的電動機轉(zhuǎn)矩,N·m;
Tm_max(k)、Tm_min(k)——k時刻電機轉(zhuǎn)矩的最大、最小值,N·m;
Te(k)——k時刻的發(fā)動機轉(zhuǎn)矩,N·m;
Te_max(k)、Te_min(k)——k時刻發(fā)動機的最大、最小值,N·m。
2)DP優(yōu)化求解過程
動態(tài)規(guī)劃(DP)作為一種全局最優(yōu)算法,在模型預(yù)測控制當中,對預(yù)測時域內(nèi)的預(yù)測信息進行滾動優(yōu)化求解,可提高計算效率,具體優(yōu)化步驟如下:
(1)根據(jù)馬爾可夫模型預(yù)測獲取的加速度信息,結(jié)合式(1)求出預(yù)測時域內(nèi)的需求轉(zhuǎn)矩[Tm(k)~Tm(k+p)];
(2)在預(yù)測時域k~k+p內(nèi),可將優(yōu)化問題劃分成p+1個子階段[k,k+1,…,k+p],并將狀態(tài)變量SOC在約束范圍內(nèi)進行離散化處理;
(3)根據(jù)上文的目標函數(shù)和約束條件,首先從最后一個階段k+p逆行求解,求出該階段到上一階段k+p-1的最小油耗值,并記錄獲得最低油耗時的控制變量Tm,依次逆向計算直到第k階段,則整個逆向求解過程結(jié)束;
(4)從初始階段開始正向?qū)?yōu),根據(jù)k階段的狀態(tài)變量SOC(k),插值找到SOC(k)所對應(yīng)的最小燃油消耗量fuel(k)和電動機轉(zhuǎn)矩Tm(k),根據(jù)狀態(tài)轉(zhuǎn)移方程(式5)獲得下一時刻的狀態(tài)量SOC(k+1),重復(fù)(3),直到k+p時結(jié)束,就能獲得k~k+p內(nèi)的最優(yōu)電機轉(zhuǎn)矩分配序列[Tm(k),Tm(k+1/k),…,Tm(k+p/k)]。
2.2.3 實施反饋校正
通過DP求解獲得最優(yōu)電機轉(zhuǎn)矩分配序列之后,只將最優(yōu)序列的第1個控制量Tm(k)施加給車輛。在下一個時刻,首先檢測車輛的實際車速和加速度值,并將其反饋給預(yù)測模型,重新預(yù)測系統(tǒng)輸出并實施優(yōu)化求解,重復(fù)執(zhí)行上述過程直到預(yù)測時域結(jié)束,即可獲得預(yù)測時域內(nèi)的最優(yōu)轉(zhuǎn)矩分配。整個控制過程的流程圖如圖5所示。
圖5 基于DP的隨機模型預(yù)測控制流程圖
為驗證所提控制策略的性能,利用Matlab/Simulink仿真平臺,基于ECE_EUDC、UDDS標準循環(huán)工況進行整車仿真分析。選取預(yù)測時域為3 s,采樣時間間隔為1 s;將電池SOC限定0.3~0.8之間,以0.1為間隔進行離散,SOC初始值設(shè)為0.6;將預(yù)測時域內(nèi)的需求轉(zhuǎn)矩以5 N·m的間隔進行離散。仿真結(jié)果如圖6所示。圖6a為仿真工況數(shù)據(jù)圖,圖6b為發(fā)動機轉(zhuǎn)矩隨仿真工況的車速變化軌跡,可以看出,在汽車加速情況下,所需要的車輪處轉(zhuǎn)矩較大,發(fā)動機多呈工作狀態(tài),輸出較大轉(zhuǎn)矩。圖6c、6d為電機轉(zhuǎn)矩及電池SOC變化軌跡,可看出,當電動機轉(zhuǎn)矩為正時,電機作為電動機,使用電能,使電池SOC下降;當電動機轉(zhuǎn)矩為負時,電機作為發(fā)電機,進行發(fā)電,使電池SOC上升。綜合觀察圖6,當車速較低、頻繁啟動時多用電動機驅(qū)動,當車輛速度較高時,多用發(fā)動機,同時給電池充電。這與我們平時熟知的混合動力汽車理想轉(zhuǎn)矩分配結(jié)果相同,說明所提出的控制策略具有一定的可行性。
圖6 仿真結(jié)果圖
本文將MPC控制理論與DP算法有效結(jié)合,實現(xiàn)了超輕度混合動力汽車良好的轉(zhuǎn)矩分配控制?;贓CE_EUDC、UDDS標準循環(huán)工況為樣本數(shù)據(jù)構(gòu)建馬爾科夫模型對加速度進行預(yù)測,對預(yù)測時域內(nèi)的信息采用DP算法進行滾動優(yōu)化求解,然后實施反饋控制獲得最優(yōu)轉(zhuǎn)矩分配。將所提控制策略基于Matlab/Simulink平臺進行仿真分析,仿真結(jié)果表明,發(fā)動機和電動機基本工作在最優(yōu)轉(zhuǎn)矩區(qū)域內(nèi),證明該策略能取得良好的控制效果以及實現(xiàn)超輕度混合動力汽車最優(yōu)的能量管理。