程方曉, 李騰飛, 王 旭
(長春工業(yè)大學(xué) 電氣與電子工程學(xué)院, 吉林 長春 130012)
?
電動汽車電池建模及放電管理研究
程方曉,李騰飛,王旭
(長春工業(yè)大學(xué) 電氣與電子工程學(xué)院, 吉林 長春130012)
摘要:基于電池的額定容量效應(yīng)和恢復(fù)效應(yīng)的特性,采用脈沖放電策略建立電池組隨機模型,馬爾可夫決策過程理論和線性規(guī)劃理論對電池組的放電能量均衡問題進行仿真控制。
關(guān)鍵詞:電池模型; 脈沖放電; 馬爾可夫決策; 線性規(guī)劃
0引言
電池的額定容量效應(yīng)和恢復(fù)效應(yīng)影響電池實際釋放的容量,對于采用由單體蓄電池串聯(lián)的方式承擔(dān)著車輛的全部功率負荷的純電動汽車電池組而言,電池組達到放電電壓極限值后停止放電靜置一段時間,電池電量會有一定的恢復(fù)[1]。雖然單體電池的性能好,但若串聯(lián)成一組使用,由于各個電池的特性不一致,會導(dǎo)致電池組性能急劇衰退或部分電池的加速損壞。在保證電池組正常功率負荷,使電池能量得到恢復(fù),利用得到最大化的思想下,文中基于隨機電池模型,采用馬爾可夫決策過程理論和線性規(guī)劃理論對電池組的能量均衡問題進行研究,解決續(xù)駛里程和電池壽命問題[2]。
1單體電池放電過程模擬分析
構(gòu)建一個以電荷單元(q=i·t)為參考變量的電池模型,其用來描述電池的容量。也就是理論容量C;在進行恒流放電的情況下,電池不間斷放電時,實際放出電量的大小為名義容量N。電池采用脈沖放電,其過程中會存在停止放電的間隙,在這短暫的時間內(nèi)會恢復(fù)部分電量,這樣,電池實際提供的容量Q介于理論容量C與名義容量N之間[3]。然后通過Q與N之間的關(guān)系設(shè)計不同放電策略。
文中采用可用離散時間的Markov過程對電池模型進行論述,電池中存在的電量可以用連續(xù)的數(shù)值代替,其中,Xn(n=0,1,2,…)代表離散的時間段0≤Xn≤N,如圖1所示。
圖1 單脈沖隨機電池模型
比如當(dāng)Xn=i時,其表示某時間段n可以使用的電池容量為i。為了使研究簡單化,該電池模型是假設(shè)電池在狀態(tài)0≤Xn≤N時進行放電,此過程放掉一個電荷單元的電量的概率為固定常數(shù)q,恢復(fù)一個電荷單元的電量的概率為固定常數(shù)p,q和p為狀態(tài)轉(zhuǎn)移概率。由此可以將其轉(zhuǎn)變?yōu)辇R次Markov過程,根據(jù)狀態(tài)轉(zhuǎn)移概率的性質(zhì)可以得出結(jié)論:p+q=1。當(dāng)Xn=0時,電池的電性能便受到極大影響,其放電能力被大大削弱,將以100%的概率始終處于0電量狀態(tài),因此Xn=0處于恢復(fù)電量的狀態(tài)。
2放電過程的模擬
2.1放電概率的確定
在實現(xiàn)仿真模擬時,需要通過一定的方式實現(xiàn)控制概率q放電,控制概率p以實現(xiàn)電荷的回歸。如果通過任意變量X代表一種放電或充電電荷的狀態(tài),那么在X=0的時候意味著電荷處于充滿狀態(tài),在X=1的時候代表電荷處于放電狀態(tài)。那么現(xiàn)在面臨的問題就變成了通過何種方法實現(xiàn)在任意變量X等于0時,概率等于p,在任意變量X等于1時,概率等于q。在仿真的實驗環(huán)境下,可以通過平均分布任意數(shù)產(chǎn)生裝置rand來完成參數(shù)的選取,平均分布任意數(shù)產(chǎn)生裝置可以確定在區(qū)間范圍內(nèi)的平均分布隨機參數(shù),定義為u。在使用平均分布任意數(shù)產(chǎn)生裝置rand后,如果選取的隨機量u≤q,那么就可以認(rèn)定電池處于放電狀態(tài),即X=1,此時電池減少了一個單元的電量;如果選取的隨機量u>q,那么可以認(rèn)定電池處于充電狀態(tài),即X=0,此時電池增加一個單元的電量。我們對電量增減的科學(xué)性做如下說明:
因為在[0,1]的區(qū)間范圍內(nèi)隨機參數(shù)產(chǎn)生器rand確定的任意參數(shù)為u,因此任意參數(shù)u的概率范圍內(nèi)的密度概率等于1,可以得到:
(1)
(2)
式(1)、式(2)代表假如產(chǎn)生器rand產(chǎn)生的隨機參數(shù)u≤q,那么就可以認(rèn)定開關(guān)是關(guān)閉的;假如產(chǎn)生器rand產(chǎn)生的隨機參數(shù)u>q,那么就可以認(rèn)定開關(guān)是打開的。
表1 隨機參數(shù)≤0.4的概率分布
表2 隨機參數(shù)≤0.8的概率分布
在MATLAB仿真模擬系統(tǒng)下,表1和表2中的實驗數(shù)據(jù)是通過任意參數(shù)產(chǎn)生器rand分別選用150、250、350、450和550個任意參數(shù)時,通過以0.1為初始值及公差為0.1時選取的隨機數(shù)進行統(tǒng)計分析。從圖中可以看出,由于rand生成隨機數(shù)的概率分布與應(yīng)用要求相差不大,故任意選取對小于或等于0.4和0.8的隨機數(shù)進行統(tǒng)計得到的隨機數(shù)概率分布情況,可用于表示電池放電概率和充電電量概率。
2.2電量的仿真
電池在名義容量N取值為100、理論容量C取值為140的理想狀態(tài)下,在各種不同的放電概率情況下電池可以使用的容量隨著時間變化的仿真數(shù)據(jù)如圖2所示。
(a) 放電概率0.8
(b) 放電概率0.6
(c) 放電概率0.4
(d) 放電概率0.2
因為每次試驗的情況不一致,這就導(dǎo)致了每次仿真的數(shù)據(jù)不會完全一致,可是仿真數(shù)據(jù)曲線的趨勢是一樣的。經(jīng)過分析可知,圖2(a)中的放電電荷概率等于0.8,那么這次的仿真數(shù)據(jù)結(jié)果從開始到狀態(tài)變?yōu)槲諔B(tài)時N=0結(jié)束,電池放電次數(shù)總計達到106次,達到充電滿電回歸狀態(tài)有6次,最后留下的電量單元達到45個。圖2(b)中的放電電荷概率等于0.6,那么這次的仿真數(shù)據(jù)結(jié)果從開始到狀態(tài)變?yōu)槲諔B(tài)時N=0結(jié)束,電池放電次數(shù)總計達到127次,達到充電滿電回歸狀態(tài)有27次,最后留下的電量單元達到15個。圖2(c)中的放電電荷概率等于0.4,那么這次的仿真電池放電次數(shù)總計達到52次,達到充電滿電回歸狀態(tài)有41次。圖2(d)中的放電電荷概率等于0.2,那么這次的仿真電池放電次數(shù)總計達到16次,達到充電滿電回歸狀態(tài)有40次。從圖2中可以得到如下結(jié)論,即電荷放電的概率越大,那么相應(yīng)的仿真曲線下降的趨勢越大。而且在電池放電概率不斷降低的過程中,電荷仿真模擬曲線的趨勢是從開始的直線變?yōu)榍劬€,最后再走到平直的一個變化過程。從上面的實驗數(shù)據(jù)足可以證明:電池電荷的回歸統(tǒng)計數(shù)會隨著電池電量放電概率的升高而降低,仿真模擬的電池殘余的電量單元反而會隨著電池放電概率的升高而升高。
為了驗證之前仿真實驗數(shù)據(jù)的科學(xué)性,通過變化參數(shù)N和C,對變化參數(shù)后的系統(tǒng)再次進行了多次仿真。電池在名義容量N取值為400、理論容量C取值為500的理想狀態(tài)下,在各種不同的放電概率情況下,電池可以使用的容量隨著時間變化的仿真數(shù)據(jù)如圖3所示。
通過圖2與圖3中的(a)、(b)、(c)、(d)比較可以看出:電荷放電概率的不斷升高,各個對應(yīng)的參數(shù)仿真曲線走向趨勢仍然是一致的。圖2(b)結(jié)束仿真模擬的原因是由于電荷已經(jīng)處于吸收狀態(tài)而引起的,圖3(b)結(jié)束仿真模擬的原因是由于電池電荷統(tǒng)計的回歸電荷數(shù)據(jù)已經(jīng)升到了最高值而引起的仿真結(jié)束。由此可以得出結(jié)論,在某種程度上印證了電池電荷脈沖放電時電池回歸滿電能力越強,那么一定程度的放電概率能夠提高電池的滿電回歸能力。
3電池放電過程研究
3.1電池模型建立
根據(jù)單體電池模型的相關(guān)性質(zhì),文中設(shè)計了相關(guān)電池模型,即在原有的電池串聯(lián)基礎(chǔ)上,對每個單體電池上并聯(lián)一個單體電池。兩個電池間用雙向控制開關(guān)連接,工作時,每對電池任選一塊與其他兩對中的任意一塊組合工作。并且雙向控制開關(guān)由開關(guān)控制器進行控制導(dǎo)通或斷開。具體模型如圖4所示。
圖4 電池模型
3.2基于馬爾可夫決策過程求解模型
3.2.1馬爾可夫決策過程簡介
馬爾可夫決策過程(MDP)是研究一類隨機序貫決策問題的理論。離散時間馬爾可夫決策過程模型[4]由如下的五重組組成:
(3)
其中各項的含義為:S是系統(tǒng)所有可能的狀態(tài)所組成的非空的狀態(tài)集,有時也稱之為系統(tǒng)的狀態(tài)空間,它可以是有限的、可列的集或任意非空集。A(i)是在狀態(tài)時可用的決策集,通常由多個決策a組成。p(j|i,a)是在某個決策時刻上采用決策a后,模型由狀態(tài)i轉(zhuǎn)移到狀態(tài)j的概率。r(i,a)是模型在狀態(tài)i采用決策a后所獲得的報酬。S為準(zhǔn)則函數(shù)(也稱為目標(biāo)函數(shù)),是獲得最佳策略的依據(jù)。
由以上定義可以看出,MDP的歷史由相繼的狀態(tài)和決策組成,其形式為
(4)
決策便是通過某個最優(yōu)值函數(shù)階段性地確定這樣一個歷史。文中討論應(yīng)用馬爾可夫決策過程建立最優(yōu)電池調(diào)度策略問題,使得在續(xù)的T+l個決策時刻單個電池恢復(fù)的電荷量最多且實現(xiàn)能量均衡。這可以看作是求解電池組為T的電池最優(yōu)調(diào)度問題。
3.2.2求解模型的建立
定義系統(tǒng)狀態(tài)為Dt[N1t,N2t,N3t,…,Nnt],N1t,N2t,N3t,…,Nnt為單體電池R1,R2,…,Rn于決策時刻t屬于{0,1,2,…,T}時電池的當(dāng)前名義容量。狀態(tài)轉(zhuǎn)移概率由控制器決策時間的情況決定:
(5)
式中:P(Dt+1|Dt,ati)----在決策時刻t時選擇單體電池i后系統(tǒng)狀態(tài)由Dt轉(zhuǎn)移到Dt+1的概率。
任一決策時刻,控制器工作的概率表示為Pst,對于連續(xù)工作情況Pst=1。如果某單體電池導(dǎo)通,則它失去一個電荷單元,未導(dǎo)通電池,則以某個概率Pr恢復(fù)一個電荷單元。對于圖5電池組模型,以其六塊單體電池中的一組為例,當(dāng)其中一個單體電池導(dǎo)通時,另一個單體電池要么以概率P(C-N)恢復(fù)一個電荷單元,要么以概率1-P(C-N)保持原狀態(tài)不變。因此,在下一決策時刻會誘導(dǎo)出2個狀態(tài),見表3。
表3 狀態(tài)轉(zhuǎn)移概率與報酬
采用Bellman最優(yōu)化原理對模型進行求解,使用以此向后迭代算法來選定各個關(guān)鍵時刻所要進行的活動,目的就是要把電池電荷回歸滿電量達到最高值。一般而言,最優(yōu)策略的子策略同樣是最優(yōu),這就是最優(yōu)化原理[6]。所以,如果從最后時刻依次向前遞推直至?xí)r刻0,以便選定在各個關(guān)鍵階段時的最佳決定路線,從而進一步選擇出最佳策略。由此可以得到遞推公式如下:
(6)
(7)
如果直接采用Markov決策對能量進行均衡管理,其過程較復(fù)雜且有很大的運算量,為了進一步減少運算量,文中通過線性規(guī)劃的思想來簡化模型的求解:將系統(tǒng)的狀態(tài)由多維Dt(N1t,N2t,…,Nnt)轉(zhuǎn)為1維Dt=(N1t+N2t+…+Nnt)后采用線性規(guī)劃的方式求解:
(8)
下面針對電池內(nèi)部一對并列單體電池狀態(tài)來說明本方法如何實現(xiàn)。假如開始時有兩個單體電池分別是電池1和電池2,電池理論上容量為C=200,名義上容量為N=150,即兩個單體電池的電池能量是均衡的。過了一段時間,單元電池1的殘余名義容量N1t取值為30,電荷電量回歸概率等于0.5;單元電池2的殘余名義容量N2t取值為21,電荷電量回歸概率等于0.3;平衡狀態(tài)為N1t=N2t=16。從表3得知,單體電池1在放電時單體電池2的電量回歸數(shù)學(xué)期望值等于0.3,單體電池2在放電時單體電池1的電量回歸數(shù)學(xué)期望值等于0.5。這樣就把這個問題轉(zhuǎn)化成了線性規(guī)劃的資源分配問題。即把一種資源分配給兩個用戶,對于每一個單元的資源,用戶1的收益占0.4,用戶2的收益占0.2,如何合理分配資源才能使用戶收益最大?
設(shè)劃分給電池1的電量定義為x1,劃分給電池2的電量定義為x2,有:
(9)
由于平衡態(tài)N1t=N2t=8,所以約束條件為:
(10)
初態(tài)N1t=30,N2t=20至平衡態(tài)N1t=N2t=16這一階段,由圖解法得x1=14,x2=4,即使電池1恢復(fù)14次,電池2恢復(fù)4次,可使電荷的恢復(fù)量最大。
4結(jié)語
通過電池組模型的建立,電池組整體電量經(jīng)馬爾可夫決策過程理論和線性規(guī)劃理論分析,電池在放電過程中能量恢復(fù)可達12.8%,達到了比較好的效果。同時減緩了因串聯(lián)導(dǎo)致的性能衰退現(xiàn)象。對于純電動汽車而言,該模型可提高其續(xù)駛能力和延長電池壽命,具有重要價值。
參考文獻:
[1]ThomasFFuller,MareDoyle,JohnNewman.Relaxationphenomenainlithium-ioninsertioncells[J].JournaloftheElectrochemicalSociety,1994,141(4):982-990.
[2]國家電動汽車試驗示范區(qū)管理中心.淺談“電動汽車中的電池能量管理系統(tǒng)” [C]//中國電動汽車會議論文集.2005:169-173.
[3]M Doyle, J Newman. Analysis of capacity-rate data for lithium batteries using simplified models of the discharge process[J]. Journal of Applied Electrochemistry,1997,27(7):846-856.
[4]Debashis Panigrahi, Carla chiasserini, Sujit Dey, et al. Battery life estimation for mobile embedded systems [C]//Fourth International Conference on VLSI Design.Bangalore India: [s.n.],2001:55-63.
[5]劉克.實用馬爾可夫決策過程[M].北京:清華大學(xué)出版社,2004.
[6]劉開緒,付保紅,鄒立君.鋰離子電池組能量均衡控制[J].長春工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2010,31(5):407-411.
[7]王曉陵,陸軍.最優(yōu)化方法與最優(yōu)控制[M].哈爾濱:哈爾濱工程大學(xué)出版社,2008.
[8]朱元,吳志紅,田光宇,等.基于馬爾可夫決策理論的燃料電池混合動力汽車能量管理策略[J].汽車工程,2006(9):798-802,828.
Electric vehicle battery modeling and discharge management
CHENG Fangxiao,LI Tengfei,WANG Xu
(School of Electrical & Electronic Engineering, Changchun University of Technology, Changchun 130012, China)
Abstract:With the effect of the battery rated capacity and recovery characteristics, pulse discharge technique is used to build a battery stochastic model. Both the Markov decision process theory and linear programming theory are applied to simulate the battery discharge energy equilibrium phenomena.
Key words:battery model; pulse discharge; Markov decision; linear programming.
收稿日期:2016-02-25
基金項目:吉林省科技發(fā)展計劃基金資助項目(20120362)
作者簡介:程方曉(1969-),女,漢族,吉林長春人,長春工業(yè)大學(xué)副教授,博士,主要從事測控技術(shù)與智能系統(tǒng)方向研究,E-mail:chengfangxiao@ccut.edu.cn.
DOI:10.15923/j.cnki.cn22-1382/t.2016.2.11
中圖分類號:TM 912
文獻標(biāo)志碼:A
文章編號:1674-1374(2016)02-0159-06