殷國棟 李廣民 朱 侗 陳建松
東南大學機械工程學院,南京,211189
純電動汽車憑借其動力傳輸損失小、控制較為柔性和能量利用率高等優(yōu)勢,引領著未來汽車的發(fā)展方向,已經(jīng)成為未來智能汽車以及智能交通技術發(fā)展的基礎。伴隨著我國汽車保有量的不斷上升,大力發(fā)展電動汽車技術更加緊迫,然而,充電時間長、續(xù)駛里程短和初始成本高等問題已經(jīng)成為制約電動汽車大規(guī)模產(chǎn)業(yè)化發(fā)展的瓶頸,解決純電動汽車系統(tǒng)的能量管理問題迫在眉睫。
面對電動汽車機電一體化程度的加深和汽車動力電池產(chǎn)業(yè)的迅速發(fā)展,用于延長汽車續(xù)駛里程、提高電源電能利用效率和促進能源清潔化的能量管理策略成為控制領域的研究焦點。目前,大部分能量管理策略都只針對混合動力汽車的燃油與電能分配方面的問題,對于輪轂電機驅動電動汽車的相關研究較少,缺乏完整的、較為規(guī)范的體系結構。人工智能的興起使得車輛系統(tǒng)的能量管理研究也逐漸向人工智能方向靠攏,通過構建對應的智能控制系統(tǒng),可以設計出能夠“自主思考”的能量控制策略。
多Agent系統(tǒng)(multi-Agent system,MAS)作為分布式人工智能(distributed artificial intelligence,DAI)領域的重要分支,已經(jīng)成功應用于各類復雜工程控制問題的求解[1]。多Agent系統(tǒng)是指由多個能力、知識有限且狀態(tài)不同的Agent所組成的Agent聯(lián)盟,這些成員Agent在同一個大的目標之下,通過任務分解、協(xié)商和協(xié)作共同完成任務[2]。多Agent系統(tǒng)通過分散控制和并行處理實現(xiàn)更加迅速的問題求解[3]??蓚鬟f置信模型(transferable belief model,TBM)最早應用于處理動態(tài)環(huán)境的證據(jù)推理問題,國內(nèi)外在該方面的研究多集中于模型算法的構建以及決策框架的建立,尚未運用在具體的工程實踐中。
本文基于多Agent系統(tǒng)思想,構建四輪驅動純電動汽車能量管理體系框架,研究四輪驅動電動汽車各用電系統(tǒng)的能量控制,在保證整車動力性的前提下實現(xiàn)車輛全局能量分配最優(yōu)。
電動汽車的能量管理策略主要用于對整車能量進行優(yōu)化分配、對動力電池的剩余能量以及電動汽車剩余里程進行估計、為電動汽車提供最佳駕駛模式、對電池工作狀態(tài)進行監(jiān)控等方面[4]。管理策略設計、剩余里程估計以及回饋能量收集是目前電動汽車能量管理研究中的熱點和關鍵技術[5]。根據(jù)四輪驅動電動汽車系統(tǒng)的結構以及多Agent系統(tǒng)的設計機制,構建圖1所示四輪驅動電動汽車能量管理多Agent體系框架。圖1中,-Si表示Agenti的特征向量,-mi表示基于Dempster規(guī)則的置信指派函數(shù),mc表示融合中心對某置信指派的融合結果。
圖1 能量管理多Agent體系Fig.1 Energy management multi-Agent system
能量管理多Agent體系分為外部信息層、決策規(guī)劃層、底層能量控制層和執(zhí)行層共4個層級,底層控制層包括復合電源(compound power,CP)、電機驅動(motor driving,MD)、能量回收(energy recuperation,ER)和低壓電氣(low-voltage electrical system,LES)4個子系統(tǒng)Agent。電動汽車在道路行駛時,多Agent體系能夠根據(jù)動力需求、環(huán)境變化和道路信息等外部知識,通過上層的決策規(guī)劃機制,合理配置各Agent的能量供給,同時能夠充分回收并貯存饋能主動懸架以及再生制動系統(tǒng)所產(chǎn)生的能量。在能量合理分配的同時,各Agent能夠相互協(xié)作,高效完成當前系統(tǒng)操作任務,從而實現(xiàn)系統(tǒng)全局能量最優(yōu)。
電動汽車動力電池仍是目前應用于電動車輛的最主要能量源,然而動力蓄電池存在能量密度偏低、瞬時放電功率較小等問題,在極限工況下大電流放電會使得電池內(nèi)部結構發(fā)生變化,不僅影響電池壽命,更有可能導致電池出現(xiàn)熱失控現(xiàn)象,產(chǎn)生自燃或者爆炸的危險。超級電容器是一種新興的汽車電力儲能元件,瞬時功率大、使用壽命長和充放電響應快等優(yōu)勢使得超級電容器能夠作為電動車輛的輔助輸出源,加入到電動汽車的電源系統(tǒng)中。
通過分析四輪驅動純電動汽車各主要用電機構對能量的需求,結合車輛驅制動系統(tǒng)的動力性能要求,構建的復合電源Agent見圖2。復合電源Agent由鋰離子動力電池和超級電容組成,兩者以雙向DC/DC轉換器連接。電源系統(tǒng)通過Agent協(xié)調(diào)分配控制器與電氣負載連接,能夠滿足電源系統(tǒng)在純電動汽車大功率工況下合理的放電要求。
圖2 復合電源Agent結構示意圖Fig.2 Schematic diagram of compound power Agent
輪轂電機驅動系統(tǒng)作為四輪驅動電動汽車最重要的執(zhí)行機構,同樣也是電動汽車眾多子系統(tǒng)中耗能最多的單元。針對輪轂電機驅動系統(tǒng)對能量效用方面的需求,建立的電機驅動Agent見圖3,考慮能量系統(tǒng)與動力學性能之間的耦合機理,設計四輪驅動電動汽車驅動系統(tǒng)能量優(yōu)化分配控制方法,并通過多Agent系統(tǒng)協(xié)調(diào)分配機制對能量供給與能量分配方面的沖突問題進行高效協(xié)調(diào),實現(xiàn)驅動系統(tǒng)能量分配的經(jīng)濟最大化。
圖3 電機驅動Agent結構示意圖Fig.3 Schematic diagram of motor driving Agent
目前應用于四輪獨立驅動純電動汽車的能量回收裝置通常包括輪轂電機再生制動系統(tǒng)和主動懸架饋能系統(tǒng)。再生制動是指車輛在減速或制動過程中,通過使用一些特別的裝置將車輛制動動能進行轉化并儲存起來以供再次利用[6]。主動懸架饋能的目標就是回收由不平路面激勵引起的振動能量,用于車輛的主動減振[7]。
探究再生制動系統(tǒng)和主動懸架饋能系統(tǒng)對能量回收的基本方法和原理,構建的能量回收Agent,見圖4。將該Agent與復合能源系統(tǒng)、輪轂電機驅動系統(tǒng)等建立關聯(lián),實現(xiàn)汽車能量的合理利用。
圖4 能量回收Agent結構示意圖Fig.4 Schematic diagram of energy recuperation Agent
本文在構建能量管理多Agent體系時對整車各用電系統(tǒng) Agent進行建模[8],各系統(tǒng) Agent以EM_Agenti表示,可以表示為下列五元組:
其中,Ni表示各系統(tǒng)自身屬性集,包含靜態(tài)屬性集和動態(tài)屬性集,各系統(tǒng)的靜動態(tài)屬性集所含內(nèi)容不同,如對于復合電源Agent,其靜態(tài)屬性包括電池容量、額定電壓電流和內(nèi)阻值等固有屬性,而其動態(tài)屬性包括荷電狀態(tài)(state of charge,SOC)、電源溫度等隨運行時間變化的參量;Mi表示系統(tǒng)能夠執(zhí)行的任務集合;Ri表示系統(tǒng)的需求信息集,分為能量需求集Pi和優(yōu)先級函數(shù)集Ui;Ci表示任務與能量分配策略集;Ai表示系統(tǒng)的當前狀態(tài)集,是經(jīng)過任務與能量分配策略處理后的具體體現(xiàn)。
在能量管理多Agent體系下,單個Agent無法單獨完成系統(tǒng)任務或動作,需要對任務性質進行分析,各Agent間通過協(xié)作對任務進行準備與解決,因此,系統(tǒng)任務分配與能量分配是必要的。本文采用基于聯(lián)合分配策略的數(shù)學模型[8]對能量管理Agent所轄的各Agent進行任務分配和能量分配。各Agent間能夠通過車輛總線直接或間接地進行通信和數(shù)據(jù)交互,對整個車輛系統(tǒng)的總能量進行數(shù)學描述,記作則任務與能量分配可表征為
Agent的任務與能量分配狀態(tài)方案可表示為
式中,tT為系統(tǒng)所能分配的最大任務量;pk、mk分別為各Agent執(zhí)行任務所需(產(chǎn)生)能量和對應系統(tǒng)任務。
約束條件為
式中,Λ為所有分配狀態(tài)方案的解空間;opt表示優(yōu)化函數(shù);G(?)為分配狀態(tài)方案目標函數(shù),本文中的設計目標為車輛全局能量最優(yōu);nlim為各Agent自身動靜態(tài)屬性約束;nlim,max、nlim,min分別為屬性約束的上下限。
對分配狀態(tài)方案做最優(yōu)化處理,即有
為了保證成功地完成系統(tǒng)操作任務,各Agent不僅要依賴于正確的任務表述和操作序列,而且要依靠用于表征各個操作序列中有效行為的動作方案。任務規(guī)劃的目的就是使系統(tǒng)自動地生成一系列操作序列和有效行為的動作方案[9]。
本文采用基于狀態(tài)轉移的行為規(guī)劃對能量管理多Agent下層各系統(tǒng)Agent的操作行為進行建模,設各Agent的環(huán)境狀態(tài)集合ξ={ε1,ε2,…,εn},則有
式中,β為系統(tǒng)操作行為集合;?為動作方案集合;ak為動作序列;ξ為動作方案或狀態(tài)轉移??;O為系統(tǒng)行為合集;下標k表示該動作序列的序號,為某特定值,與系統(tǒng)屬性相關。
將動作方案作為一個馬爾可夫鏈進行建模,模型在形式上以下面的三元組表示:
進一步區(qū)分下一個狀態(tài)的無知的概念[10-11]。無知由 賦 予的概念質量定義,表示為滿足以下性質:
在任務規(guī)劃中,假設生成的規(guī)劃是順序的,且能夠表示成一個長度為N的狀態(tài)轉移鏈a_chainN。的概率依賴于的概率,可以表示為
所以達到一個期望的最終狀態(tài)的概率可以通過下列方程進行計算:
對于系統(tǒng)任務集,定義任務語法χ作為一類分解規(guī)則,用于提取各系統(tǒng)間的相互作用關系。任務語法可以由下列的4元組定義:
式中,?t為對應于預定義簡單動作方案的終結符集合;ο為呈遞至高層操作行為規(guī)則?-?t中的元素;?為一個產(chǎn)生式規(guī)則的有限集。
任務語法可以看作是一個產(chǎn)生各種排列與組合的生成函數(shù),在本質上是遞歸的。
針對給定的任務語法,能夠由該任務語法生成規(guī)劃,表示如下:
在能量管理多Agent體系中,單個系統(tǒng)Agent無法獲取環(huán)境的完整信息,它們必須通過合作完成系統(tǒng)操作任務。目前應用于工程上的協(xié)調(diào)方案都需要Agent之間直接的信息分享和通信,信息共享可以是顯式的,也可以是隱式的[12]。由于車輛系統(tǒng)通信存在一定的局限性,各系統(tǒng)Agent之間難以保證高效的實時信息共享,故本文采用基于可傳遞置信模型的分布式?jīng)Q策方法[13]對能量信息進行綜合,系統(tǒng)框架見圖5,圖中,Pk為Pignistic概率值,θk表示所考慮模式k的前提,A為辨識框架的子集。
圖5 基于TBM的分布式?jīng)Q策系統(tǒng)框架Fig.5 Frame diagram of the distributed decision system based on TBM
TBM是一種雙層模型,由Credal層和Pignistic層組成。Credal層對獲取的置信度[14]進行量化、賦值和更新處理,Pignistic層則將處理過的置信度轉化為Pignistic概率并由此作出決策。
基于TBM的分布式?jīng)Q策方法中,各系統(tǒng)Agent彼此之間可以不進行直接的信息分享,而是通過一個預置的融合中心來進行交流。融合中心通過組合每個Agent的基本置信生成對整個環(huán)境信息的置信值,決策中心則通過對置信值的處理產(chǎn)生Pignistic概率,而決策的制定是根據(jù)Pignistic概率得出的[15-16]。
將車輛系統(tǒng)整體能量信息定義為集合InfT={li,di},其中,li表示能量的大小,di表示能量的流動方向。這兩項信息分別由Agentl和Agentd進行觀測。令Agentl的辨識框架Ψl={小,較小,較大,大}。令Agentd的辨識框架Ψd={流入,流出}。Agentl和Agentd可以通過整體能量信息,即能量大小和流動方向分別得到相應的基本置信指派。
設Agentl的特征向量為Sˉl,根據(jù)系統(tǒng)能量分配的特點定義四組參考向量υl,1~υl,4,則Agentl的測度函數(shù)定義為
從而得到Agentl置信指派為ml(?。?、ml(較小)、ml(較大)、ml(大)、ml(Ψl)。設Agentd的特征向量為Sˉd。根據(jù)系統(tǒng)能量流動的特點定義能量消耗為φout,能量回收為φin,又定義Agentd的測度函數(shù)為
其 中 ,i=out,in;φi=kπ,k∈Z。 可 以 得 到Agentd的置信指派md(流入)、md(流出)、md(Ψd)。
融合中心將每個Agent的置信指派作為輸入,基于Dempster組合規(guī)則[17]對其進行合成。融合中心確定組合后的置信指派的辨識框架Ψf={小,較小,較大,大},因此必須把Agentd的置信指派轉換為辨識框架Ψf下的置信值。令Ω:2Ψd→ 2Ψf
是從Ψd到Ψf的一個細化,在置信轉換過程中,還需根據(jù)實際特點增添一些轉化規(guī)則。同時,融合中心通過Dempster組合規(guī)則得出各類置信指派,決策中心能夠將融合中心得到的結果作為輸入,辨識框架中每個前提的概率值,由下式得到:
在能量管理多Agent系統(tǒng)中,通過決策得到每個狀態(tài)的Pignistic概率,根據(jù)概率值的大小能夠判斷各系統(tǒng)Agent的能量狀態(tài)信息[16-17]。
根據(jù)上述分析,對能量管理多Agent體系進行建模仿真。本文采用較為通用的多Agent建模軟件Netlogo進行仿真分析,軟件運行界面見圖6。首先通過Logo語言進行編程,分別構造多Agent體系中的各系統(tǒng)Agent,然后分別設定各Agent初始的能量分配權重。仿真實驗參數(shù)信息見表1。
圖6 Netlogo軟件運行界面Fig.6 Interface of Netlogo
表1 四輪驅動電動汽車參數(shù)信息Tab.1 Parameters information of 4WD EV
在UDDS工況下進行仿真,速度曲線見圖7。利用Netlogo軟件求解該工況下電機驅動Agent(MD Agent)、能量回收Agent(ER Agent)和低壓電氣Agent(LES Agent)的能量分配權重。在MATLAB/Simulink環(huán)境下,基于能量分配權重搭建功率分配控制器,并將功率分配控制器嵌入ADVISOR純電動汽車整車模型中進行驗證,對比于靜態(tài)分配能量控制算法(各部件的功率分配不發(fā)生變化),仿真結果見圖8~圖10。
圖7 UDDS工況速度曲線Fig.7 Velocity curve of UDDS condition
圖8 能量分配權重變化曲線Fig.8 Changing curves of energydistributed weights
圖9 功率與能耗對比Fig.9 Comparison of motor power and energy consumption
圖10 復合電源Agent SOC值變化Fig.10 Diagram of changing SOC of compound power Agent
圖8中,系統(tǒng)Agent的能量分配權重在整個過程中是不斷變化的。電機驅動Agent的整體能耗最高,而能量回收Agent只在再生制動條件下產(chǎn)生一定的耗能。當電機驅動Agent需求能量較大時(200~400 s),低壓電氣Agent的能耗相應降低;在驅動能量需求不大的情況下,低壓電氣Agent能耗保持平穩(wěn)。
圖9所示為多Agent能量控制與靜態(tài)分配能量控制的對比結果。通過功率對比可以看出,在低功率工況下兩種控制的輸出功率相近,在高功率工況下,多Agent能量控制的輸出功率較低。通過能耗對比可知,多Agent能量控制在各個階段的能量消耗都要小于靜態(tài)分配能量控制。
圖10中,動力電池SOC值Ssoc的變化較為平和,而超級電容SOC值的變化幅度較大,尤其在高功率工況下出現(xiàn)急劇下降的情況,表明其在高功率放電時具有更高的優(yōu)先級。
本文基于多Agent系統(tǒng)規(guī)則構建出適用于四輪驅動電動汽車的能量管理體系結構,并在該結構下建立能量管理多Agent數(shù)學模型,分別基于狀態(tài)轉移和可傳遞置信模型為能量管理多Agent體系搭建決策規(guī)劃層,從而構成了宏觀層次化、微觀具體化的理論框架,并通過建模仿真分析驗證了模型的正確性與合理性。本文所提出的能量管理體系結構能夠為今后相關領域的研究提供一定的技術參考和理論支撐,同時為多Agent系統(tǒng)思想在四輪驅動電動汽車其他研究層面的應用和推廣提供依據(jù)。