何勝利,劉現(xiàn)濤,張?zhí)?,陳?/p>
(1.南瑞集團(國網(wǎng)電力科學研究院)有限公司,江蘇 南京 211106;2.國電南瑞南京控制系統(tǒng)有限公司,江蘇 南京 211106;3.東南大學電氣工程學院,江蘇 南京 210096)
截至2020年底,中國電動汽車(electrical vehicle,EV)保有量已達約500萬輛。規(guī)模化EV的發(fā)展推動了交通與能源行業(yè)的融合[1—3],這不僅拓寬了電網(wǎng)的業(yè)務范圍[4—5],也為含高比例可再生能源電力系統(tǒng)的隨機性平抑提供了優(yōu)質的用戶側資源[6—8]。
EV與電力系統(tǒng)融合的優(yōu)化調度策略研究主要集中在2個層面:(1)合理調整EV充電的地點、時間和功率,減小規(guī)?;疎V充電對配電系統(tǒng)負面影響,降低用戶及運營商的用電成本[9—11]。(2)視EV群為分布式的儲能系統(tǒng),設計相應的調度及通信架構、優(yōu)化算法和激勵措施,為電網(wǎng)提供移峰填谷、頻率調節(jié)等服務[12—14]。
用戶行為對EV與電網(wǎng)融合有著深入影響,將成為信息-物理-社會融合系統(tǒng)中的重要環(huán)節(jié)[15]。在建模與優(yōu)化控制的過程中,必須對非完全理性用戶的決策行為進行研究[16]。期望效用理論(expected utility theory,EUT)是風險狀態(tài)下用戶決策的經(jīng)典規(guī)范性理論,建立了不確定條件下對理性人選擇進行分析的框架[17]。而前景理論(prospect theory,PT)將心理學研究應用在經(jīng)濟學中,由諾貝爾獎得主丹尼爾·卡內曼及其合作伙伴共同提出[18],是面向非完全理性人決策的描述性模型。
EV充電與分布式新能源(distributed renewable generation,DRG)具有潛在的協(xié)同性[19,且目的地充電是用作日常通勤的EV充電的主要方式之一[20],文中以含有DRG、常規(guī)負荷、儲能的多元充電站(multi-element charging station,MCS)為研究場景。當前的研究中[21],往往將用戶的充電需求作為約束條件,而對用戶充電決策的主觀性考慮不足。面向用戶的激勵機制較為復雜,缺乏直觀性。
針對上述問題,文中設計了面向用戶自主選擇的價格機制,通過價格激勵,引導用戶為充電站的調節(jié)提供靈活性。并分別建立了基于EUT和PT的用戶決策行為模型。同時考慮充電站運行經(jīng)濟性和面向電網(wǎng)的調節(jié)靈活性2個目標,采用模型預測控制(model predict control,MPC)方法,使得充電站運行優(yōu)化能夠兼容用戶決策的隨機性?;诤献鞑┺姆椒ㄇ蠼舛叩钠胶恻c,并通過虛擬變量的設置,將雙層優(yōu)化轉化為單層二次優(yōu)化。
用戶最終充電費用C決定方式如下。充電開始時,用戶選擇期望充電電量Q和能夠接受的充電時長T,并計算預期的充電費用,如式(1)所示。
(1)
在用戶離開前進行結算,設用戶實際的充電持續(xù)時長為Tactual,則用戶最終的充電費用為:
(2)
EUT為規(guī)范性理論,即從客觀角度出發(fā),用戶按此種方式進行決策能夠實現(xiàn)利益最優(yōu)。用戶抵達充電站后,若選擇T作為其充電時長,期望效用E(T)為風險條件下付出的充電成本的負值,可由式(3)進行計算。
(3)
式中:f(t)為充電持續(xù)時長的概率密度函數(shù);E1(T),E2(T)分別為用戶在設定時長達到之前、之后離開時所付出的充電成本的負值,二者之和為期望效用。用戶選擇使其期望效用最大的T作為其充電持續(xù)時長。
PT是用戶在不確定性條件下進行決策的描述性模型。在PT的框架下,用戶做出的決策未必是最優(yōu)的。用戶將選擇前景值最大而非期望值最大的T,基于PT建立用戶決策模型的主要步驟可以表示如下。
(1)參照點依賴。用戶決策的載體是相對于參照點的收益或損失。用戶選擇Q,T后,將產(chǎn)生的C作為參考點。若用戶提前離開,產(chǎn)生的損失為:
Lbefore=Qs(1-β(Q,T))
(4)
若用戶推遲離開,產(chǎn)生的損失為:
Lafter=Qs(β(Q,T)-β(Q,Tactual))
(5)
(2)框架效應。用戶決策系統(tǒng)性的依賴前景的描述方式。選取Tactual,0,Tactual,1和Tactual,2作為用戶可能離開的典型場景,Tactual,0 (6) 設L1 V(T)=L2ω(1-F(Tactual,2))+ (7) 式中:F(T),F(xiàn)(Tactual,1),F(xiàn)(Tactual,2)分別為用戶在T,Tactual,1,Tactual,2前離開的累積概率密度;ω為概率的非線性變換函數(shù)。 (3)非線性偏好。PT框架下,用戶會為小概率的事件賦予較大權重,而對中間概率事件p的變化不敏感,采用加權函數(shù)對概率進行非線性變換: (8) 式中:δ為損失規(guī)避系數(shù),一般取值為0.2。 基于MPC的充電站調度優(yōu)化的基本流程如圖1所示,設每次優(yōu)化的時間尺度為ΔT,執(zhí)行時間步長為Δt,主要包括預測、優(yōu)化、執(zhí)行與滾動3個步驟。 圖1 基于MPC充電站優(yōu)化調度流程Fig.1 Optimization scheduling process of charging station based on MPC 首先,以Δt為步長,采用自回歸滑動平均模型對DRG和常規(guī)負荷在當前優(yōu)化時段Ti的值進行滾動預測;同時,對充電站未來時段的充電需求進行滾動預測,并根據(jù)用戶行為決策模型預測用戶選擇的充電方案;然后,以當前優(yōu)化時段Ti經(jīng)濟性最優(yōu)、下一執(zhí)行時段t2可用功率最大等為目標,以Δt為步長,計算當前時段Ti儲能及EV的最優(yōu)功率;得到最優(yōu)功率計劃后,僅執(zhí)行時段t1的計劃。并以Δt為步長向前滾動。 (1)優(yōu)化目標。MCS的目標之一為其自身運行的經(jīng)濟性,而運營收入與MPC的效果無關,故在優(yōu)化的過程中,采用運營成本代表其經(jīng)濟性目標: (9) 式中:Cobj(Ti)為當前優(yōu)化時段充電站的運行成本;Ptotal(tj)為tj時段充電站的總功率;Eprice(tj)為tj時段的購電電價;βBE為儲能充/放單位電量的損耗成本;PBEc(tj),PBEd(tj)分別為tj時段儲能的充/放電功率。在短時間尺度的經(jīng)濟性優(yōu)化中不考慮DRG的出力成本。 MCS的目標之二為其下一執(zhí)行時段可上調功率,即其相對于計劃功率可增加吸收的值最大化,反映了上級電網(wǎng)對充電站靈活調節(jié)能力的要求,可表示為: maxPobj(Ti)=max(Pt,max(t2)-Ptotal(t2)) (10) 式中:Pobj(Ti)為在下一執(zhí)行時段的可上調功率;Pt,max(t2)為當前運行方案下時段t2能達到的最大功率;Ptotal(t2)為時段t2的原計劃功率。 (2)約束條件。與EV相關的約束可表示為: (11) 式中:uEV,k(tj)為0-1變量,為1時代表第k輛EV在時段tj正在充電;UEV,k(tj)為時段tj的可充電狀態(tài),為1時代表其在時段tj可以充電,根據(jù)對用戶充電行為的預測及用戶的實際選擇情況得到;PEV,k,min,PEV,k,max分別為第k輛EV的最小、最大充電功率;PEV,k(tj)為其在時段tj的充電功率;CEV,k,min(Ti),CEV,k,max(Ti)分別為時段Ti結束后的最小、最大充電電量。 與儲能相關的約束可表示為: (12) 式中:uBEc(tj),uBEd(tj)均為0-1變量,uBEc(tj)為1代表儲能處于充電狀態(tài),uBEd(tj)為1代表儲能處于放電狀態(tài);PBEc,max,PBEc,min分別為儲能充電功率的最大值、最小值;PBEd,max,PBEd,min分別代表儲能放電功率的最大值、最小值;EB(tj)為時段tj儲能的荷電狀態(tài);EB,max,EB,min分別為儲能的最大、最小荷電量。 新能源出力與總功率相關的約束為: (13) 式中:Pnew(tj)為新能源出力;Pnew,predict(tj)為預測得到的新能源出力最大值;Pload(tj)為常規(guī)負荷的預測值;Ptotal,max為MCS受容量限制能夠吸收的最大功率,設置Ptotal(tj)≥0。 MPC的目標1和目標2存在如下關系:目標2的優(yōu)化是在已有運行計劃基礎上再次進行的,且僅當上級電網(wǎng)下發(fā)響應指令時才會執(zhí)行,只影響之后的運行計劃,而對目標1進行優(yōu)化的時候,需考慮優(yōu)化結果對目標2的影響。因此該優(yōu)化是雙層優(yōu)化問題,為減少計算時間,滿足在線滾動需求,文中采用如下方法處理目標1和目標2之間的關系。 記X(tj)為當前優(yōu)化問題的控制變量,增設虛擬變量X′(tj),虛擬變量除滿足式(11)—式(13)外,還需滿足約束條件X(t1)=X′(t1)以保證下一執(zhí)行時段調度計劃的一致性。 同時,將優(yōu)化目標2修改為: maxPobj(Ti)=maxP′total(t2)-Ptotal(t2) (14) 通過增設虛擬變量及相應約束條件,將雙層優(yōu)化問題轉換為單層雙目標優(yōu)化問題進行求解。 由于MCS和電網(wǎng)處于長期穩(wěn)定的合作關系之中,故可基于合作博弈的思想求該雙目標優(yōu)化的帕累托最優(yōu)解。 (1)記目標1為Ψ1,目標2為Ψ2,分別求解Ψ1的最大值Ψ1,max和最小值Ψ1,min,Ψ2的最大值Ψ2,max,Ψ2的最小值記為0; (2)將目標1改寫為: (15) 目標2改寫為: (16) (3)加入權重變量d,將總目標記為: maxφ=max[(1-d)φ2-Cφ1] (17) 通過步驟(1)、(2)對目標函數(shù)進行規(guī)格化,并將權重作為優(yōu)化變量以尋求最佳的配比。由此,將雙目標線性優(yōu)化轉換為單目標二次優(yōu)化,可通過成熟的求解器進行計算。 開展面向真實人的實驗測試。受試者分為2組,分別由20名具備一定駕駛經(jīng)驗的學生和20名專業(yè)司機組成。實驗流程如圖2所示。 圖2 面向真實人的充電行為決策實驗Fig.2 Experiment of charging decision making for real people 首先設定實驗人初始獎勵。根據(jù)預設規(guī)律自動生成充電開始時刻、Q和預期離開時刻及其概率分布并告知實驗人。有限時間內,實驗人被鼓勵按直覺設置T。之后,系統(tǒng)根據(jù)規(guī)則抽取Tactual并結算C。將初始獎勵扣除C,作為本次實驗的最終獎勵發(fā)放給用戶。開展2組對照實驗。一組充電開始于日間,Q較少,T較短;另一組充電開始于傍晚或夜間,Q較多。β0取0.6,s取1.2元/(kW·h)。初始獎勵為50元。 圖3展示了PT和EUT的預測結果與實驗人實際選擇的對比。相較EUT,PT更為貼切地描述了用戶的決策:EUT的預測結果平均相對誤差為14.23%,而PT的預測結果平均相對誤差為4.81%。面向專業(yè)司機和學生的實驗結果沒有明顯差異。EUT在夜間長時間充電場景下的預測準確度明顯提升,原因可能在于,用戶對時間跨度較長的決策的風險敏感性有所降低。 圖3 面向真實人的實驗結果Fig.3 Results of experiments for real people EV進站流量、充電開始時刻、持續(xù)時長和充電電量等參數(shù)根據(jù)文獻[22]中的方法生成。DRG容量為40 kW·h,常規(guī)負荷峰值為200 kW,采用文獻[23]中的方法預測其出力及功率曲線。ΔT,Δt分別取1.5 h和15 min。充電樁數(shù)量為30,額定功率為21 kW。儲能容量為20 kW·h,最大和最小的充放電功率分別為10 kW和1.4 kW,初始電量為容量的50%。峰(08:00—12:00,17:00—21:00)、谷(00:00—08:00)、平(12:00—17:00,21:00—24:00)等時段的電價分別設為1.07元/(kW·h)、0.31元/(kW·h)和0.64元/(kW·h)。采用PT預測用戶的充電決策,根據(jù)3.1節(jié)的實驗結果,以4.81%為平均值隨機生成預測誤差。基于Matlab平臺,采用Yalmip工具箱調用Mosek求解器對模型進行求解,相關的運行環(huán)境為Intel(R)Core(TM)i7-9700 CPU@3.00 GHz RAM 32.0 GB。計算該充電站在工作日、非工作日2種場景下的調度結果,并與無序充電情況下的運行結果對比,如表1、表2所示。 表1 優(yōu)化及仿真結果(工作日)Table 1 Optimization and simulation results on weekdays 表2 優(yōu)化及仿真結果(非工作日)Table 2 Optimization and simulation results at weekends 無序充電情況下僅對儲能運行進行優(yōu)化。文中提出的優(yōu)化調度策略在不同場景下均能有效降低運行成本達20%左右,并提供一定的功率靈活調節(jié)能力。特別是在非工作日,由于用戶出行彈性大,優(yōu)化調度策略的效果更為顯著。 表1中,優(yōu)化值是根據(jù)光伏、常規(guī)負荷和用戶行為預測進行優(yōu)化得到的結果,而仿真值是計及預測誤差情況下執(zhí)行決策變量優(yōu)化值得到的結果。文中基于MPC的調度策略能夠顯著的抑制誤差和隨機性導致的優(yōu)化結果劣化,仿真值與優(yōu)化值的偏差控制在1%左右。 為進一步驗證文中優(yōu)化調度策略的效果,研究如下對比算例: (1)基于EUT預測用戶的充電行為。工作日場景下充電站總功率優(yōu)化值及仿真值如圖4所示。對比算例中,由于未能較為準確的預測用戶選擇,總功率的優(yōu)化值與仿真值之間存在較大偏差,優(yōu)化得到的充電站日運行成本為4 701.65元,而運行成本的仿真值則為5 081.47元,文中調度策略下運行成本的仿真值則為4 817.04元。 圖4 不同調度方法下充電站的運行情況Fig.4 The operation of charging station under different scheduling strategies 模擬上級調度于03:45下發(fā)功率上調指令,上調量為60 kW。文中調度策略下,充電站總功率準確跟蹤了上級調度指令。而未考慮用戶非完全理性行為的調度策略則未能完全滿足上級調度需求。 (2)以站級經(jīng)濟性為單一目標進行優(yōu)化調度。不同場景下,充電站運行成本對比如圖5所示。單一優(yōu)化目標下,工作日和非工作日運行成本分別為4 678.61元和4 461.34元。當采用文中的雙目標優(yōu)化方法時,增加運行成本小于4.0%,能夠在經(jīng)濟性犧牲較小的情況下,提供站級調節(jié)靈活性。 圖5 充電站運行成本對比Fig.5 Comparison of operating cost for charging stations (3)在雙目標求解時,采用上下層迭代的方式進行。單次計算時間與文中所用方法的對比如圖6所示。采用迭代方法時,單次計算時間在20 s以上,相同環(huán)境下,文中的求解算法大幅降低了求解時間,單次計算時間在1~2 s間,且在不同場景下保持了計算速度的穩(wěn)定性,可滿足在線優(yōu)化的需求。 圖6 計算時間對比Fig.6 Comparison of calculation time 文中將包含常規(guī)負荷、DRG及儲能的MCS作為研究對象。設計了充電價格激勵機制,在保證用戶自由選擇的基礎上,挖掘其調節(jié)靈活性。并分別采用EUT和PT,建立了用戶充電決策預測模型。基于MPC方法,通過合作博弈以及虛擬變量設置,對EV充電和儲能的調度策略進行了多目標優(yōu)化。真實人參與的實驗結果表明,在面向不同對象時,考慮用戶非完全理性的PT在描述用戶選擇上均更具優(yōu)勢。仿真實驗結果表明,文中所提調度方法在不同場景下均能顯著降低充電站運行成本,并以較小的經(jīng)濟代價為上級電網(wǎng)提供靈活調節(jié)能力,同時具備能夠滿足在線應用要求的模型求解速度。 與電力系統(tǒng)傳統(tǒng)的調度對象不同,EV用戶是分散的、具有非完全理性的個體。在進行EV與電網(wǎng)互動等工作時,應考慮社會-物理融合的模型。未來擬進一步開展面向城市級、多層次的EV充電優(yōu)化調度研究。
L0(ω(1-F(Tactual,2)+F(T))-ω(F(T)))+
L1(ω(1-F(Tactual,1)+F(T))-ω(1-F(Tactual,2)+F(T)))2 基于MPC的充電站優(yōu)化調度策略
2.1 調度優(yōu)化的基本流程
2.2 優(yōu)化目標與約束條件
2.3 求解方法
3 實驗及算例分析
3.1 理性人模型與非完全理性人模型的對比
3.2 調度策略的有效性
4 結語