夏 煒,呂 林,劉沛清
(四川大學(xué)電氣信息學(xué)院,四川成都 610065)
Economic Game Theory Research on Bilateral Electricity Pricing in Direct Power PurchaseXIA Wei, LYU Lin, LIU Peiqing
(School of Electrical Engineering and Information, Sichuan University, Chengdu 610065, China)
?
直購電交易中等效電能雙邊定價(jià)博弈研究
夏煒,呂林,劉沛清
(四川大學(xué)電氣信息學(xué)院,四川成都610065)
Economic Game Theory Research on Bilateral Electricity Pricing in Direct Power PurchaseXIA Wei, LYU Lin, LIU Peiqing
(School of Electrical Engineering and Information, Sichuan University, Chengdu 610065, China)
0引言
近年來,隨著主動配電網(wǎng)的蓬勃發(fā)展,其優(yōu)異的雙向操作性賦予中國電力市場最大且最優(yōu)的發(fā)展空間。2013年10月,國家能源局、工信部發(fā)布《關(guān)于規(guī)范電力用戶與發(fā)電企業(yè)直接交易的通知》[1],明確提出支持各地開展規(guī)范的電力用戶與發(fā)電企業(yè)直接交易,而主動配電網(wǎng)雙向流動的電力潮流和數(shù)字信息流特征,為其實(shí)現(xiàn)提供了有力保障[2]。
文獻(xiàn)[3-4]就國外的大用戶直購電模式建立了適應(yīng)其市場環(huán)境的電力市場直購電定價(jià)模型及激勵機(jī)制。文獻(xiàn)[5]中發(fā)電商和大用戶采用貝葉斯學(xué)習(xí)模型進(jìn)行叫價(jià)博弈通過預(yù)測對方的保留價(jià)格探討交易的可行性。文獻(xiàn)[6]以電網(wǎng)、發(fā)電廠以及用戶收益相等為目標(biāo)建立定價(jià)模型,找尋相同收益的定價(jià)狀態(tài)。文獻(xiàn)[7]針對直購電模式提出合適的過網(wǎng)費(fèi)用計(jì)算方法。文獻(xiàn)[8]從經(jīng)濟(jì)學(xué)的角度出發(fā),通過法律以及市場手段來監(jiān)管直購電定價(jià)從而對直購電行為進(jìn)行控制。文獻(xiàn)[9]針對大用戶直購電問題提出了合同訂購與實(shí)時(shí)結(jié)算兩種購電模式,并分別確定了最優(yōu)電價(jià)。文獻(xiàn)[10]應(yīng)用Pareto最優(yōu)分配理論,建立了大用戶直購電系列模型進(jìn)行測算,證明該分配模型對于產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、區(qū)域經(jīng)濟(jì)發(fā)展能夠起到良好的促進(jìn)作用。文獻(xiàn)[11]分析市場各主體間的博弈行為,推導(dǎo)出雙方達(dá)成直購電交易的條件并結(jié)合算例探討我國大用戶直購電定價(jià)機(jī)制的改革與過渡。上述文獻(xiàn)主要考慮電力市場成交前期的優(yōu)化問題或?qū)_(dá)成直購電成交條件的探求,并未考慮用戶自身利用電能所產(chǎn)生的經(jīng)濟(jì)價(jià)值因素,而該價(jià)值因素同發(fā)電廠售予用戶的批發(fā)電價(jià)會共同影響用戶的效益,進(jìn)而改變用電格局。
本文基于博弈論[12],通過找尋發(fā)電廠電價(jià)和大用戶的等效電能定價(jià)間的博弈關(guān)系,研究分析二者在參與電能交易過程中的推動因素,建立了以電網(wǎng)公司收益最大和用戶收益最大為目標(biāo)的雙層規(guī)劃模型。通過對比系統(tǒng)最優(yōu)化模型,探尋合作博弈和非合作博弈在競價(jià)電能交易中產(chǎn)生的不同效果。為當(dāng)前備受關(guān)注的大用戶直購電政策下的電力公司各類大型用電企業(yè)的自身定價(jià)策略及收益預(yù)估提供了有益參考。
1博弈論及原理分析
博弈論[12]又被稱為對策論(Game Theory),主要研究公式化的激勵結(jié)構(gòu)間的相互作用,是研究具有競爭性質(zhì)現(xiàn)象的方法。
在經(jīng)濟(jì)性博弈行為中,利益是驅(qū)使市場持續(xù)向前的最直接動力。發(fā)電廠通過雙向通信了解負(fù)荷情況,合理操控針對不同用戶的實(shí)時(shí)電價(jià),控制用電情況,提高自身收益;從用戶出發(fā),將一切利益產(chǎn)品轉(zhuǎn)化為電能的形式,看作電網(wǎng)中電能的中間商,以供電方的電價(jià)為基礎(chǔ)制定自身的銷售單價(jià)。在經(jīng)濟(jì)學(xué)供應(yīng)鏈[13]的模式下,用戶的用電行為意在將電能轉(zhuǎn)化為利潤。此時(shí),電價(jià)即生產(chǎn)成本,用戶定價(jià)即售價(jià),售價(jià)影響市場需求。由此可見,在滿足理性經(jīng)紀(jì)人假設(shè)[14]的基礎(chǔ)上,用戶和發(fā)電廠通過各自定價(jià)決策追求當(dāng)前情況下各自利潤最大化,達(dá)到共贏。
本文中所有行為均發(fā)生在單位時(shí)間段t中,博弈上下層的決策可視為主從先后順序,因此本文采用一個(gè)完全信息靜態(tài)博弈模型模擬電價(jià)和等效電能定價(jià)是合理的。
2發(fā)電廠與大用戶的雙層優(yōu)化模型
2.1Stackelberg雙層規(guī)劃問題的描述
Stackelberg博弈模型是最常見的完全信息非合作博弈模型,在Stackelberg博弈中存在兩種類型的決策者:處于較高決策層的主導(dǎo)者和處于較低決策層的跟隨者。主導(dǎo)者從策略集中選擇一個(gè)策略,跟隨者根據(jù)主導(dǎo)者的決策來選擇自身策略,主導(dǎo)者預(yù)計(jì)跟隨者的反應(yīng)根據(jù)反饋信息來作出自己的最優(yōu)決策[15]。Stackelberg問題可以表示成兩層規(guī)劃問題。
(1)
(2)
(3)
(4)
式中:x以及yi為上級決策者和下級第i個(gè)決策者的決策變量;F,fi為上級決策者和下級第i個(gè)決策者的目標(biāo)函數(shù)。
2.2發(fā)電廠與大用戶定價(jià)博弈的雙層優(yōu)化模型
構(gòu)建發(fā)電廠為模型中上層決策者,大用戶為下層決策者的二層規(guī)劃問題。等效電能——該模型中所有的產(chǎn)品單位均由電量量化,即所有的單價(jià)均表示為單位電能的等量增值價(jià)格,具體等效方式如下:設(shè)用戶i當(dāng)前生產(chǎn)的產(chǎn)品A定價(jià)為Pi,生產(chǎn)一個(gè)A產(chǎn)品所消耗的電量為lA,拋去其余成本消耗,單純從能量角度出發(fā)得到產(chǎn)品等效電價(jià)模型:
(5)
該模型用于描述等效電價(jià)的意義,下文中統(tǒng)一為決策量pi,不再考慮用戶實(shí)際產(chǎn)品單價(jià)等問題。
建立發(fā)電廠與用戶定價(jià)博弈的雙層優(yōu)化模型。
(6)
(7)
(8)
(9)
(10)
(11)
u0=bg×cm
(12)
(13)
式(6)和式(7)分別為發(fā)電廠的最大收益函數(shù)和大用戶i的最大收益函數(shù)。其中,wi為發(fā)電廠給用戶i的實(shí)時(shí)電價(jià);ui為發(fā)電廠配送電能給用戶i時(shí)需要繳納配電網(wǎng)絡(luò)的單位電能配送成本;u0為發(fā)電廠當(dāng)前時(shí)間段發(fā)電成本;li為發(fā)電廠配送給用戶i的單位電能;N為用戶個(gè)數(shù);pi為用戶i將電能轉(zhuǎn)變成的等效零售價(jià)值;Di(pi)為用戶i所產(chǎn)生的等效價(jià)值對應(yīng)的市場需求量[16],本模型中對i的配送電量等于用戶i等效價(jià)值為pi時(shí)產(chǎn)品的市場需求量。
本模型中下層有多個(gè)大用戶,均有自己的決策變量pi,設(shè)各用戶將電能轉(zhuǎn)化為的商品市場需求量不受其他用戶的決策影響,用電用戶i對應(yīng)的市場需求量Di只和pi有關(guān),即Di=Di(pi)[16]。
為便于對比非合作博弈與合作博弈的區(qū)別,將建立理想全局最優(yōu)收益模型。
2.3理想狀態(tài)下全局最優(yōu)收益模型
均衡解建立在各方滿足理性經(jīng)濟(jì)人假設(shè)[12]的非合作博弈狀態(tài)下,全局最優(yōu)解則建立在各參與者完全信任的合作博弈狀態(tài),所有參與者均在同一決策級別,該狀態(tài)僅在各方均喪失理性經(jīng)濟(jì)人假設(shè)且相互完全合作時(shí)存在,因此本文稱該狀態(tài)為理想全局最優(yōu)狀態(tài),模型如下。
(14)
(15)
(16)
(17)
(18)
(19)
(20)
2.4雙層規(guī)劃問題的求解
模型(6)~(13)中有多個(gè)下層目標(biāo),反饋函數(shù)不能確定,而上層決策變量wi范圍已知,故采用混沌搜索的優(yōu)化算法來求解模型?;煦缢阉魉惴ň哂斜闅v性,初值敏感性等特點(diǎn),能以概率1求解整數(shù)規(guī)劃問題。二層規(guī)劃的混沌搜索算法基本思想是將上層決策變量作為混沌變量傳遞給下層,下層通過SQP單層優(yōu)化求解,本文方法為Chaos-SQP法[18],算法的基本求解步驟如下:
① 利用公式y(tǒng)i,n+1=4yi,n(1-yi,n)分別賦予H個(gè)不同的初值yi,0(其中yi,0不能為0,0.25,0.5,0.75,1)產(chǎn)生H個(gè)區(qū)間[0,1]內(nèi)的混沌變量{yi,n};
② 將上層決策變量wi∈[ai,bi],轉(zhuǎn)化成屬于[0,1]的混沌變量xi,n=(ai-μ1)+(bi-ai+μ2)yi,n的形式,其中μ1,μ2為極小的正數(shù),且μ2>μ1;
③ 設(shè)k=0,迭代數(shù)為M,并賦予上層目標(biāo)函數(shù)公式(6)一個(gè)較小的數(shù)F*;
④ 將②中得到的上層參數(shù)xi,k帶入下層規(guī)劃,利用SQP方法求解下層規(guī)劃問題,得到當(dāng)前最優(yōu)解yi,k,將yi,k返回上層目標(biāo)得到上層目標(biāo)函數(shù)Fk;
3仿真分析
本文算例設(shè)定為發(fā)生在一個(gè)單位時(shí)間周期t=24h中,最上層的博弈決策方法選擇建立在理性經(jīng)濟(jì)人假設(shè)下。
以一個(gè)由一個(gè)供電商和3個(gè)用戶組成的直供電網(wǎng)絡(luò)作為實(shí)例研究,即i=1,2,3,且3個(gè)用戶是獨(dú)立不合作的。設(shè)發(fā)電廠將電能配送給3個(gè)用戶所需繳納的配送成本分別為u1=0.05元/kWh,u2=0.07元/kWh,u3=0.08元/kWh。發(fā)電廠當(dāng)前時(shí)間段所購動力煤總成本cm=0.000 3元/g,該發(fā)電廠機(jī)組綜合供電煤耗bg=330g/kWh。發(fā)電廠配送給用戶的電能協(xié)議最低配送量分別為l1=2 000kWh,l2=2 000kWh,l3=3 000kWh,發(fā)電廠現(xiàn)階段用于大用戶直購電的最大配電量L=30 000kWh,發(fā)電廠對于用戶的電能價(jià)格范圍為0.2元≤w1≤0.3元;0.2元≤w2≤0.35元;0.2元≤w3≤0.35元。
用電用戶i在當(dāng)前時(shí)間周期t所產(chǎn)生的等效價(jià)值對應(yīng)的市場需求量模型[16]分別設(shè)為
D1=20 000-400p1;
D1=25 000-500p2;
D1=30 000-600p3
其中20 000、25 000、30 000分別為各產(chǎn)品的最大潛在需求量,400、500、600為各產(chǎn)品定價(jià)銷量遞減系數(shù),用戶對電能價(jià)值等效轉(zhuǎn)化率滿足1.1<λi<1.5。
輸入混沌變量數(shù)N=200,最大迭代步數(shù)M=120,初始F*=10,變量放大參數(shù)a1=a2=a3=0.2,b1=0.3,b2=b3=0.35,μ1=10-6,μ2=10-5,應(yīng)用混沌搜索算法求得Stackelberg博弈模型下各方均衡解及各方收益如表1、表2所示。
表1 Stackelberg博弈模型下各方最優(yōu)決策
表2 Stackelberg博弈模型下各方收益情況
將表2所得的收益數(shù)據(jù)用于理想狀態(tài)全局最優(yōu)收益模型(14)中,可求得全局最優(yōu)解以及應(yīng)用全局最優(yōu)解時(shí)各方理想最優(yōu)收益情況如表3、表4所示。
表3 理想全局最優(yōu)模型下各方最優(yōu)決策
表4 理想全局最優(yōu)模型下各方收益情況
經(jīng)比較,在理想狀態(tài)下參與者均喪失理性經(jīng)濟(jì)人假設(shè)時(shí),П1>П,系統(tǒng)中發(fā)電廠、用戶收益較Stackelberg博弈都有所提高,然而全局最優(yōu)解出現(xiàn)的前提是參與者均喪失理性經(jīng)濟(jì)人假設(shè)且信息完全共享相互完全合作,這是一個(gè)理想狀態(tài),該定價(jià)狀態(tài)對于發(fā)電方具有一定風(fēng)險(xiǎn),即用戶因脫離理想狀態(tài)重獲理性經(jīng)濟(jì)人假設(shè)進(jìn)一步追求自身利益最大化,可以驗(yàn)證,原上層決策者發(fā)電廠依然取采用完全合作的全局最優(yōu)定價(jià)決策w1=0.266元,w2=0.292元,w3=0.227元,下層決策者即用戶因重獲理性經(jīng)濟(jì)人假設(shè),為追求自身更大收益選擇背離與供電方的完全合作,由公式(7)求解各自最優(yōu)決策,各用戶背離發(fā)電廠時(shí)的最優(yōu)策略及各方收益如表5、表6所示。
表5 用戶背離合作狀態(tài)各用戶最優(yōu)決策
表6 用戶背離合作狀態(tài)下各方收益情況
經(jīng)比較,當(dāng)用戶重獲理性經(jīng)濟(jì)人假設(shè)選擇背離發(fā)電廠時(shí),各用戶收益較理想全局最優(yōu)狀態(tài)均有提高,發(fā)電廠收益極大降低,發(fā)電廠主導(dǎo)權(quán)完全喪失。
表7 單一原始電價(jià)成本下的各方收益情況
由表7可知,理想全局最優(yōu)狀態(tài)時(shí)發(fā)電廠收益最高,用戶收益仍有上升空間,因理性經(jīng)濟(jì)人假設(shè)的存在,用戶在利益的驅(qū)使下會選擇背離發(fā)電廠,導(dǎo)致發(fā)電廠收益由2 266.5元降至1 625.6元,遠(yuǎn)小于Stackelberg博弈下的收益2 050.4元,該狀態(tài)對發(fā)電廠極其不利。作為上層決策者的發(fā)電廠意識到用戶重獲理性經(jīng)濟(jì)人假設(shè),又因自身理性經(jīng)濟(jì)人假設(shè)的存在,在利益的驅(qū)使下會選擇停止與用戶合作,最終選擇對于自身有利的非合作Stackelberg博弈,如圖1所示。
圖1 上層定價(jià)模式選擇的博弈過程
Stackelberg博弈規(guī)劃下,上下層各方達(dá)到均衡狀態(tài)。雖然各方收益均較系統(tǒng)理想最優(yōu)解有所損失,但在該定價(jià)狀態(tài)下,每一個(gè)理性的參與者都不會有單獨(dú)改變策略的沖動,且對于主導(dǎo)方發(fā)電廠來說,該狀態(tài)有較高收益,且風(fēng)險(xiǎn)最低。
綜上所述,在上述實(shí)際算例中,就主從關(guān)系的直購電收益對比可知,Stackelberg博弈雙層規(guī)劃所得全局均衡解更適合主導(dǎo)方發(fā)電廠的發(fā)展需要。
4結(jié)論
本文基于博弈論分析了發(fā)電站、大用戶在直購電交易過程中的利益關(guān)系,在《通知》[1]要求的平等自愿等基礎(chǔ)上,通過建立發(fā)電廠電價(jià)和大用戶等效電能定價(jià)之間的博弈模型。采用混沌優(yōu)化算法,求得建立在博弈基礎(chǔ)上的收益均衡定價(jià)策略,并對比合作與非合作狀態(tài)下的全局最優(yōu)解。
研究結(jié)果表明:利用Stackelberg博弈所得的全局均衡定價(jià)策略為最適合主從架構(gòu)的直購電市場交易模式的定價(jià)狀態(tài),參與者在當(dāng)前時(shí)間段不會再為自身收益最大化而改變策略。實(shí)際的直購電市場中表現(xiàn)為:上層決策者發(fā)電廠處于完全無風(fēng)險(xiǎn)且高收益的穩(wěn)定狀態(tài),下層決策者即用戶對該定價(jià)狀態(tài)表示接受,各方收益均衡,直購電交易穩(wěn)定可持續(xù)。
值得注意的是,對于合作博弈還存在許多可行的控制及激勵機(jī)制以降低上層決策者的決策風(fēng)險(xiǎn),進(jìn)一步提高市場整體收益。
參考文獻(xiàn)
[1]國家能源局綜合司, 工業(yè)和信息化部辦公廳. 關(guān)于規(guī)范電力用戶與發(fā)電企業(yè)直接交易的通知[Z]. 國能綜監(jiān)管[2013]506號.
[2]尤毅, 劉東, 于文鵬, 等. 主動配電網(wǎng)技術(shù)及其進(jìn)展[J]. 電力系統(tǒng)自動化, 2012, 36(18): 10-16.
[3]Ferrero R W, Rivera J F. Application of game with in complete information for pricing electricity in deregulated power pool[J]. IEEE Trans on Power Systems, 1998, 13(1): 1056-1061.
[4]Wen F S, David A K. Optimal biddings strategy and modeling of in complete information among competitive generator[J]. IEEE Trans on Power Systems, 2001, 16(4): 1123-1132.
[5]譚忠富, 柏慧, 李莉, 等. 電力用戶從發(fā)電商購電定價(jià)的雙邊貝葉斯動態(tài)博弈學(xué)習(xí)模型[J]. 華東電力, 2009, 37(3): 384-388.
[6]孫波, 施泉生. 利潤均衡下大用戶直購的電價(jià)設(shè)計(jì)模型分析[J]. 華東電力, 2013, 41(1): 47-49.
[7]羅琦, 呂林. 大用戶直購電電價(jià)中過網(wǎng)費(fèi)的計(jì)算方法[J]. 電力科學(xué)與工程, 2008, 24(4): 38-41.
[8]胡江溢, 陳西穎. 對大用戶直購電交易的探討[J]. 電網(wǎng)技術(shù), 2007, 31(24): 40-45.
[9]雷霞, 劉俊勇, 黨曉強(qiáng). 對電力大用戶定價(jià)模式的研究[J]. 電力系統(tǒng)及其自動化學(xué)報(bào), 2010, 22(3): 61-66.
[10]王雁凌, 孫健, 李艷君. 大用戶直購電量模型研究[J]. 電力系統(tǒng)保護(hù)與控制, 2010 (13): 1-5.
[11]陳皓勇, 張森林, 張堯. 電力市場中大用戶直購電交易模式及算法研究[J]. 電網(wǎng)技術(shù), 2008, 32(21): 85-90.
[12]李幫義, 王玉燕. 博弈論及其應(yīng)用[M]. 北京: 機(jī)械工業(yè)出版社, 2010.
[13]常良峰, 盧震, 黃小原. 供應(yīng)鏈渠道協(xié)調(diào)中的Stackelberg主從對策[J]. 控制與決策, 2003, 18(6): 651-660.
[14]亞當(dāng)·斯密. 國民財(cái)富的性質(zhì)和原因的研究(下卷)[M]. 北京:商務(wù)印書館,1996, 25.
[15]盛昭瀚. 主從遞階決策論——STACKELBERG問題[M]. 北京: 科學(xué)出版社, 1998.
[16]鄧冬婭, 黎志成. 市場需求預(yù)測的定性模擬研究[J]. 武漢理工大學(xué)學(xué)報(bào):信息與管理工程版, 2003, 25(3): 175-178.
[17]謝瑛, 譚忠富, 程晉,等. 節(jié)能減排調(diào)度環(huán)境下燃煤電廠發(fā)電成本分析[J]. 電網(wǎng)技術(shù), 2011, 35(2): 137-142.
[18]滕春賢, 李智慧. 二層規(guī)劃的理論與應(yīng)用[M]. 北京: 科學(xué)出版社,2002: 84-91.
夏煒(1990—),男,碩士研究生,研究方向?yàn)橹鲃优潆娋W(wǎng)、電力市場及博弈論應(yīng)用研究,E-mail:996124403@qq.com;
呂林(1963—),男,博士,教授,研究方向?yàn)榕潆娋W(wǎng)自動化,E-mail:lvlin@scu.edu.cn。
(責(zé)任編輯:林海文)
摘要:大用戶向發(fā)電企業(yè)直接購電交易中,電費(fèi)及大用戶產(chǎn)品等效價(jià)格的制定共同影響各方收益。為找尋最合適的定價(jià)狀態(tài),提出將直接交易電價(jià)和產(chǎn)品等效電價(jià)作為發(fā)電企業(yè)和用戶的決策變量,基于博弈論的思想建立了以系統(tǒng)各參與者收益達(dá)到最優(yōu)均衡狀態(tài)為目標(biāo)的完全信息非合作的雙層規(guī)劃模型;并在該雙層模型基礎(chǔ)上構(gòu)建了以系統(tǒng)最優(yōu)為目標(biāo)的全局優(yōu)化模型。仿真結(jié)果表明,在直購電交易過程中,各參與者滿足理性經(jīng)濟(jì)人假設(shè)時(shí),所得Stackelberg均衡解更適合主導(dǎo)方發(fā)電廠的發(fā)展需要,市場呈現(xiàn)出更強(qiáng)的穩(wěn)定性與可持續(xù)性。
關(guān)鍵詞:定價(jià);雙層優(yōu)化;納什均衡;直購電;主動配電網(wǎng)
Abstract:The electricity pricing and the products price for large customers both affect the benefits of all participants in the course of the direct power purchase. In order to find the best pricing status, the electricity pricing and the products price are considered as the decision-making variables for the generation company and the large customers. The complete information non-cooperation bi-level programming model is built to achieve the equilibrium of all participants in the system based on game theory, and the Pareto model based on the two-layer model is built. Simulation result shows that the balancing solution of Stackelberg optimization method is better than that of the Pareto optimization method with much more stability and sustainability when all participants are rational agents in the course of the direct power purchase.
Keywords:pricing; bi-level optimization; Nash equilibrium; direct power purchase; active distribution network
作者簡介:
收稿日期:2014-06-06
基金項(xiàng)目:國家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)(2014 AA051901)
文章編號:1007-2322(2015)03-0071-05
文獻(xiàn)標(biāo)志碼:A
中圖分類號:TM73