付艷蘭,趙雪霖,劉鎧誠,何光宇
(1.海南電網(wǎng)公司,海口市 570273;2.電力系統(tǒng)國家重點實驗室(清華大學電機系),北京市 100084; 3.上海交通大學電機系,上海市 200240)
?
基于演化算法和討價還價博弈的多目標最優(yōu)潮流研究
付艷蘭1,趙雪霖2,劉鎧誠2,何光宇3
(1.海南電網(wǎng)公司,??谑?570273;2.電力系統(tǒng)國家重點實驗室(清華大學電機系),北京市 100084; 3.上海交通大學電機系,上海市 200240)
針對電力系統(tǒng)的多目標最優(yōu)潮流問題,首先通過遺傳算法取得帕累托解集,從而充分反映出不同優(yōu)化目標之間相互影響、相互背離的內在關系,在此基礎上利用納什討價還價博弈方法選取全局最優(yōu)解。探討同時考慮發(fā)電費用(或發(fā)電煤耗)最小和系統(tǒng)網(wǎng)損最小的多目標最優(yōu)潮流問題,首先驗證該問題滿足討價還價博弈公理,再通過強度帕累托演化算法(strong Pareto evolution algorithm 2, SPEA2)求解得到帕累托前沿,保證收斂速度較快且帕累托前沿分布均勻,最后基于納什討價還價博弈求得最優(yōu)解,解決了不同目標函數(shù)之間可能存在的矛盾。該文通過對IEEE 14節(jié)點系統(tǒng)的算例計算,驗證了該方法的有效性。
多目標;最優(yōu)潮流;納什討價還價博弈;遺傳算法
電力系統(tǒng)最優(yōu)潮流是通過對控制變量的優(yōu)化選擇,在滿足系統(tǒng)所有約束條件的前提下,使得系統(tǒng)運行效益的某一給定的目標函數(shù)最優(yōu)[1-2]。由于電力系統(tǒng)單獨優(yōu)化上述某一運行效益(如單獨優(yōu)化發(fā)電成本或單獨優(yōu)化系統(tǒng)網(wǎng)損)時,都不一定是系統(tǒng)的最佳運行方式,只有同時優(yōu)化多個目標時才更具有實際意義,因此許多學者針對多目標最優(yōu)潮流計算做出很多研究,并取得了開創(chuàng)性的研究成果,如文獻[3-4]同時考慮機組燃料費用和系統(tǒng)有功網(wǎng)損為目標函數(shù)情況下的最優(yōu)潮流計算,文獻[5-6]則以有功網(wǎng)損和發(fā)電總耗量為目標函數(shù)進行多目標最優(yōu)潮流計算。
求解多目標最優(yōu)潮流問題一般先將多目標優(yōu)化問題轉化為單目標優(yōu)化問題,再進一步求解該單目標優(yōu)化問題。如文獻[7]引入模糊集理論將多目標優(yōu)化問題轉化為單目標優(yōu)化問題,再進一步與免疫禁忌混合算法相結合進行求解。文獻[8]利用目標滿意度的隸屬度函數(shù)概念進行目標的多對單轉化,并采用內點法求解。然而這些轉化方法都沒有充分反映出不同優(yōu)化目標之間的相互影響、相互背離的內在關系,如要獲得更小的發(fā)電成本,必然使成本系數(shù)低的機組更多出力,從而破壞了系統(tǒng)整體穩(wěn)定性,即經(jīng)濟性與穩(wěn)定性難以兼顧。文獻[9]在非支配排序遺傳算法(non-dominated sorting genetic algorithm,NSGA)的基礎上,采用NSGA-II[10]算法,獲得優(yōu)質廣泛的帕累托前沿,反映出了多目標優(yōu)化的不同目標之間相互矛盾的關系,但文章認為最終需要決策者根據(jù)實際情況從帕累托解集中選擇需要的方案,而未能給出更為充分的分析和更有說服力的結果。因此,本文首先采用遺傳算法中的強度帕累托演化算法(strong Pareto evolution algorithm 2, SPEA2)[11]求解多目標優(yōu)化的帕累托前沿,充分反映出不同優(yōu)化目標間的內在關系,再進一步引入博弈的思想,將不同的優(yōu)化目標視為博弈者,各優(yōu)化目標間的協(xié)調過程則可視為博弈者之間的討價還價過程。若此博弈過程滿足Nash公理,則可求出該博弈問題的唯一解,從而使最優(yōu)潮流在發(fā)電成本和網(wǎng)損等不同的優(yōu)化目標間取得平衡。
本文建立的多目標最優(yōu)潮流模型中同時考慮了2個目標:發(fā)電費用(或發(fā)電煤耗)最??;系統(tǒng)網(wǎng)損最小。目標函數(shù)如(1)式和(2)式所示:
(1)
(2)
約束條件:
(1)潮流方程:
(3)
(2)發(fā)電機節(jié)點有功上下限約束:
(4)
(3)發(fā)電機節(jié)點無功上下限約束:
(5)
(4)節(jié)點電壓的上下限約束:
(6)
上述多目標最優(yōu)潮流模型希望能同時優(yōu)化“發(fā)電費用”和“網(wǎng)損”這2個指標。這2個指標相互聯(lián)系、相互影響,既不完全一致,也不完全背離。從數(shù)學上看,二者實質存在著某種“競爭-合作”關系。因此將“發(fā)電費用”和“網(wǎng)損”看作2個互相競爭的談判單位所追求的目標,它們可選擇的策略就是發(fā)電機節(jié)點的有功功率和電壓控制。因此,采用博弈論中的討價還價博弈方法解決這個問題。
2.1Nash公理模型
在討價還價過程中,假設利益雙方都是理性的,且對于對方可能的策略及收益有著完全的了解。對于這類討價還價問題,Nash提出了4條公理,用于求出一個博弈雙方都可以接受的“合理”的解。下面對這些公理及其意義進行闡述,并驗證該多目標最優(yōu)潮流模型滿足這4條公理。
(1)帕累托有效性:一個雙方均可接受的結果不能被其他結果所“優(yōu)超”,即不能有其他結果使雙方均獲得更大的收益。即討價還價博弈問題的結果一定在其所對應的多目標優(yōu)化問題的帕累托前沿上。在該多目標最優(yōu)潮流模型中,將“發(fā)電費用”和“網(wǎng)損”看作2個互相競爭的談判單位所追求的目標,一個雙方均可接受的結果,一定不能有其他的結果既獲得更少的發(fā)電費用又獲得更少的網(wǎng)損,即該討價還價問題的結果一定在其所對應的雙目標優(yōu)化問題的帕累托前沿上。
(2)對稱性:對稱性是指博弈方的討價還價結果與雙方?jīng)Q策的順序無關,只由博弈雙方的收益函數(shù)決定。即當博弈方收益空間完全相同時,作為2個理性的對局者,沒有理由不對等地分配它們的收益。在該多目標最優(yōu)潮流模型中,討價還價結果與發(fā)電費用和網(wǎng)損的決策順序無關,滿足對稱性。
(3)等價收益的不變性:對任一方的收益函數(shù)作線性變換,則最終合理解也應做同樣的線性變換。這一公理表明了博弈雙方合理解的相對位置不隨收益數(shù)值大小的改變而改變。對該多目標最優(yōu)潮流模型,無論對發(fā)電費用還是網(wǎng)損作線性變換,最終合理解也都是做同樣的線性變換,故滿足等價收益的不變性。
(4)無關選擇的獨立性:假設U和U′是2個討價還價問題,U′的收益空間是U的收益空間的子集,則U的合理解必然也是U′的合理解。即對博弈者來說,在選擇某個合理解的時候,與合理解無關的選擇不會影響最終博弈的結局。對該多目標最優(yōu)潮流問題,假設約束條件變化,形成討價還價問題1和討價還價問題2,如果討價還價問題2的收益空間是討價還價問題1的收益空間的子集,那么問題1的合理解必然也是問題2的合理解。該討價還價問題滿足無關選擇的獨立性。
Nash證明了在滿足上述公理的前提下,討價還價問題存在下述唯一的合理解:
(7)
式中:f1、f2為博弈雙方的收益函數(shù),(d1,d2)表示博弈雙方可能會得到的最差收益。一般來講,若雙方都是理性的博弈者,且均對自身利益有著相同的偏好程度,則它們總是希望選擇一個離最壞情況最遠的解,因而兩人談判的結果即為最終的博弈解。
2.2 基于討價還價博弈的多目標最優(yōu)潮流模型
對于發(fā)電費用和網(wǎng)損這2個目標,采用討價還價問題模型求解Nash均衡解,則可等價于求解下述二次優(yōu)化問題:
max(f1-F1max)(f2-F2max)
(8)
式中:F1max和F2max分別表示發(fā)電費用和煤耗在約束條件下的最大值,可先由單目標優(yōu)化分別求解得出。由Nash公理1可知,均衡點一定在多目標優(yōu)化問題的帕累托前沿上取得。由于二次優(yōu)化問題求解較為復雜,因此,可先求出原多目標優(yōu)化問題的帕累托前沿,再從中搜索滿足式(7)條件的解x0。選用SPEA2求解該雙目標最優(yōu)潮流問題的帕累托前沿。
2.3 基于SPEA2求解帕累托前沿
SPEA采用了協(xié)同進化規(guī)則的適應度分配策略和基于帕累托支配關系的小生境機制,與其他多目標演化算法相比具有更強的優(yōu)化能力,而且需要設置的參數(shù)較少,是目前公認比較好的多目標問題優(yōu)化方法,但存在適應度分配不精確以及多樣性差等缺點[12]。針對上述缺點,SPEA2算法對SPEA算法進行了改進,成功地把精確的適應度分配策略、密度估計技術、增強截斷方法結合在一起,收斂速度加快、帕累托最優(yōu)解分布均勻。將發(fā)電機的有功功率和電壓作為控制變量進行編碼,不等式約束的處理采用罰函數(shù)的方式。SPEA2的算法流程如圖1所示。
圖1 SPEA2程序流程圖Fig.1 Flow chart of SPEA2 program
步驟簡介如下:
(1)初始化種群。采用隨機生成一定數(shù)量個體的方式,初始化種群P和備用種群A,并混合種群A和P,得到新的種群AP。
(2)潮流計算。通過定雅克比矩陣法進行潮流計算,得到狀態(tài)變量電壓U和相角θ的值。
(3)計算適應值和罰函數(shù)。計算種群AP的適應值和罰函數(shù)。適應值即目標函數(shù)值f1和f2,罰函數(shù)值為違反約束的值,即查看有功、無功和電壓越限情況。
(5)計算函數(shù)值F。F=R+D,F(xiàn)的值越小越好。
(6)選擇、交叉與變異。選擇函數(shù)值F最小的前一半個體,生成新種群A。對新種群A進行模擬二項式交叉操作,進而生成新種群P。對新種群P進行高斯變異操作,再次生成新種群P。
(7)終止條件。如果t 本文算例采用IEEE#14母線系統(tǒng),功率基準值為100 MVA,母線電壓上、下界分別為 1.1 和 0.95(標幺值),具體參數(shù)見文獻[13]。發(fā)電機的經(jīng)濟參數(shù)見表1,其中下限、上限代表有功功率下限和上限,也就是在進行最優(yōu)潮流計算時,有功源的上下限約束,此處為有名值。 根據(jù)2.3節(jié)中的SPEA2方法求解帕累托前沿,選取種群數(shù)量為50,最大遺傳代數(shù)為200,算法以達到最大代數(shù)為終止條件。在此基礎上,基于納什討價還價博弈尋優(yōu),找出最優(yōu)點,最優(yōu)解的結果在圖2上標出,最終得出的結果是發(fā)電費用為28.345 5萬元,網(wǎng)損是0.034 82 pu。相應的潮流計算結果如表2所示。 表1 算例發(fā)電機經(jīng)濟參數(shù) Table 1 Economic parameters of generator in example 圖2 基于遺傳算法的帕累托前沿與討價還價博弈的最優(yōu)解Fig.2 Optimal solution based on GA’s Pareto front and Nash Bargaining Game 將轉化成單目標優(yōu)化問題后求得的最優(yōu)解與基于演化計算和討價還價博弈的多目標最優(yōu)潮流計算比較,如表3所示。通過比較以式(9)和式(10)為目標函數(shù)的單目標算法,可看出將多目標最優(yōu)潮流轉化成單目標最優(yōu)潮流問題時,不同的權重系數(shù)會帶來不同的結果。采用式(9)的單目標函數(shù)進行計算時,可以獲得較少的發(fā)電費用,但網(wǎng)損較大,而采用式(10)的單目標函數(shù)進行計算時,可以獲得很少的網(wǎng)損,但發(fā)電費用較多。實際上發(fā)電費用與網(wǎng)損之間并沒有明確的函數(shù)關系,因此單純把二者加和所得的值進行最優(yōu)化求解,本身物理含義不明確,且無法確定權重系數(shù)。但是討價還價博弈算法則是在得到該雙目標優(yōu)化的帕累托前沿的基礎上,進行討價還價博弈,確定對博弈雙方都最優(yōu)的解,可以在獲得較少的發(fā)電費用的同時,獲取較小的網(wǎng)損,意義明確,結果可靠。因此,討價還價博弈在求解該多目標最優(yōu)潮流問題上具有優(yōu)越性。 表2 潮流計算結果 Table 2 Power flow calculation results minf0=f1+f2 (9) minf0=f1/max(f1)+f2/max(f2) (10) 表3 最優(yōu)解比較 Table 3 Comparison of optimal solutions 本文提出的基于演化計算和討價還價博弈的多目標最優(yōu)潮流算法,可以在考慮潮流平衡方程、有功上下限、無功上下限和電壓上下限等約束的基礎上,對模型的發(fā)電費用和網(wǎng)損進行優(yōu)化。SPEA2算法可以獲得較好的帕累托前沿,充分反映了2個目標函數(shù)之間相互影響又相互背離的關系,博弈方法進一步解決了這種不同目標函數(shù)之間的矛盾并得到最優(yōu)解,具有明確的物理意義。通過算例表明了該算法的可行性與有效性。 [1]袁貴川,王建全,韓幀祥.電力市場下的最優(yōu)潮流[J].電網(wǎng)技術, 2004,28(5):13-17. Yuan Guichuan, Wang Jianquan, Han Zhenxiang. Optimal power flow under electricity market[J].Power System Technology,2004,28(5):13-17. [2] 王彬, 何光宇, 盧建剛, 等. 考慮電網(wǎng)運行狀態(tài)不確定性的最優(yōu)潮流研究[J]. 電力建設, 2014,35(10): 1-6. Wang Bin, He Guangyu, Lu Jiangang, et al. Optimal Power Flow with Considering Operation State Uncertainty of Power System[J]. Electric Power Construction, 2014, 35(10): 1-6. [3] Wei H, Sasaki H, Kubokawa J. An interior point nonlinear programming for optimal power flow problems with a novel data structure[J]. IEEE Transactions on Power Systems, 1997, 13(3):870-877. [4] Yan Wei, Yu Juan, Yu D C, et al. A new optimal reactive power flow model in rectangular form and its solution by predictor corrector primal dual interior point method[J]. IEEE Transactions on Power Systems, 2006,21(1):61-67. [5] 劉明波,段曉軍,趙艷. 多目標最優(yōu)潮流問題的模糊建模及內點解法[J].電力系統(tǒng)自動化,1999,23(14):37-40. Liu Mingbo,Duan Xiaojun,Zhao Yan. Fuzzy modeling and interior point algorithm of multi-objective OPF problem[J]. Automation of Electric Power Systems,1999,23(14):37-40. [6] 卓峻峰,趙冬梅.基于混沌搜索的多目標模糊優(yōu)化潮流算法[J].電網(wǎng)技術,2003,27(2):41-44. Zhuo Junfeng, Zhao Dongmei. A chaos optimization based algorithm for multi-objective fuzzy optimal power flow[J]. Power System Technology, 2003,27(2):41-44. [7] 唐忠, 蔡智慧, 黎文華. 基于免疫禁忌混合算法的多目標最優(yōu)潮流計算[J]. 高電壓技術, 2008, 34(9): 1954-1958. Tang Zhong, Cai Zhihui, Li Wenhua. Multi-objective optimal power flow calculation based on immune/Tabu search hybrid algorithm [J]. High Voltage Engineering, 2008, 34(9): 1954-1958. [8] 衛(wèi)志農(nóng), 向育鵬, 孫國強, 等. 計及碳排放含有碳捕集電廠電網(wǎng)的多目標動態(tài)最優(yōu)潮流[J]. 電網(wǎng)技術, 2012, 36(12): 11-17. Wei Zhinong, Xiang Yupeng, Sun Guoqiang, et al. Carbon emission-considered multi-objective dynamic optimal power flow of power system containing carbon-capture plant[J].Power System Technology,2012,36(12):11-17. [9] 葉承晉, 黃民翔. 考慮暫態(tài)穩(wěn)定性的多目標最優(yōu)潮流[J]. 中國電機工程學報, 2013, 33(10): 137-144. Ye Chengjin, Huang Minxiang. Multi-objective optimal power flow considering transient stability[J].Proceedings of the CSEE,2013, 33(10):137-144. [10] Deb K, Pratap A, Agarwal S, et al. A fast and elitist multiobjective genetic algorithm: NSGA-II[J]. IEEE Transactions on Evolutionary Computation, 2002, 6(2): 182-197. [11] Mendoza F, Bernal-Agustin J L, Dominguez-Navarro J A. NSGA and SPEA applied to multiobjective design of power distribution systems[J]. IEEE Transactions on Power Systems, 2006, 21(4): 1938-1945. [12] Zitzler E,Laumanns M,Thiele L. SPEA2: Improving the strength Pareto evolutionary algorithm[R], 2001. [13] 張伯明, 陳壽孫. 高等電力網(wǎng)絡分析[M]. 北京:清華大學出版社,1996. (編輯:張媛媛) Multi-Objective Optimal Power Flow Based on Evolutionary Algorithm and Bargaining Game FU Yanlan1, ZHAO Xuelin2, LIU Kaicheng2, HE Guangyu3 (1. Hainan Power Grid Corporation, Haikou 570273, China;2. State Key Laboratory of Power Systems, Department of Electrical Engineering, Tsinghua University, Beijing 100084, China;3. Department of Electrical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China) To solve the multi-objective optimal power flow (OPF) problem, genetic algorithm (GA) was used to find the Pareto front, and fully reflect the interaction and deviation internal relation of different optimal objective functions. On this basis, Nash Bargaining Game was used to get the global optimal solution. This paper discussed the multi-objective OPF problem with considering the minimum generation cost (or coal consumption) and the minimum system loss simultaneously. This paper firstly verified that the problem could satisfy the Nash Bargaining axiom, secondly obtained the Pareto front by strong Pareto evolution algorithm 2 (SPEA2), which could ensure faster convergence rate and more uniform Pareto front, and then used Nash Bargaining to find the optimal solution and solve the possible contradiction between the different objective function. Case study on IEEE 14-bus system verified the effectiveness of the proposed algorithm. multi-objective; optimal power flow (OPF); Nash Bargaining Game; genetic algorithm 國家高技術研究發(fā)展計劃項目(863計劃)(2012AA050201)。 TM 73 A 1000-7229(2015)05-0020-05 10.3969/j.issn.1000-7229.2015.05.004 2014-12-01 2015-02-04 付艷蘭(1983),女,碩士,主要研究方向為電力系統(tǒng)自動化; 趙雪霖(1991),女,碩士研究生,主要研究方向為電器節(jié)能; 劉鎧誠(1988),男,博士研究生,研究方向為無功電壓自動控制、智能調度; 何光宇(1972),男,博士、教授、博士生導師,主要研究方向為智能調度與智能電網(wǎng)、優(yōu)化技術及其在電力系統(tǒng)中的應用。 Project Supported by the National High Technology Research and Development of China (863 Program)(2012AA050201).3 算例分析
4 結 論