張正文,李 津,孫樹娟
(國網(wǎng)雄安新區(qū)供電公司,河北 保定 071600)
隨著云服務(wù)在互聯(lián)網(wǎng)上日益占據(jù)主導(dǎo)地位,以及基于云服務(wù)的物聯(lián)網(wǎng)的出現(xiàn)[1-4]。預(yù)計到2021年,云數(shù)據(jù)中心流量將占數(shù)據(jù)中心總流量的95%[5]。隨著萬物物聯(lián)理念的提出,電網(wǎng)作為傳統(tǒng)行業(yè),也在積極的對自身進(jìn)行升級和改革[6-7]。為了解決海量數(shù)據(jù)處理造成的流量大、時間長等問題[8-9],在此智能電網(wǎng)引入了多站融合的概念,通過將分布密集的變電站建設(shè)運營成為數(shù)據(jù)中心等,從而解決該問題。但一個數(shù)據(jù)中心擁有數(shù)千臺服務(wù)器、存儲設(shè)備、冷卻設(shè)施和電力變壓器,數(shù)據(jù)中心部門估計占全球電力消耗的1.4%。如果直接將變電站轉(zhuǎn)化為數(shù)據(jù)中心,而不是考慮給其分配有限能量,這可能導(dǎo)致發(fā)電站超載,對電網(wǎng)造成嚴(yán)重破壞,同時,還可能剝奪更需要電力的其他數(shù)據(jù)中心的能量。為了克服這一問題,提出了一種針對數(shù)據(jù)中心用電量的博弈論方案(G-Power),其中每個數(shù)據(jù)中心由博弈中的一個參與者表示。該方案的基本思想是根據(jù)數(shù)據(jù)中心的收費優(yōu)先級、關(guān)鍵運行應(yīng)用程序的優(yōu)先級和其他數(shù)據(jù)中心的優(yōu)先級3個指標(biāo)為每個數(shù)據(jù)中心分配最優(yōu)的功率,以達(dá)到公平的功率分配。
在提出的系統(tǒng)中,智能電網(wǎng)控制器(公用事業(yè)公司)負(fù)責(zé)供電,響應(yīng)用戶的用電需求。電力來自與云數(shù)據(jù)中心通信的多個發(fā)電站(雙向通信)。因此,智能電網(wǎng)控制器可以查看每個數(shù)據(jù)中心的電源行為。智能電網(wǎng)和云數(shù)據(jù)中心的系統(tǒng)架構(gòu)如圖1所示。
在提出的系統(tǒng)中,數(shù)據(jù)中心的目標(biāo)是購買最大功率,以便為其存儲的能量充電并處理最大的應(yīng)用程序。這將提高云提供商的利潤。此外,每個數(shù)據(jù)中心都試圖增加其充電狀態(tài)并以自私的方式要求電力,而不考慮計劃用于數(shù)據(jù)中心的有限能源。這可能使發(fā)電站過載,并對電網(wǎng)造成嚴(yán)重?fù)p害。
在這里介紹了G-Power的原理,首先用非合作博弈理論對數(shù)據(jù)中心的功率分配進(jìn)行了建模。因此,考慮對策:G=(I,Si,gaini)i∈T,其中I表示一組玩家(數(shù)據(jù)中心),d1,d2,…,dn,其中n是參與博弈的數(shù)據(jù)中心的數(shù)量。
在提出的方案中,設(shè)計了回報函數(shù)來反映4個主要函數(shù):第1個函數(shù)計算數(shù)據(jù)中心對具有高功率的需求(效用函數(shù));其余3個函數(shù)是優(yōu)先級成本函數(shù),分別計算數(shù)據(jù)中心收費優(yōu)先級的成本、關(guān)鍵應(yīng)用程序優(yōu)先級的成本以及總關(guān)鍵應(yīng)用程序優(yōu)先級的成本。支付函數(shù)包括以下4個函數(shù)。
(1) 效用函數(shù)。在G-Power中,效用函數(shù)被建模為,當(dāng)每個參與者增加其電力需求值時,會獲得更多的利潤。在網(wǎng)絡(luò)研究中常用的效用函數(shù)[16],選擇使用對數(shù)函數(shù)來設(shè)計G-Power的效用函數(shù)。因此,選擇一個效用函數(shù):
γi(xi)=log(xi+1),?i∈I
(1)
式中,xi為玩家di需求的電量。
(2)數(shù)據(jù)中心的費用函數(shù)優(yōu)先權(quán)。該函數(shù)定義了玩家根據(jù)其電量需求xi和其收費優(yōu)先級Dvi支付的懲罰。在提出的方法中,優(yōu)先級是根據(jù)活躍服務(wù)器ASi和玩家di的荷電狀態(tài)SoCi計算的,具體公式見式(2):
(2)
因此,有以下函數(shù):
ρi(xi,Dpi)=xi×Dpi
(3)
(3)關(guān)鍵應(yīng)用程序優(yōu)先級的成本函數(shù)。在這個優(yōu)先級成本函數(shù)中,考慮了一個玩家di的關(guān)鍵運行應(yīng)用程序。在G-Power中,將實時應(yīng)用程序視為關(guān)鍵應(yīng)用程序。該功能基于玩家的電量需求xi及其關(guān)鍵應(yīng)用優(yōu)先Api。將優(yōu)先級Api計算為關(guān)鍵應(yīng)用程序記錄Critical_appsi占總應(yīng)用程序記錄Total_appsi的比率。因此,定義函數(shù)如下:
σi(xi,Ani)=xi×Ani
(4)
(5)
(4)總關(guān)鍵應(yīng)用優(yōu)先級的成本函數(shù)。該優(yōu)先級成本函數(shù)基于玩家功率量需求xi及其總關(guān)鍵應(yīng)用優(yōu)先級TPi。優(yōu)先級TPi是玩家關(guān)鍵應(yīng)用與所有玩家關(guān)鍵應(yīng)用之和的比率。因此,有以下成本函數(shù):
τi(xi,Tpi)=xi×Tpi
(6)
(7)
在定義了玩家di的4個函數(shù)之后,可以得出支付函數(shù):
gaini(xi,x-i)=αiγi(xi)+βiρi(xi,Dpi)+ωiσi(xi,Api)+ψiτi(xi,Tpi)
(8)
其中,x-i={xk}(k∈i)且是除玩家di外的所有玩家的電力需求量(策略)向量。s=(xi,x-i)是策略配置文件。αi,βi,ωi和ψi分別是γi,ρi,σi和τi的玩家偏好系數(shù)。這些參數(shù)的設(shè)置是為了滿足系統(tǒng)的目標(biāo)和要求,例如,當(dāng)ωi值越大,獲得具有高關(guān)鍵應(yīng)用率的玩家和那些具有低關(guān)鍵應(yīng)用比率的玩家的功率之間的差異就越大,反之亦然。
在博弈論中,納什均衡(NE)是一個基本概念,常用于預(yù)測所有參與者的未來行為和確定永久狀態(tài)。這意味著博弈中的每個玩家都沒有興趣改變自己的策略,并執(zhí)行相同的操作。因此,如果存在一個NE,則非合作博弈有一個解。在G-Power的對策G=(I,Si,gaini)i=T中,如果沒有一個玩家能夠通過改變策略來增加其收益,那么一組策略代表一個NE。
(9)
綜上所述,在計算G的對策解之前,證明了NE的存在性和唯一性。
當(dāng)時,每個參與者的策略集是閉有界的。那么,集合Si,?i∈I是緊的。
考慮2點y1,y2∈Si和ε=[0,1]。因此,得到
通過計算s={xi},?i∈I的增益的Hessian矩陣,可以證明的支付函數(shù)的凹性如下:
(10)
(11)
因此,可以看到H(S)對于所有策略s∈S是負(fù)定的,因此,gainxi,x-i)在Si,?i∈I中是嚴(yán)格凹的。 根據(jù)Nikaido-Isoda定理[10],G-Power的博弈G至少具有一個NE。
(2)納什均衡的唯一性。設(shè)u=(u1,u2,…,un)是正參數(shù)的隨機(jī)向量,使用Rosen定理[11]來得到支付函數(shù)的加權(quán)正和,其定義如下:
(12)
這里δ(xi,x-i;u)偽梯度給出的:
(13)
并且
(14)
另外,g的Jacobian矩陣J(xi,x-i;u)可以定義如式(15)所示。
(15)
式中,Bij=uiDij,?i,j∈I。
由此可見,對于所有對稱矩陣是負(fù)定的。因此,函數(shù)是根據(jù)Rosen定理(18)對角線嚴(yán)格凹的。因此,博弈G在其純策略空間中具有唯一的NE,這也符合Rosen定理。
(16)
約束條件為:
為了解決問題(F),使用拉格朗日乘子法使G-Power的函數(shù)在2個不等式約束下最大化。引入了2個拉格朗日乘子λi和li,函數(shù)可定義為式(17):
(17)
因此,對于每個玩家di,G-Power的拉格朗日函數(shù)滿足以下KKT條件,如式(18)所示:
(18)
(19)
在這里條件1和條件2可以用公式(20)和(21)表示:
βiρi(xi,Dpi)+ωiσi(xi,Api)+ψiτi(xi,Tpi≥αi
(20)
(21)
圖2分別使用式(2)、式(5)和式(7)顯示了每個數(shù)據(jù)中心在1 d內(nèi)不同的成本(數(shù)據(jù)中心的費用優(yōu)先級、關(guān)鍵應(yīng)用程序優(yōu)先級和總關(guān)鍵應(yīng)用程序優(yōu)先級)。
圖2 數(shù)據(jù)中心成本變化
可以觀察到,在每個數(shù)據(jù)中心,數(shù)據(jù)中心的收費優(yōu)先級在非高峰時段較低,而在高峰時段較高。這可以解釋為這樣一個事實:數(shù)據(jù)中心沒有太多活動服務(wù)器,在非高峰時間存儲能量,相反,在高峰時間,數(shù)據(jù)中心已對其能量進(jìn)行了充電并擁有大量活動服務(wù)器。另一方面,關(guān)鍵應(yīng)用程序和總的關(guān)鍵應(yīng)用程序優(yōu)先級在非高峰時段較高,而在高峰時段較低。這意味著,與數(shù)據(jù)中心中運行的應(yīng)用程序總數(shù)相比,在高峰時段運行的關(guān)鍵應(yīng)用程序要比在非高峰時段運行的應(yīng)用程序多得多。
圖3描述了使用基于博弈的功率分配方案在一個特定小時內(nèi)(0:00)4個數(shù)據(jù)中心的功率分配??梢钥吹?,G-Power方案根據(jù)每個數(shù)據(jù)中心的優(yōu)先級成本進(jìn)行了公平的分配。
圖3 基于博弈的電量分配
與自私方案的性能比較如圖4所示。
圖4 與自私方案的性能比較
圖4(a)顯示了隨機(jī)選擇的一個數(shù)據(jù)中心,G-Power與自私方案的功率分配比較??梢杂^察到自私方案總是以所需的總功率供應(yīng),而不管數(shù)據(jù)中心有什么關(guān)鍵應(yīng)用或能量消耗。這可能會使電網(wǎng)過載并使發(fā)電站超載。另一方面,在G-Power中分配的能量隨著時間的推移而變化,可能會減少到1.27 MW。這通常發(fā)生在非高峰時段(例如圖4(a)中的3:00),此時數(shù)據(jù)中心正在充電,并且沒有很多正在運行的應(yīng)用程序。此外,它可能會達(dá)到最大值5 MW,如上午11:00和19:00。所呈現(xiàn)的結(jié)果是由于提出的方案中使用的博弈論,該方案考慮到:①每個數(shù)據(jù)中心的活動服務(wù)器和充電狀態(tài);②在數(shù)據(jù)中心運行的關(guān)鍵應(yīng)用程序;③在所有數(shù)據(jù)中心運行的關(guān)鍵應(yīng)用程序,如圖4(b)、圖4(c)和圖4(d)所示。在圖4(b)中顯示了根據(jù)數(shù)據(jù)中心在活動服務(wù)器和充電狀態(tài)方面的收費優(yōu)先級的功率分配值??梢钥吹?,在G-Power中,分配的電力隨著優(yōu)先級的降低而減少。然而,自私方式方案在不考慮任何優(yōu)先級的情況下,總是具有穩(wěn)定的功率分配。此外,圖4(c)和圖4(d)還表明,關(guān)鍵應(yīng)用程序優(yōu)先級和總關(guān)鍵應(yīng)用程序優(yōu)先級分別與功率分配成反比關(guān)系。當(dāng)一個玩家的關(guān)鍵應(yīng)用程序增加時,它的能力就會增強(qiáng),反之亦然。
本文研究了智能電網(wǎng)與云數(shù)據(jù)中心之間的交互作用,以獲得公平的功率分配。將數(shù)據(jù)中心的功率分配建模為一個非合作博弈。證明了納什均衡的存在性和唯一性。然后計算分配給每個玩家的最佳功率。仿真結(jié)果表明,與其他方案相比,該方法能顯著降低電網(wǎng)負(fù)荷。