李素瑩
(廣東電網(wǎng)有限責任公司 佛山供電局,廣東 佛山 528000)
目前在人們的生活中已經(jīng)離不開電力,電力已然成為人類生活的主要能源之一。在這樣的背景下,電力信息化建設發(fā)展迅速,不斷跟隨社會的發(fā)展,擴展電力業(yè)務范圍。在電力業(yè)務擴展的過程中,電力行業(yè)政策隨著市場情況不斷變化,導致電力市場競爭更加激烈,促使電力企業(yè)內(nèi)部建立起完善的電力營銷體系。此外,為滿足社會發(fā)展,人類對電力需求增強,用電量不斷增加,傳統(tǒng)發(fā)電能源逐漸枯竭,新型發(fā)電能源還在研發(fā)當中,導致電力企業(yè)運行面臨嚴峻挑戰(zhàn)。因此,在電力企業(yè)中,提出電力營銷體系。
基于此,相關(guān)領(lǐng)域?qū)W者十分重視電力企業(yè)營銷體系,提出電力營銷一體化模型體系,轉(zhuǎn)變電力營銷模式、用戶角色、硬件設施,從而提高電力企業(yè)營銷工作能力。在電力營銷體系中,引入貝葉斯網(wǎng)絡,挖掘營銷客戶數(shù)據(jù),評估用戶潛在價值,從而根據(jù)用戶特點,提供電力業(yè)務。對目前電力企業(yè)營銷體系進行了分析,發(fā)現(xiàn)電力企業(yè)營銷工作存在工作效率低等工作問題,設計出掌上營銷系統(tǒng),提高電力企業(yè)營銷工作效率。雖然上述方法取得了一定的研究成果,但存在營銷電力節(jié)能業(yè)務精準度較低的問題。針對上述研究存在的問題,提出差異化密度聚類下的電力節(jié)能業(yè)務精準營銷算法,引入差異化密度聚類算法,分析電力節(jié)能用戶分布情況,從而根據(jù)用戶具體情況,為用戶提供節(jié)能業(yè)務營銷服務,提高電力節(jié)能業(yè)務營銷精度。
用戶用電數(shù)據(jù)是以數(shù)據(jù)庫記錄的形式,存儲在電力企業(yè)客戶數(shù)據(jù)庫中。這些數(shù)據(jù)包含姓名、用電量、地址等屬性信息,并由這些屬性信息,組成一個特征向量。除特征向量外,用戶用電數(shù)據(jù),還有一個特定的類別標簽,與屬性相對應?;诖?,將電力企業(yè)客戶信息數(shù)據(jù)庫中,存儲的電力用電數(shù)據(jù)樣本向量記為(,,…,o;),其中:o表示第個屬性的字段;表示屬性總數(shù);表示電力用電數(shù)據(jù)樣本類別。
根據(jù)數(shù)據(jù)屬性,采用決策樹算法,深入挖掘用戶用電數(shù)據(jù)。構(gòu)建電力用戶用電數(shù)據(jù)挖掘決策樹,其構(gòu)建過程如下:
在電力用戶數(shù)據(jù)庫中,存儲的單個用戶數(shù)據(jù),作為決策樹構(gòu)建節(jié)點,判斷選擇的單個用戶數(shù)據(jù)是否屬于同一個類別。當單個用戶數(shù)據(jù)屬于同一個類別時,將該數(shù)據(jù)節(jié)點,記為決策樹樹葉,并用該類別對單個用戶數(shù)據(jù)進行標記。當單個用戶數(shù)據(jù)不屬于同一個類別時,標記該數(shù)據(jù)節(jié)點中最普通的類別,并計算該數(shù)據(jù)節(jié)點的信息量和信息熵,其計算公式如下:
式中:p表示第個電力用戶數(shù)據(jù)樣本,屬于數(shù)據(jù)樣本類別的概率。
根據(jù)公式計算該數(shù)據(jù)節(jié)點的信息量和信息熵的結(jié)果,挑選該數(shù)據(jù)樣本分類屬性,選擇信息量和信息熵值最高的屬性,作為該數(shù)據(jù)節(jié)點的“測試”屬性節(jié)點。依據(jù)“測試”屬性節(jié)點的已知值,創(chuàng)建一個樹的分枝,并根據(jù)這些分枝劃分電力用戶數(shù)據(jù)。
此時,利用該用戶數(shù)據(jù)節(jié)點,根據(jù)“測試”屬性節(jié)點的已知值,長出帶有“測試”屬性的分枝,并讓該用戶數(shù)據(jù)節(jié)點中的“測試”屬性分枝組成集合,判斷集合是否為空集合。
當集合為空集合時,需要在樹上增加一片樹葉,并將其標記為該數(shù)據(jù)節(jié)點的最普通類。按照上述過程,構(gòu)建決策樹,不需要考慮該用戶數(shù)據(jù)節(jié)點的后代節(jié)點。當給定節(jié)點的所有數(shù)據(jù)樣本均屬于類時,即完成決策樹構(gòu)建。
基于此次研究,構(gòu)建的決策樹,即可挖掘出電力企業(yè)客戶數(shù)據(jù)庫中存儲的用戶用電數(shù)據(jù),根據(jù)這些數(shù)據(jù),可以推斷該用戶是否為節(jié)能用戶。
將決策樹算法挖掘到的電力節(jié)能用戶數(shù)據(jù),作為差異化密度聚類對象集,給定對象集的鄰域Υ和領(lǐng)域閾值。從對象集中,選擇任意對象Ψ,作為差異化密度聚類對象集的核心,尋找Ψ的所有密度可達對象。
當Ψ屬于對象集的核心對象時,則差異化密度聚類算法可以找到Υ 和的簇;當Ψ屬于對象集的邊界點時,則Ψ的領(lǐng)域所包含的對象個數(shù)小于閾值,則Ψ不存在密度可達對象,此時,將Ψ標記為噪聲點,記為。其差異化密度聚類如圖1所示。
圖1 差異化密度聚類示意圖Fig. 1 Differentiated density clustering diagram
圖1中,、、、、、均表示差異化密度聚類對象集的核心點,其中,、、表示密度是有連接關(guān)系的;密度直接可達;密度直接可達;密度間接可達。
依據(jù)圖1的差異化密度聚類示意圖,確定的電力節(jié)能用戶分布步驟如下:
步驟1:遍歷挖掘到的電力用戶用電數(shù)據(jù),以一維單元格為目標,組成一維密集單元格集合;
步驟2:按照數(shù)據(jù)維度,直至生成維的候選密集單元格集合H;
步驟3:判斷集合H是否為空集;
步驟4:當∈?時,結(jié)束算法,直接輸出電力用戶數(shù)據(jù)子空間;當∈?時,返回步驟:1。
在空間中,聚集電力用戶用電數(shù)據(jù),確定子空間中的聚類。處理上述過程中,丟失的數(shù)據(jù)對象,并合并空間中的子簇。生成電力用戶用電數(shù)據(jù)聚類描述,確保每一個類別中,至少包含一個區(qū)域集合。至此,完成電力節(jié)能用戶聚類。
根據(jù)此次研究設計的聚類過程,得到的電力節(jié)能用戶分布情況,為非電力節(jié)能用戶提供電力節(jié)能業(yè)務。
依據(jù)此次研究,確定的精準營銷對象,建立電力節(jié)能業(yè)務精準營銷目標函數(shù),需要將其分為用戶用電效益和供電公司收益,分別建立營銷目標函數(shù),其中,用戶用電效益函數(shù)(,)為:
式中:表示用戶的用電量;>0表示目標函數(shù)的參數(shù);>0表示目標函數(shù)約束。
相比用戶用電效益函數(shù),供電企業(yè)函數(shù)包含較廣,且受用戶用電量制約,基于此,建立的供電公司供電收益目標函數(shù)如下式所示:
式中:表示時間;x()表示位用戶在時刻時的用電量;()表示電力企業(yè)銷售商購買的電量;$表示電力企業(yè)供電收益;表示1 d;表示用戶總數(shù)量;∈,表示用戶任意數(shù)量; $()表示位用戶在時刻時購電的電價; ¥()表示電力企業(yè)銷售商購買的電價;表示用戶對電能的需求量;w()表示位用戶在時刻時的約束。
針對此次研究建立的目標函數(shù),所設置的目標函數(shù)約束,將其分為用電量約束和最小用電量約束,如下式所示:
綜合上述計算過程,所建立的電力節(jié)能業(yè)務精準營銷算法流程如下:①初始化電力用戶,挖掘電力用戶用電數(shù)據(jù);②劃分電力用戶用電數(shù)據(jù),選擇用戶中的非節(jié)能用戶;③采用差異化密度聚類,劃分用戶中的非節(jié)能用戶分布情況;④根據(jù)此次研究建立的目標函數(shù),計算用戶是否滿足用電節(jié)能業(yè)務條件;⑤記錄每位用戶的適應個體數(shù)值,尋找最佳最優(yōu)用電節(jié)能業(yè)務對應用戶,并判斷該用戶是否滿足式(4)所示的約束條件;⑥當滿足約束條件時,終止循環(huán),輸出最優(yōu)用戶;當不滿足約束條件時,則返回④繼續(xù)循環(huán)。通過上述步驟,實現(xiàn)電力節(jié)能業(yè)務精準營銷。
為了驗證差異化密度聚類下的電力節(jié)能業(yè)務精準營銷算法的有效性,在Inter Core i5-3470 處理器、8.0 GB內(nèi)存、32位Windows7操作系統(tǒng)下運行。選擇文獻[6]和文獻[7]兩組當前營銷算法,以對比實驗的方式,采用電力節(jié)能業(yè)務,作為此次實驗研究對象。在Matlab 2010b算法仿真軟件上,運行3組營銷算法,對比驗證此次研究的電力節(jié)能業(yè)務精準營銷算法,為用戶提供電力節(jié)能業(yè)務精準程度。
根據(jù)此次實驗選擇的3組營銷算法,所設計的營銷算法在仿真軟件上運行環(huán)境如圖2所示。
圖2 算法運行環(huán)境Fig. 2 Running environment of the algorithm
基于此次實驗設置的營銷算法運行環(huán)境,采用如圖3所示的某市24 h的用電量,作為此次實驗數(shù)據(jù)。
圖3 某市24 h用電量Fig.3 24 h electricity consumption in a city
根據(jù)此次實驗選擇的實驗數(shù)據(jù),從該市中選擇12位用戶,作為此次實驗自變量。采用3組營銷算法,根據(jù)圖3所示的某市24 h用電量數(shù)據(jù),劃分12位用戶耗電量、用電總?cè)萘俊⒔灰纂娏?個類別,并與12位用戶的實際類別相對比,驗證此次研究的營銷算法,為用戶提供電力節(jié)能業(yè)務精準程度。
2.2.1 第1組實驗結(jié)果
采用3組營銷算法,劃分12位用戶耗電量結(jié)果,如表1所示。
從表1中可以看出,文獻[7]算法劃分12位用戶耗電量結(jié)果,與用戶實際耗電量平均相差178 kW·h,產(chǎn)生的差值最大;文獻[6]算法劃分12位用戶耗電量結(jié)果,與用戶實際耗電量平均相差59 kW·h,產(chǎn)生的差值次之;而所提算法劃分12位用戶耗電量結(jié)果,與用戶實際耗電量平均相差2 kW·h,較兩組當前算法分別少57 kW·h和176 kW·h,產(chǎn)生的差值最小。由此可知,所提算法的用戶耗電量與實際耗電量較為相符,可以為用戶提供精準的電力節(jié)能業(yè)務。
表1 用戶耗電量Tab. 1 Power consumption of users
2.2.2 第2組實驗結(jié)果
采用3組營銷算法,劃分12位用戶用電總?cè)萘拷Y(jié)果,如表2所示。
表2 用戶用電總?cè)萘縏ab.2 Total electricity capacity of users
由表2可知,文獻[7]算法劃分12位用戶用電總?cè)萘拷Y(jié)果,與用戶實際用電總?cè)萘科骄嗖?47 kW,產(chǎn)生的差值最大;文獻[6]算法劃分12位用戶戶用電總?cè)萘拷Y(jié)果,與用戶實際用電總?cè)萘科骄嗖?65 kW,產(chǎn)生的差值偏大;所提算法劃分12位用戶用電總?cè)萘拷Y(jié)果,與用戶實際用電總?cè)萘科骄嗖? kW,較2組當前算法分別少262 kW和344 kW,產(chǎn)生的差值最小。由此可知,所提算法的用戶用電總?cè)萘颗c實際用戶用電總?cè)萘肯嘟?,可以為用戶提供精準的電力?jié)能業(yè)務。2.2.3 第3組實驗結(jié)果采用3組營銷算法,劃分12位用戶交易電量結(jié)果,如表3所示。
表3 用戶交易電量Tab.3 User trading power
由表3可知,文獻[7]算法劃分12位用戶交易電量結(jié)果,與用戶實際交易電量平均相差146 kW,產(chǎn)生的差值最大;文獻[6]算法劃分12位用戶交易電量結(jié)果,與用戶實際交易電量平均相差134 kW,產(chǎn)生的差值偏大;所提算法劃分12位用戶交易電量結(jié)果,與用戶實際交易電量平均相差1.4 kW,較兩組當前算法分別小144.6 kW和132.6 kW,產(chǎn)生的差值最小。由此可知,所提算法的用戶交易電量與實際交易電量較為接近,可以為用戶提供精準的電力節(jié)能業(yè)務。
此次研究差異化密度聚類下的電力節(jié)能業(yè)務精準營銷算法,通過構(gòu)建用戶用電數(shù)據(jù)挖掘決策樹,在挖掘到的電力用戶用電數(shù)據(jù)基礎上,充分利用差異化密度聚類算法,劃分電力用戶用電數(shù)據(jù),確定電力節(jié)能用戶分布。通過建立營銷目標函數(shù),設置最小用電量約束,提高電力節(jié)能業(yè)務營銷精準度。