賴光源 李佳良
(廣東電網(wǎng)有限責(zé)任公司河源供電局 廣東 河源 517000)
?
基于特征感知迭代的電網(wǎng)業(yè)務(wù)營銷數(shù)據(jù)挖掘方法
賴光源 李佳良*
(廣東電網(wǎng)有限責(zé)任公司河源供電局 廣東 河源 517000)
“互聯(lián)網(wǎng)+電力”的大數(shù)據(jù)挖掘能為精準(zhǔn)用電提供基礎(chǔ)支撐?,F(xiàn)有電網(wǎng)營銷數(shù)據(jù)挖掘?qū)τ脩魯?shù)據(jù)的挖掘粒度大,特征集區(qū)分度小,空間維度權(quán)值低,基于用戶行為的電網(wǎng)營銷策略準(zhǔn)確度低。提出基于特征感知迭代的電網(wǎng)業(yè)務(wù)營銷數(shù)據(jù)挖掘方法。構(gòu)建結(jié)合空間特征的電力用戶用電模型,設(shè)計(jì)營銷管理決策樹挖掘模型,對(duì)冗余數(shù)據(jù)特征進(jìn)行過濾清洗,推導(dǎo)準(zhǔn)確的電網(wǎng)營銷行為。通過仿真和實(shí)驗(yàn)分析,驗(yàn)證新方法具有更好的預(yù)測(cè)精度和更低的數(shù)據(jù)消耗。
數(shù)據(jù)挖掘 決策樹 時(shí)空關(guān)聯(lián) 電力營銷
“互聯(lián)網(wǎng)+”電力已逐漸成為智能電網(wǎng)與“電網(wǎng)2.0”的深入發(fā)展內(nèi)容。電力云網(wǎng)絡(luò)、智能電力終端以及智能電力應(yīng)用將有力催生“互聯(lián)網(wǎng)+電力服務(wù)”[1]全新現(xiàn)代服務(wù)模式,實(shí)現(xiàn)客戶與電網(wǎng)的直接無縫互動(dòng),實(shí)現(xiàn)精準(zhǔn)售電的高服務(wù)質(zhì)量。
實(shí)現(xiàn)高服務(wù)質(zhì)量精準(zhǔn)售電的電網(wǎng)營銷需要以大數(shù)據(jù)挖掘作為前提,深度分析電網(wǎng)生產(chǎn)數(shù)據(jù)、電網(wǎng)運(yùn)營數(shù)據(jù)以及電網(wǎng)企業(yè)管理數(shù)據(jù)之間的特征關(guān)系,從而為準(zhǔn)確預(yù)測(cè)用戶用電需求、企業(yè)用電規(guī)律以及電能消耗情況,提供精準(zhǔn)的電力營銷方案。然而電網(wǎng)營銷數(shù)據(jù)不僅具有傳統(tǒng)數(shù)據(jù)挖掘所面臨的高速性、多樣性和價(jià)值性,而且數(shù)據(jù)維度高、冗余大、流量高,使得電網(wǎng)營銷預(yù)測(cè)存在準(zhǔn)確度偏低、處理效率低和重用性低的顯著問題。據(jù)調(diào)研分析,現(xiàn)有電網(wǎng)營銷系統(tǒng)的數(shù)據(jù)利用效率僅有30.6%,初次挖掘的數(shù)據(jù)65.9%需要再重新挖掘,而電力數(shù)據(jù)價(jià)值[2]只有數(shù)據(jù)總量的9.6%。因此更加準(zhǔn)確和高效的數(shù)據(jù)挖掘方式才能滿足電網(wǎng)電力營銷的精準(zhǔn)售電需求,實(shí)現(xiàn)用戶智能和自主用電。智能電網(wǎng)營銷管理的數(shù)據(jù)挖掘來源和關(guān)系如圖1所示。
圖1 電網(wǎng)營銷管理的數(shù)據(jù)挖掘來源和關(guān)系
國內(nèi)外研究機(jī)構(gòu)和電網(wǎng)企業(yè)對(duì)智能電網(wǎng)營銷管理的數(shù)據(jù)挖掘技術(shù)展開多方位的研究,主要包括電網(wǎng)并行負(fù)荷預(yù)測(cè)、電力電網(wǎng)應(yīng)用技術(shù)、電網(wǎng)數(shù)據(jù)智能分析,以及電力客戶服務(wù)數(shù)據(jù)分析等。其中,電網(wǎng)系統(tǒng)云數(shù)據(jù)聚類故障檢測(cè)方法采用改進(jìn)的蟻群分析方法[3],改進(jìn)基因位數(shù)的輸出精度,從而提升基于Hadoop的集群云計(jì)算原型系統(tǒng)的數(shù)據(jù)挖掘精度,為電網(wǎng)節(jié)點(diǎn)監(jiān)測(cè)提供精準(zhǔn)的基礎(chǔ)數(shù)據(jù)?;诤A吭诰€歷史數(shù)據(jù)的大電網(wǎng)快速判穩(wěn)策略[4],利用已有在線的電網(wǎng)運(yùn)行數(shù)據(jù)進(jìn)行支持向量機(jī)的大數(shù)據(jù)挖掘,能夠完成快速運(yùn)行狀態(tài)判決,建立的預(yù)測(cè)準(zhǔn)則與實(shí)際數(shù)據(jù)緊密結(jié)合,能夠?yàn)殡娋W(wǎng)管理提供良好的應(yīng)用價(jià)值。電力用戶側(cè)是電網(wǎng)系統(tǒng)的電力消費(fèi)主體,根據(jù)云計(jì)算技術(shù),采集電網(wǎng)運(yùn)營、管理和銷售數(shù)據(jù),利用隨機(jī)森林算法的并行負(fù)荷預(yù)測(cè)方法[5],能夠在多數(shù)據(jù)集下,提升數(shù)據(jù)挖掘的預(yù)測(cè)精度,解決電力用戶側(cè)大數(shù)據(jù)挖掘面臨的數(shù)據(jù)量大、種類繁多的問題?;跀?shù)據(jù)挖掘的電網(wǎng)數(shù)據(jù)智能分析[6],通過對(duì)電網(wǎng)的設(shè)備信息、運(yùn)行數(shù)據(jù)、日?qǐng)?bào)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理、多維數(shù)據(jù)模式數(shù)據(jù)倉庫建立以及多維關(guān)聯(lián)性分析,形成新的預(yù)測(cè)特征。電網(wǎng)企業(yè)級(jí)數(shù)據(jù)挖掘研究還包括電力云資源規(guī)劃調(diào)度[7]、調(diào)度控制系統(tǒng)數(shù)據(jù)庫管理[8]、變電設(shè)備狀態(tài)監(jiān)測(cè)[9]等,為電網(wǎng)智能化管理提供有效的數(shù)據(jù)基礎(chǔ)。
但現(xiàn)有電網(wǎng)營銷數(shù)據(jù)挖掘主要面向經(jīng)營管理應(yīng)用,對(duì)電力用戶的挖掘粒度大,且缺乏區(qū)分度高的數(shù)據(jù)挖掘特征集,空間維度為電網(wǎng)營銷的權(quán)值低,使得基于用戶行為的電網(wǎng)營銷策略準(zhǔn)確度低。
針對(duì)電網(wǎng)營銷數(shù)據(jù)挖掘存在的挖掘粒度大、區(qū)分度低、空間關(guān)聯(lián)度少的顯著問題,本文提出基于特征感知迭代的電網(wǎng)業(yè)務(wù)營銷數(shù)據(jù)挖掘方法。構(gòu)建結(jié)合空間特征的電力用戶用電模型,提升數(shù)據(jù)特征集的強(qiáng)空間關(guān)聯(lián)特性,設(shè)計(jì)營銷管理決策樹挖掘模型,對(duì)冗余數(shù)據(jù)特征進(jìn)行過濾清洗,推導(dǎo)準(zhǔn)確的電網(wǎng)營銷行為,實(shí)現(xiàn)對(duì)用戶的精準(zhǔn)售電。通過仿真和實(shí)驗(yàn)分析,驗(yàn)證新的數(shù)據(jù)挖掘方法具有更好的預(yù)測(cè)精度和更低的數(shù)據(jù)消耗。
經(jīng)營管理應(yīng)用是現(xiàn)有電網(wǎng)營銷數(shù)據(jù)挖掘主要方向。而隨著“互聯(lián)網(wǎng)+電力”的發(fā)展,將用電行為轉(zhuǎn)變?yōu)橐杂脩趄?qū)動(dòng)進(jìn)行營銷管理。以地理空間信息為基礎(chǔ)的時(shí)空關(guān)聯(lián)特征,能夠?qū)⒂脩羲诘乩砦恢谩⑹召M(fèi)水平、用電習(xí)慣、氣溫氣候、重點(diǎn)節(jié)日等長時(shí)、海量數(shù)據(jù)進(jìn)行融合處理挖掘,才能得到精準(zhǔn)的用戶信息進(jìn)行精準(zhǔn)用電營銷。因此,首先構(gòu)建營銷時(shí)空特征管理模型,用以分析地理信息關(guān)系數(shù)據(jù),然后融入深度數(shù)據(jù)挖掘框架中。
1.1 營銷時(shí)空特征的數(shù)據(jù)云模型
以時(shí)空特征作為營銷主體,進(jìn)行數(shù)據(jù)挖掘,首先需要建立電網(wǎng)營銷數(shù)據(jù)云模型,也即是將輸電、配電、售電過程中的實(shí)際用戶數(shù)據(jù)轉(zhuǎn)化成機(jī)器能理解和可處理的基礎(chǔ)數(shù)據(jù)模型。構(gòu)建的營銷時(shí)空特征數(shù)據(jù)云模型為3基素模型:
K:=
(1)
其中,L為挖掘特征從實(shí)際空間到數(shù)據(jù)空間的映射方式,D為機(jī)器可處理的結(jié)構(gòu)化信息,形成特征群D={d1,d2,…,dn},即每個(gè)云模型將由n個(gè)數(shù)據(jù)特征組成。O為電網(wǎng)營銷過程中實(shí)際的各項(xiàng)操作,也由不同的{o1,o2,…,on}操作組成。由此可以得到的映射關(guān)系為:
L:={dn=l(on)}
(2)
數(shù)據(jù)云模型關(guān)系如圖2所示。
圖2 營銷時(shí)空特征的數(shù)據(jù)云模型
假設(shè)地理空間信息為基礎(chǔ)的時(shí)空關(guān)聯(lián)特征為(x,y),則建立強(qiáng)關(guān)聯(lián)的數(shù)據(jù)云模型。首先對(duì)電網(wǎng)營銷過程中實(shí)際的各項(xiàng)操作進(jìn)行緊自相關(guān)處理,即求解其相關(guān)函數(shù)的相關(guān)函數(shù):
(3)
再利用時(shí)空關(guān)聯(lián)特征進(jìn)行數(shù)據(jù)歸一化處理,設(shè)關(guān)聯(lián)參數(shù)因子為θ,其由實(shí)際操作與地理特征的映射距離的均方根誤差決定,從而形成在全局電網(wǎng)營銷過程的加權(quán)參數(shù)值,即:
(4)
聯(lián)列式(1)、式(3)和式(4),則可得到變換的初始營銷時(shí)空特征數(shù)據(jù)云模型,即:
K:=
(5)
初始營銷時(shí)空特征數(shù)據(jù)云模型使得電網(wǎng)營銷數(shù)據(jù)挖掘時(shí),具備了空間地理信息特征,并能夠以坐標(biāo)為基準(zhǔn),對(duì)信息進(jìn)行有效的組合。
由于上述過程建立的初步模型在于能夠覆蓋電網(wǎng)營銷中的主要操作,而引入了對(duì)營銷策略具有相似性的操作,使得構(gòu)建的數(shù)據(jù)云模型有一定的冗余性。因此,對(duì)其相關(guān)的參數(shù)進(jìn)行相似性分析和冗余數(shù)據(jù)過濾。
相似度計(jì)算是指利用操作的交集來表征兩種元素之間的相同程度。設(shè)置相似門限為Ω,兩個(gè)需要對(duì)比的操作為OA和OB,則可得到收斂的判決過程:
(6)
不滿足以下條件的操作,表明其對(duì)于時(shí)空特征參量的距離較短,或者區(qū)分度較低,應(yīng)該在數(shù)據(jù)挖掘過程中被清洗,通過相似度計(jì)算,減少冗余的數(shù)據(jù)特征參量。
1.2 深度數(shù)據(jù)挖掘框架
時(shí)空特征關(guān)聯(lián)的深度數(shù)據(jù)挖掘框架用以適應(yīng)電網(wǎng)企業(yè)營銷的數(shù)據(jù)輸入和策略輸出框架。設(shè)計(jì)的深度數(shù)據(jù)功能需求包括電網(wǎng)數(shù)據(jù)挖掘以及營銷預(yù)測(cè)模型兩個(gè)部分,挖掘框架如圖3所示。
圖3 深度數(shù)據(jù)挖掘框架
圖3中深度數(shù)據(jù)挖掘框架包括采集層、元數(shù)據(jù)層以及數(shù)據(jù)挖掘?qū)?。采集層主要?shí)現(xiàn)對(duì)基礎(chǔ)數(shù)據(jù)信息的采集以及和基礎(chǔ)空間信息的關(guān)聯(lián),為元數(shù)據(jù)層模型建立構(gòu)建數(shù)據(jù)基礎(chǔ)。深度數(shù)據(jù)挖掘框架的數(shù)據(jù)來源于電網(wǎng)數(shù)據(jù)中心的數(shù)據(jù)流、信息柵格、數(shù)據(jù)庫以及文件記錄。然后建立以位置為基礎(chǔ)的數(shù)據(jù)關(guān)聯(lián)關(guān)系,元數(shù)據(jù)層主要建立以空間信息模型為基礎(chǔ)的機(jī)器可處理的基礎(chǔ)數(shù)據(jù)模型,能夠有效實(shí)現(xiàn)可關(guān)聯(lián)、可擴(kuò)展、可追溯的動(dòng)態(tài)數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)挖掘?qū)又饕娏μ卣鲙?、地理空間特征庫以及用戶特征庫組成的電網(wǎng)銷售策略基礎(chǔ)知識(shí)庫,設(shè)置的特征比對(duì)模塊能夠使得具備相似特征的目標(biāo)請(qǐng)求,快速獲得營銷策略。
2.1 大數(shù)據(jù)并發(fā)預(yù)處理
電網(wǎng)營銷數(shù)據(jù)并發(fā)預(yù)處理主要包括數(shù)據(jù)清洗、整理和加載。為了降低數(shù)據(jù)挖掘的復(fù)雜度,引入K-Means對(duì)電網(wǎng)營銷數(shù)據(jù)進(jìn)行聚類,降低數(shù)據(jù)挖掘的整體維度[10]。
首先將電網(wǎng)營銷數(shù)據(jù)的特征群D離散化,即Di=D×δi(n),將連續(xù)的特征數(shù)值轉(zhuǎn)化為離散的區(qū)間,使得每個(gè)離散區(qū)間能夠獨(dú)立對(duì)應(yīng)唯一的特征值。使用K-Means算法,分析不同特征之間的距離值,劃歸不同的簇,從而形成特定的樣本中心值,預(yù)處理過程如圖4所示。
圖4 電網(wǎng)營銷數(shù)據(jù)并發(fā)預(yù)處理
將基于某地理坐標(biāo)的電網(wǎng)運(yùn)行樣本數(shù)據(jù)離散為5個(gè)不同的等級(jí),2015年某地區(qū)各月電網(wǎng)營銷事務(wù)離散化處理結(jié)果如表1所示。
表1 電網(wǎng)營銷數(shù)據(jù)離散化處理結(jié)果 億千瓦時(shí)
續(xù)表1
由表1中可以得到,電網(wǎng)營銷事務(wù)中的用電量峰值和平均值經(jīng)過離散化處理后,12組按月控制的數(shù)據(jù)轉(zhuǎn)化成5組離散化的等級(jí)值,其中F1、F2、F3、F4、F5分別從低到高代表數(shù)據(jù)的等級(jí)水平。在數(shù)據(jù)挖掘中,輸入的數(shù)據(jù)也從12組減少至5組。
2.2 改進(jìn)決策樹的目標(biāo)推理
通過對(duì)電網(wǎng)營銷數(shù)據(jù)并發(fā)預(yù)處理,獲得了精簡的預(yù)處理數(shù)據(jù)集,設(shè)計(jì)主體增益決策樹的電網(wǎng)營銷數(shù)據(jù)挖掘策略。決策樹的基本原理在于根據(jù)每一步選擇的輸入狀態(tài)決定最優(yōu)選擇情況。因此電網(wǎng)營銷策略需要根據(jù)每一組特征集輸入進(jìn)行離散化的判決,獲得最后的最優(yōu)選擇。
改進(jìn)決策樹的目標(biāo)推理過程如下:
(1) 計(jì)算電網(wǎng)營銷策略的樣本信息值
將用戶所在地理位置location、收費(fèi)水平expense、用電習(xí)慣rule、氣溫氣候temperatrue、重點(diǎn)節(jié)日day等建立為訓(xùn)練樣本值,設(shè)置的決策樹根節(jié)點(diǎn)具有α個(gè)“是”和β個(gè)“否”,則其信息值為:
(7)
(2) 構(gòu)建第一個(gè)營銷策略子樹
基于地理空間信息,設(shè)定其葉節(jié)點(diǎn)的“是”和“否”個(gè)數(shù)為[α1,β1]、[α2,β2]、[α3,β3],由此推斷其信息值為info([α1,β1])、info([α2,β2])、info([α3,β3])。
(3) 計(jì)算每個(gè)節(jié)點(diǎn)屬性導(dǎo)致的信息增益
根據(jù)空間地理信息的樹,導(dǎo)致的信息增益,為基于全體特征數(shù)值的有效比值,將電網(wǎng)營銷策略的特征路徑進(jìn)行重新分配,并計(jì)算整體增益為info([α1,β1],[α2,β2],[α3,β3])。
(4) 加權(quán)整個(gè)子樹的挖掘信息增益
基于地理坐標(biāo)信息延伸的四個(gè)子樹,需要由聯(lián)合概率分布規(guī)律,分別計(jì)算每個(gè)子樹導(dǎo)致的電網(wǎng)營銷策略信息增益,為每個(gè)屬性計(jì)算信息增益Gα=info([α1,α1])、Gβ=info([β1,β2],[β2,β3])、Gαβ=info([α1,β2],[β2,β3])和Gβα=info([β1,α2],[α2,α3])。
(5) 確定最大的數(shù)據(jù)挖掘信息控制度
選擇屬性計(jì)算信息增益的時(shí)空關(guān)聯(lián)程度根節(jié)點(diǎn)與子樹,確定其具有最優(yōu)的數(shù)據(jù)挖掘性能。以此類推,再對(duì)后續(xù)屬性或者添加的子樹進(jìn)行遞歸,繼續(xù)劃分屬性。
改進(jìn)決策樹目標(biāo)推理的策略如圖5所示。
圖5 改進(jìn)決策樹目標(biāo)推理的策略
由圖5中展示的可以根據(jù)特定的電網(wǎng)營銷需求,推導(dǎo)出電網(wǎng)企業(yè)所需要的營銷策略。
為了驗(yàn)證新的數(shù)據(jù)挖掘方法具有更好的預(yù)測(cè)精度和更低的數(shù)據(jù)消耗,將建立基于特征感知迭代的電網(wǎng)業(yè)務(wù)營銷數(shù)據(jù)挖掘方法的測(cè)試環(huán)境。
3.1 測(cè)試環(huán)境部署
以南方電網(wǎng)某地級(jí)市為例,將電網(wǎng)企業(yè)級(jí)營銷數(shù)據(jù)挖掘系統(tǒng)部署在電網(wǎng)數(shù)據(jù)中心中,并且能夠接入到電力專網(wǎng),獲取電力營銷管理系統(tǒng)、集中抄表管理系統(tǒng)、用電現(xiàn)場(chǎng)管理系統(tǒng)、配變監(jiān)測(cè)管理系統(tǒng)以及電量遠(yuǎn)程系統(tǒng)。在專網(wǎng)交換機(jī)中部署網(wǎng)絡(luò)流量鏡像[11],接入泰克TLA7SA00協(xié)議分析儀用于檢測(cè)實(shí)際運(yùn)行情況,測(cè)試環(huán)境搭建架構(gòu)如圖6所示。
圖6 測(cè)試環(huán)境搭建架構(gòu)
觀測(cè)某地級(jí)市電信局的用戶數(shù)量為12.3萬戶,其中按用電性質(zhì)作為第1維度數(shù)據(jù)劃分依據(jù),包括住宅用戶7.4萬戶、商業(yè)用戶1.2萬戶,工業(yè)用戶1.3萬戶、農(nóng)業(yè)用戶1.1萬戶、其他用戶1.0萬戶。以6小時(shí)作為事件單位觀察,每天可以獲得49.2萬組數(shù)據(jù),其中每組數(shù)據(jù)量為1 024 bit,則每天的數(shù)據(jù)量為492 Mbit。從數(shù)據(jù)內(nèi)容上分別包括用戶所在地理位置、用電水平、用電習(xí)慣、氣溫氣候等4種主要用電特征,由此形成數(shù)據(jù)的第2維度,并對(duì)數(shù)據(jù)進(jìn)行擴(kuò)充為1.968 Gbit。以采集的數(shù)據(jù)進(jìn)行累計(jì)值、增量值、平均值、最大值、最小值和標(biāo)準(zhǔn)差值等數(shù)據(jù)格式作為第3維度,數(shù)據(jù)量進(jìn)一步擴(kuò)充為11.8 Gbit。
3.2 預(yù)測(cè)精度性能分析
通過選擇在電網(wǎng)數(shù)據(jù)中心內(nèi)配置三類營銷事件:工業(yè)用電、商業(yè)用電和居民用電,收集數(shù)據(jù)挖掘結(jié)果與協(xié)議分析儀器直接采集的數(shù)據(jù),利用蒙特卡洛分析法和均方根誤差分析數(shù)據(jù)挖掘的預(yù)測(cè)精度,預(yù)測(cè)結(jié)果如圖7所示。
圖7 預(yù)測(cè)精度性能分析
由圖7中可以看出,基于特征感知迭代的電網(wǎng)業(yè)務(wù)營銷數(shù)據(jù)挖掘方法的最小誤差值分別為5.86%、5.92%、6.01%,低于文獻(xiàn)[5-6]中提及的數(shù)據(jù)挖掘方法,這是由于新方法能夠提升數(shù)據(jù)特征集的強(qiáng)空間關(guān)聯(lián)特性,降低預(yù)測(cè)誤差。
3.3 數(shù)據(jù)消耗性能分析
數(shù)據(jù)挖掘過程中需要一定的數(shù)據(jù)集才能滿足挖掘需求,因此對(duì)數(shù)據(jù)有一定的消耗。本文方法利用相似度計(jì)算,對(duì)數(shù)據(jù)進(jìn)行有效清洗,區(qū)分度較低,應(yīng)該在數(shù)據(jù)挖掘過程中被清洗。通過相似度計(jì)算,減少冗余的數(shù)據(jù)特征參量,如圖8所示,在測(cè)試目標(biāo)數(shù)目相同時(shí),本文方法的系統(tǒng)流量并發(fā)吞吐量要低于其他兩種方法。當(dāng)測(cè)試目標(biāo)為6個(gè)時(shí),吞吐量為28.6 Mbps,能夠滿足電網(wǎng)業(yè)務(wù)營銷的網(wǎng)絡(luò)需求。
圖8 數(shù)據(jù)消耗性能分析
本文提出基于特征感知迭代的電網(wǎng)業(yè)務(wù)營銷數(shù)據(jù)挖掘方法。構(gòu)建結(jié)合空間特征的電力用戶用電模型,提升數(shù)據(jù)特征集的強(qiáng)空間關(guān)聯(lián)特性,設(shè)計(jì)營銷管理決策樹挖掘模型,對(duì)冗余數(shù)據(jù)特征進(jìn)行過濾清洗,推導(dǎo)準(zhǔn)確的電網(wǎng)營銷行為,實(shí)現(xiàn)對(duì)用戶的精準(zhǔn)售電。通過仿真和實(shí)驗(yàn)分析,驗(yàn)證新的數(shù)據(jù)挖掘方法具有更好的預(yù)測(cè)精度和更低的數(shù)據(jù)消耗。
[1] 彭小圣, 鄧迪元, 程時(shí)杰,等. 面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)[J]. 中國電機(jī)工程學(xué)報(bào), 2015, 35(3):503-511.
[2] 蔡徽. 廣東電網(wǎng)電力大數(shù)據(jù)現(xiàn)狀及主要發(fā)展思路[J]. 廣東電力,2014(12):11-14.
[3] 張向豐. 改進(jìn)的蟻群引導(dǎo)電網(wǎng)系統(tǒng)云數(shù)據(jù)聚類故障檢測(cè)[J]. 科技通報(bào),2014(10):187-189.
[4] 黃彥浩, 于之虹, 史東宇,等. 基于海量在線歷史數(shù)據(jù)的大電網(wǎng)快速判穩(wěn)策略[J]. 中國電機(jī)工程學(xué)報(bào), 2016, 36(3):596-603.
[5] 王德文, 孫志偉. 電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測(cè)[J]. 中國電機(jī)工程學(xué)報(bào), 2015, 35(3):527-537.
[6] 楊懿, 楊潔, 聶恬. 基于數(shù)據(jù)挖掘的電網(wǎng)數(shù)據(jù)智能分析的研究[J]. 電子技術(shù)與軟件工程, 2014(23):218-218.
[7] 龐松濤. 基于數(shù)據(jù)挖掘的電力云資源規(guī)劃調(diào)度[J]. 電信科學(xué), 2015, 31(3):142-147.
[8] 彭暉, 陶洪鑄, 嚴(yán)亞勤,等. 智能電網(wǎng)調(diào)度控制系統(tǒng)數(shù)據(jù)庫管理技術(shù)[J]. 電力系統(tǒng)自動(dòng)化, 2015(1):19-25.
[9] 張東霞, 苗新, 劉麗平,等. 智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J]. 中國電機(jī)工程學(xué)報(bào), 2015(1):2-12.
[10] 耿亮, 吳燕, 孟憲楠. 電力數(shù)據(jù)挖掘在電網(wǎng)內(nèi)部及各領(lǐng)域間的應(yīng)用[J]. 電信科學(xué), 2013, 29(11):127-130.
[11] 于君, 范文彬, 杜永軍. 智能電網(wǎng)中高維數(shù)據(jù)聚類方法研究[J]. 智能計(jì)算機(jī)與應(yīng)用, 2016, 6(1):9-12.
ADATAMININGMETHODBASEDONITERATIONFEATURESENSATIONFORSTATEGRIDENTERPRISEMARKETING
Lai Guangyuan Li Jialiang*
(SupplyBureauofHeyuan,GuangdongPowerGridCo.,Ltd,Heyuan517000,Guangdong,China)
The data mining of the “Internet plus electric” mode basically supports the precise power utilization. Current data mining methods for electricity enterprise marketing are rough description and low differentiation, which causes low compatibility of electricity marketing based on users behavior. Therefore, this paper proposes a data mining method based on iteration feature sensation for state grid enterprise marketing. Constructing the power consumer utilization model considering spatial feature, designing the mining model for marketing management decision-making tree, and filtering the redundant data feature to deduct the accurate marketing method for State Grid. The tests and simulations demonstrate that the proposed method has better performance of accuracy and lower data consuming.
Data mining Decision-making tree Space-time relevance Electricity marketing
2016-08-08。賴光源,高工,主研領(lǐng)域:電網(wǎng)數(shù)據(jù)挖掘。李佳良,工程師。
TP391
A
10.3969/j.issn.1000-386x.2017.08.014