亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于熵權(quán)法與改進(jìn)的PCA聚類算法的電力客戶價值分類與應(yīng)用

        2017-04-14 12:52:32皇甫漢聰肖招娣余永忠
        現(xiàn)代電子技術(shù) 2017年7期
        關(guān)鍵詞:熵權(quán)法數(shù)據(jù)挖掘

        皇甫漢聰 肖招娣 余永忠

        摘 要: 對電力客戶進(jìn)行價值分析,有利于全面了解客戶,為電力客戶提供差異化服務(wù)。同時也可以提高客戶滿意度,實現(xiàn)供電企業(yè)、客戶雙贏的局面。運用數(shù)據(jù)挖掘方法對電力客戶價值分類,構(gòu)建電力客戶價值評價指標(biāo)體系,這些指標(biāo)涵蓋客戶的用電行為、繳費行為、輿情和行業(yè)發(fā)展?fàn)顩r等,運用熵權(quán)法計算指標(biāo)的權(quán)重,提出一種改進(jìn)的PCA聚類算法對電力客戶價值進(jìn)行分類,為供電企業(yè)制定差異化服務(wù)策略提供輔助支撐。

        關(guān)鍵詞: 電力客戶價值; 熵權(quán)法; 改進(jìn)的PCA聚類算法; 數(shù)據(jù)挖掘

        中圖分類號: TN911.1?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)07?0183?04

        Power consumer value classification and application based on entropy weight method

        and improved PCA clustering algorithm

        HUANGFU Hancong, XIAO Zhaodi, YU Yongzhong

        (Foshan Power Supply Bureau, Guangdong Power Grid Co., Ltd., Foshan 528000, China)

        Abstract: The analysis of the power consumer value helps the power enterprises to understand their consumers comprehensively, provides the differentiated services for power consumers, and can improve the consumer satisfaction to benefit both of the power supply enterprises and consumers. The data mining method is used to classify the power customer value, and construct the evaluation index system of the power consumer value. The indexes involve the consumer′s power consumption behavior, paying behavior, public feelings and industrial development status. The weights of the indexes are calculated with the entropy weight method. A new improved PCA clustering algorithm is proposed to classify the power consumer value, which provides the ancillary support for the power enterprises to formulate the differentiated services strategy.

        Keywords: power consumer value; entropy weight method; improved PCA clustering algorithm; data mining

        0 引 言

        經(jīng)濟(jì)的發(fā)展推動著我國電力事業(yè)的快速發(fā)展,隨著電力市場化步伐的加快,供電企業(yè)面臨著越來越激烈的競爭,電力客戶不再完全是被動接受者,客戶的作用越來越大,客戶價值的影響也越來越大。然而,電力客戶群體廣泛,不同客戶對于服務(wù)內(nèi)容、方式、深度的需求存在巨大的差異。因此,供電企業(yè)迫切需要對客戶進(jìn)行科學(xué)的分析,根據(jù)客戶的綜合價值對其進(jìn)行分類,針對不同的客戶群體制定不同的營銷策略,為客戶提供精益化的服務(wù)。

        迄今為止,客戶價值評價分析的主要方法有模糊層次分析法[1]、結(jié)合利益細(xì)分法和K?均值的混合方法[2]、結(jié)合熵權(quán)法與區(qū)間數(shù)概率分布的混合方法[3]、支持向量機法[4]等。在有些情況下這些算法能取得不錯的效果,然而依然存在一些不足之處,如模糊層次分析法包含較強的主觀因素,支持向量機法不能確定數(shù)據(jù)中哪些知識是冗余的,K?均值因隨機選取初始中心點會導(dǎo)致結(jié)果不穩(wěn)定。

        鑒于上述算法的不足,本文構(gòu)建了電力客戶價值評價的指標(biāo)體系。提出一種對電力客戶價值分類的新方法,即基于熵權(quán)法和改進(jìn)的PCA聚類算法的混合方法,熵權(quán)法用于計算各個指標(biāo)的權(quán)重,改進(jìn)的PCA聚類算法用于電力客戶價值分類。

        1 電力客戶價值評價指標(biāo)體系

        在遵循完整性、可比性、易獲取性、非重疊性等原則的基礎(chǔ)上,結(jié)合電力行業(yè)的現(xiàn)狀和客戶價值理論[5?6],從電力客戶的收入貢獻(xiàn)、風(fēng)險性、成長性等三個方面選取了11個指標(biāo),這11個指標(biāo)從不同角度反映電力客戶的價值,并初步構(gòu)成了電力客戶價值評價指標(biāo)體系,如表1所示,各指標(biāo)計算說明見表2。

        2 權(quán)重和聚類方法

        2.1 權(quán)重的計算方法

        權(quán)重的計算方法有專家評分法、層次分析法[7]、主成分分析法、熵權(quán)法等。專家評分法主觀性強;層次分析法具有多層次、多指標(biāo)、定量定性相結(jié)合的特點,但它要求同層次指標(biāo)間相互獨立以及跨層次指標(biāo)間不具備支配關(guān)系[5]。主成分分析法是一種客觀性較強的方法,主要是依據(jù)指標(biāo)數(shù)據(jù)的方差計算權(quán)重,不能真實反應(yīng)指標(biāo)對綜合評價的貢獻(xiàn)。鑒于以上方法的一些不足,本文采用熵權(quán)法計算指標(biāo)權(quán)重,熵權(quán)法精度較高且客觀性較強,適用于任何需要確定權(quán)重的地方。

        熵權(quán)法的計算方法如下:

        步驟1:將各個指標(biāo)的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。

        假設(shè)給定了[k]個指標(biāo)[X1,X2,…,Xk,]其中[Xi=x1,x2,…,xn]。假設(shè)對各指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化后的值為[Y1,Y2,…,Yk。]

        步驟2:求各指標(biāo)的信息熵。

        計算各個指標(biāo)的信息熵[Ej=-1lnni=1npijlnpij]。其中[pij=Yiji=1nYij,]如果[pij=0,]則定義[limpij→0pijlnpij=0]。

        步驟3:確定各指標(biāo)權(quán)重。

        根據(jù)各指標(biāo)的信息熵計算各指標(biāo)的權(quán)重[Wi=1-Eik-Ei,i=1,2,…,k]。

        2.2 聚類算法

        聚類分析指的是根據(jù)不同數(shù)據(jù)對象之間的差異,將數(shù)據(jù)集合分組成為由類似的對象組成的多個類或簇的分析過程。聚類算法主要有層次聚類算法和劃分類的聚類算法等。層次聚類算法是將所有樣本點自底向上合并成一棵樹或者自頂向下分裂成一棵樹的過程,但是層次聚類算法有一個缺點就是一旦一個凝聚或是分割形成,這個操作永遠(yuǎn)不會被改變了,且層次聚類算法計算復(fù)雜。劃分的聚類算法中最經(jīng)典的是K?means聚類算法,計算簡單高效,但是,它對初始聚類中心敏感。此外,隨機選取初始聚類中心會導(dǎo)致聚類結(jié)果不穩(wěn)定。因此,學(xué)者們提出了許多改進(jìn)的聚類算法。

        初始聚類中心算法[8]的實現(xiàn)過程如下:

        步驟1:數(shù)據(jù)集[X]有[n]個數(shù)據(jù)對象,聚類的類數(shù)為[k],計算其中最小的數(shù)據(jù)對象[min(X)];

        步驟2:計算[X]中所有數(shù)據(jù)對象到[min(X)]的距離[Dis1,Dis2,…,Dis n,]根據(jù)此距離升序排列所有數(shù)據(jù)對象;

        步驟3:將第[1+(i-1)(n-2)(k-1),i=1,2,…,k]項數(shù)據(jù)對象設(shè)為對應(yīng)類的初始成員;

        步驟4:對尚未分配的數(shù)據(jù)對象,計算其與每個類中初始成員的距離,同時將數(shù)據(jù)對象歸入到距離最小的類中;

        步驟5:計算每個類中所有數(shù)據(jù)對象的平均值,即為初始中心點。

        上述初始聚類中心算法避免了隨機的步驟,使得聚類結(jié)果更加可靠,同時計算得出的初始聚類中心點分布均勻,更能代表原始數(shù)據(jù)的整體分布,可適當(dāng)?shù)臏p少迭代次數(shù)。結(jié)合改進(jìn)的初始聚類中心算法和K?means的思想,得出了改進(jìn)的K?means聚類算法,記為算法1,該算法的實現(xiàn)步驟如下:

        步驟1:應(yīng)用初始聚類中心算法選取[K]個初始聚類中心。

        步驟2:計算所有數(shù)據(jù)對象與聚類中心的距離,同時將數(shù)據(jù)對象分配到最近的類中。

        步驟3:重新計算每個聚類中所有數(shù)據(jù)對象的平均值,作為新的聚類中心。

        步驟4:循環(huán)步驟2,步驟3,直到前后兩次迭代得到的每個聚類中心點相同為止。

        雖然改進(jìn)的K?means聚類算法具有計算簡單、高效,聚類結(jié)果穩(wěn)定等優(yōu)點,但是處理大規(guī)模高維度數(shù)據(jù)時相似度(距離)的計算需要耗費大量的時間,結(jié)合主成分分析[9]即PCA的思想與算法1,本文提出了改進(jìn)的PCA聚類算法,算法步驟如下:

        步驟1:設(shè)原始數(shù)據(jù)矩陣為[X∈Rn×d;]

        步驟2:令[B∈Rd×d,]且[B=XX;]

        步驟3:計算矩陣[B]的特征值和特征向量,并取出最大特征值對應(yīng)的特征向量[V;]

        步驟4:令[C=X?V,]則[C∈Rn×1;]

        步驟5:應(yīng)用算法1對1維列向量[C]進(jìn)行聚類,然后再對應(yīng)到原始數(shù)據(jù),得出原始數(shù)據(jù)的聚類結(jié)果,即原始數(shù)據(jù)對象[Xi]被劃分到第[j]類中,當(dāng)且僅當(dāng)向量[C]的第[i]行被劃分到第[j]類。

        該算法既具有PCA主成分分析降維的特點, 又避免了K?means算法聚類結(jié)果不穩(wěn)定的缺點, 同時又具有K?means算法的高效性與簡潔性等優(yōu)點, 因此該算法適合處理大規(guī)模高維度數(shù)據(jù)。

        3 模型應(yīng)用

        為了說明本文所提出的改進(jìn)PCA聚類算法的可行性,抽取了一些電力客戶的樣本數(shù)據(jù),應(yīng)用Matlab R2012b軟件對其編程。

        為確保樣本選取的公平性,首先需保證指標(biāo)體系中的各個指標(biāo)都要對應(yīng)選取一定量的樣本,其次,隨機抽取樣本。根據(jù)此樣本數(shù)據(jù)選取方法抽取8個樣本客戶,分別記為客戶1、客戶2、…、客戶8,客戶指標(biāo)數(shù)據(jù)如表3所示。

        指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化處理說明:

        (1) 指標(biāo)[X1,X2,X3,X7]屬于高優(yōu)指標(biāo),即指標(biāo)的值越大越好,這兩個指標(biāo)標(biāo)準(zhǔn)化處理的方法為:

        [(原值-最小值)(最大值-最小值)×100] (1)

        (2) 除去上述4個指標(biāo)之外,其他指標(biāo)均屬于低優(yōu)指標(biāo),即指標(biāo)的值越小越好,這些指標(biāo)標(biāo)準(zhǔn)化處理的方法為:

        [(最大值-原值)(最大值-最小值)×100] (2)

        根據(jù)2.1節(jié)中權(quán)重的計算方法,得出各指標(biāo)的權(quán)重如表4所示。對客戶指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化處理,結(jié)合表4中的各個指標(biāo)的權(quán)重,加權(quán)求和得出每個客戶的綜合得分,應(yīng)用改進(jìn)的PCA聚類算法對客戶進(jìn)行分類,如表5所示。根據(jù)綜合得分和改進(jìn)的PCA聚類算法的分類結(jié)果可知本文所提算法的可行性。

        為了說明改進(jìn)的PCA聚類算法的有效性,在相同數(shù)據(jù)集的情況下,把它同算法1進(jìn)行比較。其中改進(jìn)的PCA聚類算法的運行時間是0.010 158 s,算法1的運行時間是0.022 612 s,改進(jìn)的PCA聚類算法在運行效率上要優(yōu)于算法1,運行結(jié)果相同。

        4 結(jié) 論

        電力客戶綜合價值評價體系的建立為供電企業(yè)制定營銷策略提供依據(jù),是客戶關(guān)系管理的基礎(chǔ)。首先,結(jié)合客戶價值理論和電力行業(yè)的特殊性建立電力客戶價值評價指標(biāo)體系,指標(biāo)體系涵蓋客戶用電行為、繳費行為、輿情和行業(yè)發(fā)展動態(tài);其次,提出了一種行之有效的對電力客戶價值評價的混合方法,即結(jié)合熵權(quán)法和改進(jìn)的PCA聚類算法,該算法能夠根據(jù)數(shù)據(jù)自身的特征計算各指標(biāo)的權(quán)重并科學(xué)的確定分類標(biāo)準(zhǔn)。熵權(quán)法是一種精度較高,客觀性較強的計算權(quán)重的方法。改進(jìn)的PCA聚類算法既具有主成分分析降維的優(yōu)點,同時避免了因隨機選取初始中心點導(dǎo)致的聚類結(jié)果不穩(wěn)定這一缺陷,也具有K?means聚類算法簡潔高效等優(yōu)點,因此該算法適合處理大規(guī)模高維度數(shù)據(jù);最后,通過實例驗證了該方法的有效性,且該技術(shù)在某供電企業(yè)得到了深入應(yīng)用,并取得了良好效果。

        參考文獻(xiàn)

        [1] 王松濤.市場條件下的電力客戶價值分析體系[J].電網(wǎng)技術(shù),2010,34(2):155?158.

        [2] 曾鳴,楊素萍,楊鵬舉,等.社會節(jié)能環(huán)境下電力客戶價值評估研究[J].華東電力,2008,36(6):15?19.

        [3] 李金超,李金穎,牛東曉,等.考慮區(qū)間數(shù)概率分布的電力客戶價值綜合評價[J].華北電力大學(xué)學(xué)報,2005,32(4):56?58.

        [4] 李俊飛.集成粗糙集和支持向量機的電力客戶價值評價[D].保定:華北電力大學(xué),2007.

        [5] 趙曉波.供電企業(yè)大客戶管理的研究[D].南京:南京理工大學(xué),2005.

        [6] 靳方明.基于客戶價值分析的電力客戶服務(wù)管理研究[D].北京:華北電力大學(xué),2007.

        [7] 沈利香,曹國.基于網(wǎng)絡(luò)層次分析法的商業(yè)銀行網(wǎng)絡(luò)安全評估模型[J].計算機應(yīng)用,2012,32(2):480?484.

        [8] 董騏瑞. K?均值聚類算法的改進(jìn)與實現(xiàn)[D].吉林:吉林大學(xué),2015.

        [9] 劉倩.基于主成分聚類分析的中小企業(yè)成長性研究[J].企業(yè)管理,2011,16(4):186?188.

        猜你喜歡
        熵權(quán)法數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        高職機電專業(yè)學(xué)生數(shù)學(xué)能力的調(diào)查及對策
        考試周刊(2016年103期)2017-01-23 15:58:59
        大學(xué)周邊健身房滿意度調(diào)查報告
        基于熵權(quán)法的京津冀區(qū)域信息化協(xié)調(diào)發(fā)展規(guī)律模型及其應(yīng)用
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        基于熵權(quán)法的“互聯(lián)網(wǎng)+”農(nóng)業(yè)發(fā)展影響因素權(quán)重確定
        商(2016年34期)2016-11-24 20:05:32
        基于熵權(quán)法的西安市外向型經(jīng)濟(jì)發(fā)展綜合評價研究
        價值工程(2016年29期)2016-11-14 00:15:45
        城市與區(qū)域經(jīng)濟(jì)可持續(xù)發(fā)展
        商(2016年27期)2016-10-17 04:35:55
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        国产91精品清纯白嫩| 亚洲国产精品久久久久婷婷老年| 少妇高潮潮喷到猛进猛出小说| 国产成人无码A区在线观| 精品999无码在线观看| 国产av麻豆精品第一页| 国产亚洲精品熟女国产成人| 亚洲 中文 欧美 日韩 在线| 成熟人妻av无码专区| 国产成人亚洲欧美三区综合| 经典亚洲一区二区三区| 黄色国产一区二区99| 成人欧美一区二区三区在线观看| 久久夜色精品国产| 久久久久亚洲AV成人网毛片| 国产三级视频一区二区| 放荡成熟人妻中文字幕| 国产a在亚洲线播放| 真实国产老熟女粗口对白| 国产乱人伦真实精品视频| av免费在线观看网站大全| 国产一区二区三区激情视频| 久久精品亚洲一区二区三区浴池| 丰满人妻无奈张开双腿av| 久久久久久人妻一区精品| 亚洲精品中文字幕91| 国产香港明星裸体xxxx视频| 亚洲欧美aⅴ在线资源| 国产美女69视频免费观看| 国产成人自拍视频在线观看网站| 亚洲av少妇高潮喷水在线| 亚洲视频在线观看| 久久夜色撩人精品国产小说 | 国产精品 人妻互换| 无码成人片一区二区三区| 一区二区三区在线观看视频免费 | 精品久久久久久午夜| 日本免费三片在线视频| 水蜜桃在线视频在线观看| 午夜视频一区二区三区四区| 97人伦影院a级毛片|