亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        探究基于改進決策樹的電力營銷數(shù)據(jù)挖掘方法

        2024-04-01 04:12:18李慧翔
        電氣技術(shù)與經(jīng)濟 2024年3期
        關(guān)鍵詞:數(shù)據(jù)挖掘分類信息

        李慧翔 劉 博

        (國網(wǎng)豐寧縣供電公司)

        0 引言

        在信息時代下,各行各業(yè)朝向信息化經(jīng)營模式發(fā)展已經(jīng)成為必然趨勢。其中電力行業(yè)通過信息集成系統(tǒng)實現(xiàn)了一站式管理,但其中生成的海量數(shù)據(jù)無法得到充分利用。如何充分挖掘、有效利用這些數(shù)據(jù)成為目前行業(yè)關(guān)注焦點話題。電力管理信息系統(tǒng)運行中生成了大量變電站運行信息、銷售數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)可有效獲取其中的隱藏、有價值信息,解決數(shù)據(jù)分析問題,為用戶決策提供信息支撐,保障電網(wǎng)運行可靠性。目前數(shù)據(jù)挖掘的營銷效果評價主要采用決策樹算法,直接影響整個信息挖掘與分析系統(tǒng)的性能,因此加強改進決策樹的電力營銷數(shù)據(jù)挖掘方法研究有著重要意義。本次設(shè)計以C5.0決策樹為基礎(chǔ),通過引入信息熵的方案,在保障分類精準(zhǔn)性的前期下,提高信息分類時間效率,進一步強化電力營銷數(shù)據(jù)挖掘性能,為電力企業(yè)管理決策提供高質(zhì)量數(shù)據(jù)支撐。

        1 改進決策樹算法的必要性

        在信息時代下,電力營銷數(shù)據(jù)分析處理對電力企業(yè)決策、發(fā)展、規(guī)避風(fēng)險有著重要意義。常見電力營銷數(shù)據(jù)處理分析運算方法包括BP神經(jīng)網(wǎng)絡(luò)、云計算以及決策樹。目前電力系統(tǒng)數(shù)據(jù)與營銷數(shù)據(jù)挖掘主要是采用決策樹算法,并且在多年發(fā)展中決策樹算法也在不斷更迭,如ID3.0決策樹、C4.5決策樹等。但這些決策樹算法均存在一定弊端。如基于C4.5決策樹的電力側(cè)大數(shù)據(jù)挖掘營銷效果評價方法,該方法結(jié)合BP神經(jīng)網(wǎng)絡(luò)系統(tǒng),可實現(xiàn)對電力營銷數(shù)據(jù)的快速挖掘功能;再如基于C4.5決策樹算法的電力客戶欠費風(fēng)險預(yù)測模型,可判斷電力客戶欠費概率和趨勢。雖然這些方法在技術(shù)層面上實現(xiàn)了突破,但其決策樹算法核心依然是ID3,功能上限較低[1]。而C5.0決策樹算法作為C4.5決策樹的迭代產(chǎn)品,綜合性能更高、可用性更強。

        因此,為了快速獲取高精度電力營銷數(shù)據(jù),為用戶決策提供信息支撐,加強決策樹算法改進研究工作十分必要。通過C5.0決策樹對電力營銷數(shù)據(jù)進行深層挖掘、分析,在C5.0決策樹基礎(chǔ)上引入信息熵實現(xiàn)進一步改進,可有效提升信息分類精度和效率,從而更好的滿足電力營銷中分類預(yù)測需求。

        2 C5.0決策樹算法原理

        C5.0決策樹在ID3核心架構(gòu)決策樹算法的基礎(chǔ)上實現(xiàn)了升級,之前的C4.5決策樹是一種連續(xù)型算法,注重各項屬性的關(guān)聯(lián)性,并在ID3決策樹基礎(chǔ)上新增2個屬性,即分離信息、信息增益,有助于搭建多分支決策樹。C5.0決策樹相對于C4.5決策樹在內(nèi)存管理等方面實現(xiàn)了升級,雖然核心算法相同,但在商業(yè)領(lǐng)域可用性更強。C5.0決策樹算法的核心就是確定分裂屬性。

        假設(shè)某個訓(xùn)練樣本集為S,其中包含了s個樣本量、m個不同種類xi(i=1,2,…,m)。S中的某個屬性D,其取值范圍為[1,k]。Vi表示不同種類xi樣本總數(shù)。S中D屬性不同,可將S分成k個子集。si為上述子集中的第i個子集,i=l,2,…/,k,[si]代表子集si樣本數(shù)量。以此計算信息增益Gain(S,D)以及信息增益比率GainRatio(S,D)[2]。

        式中,E(S,D)為D劃分出k個子集熵加權(quán)和;I(si,s2,…,sk)為S的熵。

        式中,Split_Info(S,D)代表分裂信息項。

        在選取分裂屬性當(dāng)中,根據(jù)C5.0決策樹算法,從多個分裂屬性中選擇增益比率最高的屬性,將該屬性定義為分裂屬性。確定分裂屬性后執(zhí)行最佳分割點的確定步驟,以核心數(shù)據(jù)為決策樹主干,在決策樹主干上生成k個分支。隨著信息值增加和更新,最佳分裂屬性產(chǎn)生連續(xù)變量,通過分箱策略設(shè)定劃分值,劃分值以上的樣本數(shù)據(jù)進行二次劃分,直到低于劃分值為止。通過循環(huán)分裂屬性即可生成最終的決策樹,代表決策樹模型建立完成。

        3 改進C5.0決策樹算法

        分析C5.0決策樹算法原理可知,想要實現(xiàn)該決策樹的功能,需要在每個屬性節(jié)點上急性算法運算,并且要先計算信息增益Gain(S,D),再計算信息增益比率GainRatio(S,D),這樣才能夠確定分裂屬性。整個計算過程需要對數(shù)據(jù)集S以及子集進行多次運算,雖然可以在一定程度上保證計算精度,但是整個計算流程較長,會耗費較多的時間,如果連續(xù)多次運算整體性能不夠理想。因此,本文通過引入信息熵改進屬性選擇方式。假設(shè)P為正例屬性個數(shù)、n為反例屬性個數(shù),信息量計算公式為[3]:

        由于n、p均為常量,在重復(fù)循環(huán)中,可通過信息熵選取節(jié)點屬性,期間減少了子集運算量,整個運算過程結(jié)構(gòu)更加簡單,可提高計算效率,特別是在連續(xù)計算下,其運算效率作用更加明顯。但由于本設(shè)計結(jié)果并非是精準(zhǔn)數(shù)值而是約等值,因此相比C5.0決策樹算法,改進C5.0決策樹算法的分類精度可能會略有下降,但不會對整體性能造成明顯負面影響[4]。

        4 改進C5.0決策樹在電力營銷中的應(yīng)用

        4.1 數(shù)據(jù)模型設(shè)計

        在電力企業(yè)管理系統(tǒng)(電力營銷系統(tǒng))中融入改進C5.0決策樹,以售電量為核心,搭建電力企業(yè)各部門數(shù)據(jù)庫表格之間的映射關(guān)系,從而形成整個數(shù)據(jù)模型。如基于銷售電統(tǒng)計表,可映射出供電局信息、時間、行業(yè)信息、電壓等級、電價類別。

        4.2 數(shù)據(jù)挖掘流程

        基于C5.0決策樹的電力營銷系統(tǒng)數(shù)據(jù)挖掘流程為:數(shù)據(jù)庫→數(shù)據(jù)過濾→訓(xùn)練生成決策樹→修建決策樹、分類規(guī)則庫→改進算法數(shù)據(jù)挖掘→結(jié)果輸出。

        5 試驗與結(jié)果分析

        5.1 試驗環(huán)境

        為了檢驗基于C5.0決策樹的電力營銷數(shù)據(jù)挖掘方案性能,對該決策樹進行分類方法進行驗證和分析。試驗硬件為:Inerl core i9 3.2GHz中央處理器、GTX1060@8G顯存的顯卡(圖像處理設(shè)備)、16G運存。試驗軟件為:Windows 10操作系統(tǒng)、MATLAB 8.0仿真軟件。

        5.2 改進C5.0決策樹算法性能驗證

        針對C5.0決策樹算法性能驗證試驗,本次采用了UCI機器學(xué)習(xí)數(shù)據(jù)集通過分類測試方法對比驗證。準(zhǔn)備數(shù)據(jù)集20組,每組120個數(shù)據(jù),共計2400個樣本。從中2400個樣本中挑選1000個樣本用作訓(xùn)練樣本,剩余1400個樣本作為測試樣本。每組試驗開展10次,去除最高值和最低值,剩余8個測試值取均值為最終數(shù)據(jù)[5]。

        隨著測試樣本數(shù)量逐漸增多,C5.0決策樹與改進C5.0決策樹的準(zhǔn)確率十分相近,在時間分類對比中,隨著測試樣本數(shù)量逐漸增多,改進C5.0決策樹分類時間明顯有縮短趨勢,提高了分類效率。

        5.3 改進C5.0決策樹實際應(yīng)用

        以某電力企業(yè)2021年期間電力營銷數(shù)據(jù)為采樣對象,設(shè)定電力營銷測試數(shù)據(jù)集,通過改進C5.0決策樹進行分析運算。整個數(shù)據(jù)集中包括同一個地區(qū),不同崗位用戶、不同年齡用戶的用電樣本數(shù)據(jù)。共有100個樣本數(shù)據(jù),選擇其中50個數(shù)據(jù)作為訓(xùn)練樣本,剩余50個數(shù)據(jù)作為測試樣本。通過將訓(xùn)練樣本進行改進C5.0決策樹運算,將具有最大信息增益屬性值作為決策樹的葉節(jié)點,循環(huán)決策樹執(zhí)行步驟,通過重復(fù)運算得出該數(shù)據(jù)樣本中的決策樹模型和分類規(guī)則,通過測試樣本所得到的分類決策樹進行模型驗證[6]。為了能夠更加直觀的看到改進C5.0決策樹的性能優(yōu)勢,本次試驗還同時進行了BP神經(jīng)網(wǎng)絡(luò)、ID3.0決策樹模型建立,對比分析不同模型分類準(zhǔn)確率、分類時間的差異性。見下表。

        表 不同分類模型結(jié)果對比

        通過上表可以看到,改進C5.0決策樹在分類準(zhǔn)確率、分類時間上均優(yōu)于ID3.0決策樹和BP神經(jīng)網(wǎng)絡(luò),即便是標(biāo)準(zhǔn)的C5.0決策樹相比前兩者也有明顯優(yōu)勢。在分類精準(zhǔn)率對比階段,C5.0決策樹算法以87.9%準(zhǔn)確率排在首位,第二是改進C5.0決策樹以87.0%準(zhǔn)確率排在次位,BP神經(jīng)網(wǎng)絡(luò)、ID3.0決策樹分別以83.9%、79.1%分別排列在第三和第四;在分類效率對比階段,改進C5.0決策樹算法以1.85s的分類時間排在首位,第二是C5.0決策樹以2.16s分類時間排在次位,ID3.0決策樹、BP神經(jīng)網(wǎng)絡(luò)分別以2.33s分類時間、2.69s分類時間分別排列在第三和第四。

        綜合來看,改進C5.0決策樹算法雖然在精度上略低于標(biāo)準(zhǔn)改進C5.0決策樹算法,但其分類時間非常短,相比標(biāo)準(zhǔn)改進C5.0決策樹算法有明顯優(yōu)勢,可以更快的速度完成數(shù)據(jù)分類,提高了電力營銷數(shù)據(jù)挖掘、處理效率,改進C5.0決策樹算法的綜合分類性能更強,更適用于電力營銷工作需求。

        6 結(jié)束語

        綜上所述,由于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)、ID3.0決策樹分類精度較低、分類時間較長,而C5.0決策樹算法雖然要比C4.5決策樹性能更強,但由于核心架構(gòu)不變,因此在分類時間上提升不大,影響電力營銷數(shù)據(jù)處理分析效率?;诖耍疚奶岢隽艘环N改進C5.0決策樹算法的電力營銷數(shù)據(jù)挖掘技術(shù),以C5.0決策樹算法為基礎(chǔ),通過引入信息熵的方式改進屬性選擇方式,在分類準(zhǔn)確率不受較大影響下,有效提升了增益比率計算速度,讓分類時間進一步縮短。針對改進C5.0決策樹算法性能展開實際測試,改進C5.0決策樹算法在分類時間上優(yōu)于C5.0決策樹算法,分類精準(zhǔn)性相比C5.0決策樹算法下降不到1%,綜合性能要強于C5.0決策樹算法。相比BP神經(jīng)網(wǎng)絡(luò)和ID3.0決策樹,無論是分類精準(zhǔn)度、分類時間均有明顯的優(yōu)勢。

        猜你喜歡
        數(shù)據(jù)挖掘分類信息
        分類算一算
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        人妻少妇精品视频一区二区三区l| 亚洲国产成人久久综合一区77| 亚洲精品国产福利在线观看 | 久久婷婷五月综合色高清| 国产亚洲精品aaaa片小说| 亚洲A∨无码国产精品久久网| 中文少妇一区二区三区| 国产自拍精品视频免费| 国产特级毛片aaaaaa| 热久久这里只有| 中文字幕你懂的一区二区| 青青草成人在线免费视频| 看av免费毛片手机播放| 97人妻碰免费视频| av免费网站不卡观看| 妺妺窝人体色www在线| 老师脱了内裤让我进去| 亚洲av日韩片在线观看| 久久亚洲精品一区二区三区| 成人内射国产免费观看| 亚洲人成网7777777国产| 国产极品喷水视频| 美女扒开内裤让我捅的视频| 国产精品久久国产精品99| 亚洲一区二区在线| 国产精品一区二区三区女同| 插鸡网站在线播放免费观看| 熟妇人妻av无码一区二区三区| 亚洲无码视频一区:| 国产一级一区二区三区在线播放| 天堂网www资源在线| 国产鲁鲁视频在线播放| 69精品人妻一区二区| 国产av精品一区二区三| 丰满五十六十老熟女hd| 日本女优在线观看一区二区三区| 风韵犹存丰满熟妇大屁股啪啪| 国产性生大片免费观看性| 毛片av在线播放亚洲av网站| 日本岛国一区二区三区四区| 男人的天堂无码动漫av|