盛紅雷
(南京南瑞信息通信科技有限公司,江蘇 南京 210000)
目前傳統(tǒng)電力企業(yè)的抄表采用人工抄表或者進(jìn)行插卡購電,往往給用電用戶和供電企業(yè)帶來不便,經(jīng)常出現(xiàn)夜間停電無處購電插卡導(dǎo)致用戶對(duì)用電企業(yè)不滿,也會(huì)出現(xiàn)人工抄表出現(xiàn)誤差導(dǎo)致用戶企業(yè)受到經(jīng)濟(jì)損失,無法對(duì)這些情況進(jìn)行智能化分析管理進(jìn)一步提升用戶滿意度,提升電力企業(yè)的服務(wù)水平。而隨著我國信息化技術(shù)的不斷發(fā)展,在指數(shù)級(jí)增加的電力數(shù)據(jù)中,可以通過大數(shù)據(jù)技術(shù),不斷挖掘目前存在的問題,給出智能化的解決方案,使得用電用戶安心安全用電,用電企業(yè)經(jīng)濟(jì)收益社會(huì)貢獻(xiàn)得到平衡,更好地服務(wù)于小康社會(huì)的建設(shè)。
大數(shù)據(jù)是目前比較火熱的一個(gè)新數(shù)據(jù),同AI人工智能一起被大家重視,而數(shù)據(jù)挖掘就是利用相關(guān)分析工具對(duì)海量的大數(shù)據(jù)進(jìn)行建模的工程,通過對(duì)大數(shù)據(jù)的規(guī)律進(jìn)行分析,找出其與相關(guān)模型之間的關(guān)系,不斷的修正模型達(dá)到充分匹配??梢酝ㄟ^所建立的模型來合理預(yù)測未來數(shù)據(jù)的走向,業(yè)務(wù)的發(fā)展趨勢,相關(guān)數(shù)據(jù)之間的關(guān)聯(lián),為企業(yè)了解現(xiàn)狀和進(jìn)行決策提供充分依據(jù)。數(shù)據(jù)挖掘的流程是各行各業(yè)目前數(shù)據(jù)挖掘的過程綜合總結(jié)展示,這個(gè)過程通過不斷的實(shí)踐和完善的動(dòng)態(tài)更新,通過對(duì)商業(yè)的理解、對(duì)數(shù)據(jù)的理解、大數(shù)據(jù)的準(zhǔn)備、初步建立模型、模型的評(píng)估更新和模型的部署6個(gè)步驟。其中商業(yè)地理解為掌握商業(yè)目標(biāo),了解業(yè)務(wù)的需求,將數(shù)據(jù)挖掘充分和需求相結(jié)合;對(duì)數(shù)據(jù)地理解為對(duì)獲取的數(shù)據(jù)進(jìn)行篩選,按照業(yè)務(wù)中產(chǎn)生的數(shù)據(jù)進(jìn)行選??;大數(shù)據(jù)的準(zhǔn)備為對(duì)業(yè)務(wù)中可用的原始數(shù)據(jù)源按照模型進(jìn)行清洗,達(dá)到后面建立模型的數(shù)據(jù)格式需求;建立模型為最關(guān)鍵的一個(gè)步驟,需要使用到多種不同的建模技術(shù)和方法,不斷更新業(yè)務(wù)數(shù)據(jù)模型參數(shù),將數(shù)據(jù)關(guān)聯(lián)、分類和預(yù)測,從而建立適合本業(yè)務(wù)需求的模型;模型評(píng)估指的是評(píng)估所建立的模型的有效性,是否和業(yè)務(wù)的需求相吻合;最后就是模型的部署,對(duì)模型進(jìn)行實(shí)際應(yīng)用在實(shí)際業(yè)務(wù)中,發(fā)揮數(shù)據(jù)挖掘的巨大作用。
大數(shù)據(jù)技術(shù)中數(shù)據(jù)挖掘的方法有很多種,目前常用的有回歸分析、聚類分析、神經(jīng)網(wǎng)絡(luò)、決策樹和可視化這5種方法?;貧w分析是目前行業(yè)內(nèi)常用的數(shù)據(jù)預(yù)測性分析模型,可以根據(jù)大量的歷史數(shù)據(jù)來尋找相關(guān)規(guī)律,根據(jù)規(guī)律得出線性回歸方程,從而預(yù)測相關(guān)業(yè)務(wù)的發(fā)展趨勢;聚類分析方法是將業(yè)務(wù)中相類似的對(duì)象進(jìn)行歸類,對(duì)不同類別的對(duì)象進(jìn)行類別劃分,通過聚類分析技術(shù)將所有類別映射到對(duì)應(yīng)類別中,從而實(shí)現(xiàn)業(yè)務(wù)分類及趨勢預(yù)測;神經(jīng)網(wǎng)絡(luò)也是大數(shù)據(jù)中常用的模仿人類腦部神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)而建立的一種計(jì)算模型,可以針對(duì)一些與人類思維相似的業(yè)務(wù)進(jìn)行數(shù)據(jù)挖掘;決策樹是根據(jù)業(yè)務(wù)發(fā)展的關(guān)聯(lián)情況而生成的自上而下的樹形結(jié)構(gòu),決策樹對(duì)解決與多維數(shù)據(jù)業(yè)務(wù)相關(guān)的業(yè)務(wù)非常有效的一種數(shù)據(jù)挖掘方法;可視化是數(shù)據(jù)挖掘中提供給用戶一個(gè)可以直觀進(jìn)行人機(jī)互動(dòng)的平臺(tái),也是大數(shù)據(jù)中一種方法。
在電力企業(yè)進(jìn)行大數(shù)據(jù)挖掘的應(yīng)用按照大數(shù)據(jù)挖掘的流程,首先需要進(jìn)行商業(yè)理解,智能抄表工作是電力企業(yè)進(jìn)行電費(fèi)電價(jià)電量管理的一個(gè)非常重要的環(huán)節(jié)。其中的抄表是業(yè)務(wù)數(shù)據(jù)的來源,通過精確整理抄表數(shù)據(jù)可以減少抄表的誤差,接下來對(duì)電費(fèi)的核算是影響電價(jià)和電量管理很重要的一個(gè)步驟,可以精確得知各個(gè)單位行業(yè)的用電量電費(fèi)情況,最后再進(jìn)行電費(fèi)收取,將相關(guān)收據(jù)發(fā)送給用電用戶。通過智能抄表了解用戶繳費(fèi)、欠費(fèi)情況,了解用戶用電量、用電單價(jià)情況,進(jìn)而做出對(duì)未來用電量和單價(jià)的預(yù)測和調(diào)整。這樣的管理方式極大的提升了工作效率,有效降低了成本,從商業(yè)角度考慮是極為有利的,故在電力企業(yè)中,不斷地加深對(duì)于大數(shù)據(jù)的應(yīng)用力度,并挖掘更好的方法。
在收集到智能抄表的基礎(chǔ)數(shù)據(jù)后,需要對(duì)數(shù)據(jù)進(jìn)行理解。目前隨著傳統(tǒng)電表改造業(yè)務(wù)的不斷推進(jìn),所收集到基礎(chǔ)數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)增長的趨勢,這些基礎(chǔ)數(shù)據(jù)符合大數(shù)據(jù)所包含的5個(gè)特性:大體量、多樣性、時(shí)效性、準(zhǔn)確性和大價(jià)值。
其中大體量體現(xiàn)在智能抄表數(shù)據(jù)包括用戶的用電信息、繳費(fèi)信息、歷史信息等,隨著電表改造用戶越來越多,每月的基礎(chǔ)數(shù)據(jù)呈現(xiàn)出千萬級(jí)增長趨勢;多樣性體現(xiàn)在智能抄表所得到的數(shù)據(jù)包括不同單位、行業(yè)及個(gè)人用戶的數(shù)據(jù),數(shù)據(jù)格式的內(nèi)容多種多樣;時(shí)效性體現(xiàn)在智能抄表為實(shí)時(shí)抄錄,需要按時(shí)繳費(fèi)處理才能繼續(xù)用電,所獲取的數(shù)據(jù)都是實(shí)時(shí)數(shù)據(jù);準(zhǔn)確性體現(xiàn)在抄錄的數(shù)據(jù)與用戶的繳費(fèi)息息相關(guān),智能抄表采用NB-IOT技術(shù)實(shí)時(shí)上報(bào)數(shù)據(jù),抄錄的數(shù)據(jù)非常精準(zhǔn);大價(jià)值體現(xiàn)在抄錄的數(shù)據(jù)包括多維深度價(jià)格,需要對(duì)其進(jìn)行仔細(xì)分析和挖掘,尋找可用規(guī)律和價(jià)值,做出相應(yīng)預(yù)測,為電力企業(yè)日常管理決策提供參考。
模型的構(gòu)建對(duì)于工作的開展來說是一個(gè)重要指導(dǎo),有了科學(xué)的模型,工作開展便有了依據(jù)。大數(shù)據(jù)建立模型的步驟一般有3步:簡單報(bào)表、數(shù)據(jù)集市和數(shù)據(jù)倉庫。根據(jù)電力企業(yè)智能抄表業(yè)務(wù)的相關(guān)特性,對(duì)相關(guān)業(yè)務(wù)中的關(guān)鍵數(shù)據(jù)建立對(duì)應(yīng)的數(shù)據(jù)模型,再通過數(shù)據(jù)模型對(duì)抄表數(shù)據(jù)進(jìn)行歸類和處理,以便形成各個(gè)階段的數(shù)據(jù)模型。針對(duì)簡單報(bào)表,需要根據(jù)日常電力企業(yè)員工工作需要,生成日常使用的定制化統(tǒng)計(jì)表格;到了數(shù)據(jù)集市這一步,需要按照電力企業(yè)業(yè)務(wù)對(duì)抄收數(shù)據(jù)進(jìn)行整理多維輸出,進(jìn)行直觀展示為多維業(yè)務(wù)分析應(yīng)用提供決策依據(jù);最后數(shù)據(jù)倉庫建立符合電力企業(yè)的固定模型,通過數(shù)據(jù)倉庫生成對(duì)電力業(yè)務(wù)具有價(jià)值的數(shù)據(jù),為電力企業(yè)管理和決策提供數(shù)據(jù)依據(jù)。
電力企業(yè)對(duì)于大數(shù)據(jù)挖掘技術(shù)的應(yīng)用最廣泛是對(duì)智能抄表數(shù)據(jù)的收集、分析和挖掘。智能抄表數(shù)據(jù)的分析應(yīng)用平臺(tái)是一個(gè)采用數(shù)據(jù)挖掘方法對(duì)智能電表抄收的用戶數(shù)據(jù)進(jìn)行分析應(yīng)用的平臺(tái)。該平臺(tái)的最大應(yīng)用目前就是可視化展示,通過大顯示屏,對(duì)所有收集的數(shù)據(jù)進(jìn)行分析和展示,比如電費(fèi)應(yīng)收率情況、欠費(fèi)情況、電費(fèi)各個(gè)行業(yè)平均單價(jià)、電力負(fù)荷情況、日月年用電量情況、歷史用電量情況、未來用電量預(yù)測等,可以通過柱狀圖、餅狀圖、折線圖等直觀展示。通過對(duì)數(shù)據(jù)模型的關(guān)鍵因素提供可視化界面,使得電力企業(yè)可以非常直觀、清晰、準(zhǔn)確、簡介地看到全面的數(shù)據(jù),對(duì)自己關(guān)注的數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)控。在重大電力保障時(shí)候可以重點(diǎn)展示當(dāng)前片區(qū)的用電相關(guān)指標(biāo),為保障決策提供參考依據(jù)。
在提供相應(yīng)電力數(shù)據(jù)的展示和分析可視化界面后,還有一個(gè)重要應(yīng)用就是抄表統(tǒng)計(jì),可以通過數(shù)據(jù)挖掘?qū)χ悄艹硖峁?duì)應(yīng)的報(bào)表分析模塊,滿足電力企業(yè)日常各種報(bào)表和報(bào)告的需要,通過定制模板直接生成定制化報(bào)表,大量的減輕電力企業(yè)日常工作人員的工作負(fù)擔(dān),更智能高效準(zhǔn)確地對(duì)各項(xiàng)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。
比如可以通過對(duì)目前用電量的情況制作分析報(bào)表,可以按照單位或者行業(yè)分類對(duì)當(dāng)月用電量進(jìn)行對(duì)比,得到不同單位或者行業(yè)的用電量情況,結(jié)合對(duì)電價(jià)的分析,從而制定更加合理的電價(jià)結(jié)構(gòu),通過電價(jià)變動(dòng)拉動(dòng)作用,不斷提升企業(yè)的用電效率,從而改變企業(yè)的用電習(xí)慣,減少對(duì)電力資源的浪費(fèi)。
綜合上文所述,本文對(duì)目前比較熱門的大數(shù)據(jù)挖掘技術(shù)的流程和相關(guān)方法進(jìn)行了簡單介紹,對(duì)電力企業(yè)在大數(shù)據(jù)挖掘方面的挖掘方法的商業(yè)理解、數(shù)據(jù)理解和建立模型3個(gè)方面進(jìn)行了介紹,最后對(duì)目前大數(shù)據(jù)挖掘技術(shù)在電力企業(yè)中的應(yīng)用現(xiàn)狀進(jìn)行了研究,主要從可視化和抄表統(tǒng)計(jì)2個(gè)方面進(jìn)行了論述。同目前傳統(tǒng)的電力企業(yè)的數(shù)據(jù)統(tǒng)計(jì)方法相比,大數(shù)據(jù)挖掘技術(shù)的智能預(yù)測能力和給出解決方案的能力是傳統(tǒng)方法無法達(dá)到的,大數(shù)據(jù)挖掘技術(shù)的應(yīng)用使得電力企業(yè)可以針對(duì)用戶進(jìn)行個(gè)性化定制服務(wù),可以為電力用戶帶來滿意的效果,同時(shí)為電力企業(yè)帶來效益。