蔡艷婧 陸健 曹春梅 徐立
摘 要:電力系統(tǒng)所用的用戶畫像不能對用戶行為進行精準識別,導致無法滿足電力企業(yè)的需求。本研究提出基于綜合用電指數(shù)的用戶畫像,利用綜合用電指數(shù)構建指標體系,再根據(jù)用戶信息建立行為標簽庫,根據(jù)指標評分來計算綜合用電指數(shù),最后用Canopy改進K-means算法生成用戶畫像。通過案例分析可以看出,該方法能夠精確地分析出用戶的用電習慣,并對用戶提出指導性意見,避免資源的浪費。
關鍵詞:電力;用電指數(shù);用戶畫像;綜合
中圖分類號:TP181 ? ? 文獻標志碼:A ? ? 文章編號:1003-5168(2022)12-0021-04
DOI:10.19968/j.cnki.hnkj.1003-5168.2022.12.004
Research on User Portrait Based on Comprehensive Power
Consumption Index
CAI Yanjing? ? LU Jian? ? CAO Chunmei? ? XU Li
(School of Electronics and Information,Jiangsu Vocational College of Commerce and Trade,Nantong 226001,China)
Abstract:The user portrait used in power system can not accurately identify the user behavior and can not meet the needs of power enterprises.The research on user portrait based on comprehensive power consumption index is proposed.The index system is constructed by using the comprehensive power consumption index,and then the behavior label library is established according to the user information.The comprehensive power consumption index is calculated according to the index score.Finally,the user portrait is generated by using Canopy improved K-means algorithm.Through case analysis,it can be seen that the design method can accurately analyze the habits of users,put forward guiding opinions for users,avoid resource waste.
Keywords:electric power;electricity consumption index;user portrait;comprehensive
0 引言
隨著科學技術的發(fā)展,用電用戶的數(shù)量在不斷增加,對電量的需求也越來越大[1]。智能用電是當下最主要的用電方式,智能電網在運行時會產生大量的用戶數(shù)據(jù),對這些信息進行分析,從而得出不同用戶的用電特征,根據(jù)這些特征能夠對用戶進行分類,并根據(jù)用戶需求隨時調整電力系統(tǒng)[2]。
在智能用電站的配電系統(tǒng)中,對用戶的用電情況進行監(jiān)測,采集不同用戶的用電習慣、用電信息、用電負荷等數(shù)據(jù),并構建用戶的用電畫像[3]。
對電力企業(yè)而言,用戶畫像能夠給企業(yè)帶來很好的商業(yè)價值。通過分析不同地區(qū)的用電畫像,找尋電力企業(yè)的潛在用戶[4]。與此同時,對老用戶的用戶畫像進行分析,構造用戶的虛擬形象,分析用戶的用電習慣和行為。
在利用用戶畫像對用電用戶進行分析時,不同的用戶會形成不同的畫像特點[5]。電力用電畫像是以用戶用電信息為基礎構建而成的,具有一定的代表性和特殊性。利用用戶畫像對用電用戶的個體差異性進行標記,挖掘用戶的用電行為特征,一方面能夠實現(xiàn)不同用戶的特殊供電調度,另一方面能夠對用戶進行系統(tǒng)化管理[6]。
現(xiàn)有的電力系統(tǒng)采用單一的方式來構建用戶畫像,不能精準地對用戶的用電需求、用電特征、信用體系等要素進行分析[7]。鑒于此,本研究從綜合用電指數(shù)的角度出發(fā),研究用戶的用電特征,形成臉譜化的畫像,為客戶管理提供個性化描述,并采集用戶畫像,在此基礎上提出合理的用電方案,促進用戶合理用電。
1 基于綜合用電指數(shù)的用戶畫像研究
1.1 構建綜合用電指數(shù)指標體系
參考用戶的實際用電情況等信息,從電力企業(yè)的角度出發(fā),結合當下的整體經濟狀況和電力行業(yè)的運行情況,對綜合用電指數(shù)的指標進行規(guī)范化定義[8]。
在考慮電力企業(yè)和用戶自身因素的同時,還要充分對外界因素進行考量。一方面專業(yè)人員運用宏觀經濟景氣指數(shù)對具體走勢進行分析[9],從行業(yè)整體趨勢來分析用戶的各個指標信息。另一方面,對行業(yè)景氣指數(shù)進行綜合分析,對比不同時間段的各個用戶用電情況,對不同情況進行具體分析。
通過前文所闡述的兩方面,結合內外部因素,對管區(qū)內的用戶用電情況進行調研,了解實際情況,形成初步調研數(shù)據(jù)。按照電力系統(tǒng)輻射區(qū)域、輸電纜的導電性能、傳輸過程中的能源損耗等指標,對調研數(shù)據(jù)進行分類整理,建立綜合用電指數(shù)的指標體系[10]。
本研究所建立的指標體系分為3個等級(見表1)。
本研究所建立的指標體系內的數(shù)據(jù)是通過前期調研、電力單位直接提供、電力采集系統(tǒng)綜合數(shù)據(jù)等途徑進行整合的結果,具有普遍性。
1.2 獲取用戶信息,建立行為標簽庫
用戶行為標簽的建立是以用戶的特征信息為基礎,是對用戶行為特征和用電習慣進行綜合分析后的結果。
用戶行為標簽是用戶畫像的重要組成部分。行為標簽所標記的用戶,其用電習慣、繳費習慣和途徑、每日耗電量都被用戶畫像顯示出來。與此同時,用戶的用電傾向和生活中的用電要求可通過聚類算法進行計算分析,使用戶畫像能夠更精確地對用戶行為進行描繪。
通過大數(shù)據(jù)梳理用戶信息數(shù)據(jù)的標簽,深度挖掘用戶用電日志管理記錄系統(tǒng),通過編程連接數(shù)據(jù)庫,提取數(shù)據(jù)并更新數(shù)據(jù)進行存儲;也可將用戶的信息數(shù)據(jù)以文件的形式存儲在本地系統(tǒng)中,等到聯(lián)網時再接入標簽庫。將用戶標簽數(shù)據(jù)進行分類,并以源表數(shù)據(jù)的形式進行存儲,在后續(xù)用戶畫像繪制時,可以利用不同的數(shù)據(jù)規(guī)則獲取標簽寬表。
1.3 指標評分法計算綜合用電指數(shù)
對用戶的用電數(shù)據(jù)進行定性和定量分析,其目的是將用戶的用電數(shù)據(jù)進行綜合化、信息化處理,為后續(xù)定量分析提供數(shù)據(jù)。影響用電指數(shù)的主要因素有不同用戶的用電指標以及同時間段的能源消耗量,對用戶進行等級的排序和分類,再通過行為標簽庫對用戶進行系統(tǒng)性評價。通過指標體系將用戶分散的數(shù)據(jù)信息進行整合分類處理,形成標準化的行為標簽。
使用用戶用電指數(shù)指標體系進行綜合分析,在對用戶指標建立完整的、標準化的計算方法后,利用隸屬度函數(shù)對用戶的綜合用電指數(shù)進行整體計算(見圖1)。設置函數(shù)的基礎標準值為60,數(shù)據(jù)最高極限值為100。根據(jù)所設定的數(shù)值,計算兩者之間的數(shù)據(jù)差值,橫軸上的d是預期指標,縱軸上的S是預期指標在函數(shù)數(shù)據(jù)差值之間的位置,同時該數(shù)值也顯示出第三個等級指標的具體數(shù)值。
圖1中的指標函數(shù)是基于定量數(shù)據(jù)的指標。對定性指標的評定準則進行設定,分為優(yōu)秀、良好、中等、合格、較差這五個等級。評價標準設置為百分滿分制,因此,定性指標的五個等級分別為90~100分為“優(yōu)秀”、80~90分為“良好”、70~80分為“中等”、60~70分為“合格”、60分以下為“較差”。然后通過定量評價和定性評價進行綜合計算,得到每個用戶的評價眾數(shù),再對不同地區(qū)的用戶評價眾數(shù)求平均值,最終的平均值為用戶綜合用電指數(shù)的評價結果。
1.4 生成用電用戶畫像
根據(jù)計算出的不同用戶的綜合用電指數(shù),再用聚類分析法對用戶的用電指數(shù)進行行為計算。結合行為標簽庫中用戶的用電消耗量、電力系統(tǒng)的用電準則、綠色用電習慣等,對用戶進行種類劃分。結合以上兩方面,輸出用戶畫像,其能夠準確地分析出用戶的行為習慣、消耗電量、繳費習慣等,對用戶的特征進行提取,為電力單位和用電用戶提供方便。
對用戶用電日負荷曲線和燃氣日消耗曲線進行聚類分析。由于這兩類曲線中的數(shù)據(jù)都具有高維度的特點,因此,在聚類分析中會產生大量的復雜計算。為了提高分析效率,引入Canopy+改進K-means算法,首先對用戶的用電數(shù)據(jù)進行預處理,并歸類分析,降低總數(shù)據(jù)量,在此基礎上進行K-means聚類,可大幅度降低運算量,降低對計算機的運算載荷需求,提高處理效率。通過Canopy算法對數(shù)據(jù)進行預處理,輸出數(shù)據(jù)的Canopy子集,設置該Canopy子集為K-means算法的原始計算核心,同時確定K值[11]。算法流程設計為:運行Canopy算法進行預聚類;得到K個Canopy子集及其Canopy質心;在此基礎上運用K-means算法,以K個Canopy質心為初始聚類中心進行算法迭代,直至收斂。
采用Canopy聚類算法進行預分類如下。
①生成樣本列表[List=[x1,x2,x3,...,xn]],根據(jù)一定策略確定初始距離閾值[T1]、[T2],且[T1]>[T2]。
②從列表[List=[x1,x2,x3,...,xn]]中無規(guī)則地抽選出一個試驗數(shù)據(jù),將該數(shù)據(jù)設置為原始Canopy質心,記為O,并為其生成一個子集So,即Canopy子集,作為當前基準;
③再次從列表[List=[x1,x2,x3,...,xn]]剩余的樣本點中隨機選取一個數(shù)據(jù),記為Q,設其到O的距離為D。根據(jù)強弱規(guī)則處理Q點:若[D]>[T1],則Q生成新Canopy子集,并將Q從列表List中刪除;若[D]≤[T1],則將Q弱標記,且Q放入So子集;若[D]≤[T2],則將Q強標記,且Q放入So子集。
不斷對數(shù)據(jù)進行迭代,循環(huán)執(zhí)行第三步,直到輸出的數(shù)據(jù)List中元素數(shù)目清零,完成Canopy聚類運算。
2 案例分析
為了檢驗本研究設計的指標體系的應用效果,選取管區(qū)內A、B、C、D 4家典型企業(yè)用戶作為試驗對象。監(jiān)測時間為2020年10月到2021年9月,分析其用電情況。通過對用電情況進行調研和考察,同時參考企業(yè)的基本信息和信用體系評分等信息,依據(jù)綜合用電指數(shù)指標體系的評價方法,繪制客戶的外部特征。綜合用電指數(shù)結果如表2所示。
在不同的二級指標考核下,4家企業(yè)的得分綜合體現(xiàn)為一個外在的表現(xiàn)特征,對這4家企業(yè)進行用電畫像的繪制,結果如圖2所示。
通過對用戶用電畫像進行分析,可以看出,A企業(yè)的用電行為習慣良好,企業(yè)在用電時能夠遵循經濟用電的原則,避免能源的浪費,與另外3家企業(yè)相比,其有著十分明顯的優(yōu)勢,對該企業(yè)的建議是繼續(xù)保持企業(yè)的用電習慣,合理分類用電,關注企業(yè)過剩能源的回收,同時可以將企業(yè)的用電策略向外推廣,起到區(qū)域用電協(xié)作環(huán)保的作用,促進該地區(qū)的綠色環(huán)保用電習慣的形成。與另外幾家企業(yè)相比,A企業(yè)在互動用電方面存在著許多不足,在今后的用電優(yōu)化方面應該著重注意提升互動用電。B企業(yè)和C企業(yè)的用戶畫像表明這兩家企業(yè)的用電習慣較差,資源浪費的較多,無法做到經濟綠色用電,沒有形成對資源的再循環(huán)利用,尤其是在用電穩(wěn)定性和用電合理分配上存在著嚴重的不足,但這兩家企業(yè)在互動用電方面表現(xiàn)良好,建議B企業(yè)和C企業(yè)在今后的用電優(yōu)化方面將重點放到提升經濟綠色用電上,注重資源的回收再利用。從D企業(yè)的用戶畫像中可以看出,該企業(yè)的綜合用電指數(shù)很高,只有在綠色用電方面存在著不足,在今后的用電優(yōu)化中應該多關注綠色用電,調整電力資源的配置方案,提高電力資源的利用率。
綜上所述,基于綜合用電指數(shù)的用戶畫像能夠將用戶的用電習慣特征精準形象地表現(xiàn)出來,對用戶自身和電力系統(tǒng)的用電優(yōu)化都起著指導性作用。
3 結語
本研究利用綜合用電指數(shù)建立了全面系統(tǒng)的用戶畫像。通過對用戶畫像的分析,能夠得出不同用戶的用電信息和行為特征,方便電力系統(tǒng)對用戶的用電進行調度。通過實例分析可以看出,本研究所設計的用戶畫像能夠對用戶的行為特征進行精準分析,供電企業(yè)可根據(jù)用戶畫像規(guī)劃供電方案等。但由于時間的限制,本研究沒有對大量的用戶進行分析,在今后的研究中還要進一步完善用戶畫像,為用電分析提供更多的幫助。
參考文獻:
[1] 陸曉,徐春雷,冷釗瑩,等.基于數(shù)據(jù)驅動方法的疫情階段電力用戶負荷特性畫像模型[J].電力建設,2021(2):93-106.
[2] 王立斌,馬浩,楊鵬,等.基于用電信息的電力能效服務潛在客戶挖掘[J].電力大數(shù)據(jù),2020(9):34-41.
[3] 周玲,鐘璐,黃淵軍,等.用戶畫像和標簽在電力服務系統(tǒng)中的應用研究[J].自動化儀表,2021(5):10-13.
[4] 趙晉泉,夏雪,劉子文,等.電力用戶用電特征選擇與行為畫像[J].電網技術,2020(9):3488-3496.
[5] 時珊珊,田英杰,金瑞楊,等.基于聚類的電網低壓臺區(qū)用電畫像方法研究[J].電工電能新技術,2020(8):66-74.
[6] 陳佳,陳輝,成飛.浙江居民用電需求的影響因素研究及定量預測[J].大眾標準化,2020(15):124-125.
[7] 羅金滿,溫兆聰,董文杰,等.基于居民用戶畫像的綜合能源需求響應潛力量化模型[J].可再生能源,2020(10):1407-1414.
[8] 張琳娟,許長清,王利利,等.基于多維度能耗分析的園區(qū)用戶畫像模型[J].可再生能源,2021(8):1078-1086.
[9] 張壯,馮小年,錢鐵云.基于多模態(tài)融合技術的用戶畫像方法[J].北京大學學報(自然科學版),2020(1):105-111.
[10] 王利利,張琳娟,許長清,等.能源互聯(lián)網背景下園區(qū)用戶畫像及成熟度評價模型研究[J].中國電力,2020(8):19-28.
[11] 杜佳穎,段隆振,段文影,等.基于Spark的改進K-means算法的并行實現(xiàn)[J].計算機應用研究,2020(2):434-436,497.