陳俐冰,何 容,邱 林,王 穎,孫天昊
(1.國網(wǎng)重慶市電力公司 客戶服務中心,重慶 400017;2.重慶大學 計算機學院,重慶 400044)
電力客服中心用戶行為分析研究與實現(xiàn)
陳俐冰1,何 容1,邱 林1,王 穎1,孫天昊2
(1.國網(wǎng)重慶市電力公司 客戶服務中心,重慶 400017;2.重慶大學 計算機學院,重慶 400044)
目前電力客服中心已經(jīng)開展了多元化服務渠道為客戶提供全方位的服務,但缺少對各渠道的深度挖掘和分析。針對這種情況,提出基于大數(shù)據(jù)進行電力客服中心用戶行為分析,將為多個電力客戶服務渠道建立智能在線監(jiān)測分析系統(tǒng)。首先進行分布式多線程的數(shù)據(jù)采集,然后基于大數(shù)據(jù)從多維度進行用戶在線行為分析,包括統(tǒng)計分析和聚類分析等。其中統(tǒng)計分析包括服務渠道指標、服務功能總指標、單個服務功能指標、客戶訪問時間指標、客戶區(qū)域分布等,聚類分析采用K-means聚類根據(jù)忠誠度、使用頻度、貢獻度三個指標進行用戶細分挖掘分析。實現(xiàn)的系統(tǒng)能夠獲得各渠道的客戶行為特性,為企業(yè)全面掌握各服務渠道提供了支撐,有助于提供更為智能便捷的個性化服務。
大數(shù)據(jù);電力大數(shù)據(jù);數(shù)據(jù)挖掘;用戶行為分析
隨著數(shù)字信息化時代的迅猛發(fā)展,信息量也呈爆炸性增長態(tài)勢。近年來,電力行業(yè)信息化發(fā)展迅速,特別是伴隨著下一代智能化電網(wǎng)的全面建設,以物聯(lián)網(wǎng)和云計算為代表的新一代IT技術在電力行業(yè)得到廣泛應用,電力數(shù)據(jù)資源開始急劇增長并形成了一定的規(guī)模。
電力大數(shù)據(jù)是以業(yè)務趨勢預測、數(shù)據(jù)價值挖掘為目標,利用數(shù)據(jù)集成管理、數(shù)據(jù)存儲、數(shù)據(jù)計算、分析挖掘等方面的核心關鍵技術,實現(xiàn)面向典型業(yè)務場景的模式創(chuàng)新及應用提升[1]。電力大數(shù)據(jù)的應用將推動公司業(yè)務發(fā)展和管理水平。其中客戶服務中心是公司優(yōu)化整合服務資源,打造“全業(yè)務、全天候,服務專業(yè)化、管理精益化、發(fā)展多元化”的供電服務平臺。
目前重慶電力客服中心已經(jīng)開展了多元化服務渠道為客戶提供全方位的服務,包括短信、網(wǎng)站、手機APP、微信、有線電視等。
文中將基于電力大數(shù)據(jù)對電力客服中心的用戶行為進行分析研究。用戶行為的研究與心理學、社會學、社會心理學、人類學以及一切與網(wǎng)絡行為的學科密切相關,它研究網(wǎng)絡用戶行為的規(guī)律性,借以控制并預測網(wǎng)絡用戶行為,并實現(xiàn)特定的目標。具體來說,網(wǎng)絡用戶行為研究就是分析網(wǎng)絡用戶的構成、特點及其行為表現(xiàn)出來的規(guī)律[2]。
對短信、網(wǎng)站、手機APP、微信、有線電視等多個電力客戶服務渠道建立智能在線監(jiān)測分析應用,進行分布式多線程的數(shù)據(jù)采集,從多維度進行用戶在線行為分析,研究用戶行為,各渠道的客戶群體特性,為提供更為智能便捷的服務奠定基礎。進行全面系統(tǒng)的用戶行為分析,有助于掌握各渠道客戶實際使用情況,為有針對性地進行各服務渠道的優(yōu)化提升,進一步提供個性化服務定制奠定基礎。
目前基于大數(shù)據(jù)的用戶行為分析最常用的技術是數(shù)據(jù)挖掘技術,包括大數(shù)據(jù)平臺的構建、數(shù)據(jù)整合、數(shù)據(jù)挖掘、分析展示等方法。
文獻[2-3]研究了基于大數(shù)據(jù)的網(wǎng)絡用戶行為分析。文獻[4]實現(xiàn)了一個基于數(shù)據(jù)挖掘技術的電網(wǎng)用戶行為分析系統(tǒng)進行用電客戶細分、客戶信用等級評估和欠費高風險客戶預測。文獻[5]提出了一個基于大數(shù)據(jù),云計算和智能網(wǎng)格的關系分析的電力大數(shù)據(jù)平臺的通用框架。電力大數(shù)據(jù)的關鍵技術包括大數(shù)據(jù)管理技術、大數(shù)據(jù)分析技術、大數(shù)據(jù)處理技術和大數(shù)據(jù)可視化技術。
文獻[1,6-7]研究了大數(shù)據(jù)技術在電力行業(yè)的具體應用。其中,文獻[1]利用大數(shù)據(jù)技術應用于客戶服務中心,可實現(xiàn)面向典型業(yè)務場景的模式創(chuàng)新及應用提升,包括服務質量實時監(jiān)控,熱點問題集中處理等。文獻[6]根據(jù)電力行業(yè)特征,分析了電力大數(shù)據(jù)的生成階段、大數(shù)據(jù)的應用方式等。文獻[7]討論了大數(shù)據(jù)時代下電力企業(yè)數(shù)據(jù)挖掘的過程。
文獻[8-11]研究了數(shù)據(jù)挖掘技術在客戶服務中的應用。其中,文獻[8]具體研究了數(shù)據(jù)挖掘技術在電信客戶服務的應用。文獻[9]提出了一個大數(shù)據(jù)應用框架來分析客戶行為。首先客戶相關數(shù)據(jù)被轉化為拓撲數(shù)據(jù)結構,然后使用拓撲關系生成共生矩陣,并用來為客戶行為分析推導馬爾可夫鏈模型。文獻[10]提出并實現(xiàn)了一個網(wǎng)絡用戶行為分析系統(tǒng),該系統(tǒng)基于Hadoop分布式平臺獲取流量,分析用戶行為。文獻[11]通過個案研究,大數(shù)據(jù)分析支持創(chuàng)建,提高和增強各種商業(yè)服務,既能顯著提高客戶體驗,又能為企業(yè)創(chuàng)造價值。
基于目前大數(shù)據(jù)技術和數(shù)據(jù)挖掘技術,研究和實現(xiàn)了電力客戶服務中心的用戶行為分析系統(tǒng)。
2.1 系統(tǒng)流程
系統(tǒng)按照圖1所示流程進行。先從多個數(shù)據(jù)源中基于大數(shù)據(jù)平臺進行數(shù)據(jù)采集,具體數(shù)據(jù)源包括為客戶提供全方位服務的短信、網(wǎng)站、手機APP、微信、有線電視等多元化服務渠道所產(chǎn)生的客戶服務數(shù)據(jù),具體包括用電查詢、電費繳納、業(yè)務辦理、信息訂閱、服務開通等。接著對采集到的數(shù)據(jù)進行建模,包括數(shù)據(jù)約簡和轉換等環(huán)節(jié),形成標準化的可以使用的數(shù)據(jù),如統(tǒng)一標準的服務功能訪問記錄等。建模好的數(shù)據(jù)通過Sqoop工具進行抽取,整合到Hadoop大數(shù)據(jù)平臺的分布式數(shù)據(jù)庫HBase中。然后使用數(shù)據(jù)挖掘技術進行具體的用戶行為分析,從多維度(如服務渠道指標、服務功能總指標、單個服務功能指標、客戶訪問時間指標、客戶區(qū)域分布等)進行包括用戶行為特征、客戶群體特性、服務渠道特征等行為分析。最后進行可視化的結果展示,包括柱狀圖、曲線圖、餅圖和條形圖等,為進一步?jīng)Q策提供支撐。
圖1 用戶行為分析流程
2.2 系統(tǒng)設計
用戶行為分析系統(tǒng)的功能包括數(shù)據(jù)采集與建模、數(shù)據(jù)挖掘與分析、結果可視化展示等關鍵內容,如圖2所示。
(1)數(shù)據(jù)采集具體包括數(shù)據(jù)源選擇與數(shù)據(jù)源維護等功能。數(shù)據(jù)源選擇,就是選擇需要進行處理的數(shù)據(jù)源,通過數(shù)據(jù)接口的方式進行數(shù)據(jù)采集。數(shù)據(jù)源維護,就是數(shù)據(jù)源相關信息(如名稱、鏈接地址、用戶名和密碼等信息)的修改。
(2)數(shù)據(jù)建模主要加工在數(shù)據(jù)采集中所選擇的數(shù)據(jù)源,包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)歸約和數(shù)據(jù)轉換四個功能。數(shù)據(jù)清洗是在確定清洗的數(shù)據(jù)屬性后對所選擇的數(shù)據(jù)源進行清洗加工。數(shù)據(jù)簡化主要是對數(shù)據(jù)源中某些數(shù)據(jù)按月份或年份做匯總處理。數(shù)據(jù)歸約是對所選擇的數(shù)據(jù)源中某些不相關屬性利用直接刪減法、信息增益法等進行處理。數(shù)據(jù)轉換包括數(shù)據(jù)標準化和數(shù)據(jù)泛化,主要是對數(shù)據(jù)源中的連續(xù)值和離散值做不同的處理。針對數(shù)據(jù)源中的連續(xù)值,采用標準化作為數(shù)據(jù)轉換的方法,而針對數(shù)據(jù)源中的離散值,采用數(shù)據(jù)泛化的方法。
圖2 用戶行為分析系統(tǒng)的功能
(3)數(shù)據(jù)挖掘模塊,可選擇使用統(tǒng)計分析方法、層次分析法、KNN分類算法和K-means聚類算法等對用戶行為進行具體的分析和預測。
統(tǒng)計分析方法是指對目標數(shù)據(jù)集中的關系屬性進行整理歸類并進行解釋的數(shù)據(jù)挖掘方法[12]。比較常用的有:因子分析、相關分析、判別分析、回歸分析等。
K-means是一種基于樣本間相似度度量的非監(jiān)督學習的聚類算法[13]??梢杂脕韺τ脩暨M行分類等。首先隨機選取k個點作為k個初始聚類中心,然后對剩下的點依據(jù)對k個聚類中心的相似度劃歸到對應的聚類中,再更新每個聚類的中心,不斷迭代,直到收斂。
(4)結果可視化展示對挖掘出的結果進行數(shù)據(jù)分布、數(shù)據(jù)對比、報表生成。數(shù)據(jù)分布可以分別按照客戶類別、渠道、功能等不同的分類條件輸出相應的統(tǒng)計信息,并以餅圖或柱狀圖的直觀化形式呈現(xiàn)。數(shù)據(jù)對比可以分別按照渠道不同的對比屬性輸出相應的對比信息,并以柱狀圖形式輸出對比結果。報表生成分為年報表和月報表,按照渠道的不同屬性生成相應的報表。
2.3 系統(tǒng)實現(xiàn)
最終實現(xiàn)的系統(tǒng)主要完成了各類指標的統(tǒng)計分析和用戶細分。
(1)統(tǒng)計分析。
系統(tǒng)分別從服務渠道指標、服務功能總指標、單個服務功能指標、客戶訪問時間指標、客戶區(qū)域分布等幾個方面進行統(tǒng)計分析。其中,對電力客服中心的用戶行為的統(tǒng)計分析包括以下幾個指標:
①服務渠道指標:對每個服務渠道統(tǒng)計出渠道的總用戶數(shù)、訪問次數(shù)和訪問總時長。
②單功能指標:對每個服務功能統(tǒng)計出其用戶數(shù)、訪問時間和訪問時長。
③功能總指標:對每個服務功能統(tǒng)計出各服務功能的總用戶數(shù)、訪問次數(shù)和訪問總時長。
④用戶喜好指標:從訪問渠道、訪問時長、所訪問服務功能三個方面統(tǒng)計用戶的喜好。
⑤用戶區(qū)域分布指標:統(tǒng)計用戶所屬區(qū)域的分布情況,給出分布圖及其各占比例。
數(shù)據(jù)分布和對比包括:
①指標在時間上的分布:包括指標在不同時間粒度(日、周、月、年)上的分布;分布對比(同一指標在不同時間粒度上的對比,不同指標在同一時間粒度上的對比)。
②指標在空間上的分布,包括不同指標在一個地區(qū)上的分布;同一指標在不同地區(qū)分布的對比。
③時間和空間的結合:指標在同一時間粒度不同地區(qū)的分布,指標在不同時間粒度同一地區(qū)的分布,分布對比。
用戶喜好分析包括渠道、時間、業(yè)務等幾方面,具體為:
①渠道愛好:以用戶在一段時間內對各個渠道的訪問次數(shù)作為衡量用戶對渠道的喜好標準。
②時間愛好:以用戶在各個時段訪問時長作為衡量用戶時段喜好的標準。
③功能愛好:以用戶在一段時間內對各個服務功能訪問次數(shù)作為衡量用戶對功能的喜好標準。
系統(tǒng)實現(xiàn)的數(shù)據(jù)分析界面如圖3所示。
其中,渠道分析分別向系統(tǒng)用戶展示每個渠道的用戶數(shù)、訪問次數(shù)、訪問頻度等,用統(tǒng)計圖和表格兩種方式顯示。服務功能總指標分析以統(tǒng)計圖和表格的方式顯示不同渠道下各服務的用戶數(shù)、訪問次數(shù)、訪問總時長。服務歷年走勢分析中系統(tǒng)用戶選擇待分析服務和起止年份,選擇待分析指標(用戶數(shù)、訪問次數(shù)、訪問總時長)后生成趨勢圖??蛻粼L問時間分析中系統(tǒng)用戶選擇待分析服務,設置起止時間后點擊生成分析圖??蛻魠^(qū)域分布分析統(tǒng)計出客戶所屬區(qū)域的分布情況并以餅狀圖和表格兩種形式展示結果。
圖3 用戶行為分析系統(tǒng)界面
(2)用戶細分。
客戶細分是把客戶按照一定的標準劃分為多個不同的客戶群,以便有針對性地實行不同的營銷策略[14]。具體的客戶細分指標可以是用戶行為的不同、行為習慣的不同或者客戶需要的不同等等。對客戶進行正確的細分,是電力企業(yè)制定營銷策略的起點。
目前,電網(wǎng)企業(yè)的一些靜態(tài)分類方式,例如根據(jù)行業(yè)類別、用電類別、用電方式、電壓等級等等,并不能很好地反映出客戶的行為習慣和動態(tài)需求,而在實際情況中,客戶的忠誠度、客戶對各渠道服務的使用情況以及客戶對企業(yè)利潤的貢獻等指標得到了極大的關注。文中使用K-means聚類技術根據(jù)這三個指標進行用戶細分挖掘分析。
①忠誠度:主要表現(xiàn)在客戶從開戶至今所經(jīng)歷的時間(以月為單位)。
客戶保持時長=當前年月-開戶年月
②使用頻度:是以客戶對各渠道服務的使用頻度情況。使用情況可由用戶對服務的月平均點擊次數(shù)來衡量。
使用情況=客戶對各服務總的點擊次數(shù)/客戶保持時長
③貢獻度:主要以客戶的月平均用電量來衡量。該指標是電網(wǎng)公司關注的重點指標,因而也是用電客戶細分的關鍵指標之一。
月平均用電量=累計用電量/客戶保持時長
系統(tǒng)實現(xiàn)的客戶細分界面如圖4所示。
圖4 客戶細分界面
在用戶設置好聚類的K值以及時間段之后,系統(tǒng)使用K-means聚類算法訓練學習得出用戶細分結果。
基于大數(shù)據(jù)技術和數(shù)據(jù)挖掘技術,研究和實現(xiàn)了電力客戶服務中心的用戶行為分析系統(tǒng)。該系統(tǒng)已投入實際運行,能夠根據(jù)短信、網(wǎng)站、手機APP、微信、有線電視等多元化服務渠道所產(chǎn)生的客戶服務數(shù)據(jù)進行用戶行為分析,包括用戶行為特征、客戶群體特性、服務渠道特征等。通過用戶行為分析,發(fā)現(xiàn)用戶行為規(guī)律,對企業(yè)和用戶都有重要意義。對企業(yè)來說,用戶行為分析可以發(fā)現(xiàn)用戶對服務渠道、業(yè)務的使用特征,幫助企業(yè)進行合理資源規(guī)劃,使得資源在最大限度滿足用戶需求的同時,降低運營成本;幫助企業(yè)了解用戶對服務渠道、業(yè)務的興趣所在,從而為企業(yè)制定個性化服務提供依據(jù)。對用戶來說,企業(yè)根據(jù)用戶行為進行了服務優(yōu)化,能夠更快更方便地使用網(wǎng)絡服務。
[1] 陳 超,張順仕,尚守衛(wèi),等.大數(shù)據(jù)背景下電力行業(yè)數(shù)據(jù)應用研究[J].現(xiàn)代電子技術,2013,36(24):8-11.
[2] 任思穎.基于大數(shù)據(jù)的網(wǎng)絡用戶行為分析[D].北京:北京郵電大學,2015.
[3] 劉淑鑫.面向大數(shù)據(jù)的網(wǎng)絡用戶行為分析研究[D].上海:東華大學,2015.
[4] 林嘉暉.基于數(shù)據(jù)挖掘的電網(wǎng)用戶行為分析系統(tǒng)的設計與實現(xiàn)[D].廣州:中山大學,2013.
[5]ZhanJie,HuangJinxin,NiuLin,etal.Studyofthekeytechnologiesofelectricpowerbigdataanditsapplicationprospectsinsmartgrid[C]//Proceedingsof6thIEEEPESAsia-Pacificpowerandenergyengineeringconference.[s.l.]:IEEE,2014.
[6] 趙云山,劉煥煥.大數(shù)據(jù)技術在電力行業(yè)的應用研究[J].電信科學,2014,30(1):57-62.
[7] 盧建昌,樊圍國.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術在電力企業(yè)中的應用[J].廣東電力,2014,27(9):88-94.
[8] 陶曉英.大數(shù)據(jù)支撐下的客戶服務應用探索[J].信息通信技術,2014,8(6):14-20.
[9]ZinTT,TinP,ToriuT,etal.Abigdataapplicationframeworkforconsumerbehavioranalysis[C]//2013IEEE2ndglobalconferenceonconsumerelectronics.[s.l.]:IEEE,2013:245-246.
[10]GuanJianfeng,YaoSu,XuChangqiao,etal.DesignandimplementationofnetworkuserbehaviorsanalysisbasedonHadoopforbigdata[J].CommunicationsinComputerandInformationScience,2014,490:44-55.
[11]AnkurB,NikitaM,SwadeshP,etal.Forecastingconsumerbehaviorwithinnovativevaluepropositionfororganizationsusingbigdataanalytics[C]//Proceedingsof4thIEEEinternationalconferenceoncomputationalintelligenceandcomputingresearch.[s.l.]:IEEE,2013:1-4.
[12]LiuHong.Discussiononthestatisticalanalysismethod[C]//7thinternationaljointconferenceoncomputationalsciencesandoptimization.[s.l.]:[s.n.],2014:383-385.
[13]KhandareA,AlviAS.Surveyofimprovedk-meansclusteringalgorithms:improvements,shortcomingsandscopeforfurtherenhancementandscalability[M]//Informationsystemsandintelligentapplication.[s.l.]:[s.n.],2016:495-503.
[14] 耿筱媛,張燕平,閆 屹.改進的K-means算法在電信客戶細分中的應用[J].計算機技術與發(fā)展,2008,18(5):163-167.
Research and Implementation of User Behaviors Analysis of Electric Power Customer Service Center
CHEN Li-bing1,HE Rong1,QIU Lin1,WANG Ying1,SUN Tian-hao2
(1.Customer Service Center,State Grid Chongqing Electric Power Corporation,Chongqing 400017,China; 2.College of Computer,Chongqing University,Chongqing 400044,China)
At present,the electric power customer service center has already carried out the diversified service channels to provide customers with a full range of services,but the lack of depth mining and analysis for each channel.In view of this,the user behaviors analysis of electric power customer service center is conducted based on big data.An intelligent online monitoring and analysis system is set up for multiple power customer service channels.First it collects data using distributed multi thread,then makes online analysis of user behavior with multiple dimensions based on big data,including statistical analysis and cluster analysis.Statistical analysis contains service channel index,service function total indexes,service function single index,customer access time index,customer area distribution,etc..Cluster analysis usesK-meansclusteringtoanalyzeusersegmentationaccordingtoloyalty,frequencyandcontribution.Thesystemimplementedcangetthecustomerbehaviorcharacteristicsofeachchannel,providesupportforenterprisestofullygraspthevariousservicechannelsandhelptogivemoreintelligentandconvenientpersonalizedservice.
big data;power big data;data mining;user behavior analysis
2016-03-29
2016-08-03
時間:2017-01-10
國家自然科學基金資助項目(61472051);重慶市科技計劃項目(cstc2013kjrc-qnrc40003)
陳俐冰(1979-),女,經(jīng)濟師,研究方向為信息數(shù)據(jù)分析。
http://www.cnki.net/kcms/detail/61.1450.TP.20170110.0941.020.html
TP
A
1673-629X(2017)02-0116-04
10.3969/j.issn.1673-629X.2017.02.026