張宏達(dá)
(國(guó)網(wǎng)浙江省電力公司臺(tái)州供電公司,浙江 臺(tái)州 318000)
近年來,隨著市場(chǎng)經(jīng)濟(jì)的發(fā)展完善,中共中央辦公廳在《關(guān)于進(jìn)一步深化電力體制改革的若干意見》(中發(fā)[2015]9號(hào)),明確提出了要完善電力交易機(jī)構(gòu)的市場(chǎng)功能。電力企業(yè)需要順應(yīng)市場(chǎng)的潮流,為用戶提供更人性化的服務(wù)。
根據(jù)智研咨詢發(fā)布的報(bào)告,截至2016年12月,我國(guó)手機(jī)網(wǎng)民規(guī)模達(dá)6.95億人,占網(wǎng)民人群的95.1%。由此可見,移動(dòng)互聯(lián)網(wǎng)在企業(yè)與用戶交互、溝通與交易的渠道上占有越來越重要的地位。
以國(guó)家電網(wǎng)公司為例,用戶除了可以通過以往的銀行批扣、營(yíng)業(yè)廳進(jìn)行繳費(fèi),現(xiàn)在還可以通過掌上電力APP在手機(jī)端進(jìn)行繳費(fèi)、電量和購電等記錄的查詢。
任何產(chǎn)品都離不開營(yíng)銷,APP雖然為用戶提供了便利,但要使廣大電力用戶知曉,并且嘗試使用,進(jìn)而建立起使用習(xí)慣,仍然需要進(jìn)行宣傳推廣。精準(zhǔn)營(yíng)銷是指在精準(zhǔn)定位的基礎(chǔ)上,為用戶提供個(gè)性化的營(yíng)銷方案,使得企業(yè)可以降低營(yíng)銷成本,提高營(yíng)銷的投資回報(bào)。精準(zhǔn)營(yíng)銷建立在現(xiàn)代信息技術(shù)手段之上,首先要有大量的反饋數(shù)據(jù)作為基礎(chǔ),之后通過數(shù)據(jù)挖掘技術(shù)發(fā)掘數(shù)據(jù)中蘊(yùn)含的商業(yè)價(jià)值,比如用戶的偏好和行為習(xí)慣。
以下研究就建立在臺(tái)州電力公司一次全渠道推廣的反饋數(shù)據(jù)之上?;顒?dòng)歷時(shí)一個(gè)多月,活動(dòng)目的是以推廣峰谷表為契機(jī)提高掌上電力APP、電e寶的注冊(cè)綁定量。在推廣的過程中,用戶通過何種渠道進(jìn)行注冊(cè)都會(huì)被記錄,包括微信朋友圈、臺(tái)州移動(dòng)和地推,然后與已有的用戶數(shù)據(jù)進(jìn)行關(guān)聯(lián),得到用戶的年齡、性別、所在區(qū)域和用電量等特征,這些數(shù)據(jù)將被用于決策樹的建模。
決策樹是機(jī)器學(xué)習(xí)中的一種分類器算法,它的特點(diǎn)是判斷過程是可見的,這有利于人們理解和發(fā)現(xiàn)影響分類的因素和其中的邏輯。很多分類器算法的結(jié)果都沒有這種直觀的展現(xiàn),這也是選擇決策樹算法的原因,利用決策樹算法可以得到更多的信息去理解用戶被渠道影響的原因,有助于分析渠道的效能。
精準(zhǔn)營(yíng)銷的概念由菲利普·科特勒首次提出,他認(rèn)為采用精準(zhǔn)營(yíng)銷理念的公司的營(yíng)銷溝通,溝通需要更加精準(zhǔn),在結(jié)果上看,溝通的投資回報(bào)比較高,并且可以對(duì)溝通的結(jié)果進(jìn)行衡量。在營(yíng)銷傳播計(jì)劃制定上,更加注重結(jié)果和實(shí)際行動(dòng),與客戶的溝通更多地以直接方式進(jìn)行。
在2005年精準(zhǔn)營(yíng)銷的概念被提出之后,Zabin和Brebach補(bǔ)充提出了精準(zhǔn)營(yíng)銷的4R法則,即:正確的顧客、正確的信息、正確的渠道和正確的時(shí)機(jī)。在正確的時(shí)機(jī)之下,通過正確的渠道下向正確的顧客傳達(dá)正確的信息,從而促使顧客做出有利于企業(yè)的決策。
不少學(xué)者對(duì)用戶下載APP的意愿、使用的滿意度和喜好等開展過研究。Hee-Woong Kim的研究結(jié)果表明,用戶是否愿意下載使用APP的影響因素有口碑、是否有用、APP的評(píng)分、使用費(fèi)用、使用表現(xiàn)、娛樂性和是否容易使用。范宇峰、張燕等人從自我效能理論出發(fā),認(rèn)為用戶的自我效能感知對(duì)用戶是否愿意下載使用APP影響最大,第二大影響因素是APP的娛樂性,影響最小的是是否有用這一性質(zhì)。趙海平、楊詩姝、鄧勝利等人從雙因素理論出發(fā),從多個(gè)方面對(duì)用戶是否愿意持續(xù)使用APP和卸載APP的可能性進(jìn)行了實(shí)證研究。
越來越多的傳統(tǒng)企業(yè)不僅直接開發(fā)APP來為用戶提供服務(wù),還在各類非企業(yè)所有的APP上為自己的服務(wù)引流宣傳。使用不同APP的用戶屬于不同的群體,往往具有不同的偏好、觀念和習(xí)慣,所以通過在不同的APP上傳達(dá)不同的信息,來做到精準(zhǔn)營(yíng)銷中的正確的信息。
APP的營(yíng)銷模式有多種。一是有廣告植入模式,企業(yè)在APP上投放跟自己的產(chǎn)品或服務(wù)有關(guān)的各種廣告、活動(dòng)、信息,來對(duì)用戶進(jìn)行引流;二是用戶參與模式,通過H5網(wǎng)頁制作技術(shù)制造與用戶的互動(dòng),來傳達(dá)信息;三是移植模式,四是內(nèi)容營(yíng)銷模式。
決策樹分類算法是機(jī)器學(xué)習(xí)領(lǐng)域中的一種監(jiān)督學(xué)習(xí)算法,它需要具有類標(biāo)號(hào)的數(shù)據(jù)來作為模型學(xué)習(xí)的訓(xùn)練集。
決策樹是一種層次結(jié)構(gòu),由結(jié)點(diǎn)和有向邊組成的。樹中有根結(jié)點(diǎn)、內(nèi)部結(jié)點(diǎn)和葉結(jié)點(diǎn)這3種結(jié)點(diǎn)。在決策樹中,葉節(jié)點(diǎn)都會(huì)被賦予1個(gè)類標(biāo)號(hào)。根結(jié)點(diǎn)和內(nèi)部結(jié)點(diǎn)則都包含屬性測(cè)試條件,用來區(qū)分具有不同特性的記錄。
歷史數(shù)據(jù)被用作訓(xùn)練集之前必須經(jīng)過處理,以滿足算法的要求。
(1)將用電量轉(zhuǎn)化為分類屬性。
具體方法是對(duì)用電量進(jìn)行排序,按排名情況其屬性分別為高、中、低(見表1)。
表1 按用電量排序分類
(2)將谷電量占比轉(zhuǎn)化為分類屬性。
谷電量占比20%以下的為低,20%—50%為中,50%以上為高(見表2)。
表2 按谷電量占比排序分類
(3)將年齡轉(zhuǎn)化為分類屬性。
18—30歲為青年,30—45歲為中年,45歲以上為中老年(見表3)。
表3 按年齡排序分類
對(duì)數(shù)據(jù)進(jìn)行預(yù)處理之后,要利用數(shù)據(jù)來對(duì)模型進(jìn)行訓(xùn)練。要從根節(jié)點(diǎn)開始建立決策樹,就必須逐步對(duì)結(jié)點(diǎn)進(jìn)行分裂。每一次分裂,其實(shí)都是將訓(xùn)練集中的數(shù)據(jù)進(jìn)行劃分,算法為了確保每一次的劃分都是最好的選擇,必須確定一個(gè)不純性度量,來衡量劃分的效果。
所使用的不純性度量是香農(nóng)熵,公式如下:
式中:xi指類標(biāo)號(hào);p(xi)指該類在數(shù)據(jù)集中的頻數(shù)。
每次劃分的效果由信息增益ΔI來表示:
ΔI值越高,說明劃分的效果越好。
模型訓(xùn)練流程詳見圖1:
(1)確定了如何去選擇劃分之后,算法需要解決的是什么時(shí)候終止結(jié)點(diǎn)繼續(xù)分裂。思路是:結(jié)點(diǎn)不斷分裂直到結(jié)點(diǎn)所劃分的數(shù)據(jù)集里的元素全部具有相同的類標(biāo)號(hào)。
(2)當(dāng)所有屬性都已被考慮,無法再進(jìn)行分裂時(shí),分裂也將停止。結(jié)點(diǎn)最終的類標(biāo)號(hào)由結(jié)點(diǎn)中的數(shù)據(jù)集的多數(shù)類決定。
(3)為了防止無意義的過度擬合,使得整個(gè)決策樹過于龐大,研究中也在信息增益已經(jīng)低于閾值的情況下,提前終止結(jié)點(diǎn)的分裂。結(jié)點(diǎn)最終的類標(biāo)號(hào)由結(jié)點(diǎn)中數(shù)據(jù)集的多數(shù)類決定。
因?yàn)闆Q策樹的分支比較繁雜,所以將整個(gè)樹在根結(jié)點(diǎn)處進(jìn)行了分割,分別展示。
圖2展示了在根結(jié)點(diǎn)對(duì)縣公司這一屬性進(jìn)行分裂后的部分子樹,屬性值分別為臺(tái)州黃巖、臺(tái)州電業(yè)局、臺(tái)州椒江、臺(tái)州路橋、臨海、三環(huán)、玉環(huán),它們的葉結(jié)點(diǎn)的類都是其他。說明這些縣公司所服務(wù)的用戶,無論進(jìn)一步考慮他們的哪一特征,相應(yīng)類型的用戶大多數(shù)都選擇了其他渠道來下載注冊(cè)APP。
圖1 模型訓(xùn)練流程
圖2 決策樹1
圖3 展示了從根結(jié)點(diǎn)分裂的縣公司屬性為仙居和天臺(tái)的子樹。從建立的模型結(jié)果可以看出,縣公司仙居所服務(wù)的用戶在活動(dòng)期間沒有辦理峰谷表的多數(shù)都是通過地推渠道來下載APP的,統(tǒng)計(jì)結(jié)果顯示,縣公司仙居所服務(wù)的用戶在活動(dòng)期間沒有辦理峰谷表的有5 922人,從地推渠道下載APP的就有2 853人??h公司天臺(tái)所服務(wù)的農(nóng)村用戶,其多數(shù)是通過地推渠道來下載APP的,統(tǒng)計(jì)結(jié)果顯示,縣公司天臺(tái)所服務(wù)的農(nóng)村用戶有1 385人,而通過地推渠道下載APP的就有708人。
圖3 決策樹2
圖4 展示了縣公司下屬性值為溫嶺的部分子樹。在所有下載APP的41 313名用戶中,通過其他渠道下載的就有28 607名。從決策樹上可以看出,縣公司為溫嶺、活動(dòng)期間沒有辦理峰谷電、中老年的用戶更多是通過地推渠道來下載APP。統(tǒng)計(jì)結(jié)果顯示,縣公司為溫嶺、活動(dòng)期間沒有辦理峰谷電、中老年的用戶有3 123人,其中通過地推渠道下載APP的有2 396人。
縣公司為溫嶺、活動(dòng)期間沒有辦理峰谷電、中年、用電類別為城市、繳費(fèi)方式為其他的用戶更多是通過地推渠道來下載APP。統(tǒng)計(jì)結(jié)果顯示,縣公司為溫嶺、活動(dòng)期間沒有辦理峰谷電、中年、用電類別為城市、繳費(fèi)方式為其他的用戶有46人,其中通過地推方式來下載APP的有25人。
圖5展示了縣公司下屬性值為溫嶺的剩余部分的子樹。通過其他渠道來下載APP仍然是大多數(shù)用戶的選擇。但根據(jù)決策樹的結(jié)果,縣公司為溫嶺、活動(dòng)期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費(fèi)方式為銀行批扣的用戶更多地通過地推渠道來下載APP。統(tǒng)計(jì)結(jié)果上,縣公司為溫嶺、活動(dòng)期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費(fèi)方式為銀行批扣的用戶有389人,通過地推渠道下載的有252人。
縣公司為溫嶺、活動(dòng)期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費(fèi)方式為線上、用電量為高、谷電量占比為低和高的用戶,多是通過地推渠道來下載APP。但是從統(tǒng)計(jì)結(jié)果上看,這一結(jié)論還不能看作一種普遍規(guī)律,因?yàn)樵擃愋偷挠脩羧藬?shù)總共只有4人,樣本太小,偶然性太大。
此外,從決策樹中可以發(fā)現(xiàn)有一用戶類型多數(shù)是通過微信朋友圈來下載APP的。該用戶類型的特征為:縣公司為溫嶺、活動(dòng)期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費(fèi)方式為線上、用電量為低、谷電量占比為低的用戶。但是從統(tǒng)計(jì)結(jié)果上看,該用戶類型的樣本同樣太小,一共只有2人,所以不具備參考意義。
圖5 決策樹4
此次研究回收的反饋數(shù)據(jù)有41 313條,即41 313人下載了APP。其中,通過其他渠道下載APP的有28 607人,通過地推渠道下載APP的有11 567人,通過臺(tái)州移動(dòng)渠道下載APP的有73人,通過微信朋友圈渠道下載的有101人,通過線上渠道下載的有186人,通過營(yíng)業(yè)廳下載的有779人(見表4)。
表4 掌上電力APP全渠道推廣統(tǒng)計(jì)結(jié)果
決策樹算法通過計(jì)算信息增量來選擇是否分裂結(jié)點(diǎn),信息增益的閾值被設(shè)定為0.05,當(dāng)無論如何分裂結(jié)點(diǎn)都無法使信息增益超過0.05后,結(jié)點(diǎn)就不會(huì)再分裂了??梢钥闯?,絕大多數(shù)用戶類型都是通過其他渠道來下載APP,其次有一些用戶類型明顯偏向于地推渠道。
偏向于地推渠道的用戶類型包括:縣公司仙居、活動(dòng)期間沒有辦理峰谷表;縣公司天臺(tái)、用電類別是農(nóng)村;縣公司溫嶺、活動(dòng)期間沒有辦理峰谷電、中老年;縣公司溫嶺、活動(dòng)期間沒有辦理峰谷電、中年、用電類別為城市、繳費(fèi)方式為其他;縣公司溫嶺、活動(dòng)期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費(fèi)方式為銀行批扣。
對(duì)于這些用戶類型,在下一次宣傳推廣活動(dòng)中可以著重采用地推方式去推廣,會(huì)更容易達(dá)到效果。
通過從已有數(shù)據(jù)里提煉出一些知識(shí)和規(guī)則,并應(yīng)用到此后的營(yíng)銷決策當(dāng)中,有助于提高營(yíng)銷效果。使用決策樹算法來分析營(yíng)銷的反饋數(shù)據(jù),從結(jié)果上來看,可以很直觀地看到不同的用戶類型所敏感的渠道。
但是此次反饋數(shù)據(jù)的一大特征是,占比最高的渠道同時(shí)也是一個(gè)意義最模糊的渠道,它包含了除了線上、營(yíng)業(yè)廳、地推、臺(tái)州移動(dòng)和微信朋友圈以外的所有渠道。如果來源于該渠道的數(shù)據(jù)可以刻畫得更為細(xì)致,研究結(jié)果將可以披露更多的內(nèi)容。