隨著3G時代的到來,國內(nèi)電信市場競爭日趨激烈,電信運營商的經(jīng)營模式逐漸從“技術(shù)驅(qū)動”向“市場驅(qū)動”、“客戶驅(qū)動”轉(zhuǎn)化。這就要求運營商要采取以客戶為中心的策略,根據(jù)客戶的實際需求提供多樣化、層次化、個性化的服務(wù)解決方案。
電信增值業(yè)務(wù)是憑借公用電信網(wǎng)的資源和其它通信設(shè)備而開發(fā)的附加通信業(yè)務(wù),其實現(xiàn)的價值使原有網(wǎng)絡(luò)的經(jīng)濟(jì)效益或功能價值得到進(jìn)一步提升,是運營商提供給消費者的信息服務(wù)。增值業(yè)務(wù)的種類很多,例如短信、彩信、手機(jī)上網(wǎng)、電子信箱、可視電話、手機(jī)電視等,多以語音、文字、圖形、圖像等多媒體形式生動、直觀、形象地表示和傳遞信息。
增值業(yè)務(wù)是運營商提供給消費者的更高層次的信息服務(wù),要求運營商提供的產(chǎn)品應(yīng)符合不同消費群的個性化需求,這使得傳統(tǒng)的電信增值服務(wù)行業(yè)的大眾營銷策略已很難適應(yīng)新形勢的發(fā)展要求。充分獲取并利用相關(guān)數(shù)據(jù)信息,使用數(shù)據(jù)挖掘方法發(fā)現(xiàn)潛在客戶并展開針對性營銷,已成為運營商重點關(guān)注的市場拓展方法之一。
數(shù)據(jù)挖掘是從大量的、不完整的、有噪聲的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先并不知道的、具有潛在價值的信息和知識的過程。它的出現(xiàn)為自動和智能地把海量的數(shù)據(jù)轉(zhuǎn)化成有用的信息和知識提供了手段。
數(shù)據(jù)挖掘在電信行業(yè)的應(yīng)用包括如下幾個方面:
1)關(guān)聯(lián)分析:其目的是挖掘出隱藏在數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。例如,訂購手機(jī)視頻通話包月套餐的顧客同時訂購手機(jī)電視套餐的概率較高,這就是一條關(guān)聯(lián)規(guī)則。
2)分類/預(yù)測:其目的是產(chǎn)生一個分類模型,該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中。分類數(shù)據(jù)挖掘主要利用歷史數(shù)據(jù)找出規(guī)律,建立模型,并應(yīng)用模型預(yù)測未來數(shù)據(jù)的種類、特征等,可用于電信行業(yè)的潛在客戶發(fā)現(xiàn)。
3)聚類:聚類是把一組個體按照相似性歸成若干類別,使得屬于同一類別的個體之間的距離盡可能小,而不同類別個體間的距離盡可能大。聚類通常用于根據(jù)客戶消費行為特征劃分為不同的用戶群,開展針對性營銷。
4)偏差分析:從數(shù)據(jù)庫中找出異常數(shù)據(jù),如短信群發(fā)、欺詐行為的發(fā)現(xiàn)。
5)時間序列:從序列數(shù)據(jù)庫中發(fā)現(xiàn)相對時間或者其他順序所出現(xiàn)的高頻率子序列。其最初是通過在帶有交易時間屬性的交易數(shù)據(jù)庫中發(fā)現(xiàn)頻繁項目序列,以發(fā)現(xiàn)某一時間段客戶的購買活動規(guī)律。
增值業(yè)務(wù)精確營銷是通過分析現(xiàn)有的增值業(yè)務(wù)訂購關(guān)系數(shù)據(jù),使用統(tǒng)計分析或數(shù)據(jù)挖掘方法找出針對不同業(yè)務(wù)具有潛在營銷價值的目標(biāo)客戶。
數(shù)據(jù)挖掘方法可以從兩個方面發(fā)現(xiàn)增值業(yè)務(wù)的潛在用戶:
2.1 用戶消費能力和消費行為差異角度
通過分析使用某增值業(yè)務(wù)的用戶和未使用用戶的消費行為數(shù)據(jù),找出兩者的消費行為差異,尋找和探索表征客戶使用習(xí)慣的指標(biāo)變量,以建立客戶的特征模型。從現(xiàn)有未使用該增值業(yè)務(wù)的客戶中篩選出符合此特征模型的用戶群,并預(yù)評估其營銷成功的概率,對其中營銷成功概率較高的潛在用戶開展有針對性的營銷服務(wù),使之發(fā)展成為該增值業(yè)務(wù)的用戶。
2.2 增值業(yè)務(wù)交叉銷售角度
交叉銷售是一種以企業(yè)和客戶的現(xiàn)有關(guān)系為基礎(chǔ)去推銷另一個產(chǎn)品的營銷策略,是通過對現(xiàn)有客戶擴(kuò)大銷售來增加利潤的一個有效手段。運營商通過收集和積累客戶大量的購買信息,并對相關(guān)數(shù)據(jù)進(jìn)行處理、統(tǒng)計和分析,在全面掌握客戶消費能力、消費習(xí)慣、信用情況等信息后預(yù)測客戶下一步要購買的產(chǎn)品和服務(wù),從而有針對性地向客戶推薦特定的產(chǎn)品,以便提高產(chǎn)品的營銷成功率。
增值業(yè)務(wù)交叉銷售通過分析現(xiàn)有客戶對增值業(yè)務(wù)訂購和使用信息,分析同一業(yè)務(wù)不同產(chǎn)品之間的內(nèi)在聯(lián)系,掌握客戶使用偏好,對于某特定產(chǎn)品篩選出具有潛在價值的客戶,使?fàn)I銷服務(wù)更具針對性,擴(kuò)大產(chǎn)品的用戶群體。
以機(jī)器學(xué)習(xí)的觀點,分類是一種有指導(dǎo)的學(xué)習(xí),即每個訓(xùn)練樣本的數(shù)據(jù)對象已經(jīng)有類標(biāo)識,通過學(xué)習(xí)可以形成表達(dá)數(shù)據(jù)對象與類標(biāo)識間對應(yīng)的知識。從這個意義上說,分類的目標(biāo)就是根據(jù)樣本數(shù)據(jù)形成類知識,并對源數(shù)據(jù)進(jìn)行分類,進(jìn)而預(yù)測未來數(shù)據(jù)的歸類,可用于潛在客戶的挖掘。
目前常用的分類器構(gòu)造方法包括:基于決策樹模型的分類器構(gòu)造方法(如ID3、C4.5、IBLE、 SLIQ、SPRINT等)、基于統(tǒng)計模型的分類器構(gòu)造方法(如貝葉斯方法)、基于神經(jīng)網(wǎng)絡(luò)模型的分類構(gòu)造方法、基于遺傳算法的分類器構(gòu)造方法、基于粗糙集的分類器構(gòu)造方法等。由于電信企業(yè)的用戶資料存在非數(shù)值類型數(shù)據(jù),相對于神經(jīng)網(wǎng)絡(luò)算法而言,使用決策樹算法可免去許多預(yù)處理工作,且模型結(jié)果易于解釋。針對電信業(yè)超大規(guī)模數(shù)據(jù)量,決策樹C5.0算法具有很高的執(zhí)行效率,并且在面對數(shù)據(jù)遺漏和輸入字段很多的問題時非常穩(wěn)定,故本文采用C5.0算法創(chuàng)建決策樹。建模過程如圖1所示。
圖1 建模過程圖
C5.0算法根據(jù)能夠帶來最大信息增益的字段拆分樣本。其算法思想是:第一次拆分確定的樣本子集隨后再次拆分,通常是根據(jù)另一個字段進(jìn)行拆分,這一過程重復(fù)進(jìn)行直到樣本子集不能再被拆分為止。最后,重新檢驗最低層次的拆分,那些對模型值沒有顯著貢獻(xiàn)的樣本子集被剔除或者修剪。
以某運營商“手機(jī)報潛在客戶挖掘”為例,通過該運營商用戶使用電信業(yè)務(wù)的一些基礎(chǔ)數(shù)據(jù)資料,包括用戶資料(如客戶類型、入網(wǎng)時長等)、用戶業(yè)務(wù)使用信息(如月均彩信條數(shù)、GPRS流量等)、用戶消費信息(如ARPU、增值業(yè)務(wù)費用等),終端支持信息、用戶手機(jī)報訂購信息(是否訂購手機(jī)報)等。這些數(shù)據(jù)清洗工作完成后,抽取連續(xù)三個月的數(shù)據(jù)進(jìn)行數(shù)據(jù)探索,掌握各因子的數(shù)據(jù)分布情況,并結(jié)合業(yè)務(wù)經(jīng)驗設(shè)計反映預(yù)測結(jié)果且與結(jié)果直接、間接相關(guān)的衍生因子。然后,取10萬名連續(xù)使用三個月手機(jī)報的在網(wǎng)用戶和1萬名最近兩個月未使用手機(jī)報的用戶作為訓(xùn)練集,使用C5.0算法對訓(xùn)練集數(shù)據(jù)建立預(yù)測模型,以“是否手機(jī)報用戶”為輸出變量,其余為輸入變量。訓(xùn)練結(jié)果為用戶手機(jī)報業(yè)務(wù)用戶特征的決策樹。
Apriori 算法是一種最具影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法。其基本思想是把關(guān)聯(lián)規(guī)則挖掘分為如下兩步:
第一步:從事務(wù)數(shù)據(jù)庫中找到所有支持度不小于用戶指定的最小支持度閾值的頻繁項目集。在數(shù)據(jù)挖掘中,支持度不小于用戶給定的最小支持度閾值的項目集簡稱頻繁項目集。
第二步:使用頻繁項目集產(chǎn)生所期望的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的置信度不小于用戶指定的最小置信度閾值。
以手機(jī)報深度營銷為例(指向目前使用手機(jī)報的用戶推薦其它不同類型的手機(jī)報),交叉銷售挖掘的研究思路為:分析各種手機(jī)報之間的關(guān)聯(lián)程度,篩選使用了較強(qiáng)關(guān)聯(lián)中后項的用戶。建模步驟如下:
1)根據(jù)客戶的手機(jī)報訂購關(guān)系,分析挖掘客戶同時訂購多種手機(jī)報的情況,根據(jù)關(guān)聯(lián)度判定規(guī)則,對訂購各手機(jī)報產(chǎn)品進(jìn)行關(guān)聯(lián)度計算,判斷出哪些手機(jī)報之間具有較高的支持度和可信度。
2)從多種視角分析不同手機(jī)報之間關(guān)聯(lián)度高的原因,例如哪類用戶同時訂購了新聞早晚報和鳳凰時事周刊,為優(yōu)化產(chǎn)品結(jié)構(gòu)和捆綁營銷提供支撐。
3)選擇訂購了某種手機(jī)報,但未訂購和該種類型關(guān)聯(lián)程度較高的手機(jī)報的用戶,作為該手機(jī)報的潛在用戶。
1)模型驗證
分類模型的驗證方法是對檢驗集數(shù)據(jù)應(yīng)用模型結(jié)果規(guī)則集,用命中率、查全率、Gains圖、Lift圖等對應(yīng)用結(jié)果進(jìn)行準(zhǔn)確性和模型效果評估。關(guān)聯(lián)規(guī)則模型通過多期數(shù)據(jù)的支持度、可信度、提升度等指標(biāo)衡量。此外也包括通過多期歷史數(shù)據(jù)進(jìn)行驗證,以確定模型的表現(xiàn)是否穩(wěn)定。模型的穩(wěn)定性主要用于測試模型是否在未來具有較好表現(xiàn),是否符合預(yù)期。
2)模型調(diào)優(yōu)
模型調(diào)優(yōu)的目標(biāo)是根據(jù)模型評估結(jié)果,對模型進(jìn)行優(yōu)化,使檢驗指標(biāo)具有較好的綜合表現(xiàn)。模型調(diào)優(yōu)可以通過設(shè)計合理的衍生因子、調(diào)整平衡節(jié)點、修改挖掘方案等實現(xiàn)。
3)營銷效果評估
該某運營商“手機(jī)報潛在客戶挖掘”案例為例,使用手機(jī)報數(shù)據(jù)挖掘模型從樣本數(shù)據(jù)中發(fā)現(xiàn)8903名目標(biāo)客戶,通過客服人員電話營銷,實際呼通4741人,實際訂購1238人,營銷成功率為26%。而此前該運營商手機(jī)報外呼營銷成功率在9%-11%之間,挖掘模型提供的數(shù)據(jù)營銷效果明顯,營銷成功率約是原來的2~3倍,取得良好的經(jīng)濟(jì)效益。
本文從用戶消費行為差異角度和增值業(yè)務(wù)交叉銷售角度建立了精確營銷模型,分別應(yīng)用于潛在客戶的挖掘和對同一種增值業(yè)務(wù)不同產(chǎn)品的深度營銷,在某地市的手機(jī)報營銷中取得了預(yù)期效果。
在3G時代,增值業(yè)務(wù)已成為各大運營商市場爭奪的焦點,使用數(shù)據(jù)挖掘方法實現(xiàn)增值業(yè)務(wù)精確營銷已成為拓展客戶的重要途徑。然而數(shù)據(jù)挖掘的特殊性在于模型的調(diào)整、優(yōu)化是一個持續(xù)改進(jìn)的過程。隨著增值業(yè)務(wù)產(chǎn)品的不斷豐富,建立多種業(yè)務(wù)交叉銷售的模型成為下一步需要重點研究的內(nèi)容。
[1]段云峰,等.數(shù)據(jù)倉庫及其在電信領(lǐng)域中的應(yīng)用[M].北京:電子工業(yè)出版社,2005.
[2]王肇剛.基于網(wǎng)絡(luò)拓?fù)浼s束的時序數(shù)據(jù)挖掘算法研究與應(yīng)用.北京郵電大學(xué),2009.
[3]婁蘭芳,潘慶先.基于集合運算的頻繁集挖掘優(yōu)化算法[J].山東大學(xué)學(xué)報(理學(xué)版),2008.