亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘方法應(yīng)用于電信行業(yè)渠道潛在用戶識別

        2014-04-29 00:00:00
        商業(yè)2.0 2014年11期

        數(shù)據(jù)挖掘方法應(yīng)用于電信行業(yè)渠道潛在用戶識別

        齊芳芳

        (美商天睿信息系統(tǒng)有限公司,北京"100000)

        中圖分類號:TP311"文獻(xiàn)標(biāo)識碼:A

        摘要:伴隨中國電信行業(yè)競爭加劇,運(yùn)營商面臨節(jié)約資源和提升服務(wù)的雙重考驗(yàn)?;ヂ?lián)網(wǎng)的蓬勃發(fā)展,使得電子渠道的優(yōu)勢逐漸凸顯,其快捷高效、易于管理、成本較低等特點(diǎn)更符合當(dāng)前電信行業(yè)的發(fā)展要求,因此,成為運(yùn)營商首選的渠道類型。當(dāng)前運(yùn)營商電子渠道已經(jīng)積累了一部分用戶,運(yùn)營商希望加速傳統(tǒng)渠道用戶向電子渠道的轉(zhuǎn)移,以數(shù)據(jù)挖掘方法建立電子渠道潛在用戶識別模型,更精準(zhǔn)的鎖定目標(biāo)用戶群體,提高營銷效率。本文圍繞解決該問題過程中的業(yè)務(wù)分析、方法選擇、技術(shù)實(shí)現(xiàn),評估上線等環(huán)節(jié)進(jìn)行闡述,重點(diǎn)體現(xiàn)應(yīng)用數(shù)據(jù)挖掘方法解決行業(yè)實(shí)際業(yè)務(wù)問題的經(jīng)驗(yàn)積累過程。

        關(guān)鍵詞:數(shù)據(jù)挖掘;電子渠道;用戶渠道偏好;決策樹;C4.5;模型評估

        一、引言

        1、研究背景

        中國電信業(yè)先后經(jīng)歷了改革、打破壟斷、引入競爭、規(guī)模發(fā)展、業(yè)務(wù)升級等發(fā)展階段,三大運(yùn)營商圍繞政策、價格、資費(fèi)、業(yè)務(wù)、用戶等問題展開了長期的競爭,目前已逐步形成多家運(yùn)營商并存、業(yè)務(wù)同質(zhì)化,競爭日趨正面激烈的局面。尤其是近年來電信業(yè)規(guī)模發(fā)展放緩,同時隨著虛擬運(yùn)營商、OTT行業(yè)的進(jìn)入、政府進(jìn)一步向外商以及國內(nèi)其他企業(yè)(包括民營企業(yè))開放電信市場、以及營改增制度的實(shí)行等影響,中國電信運(yùn)營商面臨的競爭日益加大。

        隨著行業(yè)增幅放緩和利潤空間收窄,各大運(yùn)營商均面臨向集約型發(fā)展轉(zhuǎn)型的問題,據(jù)相關(guān)報道,目前國資委已向三大運(yùn)營商發(fā)出通知,要求其大幅削減營銷費(fèi)用。集約發(fā)展需要從企業(yè)內(nèi)部尋求內(nèi)生動力,由粗放式管理轉(zhuǎn)向精細(xì)化管理,平衡好成本與效益的關(guān)系。需要進(jìn)一步優(yōu)化資源使用,使資本更好的聚焦在關(guān)鍵業(yè)務(wù)的開發(fā)和運(yùn)營上,提升市場競爭能力,完成轉(zhuǎn)型升級。

        伴隨互聯(lián)網(wǎng)成為經(jīng)濟(jì)發(fā)展的驅(qū)動力量,電子渠道在各行業(yè)迅速發(fā)展。其主要優(yōu)勢體現(xiàn)在實(shí)時高效、區(qū)域廣泛、更利于多樣化個性化服務(wù)、有效降低企業(yè)庫存、渠道運(yùn)行和管理、交易等成本等方面。如果可以更好的發(fā)掘電子渠道的發(fā)展價值,基于其發(fā)展價值開發(fā)創(chuàng)新性的功能,與實(shí)體渠道互為補(bǔ)充、相互結(jié)合,形成多層次、立體化的服務(wù)營銷渠道體系,提升用戶體驗(yàn),可以有效提升競爭力。

        目前運(yùn)營商用戶可以使用的電子渠道包括網(wǎng)上營業(yè)廳、短信營業(yè)廳、WAP營業(yè)廳、熱線及自助終端等已經(jīng)積累了一部分用戶,如何更好的提高電子渠道的普及率,更深入培養(yǎng)用戶使用電子渠道的習(xí)慣,引導(dǎo)用戶從傳統(tǒng)渠道向電子渠道轉(zhuǎn)移成為運(yùn)營商急切關(guān)注的問題。然而從傳統(tǒng)渠道用戶中發(fā)展和培養(yǎng)電子渠道用戶需要較高的營銷成本,另一方面盲目營銷不僅營銷效率低且影響用戶感知。因此本項(xiàng)目提出以用戶為中心,以各類電子渠道沉淀的業(yè)務(wù)受理信息,基于數(shù)據(jù)挖掘方法,分析挖掘不同渠道的偏好度的用戶的業(yè)務(wù)需求和特征,建立模型預(yù)測潛在電子渠道用戶,更精準(zhǔn)的展開潛在用戶滲透營銷。

        2、應(yīng)用場景

        通過建立電子渠道潛在用戶識別模型,周期性從全網(wǎng)用戶中產(chǎn)出各細(xì)分電子渠道的潛在用戶名單及傾向概率,讓一線工作人員依托此名單展開營銷發(fā)展活動,提高營銷成功率。

        二、相關(guān)工作理論基礎(chǔ)

        1、數(shù)據(jù)挖掘方法論

        數(shù)據(jù)挖掘過程主要分為五個階段:定義業(yè)務(wù)問題范圍、選取和抽樣、探索型數(shù)據(jù)分析、建模和實(shí)施。定義業(yè)務(wù)問題范圍階段主要是詳細(xì)分析用戶業(yè)務(wù)需求并明確數(shù)據(jù)挖掘目標(biāo);選取和抽樣階段要確立建模用的樣本和相關(guān)屬性集,抽樣生成訓(xùn)練和測試數(shù)據(jù);探索數(shù)據(jù)分析階段的任務(wù)是整理和理解數(shù)據(jù)集,保證指標(biāo)變量可用性;建模階段主要是利用不同的建模技術(shù)或不同數(shù)據(jù)集,通過性能評估,選出最好的分析模型;實(shí)施階段主要是將模型的結(jié)果自動化并提供業(yè)務(wù)使用。

        2、分類問題

        分類問題是數(shù)據(jù)挖掘的一個重要課題。分類的是利用一個分類模型,將目標(biāo)數(shù)據(jù)影射到給定類別中的一個,屬于有監(jiān)督的學(xué)習(xí)的范圍。所謂有監(jiān)督是指訓(xùn)練之前模型需要被告知每個訓(xùn)練樣本屬于哪個類。分類問題主要分為兩大步驟:第一步,建立模型,訓(xùn)練產(chǎn)出分類規(guī)則。第二步,使用模型,對未知的對象進(jìn)行分類。

        3、決策樹算法

        決策樹分類器,是最常用的分類算法之一。決策樹是一種樹狀結(jié)構(gòu),由根節(jié)點(diǎn)、內(nèi)部節(jié)點(diǎn)、葉節(jié)點(diǎn)和邊組成。內(nèi)部節(jié)點(diǎn)表示在一個屬性上的測試,分枝代表一個測試輸出,樹葉節(jié)點(diǎn)代表類或類分布。決策樹的生成由兩個階段組成:決策樹構(gòu)建和剪枝。決策樹構(gòu)建是自上而下的,開始時,所有的訓(xùn)練樣本都在根節(jié)點(diǎn),所有樣本根據(jù)每次選擇出的屬性遞歸的逐漸劃分開來,選擇出來的屬性稱為一個劃分或查詢,而劃分的選擇是基于啟發(fā)式或者某種統(tǒng)計特征進(jìn)行的。當(dāng)滿足某種迭代停止條件時,劃分操作停止。樹的剪枝過程主要針對許多分枝反映的是訓(xùn)練數(shù)據(jù)中的噪聲和孤立點(diǎn),樹剪枝試圖檢測和剪去這種分枝。決策樹的分類過程是從根節(jié)點(diǎn)開始,對某屬性的取值進(jìn)行提問,根據(jù)不同的回答轉(zhuǎn)向相應(yīng)的分支,這一過程持續(xù)迭代,直到到達(dá)某個葉節(jié)點(diǎn),輸出該葉節(jié)點(diǎn)的類別標(biāo)記。決策樹作為一種分類器的被廣泛使用的原因是其可解釋性強(qiáng),訓(xùn)練速度快以及比較容易與業(yè)務(wù)經(jīng)驗(yàn)結(jié)合等優(yōu)點(diǎn)。

        C4.5算法是目前最流行的一種決策樹算法。是由Ross"Quinlan于1993年在ID3算法的基礎(chǔ)上進(jìn)一步改進(jìn)而成的,它繼承了ID3算法的全部優(yōu)點(diǎn),并做出了改進(jìn):首先,用信息增益率代替信息增益來選擇屬性,決策樹的基本思想是使后繼結(jié)點(diǎn)的數(shù)據(jù)盡可能的“純”,常見的不純度度量有熵、GINI、方差等,劃分的選擇主要是選擇使不純度下降最快的那個查詢。ID3算法就是選擇信息增益最大即熵下降最大的屬性進(jìn)行分支的。但以信息增益進(jìn)行分類決策時,存在偏向于取值較多的屬性特征的問題。C4.5用信息增益率代替信息增益來選擇屬性,克服了這一問題。其次,C4.5能夠?qū)B續(xù)屬性進(jìn)行離散化處理,因此可以處理實(shí)值數(shù)據(jù)。另外在處理不完整數(shù)據(jù)、剪枝等方面也進(jìn)行了改進(jìn)。

        三、模型設(shè)計及實(shí)現(xiàn)

        1、問題定義

        對幾種電子渠道(包括網(wǎng)上營業(yè)廳,短信營業(yè)廳,WAP營業(yè)廳,熱線及自助終端)各自的潛在用戶進(jìn)行識別,對應(yīng)的是數(shù)據(jù)挖掘中的分類問題。分類問題要求我們首先對正負(fù)樣本進(jìn)行定義,正負(fù)樣本的定義對于研究分類問題是非常重要的環(huán)節(jié)。在此問題中,由于很多用戶不只使用一種渠道,如果單純將分析周期內(nèi)有過接觸行為的用戶作為正樣本反映出的用戶特征將不明顯,因此我們將幾種電子渠道各自的偏好用戶作為該渠道的正樣本分別進(jìn)行訓(xùn)練。如何定義每種電子渠道的偏好用戶呢,依托每種電子渠道的接觸數(shù)據(jù),我們對用戶偏好某種電子渠道的標(biāo)準(zhǔn)定義如下:針對渠道接觸次數(shù)大于10次的用戶,分析周期內(nèi)用戶通過某種電子渠道辦理業(yè)務(wù)的次數(shù)/總次數(shù)gt;40%。

        2、數(shù)據(jù)輸入

        定義好正負(fù)樣本之后,我們對輸入特征變量集合進(jìn)行了設(shè)計。特征主要包括幾大類:用戶自然屬性、消費(fèi)行為特征、終端特征、渠道接觸特征和電信行為特征。用戶自然屬性特征主要包括用戶的性別、年齡、歸屬地、入網(wǎng)時長等;電信行為特征主要是指用戶使用主要業(yè)務(wù)的行為特征(包括使用量和使用頻次等),包括語音通話、流量使用以及短信使用等;消費(fèi)行為特征主要指用戶使用主要業(yè)務(wù)產(chǎn)生的費(fèi)用特征,包括ARPU、語音消費(fèi)、流量消費(fèi)和短信消費(fèi)等;渠道接觸特征包括用戶撥打熱線、訪問登陸網(wǎng)上/短信/掌上營業(yè)廳、使用自助終端等行為特征;終端特征包括用戶的終端是否智能終端、終端品牌、操作系統(tǒng)等。

        3、模型建立

        選本月對應(yīng)的前三個月的時間段作為研究的時間窗口,由于問題對應(yīng)的正負(fù)樣本存在較嚴(yán)重的不均衡問題,因此對各種電子渠道(網(wǎng)廳,短廳,掌廳,IVR熱線和自助終端)各自的渠道偏好用戶和實(shí)體渠道用戶進(jìn)行了抽樣,樣本數(shù)據(jù)分為訓(xùn)練集和測試集兩部分,訓(xùn)練集樣本占70%,測試集占30%。采用C4.5算法對混合樣本進(jìn)行訓(xùn)練,得到用戶被劃分到各種電子渠道的概率。

        4、模型評估

        由于模型產(chǎn)出對應(yīng)的業(yè)務(wù)應(yīng)用屬于主動營銷問題,因此模型評估最關(guān)注的是概率值最高部分用戶預(yù)測的命中率和提升度。以網(wǎng)廳模型為例,潛在用戶傾向概率中前30%用戶對應(yīng)的命中率為43%,提升度為5.77,在模型上線3個月后,營銷回流反饋數(shù)據(jù)呈現(xiàn),營銷準(zhǔn)確率提升了27%,其他幾個模型的效果均比較理想。

        四、總結(jié)

        近年來,隨著計算機(jī)技術(shù)發(fā)展和用戶精細(xì)化管理的要求,電信行業(yè)應(yīng)用數(shù)據(jù)挖掘解決業(yè)務(wù)問題已經(jīng)有了很多積累,如業(yè)務(wù)關(guān)聯(lián)、用戶細(xì)分、流失預(yù)警等問題。但針對具體問題,建模中還有很多細(xì)節(jié)決定模型的最終應(yīng)用效果。本文以一個具體案例講述數(shù)據(jù)挖掘方法在解決實(shí)際業(yè)務(wù)問題時的方法選擇和細(xì)節(jié)處理。伴隨大數(shù)據(jù)時代的到來,各行業(yè)越來越重視從數(shù)據(jù)中尋找價值,相信數(shù)據(jù)挖掘在電信行業(yè)中的應(yīng)用也會繼續(xù)深入普及。

        參考文獻(xiàn):

        [1]R.Quinlan(1993).C4.5:Programs"for"Machine"Learning.Morgan"Kaufmann"Publishers,San"Mateo,CA.

        [2]馬秀紅.數(shù)據(jù)挖掘中決策樹的探討[J].計算機(jī)工程與應(yīng)用

        人妻夜夜爽天天爽| 国产丝袜在线福利观看| 中文字幕人妻av四季| 日本一区二区三区人妻| 中文字幕日韩欧美一区二区三区| 2020年国产精品| 国产午夜亚洲精品理论片不卡| 国产小车还是日产的好| 日本一区二区三级免费| 国产成人精品无码免费看| 国产精品∧v在线观看| 97人妻熟女成人免费视频| 无码伊人久久大杳蕉中文无码| 一区二区在线观看日本免费| 三级黄色片免费久久久| 欧美真人性野外做爰| 国产av无码专区亚洲av| 亚洲一区二区情侣| 日本国产一区在线观看| 亚洲精品久久国产精品| 日韩欧美人妻一区二区三区| 国产亚洲日韩欧美一区二区三区| 亚洲区精品久久一区二区三区女同| 视频一区视频二区自拍偷拍 | 毛片无码国产| 国产精品熟妇视频国产偷人 | 精品国产3p一区二区三区| 风骚人妻一区二区三区| 午夜精品射精入后重之免费观看 | 一区二区中文字幕在线观看污污| 中文字幕日韩精品有码视频| 男女车车的车车网站w98免费| 日韩欧美在线播放视频| 亚洲综合天堂av网站在线观看| 精品粉嫩av一区二区三区| 亚洲av无码av在线播放| 麻豆国产成人av高清在线观看 | 中文字幕被公侵犯的丰满人妻| 国产自拍精品视频免费| 国产精品久久久久aaaa| 99精品成人片免费毛片无码|