亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K-medoids算法的RFAT客戶細(xì)分

        2016-08-27 08:02:50吳倩倩何友全
        關(guān)鍵詞:細(xì)分聚類分類

        吳倩倩, 何友全

        (1.重慶交通大學(xué) 經(jīng)濟(jì)管理學(xué)院,重慶 400074; 2.重慶交通大學(xué) 信息科學(xué)與工程學(xué)院,重慶 400074)

        ?

        基于K-medoids算法的RFAT客戶細(xì)分

        吳倩倩1, 何友全2

        (1.重慶交通大學(xué) 經(jīng)濟(jì)管理學(xué)院,重慶 400074; 2.重慶交通大學(xué) 信息科學(xué)與工程學(xué)院,重慶 400074)

        客戶的精準(zhǔn)定位、相應(yīng)的營銷手段和策略,以及對公司客戶的專業(yè)管理,是企業(yè)發(fā)展的重要環(huán)節(jié)。以傳統(tǒng)零售行業(yè)為研究對象,在RFM模型的基礎(chǔ)上,引入RFAT模型分析客戶信息,比較K-means和K-medoids兩種算法對企業(yè)客戶的聚類分析結(jié)果,最后利用RFAT模型和K-medoids算法對客戶精準(zhǔn)定位,企業(yè)可根據(jù)定位結(jié)果針對不同客戶采取相應(yīng)的營銷策略。

        客戶細(xì)分;聚類分析;RFM模型;K-medoids

        隨著客戶關(guān)系管理發(fā)展的愈加成熟,以客戶為中心的營銷思想也越來越被企業(yè)所重視。企業(yè)需要有效運(yùn)用客戶資源,從客戶的消費信息中得到更加有用的信息,分析客戶與企業(yè)之間的關(guān)系,對客戶的消費行為分析,為客戶提供個性化服務(wù)。在客戶細(xì)分方面,最常用的是RFM模型,RFM模型是通過客戶的購買行為、購買頻率以及花費成本三個指標(biāo)描述客戶對于企業(yè)的價值。徐翔斌在RFM模型的基礎(chǔ)上,添加了商品利潤因子,提出了RFP模型,得出的結(jié)果比RFM模型對客戶細(xì)分更加準(zhǔn)確[1]。蔡淑琴使用客戶偏好建模和客戶聚類的二階段客戶細(xì)分方法對客戶進(jìn)行自動聚類[2]。筆者在RFM基礎(chǔ)上,引入RFAF模型分析客戶信息,并結(jié)合K-medoids算法對客戶精準(zhǔn)定位,定位結(jié)果可為企業(yè)決策提供參考。

        一、技術(shù)路線和模型背景

        (一)客戶分類模型介紹

        客戶模型的構(gòu)建是決定客戶細(xì)分的基礎(chǔ),也決定了公司在挖掘潛力客戶的準(zhǔn)確性[3]。在客戶細(xì)分模型中,最常用的是RFM模型,但是RFM模型也存在一定弊端,運(yùn)用RFM客戶分類后,會導(dǎo)致客戶群過多,購買頻率和客戶消費金額這兩個變量存在高度相關(guān)關(guān)系,存在多重共線性,最終導(dǎo)致模型失真或者結(jié)果不精準(zhǔn)。劉芝怡考慮到客戶購買傾向?qū)蛻魞r值的影響,提出了RFAT模型[4],主要判斷潛在客戶,使得客戶分類更加準(zhǔn)確,為公司提供更加精準(zhǔn)的服務(wù)。

        (二)聚類算法介紹

        在聚類分析中,大多研究者使用的是K-means算法。K-means算法對噪音和異常數(shù)據(jù)非常敏感,對于客戶群體在消費行中出現(xiàn)異常的消費行為,這種消費行為產(chǎn)生的極端數(shù)據(jù)點對于客戶分類產(chǎn)生很大的影響[4]。K-medoids算法選取任意點為初始中心點,計算其他點到選取點的距離,不斷循環(huán)這個過程,最后計算取點到其他所有點距離和為最小即得到簇中心(即中心點),這樣可以有效避免噪音和異常數(shù)據(jù)。

        二、實驗所用模型與過程

        (一)RFAT模型

        在RFAT模型中:R為模型最近消費時間距離現(xiàn)在的天數(shù),天;F為在規(guī)定的時間內(nèi)的客戶總體消費次數(shù),次;A為客戶消費總額與消費次數(shù)的商(單次消費金額),元;T為在平均發(fā)生消費行為的間隔時間為基礎(chǔ)判斷客戶的購買趨勢和活躍程度。其計算過程為:

        (1)

        其中ti為第i次與第i-1次消費行為的時間間隔;n代表在某段時間內(nèi)的客戶消費的總次數(shù),即消費頻次。當(dāng)t=0時,代表客戶自己已經(jīng)有了固定的購物習(xí)慣;t越大代表客戶價值越高,具有良好的購物習(xí)慣,兩次購買之間的時間間隔也就越短;t減小時,代表客戶價值也隨之減小,購買時間間隔長,成為企業(yè)重點培養(yǎng)客戶的概率也較小。

        (二)K-medoids算法

        K-medoids算法的核心是中心點的選擇。假設(shè)任意選取k個點作為初始中心值,根據(jù)剩下數(shù)據(jù)到達(dá)中心點距離最近的原則,調(diào)整引起變化的各個數(shù)據(jù)所屬簇的情況,直至不再發(fā)生變化為止。

        假設(shè)點x=(x1,x2,…,xn)和點y=(y1,y2,…,yn),則它們之間的距離為[5]:

        (2)

        (三)實驗過程

        基于RFAT模型,運(yùn)用K-medoids算法,以R、F、A和T為計算指標(biāo),將企業(yè)客戶群體分類,具體的操作步驟如下:

        步驟1將收集的數(shù)據(jù)預(yù)處理,再進(jìn)行歸一化處理;

        步驟2在n個數(shù)據(jù)中任意選出k個對象作為初始中心值;

        步驟3將剩余的數(shù)據(jù)分別指派到距離最短的第k個初始中心值所代表的簇中;

        步驟4根據(jù)平方差函數(shù)值減少的原則,如果距離小于零,則中心值發(fā)生替換;

        步驟5重復(fù)步驟2和3直到每個聚類停止變化位置。

        式中p為類Ci中的樣本,Oj為聚類中心(p和Oj都是多維的)。

        三、實驗研究

        (一)數(shù)據(jù)預(yù)處理

        實驗數(shù)據(jù)來源于重慶某食品銷售公司的實際銷售數(shù)據(jù),包含的數(shù)據(jù)字段為客戶名稱、物料名稱、型號、單位、數(shù)量、主含稅凈價等字段。選擇了105名客戶10月份到12月份三個月的406條銷售數(shù)據(jù),時間為2015年12月31日,屬性字段選擇了客戶名稱、單據(jù)時間(銷售時間)、主含稅凈價。根據(jù)RFAT模型,對原銷售數(shù)據(jù)庫中原始數(shù)據(jù)進(jìn)行處理生成RFAT數(shù)據(jù)表。數(shù)據(jù)表的屬性字段包括:最近一次購買時間到2015年12月31日的間隔R、消費頻次F、單次消費金額A、購買傾向T。由于四個指標(biāo)量綱不同,為了便于比較,將各個屬性進(jìn)行極差正規(guī)比變換,得到處理后的規(guī)格化數(shù)據(jù)見表1。

        表1 客戶信息表(處理后)

        (二)聚類分析

        根據(jù)樣本數(shù)量大小分析知K取值為2、3和4,利用sig<0.01和F值檢驗,確定K=4。將客戶分為四類,聚類結(jié)果見表2和表3。

        表2 K-means算法聚類后客戶分類情況

        表3 K-medoids算法聚類后客戶分類情況

        觀察表2和表3,兩種算法結(jié)果很接近,這表明K-means算法對于客戶分類具有可行性。在表2中類4的客戶價值最高;中高端客戶數(shù)量占46%,購買數(shù)次較高,購買金額比較大;普通客戶占比11%,購買頻次較高,購買傾向低;價值極低客戶占比30%,購買頻次最少,是企業(yè)最容易流失的客戶。最后根據(jù)K-means算法分類結(jié)果查看客戶信息數(shù)據(jù),發(fā)現(xiàn)有極端點存在,即有極大極小值存在,這樣會影響客戶的整體分類情況,導(dǎo)致企業(yè)管理決策失誤,損失客戶價值高的客戶,并且在管理客戶中,出現(xiàn)成本過高,占用大量人力物力資源等。使用RFAT模型,并用K-medoids算法計算后的聚類結(jié)果見表3。查看客戶信息數(shù)據(jù),出現(xiàn)極大極小值的概率較小,極端值對整體數(shù)據(jù)的影響較小,客戶價值穩(wěn)定。從K-means算法的分類結(jié)果看,總體數(shù)據(jù)穩(wěn)定,公司可以有效得出客戶整體輪廓,以及整體的客戶價值。

        (三)分類結(jié)果分析

        客戶直接價值定義為購買的頻率F和平均購買金額A兩者之和,客戶間接價值定義為購買傾向T、購買時間距離現(xiàn)在時間差R和購買頻率F這三者之和,具體值見表4。

        表4 RFAT模型中客戶價值表

        根據(jù)表3和表4,類4的客戶對公司的貢獻(xiàn)最大,相對而言,給公司帶來的利潤也比較大,是企業(yè)最具有價值的客戶,間接價值發(fā)展空間大,公司需要對這類客戶進(jìn)行大量的人力資源和資金的投入,調(diào)整相應(yīng)的營銷手段,用戶數(shù)量少,可以為用戶提供個性化的一對一服務(wù),保持和發(fā)展客戶關(guān)系,這種客戶是公司良好口碑的傳播者。類2的客戶屬于企業(yè)中的中高端用戶,這部分客戶對企業(yè)已經(jīng)產(chǎn)生信任感,最有潛力成為公司的最重要客戶,但是一旦產(chǎn)品缺貨,這類客戶也很快轉(zhuǎn)向競爭對手,公司應(yīng)該投入相應(yīng)的資源,維持好客戶關(guān)系,盡可能地讓客戶成長為公司最重要的客戶。類1的客戶是普通用戶,但是占比額最高,其R指標(biāo)也比較高,購買金額、購買趨勢相對較低,有可能是公司的新客戶群體,具有一定的發(fā)展?jié)摿?,公司可以通過提高服務(wù)速度和服務(wù)質(zhì)量,進(jìn)一步發(fā)展客戶關(guān)系。類3的客戶直接價值最少,具有極低的購買傾向,這類客戶比較容易流失,公司對這類客戶可以不用投資或者投資極少資源,以降低這類客戶的管理成本。

        四、結(jié)語

        筆者以客戶銷售數(shù)據(jù)為研究對象,著重研究了K-medoids聚類算法在RFAT模型上的應(yīng)用,并通過對比實驗進(jìn)行了驗證。文章主要從兩個方面進(jìn)行深入研究:一方面,利用RFAT模型,運(yùn)用K-medoids聚類算法,將客戶群體進(jìn)行細(xì)分,發(fā)現(xiàn)客戶的共性,提供針對性的服務(wù)。根據(jù)他們的消費行為,為公司客戶資源投資提出良好建議,降低企業(yè)服務(wù)成本,提高企業(yè)收益。另一方面,利用RFAT模型細(xì)分客戶群體,也可以使得企業(yè)精準(zhǔn)把握客戶群體狀況,分別采用不同的服務(wù)、價格策略以及推銷手段穩(wěn)定最重要客戶,發(fā)展中小潛力客戶向重要客戶的轉(zhuǎn)化,最后盡可能降低價值極低客戶的管理成本。

        [1] 徐翔斌,王佳強(qiáng),涂歡,等. 基于改進(jìn)RFM模型的電子商務(wù)客戶細(xì)分[J].計算機(jī)應(yīng)用,2012(5):1439-1442.

        [2]蔡淑琴,蔣士淼,秦志勇.基于在線客戶評論的客戶細(xì)分研究[J].管理學(xué)報,2015(7):1059-1063.

        [3]MAIA M,ALMEIDA J,ALMEIDA V.Identifying user behavior in online social networks[C]∥Proceedings of the 1st workshop on Social network systems.ACM,2008:1-6.

        [4]劉芝怡,陳功. 基于改進(jìn) K-means 算法的 RFAT 客戶細(xì)分研究[J]. 南京理工大學(xué)學(xué)報(自然科學(xué)版),2014 (4): 531-536.

        [5]夏寧霞,蘇一丹,覃希.一種高效的 K-medoids 聚類算法[J]. 計算機(jī)應(yīng)用研究,2010(12):4517-4519.

        (責(zé)任編輯:蔡洪濤)

        RFAT Customer Segmentation Based on K-medoids Algorithm

        WU Qianqian1,HE Youquan2

        (1.School of Economics and Management,Chongqing Jiaotong University, Chongqing 400074,China;2.School of Information Science & Engineering, Chongqing Jiaotong University, Chongqing 400074, China)

        For enterprise, the precise positioning of customers, appropriate marketing strategies and tactics, as well as professional management is an important part of business development. Based on the RFM model, RFAT model was introduced to customer information analysis. Classifying clients through K-means algorithm and K-medoids algorithm, this paper analyzes the results of the two clustering algorithms, and then precisely position the customers for the enterprises to take appropriate marketing strategies.

        customer segmentation; cluster analysis; RFM model; K-medoids

        2016-03-14

        吳倩倩(1992—),女,甘肅慶陽人,重慶交通大學(xué)經(jīng)濟(jì)管理學(xué)院碩士研究生,研究方向為電子商務(wù),數(shù)據(jù)挖掘;

        何友全(1964—),男,湖北監(jiān)利人,重慶交通大學(xué)信息科學(xué)與工程學(xué)院教授,博士,研究方向為數(shù)據(jù)挖掘。

        F203

        A

        1008—4444(2016)03—0044—03

        猜你喜歡
        細(xì)分聚類分類
        分類算一算
        深耕環(huán)保細(xì)分領(lǐng)域,維爾利為環(huán)保注入新動力
        華人時刊(2020年23期)2020-04-13 06:04:12
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        教你一招:數(shù)的分類
        1~7月,我國貨車各細(xì)分市場均有增長
        專用汽車(2016年9期)2016-03-01 04:17:02
        基于改進(jìn)的遺傳算法的模糊聚類算法
        整體低迷難掩細(xì)分市場亮點
        專用汽車(2015年2期)2015-03-01 04:05:42
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        精品人妻丰满久久久a| 777国产偷窥盗摄精品品在线| 国产96在线 | 欧美| 国产一级黄色录像| 搞黄色很刺激的网站二区| 精品人妻伦一二三区久久| 蜜桃麻豆www久久囤产精品| 亚洲Va中文字幕久久无码一区| 亚洲av一二三四又爽又色又色| 国产99一区二区三区四区| 亚洲av高清在线一区二区三区 | 国产一区二区精品亚洲| 天天做天天爱夜夜夜爽毛片 | 国产成人亚洲精品2020| 国产精品日韩亚洲一区二区| 久爱www人成免费网站| 国产a v无码专区亚洲av| 国语精品视频在线观看不卡 | 精品香蕉99久久久久网站| 欧洲成人午夜精品无码区久久| 一本一本久久久久a久久综合激情| 少妇饥渴偷公乱a级无码| 精品亚洲国产成人av色哟哟| 日韩av综合色区人妻| 亚洲中字幕永久在线观看| 97人妻精品一区二区三区免费| 国产日韩精品suv| 国产 国语对白 露脸| 人妻精品一区二区免费| 亚洲av人片在线观看| 国产av麻豆mag剧集| 91亚洲国产成人aⅴ毛片大全| 黄页免费人成网址大全| 真人抽搐一进一出视频| 亚洲综合无码一区二区三区| 亚洲av乱码国产精品色| 美女用丝袜脚玩我下面| 国产精品丝袜久久久久久不卡| 亚洲国产精品久久久性色av| 日本中文字幕有码在线播放| 麻豆tv入口在线看|