亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的客戶細分模型研究及應用

        2021-01-20 07:57:22原慧琳李延柯
        計算機工程與設計 2021年1期
        關鍵詞:數(shù)據(jù)挖掘模型

        原慧琳,杜 杰,李延柯

        (東北大學 信息科學與工程學院,遼寧 沈陽 110000)

        0 引 言

        如今,零售行業(yè)的市場競爭日趨激烈,這給企業(yè)帶來了巨大壓力,迫使他們需要更有效了解客戶需求,以獲得或保持該行業(yè)的競爭優(yōu)勢。為了提高客戶的忠誠度和滿意度,提供個性化的服務和制定精準的營銷策略對企業(yè)來說是至關重要的。在現(xiàn)代消費者的偏好和品味中,企業(yè)不可能完全滿足每一位消費者。然而,大數(shù)據(jù)時代的到來,為企業(yè)提供了使用數(shù)據(jù)分析和挖掘技術的機會,通過這些海量數(shù)據(jù)對客戶進行細分,從而提高企業(yè)決策質(zhì)量[1]。

        傳統(tǒng)的細分模型雖然在客戶分類方面表現(xiàn)良好,但忽略了客戶購買行為的周期性和產(chǎn)品的購買力,而這兩個方面體現(xiàn)了客戶價值信息。此外,在經(jīng)典的RFM模型中,定義的時間變量只考慮客戶的最新交易行為,但在很多情況下,因為客戶的消費行為表現(xiàn)出時間上的變化,這樣的變量并不能準確地反映客戶的重復購買或訪問傾向[2]。為了彌補上述不足,本文旨在研究一套基于數(shù)據(jù)挖掘的多指標客戶細分模型,提高細分模型的準確度。利用熵值法賦權值,構建新的指標矩陣,并用因子分析法進行新指標矩陣的降維,減小算法的時間復雜度。最后,利用改進的 K-means 算法實現(xiàn)客戶分類。

        通過某零售商提供的過去幾年的銷售點(POS)數(shù)據(jù),驗證我們的多指標客戶細分方法可以有效地識別客戶群體,幫助企業(yè)提高決策質(zhì)量和客戶關系管理水平。

        1 相關知識

        1.1 客戶細分

        客戶細分是指企業(yè)在特定的市場環(huán)境和運營模式下,按照客戶的行為、屬性、需求及偏好等變量進行劃分,并為其提供滿足需求的服務和產(chǎn)品的過程。關于客戶細分的研究主要從以下4個方面展開,包括客戶行為、人口統(tǒng)計方法、生活方式細分以及利益的細分方法。目前,基于客戶行為的細分方法最為廣泛,該方法以信息技術為基礎,利用數(shù)據(jù)庫中已有的客戶行為數(shù)據(jù)完成客戶細分。最常用的為Hushes提出的基于RFM(Recency、Frequency和Monetary)模型的客戶細分方法。例如,Dursun和 Caber 利用RFM模型,對酒店客戶關系管理系統(tǒng)中的客戶消費行為信息進行價值細分[3]。Krishna和Ravi利用RFM模型進行客戶細分,幫助企業(yè)根據(jù)客戶的需求定制產(chǎn)品和服務,提高客戶體驗和滿意度[4]。Cho等認為客戶的重要性并不相同,因此提出了加權的RFM模型,從客戶的消費數(shù)據(jù)中挖掘行為模式,以提高推薦的準確性,完成客戶細分[5]。

        其次,客戶細分另一個重要的問題是指標體系的劃分。根據(jù)客戶細分變量將整個客戶群劃分為不同的小群體,由具有相似需求和特征的客戶組成。例如:Park等提出了一種用于多類別背景下客戶細分的模型框架,以預測客戶購買模式[6]。Kwac等根據(jù)客戶的用電數(shù)據(jù)進行生活方式的細分,并根據(jù)細分結果對哪些生活方式群體可以成為某些能源項目的良好候選提出建議[7]。Chen等根據(jù)顧客在服務提供中的角色和行為來識別不同的細分市場,通過與客戶建立密切聯(lián)系,提高服務質(zhì)量[8]。Han等展示了分類變量屬性在客戶細分中的重要性[9]。

        如今,客戶細分不僅能夠有效地識別關鍵客戶群,而且?guī)椭髽I(yè)更深層次地了解客戶行為和偏好。利用客戶細分結果,幫助企業(yè)制定差異化的客戶管理和營銷策略,實現(xiàn)企業(yè)與客戶的雙贏。

        1.2 數(shù)據(jù)挖掘

        數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中發(fā)現(xiàn)隱藏于其中的信息的過程,如特征(Pattern)、趨勢(Trend)及相關性(Relationship),也可以說是從數(shù)據(jù)中提取信息或知識。通過使用復雜的數(shù)據(jù)分析工具來突出大數(shù)據(jù)集下的信息結構,發(fā)現(xiàn)這些數(shù)據(jù)之間隱藏的潛在關系。對于客戶消費數(shù)據(jù)來說,數(shù)據(jù)挖掘技術能夠幫助企業(yè)更好維系客戶關系,多屬性和多維度地發(fā)現(xiàn)客戶群體消費需求和行為模式的差異性,實現(xiàn)精準化的客戶關系管理。數(shù)據(jù)挖掘技術主要有以下幾個方面:聚類(Clustering)、分類(Classification)、回歸分析(Regression analysis)、預測(Prediction)、關聯(lián)規(guī)則(Association rules)[10-12]。

        在數(shù)據(jù)挖掘技術中,客戶關系挖掘常用的幾種算法如下:聚類算法、分類算法和關聯(lián)規(guī)則挖掘。聚類算法可以發(fā)現(xiàn)不同客戶群體消費行為的差異性,幫助企業(yè)制定精準的營銷策略。分類算法可以預測未來客戶消費行為的趨勢。關聯(lián)規(guī)則挖掘可以找出客戶與產(chǎn)品之間的關聯(lián)性,指導企業(yè)進行交叉銷售。其中,Hu等利用關聯(lián)規(guī)則,挖掘有價值的購買模式和客戶群體[10]。Zhuang等使用3種混合類型的數(shù)據(jù)聚類算法對客戶進行細分,挖掘有用的客戶相關信息來獲得競爭優(yōu)勢[13]。Murray等利用數(shù)據(jù)挖掘方法來識別歷史嘈雜的傳遞數(shù)據(jù)中的行為模式,從而更好實現(xiàn)客戶細分[14]。Tleis等利用K-means聚類算法,實現(xiàn)有機食品市場的客戶價值細分[15]。Peker等通過LRFM模型聚類實現(xiàn)雜貨零售行業(yè)的客戶細分[16]。Lotko等利用神經(jīng)網(wǎng)絡對維修服務行業(yè)的顧客忠誠度進行建模分析[17]。

        數(shù)據(jù)挖掘技術己成為企業(yè)輔助決策的重要工具。有效的客戶關系管理需要借助數(shù)據(jù)挖掘技術,實現(xiàn)客戶信息的特征提取和價值分類。充分利用客戶消費信息,能夠提高客戶忠誠度和關系管理的質(zhì)量。同時,有效地分配資源,實現(xiàn)公司利潤最大化,保持同行業(yè)的競爭力。因此,企業(yè)在客戶關系管理中使用數(shù)據(jù)挖掘技術具有重要的意義。

        2 模型構建

        本節(jié)中,主要介紹了研究的模型和客戶細分流程。主要包括以下幾個步驟:①數(shù)據(jù)獲取和預處理;②分析與建模;③模型評估與優(yōu)化。其中,模型的創(chuàng)新性主要體現(xiàn)在“分析與建模”階段,包括:構建RFMPA多指標細分體系、熵值法客觀賦權值、因子分析降維、聚類實現(xiàn)客戶細分。具體模型流程如圖1所示。

        圖1 客戶細分模型

        2.1 數(shù)據(jù)獲取和預處理

        數(shù)據(jù)獲取是數(shù)據(jù)挖掘工作的基礎,是依據(jù)需求分析的結果提取、搜集數(shù)據(jù),主要從網(wǎng)絡數(shù)據(jù)與本地數(shù)據(jù)庫中獲得。但是,原始數(shù)據(jù)中存在大量異常數(shù)據(jù),例如:數(shù)據(jù)缺失、異常值、不一致等,嚴重影響數(shù)據(jù)分析模型的效率,甚至會導致分析結果的偏差。所以,數(shù)據(jù)清洗變得尤其重要。數(shù)據(jù)清洗完成之后,接下來需要進行的是數(shù)據(jù)的轉換、集成、規(guī)約等一系列操作,這就是數(shù)據(jù)獲取和預處理。數(shù)據(jù)預處理一方面可以提高基礎數(shù)據(jù)的質(zhì)量,另一方面能夠讓數(shù)據(jù)更好地適應特定的數(shù)據(jù)挖掘模式,降低模型所花費的時間。

        2.2 分析與建模

        2.2.1 構建RFMPA指標體系

        經(jīng)典的RFM模型中,只考慮客戶近期的交易情況,并不能完全刻畫客戶整體行為特征。結合數(shù)據(jù)的多維特性,我們對傳統(tǒng)的客戶細分指標進行更新和優(yōu)化,主要體現(xiàn)在以下幾個方面:

        (1)將每一個維度劃分為宏觀和微觀方面。在宏觀方面可以反映出客戶在整體消費中的情況,微觀方面反映自身近期購買行為特征;

        (2)增加了客戶購買行為的周期性和數(shù)量。一方面能夠準確反映客戶交易行為,另一方面體現(xiàn)了客戶的購買力。

        首先,在R(Recency)的選取上,經(jīng)典的客戶細分模型通常選取客戶最近一次訪問日期到觀察期的時間間隔。在此基礎上,我們將近度變量修改為客戶N次訪問日期到觀察期之間的平均天數(shù),可以觀察出客戶訪問公司的程度,并提供有關重復購買傾向的信息,模型計算公式如下

        (1)

        其中,date_dis(tenddate,tm-i), 表示觀察期日期與客戶來訪日期之間的差值。tm是客戶最后一次訪問。n是客戶總計訪問的次數(shù)。當n=1時,新定義的近度值變量等于傳統(tǒng)的近度值,因此新特征變量包含了經(jīng)典的變量特征。R1為顧客消費平均近度值與所有客戶平均近度值的比值,R2為顧客一年內(nèi)近度值與其自身歷史近度值的比值。比值越高,說明客戶消費時間距離觀察期越近,客戶的流失性越小。反之,客戶的流失性越大。

        F(Frequency)選取上,以顧客觀察期內(nèi)總的消費次數(shù)為分子,所有顧客的平均消費次數(shù)為分母,二者的比值記為F1。宏觀方面體現(xiàn)了客戶在全部客戶中的水平。微觀方面,選取了近一年內(nèi)總的消費次數(shù)和自身總的消費次數(shù),二者的比值為F2。目的是觀察客戶近期忠誠度的變化,如果近一年內(nèi)總的消費次數(shù)與總的消費次數(shù)比值較大,說明客戶的忠誠度處于上升期。

        M(Monetary)選取上,統(tǒng)計客戶在觀察期內(nèi)總消費金額,并計算所有客戶的平均消費金額。M1為客戶消費總金額與全部客戶平均消費金額的比值,M2為客戶近期內(nèi)消費額與其歷史總消費額的比值。通過消費金額的比值大小,可以觀察出客戶對企業(yè)的貢獻度的高低。如果比值較大,說明客戶購買力較大,企業(yè)應該將資源投入到這部分客戶中去,提高客戶滿意度和客戶價值。反之,客戶購買力越小,企業(yè)應適當投放資源,并制定有效的營銷策略,刺激客戶消費。

        在P(Periodicity)的確定上,我們定義為客戶訪問間隔時間的標準差,它能夠反映客戶是否定期光顧商店,計算公式如下

        Periodicity=stdev(VT1,VT2,…,VTn)

        (2)

        其中,n表示客戶訪問間隔值的個數(shù)。VT表示訪問時間間隔,指客戶連續(xù)兩次訪問之間經(jīng)過的時間。P1為客戶購買產(chǎn)品的周期值與全部客戶購買產(chǎn)品的平均周期值的比值。P2為客戶近期內(nèi)購買產(chǎn)品周期性值與其歷史總購買周期性值的比值。周期性表示客戶訪問是否傾向于定期進行。如果一個客戶的周期性值較低,這意味著該客戶訪問或購買的時間間隔相對固定,可以被認為是有規(guī)律的。

        A(Amount)為客戶消費記錄中購買商品數(shù)量的多少,A1為客戶購買產(chǎn)品數(shù)量與全部客戶平均購買數(shù)量的比值。A2為客戶近期內(nèi)購買產(chǎn)品數(shù)量與其歷史總購買數(shù)量的比值。通過觀察這一指標,目的是從客戶的購買記錄中發(fā)現(xiàn)客戶消費的種類越多,那么對這類客戶進行交叉銷售可能性越高。在對商品購物籃分析之后,他們更傾向于購買種類較多的產(chǎn)品。企業(yè)可以根據(jù)客戶的這種心理趨勢來完成產(chǎn)品的交叉銷售,提高產(chǎn)品銷量。

        構建RFMPA模型的指標體系見表1。

        表1 客戶細分指標體系

        2.2.2 確定權重

        進一步研究,經(jīng)典RFM模型在指標權重劃分方面存在不同意見。Hughes和Arthur認為RFM模型在權重劃分方面是相同的,應該賦予相同的權重值。而Stone和Jacobs利用信用卡用戶數(shù)據(jù)的實證分析表明,各個指標的權重并不相同,應賦予頻度值最高,近度次之,花費金額最低。目前,關于客戶細分指標權重的研究主要有以下兩個方面:一是主觀賦權法,包括層次分析法、特征值法等,主觀評價法與決策者自身理解能力有關,人為因素的影響較大。二是客觀賦權法,包括極差法、熵值法等,客觀評價法重視數(shù)學理論的應用,從數(shù)據(jù)的離散程度和信息貢獻度出發(fā),不受決策者本身影響。

        為了得到更加客觀的客戶細分結果,突出指標重要性,選用熵值法來計算細分指標的權重。按照各項指標觀測值所提供信息的能力來確定權重值。熵值法的具體步驟如下:

        (1)建立數(shù)據(jù)矩陣

        (3)

        其中,Xij為第i個客戶,第j個細分指標的數(shù)值。

        (2)數(shù)據(jù)標準化處理

        其中,為避免計算熵值時對數(shù)的無意義,對數(shù)據(jù)進行了平移,正向指標

        (4)

        負向指標

        (5)

        (3)計算第i個客戶,第j個指標的比重

        (6)

        (4)計算第j項指標的熵值

        (7)

        其中,k=1/lnn, ln為自然對數(shù),n為客戶數(shù)量,ej≥0。

        (5)計算第j項指標的差異系數(shù)

        gj=1-ej

        (8)

        對于第j項指標,指標值X′ij的差異越大,對方案評價的作用越大,熵值就越小,gj值就越大。說明指標越重要。

        (6)計算各項指標的權值

        (9)

        A′=AW

        (10)

        2.2.3 數(shù)據(jù)降維

        熵值法是按照各項指標的差異程度來確定權重值的大小,避免了主觀因素帶來的偏差,但熵值法并不能降低評價指標的維度,存在聚類時間復雜度較高的現(xiàn)象,所以我們引用了因子分析法對新指標矩陣進行數(shù)據(jù)降維。

        因子分析模型:一般地設X=(x1,x2,…,xp)′為可觀測的隨機變量,且有

        Xi=μi+ai1f1+ai2f2+…+aimfm+ei

        (11)

        其中,f=(f1,f2,…,fm)′ 為公共因子,e=(e1,e2,…,ep)′ 為特殊因子,f和e均為不可直接觀測的隨機變量。μ=(μ1,μ2,…,μp)′ 為總體X的均值。A=(aij)p*m為因子載荷矩陣。

        通常先對X做標準化處理,使其均值為零,方差為1,這樣就有:

        假定:

        (1)fi的均數(shù)為0,方差為1;

        (2)ei的均數(shù)為0,方差為δi;

        (3)fi與ei相互獨立。

        則稱X為具有m個公共因子的因子模型。

        如果滿足fi與fj相互獨立 (i≠j), 則稱該因子模型為正交因子模型。正交因子模型具有如下特性:

        X的方差可表示為

        Var(xi)=1=ai12+ai22+…+aim2+δi

        (12)

        hi2=ai12+ai22+…+aim2

        (13)

        則:

        (1)hi2是m個公共因子對第i個變量的貢獻,表示第i個共同度或共性方差;

        (2)δi為特殊方差,表示不能由公共因子解釋的部分。

        因子載荷是隨機變量與公共因子的相關系數(shù)。

        (14)

        稱gj2為公共因子fj對X的“貢獻”,是衡量公共因子重要性的一個指標。

        因子分析步驟:

        (1)輸入原始數(shù)據(jù)Xn*p, 計算樣本均值和方差;

        (2)求樣本相關系數(shù)矩陣R=(rij)p*p;

        (3)求相關系數(shù)矩陣的特征根λi(λ1,λ2,…,λp>0) 和相應的標準正交的特征向量;

        (4)確定公共因子數(shù);

        (5)計算公共因子的共性方差hi2;

        (6)對載荷矩陣進行旋轉,以求能更好解釋公共因子。

        因子分析法是利用變量與變量之間的關系,用少數(shù)幾個因子去表示多指標之間的相關性。Kaiser度量標準見表2。

        表2 因子分析度量標準

        對新指標矩陣,我們根據(jù)KMO和Bartlett’s test來確定變量之間是否適合進行因子分析,參照并通過累計方差貢獻率和特征根來確定因子的數(shù)目,累計方差貢獻率一般要不小于85%,特征根要求大于1。

        2.2.4 聚類

        接下來,需要對因子變量進行聚類,完成客戶細分。其中常用的聚類算法為K-means算法,通過隨機選取一組初始聚類中心,不斷更新迭代,直到聚類結果不再變化[18]。但K-means算法中K值的確定是難以估計的,起初我們并不確定將數(shù)據(jù)集劃分成多少個類別最合適,有些根據(jù)研究經(jīng)驗來確定K值。此外,聚類算法中初始中心點的選擇對分類結果影響較大,如果初始值選取不好,可能無法得到預期的效果。所以,我們利用改進的K-means算法來彌補以上不足。

        首先,根據(jù)SSE(手肘法)確定最佳聚類數(shù)目K,SSE定義為每個簇的對象與其聚類中心之間距離的平方和。通常類別越多,SSE就越小。一個合適的K值可以定義為SSE下降速度顯著放緩的值。因為當K值小于真實聚類數(shù)時,由于K的增加會大幅提高每個簇的聚合程度,所以SSE的下降趨勢很明顯。而當K值達到真實聚類數(shù)目時,再增大K所得到的聚合程度會極速變小,SSE的下降幅度也會驟減。所以說SSE和K的趨勢圖是一個手肘的形狀,而肘部的位置就是對應的K值的真實聚類數(shù)[19]。

        此外,當確定好聚類數(shù)目之后,在初始點的選擇上,我們選取盡可能遠的K個點,這個改進雖然簡單直觀,但卻十分有效。具體算法如下描述:

        (1)從輸入的數(shù)據(jù)集中隨機選取一個點,作為初始聚類中心點;

        (2)對數(shù)據(jù)集中的每一個點X, 計算其與初始聚類中心點的距離D(x), 并將其放到一個數(shù)組里邊,然后距離相加得到Sum(D(x));

        (3)選擇下一個新的聚類中心點,選擇原則是:D(x) 較大的點,也就是距離初始中心點最遠的點,被選取的機率較大。通過權重的方法來獲取下一個初始種子點。步驟如下:

        1)取一個可以落在Sum(D(x)) 中的隨機值Random,計算方法為Sum(D(x)) 與0到1之間的隨機數(shù)相乘;

        2)找出當前Random所在的區(qū)間,Random等于Random 減去D(x), 直到其小于或等于0,此時對應的點就是下一個初始種子點。如圖2所示,Random有更大的概率落在D(x3) 中。

        圖2 初始聚類中心點選取

        (4)重復第(2)步和第(3)步,直到選出K個初始聚類中心點。

        (5)根據(jù)選出的K個初始聚類中心點,運行標準的 K-means 算法。

        另外,在距離計算方面,我們采用歐氏距離

        (15)

        其中,Xi為樣本i所有指標形成的向量,Cj是簇j的中心點對應這些指標的向量,n是指標的個數(shù)。

        2.3 模型評估

        為了驗證結果的有效性,我們與經(jīng)典RFM指標對客戶進行細分的結果對比。并驗證選取初始中心點之后的聚類時間和迭代次數(shù)的優(yōu)化。在聚類效果的評估中主要考慮的是類別的緊密程度,因此我們將每個客戶點與其聚類中心點的類內(nèi)平均歐氏距離作為標準

        (16)

        Xi是樣本i所有指標形成的向量,Cj是簇j的中心點對應這些指標的向量,n是指標的個數(shù),m為類內(nèi)樣本的數(shù)量。

        3 模型應用

        3.1 數(shù)據(jù)預處理

        我們將某零售商提供的過去3年的Pointofsales數(shù)據(jù)(POS數(shù)據(jù))作為案例,數(shù)據(jù)集含有3萬多條會員信息,約38萬條消費記錄。我們對原始數(shù)據(jù)集進行預處理工作,對存在多個屬性信息缺失的情況予以刪除,少部分缺失進行插值補全。通過對數(shù)據(jù)的清洗和整合,最終有31 099條會員基本信息和362 368條消費信息被保留,約94%的原始數(shù)據(jù)集。

        3.2 分析與建模

        首先,根據(jù)熵值法得到的每個指標的權重為W=(0.12044223,0.13227003,0.00438084,0.26321809,0.00650823,0.16555703,0.00389175,0.14118024,0.00505721,0.15749435)。 將得到的權重值按式(10)計算得到新的數(shù)據(jù)矩陣。

        接下來,利用KMO和Bartlett’s 檢驗來確定新的數(shù)據(jù)矩陣之間是否適合進行因子分析。通過計算,我們得出的結果見表3。

        表3 KMO和Bartlett’s test

        可以看出KMO=0.857,說明數(shù)據(jù)矩陣比較適合進行因子分析。Bartlett’s test Sig值小于0.05,說明拒絕零假設,即相關矩陣不是單位矩陣,原矩陣之間有共同因素存在,適合進行因子分析。進一步,通過計算累計方差貢獻率和特征根來確定因子的數(shù)目,見表4。

        表4 總方差解釋

        從表4可以看出,因子1的方差百分比為57.42%,因子2的方差百分比為15.96%,因子3的方差百分比為13.605%,前3個因子累積貢獻率為87%。另外,觀察特征值和旋轉平方和載入數(shù)據(jù),最終我們選取了3個因子。

        聚類方面,為了彌補傳統(tǒng)聚類算法的不足,我們首先根據(jù)SSE法來確定最佳聚類的數(shù)量,通過觀察肘部的位置來確定K值。將降維后,選取3個公共因子的數(shù)據(jù)集作為輸入,找出肘部位置,如圖3所示。顯然,肘部對應的K值為5,所以針對這個數(shù)據(jù)集來說,最佳聚類數(shù)目應該選擇5類。

        圖3 SSE圖

        接下來,在初始聚類中心點的選擇上,按照2.2.4節(jié)所描述,選取盡可能遠的5個點作為初始聚類中心,結果見表5。

        表5 初始聚類中心

        最后,我們根據(jù)標準K-means算法,將客戶分為5類,聚類信息見表6。

        表6 多指標客戶細分結果

        依據(jù)聚類結果,我們將客戶細分為5個等級,分別為:C1中價值客戶、C2重要發(fā)展客戶、C3低價值客戶、C4高價值客戶、C5一般客戶。

        3.3 模型評估

        對同一個數(shù)據(jù)集,根據(jù)經(jīng)典客戶細分指標對客戶進行細分,并按照本文所述評估方法進行計算,聚類信息見表7。同時監(jiān)控新模型和經(jīng)典模型的算法運行時間和迭代次數(shù),以及聚類中心變動大小的變化。

        表7 傳統(tǒng)細分模型結果

        通過實際案例發(fā)現(xiàn),在找出初始聚類中心以后,聚類中心變動均值(5個聚類中心點變化的平均值)從最初的

        1.87下降到0.57,說明初始點的選取對聚類迭代有很大的影響。從圖4(橫坐標為聚類迭代次數(shù),縱坐標為聚類中心變動的均值大小)結果對比可以看出,標準的聚類算法迭代了70多次,而加入初始點以后迭代了30多次,聚類的迭代次數(shù)是原來的1/2左右,說明對初始聚類中心點的選取做了優(yōu)化,簡要來說就是使初始聚類中心點盡可能分散開來,這樣可以有效減少迭代次數(shù),加快運算速度。而且聚類所花費時間從00:01.13下降到00:00.50,可以看出算法在改進之后迭代次數(shù)和聚類時間都得到了優(yōu)化。

        圖4 結果對比

        我們將兩種模型的細分結果進行對比,很容易發(fā)現(xiàn),經(jīng)典RFM模型細分結果中每個類別除了花費金額差異較大,其它特征差異較小。另外,可以看出各個類別的類內(nèi)平均距離較大。而通過表7可以看出,利用多指標客戶細分模型得到的細分結果,類與類之間的差異較大,類內(nèi)差異較小,聚類效果更為緊湊。這表明該模型在聚類緊湊性和特征劃分能力方面優(yōu)于傳統(tǒng)的客戶細分方法,可以有效地幫助企業(yè)區(qū)分不同類型的客戶群體,提高客戶關系管理水平和決策質(zhì)量。

        4 客戶細分策略

        本文提出的多指標客戶細分模型,根據(jù)細分結果,可以幫助企業(yè)決策者制定精準的營銷策略,加強企業(yè)與客戶之間的聯(lián)系,從而帶來更高的利潤。在本節(jié)中,我們將提供基于客戶細分的管理策略示例,目的是留住高價值客戶,吸引一般客戶,爭取重要發(fā)展客戶,從而提高企業(yè)利潤和客戶滿意度。

        中價值客戶(C1),他們是企業(yè)比重最大的客戶,占整體的30%左右,消費水平是整體客戶的平均水平。然而這個群體中,客戶消費的平均近度值較低,說明客戶購買產(chǎn)品的時間間隔較長,流失的可能性較高。企業(yè)應該關注這類客戶的最新消息,采取一定的營銷方法,降低客戶流失的可能性。

        重要發(fā)展客戶(C2),他們是企業(yè)的潛在價值客戶,客戶人數(shù)占整體的15.1%。雖然消費水平低于高價值客戶,但整體來看屬于企業(yè)的忠實客戶,有很大的發(fā)展?jié)摿?。在營銷活動中,企業(yè)應重視與這類客戶的關系,制定適當?shù)挠脩舨呗?,刺激他們消費。另外,促進重要發(fā)展客戶向高價值客戶轉變,實現(xiàn)企業(yè)長遠穩(wěn)定的收益。

        低價值客戶(C3)和一般客戶(C5),這兩類客戶人數(shù)占了總人數(shù)的50%左右。整體表現(xiàn)為購買數(shù)額小、頻次低、時間間隔較遠,購買行為具有很大的隨意性。通常,商品促銷和降價對這類客戶有很大的吸引力。企業(yè)可以定期制定營銷活動,促進他們向發(fā)展客戶的轉變。同時,企業(yè)應該適當減少這類客戶的資源投入,轉移到有價值的客戶群體,從而達到企業(yè)資源的有效利用。

        高價值客戶(C4),他們的購買金額大,消費頻次多,購買種類多,對企業(yè)的貢獻最大,但他們所占的比例卻最小,占整體客戶的7.8%。企業(yè)在進行客戶關系管理時,應該重點關注這類客戶。將企業(yè)資源優(yōu)先投放到他們身上,并進行個性化管理和精準的營銷策略,提高他們的滿意度和忠誠度,延長這類客戶的消費周期。

        5 結束語

        本文針對當前客戶細分的背景,結合數(shù)據(jù)挖掘工具,提出了多指標客戶細分模型。從微觀和宏觀角度考慮,將傳統(tǒng)指標進行細化,并加入新的細分指標。通過熵值法為指標賦權。為了減少聚類的時間復雜度,利用因子分析進行數(shù)據(jù)降維。最后,利用改進的K-means聚類算法,在K值的確定和初始中心點的選取上進行優(yōu)化,確定客戶細分結果。對某零售商會員數(shù)據(jù)進行細分的實證研究結果表明,在聚類緊湊性和特征劃分能力方面優(yōu)于經(jīng)典的客戶細分方法,能夠幫助企業(yè)提高客戶關系管理水平和決策質(zhì)量。

        客戶細分有助于公司的戰(zhàn)略制定并提升競爭力。為了更好滿足客戶需求和偏好,企業(yè)必須認識到客戶的差異性,從而制定精準的營銷策略?;诳蛻艏毞謫栴}的研究,未來的工作將圍繞更加細致的客戶分類,分析不同客戶具有的各種用戶特征。結合數(shù)據(jù)挖掘技術,輔助客戶細分的決策與優(yōu)化。我們將進一步對上述問題進行研究,期望獲得更有理論意義和實際應用價值的成果。

        猜你喜歡
        數(shù)據(jù)挖掘模型
        一半模型
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
        3D打印中的模型分割與打包
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        国产美女一级做a爱视频| 免费视频成人片在线观看| 免费特级毛片| 久久这里只精品国产99热| 日韩精品有码在线视频| 99精品国产综合久久麻豆| 欧美人妻aⅴ中文字幕| 97精品伊人久久大香线蕉| 久久精品无码一区二区三区不卡| 日本女优五十路中文字幕| 极品老师腿张开粉嫩小泬| 久久精品人人爽人人爽| 国产69口爆吞精在线视频喝尿| 亚洲中文乱码在线视频| 无遮掩无码h成人av动漫| 欧美孕妇xxxx做受欧美88| 国内精品福利在线视频| 水蜜桃视频在线观看入口| 中国美女a级毛片| 国产精品白浆一区二小说| 人妻少妇精品一区二区三区| 99久久国内精品成人免费| 久久综合九色综合97欧美| 久热这里只有精品99国产| 中文字幕高清一区二区| 色狠狠一区二区三区中文| 性一交一乱一乱一视频| 久久精品国产热久久精品国产亚洲| 日本女同视频一区二区三区| 99久久99久久久精品齐齐| 亚洲av无码专区亚洲av| 国产一级黄色av影片| 精品人妻中文av一区二区三区 | 国产精品国产自产拍高清| 国产永久免费高清在线| 日韩在线看片免费人成视频| 国产精品亚洲精品日韩动图| 最新国产精品拍自在线观看| 亚洲av无码av制服丝袜在线 | 欧美亅性猛交内射| 亚洲综合色自拍一区|