崔雯 李劍鋒
摘 要:隨著經(jīng)濟(jì)全球化及大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,跨國零售商之間的競爭日益激烈,根據(jù)客戶特征進(jìn)行客戶細(xì)分,協(xié)助客戶進(jìn)行個(gè)性化的服務(wù)體驗(yàn),有利于跨國零售商實(shí)現(xiàn)精準(zhǔn)營銷和高效的客戶關(guān)系管理。為了提高客戶細(xì)分的精度,本文提出一種基于RFM模型的K-means聚類算法,使用簇內(nèi)誤方差(SSE)和輪廓系數(shù)(Silhouette Coefficient)計(jì)算聚類個(gè)數(shù),優(yōu)化K值選取。本文選取一家跨國零售商的數(shù)據(jù)進(jìn)行實(shí)證檢驗(yàn),對細(xì)分后的結(jié)果進(jìn)行特征分析,將客戶劃分為核心型客戶、維護(hù)型客戶和風(fēng)險(xiǎn)型客戶三種類別,并為不同客戶群體提供差異化營銷策略,僅供參考。
關(guān)鍵詞:K-means;RFM模型;跨國零售商;客戶細(xì)分;聚類算法
本文索引:崔雯,李劍鋒.<變量 2>[J].中國商論,2024(09):-040.
中圖分類號:F724.2 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-0298(2024)05(a)--04
近年來,隨著全球經(jīng)濟(jì)數(shù)字化浪潮的蓬勃興起,高效的客戶關(guān)系管理和優(yōu)化配置客戶資源的能力是跨國零售商生存和發(fā)展的關(guān)鍵性因素,激烈的市場競爭迫使跨國零售商逐步從剛性的產(chǎn)品導(dǎo)向轉(zhuǎn)為柔性的客戶導(dǎo)向。然而,不同類型的客戶群體消費(fèi)需求不同,若對所有客戶均采用同樣的營銷策略,不僅不能提高客戶的滿意度,還會造成資源的巨大浪費(fèi)。因此,跨國零售商要實(shí)現(xiàn)強(qiáng)競爭力的客戶管理,就要科學(xué)地甄別不同客戶群體的價(jià)值,定制基于客戶價(jià)值差異的個(gè)性化營銷策略。通過客戶細(xì)分,跨國零售商可以挖掘客戶的潛在需求,細(xì)分不同客戶群體,對不同特征的客戶采取個(gè)性化營銷策略,從而針對客戶進(jìn)行合理的資源分配,提高營銷效率。
1 相關(guān)研究
隨著客戶對跨國零售商的要求越來越高,跨國零售商逐步轉(zhuǎn)變傳統(tǒng)的營銷模式,開始注重客戶體驗(yàn)。在客戶關(guān)系管理(CRM)領(lǐng)域的研究文獻(xiàn)中,Kotler(1999)強(qiáng)調(diào)了一個(gè)關(guān)鍵理念:確立與企業(yè)最具價(jià)值的客戶之間的持久聯(lián)系是CRM戰(zhàn)略的核心[1]。Wyner(1996)明確指出,企業(yè)80%的利潤來自20%的客戶[2]。跨國零售商的客戶關(guān)系管理也遵循這一模式,如何對客戶進(jìn)行精準(zhǔn)細(xì)分,識別不同價(jià)值類別的客戶,成為跨國零售商需要積極思索的問題[3]。
在客戶細(xì)分的方法上,K-means聚類算法作為一種基于劃分的聚類算法,被應(yīng)用于不同的聚類場景中。RFM模型及其改進(jìn)模型憑借便捷高效和通俗易懂的優(yōu)勢,占據(jù)著客戶價(jià)值細(xì)分領(lǐng)域的主導(dǎo)地位。許雪晶、林辰瑋(2021)通過實(shí)驗(yàn)驗(yàn)證RFM模型與K-means方法的結(jié)合使用能夠?qū)ζ髽I(yè)客戶價(jià)值進(jìn)行有效細(xì)分[4]。陳丹紅等(2022)在RFM模型的基礎(chǔ)上,構(gòu)建了融入客戶信用指標(biāo)C的RFMC模型,具有良好的實(shí)驗(yàn)效果[5]。靖立崢、吳增源(2020)引入了客戶消費(fèi)行為特征,構(gòu)建了RFPAV客戶細(xì)分模型[6]。但客戶細(xì)分研究仍需解決以下問題:如果聚類數(shù)目過少,則聚類客戶分配就不徹底,聚類效果不佳;如果聚類數(shù)目過多,則客戶群體細(xì)分就瑣碎,數(shù)據(jù)泛化性受到損害[7]。傳統(tǒng)的K-means聚類算法存在人為設(shè)定K值的缺陷,結(jié)果易失真。因此,為提高客戶細(xì)分的精度,本文使用簇內(nèi)誤方差(SSE)和輪廓系數(shù)(Silhouette Coefficient)計(jì)算聚類個(gè)數(shù)優(yōu)化K值選取,提出基于RFM模型的K-means 聚類算法,按照價(jià)值類別的重要程度細(xì)分跨國零售商客戶群體,并針對每一類細(xì)分群體提出個(gè)性化的營銷建議。
2 RFM模型與K-means聚類算法
2.1 RFM模型
源自Arthur Hughes在美國數(shù)據(jù)庫營銷研究所進(jìn)行的企業(yè)用戶分析,RFM模型是一種關(guān)鍵的分類手段,用于評估客戶的價(jià)值及其消費(fèi)行為。該模型在客戶關(guān)系管理(CRM)領(lǐng)域得到了普遍采納,廣泛應(yīng)用于精細(xì)化管理和提升客戶互動(dòng)策略[8]。在客戶行為分析中,R指標(biāo)代表最近消費(fèi)的時(shí)間跨度,具體而言,指的是自客戶最后一次購買行為發(fā)生至今所經(jīng)過的天數(shù);F指標(biāo)則用于衡量消費(fèi)的頻次,反映的是在特定時(shí)間范圍內(nèi)客戶的購買次數(shù);M指標(biāo)反映了消費(fèi)的貨幣價(jià)值,即在考察的時(shí)間段內(nèi),客戶的總消費(fèi)支出。這三個(gè)維度共同構(gòu)成了客戶價(jià)值評估的框架,有助于企業(yè)更精準(zhǔn)地識別和理解客戶行為模式。
在跨國零售商想要擴(kuò)大自身業(yè)務(wù),卻無法一一查看每個(gè)客戶的細(xì)節(jié)時(shí),RFM有助于對客戶的價(jià)值進(jìn)行合理的評估,瞄準(zhǔn)最有可能成為跨國零售商忠實(shí)客戶的群體,重點(diǎn)關(guān)注最有價(jià)值的客戶。
2.2 K-means聚類算法
K-means聚類算法是一種經(jīng)典有效的無監(jiān)督學(xué)習(xí)聚類算法,數(shù)據(jù)集通過距離度量被劃分為多個(gè)類別群組,其中群組內(nèi)部的樣本表現(xiàn)出較高的相似性,而不同群組間的樣本相似性則相對較低。該過程的關(guān)鍵步驟包括:首先,設(shè)定聚類中心的初始位置。給定一個(gè)包含n個(gè)數(shù)據(jù)項(xiàng)的數(shù)據(jù)集N,并從中挑選K個(gè)數(shù)據(jù)項(xiàng)作為各類別的初始聚類中心。其次,進(jìn)行樣本分配,通過計(jì)算每個(gè)數(shù)據(jù)項(xiàng)到這K個(gè)聚類中心的距離,并根據(jù)這些距離將數(shù)據(jù)項(xiàng)分配到與之最接近的聚類中心所在的類別中,從而構(gòu)建不同的類別群組;再次更新聚類中心。令i=i+1,利用公式重新對每個(gè)形成的群組內(nèi)的樣本數(shù)據(jù)計(jì)算其平均值,并將此平均值視作更新后的群組中心,通過迭代這一過程,不斷重復(fù)計(jì)算和更新的步驟,直至觀察到群組中心的位置穩(wěn)定,不再發(fā)生顯著變化,得到最終的聚類分析結(jié)果。最后,評估聚類效果。
由于聚類個(gè)數(shù)K是一個(gè)人為設(shè)定的數(shù)字,不同的 K 值會產(chǎn)生不同的聚類結(jié)果,因此對于無監(jiān)督的K-means聚類來說,兩種廣泛采用的評估技術(shù)分別是:簇內(nèi)平方和(SSE)和輪廓系數(shù)(Silhouette Coefficient)。通過觀察SSE在不同K值下的變化,可以找到其學(xué)習(xí)曲線的轉(zhuǎn)折點(diǎn),即“肘部”效應(yīng),這個(gè)點(diǎn)通常被認(rèn)為是K值的較佳選擇。同樣地,輪廓系數(shù)的峰值指示著K值的最佳設(shè)定,當(dāng)K值達(dá)到這兩個(gè)指標(biāo)中的任意一個(gè)時(shí),可以認(rèn)為找到了最佳的聚類數(shù)目[9]。
通過RFM模型對跨國零售商數(shù)據(jù)進(jìn)行建模,采用K-means算法進(jìn)行聚類,以深入理解客戶的購買行為,并識別出各種客戶群體的獨(dú)特消費(fèi)習(xí)慣。
3 客戶細(xì)分實(shí)證分析研究
3.1 操作平臺及數(shù)據(jù)獲取
將K-means算法應(yīng)用于跨國零售商的客戶細(xì)分過程中,本文獲取了一家跨國零售商在2023年4月11日—2023年6月10日的客戶訂單數(shù)據(jù)作為樣本數(shù)據(jù)信息 ,共計(jì)1000條。研究涉及數(shù)據(jù)集中的字段:訂單編號、購買日期、交易金額、客戶編號,字段及其描述如表1所示。
3.2 數(shù)據(jù)預(yù)處理
首先,進(jìn)行數(shù)據(jù)清洗,清除數(shù)據(jù)為零或空值等異常數(shù)據(jù),處理重復(fù)數(shù)據(jù);其次,將PurchaseDate字段中的時(shí)間戳字段類型轉(zhuǎn)換成天數(shù)的形式,以方便計(jì)算R值指標(biāo);最后,結(jié)合RFM模型,對數(shù)據(jù)進(jìn)行重新統(tǒng)計(jì)整理,分別從三個(gè)維度構(gòu)建客戶價(jià)值細(xì)分特征,RFM模型部分?jǐn)?shù)據(jù)如表2所示。
為消除各指標(biāo)單位不同而對聚類結(jié)果產(chǎn)生影響,在進(jìn)行算法實(shí)驗(yàn)之前,需要對指標(biāo)提取之后的數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1。
標(biāo)準(zhǔn)化公式如(1),其中μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差:
標(biāo)準(zhǔn)化后的部分?jǐn)?shù)據(jù)如表3所示,指標(biāo)R、F、M的數(shù)據(jù)全部被轉(zhuǎn)換為無量綱的數(shù)據(jù)值。
3.3 K-means聚類算法實(shí)現(xiàn)
在聚類效果評估的眾多指標(biāo)中,簇內(nèi)平方和(SSE)與輪廓系數(shù)(Silhouette Coefficient)被廣泛認(rèn)為是兩個(gè)關(guān)鍵的性能度量。SSE,也稱為簇內(nèi)誤差平方和,代表在多次迭代過程中,數(shù)據(jù)集中的樣本點(diǎn)與各自群組中心之間的距離的平方和。通常,SSE與K值的關(guān)系圖會呈現(xiàn)出類似手肘的形狀,這個(gè)形狀的轉(zhuǎn)折點(diǎn)通常被認(rèn)為指示著最優(yōu)的K值。SSE的具體計(jì)算公式如下,其中x(i)表示樣本點(diǎn)i,u(j)表示第j簇的質(zhì)心:
輪廓系數(shù)是一個(gè)綜合考量內(nèi)聚度和分離度兩種因素的度量,值域在[-1,1]。輪廓系數(shù)的值越接近1,表示樣本聚類效果越好;越接近-1,則表示樣本更應(yīng)分類到其他的簇。輪廓系數(shù)公式如下,其中a(i)為樣本點(diǎn)a(i)到同簇樣本點(diǎn)的平均距離,b(i)為樣本點(diǎn)a(i)到其他每個(gè)簇距離平均值的最小值:
本文運(yùn)用sklearn.cluster模塊中的KMeans類來執(zhí)行K-means聚類分析,為了評估聚類效果,本文使用sklearn.metrics模塊提供的silhouette_score函數(shù)來計(jì)算輪廓系數(shù)。通過這種方法,本文對K值從2~11進(jìn)行了循環(huán)遍歷,并根據(jù)每個(gè)K值繪制不同 K值下的簇內(nèi)誤方差和輪廓系數(shù),如圖1所示。
由圖1的分析結(jié)果可以觀察到,當(dāng)K值設(shè)定為3時(shí),簇內(nèi)平方和(SSE)呈現(xiàn)出明顯的“肘部”現(xiàn)象,同時(shí)輪廓系數(shù)達(dá)到了其峰值。這一現(xiàn)象表明,在考慮SSE和輪廓系數(shù)這兩個(gè)評價(jià)標(biāo)準(zhǔn)的情況下,選擇K值為3能夠帶來最佳的聚類性能。
4 聚類結(jié)果分析與營銷建議
4.1 聚類結(jié)果分析
基于RFM模型和K-means聚類算法確定客戶的種類歸屬K=3,將處理過的原始數(shù)據(jù)導(dǎo)入客戶的聚類模型中,分別對跨國零售商的R、F、M指標(biāo)進(jìn)行聚類分析,得到3類數(shù)據(jù),對每類數(shù)據(jù)的R、F、M值分別計(jì)算均值,所得字段差異性分析結(jié)果如表4所示。
文章通過對表4中3類群體聚類結(jié)果的R、F、M值進(jìn)行分析,可以發(fā)現(xiàn):
(1)類別1,此分類群體的R值較小,F(xiàn)、M值均較大,說明該客戶群體在樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)較多,消費(fèi)金額較大,且近期有過消費(fèi)行為,對企業(yè)的貢獻(xiàn)價(jià)值最大但占比最少,是價(jià)值最大的客戶群體,屬于“核心型客戶”。
(2)類別2,此分類群體的R值最小,但F、M值相對較小,說明該客戶群體近期有過消費(fèi)行為,貢獻(xiàn)了一定的消費(fèi)金額,但樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)相對較少。雖然消費(fèi)頻率和消費(fèi)金額都表現(xiàn)一般,但最后一次消費(fèi)的時(shí)間較近,所以這類客戶很可能是新得客戶。因此,可將這類客戶視為中等價(jià)值客戶群,屬于“維護(hù)型客戶”。
(3)類別3,與其他兩種客戶類型相比,此群體的R值最大,F(xiàn)、M值較小,說明該客戶群體在樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)較少,消費(fèi)金額較少且長期沒有過消費(fèi)行為,是最不活躍和最沒有價(jià)值的一類群體,具有較高的流失風(fēng)險(xiǎn),屬于“風(fēng)險(xiǎn)型客戶”。
4.2 客戶價(jià)值分類的策略分析
(1)核心型客戶
核心型客戶是跨國零售商運(yùn)營收益的最大貢獻(xiàn)者,因此需要投入大量精力和資源進(jìn)行持續(xù)維護(hù)和大力發(fā)展??梢酝ㄟ^信息技術(shù)動(dòng)態(tài)掌握客戶的需求變化,結(jié)合其消費(fèi)行為習(xí)慣為其提供優(yōu)質(zhì)服務(wù),并優(yōu)先推薦新產(chǎn)品。同時(shí),保證價(jià)格優(yōu)惠和產(chǎn)品質(zhì)量,與客戶建立良好的信任關(guān)系,最大程度地滿足客戶的消費(fèi)期望,充分挖掘這類客戶的消費(fèi)潛力,提高客戶增購復(fù)購的意愿。
(2)維護(hù)型客戶
維護(hù)型客戶雖然近期有過消費(fèi)行為,但可能是新獲得的客戶,具有一定的流失風(fēng)險(xiǎn),因此需要及時(shí)推送客戶可能感興趣的產(chǎn)品,促進(jìn)客戶關(guān)系進(jìn)一步發(fā)展。同時(shí),需要投入一定的資源探尋客戶未能持續(xù)貢獻(xiàn)價(jià)值的原因,清楚問題所在后,針對性地制定相應(yīng)的客戶關(guān)系管理策略來留存客戶,提高客戶的購買頻率,從而有希望向核心型客戶方向發(fā)展。
(3)風(fēng)險(xiǎn)型客戶
風(fēng)險(xiǎn)型客戶消費(fèi)次數(shù)少且長期沒有消費(fèi)行為,極具流失風(fēng)險(xiǎn),因此不必投入過多資源進(jìn)行該類客戶的關(guān)系維護(hù)。可以通過再次將該類客戶細(xì)分的方式,針對不同結(jié)果制定不同的留存措施。對于再次細(xì)分后價(jià)值較高的客戶,可以通過發(fā)放優(yōu)惠券等方式進(jìn)行留存維護(hù)。對于價(jià)值低的客戶,可以選擇直接放棄,從而讓跨國零售商有限的資源產(chǎn)生最大效益。
5 結(jié)語
客戶關(guān)系管理是跨國零售商保持競爭優(yōu)勢的前提和關(guān)鍵性因素,跨國零售商需要提高客戶細(xì)分的準(zhǔn)確性,以實(shí)現(xiàn)精準(zhǔn)營銷和有效的客戶關(guān)系管理。本文針對現(xiàn)有研究存在的傳統(tǒng)K-means聚類算法人為設(shè)定K值易導(dǎo)致聚類結(jié)果偏差的不足,在方法上,引入簇內(nèi)平方和(SSE)和輪廓系數(shù)(Silhouette Coefficient)對K-means聚類算法進(jìn)行優(yōu)化,通過對一家跨國零售商客戶數(shù)據(jù)集預(yù)處理后,選取最佳K值,基于RFM模型和K-means聚類算法挖掘客戶數(shù)據(jù),將相似特征的客戶歸為一類,劃分客戶群體為核心型客戶、維護(hù)型客戶和風(fēng)險(xiǎn)型客戶三種類別,并為不同客戶群體提供了差異化的營銷建議,從而幫助跨國零售商實(shí)現(xiàn)精準(zhǔn)營銷。
參考文獻(xiàn)
Kotler Philip. Kotler on marketing: how to create, win, and dominate markets[M]. Free Press,1999.
Wyner G A. Customer profitability: linking behavior to economics[J]. Marketing Research,1996, 8(2): 36-38.
劉瀟,王效俐.基于k-means和鄰域粗糙集的航空客戶價(jià)值分類研究[J].運(yùn)籌與管理,2021,30(3):104-111.
許雪晶,林辰瑋.基于RFM的電商數(shù)據(jù)客戶價(jià)值細(xì)分實(shí)例研究[J].長春師范大學(xué)學(xué)報(bào),2021,40(4):60-69.
陳丹紅,彭張林,萬德全,等.眾包平臺用戶價(jià)值識別與細(xì)分: 基于改進(jìn)的RFM模型[J].計(jì)算機(jī)科學(xué),2022,49(4): 37-42.
靖立崢,吳增源.基于改進(jìn)K-means算法的電子商務(wù)客戶細(xì)分研究[J].中國計(jì)量大學(xué)學(xué)報(bào),2020,31(4):482-489.
杜科,鄧佳雯,陳繼紅.改進(jìn)RFM模型在房地產(chǎn)客戶細(xì)分中的研究及應(yīng)用[J].電腦知識與技術(shù),2018,14(19):243-245+251.
HUGHES A. Strategic Database Marketing: The Master Plan for Starling and Managing A Profitable Customer-Based Marketing Program[M]. New York: McGraw-Hill Professional, 1994:231-238.
巫芯宇.基于FTRM模型和K-means算法的大學(xué)生知識付費(fèi)產(chǎn)品使用行為研究[J].西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,43(6): 195-204.