亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于K-means算法的跨國零售商客戶細(xì)分研究

2024-05-14 12:28:54崔雯李劍鋒

中國商論 2024年9期

關(guān)鍵詞：聚類算法

崔雯李劍鋒

摘要：隨著經(jīng)濟(jì)全球化及大數(shù)據(jù)技術(shù)的蓬勃發(fā)展，跨國零售商之間的競爭日益激烈，根據(jù)客戶特征進(jìn)行客戶細(xì)分，協(xié)助客戶進(jìn)行個(gè)性化的服務(wù)體驗(yàn)，有利于跨國零售商實(shí)現(xiàn)精準(zhǔn)營銷和高效的客戶關(guān)系管理。為了提高客戶細(xì)分的精度，本文提出一種基于RFM模型的K-means聚類算法，使用簇內(nèi)誤方差（SSE）和輪廓系數(shù)（Silhouette Coefficient）計(jì)算聚類個(gè)數(shù)，優(yōu)化K值選取。本文選取一家跨國零售商的數(shù)據(jù)進(jìn)行實(shí)證檢驗(yàn)，對細(xì)分后的結(jié)果進(jìn)行特征分析，將客戶劃分為核心型客戶、維護(hù)型客戶和風(fēng)險(xiǎn)型客戶三種類別，并為不同客戶群體提供差異化營銷策略，僅供參考。

關(guān)鍵詞：K-means；RFM模型；跨國零售商；客戶細(xì)分；聚類算法

本文索引：崔雯，李劍鋒.<變量 2>[J].中國商論，2024（09）：-040.

中圖分類號：F724.2 文獻(xiàn)標(biāo)識碼：A 文章編號：2096-0298（2024）05（a）--04

近年來，隨著全球經(jīng)濟(jì)數(shù)字化浪潮的蓬勃興起，高效的客戶關(guān)系管理和優(yōu)化配置客戶資源的能力是跨國零售商生存和發(fā)展的關(guān)鍵性因素，激烈的市場競爭迫使跨國零售商逐步從剛性的產(chǎn)品導(dǎo)向轉(zhuǎn)為柔性的客戶導(dǎo)向。然而，不同類型的客戶群體消費(fèi)需求不同，若對所有客戶均采用同樣的營銷策略，不僅不能提高客戶的滿意度，還會造成資源的巨大浪費(fèi)。因此，跨國零售商要實(shí)現(xiàn)強(qiáng)競爭力的客戶管理，就要科學(xué)地甄別不同客戶群體的價(jià)值，定制基于客戶價(jià)值差異的個(gè)性化營銷策略。通過客戶細(xì)分，跨國零售商可以挖掘客戶的潛在需求，細(xì)分不同客戶群體，對不同特征的客戶采取個(gè)性化營銷策略，從而針對客戶進(jìn)行合理的資源分配，提高營銷效率。

1 相關(guān)研究

隨著客戶對跨國零售商的要求越來越高，跨國零售商逐步轉(zhuǎn)變傳統(tǒng)的營銷模式，開始注重客戶體驗(yàn)。在客戶關(guān)系管理（CRM）領(lǐng)域的研究文獻(xiàn)中，Kotler（1999）強(qiáng)調(diào)了一個(gè)關(guān)鍵理念：確立與企業(yè)最具價(jià)值的客戶之間的持久聯(lián)系是CRM戰(zhàn)略的核心[1]。Wyner（1996）明確指出，企業(yè)80%的利潤來自20%的客戶[2]。跨國零售商的客戶關(guān)系管理也遵循這一模式，如何對客戶進(jìn)行精準(zhǔn)細(xì)分，識別不同價(jià)值類別的客戶，成為跨國零售商需要積極思索的問題[3]。

在客戶細(xì)分的方法上，K-means聚類算法作為一種基于劃分的聚類算法，被應(yīng)用于不同的聚類場景中。RFM模型及其改進(jìn)模型憑借便捷高效和通俗易懂的優(yōu)勢，占據(jù)著客戶價(jià)值細(xì)分領(lǐng)域的主導(dǎo)地位。許雪晶、林辰瑋（2021）通過實(shí)驗(yàn)驗(yàn)證RFM模型與K-means方法的結(jié)合使用能夠?qū)ζ髽I(yè)客戶價(jià)值進(jìn)行有效細(xì)分[4]。陳丹紅等（2022）在RFM模型的基礎(chǔ)上，構(gòu)建了融入客戶信用指標(biāo)C的RFMC模型，具有良好的實(shí)驗(yàn)效果[5]。靖立崢、吳增源（2020）引入了客戶消費(fèi)行為特征，構(gòu)建了RFPAV客戶細(xì)分模型[6]。但客戶細(xì)分研究仍需解決以下問題：如果聚類數(shù)目過少，則聚類客戶分配就不徹底，聚類效果不佳；如果聚類數(shù)目過多，則客戶群體細(xì)分就瑣碎，數(shù)據(jù)泛化性受到損害[7]。傳統(tǒng)的K-means聚類算法存在人為設(shè)定K值的缺陷，結(jié)果易失真。因此，為提高客戶細(xì)分的精度，本文使用簇內(nèi)誤方差（SSE）和輪廓系數(shù)（Silhouette Coefficient）計(jì)算聚類個(gè)數(shù)優(yōu)化K值選取，提出基于RFM模型的K-means 聚類算法，按照價(jià)值類別的重要程度細(xì)分跨國零售商客戶群體，并針對每一類細(xì)分群體提出個(gè)性化的營銷建議。

2 RFM模型與K-means聚類算法

2.1 RFM模型

源自Arthur Hughes在美國數(shù)據(jù)庫營銷研究所進(jìn)行的企業(yè)用戶分析，RFM模型是一種關(guān)鍵的分類手段，用于評估客戶的價(jià)值及其消費(fèi)行為。該模型在客戶關(guān)系管理（CRM）領(lǐng)域得到了普遍采納，廣泛應(yīng)用于精細(xì)化管理和提升客戶互動(dòng)策略[8]。在客戶行為分析中，R指標(biāo)代表最近消費(fèi)的時(shí)間跨度，具體而言，指的是自客戶最后一次購買行為發(fā)生至今所經(jīng)過的天數(shù)；F指標(biāo)則用于衡量消費(fèi)的頻次，反映的是在特定時(shí)間范圍內(nèi)客戶的購買次數(shù)；M指標(biāo)反映了消費(fèi)的貨幣價(jià)值，即在考察的時(shí)間段內(nèi)，客戶的總消費(fèi)支出。這三個(gè)維度共同構(gòu)成了客戶價(jià)值評估的框架，有助于企業(yè)更精準(zhǔn)地識別和理解客戶行為模式。

在跨國零售商想要擴(kuò)大自身業(yè)務(wù)，卻無法一一查看每個(gè)客戶的細(xì)節(jié)時(shí)，RFM有助于對客戶的價(jià)值進(jìn)行合理的評估，瞄準(zhǔn)最有可能成為跨國零售商忠實(shí)客戶的群體，重點(diǎn)關(guān)注最有價(jià)值的客戶。

2.2 K-means聚類算法

K-means聚類算法是一種經(jīng)典有效的無監(jiān)督學(xué)習(xí)聚類算法，數(shù)據(jù)集通過距離度量被劃分為多個(gè)類別群組，其中群組內(nèi)部的樣本表現(xiàn)出較高的相似性，而不同群組間的樣本相似性則相對較低。該過程的關(guān)鍵步驟包括：首先，設(shè)定聚類中心的初始位置。給定一個(gè)包含n個(gè)數(shù)據(jù)項(xiàng)的數(shù)據(jù)集N，并從中挑選K個(gè)數(shù)據(jù)項(xiàng)作為各類別的初始聚類中心。其次，進(jìn)行樣本分配，通過計(jì)算每個(gè)數(shù)據(jù)項(xiàng)到這K個(gè)聚類中心的距離，并根據(jù)這些距離將數(shù)據(jù)項(xiàng)分配到與之最接近的聚類中心所在的類別中，從而構(gòu)建不同的類別群組；再次更新聚類中心。令i=i+1，利用公式重新對每個(gè)形成的群組內(nèi)的樣本數(shù)據(jù)計(jì)算其平均值，并將此平均值視作更新后的群組中心，通過迭代這一過程，不斷重復(fù)計(jì)算和更新的步驟，直至觀察到群組中心的位置穩(wěn)定，不再發(fā)生顯著變化，得到最終的聚類分析結(jié)果。最后，評估聚類效果。

由于聚類個(gè)數(shù)K是一個(gè)人為設(shè)定的數(shù)字，不同的 K 值會產(chǎn)生不同的聚類結(jié)果，因此對于無監(jiān)督的K-means聚類來說，兩種廣泛采用的評估技術(shù)分別是：簇內(nèi)平方和（SSE）和輪廓系數(shù)（Silhouette Coefficient）。通過觀察SSE在不同K值下的變化，可以找到其學(xué)習(xí)曲線的轉(zhuǎn)折點(diǎn)，即“肘部”效應(yīng)，這個(gè)點(diǎn)通常被認(rèn)為是K值的較佳選擇。同樣地，輪廓系數(shù)的峰值指示著K值的最佳設(shè)定，當(dāng)K值達(dá)到這兩個(gè)指標(biāo)中的任意一個(gè)時(shí)，可以認(rèn)為找到了最佳的聚類數(shù)目[9]。

通過RFM模型對跨國零售商數(shù)據(jù)進(jìn)行建模，采用K-means算法進(jìn)行聚類，以深入理解客戶的購買行為，并識別出各種客戶群體的獨(dú)特消費(fèi)習(xí)慣。

3 客戶細(xì)分實(shí)證分析研究

3.1 操作平臺及數(shù)據(jù)獲取

將K-means算法應(yīng)用于跨國零售商的客戶細(xì)分過程中，本文獲取了一家跨國零售商在2023年4月11日—2023年6月10日的客戶訂單數(shù)據(jù)作為樣本數(shù)據(jù)信息，共計(jì)1000條。研究涉及數(shù)據(jù)集中的字段：訂單編號、購買日期、交易金額、客戶編號，字段及其描述如表1所示。

3.2 數(shù)據(jù)預(yù)處理

首先，進(jìn)行數(shù)據(jù)清洗，清除數(shù)據(jù)為零或空值等異常數(shù)據(jù)，處理重復(fù)數(shù)據(jù)；其次，將PurchaseDate字段中的時(shí)間戳字段類型轉(zhuǎn)換成天數(shù)的形式，以方便計(jì)算R值指標(biāo)；最后，結(jié)合RFM模型，對數(shù)據(jù)進(jìn)行重新統(tǒng)計(jì)整理，分別從三個(gè)維度構(gòu)建客戶價(jià)值細(xì)分特征，RFM模型部分?jǐn)?shù)據(jù)如表2所示。

為消除各指標(biāo)單位不同而對聚類結(jié)果產(chǎn)生影響，在進(jìn)行算法實(shí)驗(yàn)之前，需要對指標(biāo)提取之后的數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理，經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布，即均值為0，標(biāo)準(zhǔn)差為1。

標(biāo)準(zhǔn)化公式如（1），其中μ為所有樣本數(shù)據(jù)的均值，σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差：

標(biāo)準(zhǔn)化后的部分?jǐn)?shù)據(jù)如表3所示，指標(biāo)R、F、M的數(shù)據(jù)全部被轉(zhuǎn)換為無量綱的數(shù)據(jù)值。

3.3 K-means聚類算法實(shí)現(xiàn)

在聚類效果評估的眾多指標(biāo)中，簇內(nèi)平方和（SSE）與輪廓系數(shù)（Silhouette Coefficient）被廣泛認(rèn)為是兩個(gè)關(guān)鍵的性能度量。SSE，也稱為簇內(nèi)誤差平方和，代表在多次迭代過程中，數(shù)據(jù)集中的樣本點(diǎn)與各自群組中心之間的距離的平方和。通常，SSE與K值的關(guān)系圖會呈現(xiàn)出類似手肘的形狀，這個(gè)形狀的轉(zhuǎn)折點(diǎn)通常被認(rèn)為指示著最優(yōu)的K值。SSE的具體計(jì)算公式如下，其中x（i）表示樣本點(diǎn)i，u（j）表示第j簇的質(zhì)心：

輪廓系數(shù)是一個(gè)綜合考量內(nèi)聚度和分離度兩種因素的度量，值域在[-1，1]。輪廓系數(shù)的值越接近1，表示樣本聚類效果越好；越接近-1，則表示樣本更應(yīng)分類到其他的簇。輪廓系數(shù)公式如下，其中a（i）為樣本點(diǎn)a（i）到同簇樣本點(diǎn)的平均距離，b（i）為樣本點(diǎn)a（i）到其他每個(gè)簇距離平均值的最小值：

本文運(yùn)用sklearn.cluster模塊中的KMeans類來執(zhí)行K-means聚類分析，為了評估聚類效果，本文使用sklearn.metrics模塊提供的silhouette_score函數(shù)來計(jì)算輪廓系數(shù)。通過這種方法，本文對K值從2～11進(jìn)行了循環(huán)遍歷，并根據(jù)每個(gè)K值繪制不同 K值下的簇內(nèi)誤方差和輪廓系數(shù)，如圖1所示。

由圖1的分析結(jié)果可以觀察到，當(dāng)K值設(shè)定為3時(shí)，簇內(nèi)平方和（SSE）呈現(xiàn)出明顯的“肘部”現(xiàn)象，同時(shí)輪廓系數(shù)達(dá)到了其峰值。這一現(xiàn)象表明，在考慮SSE和輪廓系數(shù)這兩個(gè)評價(jià)標(biāo)準(zhǔn)的情況下，選擇K值為3能夠帶來最佳的聚類性能。

4 聚類結(jié)果分析與營銷建議

4.1 聚類結(jié)果分析

基于RFM模型和K-means聚類算法確定客戶的種類歸屬K=3，將處理過的原始數(shù)據(jù)導(dǎo)入客戶的聚類模型中，分別對跨國零售商的R、F、M指標(biāo)進(jìn)行聚類分析，得到3類數(shù)據(jù)，對每類數(shù)據(jù)的R、F、M值分別計(jì)算均值，所得字段差異性分析結(jié)果如表4所示。

文章通過對表4中3類群體聚類結(jié)果的R、F、M值進(jìn)行分析，可以發(fā)現(xiàn)：

（1）類別1，此分類群體的R值較小，F(xiàn)、M值均較大，說明該客戶群體在樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)較多，消費(fèi)金額較大，且近期有過消費(fèi)行為，對企業(yè)的貢獻(xiàn)價(jià)值最大但占比最少，是價(jià)值最大的客戶群體，屬于“核心型客戶”。

（2）類別2，此分類群體的R值最小，但F、M值相對較小，說明該客戶群體近期有過消費(fèi)行為，貢獻(xiàn)了一定的消費(fèi)金額，但樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)相對較少。雖然消費(fèi)頻率和消費(fèi)金額都表現(xiàn)一般，但最后一次消費(fèi)的時(shí)間較近，所以這類客戶很可能是新得客戶。因此，可將這類客戶視為中等價(jià)值客戶群，屬于“維護(hù)型客戶”。

（3）類別3，與其他兩種客戶類型相比，此群體的R值最大，F(xiàn)、M值較小，說明該客戶群體在樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)較少，消費(fèi)金額較少且長期沒有過消費(fèi)行為，是最不活躍和最沒有價(jià)值的一類群體，具有較高的流失風(fēng)險(xiǎn)，屬于“風(fēng)險(xiǎn)型客戶”。

4.2 客戶價(jià)值分類的策略分析

（1）核心型客戶

核心型客戶是跨國零售商運(yùn)營收益的最大貢獻(xiàn)者，因此需要投入大量精力和資源進(jìn)行持續(xù)維護(hù)和大力發(fā)展?？梢酝ㄟ^信息技術(shù)動(dòng)態(tài)掌握客戶的需求變化，結(jié)合其消費(fèi)行為習(xí)慣為其提供優(yōu)質(zhì)服務(wù)，并優(yōu)先推薦新產(chǎn)品。同時(shí)，保證價(jià)格優(yōu)惠和產(chǎn)品質(zhì)量，與客戶建立良好的信任關(guān)系，最大程度地滿足客戶的消費(fèi)期望，充分挖掘這類客戶的消費(fèi)潛力，提高客戶增購復(fù)購的意愿。

（2）維護(hù)型客戶

維護(hù)型客戶雖然近期有過消費(fèi)行為，但可能是新獲得的客戶，具有一定的流失風(fēng)險(xiǎn)，因此需要及時(shí)推送客戶可能感興趣的產(chǎn)品，促進(jìn)客戶關(guān)系進(jìn)一步發(fā)展。同時(shí)，需要投入一定的資源探尋客戶未能持續(xù)貢獻(xiàn)價(jià)值的原因，清楚問題所在后，針對性地制定相應(yīng)的客戶關(guān)系管理策略來留存客戶，提高客戶的購買頻率，從而有希望向核心型客戶方向發(fā)展。

（3）風(fēng)險(xiǎn)型客戶

風(fēng)險(xiǎn)型客戶消費(fèi)次數(shù)少且長期沒有消費(fèi)行為，極具流失風(fēng)險(xiǎn)，因此不必投入過多資源進(jìn)行該類客戶的關(guān)系維護(hù)。可以通過再次將該類客戶細(xì)分的方式，針對不同結(jié)果制定不同的留存措施。對于再次細(xì)分后價(jià)值較高的客戶，可以通過發(fā)放優(yōu)惠券等方式進(jìn)行留存維護(hù)。對于價(jià)值低的客戶，可以選擇直接放棄，從而讓跨國零售商有限的資源產(chǎn)生最大效益。

5 結(jié)語

客戶關(guān)系管理是跨國零售商保持競爭優(yōu)勢的前提和關(guān)鍵性因素，跨國零售商需要提高客戶細(xì)分的準(zhǔn)確性，以實(shí)現(xiàn)精準(zhǔn)營銷和有效的客戶關(guān)系管理。本文針對現(xiàn)有研究存在的傳統(tǒng)K-means聚類算法人為設(shè)定K值易導(dǎo)致聚類結(jié)果偏差的不足，在方法上，引入簇內(nèi)平方和（SSE）和輪廓系數(shù)（Silhouette Coefficient）對K-means聚類算法進(jìn)行優(yōu)化，通過對一家跨國零售商客戶數(shù)據(jù)集預(yù)處理后，選取最佳K值，基于RFM模型和K-means聚類算法挖掘客戶數(shù)據(jù)，將相似特征的客戶歸為一類，劃分客戶群體為核心型客戶、維護(hù)型客戶和風(fēng)險(xiǎn)型客戶三種類別，并為不同客戶群體提供了差異化的營銷建議，從而幫助跨國零售商實(shí)現(xiàn)精準(zhǔn)營銷。

參考文獻(xiàn)

Kotler Philip. Kotler on marketing： how to create， win， and dominate markets[M]. Free Press，1999.

Wyner G A. Customer profitability： linking behavior to economics[J]. Marketing Research，1996， 8（2）： 36-38.

劉瀟，王效俐.基于k-means和鄰域粗糙集的航空客戶價(jià)值分類研究[J].運(yùn)籌與管理，2021，30（3）：104-111.

許雪晶，林辰瑋.基于RFM的電商數(shù)據(jù)客戶價(jià)值細(xì)分實(shí)例研究[J].長春師范大學(xué)學(xué)報(bào)，2021，40（4）：60-69.

陳丹紅，彭張林，萬德全，等.眾包平臺用戶價(jià)值識別與細(xì)分：基于改進(jìn)的RFM模型[J].計(jì)算機(jī)科學(xué)，2022，49（4）： 37-42.

靖立崢，吳增源.基于改進(jìn)K-means算法的電子商務(wù)客戶細(xì)分研究[J].中國計(jì)量大學(xué)學(xué)報(bào)，2020，31（4）：482-489.

杜科，鄧佳雯，陳繼紅.改進(jìn)RFM模型在房地產(chǎn)客戶細(xì)分中的研究及應(yīng)用[J].電腦知識與技術(shù)，2018，14（19）：243-245+251.

HUGHES A. Strategic Database Marketing： The Master Plan for Starling and Managing A Profitable Customer-Based Marketing Program[M]. New York： McGraw-Hill Professional， 1994：231-238.

巫芯宇.基于FTRM模型和K-means算法的大學(xué)生知識付費(fèi)產(chǎn)品使用行為研究[J].西南大學(xué)學(xué)報(bào)（自然科學(xué)版），2021，43（6）： 195-204.