摘 要:進(jìn)行精準(zhǔn)客戶細(xì)分,維護(hù)客戶關(guān)系,優(yōu)化客戶管理是電子商務(wù)行業(yè)大數(shù)據(jù)應(yīng)用的一個(gè)重要方向。為了了解高校學(xué)生在線上平臺消費(fèi)的傾向和偏好,滿足高校學(xué)生客戶的多元化需求,提高客戶認(rèn)可度和核心競爭力,本文以收集的真實(shí)高校學(xué)生消費(fèi)數(shù)據(jù)為基礎(chǔ),通過改進(jìn)的RFM模型和K-Means聚類分析對數(shù)據(jù)進(jìn)行處理和分析。本文以手肘法確定分類類別數(shù)K值,以提高電子商務(wù)客戶細(xì)分的準(zhǔn)確性,獲取更好的分類結(jié)果。最終根據(jù)客戶的細(xì)分結(jié)果,進(jìn)行分析解讀,為不同客戶群制定對應(yīng)的營銷方案和服務(wù)建議。
關(guān)鍵詞:客戶細(xì)分;K-Means聚類;RFM模型;手肘法
根據(jù)《中國電子商務(wù)市場競爭及企業(yè)競爭策略分析報(bào)告》顯示,2011年-2019年我國電子商務(wù)交易額呈逐年增長態(tài)勢,年均復(fù)合增速高達(dá)24%。2019年我國電子商務(wù)交易額為34.81萬億元,同比增長10.05%。突如其來的新冠疫情導(dǎo)致的封控措施更是推動(dòng)了線上成交額的飛速上升。
雖然電子商務(wù)市場呈現(xiàn)出突飛猛進(jìn)的發(fā)展趨勢,但其存在的一些亟待解決的問題仍不容忽視。根據(jù)中國商業(yè)聯(lián)合會調(diào)查的數(shù)據(jù)顯示,69%的電商客戶對網(wǎng)購商品的質(zhì)量極不滿意。客戶是企業(yè)賴以生存和發(fā)展的基礎(chǔ),客戶關(guān)系是企業(yè)極為重要的資源,把握好客戶關(guān)系是進(jìn)行企業(yè)管理和市場營銷的關(guān)鍵,而進(jìn)行客戶精準(zhǔn)細(xì)分是把握客戶關(guān)系的重要步驟,線上客戶亦是擁有更為明顯的消費(fèi)特征,因此對于線上客戶的進(jìn)行細(xì)分研究對于當(dāng)前的發(fā)展來說是極其必要的。
一、K-Means聚類簡述
1956年,美國經(jīng)濟(jì)學(xué)家溫德爾·史密斯首次提出了市場細(xì)分的概念。其主要概念是根據(jù)客戶的不同需求,把整個(gè)市場劃分成一些具有共同特征的子市場。這個(gè)概念一經(jīng)提出,就引發(fā)了相關(guān)學(xué)者的廣泛研究和探討。有很多學(xué)者在這一基礎(chǔ)上展開了更為細(xì)致的研究和應(yīng)用,實(shí)踐表明客戶細(xì)分理論的有效應(yīng)用能夠?yàn)槠髽I(yè)帶來了非常大的收益。德薩羅等認(rèn)為客戶細(xì)分對企業(yè)具有非常重要的指導(dǎo)作用,有助于企業(yè)制定科學(xué)高效的營銷策略。弗蘭克等學(xué)者通過對比客戶細(xì)分策略和傳統(tǒng)的價(jià)格歧視理論發(fā)現(xiàn),客戶細(xì)分策略能夠更好地應(yīng)對廣闊的市場以及顧客差異性帶來的挑戰(zhàn)。市場細(xì)分是客戶關(guān)系管理理論的一個(gè)主要分支,它既為企業(yè)盈利作出貢獻(xiàn)同時(shí)也提高了客戶滿意度。隨著市場多元化的發(fā)展,企業(yè)實(shí)行差異化營銷顯得尤為重要,客戶細(xì)分理論可以有效識別客戶價(jià)值,通過分析高價(jià)值顧客的需求和選擇偏好,從而為企業(yè)節(jié)約資源,有利于企業(yè)實(shí)現(xiàn)精準(zhǔn)營銷。
RFM模型首先由美國數(shù)據(jù)庫營銷學(xué)家休斯在1994年發(fā)現(xiàn)。后續(xù)學(xué)者在自己研究的基礎(chǔ)上進(jìn)行了改進(jìn)和創(chuàng)新。徐翔斌等用利潤指標(biāo)替換金額指標(biāo)提出改進(jìn)的RFP模型。徐文瑞用層次分析法確定RFM模型中的各指標(biāo)權(quán)重,將定性和定量結(jié)合進(jìn)行研究。包志強(qiáng)等加入客戶貢獻(xiàn)時(shí)間以改進(jìn)RFM模型。熊蘭等將客戶的價(jià)值按產(chǎn)品類別進(jìn)行分類。倪楓等加入客戶的活躍時(shí)間構(gòu)造RFMT模型來衡量客戶價(jià)值。靖立崢,吳增源在經(jīng)典RFM模型的基礎(chǔ)上增加客戶消費(fèi)行為特征,構(gòu)建了融入客戶線上行為特征的RFPAV客戶細(xì)分模型。
聚類的目的是將全部樣本劃分成若干類別,適合應(yīng)用在客戶細(xì)分的相關(guān)研究上。其中K-means聚類能夠更快更好地處理數(shù)據(jù)量大的樣本集。K-means聚類是由麥奎因提出的,其主要做法是選擇K個(gè)聚類中心,按照最近原則將全部樣本分為各個(gè)聚類。由于K-means聚類算法存在一些限制性較大的缺陷,如聚類中心、K值不易選取等問題。相關(guān)學(xué)者針對這些缺陷進(jìn)行了相應(yīng)的改進(jìn)。王虹、孫紅針對層次聚類法和K-means聚類法的缺陷,提出將二者相結(jié)合的改進(jìn)算法。任春華、孫林夫等提出一種層次K近鄰密度峰值初始聚類中心選取方法。
本文通過以往的研究并結(jié)合本次研究對象對RFM模型進(jìn)行改進(jìn)。并且運(yùn)用手肘法確定K值,將客戶分為對應(yīng)價(jià)值的客戶群。
二、模型建立
傳統(tǒng)的RFM模型起源于20世紀(jì)60年代的公司直接營銷,在1994年由營銷學(xué)家休斯正式提出。如今RFM模型已經(jīng)廣泛應(yīng)用于各個(gè)行業(yè)的客戶細(xì)分,中外各個(gè)學(xué)者也對模型進(jìn)行了相應(yīng)的改變和擴(kuò)展。傳統(tǒng)的RFM模型是通過客戶最近的購買時(shí)間R(recency)、購買頻率F(frequency)、購買金額M(monetary)三個(gè)基本數(shù)據(jù)指標(biāo)來衡量相關(guān)的客戶價(jià)值。F、M值越大,通常客戶價(jià)值越高。
本研究是主要針對高校學(xué)生電商客戶的研究,因此收集了202個(gè)高校學(xué)生在某電商平臺的真實(shí)消費(fèi)數(shù)據(jù)。該數(shù)據(jù)是根據(jù)該電商平臺統(tǒng)計(jì)的人生賬單作為原始數(shù)據(jù),記錄樣本學(xué)生的最近消費(fèi)時(shí)間并計(jì)算樣本學(xué)生平均一年內(nèi)的消費(fèi)次數(shù)和消費(fèi)總金額。本數(shù)據(jù)收集時(shí)間為十一月下旬,考慮到電商平臺“雙十一”活動(dòng)參與的廣泛性和時(shí)間統(tǒng)計(jì)的抽象性,本研究將最近消費(fèi)時(shí)間分為十一月之前以及十一月的上、中、下旬,分別設(shè)定值為1、3、5、7。由于消費(fèi)金額和消費(fèi)次數(shù)通常成正比,存在一定的共線性問題,容易使研究產(chǎn)生誤差,因此本研究根據(jù)原始數(shù)據(jù)計(jì)算單次的平均消費(fèi)金額來作為M值。
考慮到部分學(xué)生的消費(fèi)情況與一般同學(xué)相比差別較大一起分析會產(chǎn)生較大干擾,本文采用離差規(guī)范化法來消除這種干擾。離差規(guī)范化法受到最大值和最小值取值的限制,且經(jīng)過該法處理后的結(jié)果數(shù)據(jù)都為小數(shù),無較大差別,能夠有效地消除綱量和數(shù)據(jù)取值范圍的影響。離差規(guī)范化法對樣本數(shù)據(jù)進(jìn)行處理時(shí)會在[0,1]內(nèi)映射出原始數(shù)據(jù)的線性變換。
其轉(zhuǎn)換公式為
x*=(x-min)/(max-min)
公式中的min和max是樣本中同類數(shù)據(jù)的最小值和最大值,x為初始數(shù)據(jù)值,x*為處理后的數(shù)據(jù)值。
數(shù)據(jù)歸一化處理后進(jìn)行聚類可以更好地得到結(jié)果,以便進(jìn)行相應(yīng)分析。K-means聚類是聚類研究中最常用的聚類算法,也廣泛地應(yīng)用于各個(gè)行業(yè)的客戶細(xì)分。其基本思路是在選定聚類中心(即質(zhì)心)后,逐一比較每個(gè)個(gè)案與質(zhì)心的距離,將距離最近的一個(gè)個(gè)案首先與質(zhì)心劃為一類,然后進(jìn)行反復(fù)計(jì)算和迭代,直到滿足設(shè)定的要求為止。簡單來說,K-均值聚類就是根據(jù)歐幾里得距離把n個(gè)個(gè)案觀測值自動(dòng)聚集為k(k K-means聚類算法適用于觀測數(shù)據(jù)較多且為連續(xù)變量的情況,適合對個(gè)案的聚類。該方法的缺點(diǎn)是需要自行設(shè)定分類類別K值。分類類別值對于最后的聚類結(jié)果具有較大的影響,僅根據(jù)經(jīng)驗(yàn)隨機(jī)設(shè)定往往缺乏客觀科學(xué)性。因此本研究選用手肘法來確定最佳聚類數(shù)。 手肘法核心思想如下: 隨著分類類別數(shù)的增加,SSE的下降幅度會驟減,然后隨著K值的繼續(xù)增大而趨于平緩。也就是說誤差平方和SSE和K值的關(guān)系圖是一個(gè)手肘的形狀,而肘部對應(yīng)的K值就是本次聚類的最佳聚類數(shù)。手肘法即為選取肘部對應(yīng)的那個(gè)拐點(diǎn)。 核心指標(biāo):SSE(sum of the squared errors,誤差平方和) Ci是第i個(gè)簇,p是Ci中的樣本點(diǎn),mi是Ci的質(zhì)心(Ci中所有樣本的均值) SSE是所有樣本的聚類誤差。 本文設(shè)置K的范圍為[2,8],根據(jù)誤差平方和SSE繪制分類效果圖如下圖所示。根據(jù)手肘法確定最佳聚類數(shù)K=4。 不同聚類數(shù)目下的SSE值 聚類情況如下。 三、結(jié)果分析 由上文可知,分類類別為四時(shí)聚類效果最好。根據(jù)得到的分類情況和最終聚類中心,可以看出不同類別的客戶群有著不同的差異,差異在消費(fèi)時(shí)間、消費(fèi)次數(shù)以及消費(fèi)金額上均有體現(xiàn)。以下是對聚類出的不同客戶群進(jìn)行分析。 第一類客戶群總共有27個(gè)個(gè)案,占全部樣本的13.37%,所占比例較小。該類客戶群購買頻率最高,距離最近購買時(shí)間最短,整體客戶群購物金額跨度較大,平均單次消費(fèi)金額不高。該類客戶習(xí)慣于從該電商平臺購買日常所需用品,但價(jià)值不高,因?yàn)樵摽蛻羧和ǔ]^少購買大金額用品或者涉及金額較大的物品購置時(shí)則更多地考慮線下實(shí)體店購買。 該類客戶可劃分為次優(yōu)質(zhì)客戶群組。針對此類客戶,應(yīng)該在原有的客戶維護(hù)基礎(chǔ)上,推出更多的承諾保障,針對大金額產(chǎn)品提供更多的保險(xiǎn)服務(wù)和保障措施,使客戶充分信任平臺,相信平臺能夠最大力度地保證消費(fèi)者的全部權(quán)益,即使是較大金額的產(chǎn)品也可放心購買,從而開發(fā)該類客戶在該平臺對于大額產(chǎn)品的消費(fèi)潛力。 第二類客戶群總共有15個(gè)個(gè)案,占全部樣本的7.43%,所占比例最小。該類客戶群平均單次購買金額最大,距離最近購買時(shí)間較短,顧客群的購買次數(shù)跨度較大,但整體來看較高。該類客戶不會過于頻繁地從該電商平臺購買日常所需物品,但如果其有相應(yīng)商品的購買需求,不會過于在意商品的價(jià)格,購買顧慮較少,該客戶群通常消費(fèi)水平較高或者是出于對該平臺的信任習(xí)慣從該平臺購買大額產(chǎn)品。 該類客戶可劃分為優(yōu)質(zhì)客戶群組,對該電商平臺的信任程度較高,購買頻率較大,價(jià)格敏感度低,具有極高的客戶價(jià)值。對于本類客戶,要做好相應(yīng)的客戶維護(hù)工作,要注意根據(jù)客戶的需要定期推送相關(guān)產(chǎn)品以避免和其他電商平臺的競爭,在進(jìn)行產(chǎn)品推薦時(shí)要更注重質(zhì)量而非價(jià)格。保證客戶的購物體驗(yàn)是輕松愉快的。 第三類客戶群總共有127個(gè)個(gè)案,占全部樣本的62.87%,所占比例最大。該類客戶群的平均單次購買金額、購買頻率和距離最近購買時(shí)間間隔均居中,不會從該電商平臺過于頻繁購買或購買大額商品,客戶價(jià)值一般,但是卻具有較大的開發(fā)空間。 該類客戶可劃分為潛力客戶群組,擁有固定從該平臺購買的商品清單,購物時(shí)間、次數(shù)和金額均相對穩(wěn)定。針對此類客戶,該電商平臺應(yīng)該在做好基礎(chǔ)的客戶維護(hù)上,對比線下實(shí)體店和其他電商平臺,根據(jù)后臺數(shù)據(jù)統(tǒng)計(jì)的客戶需要有傾向性地推送本平臺的優(yōu)勢產(chǎn)品,提供更多保障以提高客戶信任度,充分開發(fā)客戶的購買潛力。 第四類客戶群總共有33個(gè)個(gè)案,占全部樣本的16.33%,所占比例較小。該類客戶群的購買頻率和購買金額均是最低的??芍擃惪蛻糨^少從該電商平臺購物且單次購物金額較少,客戶價(jià)值最低。 該類客戶可劃分為一般客戶群組,缺乏對該電商平臺的信任,更多地從實(shí)體店購物或是在其他電商平臺消費(fèi)。針對此類客戶,該電商平臺應(yīng)當(dāng)多進(jìn)行相應(yīng)的產(chǎn)品推送和活動(dòng)推薦,刺激客戶的消費(fèi)需求。平臺可先推送一些性價(jià)比較高的低價(jià)商品,根據(jù)客戶的反應(yīng)情況,再做后續(xù)的維護(hù)和推廣。 四、結(jié)語 在物質(zhì)經(jīng)濟(jì)和科學(xué)技術(shù)高速發(fā)展的今天,客戶細(xì)分及關(guān)系管理對于電子商務(wù)行業(yè)乃至各行各業(yè)都具有極大的意義。而隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和廣泛應(yīng)用,企業(yè)可以快捷地根據(jù)自有平臺統(tǒng)計(jì)的客戶消費(fèi)數(shù)據(jù)對客戶的消費(fèi)行為進(jìn)行分析并總結(jié)出對應(yīng)的消費(fèi)規(guī)律,將具有相似特征的消費(fèi)者歸為一個(gè)客戶群,從而有針對性地制定不同的營銷策略,也可以給客戶帶來更多的便捷。本文以改進(jìn)的RFM模型和加以手肘法輔助的K-means聚類對收集的高校學(xué)生消費(fèi)數(shù)據(jù)進(jìn)行分析,高校學(xué)生是電商平臺的重要客戶和優(yōu)質(zhì)潛力客戶,因此本研究具有一定的研究價(jià)值和應(yīng)用意義。通過手肘法確定K值,并以改進(jìn)的RFM模型進(jìn)行分析,得到了較好的分析結(jié)果。從研究結(jié)果中可以看到,高校學(xué)生的客戶價(jià)值是普遍較低的,并且上下差異較大。但高校學(xué)生還是具有較大的消費(fèi)潛力,高校學(xué)生目前主要經(jīng)濟(jì)來源是家庭資助和學(xué)校的獎(jiǎng)助,其消費(fèi)能力相對有限,出于對價(jià)格的敏感性和生活的便捷性,較多地從電商平臺購買日常所需物品。未來,高校學(xué)生畢業(yè)工作后,擁有較大的自主消費(fèi)能力后,還是會習(xí)慣性地從線上購買相關(guān)所需物品。因此,做好對高校學(xué)生客戶的客戶關(guān)系維護(hù)是十分必要的。 當(dāng)然本文也存在諸多不足,比如選取樣本的數(shù)量較少且分布較為集中,對RFM模型的相關(guān)數(shù)據(jù)指標(biāo)還可以更加細(xì)化。相信未來的研究一定可以克服各種困難和不足,達(dá)到理想的客戶細(xì)分效果。 參考文獻(xiàn): [1]王潤清.基于聚類分析的航空旅客在線購票行為研究[D].中國民航大學(xué),2020. [2]徐翔斌,王佳強(qiáng),涂歡,穆明.基于改進(jìn)RFM模型的電子商務(wù)客戶細(xì)分[J].計(jì)算機(jī)應(yīng)用,2012,32(05):1439-1442. [3]徐文瑞.基于RFM模型的顧客消費(fèi)行為與顧客價(jià)值預(yù)測研究[J].商業(yè)經(jīng)濟(jì)研究,2017(19):44-46. [4]包志強(qiáng),趙媛媛,趙研,胡嘯天,黃瓊丹.基于改進(jìn)RFM模型的百度外賣客戶價(jià)值分析[J].西安郵電大學(xué)學(xué)報(bào),2019,24(01):105-110. [5]熊蘭,高炳.基于RFM多層級客戶價(jià)值模型的客戶細(xì)分研究[J].商業(yè)經(jīng)濟(jì)研究,2017(05):55-57. [6]冀慧杰,倪楓,劉姜,趙燚.基于灰色關(guān)聯(lián)度和K-Means++的電子商務(wù)客戶價(jià)值分類[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2020,29(09):249-254. [7]靖立崢,吳增源.基于改進(jìn)K-means算法的電子商務(wù)客戶細(xì)分研究[J].中國計(jì)量大學(xué)學(xué)報(bào),2020,31(04):482-489. [8]王虹,孫紅.基于混合聚類算法的客戶細(xì)分策略研究[J].電子科技,2016,29(01):29-32. 作者簡介:張玉琨(1997- ),女,漢族,河北沙河人,碩士研究生在讀,研究方向:服務(wù)營銷