廣東省經(jīng)濟(jì)貿(mào)易職業(yè)技術(shù)學(xué)校 楊雄鋼
基于聚類分析的電子商務(wù)客戶忠誠(chéng)度研究
廣東省經(jīng)濟(jì)貿(mào)易職業(yè)技術(shù)學(xué)校 楊雄鋼
全面分析電子商務(wù)顧客忠誠(chéng)度的影響因素,立足于經(jīng)典RFM客戶忠誠(chéng)度模型,將RFMSA電子商務(wù)客戶忠誠(chéng)度劃分模型有效地建立起來(lái),借助聚類分析算法劃分顧客忠誠(chéng)度,立足于經(jīng)典聚類分析法K-means,將分段確定初始聚類中心的改進(jìn)算法提出,以此來(lái)劃分顧客的忠誠(chéng)度.借助分析經(jīng)典樣本數(shù)據(jù),從實(shí)驗(yàn)結(jié)果可以看成,通過(guò)對(duì)粗糙集K-means聚類算法進(jìn)行改進(jìn)后,可以將聚類的準(zhǔn)確率有效提高.
聚類分析;電子商務(wù);客戶忠誠(chéng)度
在電子商務(wù)環(huán)境下,企業(yè)可以對(duì)互聯(lián)網(wǎng)進(jìn)行利用將產(chǎn)品和服務(wù)提供給客戶.企業(yè)不認(rèn)識(shí)顧客,顧客也不認(rèn)識(shí)企業(yè),沒(méi)有當(dāng)面交流過(guò)一句,所有客戶關(guān)系都通過(guò)網(wǎng)絡(luò)來(lái)進(jìn)行維持.能夠讓消費(fèi)者更好的進(jìn)行對(duì)比、選擇以及提供各方面綜合程度較高的商品和企業(yè)即為互聯(lián)網(wǎng)的優(yōu)點(diǎn),對(duì)互聯(lián)網(wǎng)進(jìn)行利用,讓消費(fèi)者更好的對(duì)信息進(jìn)行搜索,這樣就可以利用相關(guān)企業(yè)在網(wǎng)上開設(shè)的商城,將商品的價(jià)格等相關(guān)信息獲取到,并且還可以和企業(yè)服務(wù)商進(jìn)行對(duì)比,不僅可以在價(jià)格上進(jìn)行比較,同時(shí)還可以在服務(wù)商進(jìn)行比較,通過(guò)以上所講到的對(duì)比,消費(fèi)者就會(huì)選擇和自己消費(fèi)意象更相符的產(chǎn)品或商家,因此在電子商務(wù)中,客戶忠誠(chéng)度基本較低,最終流失掉本有的客戶.怎樣才能將客戶的忠誠(chéng)度提高是現(xiàn)階段電子商務(wù)迫切需要解決的問(wèn)題.
(一)RFM模型
在電子商務(wù)行業(yè)中,RFM模型是對(duì)客戶忠誠(chéng)度進(jìn)行分析時(shí)用得最多的一種模型,客戶真實(shí)的交易數(shù)據(jù)即為RFM數(shù)據(jù),因此,數(shù)據(jù)具有較強(qiáng)的準(zhǔn)確性,客戶的個(gè)人隱私通常不會(huì)涵蓋在內(nèi),獲取較為容易.RFM模型在客戶忠誠(chéng)度研究中得到了廣泛的運(yùn)用,其以客戶的消費(fèi)金額、購(gòu)買頻率、購(gòu)買時(shí)間間隔為基礎(chǔ).
(二)RFMSA 模型
作為電子上我中對(duì)客戶行為的重要指標(biāo),RFMSA 模型將交易金額、交易頻率、交易時(shí)間、關(guān)注度、商品評(píng)價(jià)包括在內(nèi).在RFMSA 模型中,每一個(gè)屬性維度的重要程度都具有一定的差異性,也就是五個(gè)屬性維度的權(quán)重不同.五種指標(biāo)所影響用戶忠誠(chéng)度的程度不一樣,以綜合反映客戶忠誠(chéng)度的指標(biāo)CLV客戶終生價(jià)值指標(biāo)為基礎(chǔ),來(lái)定義RFMSA 模型,如式(1)所示:
其中i表示客戶中的第i個(gè)客戶,CLVi表示此客戶的忠誠(chéng)度指標(biāo),Ri、Fi、Mi、Si、Ai分別表示此客戶RFMSA 指標(biāo)的ωR、ωF、ωM、ωS、ωA分別表示五個(gè)指標(biāo)的權(quán)重系數(shù)[1].在所有指標(biāo)當(dāng)中,CLV與購(gòu)買時(shí)間成反比,而在另外四項(xiàng)指標(biāo)方面都成正比.在將 RFMSA模型確立之后,應(yīng)預(yù)先處理數(shù)據(jù),將其轉(zhuǎn)換成系統(tǒng)需要的 RFMSA數(shù)據(jù)并加以規(guī)范,然后在分析數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行分析的過(guò)程當(dāng)中,系統(tǒng)主要是通過(guò)采取聚類分析的方式,來(lái)實(shí)現(xiàn)數(shù)據(jù)集的分類.
(一)模糊K-means算法
微課可以使模糊聚類更好地實(shí)現(xiàn),以下設(shè)計(jì)和分析了模糊K-means算法,其具體描述如下所示:假設(shè)數(shù)據(jù)集集合為,數(shù)據(jù)集的簇?cái)?shù)量為K個(gè),第i個(gè)簇的中心即為mi,i=1,2,...k0uj(xi)表示K-means算法聚類過(guò)程中第x個(gè)樣本對(duì)第j類的隸屬度,模糊K-means算法的目標(biāo)函數(shù)可以對(duì)以下式子予以使用來(lái)描述.
其中,b使一個(gè)可以對(duì)模糊聚類結(jié)果予以控制的模糊度常數(shù),通過(guò)模糊K-means均值隸屬度函數(shù)求導(dǎo)數(shù),就可以將K-means算法的最佳解放得到,如以式(2)、(3)所示:
在對(duì)K- means算法予以執(zhí)行時(shí),能夠通過(guò)對(duì)上述兩個(gè)方程式予以實(shí)際的執(zhí)行,來(lái)得到一各具體的模糊K- means算法,這樣就能夠?qū)⑵鋺?yīng)用到實(shí)際數(shù)據(jù)劃分當(dāng)中[2].給予模糊思想下的K- means算法,在對(duì)其進(jìn)行具體描述時(shí)分為以下幾點(diǎn):第一,對(duì)隨機(jī)初始法予以采用,以此作為數(shù)據(jù)集設(shè)定K個(gè)簇,并將各個(gè)簇的中心設(shè)定為mi;第二,對(duì)客戶的購(gòu)買記錄數(shù)據(jù)集中所有的數(shù)據(jù)對(duì)象的隸屬函數(shù)進(jìn)行計(jì)算,計(jì)算方式為(3);第三,將第二個(gè)步驟當(dāng)中的隸屬函數(shù)作為基礎(chǔ),來(lái)對(duì)所有簇的中心值mi予以計(jì)算,能夠通過(guò)算式(2)來(lái)進(jìn)行;第四,遍歷數(shù)據(jù)集中所有數(shù)據(jù)對(duì)象,當(dāng)隸屬度不再改變時(shí),算法結(jié)束,不然就返回到步驟二.
(二)具體運(yùn)用
本文所采用的系統(tǒng)實(shí)驗(yàn)工具為Matlab2009程序處理平臺(tái),而第五代智能英特爾酷睿i7處理器是本次實(shí)驗(yàn)采用的服務(wù)器,i7一SSOOU為CPU的型號(hào),主頻為2. 40GHz,4G內(nèi)存,W in8是其操作系統(tǒng),在分析算法、實(shí)現(xiàn)算法、運(yùn)行數(shù)據(jù)的準(zhǔn)確性和有效性中得到了較好的運(yùn)用.
實(shí)驗(yàn)數(shù)據(jù)對(duì)中科院模式予以采用,對(duì)國(guó)家重點(diǎn)實(shí)驗(yàn)室采集的SUNING、JD、TMALL等三個(gè)購(gòu)物網(wǎng)站的用戶消費(fèi)數(shù)據(jù)進(jìn)行識(shí)別,使用BOW工作預(yù)處理數(shù)據(jù)集,所有的數(shù)據(jù)集中都將3萬(wàn)條電子商務(wù)瀏覽記錄包括在其中,可以將其分為高、中、低三個(gè)客戶忠誠(chéng)度的類別,黃金消費(fèi)群體即為高忠誠(chéng)度的客戶,其具有較高的交易頻率,每個(gè)月的消費(fèi)金額較多,瀏覽了很多的商品,具有極高的潛在消費(fèi)價(jià)值,其黏性較高;普通消費(fèi)群體即是中忠誠(chéng)度的客戶,商品流量的數(shù)量一般,不能確定出潛在消費(fèi)價(jià)值和黏性;低忠誠(chéng)度客戶也就是低值客戶,用戶對(duì)網(wǎng)站進(jìn)行訪問(wèn)的時(shí)間具有較長(zhǎng)的間隔,交易很少能夠成功完成,消費(fèi)額度極少.上述三個(gè)類別都其記錄都有1萬(wàn)條.
為了能夠?qū)Ω倪M(jìn)的K- means算法的有效性進(jìn)行評(píng)估,本文對(duì)召回率評(píng)估算法聚類的精確程度進(jìn)行使用,其定義如式(4)所示.
其中,T和C分別表示的是改進(jìn)的K-means的算法執(zhí)行結(jié)果的簇標(biāo)號(hào)、實(shí)際客戶屬于的忠誠(chéng)度類型的數(shù)目,A1(c,T )和A2(c,T )分別表示瀏覽記錄分到其歸宿的忠誠(chéng)度類別T中的數(shù)目、瀏覽記錄C被錯(cuò)誤地劃分到非歸屬忠誠(chéng)度類別T中的數(shù)量.
通過(guò)以上三種算法運(yùn)行在TMALL數(shù)據(jù)集上的結(jié)論可以看此,改進(jìn)的K-means可以對(duì)軟化分的思想予以采用,可以以客戶需求為基礎(chǔ),將數(shù)據(jù)準(zhǔn)確的分為高、中、低三個(gè)忠誠(chéng)度類群中[3].對(duì)于改進(jìn)的k-means算法,相較于用戶興趣度模型,在高忠誠(chéng)度準(zhǔn)確度上提高了16%,相較于RFM模型,在中忠誠(chéng)度準(zhǔn)確度上和低忠誠(chéng)度模型上分別提高了21.8%、25.7%,使電子商務(wù)網(wǎng)站忠誠(chéng)度劃分準(zhǔn)確度得到了有效提高,對(duì)弈檔次不同的數(shù)據(jù),可以采用不一樣的營(yíng)銷方法,對(duì)客戶群體的消費(fèi)能力進(jìn)行維護(hù).在JD數(shù)據(jù)集上,在中忠誠(chéng)度上RFM模型所劃分的結(jié)果只有32.4%,低于在其它數(shù)據(jù)集上的劃分,極大的改變了數(shù)據(jù)劃分準(zhǔn)確度;在高忠誠(chéng)度上,用戶興趣度模型的劃分結(jié)果為43.4%,明顯低于在其它數(shù)據(jù)集上的劃分結(jié)果,也改變了數(shù)據(jù)劃分準(zhǔn)確度.而在k-means模型進(jìn)行了改進(jìn)后,在山中數(shù)據(jù)集上的劃分結(jié)果沒(méi)有較大的差異,比較穩(wěn)定,由此可知,在不同的數(shù)據(jù)集上,改進(jìn)的k-means模型魯棒性較高,能夠?qū)τ脩糁艺\(chéng)度進(jìn)行有效獲取.在SUNING數(shù)據(jù)集上,RFM模型執(zhí)行時(shí)間為86ms,用戶興趣度模型執(zhí)行時(shí)間為87ms,通過(guò)改良折后K-means算法需要的執(zhí)行之間為63ms,因此能夠讓用戶忠誠(chéng)度在劃分時(shí)間方面的效率得到較大的提升,能夠在很短的時(shí)間內(nèi)得到準(zhǔn)確的計(jì)算結(jié)果,進(jìn)而使得電子商務(wù)網(wǎng)站在運(yùn)行與推薦效率方面得到有效地提升,具體忠誠(chéng)度模型見表1.
表1 SUNING數(shù)據(jù)忠誠(chéng)度模型執(zhí)行時(shí)間
大力發(fā)展的網(wǎng)絡(luò)技術(shù),在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用,在此背景下,電子商務(wù)得到了極大的發(fā)展.電子商務(wù)網(wǎng)站要想在競(jìng)爭(zhēng)激勵(lì)的市場(chǎng)中占據(jù)優(yōu)勢(shì),就必須立足于先進(jìn)的數(shù)據(jù)挖掘及時(shí),和客戶保持良好的關(guān)系.本文為了達(dá)到將電子商務(wù)客戶忠誠(chéng)度模型的準(zhǔn)確性提高的目的,將模糊數(shù)學(xué)理論引入到了傳統(tǒng)的k-means算法中,使改進(jìn)的k-means算法被提了出來(lái),據(jù)實(shí)驗(yàn)結(jié)果表明,這種算法可以將客戶忠誠(chéng)度挖掘準(zhǔn)確度提高,相較于用戶興趣度模型以及RFM模型,本文算法的魯棒性更好,應(yīng)用的價(jià)值較高.
[1]牛詠梅.基于粗糙集的海量數(shù)據(jù)挖掘算法研究[J].現(xiàn)代電子技術(shù),2016,39(7):115-119.
[2]王林彬,黎建輝,沈志宏.基于NoSQL的RBF數(shù)據(jù)存儲(chǔ)與查詢技術(shù)綜述[J].計(jì)算機(jī)應(yīng)用研究,2015,32(2):1281-1286.
[3]謝麗.基于聚類分析的機(jī)場(chǎng)客戶細(xì)分服務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].西安電子科技大學(xué)碩士論文,2014:15-17.