●劉瑞琪 宋子琨
數(shù)據(jù)是生產(chǎn)的關(guān)鍵要素之一,它已經(jīng)滲透到各行各業(yè)的功能領(lǐng)域。大數(shù)據(jù)又稱海量數(shù)據(jù),主要是指其中所包含的數(shù)據(jù)規(guī)模龐大且結(jié)構(gòu)復(fù)雜、從而無法通過傳統(tǒng)的方式將信息轉(zhuǎn)化為可以直觀理解的數(shù)據(jù)信息。因此,通過對大數(shù)據(jù)進(jìn)行處理和分析,進(jìn)一步挖掘出更深層次的價(jià)值并加以利用,將顯著提升企業(yè)的決策能力。
近年來,我國正在全面利用大數(shù)據(jù)等信息技術(shù)推動(dòng)傳統(tǒng)產(chǎn)業(yè)的結(jié)構(gòu)轉(zhuǎn)型與發(fā)展,實(shí)現(xiàn)新的經(jīng)濟(jì)增長點(diǎn)及各產(chǎn)業(yè)間的融合發(fā)展。隨著移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,各類電商平臺的運(yùn)營逐漸趨于成熟,商家及用戶數(shù)量龐大、商品種類繁多,當(dāng)消費(fèi)者在網(wǎng)購平臺瀏覽商品時(shí),大量無用商品的推薦無疑將會(huì)降低消費(fèi)者的購買率。因此,運(yùn)用大數(shù)據(jù)技術(shù)建立對用戶行為進(jìn)行分析的推薦系統(tǒng),挖掘用戶行為特征并進(jìn)行個(gè)性化的商品推薦,從而有針對性地喚回老用戶并吸引新用戶,不僅可以降低用戶的選購時(shí)長并提高用戶對于網(wǎng)購平臺消費(fèi)體驗(yàn)的滿意度,還可以增加商家及網(wǎng)購平臺的收益。
基于此,本文利用天貓商城的真實(shí)消費(fèi)數(shù)據(jù),使用RFM模型與K-Means聚類分析對天貓用戶進(jìn)行價(jià)值分類,從而為不同用戶提供個(gè)性化服務(wù),實(shí)現(xiàn)了基于用戶分類的精準(zhǔn)營銷。
本文的數(shù)據(jù)來源為天池平臺提供的天貓商城的真實(shí)消費(fèi)數(shù)據(jù),該數(shù)據(jù)集中包括了用戶基本信息數(shù)據(jù)、用戶消費(fèi)數(shù)據(jù)及用戶購物行為數(shù)據(jù)3個(gè)部分,涵蓋了2018年4月1日至2019年3月31日期間在天貓平臺購買商品的用戶數(shù)據(jù),共計(jì)539438條。其中,用戶基本信息數(shù)據(jù)集中主要記錄了性別、年齡層次、消費(fèi)檔次等字段;用戶購物行為數(shù)據(jù)集中主要記錄了商品種類編號、消費(fèi)者行為類型和訂單日期等字段。
在數(shù)據(jù)處理階段,本文對數(shù)據(jù)進(jìn)行去除重復(fù)值、處理缺失值、特征選擇等預(yù)處理。第一是將字符型格式等日期字段轉(zhuǎn)換為DateTime類型,并計(jì)算用戶購買時(shí)間與2019年4月1日的時(shí)間間隔。第二是使用timedelta類型屬性的days方法實(shí)現(xiàn)諸如“1”“2”等天數(shù)的提取。第三是篩選行為類型為“pv”的記錄,再根據(jù)日期分組排序,并統(tǒng)計(jì)每天對應(yīng)的購買記錄數(shù)量,即從用戶購物行為數(shù)據(jù)集中,篩選behavior_type字段等于“pv”的記錄,按照date字段分組同時(shí)進(jìn)行升序排列,并計(jì)算出每日進(jìn)行消費(fèi)的用戶數(shù)量。
1.基于RFM模型的用戶價(jià)值分析。RFM模型通過消費(fèi)時(shí)間間隔、消費(fèi)頻率、消費(fèi)金額3個(gè)指標(biāo)對消費(fèi)者的活躍度進(jìn)行分層,從而實(shí)現(xiàn)對用戶價(jià)值的評估。其中,指標(biāo)R代表最近一次消費(fèi)(最近一次消費(fèi)到截止時(shí)間的間隔),可以類比為消費(fèi)者近期的活躍度;指標(biāo)F代表客戶消費(fèi)頻率,用以反映用戶近期的購物次數(shù);指標(biāo)M代表消費(fèi)金額,用以反映消費(fèi)者的消費(fèi)能力。綜上所述,RFM模型就是對每一個(gè)用戶都從R、F、M三個(gè)維度進(jìn)行評估,并據(jù)此將用戶劃分為重點(diǎn)潛力用戶、重點(diǎn)發(fā)展用戶、重點(diǎn)喚回用戶、高價(jià)值用戶、低價(jià)值用戶、一般發(fā)展用戶、一般維系用戶和一般價(jià)值用戶等八類。
本文在將數(shù)據(jù)引入RFM模型前,為了進(jìn)一步了解用戶的消費(fèi)習(xí)慣、消費(fèi)行為及用戶本身的特性,首先根據(jù)用戶的購買行為進(jìn)行數(shù)據(jù)分析與探索,計(jì)算用戶在各流程之間的漏斗模型,研究發(fā)現(xiàn)用戶在最后實(shí)際下單的流程中流失最多(見圖一、圖二)。
圖1 加購漏斗圖
圖2 收藏漏斗圖
接著,本文采用五分法(0.2、0.4、0.6、0.8)對經(jīng)過預(yù)處理后的R、F、M數(shù)據(jù)進(jìn)行分箱處理,將用戶等分為5個(gè)層級,分別標(biāo)記為1-5分并賦予每一個(gè)用戶其相應(yīng)的分類標(biāo)簽,據(jù)此便可以有針對性的進(jìn)行符合此類用戶特征的精準(zhǔn)營銷,同時(shí)實(shí)現(xiàn)了平臺資源的利益最大化。
經(jīng)數(shù)據(jù)處理后,天貓商城用戶消費(fèi)數(shù)據(jù)集中的用戶被分為8類,其中高價(jià)值用戶占比為21%,此類用戶為平臺的核心用戶,因此需要保證該類用戶的留存率,即可以分析此類用戶的行為特征或進(jìn)行用戶訪談,了解產(chǎn)品對于此類用戶的吸引力和平臺有待優(yōu)化的問題。重點(diǎn)喚回用戶占比為14%,此類用戶過去在平臺上消費(fèi)較多而最近并未產(chǎn)生消費(fèi),此類用戶在產(chǎn)品中有一定財(cái)富積累,但最近沒有消費(fèi)可能是受競品影響或消費(fèi)習(xí)慣發(fā)生改變,因此需要根據(jù)用戶歷史偏好,推送個(gè)性化內(nèi)容從而喚回此類用戶。重要發(fā)展用戶和重點(diǎn)潛力用戶人數(shù)較少,占比僅為6.2%左右,此類用戶在平臺的消費(fèi)次數(shù)較少但是在金額上貢獻(xiàn)較大,說明用戶一旦活躍就會(huì)大筆消費(fèi),因此需要提高此類用戶在平臺的活躍度。值得注意的是,低價(jià)值客戶占比為41.1%,在各種用戶類型中占比最大,此類用戶具有較大的流失風(fēng)險(xiǎn),但可以不將其作為平臺的運(yùn)營重點(diǎn)。
2.基于K-Means聚類的用戶價(jià)值分析。K-Means算法是一種基于數(shù)據(jù)劃分的無監(jiān)督聚類算法,它以k為參數(shù),把n個(gè)數(shù)據(jù)對象分成k個(gè)簇,使簇內(nèi)具有較高的相似度,而簇間的相似度較低。由于RFM模型只涉及了天貓用戶消費(fèi)數(shù)據(jù)集中order_count、time_gap、total_amount等變量,然而通過上述變量并不能充分挖掘用戶特征,因此本文使用K-Means聚類方法將其他變量引入,從而對用戶特征進(jìn)行進(jìn)一步挖掘。
由于K-Means算法中的隨機(jī)因數(shù)將導(dǎo)致每次運(yùn)行結(jié)果都存在差異,本文為減少結(jié)果的偶然性,對每個(gè)k值重復(fù)計(jì)算了10次并對比每次計(jì)算結(jié)果的趨勢圖,選擇最明顯的拐點(diǎn)所對應(yīng)的k值。受篇幅所限,本文并未報(bào)告拐點(diǎn)的趨勢圖,但計(jì)算結(jié)果顯示k=3時(shí)滿足要求,因此確定用戶被分為3類。接著,本文通過選取刻畫用戶的重要指標(biāo),用戶的id、用戶的年齡及用戶的購物深度以及性別這4個(gè)重要指標(biāo),將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,并通過K-Means聚類得到聚類后的3類。
K-Means聚類結(jié)果與RFM模型分類結(jié)果較為相似,其中聚類結(jié)果為一類的用戶特征較為明顯,此類用戶多為女性,購買頻次較高且消費(fèi)金額較大,因此一類用戶為高價(jià)值用戶,其用戶數(shù)量為27347人,占比為53.21%;聚類結(jié)果為0類的消費(fèi)群體年齡段較高,具有購買頻次多但消費(fèi)金額較小的消費(fèi)行為特征,因此0類用戶為中價(jià)值用戶,其用戶數(shù)量為13110人,占比為25.51%;聚類結(jié)果為二類的消費(fèi)者中各指標(biāo)均相對較低,因此二類用戶為低價(jià)值用戶,其用戶數(shù)量為10937人,占比為21.28%。
運(yùn)用大數(shù)據(jù)的技術(shù)建立用戶推薦系統(tǒng),挖掘用戶行為特征并進(jìn)行個(gè)性化商品的推薦,不僅可以降低用戶的選購時(shí)長并提高用戶對于網(wǎng)購平臺消費(fèi)體驗(yàn)的滿意度,還可以增加網(wǎng)購商家及網(wǎng)購平臺的收益。本文利用天池平臺提供的天貓商城的真實(shí)消費(fèi)數(shù)據(jù),首先對數(shù)據(jù)進(jìn)行了相應(yīng)的預(yù)處理,最終數(shù)據(jù)集中包含51394條購買記錄,接著分別基于RFM模型和K-Means聚類方法實(shí)現(xiàn)了對天貓用戶的分類,從而為平臺為用戶提供精準(zhǔn)營銷提供了相應(yīng)建議。
RFM模型的分析結(jié)果顯示,重點(diǎn)發(fā)展客戶占比5%,高價(jià)值客戶占比22%,應(yīng)重點(diǎn)關(guān)注這兩類客戶并提高用戶付費(fèi)率,維系高價(jià)值用戶、重點(diǎn)發(fā)展用戶的忠誠度,保持企業(yè)良好收入。在客戶總數(shù)中占比為21.9%的高價(jià)值客戶和占比13.8%的重點(diǎn)發(fā)展客戶貢獻(xiàn)了85.8%的銷售額,因此,應(yīng)當(dāng)提高高價(jià)值客戶和重點(diǎn)發(fā)展客戶的消費(fèi)金額,或是把重點(diǎn)發(fā)展客戶轉(zhuǎn)化為高價(jià)值客戶,即提升該客戶群的消費(fèi)頻次。重要挽留客戶為1090人,首先應(yīng)當(dāng)考慮是否在計(jì)算周期內(nèi)有大型促銷或降價(jià)活動(dòng),若有則轉(zhuǎn)化這部分客戶的難度會(huì)較大,平臺應(yīng)重點(diǎn)發(fā)展其他類型客戶,若沒有則應(yīng)當(dāng)分析此類顧客的購買產(chǎn)品的特性從而提高其消費(fèi)頻率并培養(yǎng)其在此平臺的消費(fèi)習(xí)慣。新客戶人數(shù)為2143人,由于需要先把新客戶轉(zhuǎn)化為留存用戶,因此,在實(shí)際運(yùn)營過程中,可以考慮把這部分客戶和重要挽留客戶放在一起轉(zhuǎn)化,提升消費(fèi)頻率。流失客戶人數(shù)為1400人,對于銷售金額的貢獻(xiàn)占比較低,因此,需要進(jìn)一步分析此類用戶群體的消費(fèi)商品和消費(fèi)時(shí)間,但由于此類用戶人數(shù)較多,對其進(jìn)行分析耗時(shí)較長故可將其作為提升銷量的次要考慮因素。重要喚回客戶人數(shù)占比約為12%,此類用戶人數(shù)較少,但消費(fèi)意愿和消費(fèi)價(jià)值較高,可作為短期提升銷量的重點(diǎn)關(guān)注對象,通過運(yùn)營活動(dòng),優(yōu)惠活動(dòng)刺激消費(fèi)。
K-Means聚類分析的結(jié)果顯示,聚類結(jié)果中消費(fèi)能力高,購物深度與層次較高,年齡指數(shù)較小,性別指數(shù)較大,這部分群體可能多為年輕女士,比較追求時(shí)尚、品牌及服務(wù),對于此類在平臺有消費(fèi)記錄且過往消費(fèi)頻率和金額較高的用戶,屬于具有較高價(jià)值的核心用戶,本文認(rèn)為可以為這類用戶提供VIP特權(quán)和更多的專屬服務(wù),后續(xù)還可以對客戶追根溯源,找到高價(jià)值用戶對應(yīng)標(biāo)簽的客戶的個(gè)人信息,重點(diǎn)關(guān)注此類用戶的行為路徑或者對其開展用戶訪談,了解產(chǎn)品的優(yōu)勢及反饋。針對近期活躍度較低、過往消費(fèi)頻率和金額都較高的用戶,需要將其進(jìn)行喚回并重新成為平臺的核心用戶。此外,還應(yīng)當(dāng)提高一般維系用戶、一般發(fā)展用戶的活躍度,并將其轉(zhuǎn)化為潛在客戶。