丁學(xué)利 孫娓娓
摘? 要:為有效對商場會員價值進(jìn)行分類研究,首先運(yùn)用K均值聚類并結(jié)合Fisher判別分析對商場會員進(jìn)行分類,然后根據(jù)各會員群的最近一次消費(fèi)時間間隔、總購買數(shù)量、總消費(fèi)金額、單筆最高消費(fèi)金額、平均消費(fèi)金額、會員關(guān)系長度等多項(xiàng)指標(biāo)構(gòu)建模糊綜合評價模型。通過計算相對偏差模糊矩陣及變異系數(shù)法構(gòu)建的各指標(biāo)的權(quán)向量對會員群進(jìn)行了綜合評價,得到了會員群的綜合排序。該方法可有效地對大樣本數(shù)據(jù)進(jìn)行綜合評價且評價結(jié)果更接近實(shí)際,也為商場運(yùn)營商有效地對會員進(jìn)行分類管理,實(shí)施針對性的營銷策略等提供了理論參考。
關(guān)鍵詞:K均值聚類;Fisher判別分析;模糊綜合評價法;商場會員
中圖分類號:O212? ? ? ? ?文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ?文章編號:1672-4437(2019)03-0081-06
在零售行業(yè)中,會員價值表現(xiàn)為不斷地為零售運(yùn)營商帶來較好的銷售額和較高的利潤,也為零售運(yùn)營商如何制定營銷策略提供了數(shù)據(jù)支持。零售行業(yè)會采取各種不同方法來增強(qiáng)會員的忠誠度,同時吸引非會員成為會員。當(dāng)前電商的發(fā)展使商場會員不斷流失,給零售運(yùn)營商帶來了嚴(yán)重?fù)p失。因此,運(yùn)營商如何有效地對會員進(jìn)行分類管理,以及根據(jù)會員分類有針對性地實(shí)施營銷策略來加強(qiáng)與會員的良好關(guān)系,成為商場運(yùn)營商迫切解決的關(guān)鍵問題。
在對客戶進(jìn)行有效識別方面,可通過聚類分析、判別分析等[1-8]方法進(jìn)行分類,然后利用RFM模型[9]、客戶價值矩陣法[10]等對客戶進(jìn)行價值分析。但在對大樣本數(shù)據(jù)的客戶價值進(jìn)行評價時,往往評價指標(biāo)具有不確定性或模糊性,這些方法較難客觀地對客戶群進(jìn)行綜合評價。因此,本文運(yùn)用K均值聚類法對商場會員進(jìn)行分類,同時利用判別分析法對聚類結(jié)果進(jìn)行判別,驗(yàn)證聚類效果,在此基礎(chǔ)上利用模糊綜合評價法對會員群進(jìn)行綜合評價。該方法可有效地對大樣本數(shù)據(jù)進(jìn)行綜合評價且評價結(jié)果更接近實(shí)際。
1? 數(shù)據(jù)來源與分析
1.1 數(shù)據(jù)預(yù)處理
本文采用2018年全國大學(xué)生數(shù)學(xué)建模競賽C題[11]商場會員消費(fèi)信息數(shù)據(jù)。商場會員消費(fèi)信息共有911702條數(shù)據(jù),其中包括異常數(shù)據(jù)(會員卡號出現(xiàn)科學(xué)計數(shù)法的數(shù)據(jù),如會員卡號6.7738E+21,共計417條)、缺失數(shù)據(jù)(如有的會員只有消費(fèi)時間,缺失會員入會時間,共計793個會員號)等。由于這些數(shù)據(jù)所占的比例非常小,因此可考慮直接刪除。由于每個會員的消費(fèi)記錄不只一條,因此可用Excel透視表得到每個會員的總購買數(shù)量、總消費(fèi)金額、單筆最高消費(fèi)金額、平均消費(fèi)金額。然后運(yùn)用Access軟件對數(shù)據(jù)進(jìn)行處理和提取,包括分離商場會員與非會員的數(shù)據(jù)、提取會員最近一次消費(fèi)時間間隔和會員關(guān)系長度(會齡),最后得到43105條會員消費(fèi)記錄。
1.2 指標(biāo)選取
根據(jù)RFM模型[9]理論,反映顧客的價值包括三個指標(biāo):最近購買時間(R)、購買頻率(F)及購買金額(M)。R值越小,F(xiàn)和M值越大,顧客價值越高。除了RFM所代表的評價指標(biāo),本文還使用了其他特殊變量反映會員的購買行為,如單筆最高消費(fèi)金額、平均消費(fèi)金額,其值越大,顧客價值越高;會員關(guān)系長度越長說明會員越忠誠。因此,本文選取如下6個反映顧客價值的評價指標(biāo): ——最近一次消費(fèi)時間間隔(天); ——總購買數(shù)量(件); ——總消費(fèi)金額(元); ——單筆最高消費(fèi)金額(元); ——平均消費(fèi)金額(元); ——會員關(guān)系長度(會齡/天)。表1是將會員號按升序排列得到的商場會員消費(fèi)統(tǒng)計結(jié)果(由于版面限制,僅列出部分會員消費(fèi)的統(tǒng)計結(jié)果)。
2? 基于聚類-判別分析的會員分類
2.1 聚類和判別分析
聚類分析[1-5]的基本目標(biāo)是按照一定規(guī)則把分類對象性質(zhì)相似的歸為一類,而把性質(zhì)差距比較大的對象歸到不同的類,其最終得到類內(nèi)的對象會有很高的相似度,而不同類之間的對象具有較低的相似度。K均值聚類是一種適用于大數(shù)據(jù)且計算速度快的聚類方法,其算法的基本步驟是在給定數(shù)據(jù)的分類數(shù)K后,該方法會隨機(jī)選取K個聚類中心,計算每個樣本與這K個聚類中心的距離,依據(jù)距離最近原則將每個樣本分別歸到K個不同的類,然后重新計算這K個類的中心,繼續(xù)計算每個樣本與這K個中心的距離,并重新歸類,繼續(xù)上述操作直到達(dá)到設(shè)定的標(biāo)準(zhǔn)時,結(jié)束聚類過程。
判別分析[1, 2]是按照某種判別規(guī)則,對已經(jīng)分類的研究對象,計算判別指標(biāo),確立判別函數(shù),依據(jù)判別函數(shù)即可判定某一對象屬于何類。Fisher 判別法是判別分析中常用的一種方法,其基本思想是投影降維,即將K類n維數(shù)據(jù)投影到某一個方向,使得類與類之間的投影盡可能分開,而類內(nèi)離差盡可能小,從而得到一種線性判別函數(shù),最終將各個類進(jìn)行很好的區(qū)分。
在眾多的聚類和判別方法中,K均值聚類和Fisher判別分析是適應(yīng)性較強(qiáng)且處理大樣本數(shù)據(jù)效果較快的方法。針對43105條大樣本商場會員數(shù)據(jù),選取K均值聚類和Fisher判別分析是比較合適的,因此本文選用K均值聚類和Fisher判別分析。其具體步驟如下:
Step1:以 , , , , , 為自變量,將樣本數(shù)據(jù)z-score標(biāo)準(zhǔn)化,計算不同類別數(shù)下的平均輪廓值,確定K均值聚類的最佳類別數(shù)K;
Step2:選取K個初始聚類中心,運(yùn)用K均值聚類算法得到最終的聚類中心和聚類結(jié)果(每個會員的分類號及每個會員群的數(shù)量及均值);
Step3:繼續(xù)以 , , , , , 為自變量,用聚類分析的分類號作為分類變量,將所有樣本作為訓(xùn)練樣本進(jìn)行判別分析,得到判別函數(shù)系數(shù),建立Fisher判別線性函數(shù);
Step4:用判別函數(shù)對所有樣本進(jìn)行判別分類,與聚類結(jié)果比較,檢驗(yàn)聚類效果。
2.2? K均值聚類結(jié)果
為了確定K均值聚類的最佳聚類數(shù)K,首先計算分類數(shù)與平均輪廓值的關(guān)系,如圖1所示。平均輪廓值越大,表明聚類具有越好的效果。由圖1可知,當(dāng)類別數(shù)為2時平均輪廓值最大,但分類數(shù)為2時,太籠統(tǒng),效果不好。當(dāng)類別數(shù)為6時,平均輪廓值較大,因此最佳聚類數(shù)可取6。使用SPSS 21.0軟件,選取6個初始聚類中心,得到最終聚類中心(標(biāo)準(zhǔn)化后的聚類中心,見表2)。根據(jù)最終的聚類中心,可將會員分成6類會員群,見表3。由表3可知,會員群1的會員數(shù)最多,最近一次消費(fèi)時間間隔較長,總購買數(shù)量、總消費(fèi)金額、單筆最高消費(fèi)金額、平均消費(fèi)金額較少,會員關(guān)系長度最短。其余會員群的詳細(xì)特征也可類似得出。雖然利用K均值聚類得到了聚類結(jié)果,但聚類效果如何,需進(jìn)一步檢驗(yàn)。
2.3? Fisher判別分析結(jié)果
以 , , , , , 為判別自變量,以聚類分析得到的分類號作為分組變量,使用SPSS 21.0軟件對所有樣本進(jìn)行判別分析。SPSS 21.0自動選取具有會員分類號的數(shù)據(jù)進(jìn)行訓(xùn)練,得到判別函數(shù)系數(shù),見表4。方差檢驗(yàn)判別函數(shù)的p值小于0.001,表明判別函數(shù)對商場會員類別的區(qū)分差異顯著。SPSS 21.0利用判別函數(shù)可對每個會員所屬的會員群進(jìn)行有效識別,判別結(jié)果見表5。由表5可得到,每個會員群的聚類結(jié)果與判別結(jié)果基本一致,總的一致率(兩者相同的樣本數(shù)除以總樣本數(shù))達(dá)到96.2%。因此,K均值聚類得到的6類會員群是較合理的。雖然把商場會員合理地分成了6類會員群,但如何對每類會員群進(jìn)行評價還需進(jìn)一步研究。
3 會員群模糊綜合評價
3.1? 相對偏差模糊綜合評價
針對多個方案實(shí)施客觀評價時,待評價的指標(biāo)因素一般較多且存在主觀判斷。因此,應(yīng)根據(jù)多個指標(biāo)進(jìn)行綜合評價且考慮評價指標(biāo)因素的模糊性。模糊綜合評價法[12-14]是一種有效克服模糊性的數(shù)學(xué)方法,其本質(zhì)是最大隸屬度原則。在建立模糊矩陣時,隸屬度函數(shù) 可使用多種方式,如越小越優(yōu)型、越大越優(yōu)型等函數(shù)。但有些公式計算較繁瑣,而相對偏差模糊矩陣的隸屬度函數(shù) 計算簡單且可較好地反映評價結(jié)果。設(shè)有 個待評價對象集合 , 個評價指標(biāo)集合 。如果用 中的每個指標(biāo)對 中的每個待評價對象進(jìn)行評價,那么可得觀測值矩陣 ,其中 為第 個評價對象關(guān)于第 個評價指標(biāo)的指標(biāo)值,具體的綜合評價步驟如下:
Step1: 設(shè)置理想方案
3.2 會員群模糊綜合評價結(jié)果
為更好地區(qū)分6類會員群的價值,以表3中 , , , , , 的均值作為評價指標(biāo),6類會員群作為待評價對象,進(jìn)行模糊綜合評價。由于變量 的值越小越好,因此可作為成本型指標(biāo),而變量 , , , , 的值越大越好,因而可作為效益型指標(biāo)。理想方案 可設(shè)置為:
= (10.34, 250.42, 453165.81, 37422.52, 20397.5, 2528.21)
相對偏差模糊矩陣計算如下:
根據(jù)F值可將6類會員群進(jìn)行綜合排序,每類會員群的具體特征如下:
(1)會員群6綜合排名第一,占總會員數(shù)的0.42%, 屬于少數(shù)會員群。該類會員購買時間間隔最短,購買數(shù)量最多,交易金額最大,屬于商場重要保持的優(yōu)質(zhì)會員群。商場應(yīng)加大對這類會員的資源投入,增大其為商場創(chuàng)造利潤的時間。
(2)會員群3綜合排名第二,占總會員數(shù)的1.29%, 屬于少數(shù)會員群。該類會員雖然購買時間間隔較大,購買數(shù)量也較低,但平均消費(fèi)金額最大,屬于商場重要發(fā)展的會員群。對這類會員,商場應(yīng)為他們制定相應(yīng)的營銷策略,提升其忠誠度,使其逐步轉(zhuǎn)變成商場的高價值會員。
(3)會員群4綜合排名第三,占總會員數(shù)的4.96%, 屬于少數(shù)會員群。該類會員購買數(shù)量和購買金額較大,屬于商場普通保持的會員群。針對該類會員群,商場應(yīng)及時了解會員需求,逐步提高其忠誠度和滿意度。
(4)會員群2綜合排名第四,占總會員數(shù)的19.79%, 各項(xiàng)指標(biāo)一般,屬于商場普通發(fā)展的會員群。該類會員群當(dāng)前可能對商場的貢獻(xiàn)一般,但其發(fā)展?jié)摿薮?,?yīng)努力提升其價值。
(5)會員群1綜合排名第五,占總會員數(shù)的64.28%, 屬于多數(shù)會員群。該類會員購買數(shù)量和金額較少,會齡時間最短,屬于商場一般發(fā)展的會員群。對此類會員,商場應(yīng)謹(jǐn)慎對其投入資源。
(6)會員群5綜合排名第六,占總會員數(shù)的9.25%。該類會員消費(fèi)時間間隔最大,購買數(shù)量最少,消費(fèi)金額最低,會員關(guān)系較長,屬于非活躍低價值老會員群。這類會員,商場可減少對其投入的資源。
4 結(jié)束語
本文運(yùn)用K均值聚類法對商場會員進(jìn)行了分類,再利用判別分析法驗(yàn)證了K均值聚類效果,最后使用模糊綜合評價法對6類會員群進(jìn)行了綜合排序。實(shí)例表明,該方法的分類和評價是有效的,可較好地對商場會員進(jìn)行識別。本研究結(jié)果,為商場運(yùn)營商有效地對會員進(jìn)行分類管理,實(shí)施針對性的營銷策略以及如何加強(qiáng)與會員的良好關(guān)系等提供了理論依據(jù)。
參考文獻(xiàn):
[1]趙銘,李雪,李秀婷,等.基于聚類分析的商業(yè)銀行基金客戶的分類研究[J].管理評論,2013(7):38-44.
[2]韓宏穩(wěn),張建磊.層次分析與聚類分析、判別分析在卷煙零售戶分類中的應(yīng)用[J].中國煙草學(xué)報,2014, 20(6):119-126.
[3]姚思雨.改進(jìn)蟻群聚類算法在零售客戶分類中的研究與應(yīng)用[D].大連:大連海事大學(xué),2018.
[4]左國才,楊金民.K-means算法在電信CRM客戶分類中的應(yīng)用[J].計算機(jī)系統(tǒng)應(yīng)用,2010,19(2):155-159.
[5]胡雷芳.基于聚類分析的C2C電子商務(wù)客戶價值服務(wù)營銷對策研究[J].成組技術(shù)與生產(chǎn)現(xiàn)代化,2007,24(3):34-41.
[6]王軼華.基于層次分析法建立客戶綜合價值分析體系[J].華東電力,2006(4):36-39.
[7]曹云忠.基于SOM和粗糙集理論的客戶分類研究[J].商場現(xiàn)代化,2009(1):43-44.
[8]黎晗.數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用----以客戶分類為例[J].中外企業(yè)家,2015(36):82-84.
[9]徐文瑞.基于RFM模型的顧客消費(fèi)行為與顧客價值預(yù)測研究[J].商業(yè)經(jīng)濟(jì)研究,2017(19):44-46.
[10]陳明亮.基于全生命周期利潤的客戶細(xì)分方法[J].經(jīng)濟(jì)管理,2002(20):42-46.
[11]2018年全國大學(xué)生數(shù)學(xué)建模競賽試題[EB/OL]. (2018-09-20)[2019-03-02.]http://mcm.ustc.edu.cn/ahmcm/.
[12]高順成.紡織服裝類高校科技創(chuàng)新能力評價研究----基于相對偏差距離最小法[J].武漢紡織大學(xué)學(xué)報,2013,26(2):23-26.
[13]許一新,楊鵬輝,汪兆霞,等.基于模糊綜合評價對購房影響因素的定量分析[J].阜陽師范學(xué)院學(xué)報(自然科學(xué)版),2017,34(2):96-99.
[14]彭清萍,付亞賓.基于模糊分析法的網(wǎng)絡(luò)評價體系建構(gòu)與實(shí)施[J].阜陽師范學(xué)院學(xué)報(自然科學(xué)版),2018,35(1):96-100.