孫曉琳,姚 波,陳 瑜
(1.西安財(cái)經(jīng)學(xué)院a.商學(xué)院,b.統(tǒng)計(jì)學(xué)院,陜西 西安 710100;2.西安交通大學(xué) 人文社會(huì)科學(xué)學(xué)院, 陜西 西安 710049)
大數(shù)據(jù)時(shí)代已經(jīng)到來,就營(yíng)銷領(lǐng)域而言,大數(shù)據(jù)已形成一定的規(guī)模,其多樣性、低價(jià)值密度以及實(shí)時(shí)性的復(fù)雜特征對(duì)于營(yíng)銷既是挑戰(zhàn)也是機(jī)遇。在營(yíng)銷管理中,對(duì)客戶實(shí)行分類管理是企業(yè)運(yùn)作的核心問題之一。識(shí)別并擁有優(yōu)良客戶,進(jìn)而有針對(duì)性地開發(fā)以及維持客戶,既避免了企業(yè)由于分散精力造成的資源浪費(fèi),導(dǎo)致成本上升,也降低了企業(yè)盲目營(yíng)銷帶來的巨大風(fēng)險(xiǎn)。通過收集客戶與企業(yè)在接觸端產(chǎn)生的數(shù)據(jù)進(jìn)行有效的客戶分類,既過濾了市場(chǎng)上與企業(yè)不存在交易關(guān)系客戶的數(shù)據(jù)干擾,也避免了侵犯客戶隱私帶來的法律風(fēng)險(xiǎn)。在客戶數(shù)據(jù)挖掘過程中,經(jīng)常會(huì)碰到離群數(shù)據(jù),它們與整體數(shù)據(jù)表象層面所體現(xiàn)出的規(guī)律不一致,游離在大部分所處的區(qū)間之外,通常被認(rèn)為是噪聲數(shù)據(jù)或者異常數(shù)據(jù)而被剔除,但其作為客觀存在的數(shù)據(jù),該處理的方式顯然是不恰當(dāng)?shù)摹?/p>
因此,如何在海量數(shù)據(jù)中篩選數(shù)據(jù),選取哪些數(shù)據(jù),運(yùn)用怎樣的數(shù)據(jù)挖掘算法完成客戶數(shù)據(jù)的價(jià)值“提純”并尋找重要客戶,成為目前大數(shù)據(jù)背景下營(yíng)銷領(lǐng)域亟待解決的問題。本文在相關(guān)研究的基礎(chǔ)上,構(gòu)建了基于客戶資產(chǎn)離群數(shù)據(jù)分析的客戶分類模型,并針對(duì)不同的客戶分類提出相應(yīng)營(yíng)銷策略。通過梳理客戶資產(chǎn)、客戶分類和離群數(shù)據(jù)挖掘等相關(guān)文獻(xiàn),在傳統(tǒng)客戶分類模型RFM的基礎(chǔ)上,在交易頻率、交易的產(chǎn)品或服務(wù)的種類、交易金額3個(gè)維度上,增加了年齡維度,構(gòu)建了基于客戶資產(chǎn)離群數(shù)據(jù)分析的客戶分類模型,提出了從離群數(shù)據(jù)的角度深入挖掘客戶信息,開展客戶分類,并針對(duì)不同分類的客戶提出了不同的營(yíng)銷策略。最后,運(yùn)用該模型對(duì)某公司客戶數(shù)據(jù)進(jìn)行了分析,提供了供參考的實(shí)例。
客戶資產(chǎn)(Customer Asset)是客戶關(guān)系管理最終目標(biāo),“客戶資產(chǎn)”最早出現(xiàn)于1996年哈佛商業(yè)評(píng)論刊出的《用客戶資產(chǎn)進(jìn)行營(yíng)銷管理》中[1]。許多外文文獻(xiàn)將客戶資產(chǎn)視為客戶終身價(jià)值的折現(xiàn)。Blattberg 和Deighton認(rèn)為每個(gè)客戶在其整個(gè)預(yù)期生命周期中用以抵消企業(yè)固定成本的預(yù)期貢獻(xiàn)就是客戶資產(chǎn),也就是收入減去成本的折現(xiàn)值。他們主張,企業(yè)應(yīng)視客戶資產(chǎn)為金融資產(chǎn),對(duì)其進(jìn)行測(cè)量和管理以圖價(jià)值最大化[1]。Dwyer等人則提出 “客戶特許資產(chǎn)”的概念,強(qiáng)調(diào)企業(yè)應(yīng)當(dāng)拋棄以產(chǎn)品為導(dǎo)向的、離散的交易理念,轉(zhuǎn)而致力于能夠使客戶感到滿意的產(chǎn)品以及服務(wù),以確??蛻舻闹貜?fù)購(gòu)買[2]。Rust等人(2004)認(rèn)為,客戶資產(chǎn)是多個(gè)營(yíng)銷研究領(lǐng)域的重疊部分,并非是簡(jiǎn)單的獨(dú)立領(lǐng)域,但是其與客戶關(guān)系管理最為密切,所有組織可能客戶的終身價(jià)值折現(xiàn)后的總和就是客戶資產(chǎn)。Keith A.Richards和Eli Jones(2008)等人認(rèn)為客戶資產(chǎn)的定義必定與企業(yè)的當(dāng)前客戶以及潛在客戶的終身價(jià)值分不開,從這個(gè)角度出發(fā),他們認(rèn)同客戶資產(chǎn)即每個(gè)客戶終身價(jià)值折現(xiàn)后的總和。Bemd等基于Rust等人關(guān)于客戶資產(chǎn)的定義,探尋了如何以客戶資產(chǎn)作為評(píng)估企業(yè)未來導(dǎo)向的新標(biāo)準(zhǔn)[3]。
國(guó)內(nèi)相關(guān)研究通常是從銀行等金融部門出發(fā),簡(jiǎn)單地將客戶資產(chǎn)視為客戶的金融資產(chǎn)總額。主要體現(xiàn)在客戶的銀行存款方面,而不是客戶的終身價(jià)值層面。因而,深入研究客戶資產(chǎn)的文章并不是很多。劉英姿等從折現(xiàn)值的角度出發(fā),表示客戶資產(chǎn)計(jì)算所需要的大量指標(biāo)都無法表示在當(dāng)時(shí)的財(cái)務(wù)報(bào)表中,計(jì)算所得結(jié)果與實(shí)際情況有差距[4]。馬少輝等提出對(duì)客戶資產(chǎn)的客戶保持模型和維持模型進(jìn)行優(yōu)化,同時(shí)表明,客戶不同,風(fēng)險(xiǎn)不同,加上客戶資產(chǎn)又是長(zhǎng)期價(jià)值體現(xiàn),所以模型的風(fēng)險(xiǎn)差異性研究稍顯不足[5]。彭虎峰基于數(shù)據(jù)挖掘和統(tǒng)計(jì)方法對(duì)客戶資產(chǎn)進(jìn)行測(cè)量,提出從客戶分類出發(fā),尋找客戶消費(fèi)行為規(guī)律,總結(jié)平均群毛利潤(rùn)變化規(guī)律并計(jì)算各群毛利潤(rùn),最終計(jì)算得到客戶資產(chǎn)[6]。這種統(tǒng)計(jì)和數(shù)據(jù)挖掘結(jié)合的方法不易掌握,只是提供了一個(gè)新的測(cè)量客戶資產(chǎn)的思路。也有相關(guān)研究從企業(yè)客戶資產(chǎn)價(jià)值進(jìn)行評(píng)估。胡姝哲采用多期超額收益法及其評(píng)估模型,對(duì)某一企業(yè)進(jìn)行了案例分析,運(yùn)用該模型對(duì)企業(yè)的客戶資產(chǎn)價(jià)值進(jìn)行了評(píng)估[7]。綜上所述,客戶資產(chǎn)即是企業(yè)所面對(duì)的客戶的終身價(jià)值的貼現(xiàn)之和,是客戶終身價(jià)值的體現(xiàn)。
本文研究客戶資產(chǎn),并不關(guān)注精確的測(cè)量方法,試圖通過對(duì)具有不同客戶資產(chǎn)的客戶進(jìn)行分類,在實(shí)際層面優(yōu)化企業(yè)資源分配,保留企業(yè)有價(jià)值客戶,擴(kuò)大企業(yè)客戶規(guī)模,進(jìn)而提升企業(yè)的市場(chǎng)營(yíng)銷管理能力,使得營(yíng)銷行為與企業(yè)利益真正聯(lián)系在一起。
客戶分類模型中價(jià)值模型主要兩種,即RFM模型和Marcus 模型。RFM模型是一種借助于分析客戶與企業(yè)之間的交易行為來衡量客戶價(jià)值,進(jìn)而進(jìn)行客戶分類的模型。其測(cè)算的三個(gè)細(xì)分變量是R(Recency),F(xiàn)(Frequency)和M(Monetary),分別代表客戶與企業(yè)交易的時(shí)間、交易的頻率以及交易的金額。RFM模型的不足之處在于交易時(shí)間、交易頻率以及交易金額方面無法避免的多種共線性。Marcus模型是對(duì)RFM模型進(jìn)行改進(jìn),采用客戶平均交易金額A(Average Monetary)替代傳統(tǒng)模型中的細(xì)分變量——交易金額M。同時(shí),為了簡(jiǎn)化傳統(tǒng)模型的客戶分類結(jié)果,Marcus應(yīng)用聚類的思想,根據(jù)客戶與企業(yè)之間的交易頻率以及平均交易金額進(jìn)一步將客戶劃分為4種類別,分別是消費(fèi)客戶、優(yōu)質(zhì)客戶、不確定客戶以及經(jīng)??蛻鬧8]。本研究中客戶分類在RFM模型3個(gè)分類基礎(chǔ)上,增加了年齡變量,使客戶分類的劃分更加細(xì)致。
實(shí)際數(shù)據(jù)挖掘的過程中,經(jīng)常會(huì)碰到一類數(shù)據(jù),它們與整個(gè)數(shù)據(jù)集合的表現(xiàn)不符,與整體數(shù)據(jù)表象層面所體現(xiàn)出的規(guī)律不一致,游離在大部分所處的區(qū)間之外,所特有模式使得其經(jīng)常被誤判為噪聲數(shù)據(jù)或者異常數(shù)據(jù),從而在數(shù)據(jù)清洗之初就被過濾掉,不予考慮,這樣的數(shù)據(jù)就是離群數(shù)據(jù)。在數(shù)據(jù)集合中,檢測(cè)異常數(shù)據(jù)并對(duì)其加以歸納、分析、解釋的過程稱為離群數(shù)據(jù)挖掘。近年來,已有越來越多的學(xué)者對(duì)離群數(shù)據(jù)挖掘表示出極大的興趣。
國(guó)外學(xué)者早于20世紀(jì)90年代初開始探索離群數(shù)據(jù)的檢測(cè)算法。Rosner(1991)提出,可以考慮應(yīng)用單樣本多個(gè)離群檢測(cè)法,即ESD(Generalized Extreme Studentized Deviate)算法檢測(cè)離群數(shù)據(jù)。Aggarwal和Yu(1997)等人提出基于高維的數(shù)據(jù)異常檢測(cè)方法。Knor和Ng(1998)提出,基于距離檢測(cè)離群數(shù)據(jù)具有一定的合理性。Breunig 等人提出,基于局部離群因子進(jìn)行離群數(shù)據(jù)檢測(cè)可行性較高。LOF、Struyf和Rousseeuw提出基于深度的離群檢測(cè)算法。
較之國(guó)外,國(guó)內(nèi)的離群數(shù)據(jù)研究比較分散,但已逐步形成一系列有意義的研究成果。史東輝(2000)分析大量醫(yī)學(xué)流行病數(shù)據(jù),針對(duì)性地提出基于規(guī)則進(jìn)行挖掘,并取得了良好的效果。鄭斌祥(2004)等人所提出基于離群指數(shù)的時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,能夠更好地應(yīng)對(duì)數(shù)據(jù)逐漸呈現(xiàn)出的時(shí)序性,同時(shí)也能夠進(jìn)一步考量在時(shí)序維度層面上,數(shù)據(jù)所體現(xiàn)出的離群特性。曾學(xué)友(2006)提出了基于快速貪心算法,進(jìn)行離群數(shù)據(jù)挖掘,提高了海量數(shù)據(jù)挖掘的效率。唐志剛(2010)所提出的基于馬爾可夫鏈的離群點(diǎn)檢測(cè)方法,有效提高離群數(shù)據(jù)挖掘的效率以及數(shù)據(jù)維數(shù)處理的效能。彭小奇(2010)提出基于支持向量機(jī)進(jìn)行離群挖掘,在很大程度上改善了高維數(shù)據(jù)的檢測(cè)效率。
大數(shù)據(jù)背景下,數(shù)據(jù)存在的形式多種多樣,分布的規(guī)律性有待考量,數(shù)據(jù)結(jié)構(gòu)也呈多元化發(fā)展,且數(shù)據(jù)的維度不斷增多而價(jià)值密度降低,對(duì)數(shù)據(jù)內(nèi)蘊(yùn)含的信息進(jìn)行挖掘顯得尤為必要。簡(jiǎn)單的數(shù)據(jù)分類與聚類已經(jīng)無法滿足數(shù)據(jù)挖掘的需求,離群數(shù)據(jù)挖掘?qū)⑷找娉蔀橐环N重要且有效的挖掘方式。
就離群數(shù)據(jù)而言,市場(chǎng)營(yíng)銷的離群數(shù)據(jù)滿足普通離群數(shù)據(jù)的特征,它們游離在大部分普通數(shù)據(jù)的活動(dòng)區(qū)域之外,卻能反映客戶某方面重要的特征信息。例如,“交易金額極其大”的信息屬于離群信息,但是反映了客戶超強(qiáng)的購(gòu)買實(shí)力,忽略這樣的客戶絕非明智之舉。
就客戶資產(chǎn)而言,其旨在幫助企業(yè)更加深刻理解客戶,掌握客戶需求,并意圖通過管理客戶,以影響客戶的行為,促使客戶對(duì)企業(yè)做出更大的價(jià)值貢獻(xiàn)。這需要經(jīng)歷客戶識(shí)別、客戶分類、客戶管理的過程。離散數(shù)據(jù)分析通過從所得數(shù)據(jù)中提取信息來解釋隱含的客戶資產(chǎn),可以幫助企業(yè)實(shí)現(xiàn)客戶資產(chǎn)挖掘。
本研究擬構(gòu)建基于客戶資產(chǎn)離群數(shù)據(jù)分析的客戶分類模型,采用4個(gè)維度的指標(biāo)對(duì)客戶進(jìn)行分類,分別是交易金額、交易的產(chǎn)品或服務(wù)的種類、交易頻率和客戶年齡。但介于客戶信息的3個(gè)維度更具可操作性,故選擇交易金額、交易的產(chǎn)品或服務(wù)的種類、交易頻率作為變量進(jìn)入模型。選擇客戶年齡作為第4維度是因?yàn)榭蛻糍Y產(chǎn)代表了客戶終身購(gòu)買價(jià)值的總和,可以衡量客戶處于“終身”的哪個(gè)階段,進(jìn)而分析客戶的當(dāng)前消費(fèi)狀態(tài)以及消費(fèi)成長(zhǎng)性。另外,雖然簡(jiǎn)單的人口統(tǒng)計(jì)變量遠(yuǎn)不及社會(huì)經(jīng)濟(jì)變量以及心理學(xué)變量在劃分客戶層面那么準(zhǔn)確,但介于社會(huì)經(jīng)濟(jì)變量以及心理學(xué)變量在收集、整理、處理方面的復(fù)雜與繁瑣容易引起結(jié)果不準(zhǔn)確,在此采用客戶年齡作為第4個(gè)客戶分類指標(biāo),并假定客戶的年齡總體分布呈現(xiàn)正態(tài)分布規(guī)律??蛻粜畔?個(gè)維度的數(shù)據(jù)可以很容易地在終端接觸點(diǎn)通過整理獲得。尤其在電子商務(wù)環(huán)境下,交易金額、交易的產(chǎn)品或服務(wù)的種類、交易頻率以及客戶年齡可以通過后臺(tái)操作獲得。通過對(duì)4個(gè)維度指標(biāo)的離群數(shù)據(jù)進(jìn)行分析,可以發(fā)現(xiàn)重要客戶的相關(guān)特征。