摘 要:選擇合適的客戶并對其推薦合適的產品成為企業(yè)提高交叉銷售業(yè)績、獲得競爭優(yōu)勢的重要方面。本文以某商業(yè)銀行的18515位個人客戶的歷史交易數(shù)據(jù)為研究對象,構建序列模型,利用邏輯回歸分析的方法在僅利用銀行現(xiàn)有數(shù)據(jù)的基礎上來預測客戶下次購買不同產品的概率。實證結果顯示,本模型對每種產品的預測準確率達到72%以上,這樣不僅能幫助銀行提高客戶經理在產品推薦時的準確性,而且可以使銀行的營銷決策更有針對性,從而給銀行帶來更大的收益。
關鍵詞:交叉銷售;序列模型;Logistic回歸;數(shù)據(jù)挖掘
中圖分類號:F713.50 文獻標識碼:A 文章編號:1003-5192(2011)06-0013-06
A Research of the Cross-selling in Bank ’s Individual Customer Base on
the Sequence Model
LI Chun-qing, LI Xue-ping, TIAN Min, ZHAO Qi-yuan
(School of Economics and Management, Xi ’an University of Technology, Xi ’an 710032, China)
Abstract: “Recommended right product to right customer” is an important aspect to improve the cross-selling and get competitive advantage. This research selects historical transaction data of 18515 customers from a commercial bank as samples to build sequence model and to use Logistic regression to forecast the probability of customer next product to buy only based on existing data. The results show that the accuracy of each product has reached more than 72%, so there were more targeted to different customer use different cross-selling strategy, thereby increasing the accuracy of products which recommended by manager, bring greater benefits to the enterprise.
Key words:cross-selling; sequence model; Logistic regression; data mining
1 引言
客戶是企業(yè)保持活力的源泉,沒有客戶,企業(yè)就沒有收入,沒有利潤,也就沒有存在的基礎。因此企業(yè)的經營理念不斷由“產品導向”轉向“客戶導向”,客戶作為企業(yè)的重要資產受到廣泛的重視。Blattberg等指出交叉銷售是客戶資產增值的重要途徑[1]。
Nash,Deighton等指出交叉銷售是鼓勵一個已經購買了公司A產品的客戶也購買其B產品[2,3]。Jarrar等認為交叉銷售是借助客戶關系管理(CRM),發(fā)現(xiàn)現(xiàn)有客戶的多種需求,并在滿足其需求的基礎上,進而銷售多種產品或服務的一種新型營銷方式[4]。
交叉銷售的目的是保持優(yōu)質顧客,節(jié)約銷售成本,并提高顧客的轉移成本,進而使企業(yè)和客戶各有收益,達到雙贏的目的。經濟學有兩個最基本的假設,經濟個體(企業(yè)或顧客)是理性的,經濟資源是稀缺的,企業(yè)在客戶關系管理過程中應利用有限的資源保持優(yōu)質顧客,同樣交叉銷售過程正是企業(yè)保持最優(yōu)顧客的過程。
有效的交叉銷售對客戶的數(shù)據(jù)量有較高的要求,自1999年9月開始,我國各個銀行都陸續(xù)開展數(shù)據(jù)大集中,數(shù)據(jù)挖掘技術不斷發(fā)展,數(shù)據(jù)倉庫建設逐步完善,這些都為銀行業(yè)有效實施交叉銷售提供了可能。但是由于各種原因,銀行對客戶信息的掌握有一定的局限性,然而,是否能用銀行的現(xiàn)有數(shù)據(jù)來進行交叉銷售的預測,成為研究的重點,因此,本研究通過構建顧客序列模型,在使用銀行現(xiàn)有數(shù)據(jù)的基礎上完成對客戶下一次購買產品類別的預測。
李純青,等:基于序列模型的銀行個人客戶交叉銷售研究Vol.30, No.6 預測 2011年第6期2 文獻回顧
從上個世紀90年代起,國內外不同的學者對交叉銷售都做了不同的定義,總的來說交叉銷售是要在充分了解客戶的基礎上,借助各種相關分析技術與經驗進行判斷,發(fā)掘和滿足客戶的多樣化需求而銷售與其相關的服務。因此,企業(yè)在進行交叉銷售時要明確定位客戶。近幾年來,國內外學者大都致力于對交叉銷售機會的預測,并建立起一些交叉銷售預測模型。
Lehmann提出理想點模型,模型假設產品的選擇概率的大小與客戶需求等級和理想點(即理想品牌等級)之間的距離負相關[5]。Kamakura等利用潛在特質分析來預測交叉銷售機會,他們假設個人特征可以體現(xiàn)不同的個人行為,通過對這些特征的數(shù)值計算來預測客戶購買行為,潛在特質將交叉銷售的研究推向高潮[6],但是這個模型要求企業(yè)了解每個客戶消費本企業(yè)和競爭對手的產品情況,因此,2003年Kamakura等通過在其模型中使用了四種不同類型的冪指函數(shù)分布模型(a.用貝努利分布表示二元服務使用項目;b.二項式分布表示滿意度排序;c.泊松分布表示服務使用頻率;d.正態(tài)分布表示交易量),而提出了一個綜合數(shù)據(jù)因子分析模型來處理所獲得的擴展數(shù)據(jù),最終利用Gini集中度系數(shù)來解釋并總結該模型預測交叉銷售機會的能力[7]。隨后2004年,Kamakura等又采用了風險模型(Hazard Model)來評估客戶的新產品購買概率和購買時間[8]。Paas等運用Mokken量表和已有客戶購買的金融產品的先后順序,通過SLD模型 (Sequential Logit Decision Model)來分析獲得模式中客戶每個階段顯現(xiàn)出的各種特征,并將此作為一個重要指標來預測交叉銷售的機會[9]。Knott等提出NPTB(Next-Product-To-Buy)模型用來判斷將什么產品提供給什么客戶更為合適,該模型選擇了Logistic回歸、多元回歸、判別分析和神經網(wǎng)絡這四種技術,同時也驗證了采用探索的方法和NPTB方法最終確定交叉銷售目標客戶的有效性[10]。Peltier等 提出市場細分的方法,他們首先對個案客戶進行有關心理變量因素的問卷調查分析,根據(jù)心里變量因素分析對顧客進行細分,再深入剖析細分后得到的每個細分群體的人口統(tǒng)計特征,最終通過建立得分模型來預測交叉銷售機會[11]。Harrison等闡述了金融機構留住客戶的重要性,及如何利用生存分析方法預測交叉銷售機會[12]。Manchanda等提出了基于隨機效用理論(Random Utility Theory)的多種類購買時機決策(Multicategory Purchase Incidence Decision)模型。該模型通過貝葉斯多元Probit模型(Bayesian Multivariate Probit Model)詳細描述了各個消費者同時購買的行為特征,考慮了消費者異質性(Heterogeneity)的影響,有助于制定面向客戶的個性化營銷決策[13]。Li Shibo等采用了Probit模型和分層貝葉斯架構來研究客戶對多種產品需求的變化,認為不同的產品用來滿足客戶在不同需求成熟度階段的需求,并在客戶需求成熟度的個體水平上得到產品的購買順序[14]。
國內學者郭國慶明確了交叉銷售與客戶忠誠之間的影響機理,構建了交叉銷售與客戶之間的關系模型,填補了國內交叉銷售理論研究領域的一個空白點[15]。趙華、宋順林運用有維度約束的序列模式對交叉營銷進行研究,使用ERMSW算法根據(jù)已有的客戶購買序列,挖掘客戶的購物趨勢,發(fā)現(xiàn)多維序列模式,預測滿足一定匹配度的客戶的可能消費行為[16]。董莉在其碩士論文中構建了基于序列模型的銀行個人客戶交叉銷售理論框架,利用序列模型探索銀行識別交叉銷售的機會[17]。Li Chunqing等對NPTB模型的變量進行修正,建立了適合我國商業(yè)銀行的個人客戶交叉銷售的NPTB模型,并應用某商業(yè)銀行的數(shù)據(jù)進行實證研究,論證了神經網(wǎng)絡模型對交叉銷售預測的良好適用性[18]。
國內對交叉銷售實證方面的研究很有限,又由于國內外銀行產品、所存儲客戶信息等的差異,國內銀行業(yè)的交叉銷售研究需要適合其自身條件的預測模型,正是基于這樣的背景,本研究力求充分利用國內銀行現(xiàn)有數(shù)據(jù)的基礎上來完成對客戶下一次購買不同產品的預測。本研究通過對某商業(yè)銀行零售客戶的消費者序列購買行為模式分析與研究,基于銀行現(xiàn)有的客戶信息,借助數(shù)量經濟的相關方法構建顧客序列購買模型,對商業(yè)銀行零售業(yè)務交叉銷售的產品類別進行預測,為銀行客戶經理有針對性地推薦交叉銷售產品提供指導,進而使銀行有效保持優(yōu)質客戶,降低交叉銷售成本,提升交叉銷售業(yè)績。
3 模型構建
消費者在任何時間點上都有多種產品的需求。經濟理論顯示,在資源有限的情況下,各種需求目標中有一個“優(yōu)先結構”,這個需求目標的“優(yōu)先結構”能夠轉變?yōu)楫a品的“優(yōu)先結構”[6]。Li Shibo等構建模型把多種產品與這些產品的客戶需求放在一個普通連續(xù)體的位置,在某種程度上反應了客戶需求成熟度的發(fā)展[14]。任何個人消費者需求成熟度越接近某一特定產品位置,這個產品就越可能滿足客戶當前的需求,并且該客戶就越有可能購買這個產品。為了在隨機效用框架中說明這一觀點,他們采用了Lehmann開發(fā)的理想點模型[5]。通常假定家庭i(i=1,…,I)在任一時間t對產品集合j(j=1,…,J)中的每個產品做二項選擇決策(買或者不買)。Li Shibo等定義家庭i在時間t選擇產品j的潛在效用為[14]
其中Uijt表示家庭i在t時期選擇產品j的潛在效用;Oj表示產品j的成熟度等級;DMit-1表示家庭i在(t-1)期末的需求成熟度,其反映該家庭所達到的購買水平;|Oj-DMit-1|表示產品j的成熟度等級與家庭i在(t-1)期末的需求成熟度之間的距離,該距離越大,說明家庭i購買產品j的可能性越小。反之,亦然;系數(shù)βi用來衡量家庭i對產品j的需求成熟度發(fā)展狀況;COMPETi為擁有競爭對手產品的狀況,被定義為啞元變量,當家庭i過去六個月內在其他銀行開設j賬戶時記為1,反之記為0;OVERASATi為通過銀行客戶滿意度調查測量的家庭整體滿意度;SWITit表示家庭層面的轉移成本。
相應地,購買產品j的決策變量yijt描述如下
即如果潛在效用Uijt大于0,家庭i就購買產品j,否則就不購買。
Li Shibo等認為家庭的需求成熟度受家庭購買的產品累計、賬戶余額及持有產品時間的影響,并且擁有不同的產品對家庭需求成熟度的貢獻不同,因此,他們定義DMit-1的表達式如下
DMit-1= ∑4j=1OjDijt-1(λ1ACCTijt-1+λ2BALijt-1+λ3HOLDINGijt-1)
(3)
其中Dijt-1表示家庭i在t-1期末是否擁有產品j,擁有記為1,否則記為0;ACCTijt-1表示家庭i在(t-1)期末產品j的購買累計;BALijt-1表示家庭i在(t-1)期末產品j的賬戶余額;HOLDINGijt-1表示家庭i在(t-1)期末產品j的持有時間。
通過對現(xiàn)有研究成果的總結歸納,我們發(fā)現(xiàn)Li Shibo等[14]提出的序列購買效用模型,是把客戶的教育水平、性別、年齡以及對銀行的滿意度等作為影響變量,來判斷不同家庭對產品的需求情況。模擬了客戶對多種產品需求的發(fā)展,并且在客戶需求成熟度的個體水平上獲得了產品購買順序,該成果加強并推動了購買行為模式的研究。
Li Shibo等[14]的方法需要知道客戶的教育水平、性別、年齡以及對銀行的滿意度、擁有競爭對手產品等信息,但滿意度及擁有競爭對手產品情況等信息在國內銀行業(yè)的現(xiàn)有數(shù)據(jù)庫中是較難獲取的,就銀行數(shù)據(jù)庫的現(xiàn)有數(shù)據(jù)、用較簡單實用的方法來解決已知客戶購買產品的情況下,如何預測客戶下次購買其他產品的概率問題,是本研究關注的重點。根據(jù)該問題的因變量為客戶購買或不購買產品的決策特性以及前人的研究基礎,我們采用Logistic回歸方法構建模型。根據(jù)對國內商業(yè)銀行實際的調查,我們認為客戶購買一種或多種金融產品會受到性別,年齡,收入等自身條件的限制,并且根據(jù)Stone的研究發(fā)現(xiàn),客戶購買產品與否和RFM存在一定的關系,他們認為R、F、M值是衡量客戶行為的重要指標,R(Recency)“近度”是指客戶最近一次交易到統(tǒng)計日期的時間間隔;F(Frequency)“頻度”是指客戶在單位時間內購買某種產品的次數(shù);M(Monentary Value)“值度”是指客戶在單位時間內購買某產品的金額[19]。所以,本文在原有理論成果的基礎上,通過實際調研,引入AGE、SEX、INCOME、R、F、M六個變量建立相對符合銀行實際的模型,具體如(4)式所示
P(yi=1/xi)=11+e-(β1+β2AGE+β3SEX+β4INCOME+β5R+β6F+β7M+ε), i=1,…,6
(4)
(4)式中變量定義如下:AGE和SEX分別定義為年齡和性別;INCOME定義為收入,由于數(shù)據(jù)獲取的限制以及銀行實際,本研究用個人金融資產余額代替收入水平,在銀行的數(shù)據(jù)庫中,個人金融資產余額是活期賬戶余額、定期賬戶余額、貸款放款金額、理財賬戶余額、基金賬戶余額、國債賬戶余額和第三方存管余額的加總;R為客戶最近一次主動交易時間距離統(tǒng)計日期間隔的天數(shù);F為客戶一個月內的主動交易次數(shù),由于銀行產品的特殊性,該交易次數(shù)是借方交易次數(shù)和貸方交易次數(shù)的總和;M為客戶一個月內的主動交易金額,也是借方交易金額與貸方交易金額的加總。
(4)式通過Logit轉化為線性函數(shù)
ln(Pi1-Pi)=β1+β2AGE+β3SEX+β4INCOME+
β5R+β6F+β7M+ε, i=1,…,6
(5)
4 實證分析
4.1 樣本選擇
本研究隨機選取了某商業(yè)銀行個人金融資產在兩萬以上的20000個客戶截止到2008年10月31日為期13個月的交易記錄作為研究對象,以個人活期、定期、貸款、理財、基金、國債六大類產品作為交叉銷售推薦產品,其中包括客戶對六大類產品是否購買、最早開戶日期、產品擁有數(shù)、人口統(tǒng)計變量(年齡、性別)、客戶的金融資產余額等信息。由于商業(yè)數(shù)據(jù)保密性的問題,本研究需要對個人信息數(shù)據(jù)及所使用的交易數(shù)據(jù)進行一定的轉換,但這并不影響研究結論。這些數(shù)據(jù)對我們研究銀行個人客戶的交叉銷售提供了可靠的數(shù)據(jù)支持。
4.2 數(shù)據(jù)描述
在隨機選取的20000個客戶中,對于六種產品,大多數(shù)客戶擁有1~3類產品,占比92%。而且?guī)缀跞巳硕紦碛谢钇?、定期產品,將近一半的客戶擁有理財產品,而其他產品的客戶擁有量較少。因此實施交叉銷售,增加客戶產品的使用類別,對于各商業(yè)銀行具有廣闊的空間和重要的現(xiàn)實意義。
我們引入人口統(tǒng)計變量性別、年齡、金融資產余額(代替收入水平)作為調節(jié)變量。在剔除無效數(shù)據(jù)最終確定的18515個客戶中,性別比例相當,基本各占一半,有85.2%的客戶年齡在25歲~64歲之間,有58.8%的客戶個人金融資產余額在2萬元~10萬元,在樣本中占比最高。
RFM值是衡量客戶行為的重要指標,研究對象的RFM特征如下:R值越大,表明客戶越不活躍;R值越小,表明客戶越活躍。在我們選擇的樣本中,有51.8%的客戶近一個月內有交易,說明大部分客戶具有較強的活躍性,數(shù)據(jù)的質量較為良好。F值越大,表明客戶越活躍;F值越小,表明客戶越不活躍。在我們選擇的樣本中,有51%的客戶在一個月內交易次數(shù)均在一次以上,說明客戶的交易也比較頻繁??蛻艚灰捉痤~M值越大,對銀行不同的業(yè)務,有不同的含義,需要視具體情況來確定。在我們所選擇的樣本中,交易金額在1萬元~5萬元、10萬元~50萬元之間的人數(shù)較多,分別為10.5%和11.2%,但客戶在交易金額上存在較大的差異性,為消除這種差異性帶來的預測誤差,我們采用標準化處理的方法進一步篩選客戶,最終確定的客戶樣本為7097個。
4.3 實證檢驗
根據(jù)已構建的模型(5),依據(jù)SPSS的邏輯回歸結果我們得到六種產品的對應方程
分別對以上六個方程進行自變量檢驗,檢驗結果均顯著,因此方程整體顯著。依據(jù)系數(shù)矩陣中RFM的系數(shù)值和產品購買比重(表1),得到RFM修正后的系數(shù)見表2。對各種產品的相關系數(shù)求均值的方法得到方程中RFM的系數(shù)分別為:0.056、2.492及1.638。據(jù)此將7097個客戶的數(shù)據(jù)代入計算,得出每個客戶的效用值矩陣如表3,我們把求出的效用值與不同產品對應的產品等級比較,推斷出客戶接下來次最有可能購買的產品類別。
由表3可以看出,客戶號為1的客戶,真實的購買情況為活期、定期、理財已經購買,貸款、基金、國債未購買。求出的1號客戶的每個產品的效用為活期、定期、理財都大于0,為已經購買,貸款、基金、國債都小于等于0,為還沒有購買,與真實的購買情況一致,其他同理可得。依據(jù)絕對誤差的計算原理,預測準確率=準確預測的個數(shù)樣本總數(shù)×100%,用7097個客戶的預測購買情況和真實值的購買情況比較,計算出每種產品的預測準確率如表4所示。
模型按規(guī)則支持度由大到小生成的規(guī)則如下:
(1)活期、理財定期。在購買活期、理財產品后,購買定期產品的概率為82.33%,因此在針對未購買定期產品的客戶進行交叉銷售時,我們認為該客戶有82.33%概率購買定期產品。
(2)理財定期。在購買理財產品后,購買定期產品的概率為63.27%。
(3)活期定期。在購買活期產品后,購買定期產品的概率為61.48%。
(4)定期國債。在購買定期產品后,購買國債產品的概率為42.31%。
在生成的規(guī)則中,僅有以上四個規(guī)則的支持度高于40%,即該序列規(guī)則在客戶的總記錄中出現(xiàn)的概率高于40%,而且總體預測出客戶交叉購買產品的概率,僅個別產品預測概率達到80%。
將預測準確率與Li Chunqing等[18]構建的NPTB模型的預測準確率進行對比,比對結果見表5,總體上來看,購買決策模型的預測準確率除貸款的79%和國債的75%低于NPTB模型的預測準確率外,其余都較高,其原因可能為購買貸款和國債的客戶數(shù)均低于研究樣本數(shù)的5%。其他產品的預測準確性都高于NPTB模型。由此可見根據(jù)銀行現(xiàn)有數(shù)據(jù)(年齡、性別、個人金融資產余額、RFM值),應用較為簡單的方法可以有效地預測客戶下一次最有可能購買的產品類別。
5 研究結論與討論
本文將交叉銷售序列模型引入到國內商業(yè)銀行的交叉銷售分析中,根據(jù)某商業(yè)銀行客戶數(shù)據(jù)的特點對序列模型的變量進行了重新定義、依據(jù)RFM變量和人口統(tǒng)計變量,對國內銀行個人客戶基于序列模型的交叉銷售進行討論,構建了國內銀行個人客戶交叉銷售序列模型。對如何將序列模型應用到銀行的實際經營管理中進行了探討。研究發(fā)現(xiàn)交叉銷售序列模型可以根據(jù)銀行現(xiàn)有數(shù)據(jù)利用較為簡單的方法就能較準確地預測客戶下一次最有可能購買的產品類別。這對銀行有針對性地實施交叉銷售策略具有較大的現(xiàn)實意義。
未來研究還可以從以下兩個方面進行:(1)交叉銷售可以在銀行內部產品、銀行產品與其他企業(yè)產品之間實行。本研究只關注于銀行個人客戶的內部產品,銀行產品與其他企業(yè)產品間的交叉銷售研究本文尚未涉及,但這類交叉銷售的結果通常會給銀行或其他企業(yè)帶來不錯的收益,未來可考慮銀行與其他企業(yè)產品間的交叉銷售問題;(2)交叉銷售的時間階段問題在本研究中并未涉及,只考慮了客戶購買時間的先后順序,在后續(xù)的研究中,可根據(jù)客戶購買產品的特征分成不同的時間階段,可能對實際指導交叉銷售具有更為重要的意義。
參 考 文 獻:
[1]Blattberg R C, Getz G, Thomas J S. Customer equity: building and managing relationships as valuable assets[M]. Boston, MA: Harvard Business School Press, 2001.
[2]Nash E L. Database marketing: the ultimate marketing tool[M]. New York: McGraw-Hill, 1993.
[3]Deighton J, Peooers D, Rodgers M. Consumer transaction databases: present status and prospects. In Blattberg R, Rashi G, Little J, eds. The Marketing Information Revolution[M]. Boston, MA: Harvard Business School Press, 1994. 58-79.
[4]Jarrar F Y, Neely A. Cross-selling in the financial sector: customer profitability is key[J]. Journal of Targeting, Measurement and Analysis for Marketing, 2002, 10(3): 282-296.
[5]Lehmann D R. Television show preference: application of a choice model[J]. Journal of Marketing Research, 1971, 8(2): 47-55.
[6]Kamakura W A, Ramaswami S, Srivastava R. Applying latent trait analysis in the evaluation of prospects for cross-selling of financial services[J]. International Journal of Research in Marketing, 1991, 8(4): 329-349.
[7]Kamakura W A, Wedel M, Mazzon J A. Cross-selling through database marketing: a mixed data factor analyzer for data augmentation and prediction[J]. International Journal of Research in Marketing, 2003, 20(1): 45-65.
[8]Kamakura W A, Kossar B S, Wedel M. Identifying innovators for the cross-selling of new product[J]. Management Science, 2004, 50(8): 1120-1133.
[9]Paas L, Kuijlen T. Acquisition pattern analyses for recognising cross-sell opportunities in the financial services sector[J]. Journal of Targeting, Measurement and Analysis for Marketing, 2001, 9(3): 230-240.
[10]Knott A, Hayes A, Neslin S A. Next-product-to-buy models for cross-selling application[J]. Journal of Interactive Marketing, 2002, 16(3): 59-75.
[11]Peltier J W, Schultz D E. Interactive psychographics: cross-selling in the banking industry[J]. Journal of Advertising Research, 2002, (4): 7-22.
[12]Harrison T, Ansell J. Customer retention in the insurance industry: using survival analysis to predict cross-selling opportunities[J]. Journal of Financial Services Marketing, 2002, (3): 229-239.
[13]Manchanda P, Ansari A, Gupta. The “shopping basket”: a model for multicate gory purchase incidence decisions[J]. Marketing Science, 1999, 18(2): 95-114.
[14]Li Shibo, Sun Baohong, Wilcox R T. Cross-selling sequentially ordered products: an application to consumer banking services[J]. Journal of Marketing Research, 2005, 42(2): 233-239.
[15]郭國慶.CRM與交叉銷售在美國金融業(yè)的應用及其啟示[J].山東大學學報,2003,(5):79-84.
[16]趙華,宋順林.改進的序列模式挖掘算法在交叉營銷中的應用[J].計算機工程與設計,2007,(5):1219-1222.
[17]董莉.基于序列模型的銀行個人客戶交叉銷售研究[D].西安:西安工業(yè)大學,2008.
[18]Li Chunqing, Qin Changlei, Li Gang. The implication of logistic regression and neural nets in cross-selling of bank ’s individual customer[A]. Proceedings of the Ninth Wuhan International Conference on E-Business Interface[C]. USA: Alfred University, 2010. 2560-2564.
[19]Stone B. Successful direct marketing methods[M]. Lincolnwood: NTC Business Books, 1996.