杜云生
(北京理工大學(xué) 管理與經(jīng)濟(jì)學(xué)院,北京 100081)
基于客戶消費數(shù)據(jù)的信用卡持卡人細(xì)分研究
杜云生
(北京理工大學(xué) 管理與經(jīng)濟(jì)學(xué)院,北京 100081)
將逾期拖欠風(fēng)險和疑似套現(xiàn)風(fēng)險融入以RFM價值評估模型為基礎(chǔ)的信用卡持卡人細(xì)分模型中,構(gòu)建融合客戶價值和風(fēng)險因素的RFMDA細(xì)分模型,并利用RFMDA模型,通過實證分析某工商銀行客戶消費數(shù)據(jù),將信用卡持卡人按照價值和風(fēng)險分為9類,為商業(yè)銀行對不同類別的信用卡持卡人開展市場營銷策略提供方法和決策依據(jù)。
信用卡;客戶細(xì)分;客戶價值;信用風(fēng)險;RFMDA模型
關(guān)于信用卡客戶細(xì)分,國外學(xué)者和商業(yè)銀行的研究主要集中在兩個方面。一是對信用卡欺詐風(fēng)險的關(guān)注,利用風(fēng)險評估和監(jiān)測等手段,將客戶區(qū)分為有風(fēng)險和無風(fēng)險兩類客戶是一個主要的需求[1]。例如,Ramaswamy等(2000)采用KNN算法從大數(shù)據(jù)集中挖掘孤立點來發(fā)現(xiàn)存在欺詐的信用卡客戶;Duman等(2011)[2]采用社會網(wǎng)絡(luò)分析方法來發(fā)現(xiàn)在線的信用卡欺詐客戶;Lesot等(2012)采用一種混合的增量聚類算法來發(fā)現(xiàn)欺詐客戶;Subashini等(2013)[3]和Chitra等(2013)采用一些分類模型發(fā)現(xiàn)欺詐行為來實現(xiàn)信用卡的自動審批。二是在對信用卡客戶價值進(jìn)行評估的基礎(chǔ)上對信用卡客戶進(jìn)行細(xì)分研究。例如,英國巴克萊銀行集團(tuán)利用客戶帶來的利潤和客戶價值將客戶分為了四個等級;Wahab等(2012)對利用客戶價值細(xì)分客戶對CRM的影響進(jìn)行了研究;Ekinci等(2014)利用客戶生命周期價值模型對客戶進(jìn)行分類,用來指導(dǎo)銀行的營銷活動。隨著發(fā)卡機(jī)構(gòu)掌握的數(shù)據(jù)越來越多,對信用卡客戶細(xì)分的方法也在不斷發(fā)生變化。例如,Martins(2012),Ogwueleka(2012)和Rahman等(2013)都曾采用數(shù)據(jù)挖掘等手段,通過對客戶的行為進(jìn)行分析實現(xiàn)對信用卡客戶的細(xì)分。國外信用卡市場經(jīng)過一個世紀(jì)的發(fā)展,在信用卡客戶細(xì)分方面已經(jīng)有了較為成熟的經(jīng)驗和較深入的研究。
相對于國外,國內(nèi)的信用卡發(fā)展時間短,目前主要集中于基于客戶價值的細(xì)分研究和基于客戶行為的細(xì)分研究兩大方面。前者如陳明亮(2001)[4]根據(jù)客戶全生命周期利潤(Customer Lifecycle Profit,CLP)將客戶分成四類,并提出相應(yīng)的資源配置和保持策略;陳靜宇(2007)[5]構(gòu)造了客戶潛在價值空間和潛在價值能力兩類指標(biāo)來衡量客戶的潛在價值,并構(gòu)建了客戶價值立方體模型;賀昌政(2013)[6]在CLV(客戶終身價值)兩個要素(客戶當(dāng)前價值和客戶流失預(yù)測)的基礎(chǔ)上構(gòu)造信用卡客戶細(xì)分模型;鄒鵬等(2011)[7]利用代價敏感學(xué)習(xí)技術(shù)擴(kuò)展現(xiàn)有決策樹模型,并將此方法應(yīng)用在信用卡客戶價值細(xì)分上。后者如梁昌勇(2005)和劉朝華(2012)[8]基于RFM模型分別對信用卡客戶行為評分和客戶分類進(jìn)行了研究;王娜(2010)[9]采用相關(guān)度關(guān)聯(lián)分類算法、董慧敏(2011)采用聚類算法、饒黎黎(2013)采用K均值聚類算法對信用卡客戶交易行為進(jìn)行研究并用來細(xì)分客戶;許建生(2012)、陳為民(2012)[10]、王叢敏(2013)等從客戶的風(fēng)險行為對客戶進(jìn)行評價和細(xì)分。
從國內(nèi)外研究現(xiàn)狀來看,無論是哪種細(xì)分研究,大多數(shù)信用卡客戶的細(xì)分研究還是關(guān)注客戶的價值,缺少信用風(fēng)險的考慮,這種方法可能造成錯分類,而錯分類會帶來嚴(yán)重的代價,雖然也有一些研究從風(fēng)險角度細(xì)分客戶,但并沒有考慮價值因素。為此,蔣慶軍(2009)[11]提出應(yīng)綜合考慮客戶的價值指標(biāo)(大、中、小、無、負(fù))和風(fēng)險指標(biāo)(低、中、高)來細(xì)分信用卡客戶,然而他并沒有進(jìn)行實證研究?;诖耍狙芯坷眯庞每蛻粝M數(shù)據(jù)構(gòu)建了一個融合客戶價值和風(fēng)險因素的信用卡持卡人細(xì)分模型。
信用卡持卡人在用卡過程中通常主要可能產(chǎn)生兩大風(fēng)險:逾期拖欠風(fēng)險和疑似套現(xiàn)風(fēng)險。基于這兩種信用卡風(fēng)險,本研究在RFM模型的最近購買時間(Recency)、購買頻率(Frequency)和總購買金額M (Monetary Value)三個變量的基礎(chǔ)上,將信用卡持卡人的風(fēng)險因素引入評價中,增加逾期拖欠風(fēng)險(Default)和疑似套現(xiàn)風(fēng)險(Arbitrage)兩個變量,構(gòu)建了RFMDA模型。利用RFMDA模型,將信用卡持卡人細(xì)分為9類,為信用卡持卡人的營銷管理提供了更實用和有效的細(xì)分決策。
(一)信用卡持卡人的逾期信用風(fēng)險及判定方法
商業(yè)銀行在接受申請人的信用卡申請后,會根據(jù)申請人的信用狀況為信用卡持卡人設(shè)定一定的信用額度。一般情況下,信用卡發(fā)卡機(jī)構(gòu)給予持卡客戶最高56天的免息周期。信用卡持卡人在透支消費后,如果在還款日前將透支消費的欠款還清,將不會產(chǎn)生任何利息及滯納金。如果在還款日前沒有還款或沒有償還最低還款額,將會產(chǎn)生利息或滯納金。其中,利息是沒有按照約定日期還款而產(chǎn)生的,一般按照所有欠款或未還款額征收;滯納金是持卡人未能在到期還款日前償還最低還款額(一般是應(yīng)還款額的10%)產(chǎn)生的,例如按照最低還款額的未還部分的5%支付滯納金。另外,信用卡持卡人在使用過程中,可能會產(chǎn)生超限費,超限費是持卡人在超過核定信用額度使用后,而未在超限當(dāng)日歸還超限部分所產(chǎn)生的,例如對超限部分按照5%支付超限費。因為高昂的利息、滯納金和超限費,一般信用、財務(wù)狀況良好的持卡人都會選擇在規(guī)定日期之前還款。當(dāng)然,也有個別的信用良好的人因各種原因忘記在還款日前還款,但這種情況很少出現(xiàn),除此之外,產(chǎn)生利息、滯納金或超限費的持卡人應(yīng)該是存在逾期風(fēng)險性的客戶。如果在一個統(tǒng)計期內(nèi)一個持卡人多次逾期,則該持卡人是高風(fēng)險客戶。
(二)持卡人的疑似套現(xiàn)交易風(fēng)險判斷方法
“信用卡套現(xiàn)”是指持卡人違反與發(fā)卡機(jī)構(gòu)的約定,不是通過正常合法的手續(xù)(ATM或柜臺)提取現(xiàn)金,而是通過POS終端或其他不正當(dāng)?shù)氖侄螌⑿庞每ㄖ械男庞妙~度全部或部分地直接轉(zhuǎn)換成現(xiàn)金,表面上是在用信用卡刷卡消費,實際上以此來逃避信用卡提現(xiàn)的高額利息費用,同時又不支付銀行提現(xiàn)費用的行為[12-14]。信用卡套現(xiàn)的行為,相當(dāng)于持卡人獲得了一筆沒有利息的貸款,造成銀行收益與風(fēng)險不匹配,擴(kuò)大了銀行的經(jīng)營風(fēng)險,嚴(yán)重影響了信用卡市場的健康發(fā)展。因此信用卡套現(xiàn)是信用卡產(chǎn)業(yè)面臨的一種主要欺詐風(fēng)險,我國刑法和相關(guān)金融法規(guī)將其界定為一種違法行為[13]。
就目前來說,信用卡套現(xiàn)主要有兩種方式:一種是通過商家POS機(jī)套現(xiàn);另一種是通過淘寶網(wǎng)的支付寶套現(xiàn)[12]。不管通過哪種方式套現(xiàn),信用卡持卡人受利益驅(qū)動,都是以盡量長時間、無息高額占用銀行資金為目的。例如,一張卡經(jīng)常在同一商戶滿額消費,同一商戶經(jīng)常固定的卡滿額消費,一張卡在免息期前幾天滿額消費,經(jīng)常在低費率商戶滿額消費,一張卡連續(xù)或多次逾期(即還款日未按時還款),同一商戶在短期內(nèi)(如每隔一分鐘)連續(xù)發(fā)生交易,同一單位持卡人在同一商戶同時發(fā)生大額交易等。
在銀行的信用卡交易數(shù)據(jù)中,卡的逾期風(fēng)險往往很容易發(fā)現(xiàn),而信用卡套現(xiàn)行為相對隱蔽,不易發(fā)現(xiàn)。已有不少研究者提出了一些疑似套現(xiàn)交易的判定模型或指標(biāo)。例如姜盛(2009)[13]提出了基于Logistic的信用卡套現(xiàn)偵測評分模型,周洋(2009)[12]提出了一個基于四個變量的加權(quán)評分判定方法,耿晨星(2011)提出了基于個人信用卡消費分析的客戶分類指標(biāo)來判斷套現(xiàn)行為的方法。這里采用耿晨星提出的指標(biāo)判定方法。這是一種相對簡單有效的方法,通過持卡人占用銀行資金的指標(biāo)的計算和時間序列分析來判定疑似套現(xiàn)的交易行為。描述如下:
其在一個還款周期內(nèi)對銀行資金的占有率為:
如果一個持卡人的日消費序列為:K,0,0,…,0,則資金占有率μ=1,如果持卡人連續(xù)幾個月的資金占有率接近1,則存在疑似套現(xiàn)行為。
(三)融入風(fēng)險測量的RFMDA模型
RFM模型在客戶的價值判定和細(xì)分上已被很多研究證明是有效的。本研究利用RFM模型,將信用卡持卡人在用卡過程中產(chǎn)生的逾期風(fēng)險和套現(xiàn)風(fēng)險考慮進(jìn)來。如上所述,逾期風(fēng)險是已知的風(fēng)險,信用卡持卡人的拖欠金額是不同的,所產(chǎn)生的風(fēng)險也是不同的,本研究用統(tǒng)計期內(nèi)的拖欠總金額(Default Value)來表示逾期風(fēng)險。疑似套現(xiàn)風(fēng)險是隱藏的,只要信用卡持卡人在還款日前將疑似套現(xiàn)的金額還清,將不會產(chǎn)生利息或滯納金,如果持卡人在統(tǒng)計期內(nèi)產(chǎn)生了多次疑似套現(xiàn)現(xiàn)象,則其套現(xiàn)風(fēng)險較高。因為不同持卡人的信用額度不同,本研究用統(tǒng)計期內(nèi)的疑似套現(xiàn)總金額(Arbitrage Value)來表示這種風(fēng)險。從而對于每一個持卡人可以形成5類特征,分別是R(最近消費時間)、F(消費頻率)、M(總消費金額)、D(總拖欠金額)和A(總套現(xiàn)金額)。
持卡人5類特征的計算方法見圖1。R、F和M三類特征的計算方法仍采用RFM模型中的方法。首先進(jìn)行排序,然后將數(shù)據(jù)劃分為信用卡客戶數(shù)量相等的5個部分,并按照RFM模型的要求為每一部分的客戶賦值1—5的數(shù)字。其中,按最近消費時間排序時,離現(xiàn)在時間最遠(yuǎn)的一組客戶賦值1,然后依次賦值2、3、4,最近的一組客戶賦值5,記賦值后的數(shù)據(jù)為R;對于消費頻率和總消費金額,則排序后數(shù)值最小的一組客戶賦值1,然后,2、3、4,頻率和金額數(shù)值最大的一組客戶賦值5,記賦值后的數(shù)據(jù)為F和M。這樣處理后,R、F和M的取值范圍都是{} 1,2,3,4,5,從而R、F和M越高的持卡人,其價值越高。
D和A兩類特征的計算中,未產(chǎn)生拖欠的持卡人D值為0,未產(chǎn)生疑似套現(xiàn)交易的持卡人A值為0,其他的持卡人D、A特征值的計算采用RFM特征計算類似的處理方法,即按照拖欠金額、疑似套現(xiàn)金額從大到小排序,然后均分為5個組,金額最大的特征值為5,金額最小的特征值為1。這樣,D為5的逾期風(fēng)險最高,A為5的套現(xiàn)風(fēng)險最高。
圖1 RFMDA模型特征計算方法
基于這種特征計算方法,R、F和M值均高的持卡人為高價值客戶,均低的為低價值客戶;同樣,D和A值均高的為高風(fēng)險客戶,均低的為低風(fēng)險客戶?;谛庞每ǔ挚ㄈ说?類特征,構(gòu)建如下的細(xì)分模型,見圖2。
該細(xì)分模型工作流程如下:首先利用持卡人交易數(shù)據(jù)計算每一個持卡人的最近消費時間、消費頻率、消費總額、拖欠總額和疑似套現(xiàn)總額,然后利用這些數(shù)據(jù)形成每個持卡人的R、F、M、D和A特征值,其中R、F和M的值是1—5之間,而D和A的值是0—5之間。利用持卡人的消費特征,調(diào)用K-means聚類算法將持卡人聚為9個簇。
圖2 信用卡持卡人細(xì)分模型
(四)客戶分類
利用RFMDA模型,本研究可以將所有的持卡人聚類為9個簇。每一個簇的質(zhì)心同樣對應(yīng)了5類特征,通過這些特征的分析,可以按照客戶的價值和風(fēng)險將客戶分為9類(見圖3),即高價值-低風(fēng)險、高價值-中風(fēng)險、高價值-高風(fēng)險、中價值-低風(fēng)險、中價值-中風(fēng)險、中價值-高風(fēng)險、低價值-低風(fēng)險、低價值-中風(fēng)險、低價值-高風(fēng)險。
圖3 信用卡持卡人的細(xì)分類別
在細(xì)分后,發(fā)卡機(jī)構(gòu)可針對不對類別的信用卡持卡人提供不同類別的服務(wù),在有限的營銷資源約束條件下,達(dá)到較好的客戶服務(wù)效果。例如,“高價值-低風(fēng)險”類持卡人是銀行最優(yōu)質(zhì)的客戶,當(dāng)然要配以最好的服務(wù),收取最低的費用;而“低價值-高風(fēng)險”類持卡人是需要剔除出去的客戶或者需要進(jìn)行信用額度降級并收取高額管理服務(wù)費用的客戶。
(一)數(shù)據(jù)獲取
為了對模型進(jìn)行驗證,選擇某商業(yè)銀行的2014年1月和2月到期的信用卡數(shù)據(jù),隨機(jī)挑選了403張信用卡的用戶信息,并從受到監(jiān)控被降額的信用卡中隨機(jī)挑選了50張風(fēng)險信用卡的用戶信息,然后提取了以上453張卡片兩年的交易明細(xì)數(shù)據(jù)(2012年1月1日—2013年12月31日)作為分析的數(shù)據(jù)。
獲取的信用卡持卡人交易明細(xì)數(shù)據(jù)中,與本研究有關(guān)的字段及說明如下:
根據(jù)借貸方向代碼和交易描述字段,可以判斷一項交易是否為信用卡消費交易。本研究對借貸方向代碼為1(支出)的交易數(shù)據(jù)的交易描述(交易類型)字段進(jìn)行了匯總,發(fā)現(xiàn)以下交易描述不屬于消費類型的交易:
表1 信用卡持卡人交易明細(xì)數(shù)據(jù)中的相關(guān)字段及說明
ATM取款、柜面取款、跨行取款、轉(zhuǎn)賬、自助轉(zhuǎn)賬、ATM轉(zhuǎn)賬、POS轉(zhuǎn)賬、網(wǎng)上銀行轉(zhuǎn)賬、代理業(yè)務(wù)轉(zhuǎn)賬、表內(nèi)轉(zhuǎn)表外、透支利息、沖減利息、滯納金、沖減滯納金、扣收滯納金、分期付款到期扣款(分期付款扣款)、提前還款、年費扣收(年費及批量換卡費)、個人普通卡年費、個人賬戶轉(zhuǎn)賬、個結(jié)、個人同城匯款、購匯還款、收卡、掛失止付。
將以上交易類型的數(shù)據(jù)排除后,剩余的交易類型均是信用卡消費交易,這些交易的交易描述如下:網(wǎng)上銀行消費、跨行消費、POS消費、預(yù)授權(quán)確認(rèn)、自助消費、支付寶、預(yù)授權(quán)確認(rèn)(跨行)、消費、跨行支付手續(xù)費、自駕定金、境外消費、費用、繳罰、PP卡收費、高速罰款、POS充值、訂購消費。
在借貸方向代碼為1的交易數(shù)據(jù)中,把交易描述為透支利息、沖減利息、滯納金、沖減滯納金、扣收滯納金等的數(shù)據(jù)確定為拖欠金額統(tǒng)計數(shù)據(jù),因為獲取的數(shù)據(jù)中沖減利息和沖減滯納金的入賬金額用負(fù)號表示,因此在統(tǒng)計時不需另外處理。
從獲取的卡信息數(shù)據(jù)中,包含每一個信用卡的信貸額度數(shù)據(jù)。在判斷信用卡的交易行為是否疑似套現(xiàn)交易時,本研究沒有采用滿額度消費判斷的方法,而是只要一個信用卡當(dāng)月的消費交易金額超過了信貸額度的90%,認(rèn)為該卡存在疑似套現(xiàn)的問題,并將涉及的金額作為疑似套現(xiàn)金額進(jìn)行統(tǒng)計。
在經(jīng)過以上處理后,對信用卡消費交易數(shù)據(jù)進(jìn)行進(jìn)一步處理,分別計算了每個信用卡持卡人的最近消費時間(Recency)、消費頻率(Frequency)、總消費金額(Monetary Value)、拖欠總金額(Default Value)和疑似套現(xiàn)總金額(Arbitrage Value)五類數(shù)據(jù)。按照RFMDA模型的持卡人五類特征值數(shù)據(jù)生成的方法,生成了每一個持卡人的五個特征值,其中R、F和M三個特征值的取值為{1,2,3,4,5} ,D和A兩個特征值的取值為{0,1,2,3,4,5}。
(二)RFM模型實驗
為了證明傳統(tǒng)的RFM模型在信用卡細(xì)分客戶方面的缺陷,本研究以信用卡持卡人的R、F、M值為特征,調(diào)用K-means++算法進(jìn)行了聚類。在這個細(xì)分中,不考慮客戶的風(fēng)險,將453名持卡人劃分為高價值客戶、中價值客戶和低價值客戶。在執(zhí)行K-means++算法時,設(shè)聚類簇數(shù)k=3,將所有信用卡持卡人聚為3簇。聚類結(jié)果見表2,表中的R、F和M分別對應(yīng)了三個簇的聚類中心特征值。
表2 RFM模型三類簇的中心特征值
按照RFM模型的數(shù)據(jù)處理方法,R、F和M越高,對應(yīng)的客戶價值越大,因此簇1聚類中心的特征值在三個簇中相比最低,RFM值都在1—1.4之間,代表了低價值客戶;簇0聚類中心的特征值在三個簇中居于中間水平,RFM在2.7—3.2之間,代表了中價值客戶;簇2聚類中心的特征值在三個簇中居于最高水平,RFM值在4.0—4.5之間,代表了高價值客戶。本研究對各個簇包含的客戶數(shù)量及包含的風(fēng)險客戶數(shù)量進(jìn)行了統(tǒng)計,統(tǒng)計結(jié)果見表3。
表3 RFM細(xì)分模型實驗中各類持卡人的數(shù)量及包含的風(fēng)險客戶數(shù)量
高價值類別持卡人數(shù)量共159名,50名已監(jiān)控確定存在風(fēng)險的持卡人中的43名(86%)被劃分到該類別中,這些存在風(fēng)險的持卡人占整個高價值持卡人的27.4%。中價值持卡人共171名,剩余的7名監(jiān)控確定存在風(fēng)險的持卡人則都被劃分到該類中,占整個中價值持卡人的4.09%。低價值類別持卡人數(shù)量共123名,沒有一個風(fēng)險卡被劃入低價值類別中??梢钥闯?,如果不考慮風(fēng)險因素,按照RFM模型進(jìn)行持卡人細(xì)分,則大多數(shù)風(fēng)險持卡人(86%)會被劃入高價值持卡人類別中,風(fēng)險持卡人幾乎不會被劃分到低價值持卡人類別。如按照這樣的結(jié)果進(jìn)行細(xì)分,不但可能造成銀行營銷資金的浪費,而且有可能造成很大的損失。進(jìn)一步,本研究對三個聚類簇的純度和整體聚類純度進(jìn)行了計算,結(jié)果見表4。
表4 RFM模型聚類效果的評價
可見,低價值和中價值持卡人類簇的純度較高,分別為100%和95.90%,但高價值持卡人類簇的純度只有72.96%,整體的聚類純度為88.96%。
(三)RFMDA模型實驗
以信用卡持卡人的R、F、M、D、A五類數(shù)據(jù)為特征值,調(diào)用K-means++聚類算法對持卡人進(jìn)行劃分。這里要按照價值的高中低和風(fēng)險的高中低將持卡人劃分為9類,設(shè)置聚類數(shù)量K=9,聚類后得到9個簇,各簇代號及聚類中心的5個特征值見表5。
表5 RFMDA模型聚類結(jié)果
按照五類特征值的定義方法,R、F和M三個特征值越高,持卡人的價值越大,反之價值越??;D和A兩個特征值越高,則持卡人的風(fēng)險越高,反之風(fēng)險越低。通過各聚類中心的特征值,發(fā)現(xiàn)簇0、4和7的RFM值相比來說比較高,其中R值位于3.75—4.1之間,F(xiàn)值位于4.1—4.5之間,M值位于3.5—4.9之間,可以把這三個簇的持卡人認(rèn)為是高價值客戶。在這3個簇中,簇4的D值和A值相比較高,其中D值大于4.5,A值大于4.1,因此可以認(rèn)為簇4為“高價值-高風(fēng)險”持卡人;簇0的D值和A值居于中間,其中D值雖然?。?.21428571),但A值很高(4.41071429),因此簇0劃分為“高價值-中風(fēng)險”類持卡人;簇7的D值和A值均很低,劃分為“高價值-低風(fēng)險”類持卡人?;陬愃频姆治觯梢园汛?、3和5劃分為中價值類持卡人,再根據(jù)D和A指示的風(fēng)險情況,把簇3劃分為“中價值-高風(fēng)險”類別,簇5劃分為“中價值-中風(fēng)險”類別,簇1劃分為“中價值-低風(fēng)險”類別。最后把簇6劃分為“低價值-高風(fēng)險”類別,簇8劃分為“低價值-中風(fēng)險”類別,簇2劃分為“低價值-低風(fēng)險”類別。需要說明的是簇6和簇8的劃分需要根據(jù)銀行的管理準(zhǔn)則,因為拖欠行為是已知風(fēng)險,而疑似套現(xiàn)是潛在風(fēng)險,如果銀行更關(guān)注已知風(fēng)險,則會因為簇6的D值高(3.2962963)將該簇劃分為高風(fēng)險,而把簇8劃分為中風(fēng)險類別;如果銀行更關(guān)注潛在風(fēng)險,則會因為簇8的A值高(3.04255319)將該簇劃分為高風(fēng)險類別。這里采用的是前者,即重視已知風(fēng)險。經(jīng)過這樣的劃分后,各個簇對應(yīng)的信用卡持卡人類別如下(表6):
表6 RFMDA細(xì)分模型信用卡持卡人分類及對應(yīng)的聚類號
本研究對各個類別下的信用卡持卡人數(shù)量以及每個類別中已經(jīng)確認(rèn)監(jiān)控風(fēng)險的持卡人數(shù)量進(jìn)行了統(tǒng)計,計算了風(fēng)險卡在持卡人類別中的占比,以及各類別中風(fēng)險卡占總風(fēng)險卡的比例,結(jié)果見表7。
表7 RFMDA細(xì)分模型各類持卡人的數(shù)量及包含的風(fēng)險客戶數(shù)量
可以看到,風(fēng)險卡沒有1個被劃分到低風(fēng)險的類別中,大多數(shù)的風(fēng)險卡被劃分到“高價值-中風(fēng)險”類別(31張,占比55.36%)和“高價值-高風(fēng)險”類別(12張,占比42.86%),剩余的風(fēng)險卡有5張被劃分到“低價值-中風(fēng)險”類別,1張被劃分到“中價值-高風(fēng)險”類別,1張被劃分到“中價值-中風(fēng)險”類別。這樣的細(xì)分綜合考慮了持卡人的價值和風(fēng)險,為商業(yè)銀行的管理提供了有用的信息,可以有效地避免將高風(fēng)險持卡人單純劃分為高價值類別帶來的營銷損失和潛在的風(fēng)險。
同樣,為了和RFM模型實驗結(jié)果進(jìn)行對比,本研究對這9個聚類簇的純度和整體聚類純度進(jìn)行了計算,結(jié)果見表8??梢姡恕案邇r值、高風(fēng)險”和“高價值、中風(fēng)險”的類簇純度較低外,其他類簇的純度較高。整體聚類純度為90.29%,和RFM模型相比,純度得到了提升。
表8 RFMDA模型聚類效果的評價
本研究的創(chuàng)新之處在于利用信用卡客戶消費數(shù)據(jù)構(gòu)建了一個融合客戶價值和風(fēng)險因素的信用卡持卡人細(xì)分模型。提出的模型以RFM價值評估模型為基礎(chǔ),將信用卡持卡人的逾期風(fēng)險和套現(xiàn)風(fēng)險作為細(xì)分變量引入,構(gòu)建了RFMDA細(xì)分模型。為了對信用卡持卡人進(jìn)行細(xì)分,研究選取了信用卡持卡人的5類交易數(shù)據(jù),即最近消費時間(Recency)、消費頻率(Frequency)、總消費金額(Monetary Value)、拖欠總金額(Default Value)和疑似套現(xiàn)總金額(Arbitrage Value),經(jīng)過處理后形成信用卡持卡人的5類交易特征,采用K-means++算法進(jìn)行聚類,根據(jù)每個聚類簇的質(zhì)心的交易特征確定所代表的信用卡持卡人類別,按照持卡人的價值高、中、低和風(fēng)險高、中、低,將持卡人分為9個細(xì)分類別,為商業(yè)銀行對不同類別的信用卡持卡人開展市場營銷策略提供依據(jù)。
通過將RFMDA模型與RFM模型進(jìn)行對比,發(fā)現(xiàn)在不考慮風(fēng)險因素時,RFM價值評估模型會將大多數(shù)風(fēng)險卡劃分到高價值持卡人類別中,給商業(yè)銀行的管理帶來威脅,可能給經(jīng)營帶來很大的損失。而考慮風(fēng)險因素的RFMDA模型則將大多數(shù)風(fēng)險卡劃分到高價值-中風(fēng)險和高價值-高風(fēng)險類別中,未將風(fēng)險卡劃分到低風(fēng)險類別中,這為銀行開展有效的營銷活動提供了有用的信息,能有效地防范風(fēng)險。
但是本研究同樣也存在一些缺陷,首先為了簡便處理,本研究在價值和風(fēng)險維度上只采用了高、中、低三級分類,并沒有進(jìn)行更細(xì)致的劃分。其次在持卡人的風(fēng)險上,本研究只考慮了逾期風(fēng)險和套現(xiàn)風(fēng)險,沒有考慮別的風(fēng)險,而且逾期拖欠風(fēng)險、疑似套現(xiàn)交易采用了較簡單的判定方法,沒有采用其他的方法進(jìn)行對比研究。另外,在數(shù)據(jù)處理上,沒有考慮到持卡人消費后退貨退款的情況,對一些數(shù)據(jù)進(jìn)行了簡單化處理。這些缺陷也是后續(xù)研究對模型和方法進(jìn)行改進(jìn)的方向。
[1]Saunders A,Ailen L.Credit Risk Measurement: New Approaches to Value at Risk and other Paradigms [M].USA:John Wiley&Sons,1999.
[2]Duman E,Atiya A.Using Social Networks for On-line Credit Card Fraud Analysis[J].Use of Risk Analysis in Computer-Aided Persuasion,2011,88:60.
[3]Subashini B,Chitra K.Enhanced System for Revealing Fraudulence in Credit Card Approval[J].International Journal of Engineering,2013,2(8).
[4]陳明亮,李懷祖.客戶價值細(xì)分與保持策略研究[J].成組技術(shù)與生產(chǎn)現(xiàn)代化,2001,18(4):23-27.
[5]陳靜宇.客戶價值分析與客戶價值細(xì)分模型研究[J].生產(chǎn)力研究,2007,(16):60-61.
[6]賀昌政,孔力.基于CLV要素的信用卡客戶細(xì)分模型[J].統(tǒng)計與決策,2013,(11):183-185.
[7]鄒鵬,莫佳卉,江亦華,等.基于代價敏感決策樹的客戶價值細(xì)分[J].管理科學(xué),2011,24(2):20-29.
[8]劉朝華,梅強(qiáng),蔡淑琴.基于RFM的客戶分類及價值評價模型[J].技術(shù)經(jīng)濟(jì)與管理研究,2012,(5):33-36.
[9]王娜.基于相關(guān)度關(guān)聯(lián)分類算法的信用卡客戶細(xì)分模型研究[D].杭州:浙江工商大學(xué),2010.
[10]陳為民,張小勇,馬超群.基于數(shù)據(jù)挖掘的持卡人信用風(fēng)險管理研究[J].財經(jīng)理論與實踐,2012,33(179):36-40.
[11]蔣慶軍.信用卡客戶分類探析[J].中國信用卡(專業(yè)),2009,(7):43-45.
[12]周洋.數(shù)據(jù)挖掘技術(shù)在檢測信用卡套現(xiàn)上的應(yīng)用[J].企業(yè)導(dǎo)報,2009,(5):189-190.
[13]姜盛.基于Logistic的信用卡套現(xiàn)偵測評分模型[J].計算機(jī)應(yīng)用,2009,29(1):3088-1091,2095.
[14]岳東學(xué).信用卡套現(xiàn)行為剖析及防范對策[J].金融科技時代,2012,(4):91-92.
(責(zé)任編輯:賈偉)
1003-4625(2014)09-0023-06
F832.479
A
2014-07-25
杜云生(1969-),男,河南葉縣人,博士研究生,高級工程師。