摘 要:商業(yè)銀行在信用卡營(yíng)銷的過(guò)程中,面臨著存量客戶流失的嚴(yán)峻問(wèn)題。通過(guò)數(shù)據(jù)挖掘?qū)α魇У目蛻暨M(jìn)行分析,不僅能挽留可能流失的客戶,也可以使商業(yè)銀行有針對(duì)性地優(yōu)化產(chǎn)品、提升管理。文章利用決策樹(shù)算法建立信用卡客戶流失預(yù)測(cè)模型,對(duì)信用卡流失客戶進(jìn)行預(yù)測(cè)。經(jīng)過(guò)測(cè)試,模型運(yùn)行效果良好,具有較好的客戶管理意義。
關(guān)鍵詞:信用卡;客戶關(guān)系管理;決策樹(shù);流失預(yù)測(cè)
中圖分類號(hào):F832.4;F224-3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-6432(2022)08-0049-04
DOI:10.13939/j.cnki.zgsc.2022.08.049
近年來(lái),不少商業(yè)銀行的業(yè)務(wù)重心已從公司業(yè)務(wù)向零售業(yè)務(wù)轉(zhuǎn)移。公司業(yè)務(wù)客戶集中,產(chǎn)品偏個(gè)性化,受宏觀經(jīng)濟(jì)、政策導(dǎo)向及個(gè)別客戶業(yè)務(wù)波動(dòng)影響大;而零售業(yè)務(wù)小而分散,產(chǎn)品相對(duì)標(biāo)準(zhǔn)化,批量營(yíng)銷、維護(hù),行業(yè)分布貼近民生,周期性弱,受市場(chǎng)影響小,基礎(chǔ)客群較為穩(wěn)定。部分轉(zhuǎn)型的商業(yè)銀行中,零售業(yè)務(wù)創(chuàng)造的營(yíng)業(yè)收入比重過(guò)半,已超過(guò)公司業(yè)務(wù)的營(yíng)業(yè)收入,零售業(yè)務(wù)在商業(yè)銀行中的地位逐漸凸顯。
而信用卡作為零售業(yè)務(wù)的“排頭兵”,在銀行零售業(yè)務(wù)的發(fā)展過(guò)程中占有舉足輕重的地位。信用卡業(yè)務(wù)的前期推廣需要大量人力、物力的投入來(lái)占領(lǐng)市場(chǎng),構(gòu)建信用卡生態(tài)圈,同業(yè)間競(jìng)爭(zhēng)非常激烈。
隨著互聯(lián)網(wǎng)金融的快速發(fā)展,各大網(wǎng)絡(luò)平臺(tái)也陸續(xù)推出了花唄、京東白條等類信用卡產(chǎn)品。這些互聯(lián)網(wǎng)平臺(tái)不僅有著天然的消費(fèi)場(chǎng)景,而且結(jié)合大數(shù)據(jù)的優(yōu)勢(shì),利用金融科技對(duì)消費(fèi)客戶進(jìn)行精準(zhǔn)營(yíng)銷,無(wú)論營(yíng)銷的覆蓋面,還是精準(zhǔn)度都大大優(yōu)于傳統(tǒng)商業(yè)銀行,使得信用卡市場(chǎng)競(jìng)爭(zhēng)更加激烈。
1 背景
就商業(yè)銀行而言,信用卡新客營(yíng)銷的難度和成本遠(yuǎn)大于存量客戶的挽留成本。信用卡新客戶的營(yíng)銷難度逐年加大,需要由專業(yè)的團(tuán)隊(duì)發(fā)掘客戶需求、產(chǎn)品準(zhǔn)確推送并做好相關(guān)的售后服務(wù),同時(shí)還會(huì)面臨同質(zhì)產(chǎn)品的競(jìng)爭(zhēng),現(xiàn)在營(yíng)銷往往還會(huì)借助場(chǎng)景的搭建。而信用卡的存量客戶已和銀行建立了業(yè)務(wù)關(guān)系,只需了解客戶流失的原因,設(shè)計(jì)有針對(duì)性的挽留方案,重新激活客戶需求(李偉等,2019)。
G銀行的信用卡銷戶概念包括兩類:銀行根據(jù)一定的規(guī)則主動(dòng)銷戶和客戶主動(dòng)銷戶。銷戶的原因很多,在整個(gè)信用卡業(yè)務(wù)周期的過(guò)程中都有可能產(chǎn)生銷戶行為。
G銀行對(duì)于停滯客戶會(huì)定期進(jìn)行提取,然后給這批停滯客戶發(fā)短信進(jìn)行觸動(dòng),如果沒(méi)有效果,會(huì)集中進(jìn)行銷戶處理。如果客戶主動(dòng)打電話要求銷戶,G銀行會(huì)安排銷戶挽留,通常客服人員會(huì)在電話中對(duì)要求銷戶的客戶進(jìn)行挽留。
目前,G銀行每年信用卡的銷戶量超過(guò)5萬(wàn),G銀行只有在客戶提出申請(qǐng)銷戶,或者客戶滿足銀行主動(dòng)銷戶規(guī)則的時(shí)候,G銀行才會(huì)安排銷戶挽留。由于無(wú)法對(duì)客戶是否流失進(jìn)行預(yù)測(cè),因此銷戶挽留沒(méi)有提前量。
2 理論基礎(chǔ)
2.1 數(shù)據(jù)挖掘理論
現(xiàn)今的信息化社會(huì),數(shù)字生活已滲透各個(gè)角落,人們的生產(chǎn)、生活中留下了各式各樣的數(shù)據(jù)。數(shù)據(jù)挖掘就是將生活中的數(shù)據(jù)刪減、填補(bǔ)、清洗后,將參差不齊的信息整理為具備分析意義的基礎(chǔ)數(shù)據(jù),從中提取有價(jià)值的數(shù)據(jù),尋找內(nèi)部規(guī)律,發(fā)掘隱藏含義,作為決策或者預(yù)測(cè)的依據(jù)。
金融、電信、醫(yī)療等行業(yè)擁有龐大的客戶信息,具備數(shù)據(jù)挖掘的先天優(yōu)勢(shì)。特別是銀行業(yè),隨著金融科技的全面推廣,不少商業(yè)銀行已將大數(shù)據(jù)、區(qū)塊鏈、人工智能等科技手段融入到零售業(yè)務(wù)的管理中,及時(shí)在市場(chǎng)中搶占了技術(shù)優(yōu)勢(shì)。
2.2 客戶關(guān)系管理理論
客戶關(guān)系管理(簡(jiǎn)稱CRM)原本是企業(yè)生產(chǎn)經(jīng)營(yíng)中的一個(gè)概念,指企業(yè)不應(yīng)僅以簡(jiǎn)單的產(chǎn)品銷售為目的,而更強(qiáng)調(diào)以客戶為中心的一系列綜合服務(wù)方案。提出企業(yè)應(yīng)通過(guò)現(xiàn)代的信息技術(shù)和科技手段,在生產(chǎn)、銷售和服務(wù)等方面提升自己的經(jīng)營(yíng)管理能力,為客戶提供差別化的個(gè)性服務(wù),提高客戶的滿意度,實(shí)現(xiàn)收益的最大化。
降低客戶流失率,更是客戶關(guān)系管理的基礎(chǔ)要求。提前對(duì)可能流失的客戶進(jìn)行預(yù)測(cè),根據(jù)不同客戶的特征,分別制訂個(gè)性化的客戶關(guān)懷和挽留策略。后臺(tái)服務(wù)創(chuàng)造的價(jià)值,可以超過(guò)前臺(tái)營(yíng)銷,企業(yè)綜合管理能力的提升可以帶來(lái)“雙贏”的良好局面。
3 實(shí)證研究
3.1 樣本數(shù)據(jù)
樣本數(shù)據(jù)是指客戶主動(dòng)聯(lián)系銀行“申請(qǐng)銷戶”或者銀行發(fā)起執(zhí)行“申請(qǐng)銷戶”的動(dòng)作,即可定義為“流失”;對(duì)應(yīng)的流失時(shí)間分別為客戶主動(dòng)“申請(qǐng)銷戶”的時(shí)間或者銀行執(zhí)行“申請(qǐng)銷戶”的時(shí)間。流失客戶在樣本數(shù)據(jù)中定義為正樣本。
與流失客戶對(duì)照的是非流失客戶,取某個(gè)時(shí)間點(diǎn)上,其觀察期內(nèi)沒(méi)有流失,同時(shí)在表現(xiàn)期內(nèi)有完整的行為數(shù)據(jù)的客戶,即為非流失客戶。非流失客戶在樣本數(shù)據(jù)中定義為負(fù)樣本。
樣本數(shù)據(jù)從基礎(chǔ)數(shù)據(jù)中抽取2019年和2020年部分行為數(shù)據(jù),觀察期定為6個(gè)月,取2019年10月1日至2020年9月30日的流失客戶構(gòu)成正樣本,取2019年10月1日的非流失客戶作為負(fù)樣本,構(gòu)成整個(gè)樣本數(shù)據(jù)。
基于當(dāng)前數(shù)據(jù),選擇6個(gè)觀察點(diǎn)來(lái)設(shè)定觀察期和表現(xiàn)期的時(shí)間窗口,6份正樣本的流失客戶在觀察期內(nèi)都沒(méi)有流失,但在表現(xiàn)期內(nèi)逐漸申請(qǐng)銷戶或者由銀行進(jìn)行批量銷戶,見(jiàn)表1。通過(guò)觀察正樣本的消費(fèi)、取現(xiàn)、還款、查詢行為的次數(shù)、金額、時(shí)間等趨勢(shì)變化,同時(shí)有條件的判斷客戶的投訴、違約、遲繳、爭(zhēng)議賬等行為來(lái)預(yù)測(cè)我行客戶流失(鄧致,2019)。
基于2019年10月1日至2020年9月30日的銷戶客戶數(shù)據(jù)統(tǒng)計(jì)個(gè)人流失客戶,剔除其中的高端卡客戶、測(cè)試客戶、銀行內(nèi)部客戶等
3.2 變量選擇
基于對(duì)本次業(yè)務(wù)需求,建模過(guò)程中需要用到信用卡客戶的屬性特征及價(jià)值特征,通過(guò)對(duì)G銀行信用卡中心客戶信息的分析,從數(shù)據(jù)源中選取的變量主要包括以下四類:①個(gè)人基本信息:性別、年齡、職業(yè)、學(xué)歷、戶籍、婚姻等;②卡基本信息:最高卡齡、持有卡數(shù)以及信用額度等;③客戶流失信息:是否流失標(biāo)識(shí)、流失時(shí)間、是否主動(dòng)流失等信息;④客戶行為信息:消費(fèi)、轉(zhuǎn)賬、還款等行為信息,最近查詢間隔天數(shù)等信息。
對(duì)以上幾類的變量進(jìn)行篩選,從中選取客戶畫(huà)像特征明顯、卡類信息差別性較大,具有典型客戶行為動(dòng)作,對(duì)可能導(dǎo)致未來(lái)客戶流失關(guān)系較大的變量,剔除關(guān)聯(lián)性弱,不具備分析意義的維度。
精簡(jiǎn)分析變量,盡量減少其他數(shù)據(jù)的干擾性,從中選取43個(gè)有代表性的寬表變量,作為模型分析數(shù)據(jù)。其中部分寬表變量如表2所示(程勇等,2019)。
3.3 確定算法
信用卡客戶流失預(yù)測(cè)模型的目的是在客戶提出申請(qǐng)銷戶或者滿足銷戶規(guī)則之前及早的預(yù)測(cè)到客戶流失,即可以將客戶服務(wù)與關(guān)懷提前,從而降低客戶銷戶率。故根據(jù)客戶屬性特征及過(guò)去一段時(shí)間內(nèi)的行為特征,預(yù)測(cè)信用卡客戶在未來(lái)一段時(shí)間內(nèi)流失的可能性是建模需求的核心。
在對(duì)特征變量初步分析后,用數(shù)據(jù)分析工具SPSS提供的模型進(jìn)行訓(xùn)練和測(cè)試,分別選擇決策樹(shù)和神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,通過(guò)對(duì)其結(jié)果進(jìn)行比較,發(fā)現(xiàn)決策樹(shù)具有較好的性能并且容易理解,因此選擇決策樹(shù)C5.0作為預(yù)測(cè)模型 (張宇等,2015)。
決策樹(shù)的圖形表示是一種倒樹(shù)形的結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)表示一個(gè)屬性上的判斷,每個(gè)分支代表一個(gè)判斷結(jié)果的輸出,最后每個(gè)葉節(jié)點(diǎn)代表一種分類結(jié)果。通過(guò)學(xué)習(xí)樣本得到一個(gè)決策樹(shù),這個(gè)決策樹(shù)能夠?qū)π碌臄?shù)據(jù)給出正確的分類。決策樹(shù)C5.0是基于C4.5算法的升級(jí),更適用于數(shù)據(jù)挖掘。在模型建立階段使用代價(jià)矩陣調(diào)整置信率,同時(shí)使用Boosting技術(shù)多次迭代以調(diào)整樣本權(quán)重,提高了模型預(yù)測(cè)的準(zhǔn)確性。
3.4 模型建立
基于確定的樣本數(shù)據(jù)庫(kù),利用SPSS數(shù)據(jù)分析工具構(gòu)建決策樹(shù)信用卡客戶流失預(yù)測(cè)模型,模型的應(yīng)變量為“是否流失標(biāo)識(shí)”,其定義如表3所示。
由于主動(dòng)申請(qǐng)銷戶的客戶數(shù)量過(guò)少,因此在建模過(guò)程中不區(qū)分主動(dòng)或者被動(dòng)銷戶,只考慮流失客戶。另外,未來(lái)保證非流失客戶在觀察期內(nèi)有完整的行為數(shù)據(jù),因此非流失客戶需要成為信用卡客戶半年以上。
模型訓(xùn)練前,先根據(jù)上述是否流失標(biāo)識(shí)定義做樣本數(shù)據(jù)的選擇。選擇流失與正常的客戶如表4所示。
隨機(jī)選定70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),剩余30%的數(shù)據(jù)作為測(cè)試數(shù)據(jù),分布如表5所示。
在進(jìn)行模型訓(xùn)練的時(shí)候,對(duì)數(shù)據(jù)進(jìn)行了處理加工,先使用特征選擇節(jié)點(diǎn)進(jìn)行特征選擇,然后使用不同的模型進(jìn)行訓(xùn)練并比較了模型訓(xùn)練的結(jié)果。
對(duì)于分類模型,判定模型結(jié)果好壞的指標(biāo)有精確率、召回率和F測(cè)度,其公式如下:
精確率=模型預(yù)測(cè)為正且實(shí)際為正的樣本數(shù)量模型預(yù)測(cè)為正的樣本數(shù)量(1)
召回率=模型預(yù)測(cè)為正且實(shí)際為正的樣本數(shù)量實(shí)際為正的樣本數(shù)量(2)
F測(cè)度=2×精確率×召回率精確率+召回率(3)
在實(shí)際業(yè)務(wù)開(kāi)展中,特別是流失預(yù)測(cè)模型中,需要提高模型的覆蓋率,以盡可能的識(shí)別所有可能流失的客戶,同時(shí)需要提高模型的精確度。在模型訓(xùn)練過(guò)程中設(shè)置不同的代價(jià)矩陣來(lái)獲得不同的模型性能。在默認(rèn)設(shè)置下精確度達(dá)到0.76以上,但是只覆蓋0.43左右的可能流失的客戶。
對(duì)業(yè)務(wù)部門(mén)來(lái)講,可以在市場(chǎng)營(yíng)銷活動(dòng)的時(shí)候覆蓋盡可能多的可能流失的客戶。這時(shí)候,需要訓(xùn)練模型進(jìn)一步提高其召回率,通過(guò)調(diào)整模型的代價(jià)函數(shù),使模型的覆蓋率提升,而其精確率還滿足一定的條件。具體設(shè)置如圖1所示。
在該設(shè)置下,模型訓(xùn)練后的變量重要性如圖2所示。
前十變量重要性依次是:最近消費(fèi)間隔天數(shù)、最近查詢間隔天數(shù)、平均還款次數(shù)、消費(fèi)是否校驗(yàn)密碼、最近動(dòng)賬交易間隔天數(shù)、平均還款金額、平均查詢次數(shù)、最高卡片等級(jí)、平均消費(fèi)金額、年齡。
其訓(xùn)練數(shù)據(jù)上的混淆矩陣如表6所示(0:未流失;1:流失):
測(cè)試數(shù)據(jù)上的混淆矩陣如表7所示(0:未流失;1:流失):
在測(cè)試集和訓(xùn)練集上的增益圖如圖3所示。
其模型結(jié)果的性能指標(biāo)如表8所示。
從模型結(jié)果可以看到,通過(guò)調(diào)整模型設(shè)置,隨著召回率上升到0.8以上,模型精確率下降到0.45左右,雖然精確率下降明顯,但覆蓋率也同步大幅提升,達(dá)到本次模型建立的目的,將預(yù)測(cè)范圍盡可能覆蓋到可能流失的客戶。F-測(cè)度值在默認(rèn)參數(shù)時(shí)測(cè)試值為0.55,模型調(diào)整后F-測(cè)度值略有上升,說(shuō)明實(shí)驗(yàn)的有效性也有所提高。
從AUC和Gini系數(shù)的指標(biāo)來(lái)看,原模型測(cè)試數(shù)據(jù)AUC值為0.868,Gini系數(shù)為0.736,調(diào)整后數(shù)值均有提升,并且在訓(xùn)練數(shù)據(jù)上模型的表現(xiàn)更好。從這兩個(gè)指標(biāo)來(lái)看,模型的預(yù)測(cè)能力均處于可以接受的范圍內(nèi),因此可以在實(shí)際應(yīng)用中使用該模型進(jìn)行預(yù)測(cè)。
4 模型應(yīng)用
信用卡客戶流失預(yù)測(cè)模型主要結(jié)合信用卡業(yè)務(wù)開(kāi)展,作為客戶挽留或者市場(chǎng)營(yíng)銷等業(yè)務(wù)活動(dòng)的參考依據(jù)。不同于其他模型,信用卡客戶流失預(yù)測(cè)模型應(yīng)用需注意以下兩點(diǎn)。
第一,盡管流失預(yù)測(cè)模型能夠幫助銀行判斷可能流失的客戶,但是在流失真正發(fā)生前,銀行很難直接利用其名單進(jìn)行客戶挽留。因此,需要將流失預(yù)測(cè)的結(jié)果與客戶關(guān)懷或者有針對(duì)性的市場(chǎng)營(yíng)銷活動(dòng)結(jié)合起來(lái)。
第二,信用卡客戶流失預(yù)測(cè)模型的建設(shè),在流失客戶選取上傾向于選擇更多的樣本。在模型的實(shí)際應(yīng)用中,由于流失客戶數(shù)量并沒(méi)有這么多,因此精確度會(huì)下降。故流失預(yù)測(cè)模型最為看重的是召回率,即盡可能的不要漏掉可能流失的客戶,以保障模型能夠幫助銀行盡可能的識(shí)別可能流失的客戶,從而通過(guò)客戶關(guān)懷或者營(yíng)銷活動(dòng)進(jìn)行更多的接觸,以降低客戶的流失率。
信用卡客戶流失預(yù)測(cè)模型應(yīng)參照市場(chǎng)營(yíng)銷活動(dòng)的應(yīng)用場(chǎng)景,在制定和執(zhí)行市場(chǎng)營(yíng)銷活動(dòng)的過(guò)程中,借助模型的能力提高業(yè)績(jī)考核,改造和優(yōu)化現(xiàn)有業(yè)務(wù)流程。因此,信用卡客戶流失預(yù)測(cè)模型的應(yīng)用建議落地在商業(yè)銀行的營(yíng)銷管理中,成為整體營(yíng)銷管理系統(tǒng)的一部分,對(duì)預(yù)測(cè)流失的客戶進(jìn)行客戶關(guān)懷,或者開(kāi)展有針對(duì)性的提前挽留、市場(chǎng)營(yíng)銷等活動(dòng)。
模型建設(shè)中以G銀行存量客戶為依據(jù),通過(guò)決策樹(shù)進(jìn)行客戶分類預(yù)測(cè),有較好的本地化效果。但是商業(yè)銀行的客戶結(jié)構(gòu)是不斷變化的,故在模型后續(xù)的應(yīng)用過(guò)程中需根據(jù)客戶數(shù)據(jù)進(jìn)行動(dòng)態(tài)調(diào)整,提高預(yù)測(cè)的精準(zhǔn)度。
5 總結(jié)與展望
本文通過(guò)對(duì)G銀行存量信用卡客戶的數(shù)據(jù)挖掘,用決策樹(shù)C5.0算法進(jìn)行建模,對(duì)信用卡流失客戶進(jìn)行預(yù)測(cè)。經(jīng)過(guò)測(cè)試該模型運(yùn)行效果良好,召回率在可接受范圍,下一步可將該模型投入到實(shí)際應(yīng)用中。后續(xù)一方面將信用卡客戶流失預(yù)測(cè)模型應(yīng)用到營(yíng)銷管理過(guò)程中,對(duì)可能流失的客戶實(shí)施挽留策略,實(shí)時(shí)監(jiān)控流失率的變化;另一方面定期更新基礎(chǔ)數(shù)據(jù),修正、優(yōu)化模型,不斷提升預(yù)測(cè)的覆蓋面和準(zhǔn)確性。
參考文獻(xiàn):
[1]程勇,梁吉祥.基于數(shù)據(jù)挖掘的掌銀客戶流失預(yù)測(cè)建模方法研究[J].中國(guó)金融電腦,2019(8):51-60.
[2]鄧致.信用卡客戶流失預(yù)測(cè)模型研究[J].金融科技時(shí)代,2019(9):22-25.
[3]李偉,孫新杰,陳偉.基于數(shù)據(jù)挖掘的客戶流失預(yù)測(cè)研究[J].電腦知識(shí)與技術(shù), 2019,15(10):7-8.
[4]張宇,張之明.一種基于C5.0決策樹(shù)的客戶流失預(yù)測(cè)模型研究[J].統(tǒng)計(jì)與信息論壇,2015,30(1):89-94.
[作者簡(jiǎn)介]沈哲(1981—),男,漢族,浙江寧波人,研究生,供職于中國(guó)光大銀行股份有限公司寧波分行,研究方向:銀行金融管理。
1913500783331