王彥博 雷娟 周學(xué)春
數(shù)字化營銷可以簡單理解為基于大數(shù)據(jù)技術(shù)應(yīng)用的客戶關(guān)系管理、維護與業(yè)務(wù)提升。實際上,商業(yè)銀行通過多年經(jīng)營,積累了海量的客戶之間交易轉(zhuǎn)賬行為數(shù)據(jù),奠定了基于資金交易信息構(gòu)建客戶社交網(wǎng)絡(luò)的數(shù)據(jù)基礎(chǔ)。本文以客戶交易流水數(shù)據(jù)為抓手,提出了一套社交網(wǎng)絡(luò)圖數(shù)據(jù)處理流程,并結(jié)合商業(yè)銀行大零售業(yè)務(wù)實際,探索了FinTech時代大數(shù)據(jù)社交網(wǎng)絡(luò)圖挖掘技術(shù)在商業(yè)銀行數(shù)字化營銷相關(guān)領(lǐng)域的應(yīng)用發(fā)展。
數(shù)字化營銷與基于交易的客戶社交網(wǎng)絡(luò)
數(shù)字化營銷的內(nèi)涵
數(shù)字化營銷是當前FinTech時代下商業(yè)銀行開展大數(shù)據(jù)挖掘相關(guān)工作時常常會觸及的一個概念。一般來說,數(shù)字化營銷包含客戶關(guān)系管理和大數(shù)據(jù)挖掘兩項基本元素,可以簡單理解為商業(yè)銀行基于“以客戶為中心”的理念,通過運用先進的大數(shù)據(jù)技術(shù),實現(xiàn)客戶識別、客戶獲取、客戶維護、客戶挽留等業(yè)務(wù)管理行為。具體而言,商業(yè)銀行的數(shù)字化營銷,就是以大數(shù)據(jù)平臺建設(shè)為基礎(chǔ),通過一定的計算方法(如統(tǒng)計分析算法、機器學(xué)習算法、模式識別算法等),從海量數(shù)據(jù)中提取出隱藏的、有價值的信息和知識,找出隱藏在數(shù)據(jù)背后的業(yè)務(wù)規(guī)律、規(guī)則和趨勢,從而能夠解釋已知的業(yè)務(wù)事實,并預(yù)測未來的客戶行為與業(yè)務(wù)模式,有效輔助銀行營銷人員開展客戶關(guān)系管理與業(yè)務(wù)提升。
社交網(wǎng)絡(luò)的內(nèi)涵
社交網(wǎng)絡(luò)是指社會中個體與個體之間聯(lián)系的集合,由個體(網(wǎng)絡(luò)圖中的節(jié)點)和各個體之間的聯(lián)系(節(jié)點之間的連線)組成。從本質(zhì)上來看,社交網(wǎng)絡(luò)是個體為達到特定目的,在個體與個體之間進行信息和資源交流的社會關(guān)系展現(xiàn)。
數(shù)字化營銷和社交網(wǎng)絡(luò)
“客戶圈子營銷”是當前FinTech與大數(shù)據(jù)智能發(fā)展下的一個較為新興的數(shù)字化營銷概念。以往商業(yè)銀行在做客戶服務(wù)和業(yè)務(wù)提升時,往往僅關(guān)注單一客戶個體。而事實上,客戶是嵌入在各種社交網(wǎng)絡(luò)中的,客戶之間存在著各式各樣的關(guān)聯(lián)關(guān)系。根據(jù)“物以類聚、人以群分”的基本原理,通常來自于同一個社交網(wǎng)絡(luò)中的個體,他們之間的互動溝通較為頻繁,行為特征上常常會呈現(xiàn)出一定的相似性。而“客戶圈子營銷”正是把客戶及其關(guān)聯(lián)網(wǎng)絡(luò)中的其他客戶識別為一個群體,指導(dǎo)開展整體營銷,從而實現(xiàn)提高營銷效率、提升客戶保持率等業(yè)務(wù)目標。
商業(yè)銀行、大數(shù)據(jù)與社交網(wǎng)絡(luò)
經(jīng)過多年積累,商業(yè)銀行沉淀了海量的客戶之間交易轉(zhuǎn)賬行為數(shù)據(jù)。以國內(nèi)某股份制商業(yè)銀行為例,每個月客戶之間的交易明細大約有一億條。以轉(zhuǎn)賬關(guān)系為基礎(chǔ),將每名客戶抽象為網(wǎng)絡(luò)圖中的各個節(jié)點,當客戶之間存在一筆轉(zhuǎn)賬交易記錄時,就會在相應(yīng)的兩名客戶(節(jié)點)之間畫一條連線?;诳蛻糁g的交易轉(zhuǎn)賬記錄,可以刻畫出客戶之間的資金交易關(guān)系,構(gòu)建以客戶為節(jié)點的社交網(wǎng)絡(luò)圖。同時,該社交網(wǎng)絡(luò)圖在商業(yè)銀行“客戶圈子營銷”等相關(guān)應(yīng)用中頗具實踐價值,有助于推進大零售數(shù)字化營銷相關(guān)應(yīng)用發(fā)展。
基于客戶資金交易的社交網(wǎng)絡(luò)圖數(shù)據(jù)處理流程
面向客戶交易流水數(shù)據(jù),本文提出“6E”圖數(shù)據(jù)處理流程框架,予以指導(dǎo)構(gòu)建相關(guān)客戶社交網(wǎng)絡(luò)圖?!?E”框架由圖數(shù)據(jù)處理流程中“剔除不適用的交易(Elimination of inapplicablet r a n s a c t i o n s)”“邊的有效性處理(E f f e c t i v e n e s s o fedges)”“極端元素處理(Extreme element process)”“圈子的建立(Establishment of circles)”“超大圈子的均勻切割(Equally-cutting of large circles)”以及“圈子展示(Exhibition of circles)”六個步驟組成。__
剔除不適用的交易
基于客戶之間的交易流水信息構(gòu)建客戶資金交易關(guān)系網(wǎng)絡(luò)圖,當客戶與客戶之間存在交易轉(zhuǎn)賬時,說明兩名客戶之間存在一條邊。然而,在界定邊的有效性之前,需要對不適用的交易信息進行剔除,包括:剔除同名轉(zhuǎn)賬、剔除系統(tǒng)批量動賬行為(即非客戶主動發(fā)起)、剔除公對公轉(zhuǎn)賬、剔除對公共戶的轉(zhuǎn)賬(容易導(dǎo)致異常節(jié)點和異常圈子的產(chǎn)生)、剔除交易對手為空的轉(zhuǎn)賬、剔除交易對手行為空的轉(zhuǎn)賬等。
邊的有效性處理
邊是構(gòu)建網(wǎng)絡(luò)圖的基礎(chǔ),代表了兩兩客戶之間的交易轉(zhuǎn)賬行為。然而,為避免過多“噪音”信息,并非所有的交易行為都需要展示在網(wǎng)絡(luò)圖中,因此需要通過數(shù)據(jù)勘探來界定一個邊的有效性標準?;诮灰最l次、交易金額及交易的單雙邊性三個指標,能夠形成“邊的有效性”門檻標準,其中交易頻次是指針對某條邊匯總統(tǒng)計其對手客戶在一段時期內(nèi)發(fā)生的交易次數(shù);交易金額是指匯總統(tǒng)計對手客戶在一段時期內(nèi)發(fā)生的交易金額;交易的單雙邊性是指匯總統(tǒng)計對手客戶在一段時期內(nèi)發(fā)生的交易性質(zhì),即“總是單向交易”或是“有來有往的雙向交易”。更進一步,可以將時間窗口設(shè)定為一年中的上、下半年,如果在上半年6個月中出現(xiàn)的有效邊也同樣出現(xiàn)在下半年的6個月中,則可以形成“邊的穩(wěn)定性”概念。顯然,在所建立的社交網(wǎng)絡(luò)圈子中,邊的穩(wěn)定性越高意味著圈子成員之間的關(guān)聯(lián)關(guān)系越牢固,用以指導(dǎo)后續(xù)開展營銷管理應(yīng)用的相關(guān)策略也就相對更可靠。
極端元素處理
極端節(jié)點的處理。如果節(jié)點的點度中心度(即節(jié)點的出度與入度之和)較為異常時,可以考慮剔除該節(jié)點。例如,淘寶店主會與很多交易對手發(fā)生轉(zhuǎn)賬關(guān)系,但這種關(guān)系屬于弱交易關(guān)系,不利于穩(wěn)定圈子的搭建,對于這樣的節(jié)點應(yīng)剔除。經(jīng)過數(shù)據(jù)勘探,建議采用“均值標準差”的思路來識別極端節(jié)點,即偏離均值3倍標準差的樣本節(jié)點都會被剔除。
極端邊的處理。針對節(jié)點(客戶)與節(jié)點(客戶)之間的交易頻次、交易金額呈現(xiàn)出的極端特征,應(yīng)考慮進行剔除。建議通過綜合考量“均值標準差”思路和“聚類”思路兩種方式來識別極端的邊。
極端圈子的處理。初步勾勒圈子時,對于圈子規(guī)模極端大的社交網(wǎng)絡(luò),需要分析超大圈子的形成原因,如果沒有發(fā)現(xiàn)異常因素,則需要考慮后續(xù)對圈子進行切割。
圈子的建立、切割和展示
基于連通圖原理和深度優(yōu)先遍歷原理,勾勒出客戶之間基于資金交易的社交網(wǎng)絡(luò)圈。
針對圈子規(guī)模較大的網(wǎng)絡(luò),在排除異常因素之后,建議考慮均衡切割原理進行圈子切割,使得切割后的兩個子圈較為均勻,同時損失的邊數(shù)量最少。
圈子的可視化展示包括兩個方面,即“三度人脈圖”和“弱聯(lián)通圖”展示。三度人脈圖是指以某名客戶為中心節(jié)點刻畫其一度人脈(即中心節(jié)點的直接交易對手)、二度人脈(即每個一度人脈節(jié)點的直接交易對手)和三度人脈(即每個二度人脈節(jié)點的直接交易對手)。
商業(yè)銀行基于社交網(wǎng)絡(luò)圖挖掘的數(shù)字化營銷應(yīng)用
基于以上所刻畫的客戶間資金交易網(wǎng)絡(luò)圖, 本文針對商業(yè)銀行大零售數(shù)字化營銷相關(guān)應(yīng)用, 提出面向客戶(Customer)的“6C”應(yīng)用框架,即“核心客戶識別(Corec u s t o m e r i d e n t i f i c a t i o n)”“客戶產(chǎn)品推薦(Cu s t o m e rproduct recommendation)”“客戶細分與聚類(Customersegmentation & clustering)”“客戶交叉銷售(Customercross-selling)”“客戶向上銷售(Customer up-selling)”以及“客戶風險傳染(Customer risk infection)”六類應(yīng)用場景。
核心客戶識別
一般而言,網(wǎng)絡(luò)大V的社會影響力較大,作為網(wǎng)絡(luò)意見領(lǐng)袖,通過其口碑開展營銷傳播往往收效顯著,有助于加強品牌的市場滲透力。在本文所構(gòu)建的客戶資金交易網(wǎng)絡(luò)圈中,對于“意見領(lǐng)袖”核心客戶的發(fā)現(xiàn)主要通過測算每名客戶的“三度人脈”網(wǎng)絡(luò)影響力指數(shù)。以“三度人脈”理論為基礎(chǔ),主要通過三個指標來表征客戶的網(wǎng)絡(luò)影響力指數(shù),即圈子位置、關(guān)系數(shù)量和關(guān)系質(zhì)量。其中,圈子位置刻畫了客戶在圈子中的位置中心性,相關(guān)指標通過客戶的點度中心度、接近中心度和居間中心度來計算;關(guān)系數(shù)量,從客戶的一度人脈數(shù)量、二度人脈數(shù)量和三度人脈數(shù)量來計算;關(guān)系質(zhì)量所衡量的是客戶與關(guān)聯(lián)客戶之間的關(guān)系強弱,這里通過一度人脈人均關(guān)系強度、二度人脈人均關(guān)系強度和三度人脈人均關(guān)系強度來計算。關(guān)于人均關(guān)系強度的計算是通過對邊的交易金額和交易頻次做“0-1標準化”處理后,按照經(jīng)驗兩者各占50%的權(quán)重來計算。此外,對于所涉及的所有指標均需要消除量綱的影響,都會進行“0-1標準化”處理??蛻艟W(wǎng)絡(luò)影響力指數(shù)計算公式:1/3×(點度中心度+接近中心度+居間中心度)+1/3×(一度人脈數(shù)量+二度人脈數(shù)量+三度人脈數(shù)量)+1/3×(一度人脈強度+二度人脈強度+三度人脈強度);人脈強度=0.5×交易金額+0.5×交易頻次?;谠摴接嬎?,影響力指數(shù)越高的客戶越具備意見領(lǐng)袖的特征,基于相關(guān)核心客戶進行口碑傳播的價值也就越大。
客戶產(chǎn)品推薦
以往的社交網(wǎng)絡(luò)分析表明,意見領(lǐng)袖常常會帶來更多的產(chǎn)品擴散,能夠有效加速產(chǎn)品推薦和市場滲透。以貸款產(chǎn)品為例,如果高影響力客戶簽約了相關(guān)產(chǎn)品,其關(guān)聯(lián)客戶應(yīng)該也會受到較大影響,成為產(chǎn)品簽約客戶。在實證研究方面,基于前3個月的交易流水構(gòu)建社交網(wǎng)絡(luò),第4個月新簽約貸款客戶作為觀察對象,考察新簽約客戶是否會在未來6個月內(nèi)對其關(guān)聯(lián)客戶產(chǎn)生影響,從而帶來更多的貸款簽約客戶。將第4個月新簽約貸款客戶拆分為兩個群體,即考察組(網(wǎng)絡(luò)影響指數(shù)排名前1000的新簽約客戶)和對照組(在新簽約客戶中隨機抽取1000名客戶)。6個月后,前1000名高影響力客戶其關(guān)聯(lián)客戶中有2439名客戶簽約了貸款;而隨機抽取的1000名客戶其關(guān)聯(lián)客戶中僅有494名客戶簽約了貸款,前者的產(chǎn)品推薦力約為后者的5倍。為提高實證結(jié)論的一般性,除貸款產(chǎn)品外還對其他產(chǎn)品也進行了同樣的實證,結(jié)果均表明高影響力客戶能夠帶來更多的產(chǎn)品擴散。
客戶細分與聚類
在本文所勾勒出客戶資金交易網(wǎng)絡(luò)圈的基礎(chǔ)上,結(jié)合圈子的業(yè)務(wù)屬性和特征,可以進一步對相關(guān)客戶做細分和聚類分析,例如客戶產(chǎn)品偏好聚類分析。首先,以圈子為樣本單位,計算每個圈子中各類財富資產(chǎn)的分布,如儲蓄、理財、基金、保險、股票等。隨后,基于K-means算法對圈子樣本進行聚類,由此可得到理財股票圈、股票圈、高儲蓄圈、低儲蓄圈、理財圈、基金圈6個客戶細分群。不同客戶細分群在聚類指標上存有顯著差異。以基金圈為例,該客群中持有基金產(chǎn)品的客戶數(shù)占比明顯高于其他客戶細分群,由此可給出營銷策略——相比其他5個客群,可優(yōu)先對基金圈客群內(nèi)尚未購買基金的客戶推薦基金代銷產(chǎn)品。
客戶交叉銷售
在一個交易圈中,簽約或者購買某種產(chǎn)品的客戶數(shù)占比越高,基于圈子內(nèi)客戶行為和偏好的相似性,可以大致估算出該客群的產(chǎn)品偏好。這里各產(chǎn)品客戶數(shù)占比可以看作為圈子的相關(guān)產(chǎn)品推薦指數(shù)。通過分析理財產(chǎn)品購買客戶,實證數(shù)據(jù)表明,基于圈子計算得到推薦指數(shù)得分較高的前10%客群,其簽約產(chǎn)品的概率相較于隨機抽取的客戶可提高6倍以上。
客戶向上銷售
基于客戶之間的交易轉(zhuǎn)賬記錄,可以勾勒出客戶的經(jīng)營圈(針對小微金融客戶)或者消費圈(針對個人金融客戶)。進一步計算兩個圈子的“圈子密度”和“圈子戶均金融資產(chǎn)”指標。圈子密度越高,說明圈子內(nèi)成員之間的交互越為頻繁,客戶之間的關(guān)聯(lián)性越為緊密,圈子成員在行為特征和資產(chǎn)特征方面應(yīng)具有較高的相似性。如果某名圈子成員的客戶金融資產(chǎn)明顯小于圈子成員的戶均金融資產(chǎn),在圈子密度較高的情形下(成員之間相似性也較高),則該名成員存在較大的客戶金融資產(chǎn)提升空間,以此支持“精準化、名單制”客戶向上銷售。
客戶風險傳染
來自于同一個社交網(wǎng)絡(luò)圈的成員,因交易關(guān)系、互動關(guān)系、熟人關(guān)系等,他們的行為常常表現(xiàn)出相似性和一致性。由此可延伸出一個業(yè)務(wù)問題:如果某個小微貸款客戶發(fā)生了違約行為,其關(guān)聯(lián)的交易客戶是否也會有較高的違約傾向。從業(yè)務(wù)邏輯來看,如果客戶所在的交易圈中,有過貸款違約行為的客戶占比較高,則可以認為該圈子中違約風險的傳染可能性也較高,其原因在于如果圈子中某個客戶的資金周轉(zhuǎn)出現(xiàn)了問題(即該客戶不具備履約能力),則可能會影響整個交易圈中的資金流動情況,甚至導(dǎo)致整個圈子的資金鏈斷裂,使得該客戶的違約風險擴散到整個圈子。實證分析結(jié)果表明,以違約客戶為中心節(jié)點所構(gòu)建出的客戶資金交易網(wǎng)絡(luò),其關(guān)聯(lián)客戶中發(fā)生違約的概率相較于在隨機抽取客戶中發(fā)生違約的概率提升了5倍以上。
結(jié)語
本文基于商業(yè)銀行積累沉淀的海量客戶交易信息,通過運用大數(shù)據(jù)社交網(wǎng)絡(luò)圖挖掘技術(shù),探索實踐了面向商業(yè)銀行大零售數(shù)字化營銷相關(guān)領(lǐng)域的應(yīng)用。本文首先提出了“6E”圖數(shù)據(jù)處理流程框架,為商業(yè)銀行運用客戶交易轉(zhuǎn)賬信息構(gòu)建客戶社交網(wǎng)絡(luò)形成了一套標準化數(shù)據(jù)處理方案。隨后,本文面向客戶資金交易網(wǎng)絡(luò)及大數(shù)據(jù)圖挖掘技術(shù)應(yīng)用提出了“6C”應(yīng)用框架,實證分析結(jié)果表明相關(guān)應(yīng)用效果顯著,為商業(yè)銀行探索FinTech時代下大數(shù)據(jù)社交網(wǎng)絡(luò)圖挖掘技術(shù)應(yīng)用提供參考借鑒。
(本文僅代表作者個人觀點)
(作者單位:中國社會科學(xué)院研究生院金融系、中國民生銀行,京東金融)