蘇治怡,季文奎,王鈺婷
(招商銀行網(wǎng)絡(luò)經(jīng)營服務(wù)中心,廣東深圳 518000)
設(shè)計(jì)系統(tǒng)主要內(nèi)容為一項(xiàng)以突破線上與線下渠道的斷點(diǎn)為目的,突破傳統(tǒng)的以單個(gè)員工經(jīng)驗(yàn)為主導(dǎo)的服務(wù)模式,并充分以客戶客觀屬性與歷史行為數(shù)據(jù)為基礎(chǔ)打造的,以全新模式實(shí)現(xiàn)到店客戶的及時(shí)經(jīng)營與離店線上精準(zhǔn)觸達(dá)的項(xiàng)目。該項(xiàng)目設(shè)計(jì)的出發(fā)點(diǎn)是,在手機(jī)的普及與電商的發(fā)展的時(shí)代,傳統(tǒng)金融機(jī)構(gòu)也逐步將經(jīng)營服務(wù)的陣地從線下往線上轉(zhuǎn)移,手機(jī)銀行App也從僅提供查賬轉(zhuǎn)賬等基本功能的輕型軟件,升級至為客戶提供賬戶管理、產(chǎn)品咨詢與推薦、產(chǎn)品交易、資訊共享、城市服務(wù)與社區(qū)分享等一站式服務(wù)的平臺。在業(yè)務(wù)平臺的定位發(fā)生質(zhì)變的同時(shí),管理者希望經(jīng)營模式也能從“每位個(gè)體經(jīng)營人員依靠個(gè)人經(jīng)驗(yàn)主觀判斷客戶訴求”逐步向“系統(tǒng)以客觀數(shù)據(jù)事實(shí)為基礎(chǔ)對不同層次客戶需求進(jìn)行預(yù)測并能有效指導(dǎo)員工高效進(jìn)行客戶經(jīng)營服務(wù)”迭代。當(dāng)業(yè)務(wù)發(fā)展對整個(gè)經(jīng)營流程提出高效、個(gè)性化、可閉環(huán)等要求時(shí),進(jìn)行系統(tǒng)的流程設(shè)計(jì)和整體方案規(guī)劃就顯得尤為重要。在此領(lǐng)域已經(jīng)提出“數(shù)據(jù)中臺”[1]概念的基礎(chǔ)上,完善數(shù)據(jù)存儲實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)管理,依靠利用沉淀的業(yè)務(wù)數(shù)據(jù)為基石結(jié)合大數(shù)據(jù)算法,通過計(jì)算機(jī)挖掘隱藏規(guī)律替代經(jīng)驗(yàn)完成決策[2],充分融合兼顧“人工”和“智能”的元素?!盎诳蛻魝€(gè)性化經(jīng)營與員工績效閉環(huán)反饋的大數(shù)據(jù)系統(tǒng)設(shè)計(jì)與分析建?!睂n}就是圍繞這樣的出發(fā)點(diǎn)產(chǎn)生與落地的。
線上化的流程和系統(tǒng)固然能給客戶提供更便捷、不受時(shí)間和空間所制約的服務(wù),但也對經(jīng)營者提出更大的挑戰(zhàn):面對千萬級至億級客戶的并發(fā)到訪,要求更精準(zhǔn)地對客戶進(jìn)行客群劃分,實(shí)現(xiàn)差異化經(jīng)營[3],為客戶提供個(gè)性化服務(wù)推薦。因此在“得數(shù)據(jù)者得天下”的大數(shù)據(jù)時(shí)代,不能忽略數(shù)據(jù)的客觀性和潛在價(jià)值,充分利用數(shù)據(jù)挖掘更接近客觀事實(shí)的規(guī)律,實(shí)時(shí)提供績效監(jiān)控?cái)?shù)據(jù)以快速校正優(yōu)化服務(wù)客戶完成操作。
根據(jù)項(xiàng)目需求和業(yè)務(wù)流程框架,設(shè)計(jì)了基于客戶個(gè)性化經(jīng)營與員工績效回算的閉環(huán)系統(tǒng),按照方案實(shí)施后的整個(gè)業(yè)務(wù)的流轉(zhuǎn)邏輯,如圖1所示。全流程數(shù)據(jù)采集應(yīng)用系統(tǒng)的運(yùn)轉(zhuǎn)方式表明,貫穿整個(gè)業(yè)務(wù)流程,使得系統(tǒng)能運(yùn)轉(zhuǎn)落地的重要因子就是“數(shù)據(jù)”,如何讓數(shù)據(jù)在各個(gè)環(huán)節(jié)之間傳遞有價(jià)值的信息,顯得尤為關(guān)鍵。
圖1 全流程數(shù)據(jù)采集應(yīng)用系統(tǒng)
如何進(jìn)行數(shù)據(jù)的采集、數(shù)據(jù)的清洗與存儲、數(shù)據(jù)的應(yīng)用與策略落地,不僅是大數(shù)據(jù)技術(shù)的重要環(huán)節(jié),也是當(dāng)前業(yè)務(wù)需要關(guān)注和重點(diǎn)設(shè)計(jì)的部分。圖2所示為整個(gè)系統(tǒng)方案中的數(shù)據(jù)流程框架。
圖2 數(shù)據(jù)流程框架
(1)采集到的數(shù)據(jù)在存儲階段會天然地清洗掉部分格式登記有誤、表結(jié)構(gòu)無法兼容或關(guān)鍵信息為空無法錄入的臟數(shù)據(jù)。
(2)在數(shù)據(jù)分析階段,利用各系統(tǒng)底層數(shù)據(jù)的唯一ID進(jìn)行數(shù)據(jù)的合并關(guān)聯(lián)。并基于業(yè)務(wù)需求篩選出與當(dāng)期業(yè)務(wù)目標(biāo)相關(guān)性高的數(shù)據(jù)特征,清洗[4]或標(biāo)注業(yè)務(wù)關(guān)鍵指標(biāo)為空值的記錄。
(3)數(shù)據(jù)分析通常會利用分箱、計(jì)算均值和分布、簡單回歸擬合等計(jì)算方式進(jìn)行。主要使用統(tǒng)計(jì)分析[5]和畫像聚類兩種途徑。
通過統(tǒng)計(jì)分析針對大量客戶樣本的重點(diǎn)結(jié)果指標(biāo)進(jìn)行匯總,以通報(bào)報(bào)表的形式直接對業(yè)務(wù)成效進(jìn)行呈現(xiàn);采用畫像分析[6]對客戶進(jìn)行基礎(chǔ)特征分層與人群計(jì)算,并在此基礎(chǔ)上對客群內(nèi)部的行為特征[7]進(jìn)行聚類或?qū)π袨槟J竭M(jìn)行探索挖掘,通過個(gè)性化推薦[8]的方式直接落地到客戶使用場景。
為實(shí)現(xiàn)數(shù)據(jù)鏈路的閉環(huán),需對客戶的二次行為通過相關(guān)埋點(diǎn)進(jìn)行采集和回送,持續(xù)迭代、優(yōu)化模型和規(guī)則的準(zhǔn)確性。
業(yè)務(wù)流程框架是為業(yè)務(wù)策略能按照業(yè)務(wù)規(guī)則分階段落地服務(wù),數(shù)據(jù)流程框架是為支持業(yè)務(wù)系統(tǒng)間的數(shù)據(jù)傳遞流轉(zhuǎn)服務(wù)的,而系統(tǒng)實(shí)現(xiàn)“智能”的關(guān)鍵就是足量數(shù)據(jù)特征的獲取和特征的合理使用,以下將對系統(tǒng)組成的幾個(gè)重要環(huán)節(jié)的設(shè)計(jì)要點(diǎn)進(jìn)行展開說明。
如圖3所示,當(dāng)基于業(yè)務(wù)需求,進(jìn)行新產(chǎn)品設(shè)計(jì)或在原產(chǎn)品上新增模組時(shí),除了要保證客戶使用層面上基本功能的實(shí)現(xiàn),還需要為數(shù)據(jù)回流回檢做鋪墊,規(guī)范完備的埋點(diǎn)設(shè)計(jì)就是第一步。“規(guī)范”體現(xiàn)在:需要在統(tǒng)一框架格式下進(jìn)行編碼以進(jìn)行管理和檢索,且能避免后續(xù)數(shù)據(jù)映射的錯(cuò)亂;“完備”體現(xiàn)在:任何一個(gè)提供給客戶交互的環(huán)節(jié)都應(yīng)設(shè)置埋點(diǎn),才能在客戶與頁面交互的瞬時(shí)獲取到操作日志并記錄。埋點(diǎn)的設(shè)計(jì)會決定日志數(shù)據(jù)的維度和粒度,對后續(xù)分析、建模時(shí)對客戶行為特征的獲取起到重要的作用。除了對交互頁面需要進(jìn)行埋點(diǎn)管理和設(shè)計(jì),頁面的參數(shù)入口預(yù)留與系統(tǒng)間傳參及記錄也至關(guān)重要。在各系設(shè)計(jì)允許的情況下,盡可能將ID信息、時(shí)點(diǎn)狀態(tài)等進(jìn)行逐層傳遞,以減少后續(xù)在離線端使用未及時(shí)更新的數(shù)據(jù)進(jìn)行關(guān)聯(lián)匹配,影響特征的準(zhǔn)確性。
圖3 頁面埋點(diǎn)框架示意圖
獲取到規(guī)范準(zhǔn)確且足量的數(shù)據(jù)后,為進(jìn)一步提高客戶轉(zhuǎn)化效果,需對客戶進(jìn)行分類分層的個(gè)性化經(jīng)營。初期通過“客戶畫像與組合特征客戶標(biāo)注的特征”的方式,“高價(jià)值”客戶轉(zhuǎn)化效果并不理想。因此,在合理利用畫像分析初步結(jié)論的基礎(chǔ)上,考慮將系統(tǒng)中生成存儲的近100多個(gè)客戶基礎(chǔ)屬性標(biāo)簽納入分析體系。將客戶屬性做空值填充和離散化處理,通過劃定實(shí)驗(yàn)與對標(biāo)組、分箱統(tǒng)計(jì)與分層抽樣、行為特征對比、特征組合等方法完善建模的特征工程。對當(dāng)年的全部數(shù)據(jù)采樣出1000 w量級的樣本,進(jìn)行影響因子的分析與分類模型的價(jià)值概率輸出。
(1)數(shù)據(jù)模型算法的選擇
分類模型的選擇主要是在集成算法[9]中進(jìn)行挑選,主流有套袋法(bagging)和提升法(boosting)兩種方式[10],核心都是訓(xùn)練由弱分類器組合的強(qiáng)分類器,其中,bagging采用的是有放回抽樣式的并行訓(xùn)練方式,假設(shè)每個(gè)基模型的權(quán)重ri=,方差為σ。
bagging的基模型間相關(guān)系數(shù)ρ、期望μ近似相等,故bagging模型的總體期望為:
模型總體方差為:
因此bagging主要是通過增加基模型數(shù)量減少模型的方差,但是期望和基模型是接近的。相反,boosting模型的訓(xùn)練是串行的,每個(gè)基模型都會在前一個(gè)基模型學(xué)習(xí)的基礎(chǔ)上進(jìn)行學(xué)習(xí),模型間的相關(guān)系數(shù)近似等于1:
由此可見,整體模型的期望由基模型的期望累加而成,所以隨著基模型數(shù)的增多,整體模型的期望值增加、準(zhǔn)確度提高;但要保證框架中的基模型使用弱模型,以降低方差。
本項(xiàng)目中的模型訓(xùn)練流程,分別使用隨機(jī)森林(randomforest)[11]和極限梯度提升算法(xgboost)[12]兩類基于決策樹的模型進(jìn)行效果對比,并嘗試用IV值(information value)的指標(biāo),來對系統(tǒng)內(nèi)固有的用戶標(biāo)簽進(jìn)行特征初篩。其中,IV值代表利用自變量的WOE證據(jù)權(quán)重來衡量輸入對輸出的預(yù)測能力。
(2)模型訓(xùn)練的效果
所有模型的訓(xùn)練,采用的是同一批樣本和同樣的特征列,表1為隨機(jī)森林混淆矩陣,表2所示為Xgboost1混淆矩陣。其中按照模型預(yù)測的結(jié)果和樣本實(shí)際的分類,計(jì)算出4個(gè)基本因子的統(tǒng)計(jì)值:TP=True Postive(預(yù)測正實(shí)際正),F(xiàn)P=False Positive(預(yù)測正實(shí)際負(fù)),F(xiàn)N=False Negative(預(yù)測正實(shí)際正)及TN=True Negative(預(yù)測負(fù)實(shí)際負(fù))。不同模型的混淆矩陣結(jié)果如表3所示。
表1 隨機(jī)森林混淆矩陣
表2 Xgboost1混淆矩陣
表3 Xgboost2混淆矩陣
基于混淆矩陣計(jì)算模型效果,對模型效果的判斷主要依靠同一閾值下的混淆矩陣所求出的所有樣本分類預(yù)測正確的占比準(zhǔn)確率(Accuracy),和正樣本中預(yù)測為正的占比召回率(Recall)。常用的衡量指標(biāo)表達(dá)式如下。
故計(jì)算結(jié)果如表4所示。
表4 模型訓(xùn)練效果對比
使用同一組歷史樣本數(shù)據(jù)建模,驗(yàn)證集上的效果顯示:經(jīng)過特征篩選后的Xgboost模型擁有更好的預(yù)測效果,因此采用Xgboost模型2輸出的客戶價(jià)值概率作為客戶分類依據(jù)。
建模并對模型訓(xùn)練調(diào)整優(yōu)化后,使用新一周期的樣例數(shù)據(jù)進(jìn)行測試,在同一概率閾值下仍可獲得84.39%的準(zhǔn)確率和的94.42%召回率,模型具有較好的泛化能力。
(3)模型投產(chǎn)效果對比
模型分類結(jié)果投產(chǎn)后,一線在承接客戶需求時(shí)系統(tǒng)會計(jì)算出客戶的價(jià)值概率,客戶經(jīng)理可根據(jù)客戶的價(jià)值概率取值與當(dāng)前的閑忙狀態(tài),合理調(diào)整自己的預(yù)期閾值,為不同概率區(qū)間的客戶提供不同方向?qū)用娴姆?wù)或引導(dǎo)。模型投產(chǎn)后整體客戶轉(zhuǎn)化效果提升較為顯著,客戶分類模型投產(chǎn)前后效果對比如圖4所示。
圖4 客戶分類模型投產(chǎn)前后效果對比
當(dāng)流程和系統(tǒng)都完成搭建之后,整個(gè)業(yè)務(wù)就可以按照規(guī)劃的框架運(yùn)作。為保證項(xiàng)目的正常運(yùn)作,日常的統(tǒng)計(jì)通報(bào)需要緊跟上線,才能更及時(shí)地獲取一線員工執(zhí)行情況、實(shí)現(xiàn)業(yè)績效果監(jiān)控閉環(huán)。
數(shù)據(jù)采集應(yīng)用系統(tǒng)改進(jìn)往常按照執(zhí)行腳本代碼、導(dǎo)出統(tǒng)計(jì)數(shù)據(jù)、加工圖表、生成并發(fā)送報(bào)告等步驟,以作業(yè)調(diào)度系統(tǒng)和自動導(dǎo)數(shù)工具搭建作業(yè)組合,結(jié)合軟件Tableau平臺開發(fā)商業(yè)智能報(bào)表,創(chuàng)新設(shè)計(jì)自動化統(tǒng)計(jì)通報(bào)可視化看板。統(tǒng)計(jì)計(jì)算如圖5所示。
圖5 統(tǒng)計(jì)計(jì)算作業(yè)框架
自動作業(yè)組合依靠SQL語言和kettle[13]軟件完成每日數(shù)據(jù)清洗匯總和簡單的統(tǒng)計(jì)分析,主要包括按時(shí)間、客群、場景等維度的統(tǒng)計(jì);員工維度的績效明細(xì);客戶效果維度的增量增幅、轉(zhuǎn)化占比;分行維度的排名比對等要素,基于自動作業(yè)加工后的數(shù)據(jù),使用Tableau[14]開發(fā)的商業(yè)智能報(bào)表,將統(tǒng)計(jì)結(jié)果表達(dá)為:多軸圖實(shí)現(xiàn)當(dāng)期數(shù)據(jù)的趨勢監(jiān)控,簡單柱狀圖自排序?qū)崿F(xiàn)分類對比,各類表計(jì)算/字段計(jì)算嵌套實(shí)現(xiàn)同環(huán)比,合理利用時(shí)間參數(shù)可便捷回溯歷史狀態(tài)[15]。報(bào)表開發(fā)完成后,只需要更新后臺數(shù)據(jù),便可以一致的風(fēng)格和統(tǒng)一的數(shù)據(jù)發(fā)布給不同的使用方。
自動作業(yè)組合保證了統(tǒng)計(jì)結(jié)果的自動按日以同一邏輯更新底層數(shù)據(jù),較好地保證了數(shù)據(jù)執(zhí)行的準(zhǔn)時(shí)準(zhǔn)確性。而選擇使用Tableau開發(fā)商業(yè)智能報(bào)表,則實(shí)現(xiàn)將統(tǒng)計(jì)結(jié)果轉(zhuǎn)化為寬表、圖表,以一致的風(fēng)格呈現(xiàn)發(fā)布,且隨時(shí)可回溯歷史狀態(tài)。部分呈現(xiàn)內(nèi)容數(shù)據(jù)指標(biāo)看板如圖6所示。
圖6 數(shù)據(jù)指標(biāo)看板
為了更好地衡量整個(gè)系統(tǒng)及模型的使用對實(shí)際業(yè)務(wù)效果的影響,使用模擬對照實(shí)驗(yàn)的方法對項(xiàng)目效果進(jìn)行評估,圖7所示為項(xiàng)目持續(xù)提升效果對比。
項(xiàng)目前期階段,為了證明通過系統(tǒng)引流和數(shù)據(jù)回檢的方式在打通線上線下渠道壁壘、連通客戶服務(wù)的斷點(diǎn)、通過業(yè)績精準(zhǔn)回算幫助中臺快速完成效果分析及員工輔導(dǎo)等方面有綜合且顯著的效果,在試運(yùn)行階段在不同等級的分支行中隨機(jī)抽取試點(diǎn)行做效果測算。通過客戶在各渠道的持續(xù)活躍情況、以及資產(chǎn)持續(xù)達(dá)標(biāo)、復(fù)雜產(chǎn)品配置等綜合評價(jià),得到如圖7中01對標(biāo)組和02實(shí)驗(yàn)組的效果對比。線上線下聯(lián)動后,客戶在各渠道的黏性和產(chǎn)品持有比例都有顯著提升,線上渠道的靈活性和非時(shí)空限制性可以為客戶訴求的達(dá)成提供便利,跳出“客戶首面”的場景局限,大大提升了客戶轉(zhuǎn)化的可能性。此外,在手機(jī)App的依托下,線上渠道更容易讓客戶產(chǎn)生使用習(xí)慣,促成客戶的品牌依賴性,實(shí)現(xiàn)客戶深度綁定。
項(xiàng)目中后期,為進(jìn)一步做好精細(xì)化、差異化、個(gè)性化客戶經(jīng)營,將2.2所述的客戶分類模型投產(chǎn)后,客戶轉(zhuǎn)化效果又出現(xiàn)新的拐點(diǎn)。如圖7中03實(shí)驗(yàn)增強(qiáng)組所示:當(dāng)客戶模型的輸出結(jié)果輔助員工完成客戶的轉(zhuǎn)化價(jià)值預(yù)判后,客戶經(jīng)理可以根據(jù)實(shí)際情況調(diào)配單位客戶的承接時(shí)長與深度。對于價(jià)值概率高的客戶及時(shí)深挖、調(diào)取適配的個(gè)推產(chǎn)品刺激客戶潛在需求,加速客戶的轉(zhuǎn)化效率。而對于價(jià)值概率偏低客戶,需要為客戶當(dāng)期需求提供良好解決方案,提升客戶滿意度的同時(shí)為客戶對品牌的認(rèn)可奠定基礎(chǔ),也減少在客戶意向較低時(shí)過量的推銷類行為帶來的客戶投訴抱怨而導(dǎo)致未來高價(jià)值客戶流失的可能。有的放矢的模式,縮短了探索了解客戶的時(shí)長、提供客戶管理經(jīng)營的效率,對各個(gè)分支行的客戶整體轉(zhuǎn)化率和長期經(jīng)營成效都有顯著幫助。
圖7 項(xiàng)目持續(xù)提升效果對比圖
綜上,“基于客戶個(gè)性化經(jīng)營與員工績效閉環(huán)反饋的大數(shù)據(jù)系統(tǒng)”很好地解決了客戶到店完成業(yè)務(wù)辦理后持續(xù)經(jīng)營的斷點(diǎn)問題,整個(gè)系統(tǒng)參考數(shù)據(jù)中臺搭建的基本原理,從數(shù)據(jù)的產(chǎn)生環(huán)節(jié)開始規(guī)劃,打通前臺客戶業(yè)務(wù)和后臺數(shù)據(jù)分析之間的通路,整個(gè)系統(tǒng)及數(shù)據(jù)對外通過客戶分類模型評估客戶需求為客戶輸出對應(yīng)的服務(wù),對內(nèi)利用自動化工具和智能報(bào)表對員工績效統(tǒng)計(jì)完成回算,輔助員工對客戶轉(zhuǎn)化效果進(jìn)行及時(shí)回檢和校正。以系統(tǒng)為依托的數(shù)據(jù)全流程流轉(zhuǎn),使得當(dāng)期數(shù)據(jù)持續(xù)閉環(huán)正反饋于下一周期的策略執(zhí)行,突破以個(gè)人經(jīng)驗(yàn)為主導(dǎo)模式下的探索式經(jīng)營,往數(shù)字化、智能化、可量化方向發(fā)展,以數(shù)據(jù)為先導(dǎo)挖掘客觀事實(shí),用數(shù)據(jù)為度量公平衡量結(jié)果,是經(jīng)營模式上的突破性嘗試,亦可作為其他業(yè)務(wù)場景的數(shù)據(jù)系統(tǒng)流程設(shè)計(jì)與數(shù)據(jù)收集積累應(yīng)用的方案經(jīng)驗(yàn)。