劉靜芳
中國建設(shè)銀行從2003年開始認(rèn)識到數(shù)據(jù)治理的重要性,開始探索適合建行特色的數(shù)據(jù)治理體系。2011年以來,建設(shè)銀行依托新一代核心系統(tǒng)工程,建立了完善的數(shù)據(jù)管理和數(shù)據(jù)應(yīng)用體系,夯實了覆蓋所有業(yè)務(wù)的規(guī)范統(tǒng)一、集成互聯(lián)的數(shù)據(jù)基礎(chǔ),實現(xiàn)了企業(yè)級、全流程數(shù)據(jù)管控。
建設(shè)銀行建立了完善的企業(yè)級數(shù)據(jù)規(guī)范體系,并在新一代核心系統(tǒng)中全面落地執(zhí)行。數(shù)據(jù)規(guī)范體系包括數(shù)據(jù)標(biāo)準(zhǔn)、業(yè)務(wù)術(shù)語、指標(biāo)體系、業(yè)務(wù)數(shù)據(jù)模型等,截至2017年末,建設(shè)銀行累計制定數(shù)據(jù)規(guī)范80000余項并全面執(zhí)行,從源頭上保證了數(shù)據(jù)一致性。
建設(shè)銀行建立了外部數(shù)據(jù)資源統(tǒng)一引入和共享機制,數(shù)據(jù)倉庫在集成行內(nèi)125個系統(tǒng)數(shù)據(jù)的基礎(chǔ)上,引入業(yè)務(wù)場景需要的工商、法律、海關(guān)、中經(jīng)網(wǎng)等外部數(shù)據(jù),實現(xiàn)企業(yè)級數(shù)據(jù)集成整合、互聯(lián)互通和全面共享。
建設(shè)銀行建立了完整的數(shù)據(jù)管控機制,開發(fā)了企業(yè)級、可視化的數(shù)據(jù)資產(chǎn)管理工具,支持對全行數(shù)據(jù)實施全生命周期的管理。建立企業(yè)級元數(shù)據(jù)資產(chǎn)庫,提供元數(shù)據(jù)應(yīng)用服務(wù)。建立企業(yè)級數(shù)據(jù)質(zhì)量平臺,提供可定制的數(shù)據(jù)質(zhì)量監(jiān)測服務(wù)。
建立一體化協(xié)同機制
大數(shù)據(jù)能力建設(shè)是覆蓋和貫通數(shù)據(jù)價值鏈中采集、加工、管理、應(yīng)用各個環(huán)節(jié)的全局性工作,所有機構(gòu)都是直接的參與者。大數(shù)據(jù)工作取得成效的關(guān)鍵在于,遵循科學(xué)規(guī)律,結(jié)合具體實踐,以全行一盤棋的思路做好頂層設(shè)計,建立適應(yīng)互聯(lián)網(wǎng)和大數(shù)據(jù)新競合業(yè)態(tài)下的工作組織體系,充分激發(fā)全行各級機構(gòu)管理數(shù)據(jù)、應(yīng)用數(shù)據(jù)的積極性和創(chuàng)造性,促進(jìn)全行經(jīng)營管理向數(shù)據(jù)智能型邁進(jìn)。
為保證大數(shù)據(jù)戰(zhàn)略有效實施,建設(shè)銀行自上而下建立了完整的組織管理和工作機制,成立了總行領(lǐng)導(dǎo)掛帥的工作領(lǐng)導(dǎo)決策機構(gòu),強化了總行數(shù)據(jù)管理部作為大數(shù)據(jù)能力建設(shè)牽頭部門的職能定位,與新組建的大數(shù)據(jù)智慧中心一體化協(xié)同運作,加強大數(shù)據(jù)工作的體系化統(tǒng)籌管理、創(chuàng)新動能培育和內(nèi)聚賦能能力。大數(shù)據(jù)智慧中心作為專門為全行提供大數(shù)據(jù)應(yīng)用支持的專業(yè)化機構(gòu),為總分行各業(yè)務(wù)部門大數(shù)據(jù)應(yīng)用提供全面的數(shù)據(jù)、分析方法、工具和專業(yè)人員支持,協(xié)助業(yè)務(wù)部門滿足管理決策、客戶營銷、風(fēng)險管理、產(chǎn)品創(chuàng)新等數(shù)據(jù)分析,共同實現(xiàn)全行大數(shù)據(jù)戰(zhàn)略目標(biāo)。同時,為在全行范圍推廣大數(shù)據(jù)理念,培養(yǎng)數(shù)據(jù)分析人才,建設(shè)銀行每年組織實施“綠樹工程”大數(shù)據(jù)種子人才培養(yǎng)計劃,選拔總、分行骨干人員到大數(shù)據(jù)中心學(xué)習(xí)工作一段時間,以集中授課、項目實踐雙管齊下的形式,培訓(xùn)骨干人員掌握大數(shù)據(jù)分析工具、技術(shù)和方法,為全行培養(yǎng)了一大批數(shù)據(jù)分析人才。
總行各部門相繼設(shè)立大數(shù)據(jù)應(yīng)用崗位,以多方合作開展大數(shù)據(jù)應(yīng)用項目的形式,深挖全行數(shù)據(jù)資源,逐步實現(xiàn)數(shù)據(jù)引領(lǐng)和數(shù)據(jù)驅(qū)動業(yè)務(wù)發(fā)展的目標(biāo)。各分行數(shù)據(jù)管理條線參照總行大數(shù)據(jù)組織管理架構(gòu),在各層級機構(gòu)共同推進(jìn)大數(shù)據(jù)分析成果落地應(yīng)用。全面規(guī)劃工作平臺
構(gòu)建大數(shù)據(jù)生態(tài)體系
銀行業(yè)要發(fā)揮數(shù)據(jù)價值,驅(qū)動業(yè)務(wù)發(fā)展與創(chuàng)新,需要在傳統(tǒng)數(shù)據(jù)處理平臺的基礎(chǔ)上再上一個臺階。建設(shè)銀行規(guī)劃并建設(shè)了大數(shù)據(jù)工作平臺,將其定位為:面向全行數(shù)據(jù)分析人員大數(shù)據(jù)生態(tài)體系的基石,是全行大數(shù)據(jù)分析工作的實驗室、工具箱和知識庫;具備多類型數(shù)據(jù)整合、海量數(shù)據(jù)處理、數(shù)據(jù)產(chǎn)品創(chuàng)造等能力,并提供各類共享數(shù)據(jù)分析挖掘應(yīng)用資源。在平臺項目實施過程中,以基礎(chǔ)先行、應(yīng)用導(dǎo)向為原則,推進(jìn)大數(shù)據(jù)相關(guān)技術(shù)、工具的研究、引進(jìn)或功能開發(fā),逐步實現(xiàn)涵蓋數(shù)據(jù)采集與轉(zhuǎn)換、存儲與計算、展現(xiàn)與運用等能力為一體的大數(shù)據(jù)生態(tài)體系。
在數(shù)據(jù)采集與轉(zhuǎn)換能力建設(shè)方面,制定了統(tǒng)一的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)采集規(guī)范,在合法合規(guī)的前提下,實現(xiàn)對企業(yè)內(nèi)部、互聯(lián)網(wǎng)網(wǎng)站、社交媒體、第三方機構(gòu)等結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的采集,進(jìn)一步豐富數(shù)據(jù)來源。
在數(shù)據(jù)存儲與計算能力建設(shè)方面,依托“MPP+Ha-doop”的融合架構(gòu),搭建符合大數(shù)據(jù)處理要求的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)存儲與計算平臺,形成對多種數(shù)據(jù)類型的海量數(shù)據(jù)存儲能力、海量數(shù)據(jù)快速計算能力、針對流數(shù)據(jù)等動態(tài)數(shù)據(jù)的計算處理能力以及運用機器學(xué)習(xí)等技術(shù)實現(xiàn)的數(shù)據(jù)分析和挖掘能力。
在數(shù)據(jù)展現(xiàn)與運用能力建設(shè)方面,在傳統(tǒng)的可視化分析基礎(chǔ)上,增加大數(shù)據(jù)處理所需的可視化分析工具,支持更有效的圖形、圖表等可視化分析與展示需求;同時打通大數(shù)據(jù)工作平臺與多渠道的信息交互通道,支持將數(shù)據(jù)分析成果對接到應(yīng)用組件、短信平臺、微信公眾號等。
圍繞大數(shù)據(jù)生態(tài)體系,建設(shè)銀行不斷跟蹤大數(shù)據(jù)及相關(guān)領(lǐng)域的最新技術(shù)成果,深入研究大數(shù)據(jù)領(lǐng)域相關(guān)技術(shù)應(yīng)用,積極引入各類先進(jìn)的分析工具和技術(shù),培育數(shù)據(jù)挖掘和分析技能,在繼續(xù)提升全行傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)分析能力的同時,結(jié)合非結(jié)構(gòu)化數(shù)據(jù)的特點,因地制宜、各盡所能,分類建設(shè)多種不同的分析能力。
在機器學(xué)習(xí)領(lǐng)域,引入Python、R、Spark、Zeppe-lin等數(shù)據(jù)分析語言及工具,運用典型的關(guān)聯(lián)分析、LDA聚類、隨機森林、協(xié)同過濾等機器學(xué)習(xí)算法處理客服語音文本、智能客服會話文本等非結(jié)構(gòu)化數(shù)據(jù),融合處理結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),構(gòu)建熱點問題分析、來電原因分類分析、投訴升級預(yù)測分析、智能推薦等一系列挖掘分析模型,從而洞悉客戶心聲、預(yù)測客戶需求,為優(yōu)化業(yè)務(wù)運營、提升業(yè)務(wù)效益服務(wù)。
在深度學(xué)習(xí)領(lǐng)域,基于開源的TensorFlow深度學(xué)習(xí)框架等工具,在圖像識別等領(lǐng)域進(jìn)行探索與應(yīng)用;在圖分析領(lǐng)域,引進(jìn)了專門工具用于實現(xiàn)圖分析、路徑分析,并在此基礎(chǔ)上探索研究Neo4j、JanusGraph等開源圖數(shù)據(jù)庫工具,用于構(gòu)建客戶關(guān)系圖譜、預(yù)測客戶資金流向等。
積極推進(jìn)大數(shù)據(jù)應(yīng)用
建設(shè)銀行大數(shù)據(jù)戰(zhàn)略實施三年以來,聚焦全行業(yè)務(wù)發(fā)展的熱點、難點問題,著力提升大數(shù)據(jù)分析挖掘能力,推動全行體系化大數(shù)據(jù)應(yīng)用,從無到有,從弱到強。
建設(shè)銀行在普惠金融領(lǐng)域,結(jié)合企業(yè)及企業(yè)主行內(nèi)外數(shù)據(jù),運用大數(shù)據(jù)技術(shù),建立全新的客戶評價體系,圍繞客戶履約能力、信用狀況、資產(chǎn)狀況等方面進(jìn)行綜合評價,選擇誠信納稅優(yōu)質(zhì)小微企業(yè)給予信用貸款,采用全線上自助貸款流程,實現(xiàn)針對性貸后預(yù)警監(jiān)測,依托大數(shù)據(jù)技術(shù)實現(xiàn)在信貸流程、風(fēng)險控制等方面的全面創(chuàng)新。
建設(shè)銀行在住房金融領(lǐng)域,基于我行自身海量、高質(zhì)的住房交易數(shù)據(jù),整合外部優(yōu)質(zhì)數(shù)據(jù)資源,采用特征價格法編制住房租賃價格指數(shù),以完整反映住房租賃市場格局和動態(tài),為政府部門、企業(yè)機構(gòu)和各類市場參與者提供系統(tǒng)性支持和服務(wù)。建設(shè)銀行因此成為國內(nèi)首家由金融機構(gòu)編制發(fā)布住房市場分析監(jiān)測指標(biāo)的機構(gòu)。
此外,建設(shè)銀行借助大數(shù)據(jù)技術(shù)深入探索語音、圖像、文本等非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用。一是分析客戶來電投訴語音數(shù)據(jù),預(yù)測客戶投訴升級可能性,及早做好客戶服務(wù)和矛盾化解工作;二是運用深度機器學(xué)習(xí)技術(shù),對客戶行駛證圖像數(shù)據(jù)進(jìn)行自動識別分析,獲取客戶的購車日期、車型檔次等信息,精準(zhǔn)定位客戶車型續(xù)保時點,預(yù)測客戶換車需求,驅(qū)動車險、購車分期等信用卡產(chǎn)品精準(zhǔn)化營銷;三是根據(jù)各個渠道采集到的客戶咨詢、建議等文本內(nèi)容,運用自然語言分析工具,挖掘客戶業(yè)務(wù)需求和業(yè)務(wù)場景,關(guān)聯(lián)客戶交易行為,精準(zhǔn)定位營銷目標(biāo)客戶群體,結(jié)合對應(yīng)的金融產(chǎn)品,制定營銷策略和營銷話術(shù),開展手機銀行獲客、活客精準(zhǔn)營銷。