王海波
(智器云南京信息科技有限公司,江蘇 南京 210012)
面對金融科技行業(yè)的快速發(fā)展和環(huán)境的急劇變化,傳統(tǒng)風(fēng)險(xiǎn)防范與合規(guī)管理手段難以滿足未來監(jiān)管和金融機(jī)構(gòu)的要求。合規(guī)科技正成為銀行在數(shù)字化轉(zhuǎn)型發(fā)展進(jìn)程中不可或缺的助力器[1],而反洗錢是銀行合規(guī)管控的一項(xiàng)核心工作。2020 年,央行總計(jì)開出568 筆約23 273.6 萬的反洗錢行政罰單,涉及369 家金融機(jī)構(gòu),問責(zé)365 人。如何融合新技術(shù)謀求反洗錢應(yīng)用場景創(chuàng)新,是賦能業(yè)務(wù)合規(guī)、防范新興風(fēng)險(xiǎn)、助力數(shù)字化轉(zhuǎn)型和軟件智能化升級的重要問題。
目前,已有較多金融反洗錢軟件技術(shù)研究,從系統(tǒng)級和算法級兩個(gè)層面綜述如下:
系統(tǒng)級層面,肖琨等[2]開發(fā)了一種貨幣交易的可疑行為檢測和分類系統(tǒng),利用知識圖譜和數(shù)據(jù)融合搭建銀行風(fēng)控平臺。汪昱廷[3]基于大數(shù)據(jù)與機(jī)器學(xué)習(xí)設(shè)計(jì)高效反洗錢檢測,引入知識圖庫進(jìn)行檢索映射。吳剛等[4]將反洗錢數(shù)據(jù)存儲、處理及多種功能接口融合,實(shí)現(xiàn)反洗錢區(qū)域化、現(xiàn)代化、數(shù)據(jù)化。這些研究從多方面對反洗錢系統(tǒng)進(jìn)行了框架設(shè)計(jì),但從市場化軟件普適性、可推廣性角度,如何加強(qiáng)多場景下的數(shù)據(jù)智能化關(guān)聯(lián)和系統(tǒng)流程的易操作性,值得進(jìn)一步研究。此外,用知識圖譜搭建反洗錢軟件需因地制宜,尤其針對洗錢嫌疑賬戶行為的時(shí)空特性,需輔以行業(yè)經(jīng)驗(yàn)進(jìn)行調(diào)參,并開放充分的接口為軟件升級和推廣做準(zhǔn)備。
算法級層面,Wang 等[5]提出一種用于洗錢的決策樹方法,從企業(yè)客戶檔案中提取4 個(gè)屬性加以實(shí)現(xiàn)。Kingdon[6]提出基于賬戶的多維自適應(yīng)概率矩陣以判斷銀行的行為模式。但由于金融領(lǐng)域的突發(fā)性并不等于可疑性或違法性,上述系統(tǒng)對反洗錢的檢測針對性偏弱,尤其在復(fù)雜場景下的識別準(zhǔn)確率和有效性有待提升。陳強(qiáng)等[7]采用圖分析、圖挖掘等技術(shù),提取深層關(guān)聯(lián)風(fēng)險(xiǎn)特征,構(gòu)建反欺詐策略體系。肖艷麗等[8]運(yùn)用XGBoost 模型預(yù)測金融市場極端風(fēng)險(xiǎn),并展開預(yù)測效果的顯著性檢驗(yàn)。上述方法對樣本量及歷史數(shù)據(jù)的相關(guān)性特性要求較高,且方法有效性依賴于樣本的多樣性和預(yù)處理質(zhì)量,魯棒性偏弱。鐘增勝等[9]基于層次化加權(quán)的交易行為特征描述,提出結(jié)合孤立點(diǎn)檢測和小類簇檢測的交易行為異常檢測方法。該研究進(jìn)行了評估實(shí)驗(yàn),但未涉及系統(tǒng)級整體層設(shè)計(jì)。聶濤等[10]基于決策樹和特征工程進(jìn)行反洗錢大數(shù)據(jù)技術(shù)應(yīng)用,流程可行性好但案例實(shí)驗(yàn)的指標(biāo)支撐有待豐富。文獻(xiàn)[11-12]基于GREAT 和人機(jī)耦合技術(shù)進(jìn)行反洗錢智能識別建模,但主要針對局部識別模塊,通用性需要驗(yàn)證。Foley 等[13]為合法和非法比特幣交易用戶建立社區(qū),Han 等[14]基于自然語言處理技術(shù)減少反洗錢調(diào)查時(shí)間,但這些研究的適用范圍限定較多,有待形成市場認(rèn)可推廣的軟件架構(gòu)。
鑒于上述分析,本文構(gòu)建改進(jìn)的金融領(lǐng)域反洗錢全過程框架,研制可市場化的軟件,實(shí)現(xiàn)全流程控制和可視化分析,為本行業(yè)相關(guān)軟件推廣提供一定技術(shù)參考。
基于知識圖譜構(gòu)建反洗錢軟件的智能數(shù)據(jù)關(guān)聯(lián)架構(gòu),其主體設(shè)計(jì)思路為:①通過無監(jiān)督學(xué)習(xí)方法掃描CT 畫像,實(shí)現(xiàn)自動化平臺建模,支撐數(shù)據(jù)采集與預(yù)處理、統(tǒng)計(jì)特性分析、樣本訓(xùn)練及預(yù)測、性能評估與監(jiān)控等流程;②基于機(jī)器學(xué)習(xí)方法對模型各模塊進(jìn)行迭代優(yōu)化,抽取多個(gè)目標(biāo)洗錢場景的核心特征,構(gòu)造反洗錢類罪模型,精準(zhǔn)定位可疑主體;③基于深度學(xué)習(xí)技術(shù),在小樣本條件下進(jìn)行數(shù)據(jù)自適應(yīng)擴(kuò)充,提升欺詐風(fēng)險(xiǎn)自主識別能力,構(gòu)建反洗錢模型的自適應(yīng)優(yōu)化模式;④采用智能數(shù)據(jù)關(guān)聯(lián)的知識圖譜作為客戶選擇和欺詐洗錢行為識別的核心技術(shù)。基于圖數(shù)據(jù)和多維數(shù)據(jù)原理進(jìn)行黑樣本庫關(guān)聯(lián)探查,將不規(guī)則的多源異構(gòu)數(shù)據(jù)進(jìn)行標(biāo)簽化管理,作為機(jī)器學(xué)習(xí)訓(xùn)練引擎的輸入,從而提升識別速度和精度。
其中,步驟②作為核心算法部分,設(shè)計(jì)思路如圖1 所示,包括4 個(gè)模塊:數(shù)據(jù)提取、特征工程、標(biāo)準(zhǔn)化、分類。分類器采用融合的機(jī)器學(xué)習(xí)算法,可根據(jù)不同場景條件進(jìn)行初始參數(shù)預(yù)設(shè)。通過對黑、白樣本(包括原始交易數(shù)據(jù)、特征化數(shù)據(jù)、圖計(jì)算特征數(shù)據(jù)等)的學(xué)習(xí),形成算法模型,實(shí)現(xiàn)對未來交易數(shù)據(jù)的分類預(yù)測,即對可疑交易數(shù)據(jù)的甄別。
Fig.1 Data process module of anti-money laundering system based on machine learning圖1 基于機(jī)器學(xué)習(xí)的反洗錢數(shù)據(jù)處理流程
對于數(shù)據(jù)集,需將原始交易數(shù)據(jù)通過數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換(衍生、降維等)獲得標(biāo)準(zhǔn)數(shù)據(jù),再通過濾波生成圖數(shù)據(jù)存儲在數(shù)據(jù)庫中。在特征工程模塊中,圖數(shù)據(jù)通過網(wǎng)絡(luò)分析和場景檢測得到特征向量x1;標(biāo)準(zhǔn)化數(shù)據(jù)通過數(shù)據(jù)提取和轉(zhuǎn)化得到特征向量x2;原始交易數(shù)據(jù)通過時(shí)序分析模型如LSTM[15],提取得到特征向量x3。向量合并之后經(jīng)過標(biāo)準(zhǔn)化、歸一化、數(shù)據(jù)填充,得到最終的特征向量,送入機(jī)器學(xué)習(xí)分類器。本文采用隨機(jī)森林+XGBoost 混合算法,即采用隨機(jī)森林進(jìn)行特征向量的降維優(yōu)化,進(jìn)而用XGBoost進(jìn)行訓(xùn)練和分類,選出符合設(shè)定規(guī)則且滿足相關(guān)準(zhǔn)確率和覆蓋率的可行解。需注意的是,算法模型需對黑、白特征業(yè)務(wù)樣本數(shù)據(jù)分別訓(xùn)練得到模型(本文案例取數(shù)據(jù)集共計(jì)13 000 樣本點(diǎn)的前80%作為訓(xùn)練集),然后對測試數(shù)據(jù)進(jìn)行分類預(yù)測(取數(shù)據(jù)的后20%作為測試數(shù)據(jù))。
所設(shè)計(jì)的基于知識圖譜的反洗錢軟件整體框架如圖2所示。
(1)金融客戶數(shù)據(jù)的知識圖譜庫構(gòu)建。通過知識圖譜庫存儲和抽取,構(gòu)建相關(guān)的基本信息和行為特征數(shù)據(jù),如檔案信息、行為活動數(shù)據(jù)、數(shù)字指紋、賬戶間關(guān)系、閾值優(yōu)化等信息。同時(shí),整合已知銀行客戶模式,推導(dǎo)出細(xì)粒度信息,改進(jìn)引擎檢測效果。學(xué)習(xí)引擎根據(jù)給定特征向量自適應(yīng)調(diào)整權(quán)重參數(shù)和距離函數(shù),直至滿足指標(biāo)約束。
(2)動態(tài)特征提取。將智能數(shù)據(jù)關(guān)聯(lián)技術(shù)和反洗錢業(yè)務(wù)場景結(jié)合起來,并融合行業(yè)知識以“動態(tài)”提取特征。動態(tài)特征提取保證了提取過程的在線可調(diào)整性,即當(dāng)輸入數(shù)據(jù)發(fā)生增減變化時(shí),對應(yīng)在線調(diào)整特征向量維數(shù),增強(qiáng)引擎模型魯棒性。
Fig.2 Overall scheme of the anti-money laundering software圖2 反洗錢軟件整體框架
(3)CT 畫像引擎。CT 畫像引擎利用規(guī)則檢測和自監(jiān)督學(xué)習(xí)檢測實(shí)現(xiàn)對客戶6 維、72 脈、360 度掃描的立體畫像。本文軟件設(shè)計(jì)根據(jù)銀行業(yè)認(rèn)定的反洗錢規(guī)則結(jié)合目標(biāo)場景需求構(gòu)建檢測引擎,對全量數(shù)據(jù)或可疑數(shù)據(jù)進(jìn)行檢測。同時(shí),將無監(jiān)督機(jī)器學(xué)習(xí)(團(tuán)伙檢測)和規(guī)則檢測引擎檢測相融合,符合各規(guī)則檢測出的洗錢數(shù)據(jù)共同輸入有監(jiān)督學(xué)習(xí)模型,經(jīng)學(xué)習(xí)訓(xùn)練后,結(jié)合行為方式已知的賬戶信息,推算并鎖定具有類似特征的可疑賬戶。
(4)無監(jiān)督學(xué)習(xí)引擎。無監(jiān)督針對的是異常行為模式及特征有效性未知的情形。一方面,無需標(biāo)簽和訓(xùn)練數(shù)據(jù),主動檢測新型攻擊,提前防范嫌疑模式,甚至在嫌疑賬戶申請或注冊時(shí)將其檢測出來;另一方面,有效利用新型數(shù)字信息,匯總和計(jì)算多個(gè)數(shù)字指紋,通過信息融合輸出決策變量。
(5)檢測結(jié)果排序和分類。根據(jù)可信度將已檢出的可疑賬戶進(jìn)行打分和排序,并按攻擊性質(zhì)對可疑賬戶進(jìn)行分類。進(jìn)而,利用可疑賬戶的規(guī)模和聚類距離對上述打分排序結(jié)果進(jìn)行函數(shù)描述。規(guī)模越大、聚類距離越短的可疑賬戶,其得到的分?jǐn)?shù)越高,嫌疑性越強(qiáng)。
(6)實(shí)時(shí)可視化分析。結(jié)果圖數(shù)據(jù)送往實(shí)時(shí)可視化分析模塊,該模塊首先基于圖分析結(jié)果的相似度,將多個(gè)可疑賬戶進(jìn)一步關(guān)聯(lián)聚類,進(jìn)而將不同的賬戶聚類視為不同節(jié)點(diǎn),計(jì)算節(jié)點(diǎn)間的邊緣權(quán)重以揭示不同賬戶聚類間的潛在關(guān)聯(lián),再通過人機(jī)交互界面完成上述結(jié)果的實(shí)時(shí)可視化輸出。
基于軟件架構(gòu)和功能分析,得到軟件開發(fā)核心任務(wù)目標(biāo):①智能引擎設(shè)計(jì);②構(gòu)建知識圖譜;③人工智能建模;④可疑類罪自動判別;⑤動態(tài)一鍵報(bào)告。將該軟件開發(fā)過程中的關(guān)鍵技術(shù)和注意事項(xiàng)進(jìn)行總結(jié),以幫助后續(xù)開發(fā)使用者參考并改進(jìn)。
(1)知識圖譜技術(shù)嵌入。反洗錢軟件的開發(fā)本質(zhì)上屬于大數(shù)據(jù)技術(shù)應(yīng)用。面對多源異構(gòu)的銀行賬戶數(shù)據(jù)聚類問題,需要軟件具備數(shù)據(jù)搜索、預(yù)處理、映射、關(guān)聯(lián)等基本功能,并實(shí)現(xiàn)洗錢信息建模、賬戶關(guān)系鏈接、隱形關(guān)聯(lián)挖掘等附加功能。該反洗錢軟件平臺采用ELP(Entity:實(shí)體,Link:鏈接,Property:屬性)模型刻畫智能數(shù)據(jù)關(guān)聯(lián)關(guān)系,尤其是時(shí)間和空間關(guān)系,通過銀行賬單、存取單據(jù)、交易數(shù)據(jù)及分析人員可視化交互,快速挖掘可疑信息,定位嫌疑點(diǎn),并結(jié)合行為模式和組織架構(gòu)分析,提供有效反洗錢偵探線索。
(2)高度定制化ETL 工具。通過定制化ETL 工具,支持多類數(shù)據(jù)庫模塊的讀寫,包括各主流關(guān)系型數(shù)據(jù)庫、NoSQL 數(shù)據(jù)庫和Hadoop 數(shù)據(jù)庫,實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)資源的提取、預(yù)處理和轉(zhuǎn)換,然后裝載到知識圖譜平臺中,實(shí)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)集成。
(3)分布式數(shù)據(jù)庫技術(shù)。采用分布式圖數(shù)據(jù)庫結(jié)構(gòu),保證對多源異構(gòu)數(shù)據(jù)的實(shí)時(shí)處理能力,避免樣本過敏感、過擬合問題及回歸和決策時(shí)的效率低下問題。通過優(yōu)化圖計(jì)算層和存儲層,支撐海量樣本處理,適合反洗錢應(yīng)用場景。
(4)大數(shù)據(jù)建模工具。傳統(tǒng)的數(shù)據(jù)建模大多采用業(yè)務(wù)知識,但在面對金融洗錢這類數(shù)據(jù)類型異構(gòu)、賬戶來源多樣、可視化程度較低的應(yīng)用場景時(shí),需要數(shù)據(jù)挖掘、數(shù)理統(tǒng)計(jì)及人工智能等多項(xiàng)技術(shù)的交叉融合,以精準(zhǔn)鎖定嫌疑賬戶。在構(gòu)建上層應(yīng)用模型時(shí),采用基于腳本語言的建模開發(fā)工具,支持多類型文件、多數(shù)據(jù)庫、多接口的信息讀取。
(5)智能中臺。智能中臺提供數(shù)據(jù)分析和用戶交易場景的信息流交互和管理決策服務(wù),從感知、理解、統(tǒng)計(jì)、決策、展示、創(chuàng)造、挖掘、歸納八大方向出發(fā),為上層應(yīng)用提供多樣化的業(yè)務(wù)數(shù)據(jù)支撐,保證各模塊之間更精準(zhǔn)、更智能的協(xié)同,其關(guān)系網(wǎng)和功能邏輯如圖3所示。
Fig.3 Upper business directions supported by the intelligent platform圖3 智能中臺支撐的上層業(yè)務(wù)方向
(6)信息可視化與人機(jī)智能分析。基于對銀行業(yè)數(shù)據(jù)的理解,可視化模塊基于人機(jī)智能,將海量金融賬戶和場景數(shù)據(jù)可視化,提升信息的定量和定性可分析度。在與建設(shè)銀行的合作運(yùn)營過程中獲得了良好反饋。
所設(shè)計(jì)軟件經(jīng)調(diào)試已成功應(yīng)用于市場,其功能架構(gòu)如圖4 所示,包括通信層、數(shù)據(jù)層、應(yīng)用層、展現(xiàn)層和用戶層5個(gè)層次,且每個(gè)層次支撐相應(yīng)的模塊功能。
Fig.4 Functional architecture of the anti-money laundering software圖4 反洗錢軟件功能架構(gòu)
軟件所采用的業(yè)務(wù)流程如圖5 所示,總體可劃分為甄別、復(fù)核、審定和報(bào)告4 個(gè)階段。系統(tǒng)先建立案件,然后進(jìn)行數(shù)據(jù)采集,在案件甄別后提交入庫,后續(xù)通過提取案件信息、提取交易特征報(bào)告和提取分析結(jié)論,完成交易特征分析和報(bào)告編制。
Fig.5 Operation flow of the anti-money laundering software圖5 反洗錢軟件業(yè)務(wù)流程
可通過如圖6 所示的場景分析軟件功能,包括案件管理、報(bào)告管理、風(fēng)險(xiǎn)人員庫、戰(zhàn)法模型和分析圖表5 個(gè)模塊。
進(jìn)一步,圖7—圖9 給出了圖6 中各功能的實(shí)際使用執(zhí)行效果,包括“建立案件與模型分析”模塊,“報(bào)告管理與風(fēng)險(xiǎn)庫”模塊和“戰(zhàn)法模型與分析圖表”模塊。
由此可見,該反洗錢軟件系統(tǒng)各模塊協(xié)同完成了核心功能:洗錢案件類型分析、多類型數(shù)據(jù)分析、時(shí)空關(guān)聯(lián)關(guān)系分析、社會網(wǎng)絡(luò)集合分析及動態(tài)展示等。
Fig.6 Scenario application functions and features of the anti-money laundering software圖6 反洗錢軟件的場景應(yīng)用功能及特征
Fig.7 Case setup and model analysis module圖7 建立案件與模型分析模塊
Fig.8 Report management and risk library module圖8 報(bào)告管理與風(fēng)險(xiǎn)庫模塊
Fig.9 Warfare model and chart analysis module圖9 戰(zhàn)法模型與分析圖表模塊
將所設(shè)計(jì)軟件與賦能前的傳統(tǒng)人工方法進(jìn)行對比,耗時(shí)效果如表1 所示。數(shù)據(jù)來源為近年來應(yīng)用至全國幾大銀行反洗錢平臺的實(shí)際案例??梢姡捎密浖x能獲得的優(yōu)勢包括:
(1)分析戰(zhàn)法模型優(yōu)勢。反洗錢智能監(jiān)管系統(tǒng)內(nèi)嵌大量戰(zhàn)法模型,考慮國情和行業(yè)經(jīng)驗(yàn),方便業(yè)務(wù)人員快速上手。分析模型可復(fù)用,能幫助分析人員快速解決可疑賬單的交易特征分析問題,極大提高工作效率。
(2)分析服務(wù)優(yōu)勢。軟件通過設(shè)計(jì)數(shù)據(jù)接口和友好界面,便于提供售后、培訓(xùn)及分析服務(wù),保證客戶采購產(chǎn)品以后可以充分應(yīng)用于實(shí)戰(zhàn),解決當(dāng)前反洗錢業(yè)務(wù)中甄別難、分析難的實(shí)際工作問題。
(3)計(jì)算速度與應(yīng)用范圍優(yōu)勢。之前使用人工或?qū)<医?jīng)驗(yàn)判別的銀行,在面對海量數(shù)據(jù)記錄時(shí),通常難以挖掘數(shù)據(jù)關(guān)聯(lián)邏輯,計(jì)算耗時(shí)長,甚至部分案例無法求得最優(yōu)解。該軟件賦能后在計(jì)算流程、計(jì)算算法和數(shù)據(jù)處理技術(shù)方面實(shí)現(xiàn)了智能化,提升了求解效率。此外,引入改進(jìn)機(jī)器學(xué)習(xí)方法解決了海量有噪聲數(shù)據(jù)的訓(xùn)練和測試問題,適于復(fù)雜場景下的快速數(shù)據(jù)分析。
表2 對比了采用不同機(jī)器學(xué)習(xí)算法的軟件有效性。首先,對銀行目標(biāo)客戶的近30 天交易流水進(jìn)行數(shù)據(jù)清洗;然后,對原始交易數(shù)據(jù)序列進(jìn)行標(biāo)準(zhǔn)化;進(jìn)而,按訓(xùn)練集與測試集8∶2 比例進(jìn)行模型訓(xùn)練測試,推測可疑賬戶;最后,與經(jīng)過業(yè)務(wù)人員鑒別確定為真實(shí)的洗錢嫌疑賬戶進(jìn)行對比,分析準(zhǔn)確率。
表2 中的準(zhǔn)確率與F1 值為10 次實(shí)驗(yàn)所得計(jì)算結(jié)果的平均值??梢?,本文所設(shè)計(jì)軟件算法的準(zhǔn)確率可達(dá)85%以上,且F1 值較高,說明模型在數(shù)據(jù)分布不平衡的情況下取得了較好效果。
Table 1 Comparative analysis of the performance with and without the designed software表1 本文研發(fā)的軟件賦能前后效果比較
Table 2 Software performance comparison using different machine learning methods表2 采用不同機(jī)器學(xué)習(xí)方法的軟件性能比較
基于知識圖譜框架并結(jié)合反洗錢領(lǐng)域的實(shí)戰(zhàn)經(jīng)驗(yàn),考慮智能數(shù)據(jù)關(guān)聯(lián),將反洗錢措施流程化和智能化。提升性能包括:①實(shí)現(xiàn)反洗錢賬戶數(shù)據(jù)的智能采集和清洗;②根據(jù)業(yè)務(wù)特征實(shí)現(xiàn)智能分析和聚類;③滿足復(fù)雜多樣場景的分析需求,快速應(yīng)對多變的洗錢行為;④實(shí)現(xiàn)洗錢類罪自動匹配和識別,尤其反洗錢違法犯罪的類型;⑤報(bào)告及數(shù)據(jù)庫快速生成,界面友好易操作。
金融洗錢行為存在數(shù)據(jù)跨領(lǐng)域、手法多變的特點(diǎn)。對此,技術(shù)層面的創(chuàng)新包括:
(1)數(shù)據(jù)關(guān)聯(lián)架構(gòu)。從通信層、數(shù)據(jù)層、展現(xiàn)層、用戶層自下而上為反洗錢案件提供多維度分析,實(shí)現(xiàn)海量嫌疑樣本中的目標(biāo)精確快速鎖定,設(shè)定嫌疑資金流向自適應(yīng)跟蹤功能。
(2)全量的數(shù)據(jù)融合和關(guān)聯(lián)存儲。考慮案件和數(shù)據(jù)類型多變,按業(yè)務(wù)場景動態(tài)建模,并對多源異構(gòu)的海量賬戶數(shù)據(jù)進(jìn)行融合、特征抽取及關(guān)聯(lián)存儲,滿足軟件靈活性和快速性要求。
(3)基于動態(tài)圖數(shù)據(jù)的智能化。采用改進(jìn)的機(jī)器學(xué)習(xí)算法進(jìn)行數(shù)據(jù)挖掘,協(xié)助辦案分析人員快捷鎖定嫌疑賬戶的時(shí)空特性。采用人機(jī)智能的圖形化技術(shù)進(jìn)行3D 布局和地理信息系統(tǒng)軌跡描繪,為最終決策提供智能的圖形化證據(jù)鏈。
(4)基于業(yè)務(wù)積累的模型。以工作流的形式進(jìn)行反洗錢模型可視化設(shè)計(jì),避免復(fù)雜的手動編程,后續(xù)案件可直接調(diào)用。案件分析人員可根據(jù)經(jīng)驗(yàn)編寫和共享定制的分析模型,為后續(xù)維護(hù)和擴(kuò)展提供便利。
本文介紹了基于知識圖譜并考慮智能數(shù)據(jù)關(guān)聯(lián)的金融領(lǐng)域反洗錢軟件設(shè)計(jì)方法,并通過案例描述了該軟件的設(shè)計(jì)流程、銀行業(yè)應(yīng)用情況及創(chuàng)新思路。分析表明,在知識圖譜框架下將智能數(shù)據(jù)關(guān)聯(lián)和人工智能等技術(shù)融合,可實(shí)現(xiàn)從個(gè)體賦能到群體智能的軟件升級。該軟件在全國多家銀行和機(jī)構(gòu)運(yùn)行,相關(guān)評估顯示,相比傳統(tǒng)非智能軟件及人工排查反洗錢手段,本文所述軟件可有效提升洗錢甄別率。
據(jù)中國人民銀行反洗錢中心預(yù)測,未來3 年反洗錢報(bào)告機(jī)構(gòu)預(yù)估為現(xiàn)在的兩倍左右,銀行業(yè)約3 000 家,證券期貨業(yè)約800 家,反洗錢分析市場規(guī)模將達(dá)160 億。本文所述軟件方法為該需求下的大數(shù)據(jù)挖掘和應(yīng)用奠定了基礎(chǔ),也為各銀行金融機(jī)構(gòu)反洗錢業(yè)務(wù)提供了助力。