許多人工智能專家常說AI最適合應(yīng)用于金融行業(yè)。因為金融是歷史記錄數(shù)據(jù)最豐富且準確的領(lǐng)域之一,甚至斷言金融行業(yè)將被AI取代。但有個極大的問題是,人工智能無法解釋自己的行為,這使得強監(jiān)管的金融行業(yè)很難大規(guī)模采用AI。
當銀行考慮采用人工智能時,這個所謂的“黑盒子”問題就會反復(fù)出現(xiàn),無論是信用評分,貸款還是其它類型業(yè)務(wù)。一位長期從事金融風(fēng)控領(lǐng)域的業(yè)內(nèi)高管直言,傳統(tǒng)銀行普遍都希望利用社交網(wǎng)站來進行營銷,但如果銀行不能明確掌握所有客戶屬性數(shù)據(jù),就很容易被合規(guī)部門擋下。
這類限制使得銀行在AI導(dǎo)入的實際業(yè)務(wù)上,存在著理想與現(xiàn)實的巨大落差。根據(jù)“麻省理工斯隆管理評論”(MTT Sloan ManagementReview)與“波士頓顧問集團”(The BostonConsulting Group)于2017年所做研究”RESHAPING BUSINESS WITH ARTIFICIALINTELLIGENCE”,調(diào)查人工智能在各行業(yè)的被采納程度。結(jié)果金融服務(wù)業(yè)評估目前AI對其產(chǎn)品服務(wù)、工作流程的影響程度僅約10%,
甚至許多情況下,銀行即便導(dǎo)入AI,效果也不如想象神奇。例如金融機構(gòu)導(dǎo)入傳統(tǒng)規(guī)則引擎系統(tǒng)來進行檢核其實已行之有年,但缺點是真實金融場景的維度太多,人工定義的規(guī)則引擎無法做到很精準判別。為了寧枉勿縱,系統(tǒng)就存在大量誤報。因此即使采用規(guī)則引擎,對人工審核的要求仍然非常巨大。
“國際上各大金融機構(gòu)對反洗錢都是投入大量的人力,人工審核部門都非常巨大?!币晃粯I(yè)內(nèi)人士表示,這除了使成本居高不下之外,更大的風(fēng)險是繁復(fù)檢核容易使客戶不滿、甚至失去客戶。業(yè)者解釋,洗錢行為必須經(jīng)過司法部門調(diào)查才能確立罪責(zé),所以要求要很強的解釋性。如果A1只能指出某個帳號可疑,卻無法自我解釋原因時,調(diào)查人員就無法據(jù)以展開進一步調(diào)查。
而機器學(xué)習(xí)中的一個晚近分支——無監(jiān)督式學(xué)習(xí)(UML),正是一種能夠自我解釋的AI。
無監(jiān)督式學(xué)習(xí)是機器學(xué)習(xí)的一種方式,訓(xùn)練時不需要人力給予標簽,僅須對機器提供數(shù)據(jù)輸入。因為沒有預(yù)設(shè)標簽,無監(jiān)督式學(xué)習(xí)機器不會知道其分類結(jié)果是否正確,但優(yōu)點在于它會自動從數(shù)據(jù)中找出潛在的規(guī)則,因此其結(jié)果具有較強的可解釋性。臉書人工智能負責(zé)人、也是AI領(lǐng)域最有影響力的專家之一的Yann LeCun,就多次提倡無監(jiān)督式學(xué)習(xí)是AI技術(shù)的未來。
有監(jiān)督機器學(xué)習(xí)模型通常單獨查看每個賬戶,類似于每次看這幅畫中的一個點。無監(jiān)督機器學(xué)習(xí)可分析賬戶間的關(guān)聯(lián)性,即便個體賬戶無任何可疑表象,也能從數(shù)據(jù)中檢測到可疑模型。這種方式類似于我們能看到并理解畫中的整體圖案而不是每一點,即便每個點的顏色和形狀都不盡相同
DataVisor聯(lián)合創(chuàng)始人兼CEO謝映蓮(左)、DataVisor CTO俞舫(右)
無監(jiān)督式學(xué)習(xí)雖已在學(xué)研界是一大主流方向,但在產(chǎn)業(yè)界大規(guī)模成功應(yīng)用的例子還并不多,用于金融領(lǐng)域的更是少之又少。但一家由兩名華人女性共同在美國硅谷創(chuàng)辦的人工智能新創(chuàng)公司DataVisor,卻是最領(lǐng)先將無監(jiān)督式學(xué)習(xí)應(yīng)用在金融領(lǐng)域的公司之一。
DataVisor以“無監(jiān)督機器學(xué)習(xí)”(UML)引擎為核心,結(jié)合傳統(tǒng)自動規(guī)則引擎和全球數(shù)據(jù)庫,致力于解決金融領(lǐng)域的在線欺詐和金融犯罪檢測難題,可對每小時新發(fā)生的10億數(shù)量級的事件進行分析,自動判斷并發(fā)現(xiàn)潛在的惡意攻擊,至今在全球范圍內(nèi)已處理超6000億用戶事件和1.4億壞用戶,保護全球40億互聯(lián)網(wǎng)用戶,最近并入選《華爾街日報》最新發(fā)布的“2018最值得關(guān)注科技公司Top25”榜單。
DT君獨家專訪DataVisor,剖析無監(jiān)督機器學(xué)習(xí)在金融領(lǐng)域的應(yīng)用優(yōu)勢。聯(lián)合創(chuàng)始人兼CEO謝映蓮說明,金融行業(yè)數(shù)據(jù)豐富,但數(shù)字化并不完善,這是對所有機器學(xué)習(xí)模式的一個普遍存在的挑戰(zhàn)。而無監(jiān)督式學(xué)習(xí)的好處在于對數(shù)據(jù)缺失的容忍力較高,并不依賴數(shù)據(jù)的完整性。
“無監(jiān)督機器學(xué)習(xí)的優(yōu)勢是可以將海量數(shù)據(jù)在沒有標簽的情況下進行檢測,且產(chǎn)出的結(jié)果具有很強的可解釋性。”謝映蓮進一步說明,無監(jiān)督式學(xué)習(xí)是機器學(xué)習(xí)的一個分支,相較于監(jiān)督式學(xué)習(xí)和強化學(xué)習(xí)等其它分支,無監(jiān)督學(xué)習(xí)并不需要人力來輸入標簽,而是主動實時找尋新的模式,進行新的學(xué)習(xí)。
為何無監(jiān)督式學(xué)習(xí)有助于解決人工智能在金融行業(yè)應(yīng)用的痛點呢?
“這跟金融行業(yè)自身的發(fā)展改變有關(guān)”,DataVisor聯(lián)合創(chuàng)始人兼CTO俞舫解釋,“過去金融工具比較單純,欺詐形式與危害程度都比較有限。但現(xiàn)在網(wǎng)路交易愈來愈頻繁,犯罪形式也日新月異,等到有標簽后再做機器學(xué)習(xí)很多時候已經(jīng)晚了,在反應(yīng)新型攻擊上是非常滯后的?!?/p>
而無監(jiān)督學(xué)習(xí)可以使海量數(shù)據(jù)在沒有標簽的情況下進行檢測,把群組性的異常找出來,且產(chǎn)出的結(jié)果具有很強的可解釋性,甚至能在攻擊未發(fā)生前就防患于未然。以國內(nèi)猖獗的網(wǎng)絡(luò)黑產(chǎn)主導(dǎo)的數(shù)字金融欺詐為例,DataVisor中國區(qū)總經(jīng)理吳中說明,金融欺詐如要惡意轉(zhuǎn)帳,通常會有個過程。首先攻擊者需要創(chuàng)建大量惡意帳號,接著需要“養(yǎng)號”,也就是為帳號制造一些貌似正常的紀錄,接下來才能用這些帳號進行欺詐。而傳統(tǒng)規(guī)則引擎、或有標簽的監(jiān)督式學(xué)習(xí),比較難檢測出養(yǎng)號早期、貌似正常的惡意帳號。無監(jiān)督式學(xué)習(xí)則是會主動把群組性的異常找出來,提供人員進行預(yù)判。
吳中觀察,正因國內(nèi)黑產(chǎn)盛行,可以看到金融機構(gòu)將對人工智能產(chǎn)生更多的需求,會更有意識地去探索。在數(shù)據(jù)飛速增長的情況下,國內(nèi)金融機構(gòu)勢必將進入升級換代的過程。盡管目前仍有其限制,但整個行業(yè)已在加速奔向由人工智能驅(qū)動的未來。沒人能夠真正準確預(yù)測人工智能下一個突破將何時出現(xiàn),但更有意識地探索,將是保持領(lǐng)先的關(guān)鍵。(摘自美《深科技》)(編輯/華生)