亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        “人工智能+金融大數(shù)據(jù)”客戶信用評估

        2020-07-14 17:47:44劉芳齊菲菲李祥霞
        中國管理信息化 2020年11期
        關(guān)鍵詞:深度學(xué)習(xí)人工智能

        劉芳 齊菲菲 李祥霞

        [摘? ? 要] 隨著大數(shù)據(jù)時代的到來,金融大數(shù)據(jù)應(yīng)用已成為行業(yè)熱點趨勢,使得面向金融的大數(shù)據(jù)技術(shù)吸引了越來越多的關(guān)注。從大量的金融數(shù)據(jù)中挖掘有價值的數(shù)據(jù)是非常重要的,與人工智能結(jié)合,由機器代替人去挖掘信息,可實現(xiàn)數(shù)據(jù)增值??蛻粜庞迷u估是金融的一個重要應(yīng)用,可根據(jù)訓(xùn)練樣本建立模型分析新用戶是否會違約,將客戶分成“信用客戶”和“違約客戶”。本文引入遷移學(xué)習(xí)和深度學(xué)習(xí),描繪了基本的流程,強調(diào)了機器學(xué)習(xí)用于客戶信用評估的優(yōu)勢。

        [關(guān)鍵詞] 人工智能;金融大數(shù)據(jù);客戶信用評估;遷移學(xué)習(xí);深度學(xué)習(xí)

        1? ? ? 引? ? 言

        近年來,中國經(jīng)濟走向新常態(tài),預(yù)計2017-2022年,中國金融行業(yè)大數(shù)據(jù)應(yīng)用市場規(guī)模年均復(fù)合增長率為55.21%,到2022年,達到497億元。隨著大數(shù)據(jù)時代的到來,金融大數(shù)據(jù)應(yīng)用已經(jīng)成為行業(yè)熱點,已經(jīng)廣泛應(yīng)用在精準(zhǔn)營銷、智能風(fēng)險評估、交易欺詐識別等領(lǐng)域,帶來了潛在的、巨大的社會效益和經(jīng)濟效益。國家開始重視金融大數(shù)據(jù),國務(wù)院發(fā)布《十三五國家科技創(chuàng)新規(guī)劃》,規(guī)劃中明確提出促進科技金融產(chǎn)品和服務(wù)創(chuàng)新、建設(shè)國家科技金融創(chuàng)新中心等。國務(wù)院頒布的《推進普惠金融發(fā)展規(guī)劃(2016-2020年)》中更是直接提到“鼓勵金融機構(gòu)運用大數(shù)據(jù)、云計算等新興信息技術(shù),打造互聯(lián)網(wǎng)金融服務(wù)平臺”。黨的十九大報告明確提出,要推動“互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實體經(jīng)濟深度融合”。國家、高校和企業(yè)開始重視金融大數(shù)據(jù),面向金融的大數(shù)據(jù)技術(shù)吸引了越來越多的關(guān)注。將從大量的金融數(shù)據(jù)中挖掘有價值的數(shù)據(jù)與人工智能相結(jié)合,由機器代替人去挖掘信息,可實現(xiàn)數(shù)據(jù)的增值。

        人工智能在金融領(lǐng)域中有很多應(yīng)用,如信用評估。信用評估是銀行業(yè)務(wù)經(jīng)營中非常重要的一個環(huán)節(jié)。信用風(fēng)險是借款人無愿望或者無力支付其所借貸的款項而產(chǎn)生的風(fēng)險。因此,需要有一個合適的方法對該風(fēng)險進行定性、定量,進而有效識別風(fēng)險,追求利益最大化。但是傳統(tǒng)方法更多的是基于人為的經(jīng)驗信息進行判斷,如通過信用評分卡。伴隨著金融大數(shù)據(jù)時代的到來,人為判斷不足以應(yīng)付快速產(chǎn)生的金融數(shù)據(jù),因此需要引入人工智能技術(shù),利用機器學(xué)習(xí)來處理金融大數(shù)據(jù),以有效地進行信用評估。

        人工智能越來越引起社會各界的關(guān)注。未來以金融大數(shù)據(jù)為背景,推動發(fā)展人工智能在信用評估方面的應(yīng)用,將會給行業(yè)發(fā)展帶來不可限量的增長。

        在評估的過程中,有訓(xùn)練集和測試集。根據(jù)訓(xùn)練樣本建立模型分析新用戶是否會違約,分成“信用客戶” 和“違約客戶”。在訓(xùn)練階段,常常面臨的一個問題是兩類客戶比例分布不均衡,即“好客戶”占多數(shù),而“壞客戶”只占少數(shù)。在這種類別不均衡的情況下,找到一個好的方法建立模型,很好地預(yù)測新客戶是非常重要的。

        在此背景下,本文根據(jù)我國金融的發(fā)展,引入機器學(xué)習(xí)中的遷移學(xué)習(xí)(Transfer Learning,TL)[1]和深度學(xué)習(xí)(Deep Learning,DL)[2]。遷移學(xué)習(xí)技術(shù)是利用以前所學(xué)的先驗知識和技巧應(yīng)用于新任務(wù)的學(xué)習(xí)。換句話說,遷移學(xué)習(xí)可以借助源領(lǐng)域中的知識來幫助目標(biāo)域的學(xué)習(xí)。目前遷移學(xué)習(xí)已經(jīng)應(yīng)用于文本、圖片、情感、視頻等領(lǐng)域,并取得了一定的成果。筆者期望利用遷移學(xué)習(xí)技術(shù)來幫助金融大數(shù)據(jù)的學(xué)習(xí),通過遷移其他領(lǐng)域的客戶信息來建立客戶信用評估模型,進而解決少數(shù)類樣本稀疏帶來的類別不平衡問題。深度學(xué)習(xí)是人工智能浪潮的巨大推動力之一。在金融服務(wù)中深度學(xué)習(xí)通過在大數(shù)據(jù)中尋找規(guī)律,減少了人工介入和人為干涉,預(yù)測客戶信用評估的結(jié)果。一般是通過分層特征提取并通過激活函數(shù)尋找關(guān)聯(lián)關(guān)系,解決金融大數(shù)據(jù)。最終將模型應(yīng)用于銀行等金融大數(shù)據(jù)分析中。

        2? ? ? 相關(guān)工作

        針對金融領(lǐng)域中的信用評估問題對人工智能技術(shù)提出的新挑戰(zhàn),本文將描述人工智能技術(shù)在金融大數(shù)據(jù)中的應(yīng)用,并基于遷移學(xué)習(xí)、深度學(xué)習(xí)將此模型應(yīng)用于客戶信用評估。

        2.1? ?遷移學(xué)習(xí)

        從心理學(xué)和人類智能的角度來看,人類具有利用以前學(xué)過的知識幫助新內(nèi)容學(xué)習(xí)的能力。比如:一個人騎自行車技術(shù)很好,那么他在學(xué)騎摩托車過程中就會非常容易;若是一個人對彈鋼琴比較熟悉,那么她會輕松的學(xué)會彈古箏。在機器視覺領(lǐng)域中,遷移學(xué)習(xí)的思想源于 1995 年 NIPS-95 的專題研討會。會上開展了關(guān)于“學(xué)會學(xué)習(xí)(Learning to Learn)”的討論。從 1995 年開始,關(guān)于遷移學(xué)習(xí)的研究已經(jīng)引起了眾多關(guān)注,并有多個不同名稱:學(xué)會學(xué)習(xí)、知識轉(zhuǎn)移、終身學(xué)習(xí)、多任務(wù)學(xué)習(xí)、歸納轉(zhuǎn)移、知識整合等[3]。

        在 2005 年,美國國防高級研究計劃局(DARPA)的信息處理技術(shù)辦公室(IPTO)對遷移學(xué)習(xí)進行了定義:遷移學(xué)習(xí)技術(shù)能夠遷移以前學(xué)到的知識和技能,并將這部分應(yīng)用于目標(biāo)域中的新任務(wù)學(xué)習(xí)。其中,遷移學(xué)習(xí)的目的是從一個或多個源任務(wù)中提取知識,并遷移這部分知識應(yīng)用于目標(biāo)域中的任務(wù)學(xué)習(xí)。在這一年,NIPS 國際會議上給出了一個關(guān)于遷移學(xué)習(xí)的比較有代表性的定義:遷移學(xué)習(xí)目的是在不同但相似的領(lǐng)域、任務(wù)和分布之間進行知識的遷移。具體的描述如下:

        定義(遷移學(xué)習(xí))[1]:給定源域和學(xué)習(xí)任務(wù),遷移學(xué)習(xí)旨在利用和中學(xué)習(xí)到的知識,并遷移這部分知識來幫助目標(biāo)域中預(yù)測函數(shù)的學(xué)習(xí)。

        圖1展示了傳統(tǒng)的機器學(xué)習(xí)與遷移學(xué)習(xí)的學(xué)習(xí)過程之間的不同之處。從圖1可以看出,前者的目標(biāo)是對每個任務(wù)進行學(xué)習(xí),然而后者的目標(biāo)是利用少量的有標(biāo)簽訓(xùn)練數(shù)據(jù),通過遷移源領(lǐng)域中的任務(wù)知識幫助目標(biāo)任務(wù)的學(xué)習(xí)。

        2.2? ?深度學(xué)習(xí)

        深度學(xué)習(xí)的概念最先有這個想法的是G.E. Hinton等人[4]在2006年提出,主要就是將樣本數(shù)據(jù)通過一定的訓(xùn)練方法得到多層網(wǎng)絡(luò)結(jié)構(gòu)的機器學(xué)習(xí)過程。最初提出的依據(jù)是模擬人類大腦結(jié)構(gòu),通過對大腦吸收的信號進行處理,然后給出數(shù)據(jù)解釋。以圖像數(shù)據(jù)為例,靈長類的視覺系統(tǒng)中對這類信號的處理順序依次為:首先是檢測邊緣、紋理等簡單的初始形狀特征,然后再逐步形成更復(fù)雜的視覺形狀。同樣地,深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示、屬性類別或特征,給出數(shù)據(jù)的分層特征表示。

        深度學(xué)習(xí)從數(shù)據(jù)中自動學(xué)習(xí)特征,從而代替人工設(shè)計特征。把原始數(shù)據(jù)通過一些簡單的但是非線性的模型,逐層變化提取特征,進而變成為更高層次的,更加抽象的表達,且深層的結(jié)構(gòu)使其具有很強的表達能力和學(xué)習(xí)能力。

        深度學(xué)習(xí)有著廣泛的應(yīng)用,例如:圖像分類、語音識別、物品檢測和內(nèi)容描述。目前已經(jīng)提出很多深度學(xué)習(xí)的方法,有卷積網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)、超網(wǎng)絡(luò)等,

        3? ? ? “人工智能+金融大數(shù)據(jù)”客戶信用評估流程

        利用遷移學(xué)習(xí)和深度學(xué)習(xí)進行客戶信用評估,詳細的流程如下所述。

        3.1? ?遷移學(xué)習(xí)+客戶信用評估

        客戶信用評估是非常重要的一項,目前機構(gòu)只采用自有的信息進行客戶信用評估,忽略了其他領(lǐng)域帶來的額外信息。比如,如某客戶可能在工商銀行借貸,同時也在建設(shè)銀行借貸,本文認(rèn)為如果某客戶在工商銀行是“信用客戶”,那么在建設(shè)銀行很大程度上也是“信用客戶”,否則為“違約客戶”。通過遷移其他領(lǐng)域的信息,可以更好地幫助評估客戶,有效預(yù)防風(fēng)險。

        如圖2中所示,在利用遷移學(xué)習(xí)進行客戶信用評估中,遷移其他領(lǐng)域的客戶信息幫助目標(biāo)域?qū)W習(xí)。與傳統(tǒng)的客戶信用評估學(xué)習(xí)不同,學(xué)習(xí)器只能利用當(dāng)前目標(biāo)域的客戶信息進行學(xué)習(xí)預(yù)測,沒有額外的信息。因而該問題轉(zhuǎn)變?yōu)檫w移其他領(lǐng)域的客戶信息幫助目標(biāo)域客戶信用評估。同時,由于不同領(lǐng)域的特征分布不一致,學(xué)習(xí)器還應(yīng)解決領(lǐng)域特征分布不一致的問題。下面詳細描述利用遷移學(xué)習(xí)評估客戶信用的過程。

        (1)考慮客戶來自不同業(yè)務(wù)的遷移知識信用評估。在客戶進行金融業(yè)務(wù)中,客戶可能會辦理不同的業(yè)務(wù),比如在某銀行辦理貸款業(yè)務(wù)、基金投資、股票投資等銀行業(yè)務(wù)。如果某客戶在辦理其他業(yè)務(wù)擁有很好的信用時,本文認(rèn)為在信用還貸上很可能歸類為“信用客戶”,否則為“違約客戶”。因此,需要考慮客戶在進行不同業(yè)務(wù)辦理時,遷移客戶信息進行建立信用評估模型的問題。這個過程需要研究:①如果客戶信用評估選擇了考慮客戶業(yè)務(wù)信息,那評估應(yīng)該選擇一項銀行業(yè)務(wù)信息還是多項業(yè)務(wù)信息?如果選擇了一項業(yè)務(wù)信息,則如何遷移有效的客戶業(yè)務(wù)信息幫助目標(biāo)客戶信用評估?②如果選擇了多項業(yè)務(wù)協(xié)同幫助目標(biāo)客戶信用評估,則應(yīng)如何建立合理的數(shù)學(xué)模型,實現(xiàn)知識的協(xié)同有效遷移?

        (2)考慮客戶來自不同銀行的遷移知識信用評估。在客戶進行業(yè)務(wù)辦理存在中,客戶可能會的過程在不同的銀行辦理業(yè)務(wù)信息,如某客戶可能在工商銀行借貸,同時也在建設(shè)銀行借貸。本文認(rèn)為如果某客戶在工商銀行是“信用客戶”,那么在建設(shè)銀行很大程度上也是“違約客戶”。因此,需要考慮不同銀行客戶信息進行客戶信用評估問題:①如果客戶信用評估選擇了考慮銀行信息,那評估應(yīng)該選擇一家銀行還是多家銀行?如果選擇了一家銀行,則如何遷移該銀行客戶信息幫助目標(biāo)客戶信用評估?②如果選擇了多家銀行共同幫助客戶信用評估,則應(yīng)如何建立合理的數(shù)學(xué)模型進而有效預(yù)測“信用客戶”和“違約客戶”。

        (3)領(lǐng)域特征分布不一致對于目標(biāo)域的學(xué)習(xí)有著重要的影響。為了進一步提高客戶信用評估的預(yù)測率,學(xué)習(xí)器還要解決領(lǐng)域分布不一致的問題。領(lǐng)域知識的遷移最有利于目標(biāo)域客戶信息的評估,考慮利用領(lǐng)域自適應(yīng)(Domain Adaptation)來解決這個問題。領(lǐng)域自適應(yīng)將不同領(lǐng)域(如兩個不同的數(shù)據(jù)集)的數(shù)據(jù)特征映射到同一個特征空間,這樣可利用其他領(lǐng)域數(shù)據(jù)來增強目標(biāo)領(lǐng)域訓(xùn)練,最大化地減小領(lǐng)域間的分布差異,有效解決領(lǐng)域間數(shù)據(jù)分布的變化。根據(jù)領(lǐng)域自適應(yīng)研究解決遷移知識領(lǐng)域特征分布不一致方法,嘗試建立基于遷移學(xué)習(xí)的客戶信用評估模型,提高預(yù)測率。

        在基于遷移學(xué)習(xí)的客戶信用評估中,闡述了遷移哪部分知識用于遷移,以及遷移過程中需要解決的問題。

        3.2? ?深度學(xué)習(xí)+客戶信用評估

        利用深度學(xué)習(xí)技術(shù)來進行客戶信用評估是一種趨勢,深度學(xué)習(xí)可以學(xué)習(xí)更高層的特征用于預(yù)測風(fēng)險。尤其金融大數(shù)據(jù)時代的到來,傳統(tǒng)方法已經(jīng)不能滿足金融數(shù)據(jù)的需求。深度學(xué)習(xí)可以有效處理大數(shù)據(jù),挖掘潛在數(shù)據(jù)價值,有效完成評估。

        利用深度學(xué)習(xí),建立如圖3所示的客戶信用評估整體模型框架,整個模型可以分為三部分:

        (1)客戶信用數(shù)據(jù)的獲取。一方面,客戶信用數(shù)據(jù)可以利用標(biāo)準(zhǔn)信用數(shù)據(jù)集。另一方面,也可以從各大銀行獲取有效客戶信用數(shù)據(jù)進行客戶預(yù)測。

        (2)客戶信用數(shù)據(jù)的特征提取。如圖3所示,客戶信用數(shù)據(jù)采用One-hot進行編碼。輸入數(shù)據(jù)包括兩部分,一個是靜態(tài)數(shù)據(jù),如描述用戶的基本屬性的性別、職業(yè)等;另一個為動態(tài)數(shù)據(jù),主要包括用戶的銀行流水記錄、信用卡賬單記錄。經(jīng)過數(shù)據(jù)編碼后,得到客戶信用數(shù)據(jù)的特征表示。

        (3)深度學(xué)習(xí)框架下,高級特征的學(xué)習(xí)及客戶的預(yù)測率。如圖3所示,數(shù)據(jù)經(jīng)過編碼后輸入到神經(jīng)網(wǎng)絡(luò)中,通過分層學(xué)習(xí)到特征表示,進而建立合理的模型,得到 “信用客戶”與“違約客戶”的預(yù)測率。

        DNN(Deep Neural Network)神經(jīng)網(wǎng)絡(luò)模型又叫全連接神經(jīng)網(wǎng)絡(luò),是基本的深度學(xué)習(xí)框架。DNN模型表達能力強,能夠?qū)W習(xí)出高階非線性特征,具有特征交叉能力的特點。

        本文將One-hot類型的特征輸入到DNN進行客戶信用評估預(yù)測,如圖3所示。DNN方法不斷發(fā)展,其基本架構(gòu)模型不斷改變。比如Wide and deep 模型是Tensor Flow在 2016 年 6 月左右發(fā)布的一類用于分類和回歸的模型[5]。Wide and deep 模型的核心思想是結(jié)合線性模型的記憶能力(memorization)和 DNN 模型的泛化能力(generalization)。Wide 端對應(yīng)的是線性模型,輸入特征可以是連續(xù)特征,也可以是稀疏的離散特征,離散特征之間進行交叉后可以構(gòu)成更高維的離散特征。線性模型訓(xùn)練中通過 L1 正則化,能夠很快收斂到有效的特征組合中。Deep 端對應(yīng)的是 DNN 模型,每個特征對應(yīng)一個低維的實數(shù)向量,稱之為特征的 embedding。DNN 模型通過反向傳播調(diào)整隱藏層的權(quán)重,并且更新特征的 embedding。Wide and deep 整個模型的輸出是線性模型輸出與 DNN 模型輸出的疊加,如圖4所示。

        DeepFM模型[6]的提出,包含兩部分:神經(jīng)網(wǎng)絡(luò)部分與因子分解機部分,分別負責(zé)低階特征的提取和高階特征的提取。這兩部分共享同樣的輸入,如圖5所示。

        通過DNN模型的改進模型,本文也將學(xué)習(xí)到的One-hot類型的特征輸入Wide and deep 模型和DeepFM模型,通過交叉組合可以得到dense特征,dense特征進一步再通過神經(jīng)網(wǎng)絡(luò)模型,得到最后的預(yù)測。

        4? ? ? 結(jié)? ? 語

        本文詳細介紹了“人工智能+金融大數(shù)據(jù)”客戶信用評估總體框架和基本思路??蛻粜庞迷u估是金融機構(gòu)中一項重要的組成部分,人工智能技術(shù)的引入,為解決客戶評估問題提供了一個有效的路徑。其價值在于快速高效地完成客戶評估,為金融機構(gòu)有效識別違約客戶群。

        為更好地提升“人工智能+金融大數(shù)據(jù)”客戶信用評估的效率和效果,需要做好:①擴展數(shù)據(jù)。用于訓(xùn)練集和測試集的客戶數(shù)據(jù),合理的數(shù)據(jù)可以更好地檢驗?zāi)P?,有效地完成預(yù)測;②完善模型。引入人工智能技術(shù),不斷完善基于遷移學(xué)習(xí)和深度學(xué)習(xí)的客戶信用評估模型,以便適應(yīng)時代變化、個人信息變化和政策變化。

        主要參考文獻

        [1]Pan S J, Yang Q. A Survey on Transfer Learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10):1345-1359.

        [2]Minar M R , Naher J . Recent Advances in Deep Learning: An Overview[J/OL].ResearchGate,2018.

        [3]Henri J,Dillon K. Learning to learn[J]. Australian Library Journal, 1992,41(2):103-117.

        [4]Hinton G, Osindero S, Teh Y-W. A Fast Learning Algorithm for Deep Belief Nets[J]. Neural Computation, 2006,18(7):1527-1554.

        [5]Cheng H T,Koc L,Harmsen J,et al.Wide & Deep Learning for Recommender Systems[J/OL]. ResearchGate,2016.

        [6]Lian J , Zhou X , Zhang F , et al. xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems[J/OL]. ResearchGate,2018.

        猜你喜歡
        深度學(xué)習(xí)人工智能
        我校新增“人工智能”本科專業(yè)
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
        軟件工程(2016年8期)2016-10-25 15:47:34
        国产农村三片免费网站| 国产剧情亚洲一区二区三区| 韩国一区二区三区黄色录像| 精品人妻一区二区三区四区在线| 亚洲欧美激情精品一区二区| a级毛片高清免费视频就| 最新国产乱视频伦在线| 亚洲国产日韩综一区二区在性色| 国产黄三级三级三级三级一区二区| 一本色道久久综合亚洲| 日本伊人精品一区二区三区| 欧美大片aaaaa免费观看| 99国产精品无码| 日韩高清无码中文字幕综合一二三区| 中文字幕a区一区三区| 日本高清不卡二区三区| 黄射视频在线观看免费| wwww亚洲熟妇久久久久| 久久免费国产精品| 国产国拍亚洲精品福利| 日本精品中文字幕人妻| 亚洲爆乳精品无码一区二区三区 | 五月婷婷开心五月激情| 91九色老熟女免费资源| 亚洲色无码国产精品网站可下载 | 一区二区三区中文字幕在线播放| av中文字幕潮喷人妻系列| 亚洲精品国产成人AV| 久久这里都是精品一区| 网红极品女神精品视频在线 | 337p粉嫩日本欧洲亚洲大胆| 亚洲精品久久久久中文字幕二区| 国产精品无码Av在线播放小说| 色婷婷一区二区三区77| 色综合天天综合欧美综合 | 女人被男人爽到呻吟的视频| 国产精品午夜爆乳美女视频| 精品 无码 国产观看| 午夜视频在线观看国产| 无码av中文一区二区三区桃花岛| 玩弄人妻少妇500系列网址|