亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        貝葉斯網(wǎng)絡(luò)在預(yù)測銀行信貸風險中的應(yīng)用

        2014-03-26 02:53:42周森鑫吳德成
        關(guān)鍵詞:數(shù)據(jù)挖掘模型

        周森鑫,李 超,吳德成

        (安徽財經(jīng)大學 管理科學與工程學院,安徽 蚌埠 233000)

        一 引言

        隨著我國金融體制改革的深入發(fā)展,銀行作為信貸中心的地位日益突出。與此同時,貸款糾紛不斷發(fā)生,借款人拖欠貸款的現(xiàn)象非常普遍,拖欠數(shù)額也十分驚人,從而嚴重地影響了信貸工作的正常進行。[1]因此,如果能夠根據(jù)先前的貸款拖欠數(shù)據(jù)預(yù)測哪些潛在客戶可能在償還貸款時有問題,就可以對這些存在“不良風險”的客戶減少貸款額度或者是提供其他產(chǎn)品,這對銀行加強風險管理是一個有效途徑。

        貝葉斯網(wǎng)絡(luò)(Bayesian network)作為一種概率推理方法,目前已經(jīng)成為人工智能領(lǐng)域的研究熱點之一。[2]但是大多數(shù)文獻的研究點側(cè)重于談?wù)撠惾~斯網(wǎng)絡(luò)運用于操作風險管理的思路和框架,結(jié)合銀行實際操作流程的深入探討比較少。[3]Alexander(2000,2003)最早研究了貝葉斯網(wǎng)絡(luò)在特定類型的操作風險方面的應(yīng)用。國內(nèi)方面,陸靜等(2012)建立了基于貝葉斯網(wǎng)絡(luò)的商業(yè)銀行全面風險預(yù)警系統(tǒng)。[4,5]劉家鵬(2008)通過建立一個客戶流失模型說明了貝葉斯網(wǎng)絡(luò)的作用。

        本文旨在運用貝葉斯網(wǎng)絡(luò)方法,將已經(jīng)存在的、表面看似不相關(guān)的屬性結(jié)合起來構(gòu)建概率模型,以此預(yù)測潛在償還貸款可能存在問題的客戶,并通過制定相應(yīng)的風險控制或為他們提供其1他產(chǎn)品來減少銀行貸款風險。

        二 CRISP-DM過程描述

        CRISP-DM (cross-industry standard process for data mining),即為“跨行業(yè)數(shù)據(jù)挖掘標準流程”,為一個KDD工程提供了一個完整的過程描述。[6,7]該模型將一個KDD工程分為6個不同的階段。

        1.商業(yè)理解。

        這一階段的主要任務(wù)是確定商業(yè)目標,即從商業(yè)角度確定項目的目標和所要達到的效果,然后根據(jù)這種知識確定數(shù)據(jù)挖掘的目標。在本文中,該目標就是利用銀行現(xiàn)有的真實數(shù)據(jù),采用最合適的任務(wù)安排和挖掘算法,為銀行提供一個現(xiàn)成可用的,經(jīng)過評估的貸款拖欠者預(yù)測模板,而不需要用戶自己建立模型就可以解決實際問題。

        2.數(shù)據(jù)理解。

        數(shù)據(jù)理解的關(guān)鍵是數(shù)據(jù)源的選擇。本示例為了獲得現(xiàn)有的貸款拖欠數(shù)據(jù),需要從名為 bankloan.sav 的數(shù)據(jù)文件中把流bayes_bankloan.str選擇出來。然后為數(shù)據(jù)源添加一個類型節(jié)點,我們可以看出,影響default的因素有:年齡、學歷、最近工作的工齡、收入、信用卡債務(wù)、其他債務(wù)......

        3.數(shù)據(jù)準備。

        在構(gòu)建模型時,有些目標字段的值不完整或者是空值,如果不經(jīng)過數(shù)據(jù)的處理直接進行數(shù)據(jù)的使用,可能會導(dǎo)致預(yù)測結(jié)果的錯誤,為了排除這些觀測值以防止在模型評估中使用,就需要對數(shù)據(jù)進行處理。在例中,我們?yōu)轭愋凸?jié)點添加一個選擇節(jié)點,并在在“條件”框中,輸入 default = '$null$',這樣就可以達到對數(shù)據(jù)進行缺失處理的目的。

        4.模型建立。

        Clementine提供了多種預(yù)測算法,如C5.0、神經(jīng)網(wǎng)絡(luò)、Logistic回歸等,本文中我們選用貝葉斯網(wǎng)絡(luò)節(jié)點建模,具體的操作過程如下所示。

        Step 1 :將一個類型節(jié)點添加到源節(jié)點bankloan.sav,并將default字段的方向設(shè)置為輸出,其他所有字段的方向設(shè)置為輸入。

        Step 2 :由于我們構(gòu)建了多個不同類型的貝葉斯網(wǎng)絡(luò),要對它們進行比較,從而確定哪個模型具有最好的預(yù)測效果。因此我們在選擇節(jié)點之后添加三個貝葉斯網(wǎng)絡(luò)節(jié)點,將模型的名稱分別設(shè)置為“TAN”“Markov”“Markov-FS”,其中第三個模型不僅具有馬爾科夫覆蓋結(jié)構(gòu),而且使用了特征選擇預(yù)處理來選擇與目標變量有重大關(guān)聯(lián)的輸入。

        Step 3 :通過運行上述三個貝葉斯網(wǎng)絡(luò)節(jié)點就可以生成相應(yīng)模型,在這里我們可以查看它們的詳細信息,如圖1所示。可以看出,左列包含節(jié)點網(wǎng)絡(luò)圖,可顯示目標與其最重要預(yù)測變量之間的關(guān)系,以及各預(yù)測變量之間的關(guān)系;右側(cè)顯示變量的重要性,它表示評估模型時每個變量的相對重要性。

        圖1 貝葉斯網(wǎng)絡(luò)及變量重要性圖

        Step 4 :將TAN模型塊附加到選擇節(jié)點,將Markov模型塊附加到TAN節(jié)點,將Markov-FS模型塊附加到Markov節(jié)點。

        Step 5 : 為了避免輸入,要重新命名評估圖形上的模型輸出。將過濾節(jié)點附加到 Markov-FS 模型塊。在右側(cè)的字段欄中,將 $B-default、$B1-default 和 $B2-default 分別重新命名為 TAN、Markov和 Markov-FS。

        Step 6 :將評估圖形節(jié)點附加到過濾節(jié)點上,然后使用圖形節(jié)點的默認設(shè)置來執(zhí)行它。這樣就可以生成一個收益圖表。

        圖2 模型評估結(jié)果圖

        圖2顯示,每個模型類型都生成了相似的結(jié)果,但是馬爾可夫模型要稍微好一些。但是要檢查每個模型的預(yù)測效果,我們更傾向于使用分析節(jié)點而不是評估圖形。

        三 模型分析

        為了從多種模型中選擇最佳預(yù)測效果的模型,需要利用預(yù)測集的數(shù)據(jù)來檢驗?zāi)P偷臏蚀_度,對數(shù)據(jù)流的執(zhí)行結(jié)果進行評估。我們將分析節(jié)點附加到過濾節(jié)點上,然后使用分析節(jié)點的默認設(shè)置來執(zhí)行。在完成模型實施階段之后,數(shù)據(jù)流設(shè)計中的數(shù)據(jù)流圖如圖x所示:

        圖3 模型實施階段數(shù)據(jù)流圖界面

        圖3展示了數(shù)據(jù)挖掘流程的一個完整過程,這些步驟是在數(shù)據(jù)挖掘工具的指導(dǎo)下一步步自主建立的。完全符合CRISP-DM標準流程,并且將數(shù)據(jù)挖掘的流程可視化地展示在用戶面前,能夠讓用戶了解并指導(dǎo)數(shù)據(jù)挖掘的全過程。

        通過運行分析節(jié)點,我們可以得到每個模型的預(yù)測效果,具體結(jié)果如圖4所示:

        圖4 模型預(yù)測數(shù)據(jù)分析圖

        圖4顯示了依據(jù)正確和不正確的預(yù)測百分比得出的準確性。就像前面的“評估圖形”一樣,本圖顯示馬爾可夫模型在正確預(yù)測方面要稍微好一些,但是,Markov-FS 模型僅落后馬爾可夫模型幾個百分點。這可能就意味著使用 Markov-FS 模型要更為方便一些,因為它計算結(jié)果所需的輸入更少,因此節(jié)省了數(shù)據(jù)收集和輸入的時間以及處理時間。

        四 總結(jié)

        首先,本文詳細地介紹了數(shù)據(jù)挖掘工具在預(yù)測銀行貸款拖欠方面的實際需求,通過一個簡單、完整的實例,從商業(yè)理解、數(shù)據(jù)理解、數(shù)據(jù)準備、模型建立、模型比較到部署實施,將CRISP-DM通過可視化的方式展示出來,最后通過對實際數(shù)據(jù)的分析結(jié)果,得出最準確的預(yù)測模型,并且使用戶能夠很容易的掌握數(shù)據(jù)挖掘的具體操作,具有切實可操作性。

        其次,貝葉斯網(wǎng)絡(luò)建模靈活性,且預(yù)測結(jié)果不會受個別損壞的歷史數(shù)據(jù)的影響。這就使得該方法在流程和環(huán)境時刻變化、操作風險和損壞數(shù)據(jù)缺乏的銀行業(yè)具有無可替代的優(yōu)勢。同時,基于貝葉斯網(wǎng)絡(luò)強大的演算推理功能,可以精確地預(yù)測出各個變量的影響程度,使得銀行在風險控制方面更具主動權(quán)。

        [1]呂文江. 當前拖欠銀行貨款的原因、后果及對策[J].政治與法律,1990(5):48-49.

        [2]Jia wei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小峰,譯.北京:機械工業(yè)出版社,2008.

        [3]陸靜,王捷.基于貝葉斯網(wǎng)絡(luò)的商業(yè)銀行全面風險預(yù)警系統(tǒng)[J].系統(tǒng)工程理論與實踐,2012,32(02):225-235.

        [4]劉睿等.運用貝葉斯網(wǎng)絡(luò)量化和控制商業(yè)銀行操作風險[J].投資研究,2011,30(07):106-117.

        [5]陸靜,唐小我.基于貝葉斯網(wǎng)絡(luò)的操作風險預(yù)警機制研究[J].管理工程學報,2008(04):56-61.

        [6]百度百科,CRISP-DM定義. http://baike.baidu.com/link?url.

        [7]郭鑫.基于CRISP-DM的流程可視化數(shù)據(jù)挖掘工具的研究與實現(xiàn)[D].上海:東華大學,2009.

        [8]Alexander, C Bayesian Methods for M easuring Operational Risk[J].Derivatives, Use Trading and Regulation, 2000,6(2):166-186.

        猜你喜歡
        數(shù)據(jù)挖掘模型
        一半模型
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        3D打印中的模型分割與打包
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        日本丶国产丶欧美色综合| 亚洲精品成人无百码中文毛片| 99国产精品久久久久久久成人热| 免费人成视频xvideos入口| 国内久久婷婷激情五月天| 亚洲成AV人国产毛片| 中文字幕一区二区黄色| 国产精品视频一区二区三区不卡| 亚洲乱码国产一区三区| 国内精品久久久久久久亚洲| 视频国产一区二区在线| 国产爆乳美女娇喘呻吟| 国内老熟妇对白xxxxhd| 亚洲中文字幕巨乳人妻| 久久av一区二区三区黑人| 精品国产偷窥一区二区| 少妇白浆高潮无码免费区| 免费在线观看一区二区| 亚洲成人av大片在线观看| 777精品出轨人妻国产| 欧美性videos高清精品| 午夜爽毛片| 杨幂一区二区系列在线| 免费视频成人片在线观看| 国产精品国语对白露脸在线播放| 淫欲一区二区中文字幕| 亚洲一区二区三区四区地址| 日韩国产成人无码av毛片蜜柚| 国产91在线免费| 成人亚洲av网站在线看| 国产一区二区精品久久岳| 欧美巨大xxxx做受中文字幕| 超级碰碰人妻中文字幕| 国内自拍偷国视频系列| 国产亚洲日韩在线一区二区三区| 亚洲人成精品久久久久| 国产高清在线精品一区不卡 | 国产不卡视频一区二区三区| 一本一本久久a久久精品综合| 国产精品国产三级国av在线观看| 亚洲av不卡免费在线|