亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        個(gè)人信用評(píng)分模型的發(fā)展及優(yōu)化算法分析

        2015-09-03 01:52:44姜明輝
        關(guān)鍵詞:個(gè)人信用信用指標(biāo)體系

        姜明輝,許 佩,任 瀟,車 凱

        (1.哈爾濱工業(yè)大學(xué) 管理學(xué)院,150001哈爾濱;2.哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,150001哈爾濱)

        個(gè)人信貸作為銀行的主要資產(chǎn)業(yè)務(wù)之一,其風(fēng)險(xiǎn)水平的控制關(guān)系到商業(yè)銀行對(duì)于經(jīng)濟(jì)資本的整體要求.因此,能否對(duì)個(gè)人信用風(fēng)險(xiǎn)進(jìn)行有效的識(shí)別與計(jì)量,成為商業(yè)銀行能否合理控制風(fēng)險(xiǎn)的關(guān)鍵因素.隨著我國(guó)個(gè)人信貸規(guī)模和涉及領(lǐng)域日益擴(kuò)大,自90年代后期開(kāi)始,個(gè)人信用評(píng)分方法開(kāi)始引起國(guó)內(nèi)的關(guān)注.近年來(lái)隨著我國(guó)經(jīng)濟(jì)的高速發(fā)展,個(gè)人住房抵押貸款逐年增加,房地產(chǎn)市場(chǎng)出現(xiàn)過(guò)熱現(xiàn)象,個(gè)人信用貸款的風(fēng)險(xiǎn)也隨之增加.因此,在后金融危機(jī)時(shí)代,研究我國(guó)個(gè)人信用評(píng)分,對(duì)有效識(shí)別信用風(fēng)險(xiǎn)、規(guī)避金融危機(jī)的不利影響以及保持我國(guó)信貸和金融市場(chǎng)的正常運(yùn)轉(zhuǎn),甚至對(duì)維持國(guó)民經(jīng)濟(jì)的持續(xù)穩(wěn)定增長(zhǎng)都具有重大的理論和現(xiàn)實(shí)意義.

        文獻(xiàn)[1]指出,金融機(jī)構(gòu)的傳統(tǒng)做法是由專家基于自身經(jīng)驗(yàn)對(duì)個(gè)人信用進(jìn)行判斷,并由此形成了“5C”評(píng)價(jià)法.由于過(guò)度依賴于專家的經(jīng)驗(yàn),存在著訓(xùn)練成本高,主觀性和隨意性強(qiáng)等問(wèn)題.正是為了解決這些問(wèn)題,個(gè)人信用評(píng)分模型應(yīng)運(yùn)而生,其實(shí)質(zhì)是基于客觀的數(shù)學(xué)模型,根據(jù)已掌握的客戶的相關(guān)信息對(duì)客戶將來(lái)可能的信用情況進(jìn)行判斷.模型通過(guò)對(duì)客戶特定個(gè)人信息的輸入,將客戶分為“好客戶”(能夠按時(shí)還本付息)和“壞客戶”(會(huì)出現(xiàn)違約情況)兩類.

        隨著國(guó)內(nèi)外對(duì)信用評(píng)分研究的不斷深入,個(gè)人信用評(píng)分模型也經(jīng)歷了由統(tǒng)計(jì)學(xué)方法到非參數(shù)方法、運(yùn)籌學(xué)方法再到人工智能方法的演變,同時(shí)由單一模型到組合模型逐漸演進(jìn).但是,已有的個(gè)人信用評(píng)分模型在我國(guó)的實(shí)際應(yīng)用中仍存在諸如樣本的有效性及完整性、指標(biāo)體系的適用性、模型選擇的可解釋性等問(wèn)題.鑒于此,本文提出采用通過(guò)對(duì)已有樣本的規(guī)則提取實(shí)現(xiàn)異常數(shù)據(jù)的預(yù)警,結(jié)合樣本有效性及完整性的改進(jìn),選取解釋能力強(qiáng)的單一模型對(duì)信用評(píng)分的指標(biāo)體系進(jìn)行顯著性排序,選取適用的指標(biāo)顯著性權(quán)重并綜合考慮整體的準(zhǔn)確率、兩類誤判率和差異性,對(duì)現(xiàn)有模型進(jìn)行優(yōu)化.

        1 個(gè)人信用評(píng)分模型的發(fā)展

        1.1 統(tǒng)計(jì)學(xué)方法

        判別分析(discriminant analysis,DA)源于對(duì)3種鳶尾屬植物的分類實(shí)驗(yàn)并被文獻(xiàn)[2]首次用來(lái)區(qū)分信用客戶的好壞.判別分析的主要思想是基于某些分類方法來(lái)使同類之間距離最小,異類之間距離最大,通過(guò)建立一個(gè)或多個(gè)判別方程,來(lái)判斷某一變量的類別歸屬.文獻(xiàn)[3]認(rèn)為當(dāng)變量服從多元橢球面分布(多元正態(tài)分布是其特例)時(shí),線性判別無(wú)疑是最優(yōu)的選擇(忽略樣本抽樣偏差).此后,隨著著名的 FICO(fair isaac corporation)信用評(píng)分系統(tǒng)的建立,作為FICO系統(tǒng)的核心方法——判別分析在個(gè)人信用評(píng)分領(lǐng)域得到了廣泛運(yùn)用.近年來(lái),文獻(xiàn)[4]將最新的判別分析方法——SNDA、STDA、SDA、Sparse DA、FDA、MDA分別應(yīng)用于個(gè)人信用評(píng)分,以總精確度及錯(cuò)分率為判別指標(biāo),指出 SNDA、STDA和SDA在個(gè)人信用評(píng)分領(lǐng)域表現(xiàn)良好.

        回歸分析法(regression analysis,RA)是起源于遺傳學(xué)研究的經(jīng)典統(tǒng)計(jì)學(xué)方法之一.回歸分析法是在大量已知數(shù)據(jù)的基礎(chǔ)上,來(lái)探究一種變量(自變量)對(duì)另外一種變量(因變量)的影響,并建立描述二者間相關(guān)關(guān)系的回歸方程,根據(jù)已知的自變量的值對(duì)因變量的值進(jìn)行預(yù)測(cè).在回歸分析法中,應(yīng)用較為廣泛的有Logistic回歸分析、Probit回歸分析及多元線性回歸.與判別分析相比,回歸分析的魯棒性較低,但回歸分析對(duì)數(shù)據(jù)分布的要求相對(duì)寬松,而且能夠提供客戶的違約概率,因此獲得了大多數(shù)學(xué)者和銀行業(yè)的青睞.目前為止,Logistic回歸已經(jīng)成為最成功且最常用的統(tǒng)計(jì)方法之一.文獻(xiàn)[5]得出Logistic回歸在分類效果上要優(yōu)于判別分析的結(jié)論.

        1.2 非參數(shù)方法

        最近鄰法(nearest neighbors,NNs)是首先被用于分類問(wèn)題的標(biāo)準(zhǔn)非參數(shù)方法,最早由紐約銀行應(yīng)用于信用評(píng)分領(lǐng)域.最近鄰法中最常用的是KNN模型,KNN模型能夠很好的解決概率密度函數(shù)的分類和估計(jì)問(wèn)題,在個(gè)人信用評(píng)分研究中取得了較好的效果.KNN模型的基本原理是通過(guò)計(jì)算尋找與待判樣本點(diǎn)距離最近的k個(gè)信用樣本,再根據(jù)k個(gè)樣本的表現(xiàn),以投票的方式確定待判樣本的信用情況.文獻(xiàn)[6-7]均指出由于最近鄰法不用提前學(xué)習(xí)和訓(xùn)練模型,允許動(dòng)態(tài)的更改客戶信息,從而能很好的解決人口漂移問(wèn)題.有關(guān)KNN模型較近的應(yīng)用研究主要關(guān)注了“維數(shù)禍根”(curse of dimensionality)問(wèn)題,指出最近鄰法在應(yīng)用于高維數(shù)據(jù)時(shí),即使樣本量很大,散落在高維空間內(nèi)的樣本點(diǎn)仍十分稀疏,難以找到相鄰的樣本.針對(duì)該問(wèn)題,文獻(xiàn)[8]提出可以通過(guò)非線性的數(shù)據(jù)投影法來(lái)降低數(shù)據(jù)維度;文獻(xiàn)[9]提出可以對(duì)最近鄰法進(jìn)行改進(jìn),使用基于排序的最近鄰法來(lái)解決這一問(wèn)題.

        決策樹(shù)法(decision tree,DT)是近年來(lái)被引入信用評(píng)分領(lǐng)域的主要非參數(shù)方法之一.決策樹(shù)法以違約的可能上同質(zhì)性更強(qiáng)為劃分標(biāo)準(zhǔn),將信用申請(qǐng)者劃分為兩個(gè)子類,每個(gè)子類再次劃分為同質(zhì)性更強(qiáng)的子類,整個(gè)遞歸過(guò)程直到子類達(dá)到預(yù)設(shè)的終止條件為止.決策樹(shù)算法支持多個(gè)參數(shù),會(huì)對(duì)所生成的挖掘模型的性能和準(zhǔn)確性產(chǎn)生影響.文獻(xiàn)[10]首次將決策樹(shù)用于個(gè)人信用評(píng)估方法中.考慮到樣本屬性中包括了數(shù)值型數(shù)據(jù)及非數(shù)值型數(shù)據(jù),文獻(xiàn)[11]將Boosting算法技術(shù)嵌入決策樹(shù)中,該嘗試取得了更好的判別效果.

        數(shù)據(jù)包絡(luò)分析法(data envelopment analysis,DEA)是在相對(duì)效率評(píng)價(jià)基礎(chǔ)上發(fā)展的系統(tǒng)分析方法.它是以相對(duì)效率概念為基礎(chǔ),根據(jù)多指標(biāo)投入和多指標(biāo)產(chǎn)出對(duì)相同類型的單位進(jìn)行相對(duì)有效性或效益評(píng)價(jià)的一種新方法.將數(shù)據(jù)包絡(luò)分析法應(yīng)用于個(gè)人信用評(píng)估,可將客戶的特征向量視為投入指標(biāo),客戶的信用情況視為產(chǎn)出指標(biāo)進(jìn)行分類.數(shù)據(jù)包絡(luò)分析法的優(yōu)點(diǎn)在于能夠有效的避免主觀因素,減少誤差,且建立模型前無(wú)須對(duì)數(shù)據(jù)進(jìn)行量綱一的處理,與個(gè)人信用指標(biāo)的特征一致.文獻(xiàn)[12]將DEA模型應(yīng)用于私人融資計(jì)劃中借款人的信用評(píng)分,指出DEA有著能夠自動(dòng)生成相對(duì)權(quán)重等優(yōu)點(diǎn).

        1.3 運(yùn)籌學(xué)方法

        在個(gè)人信用評(píng)分中應(yīng)用的運(yùn)籌學(xué)方法主要是線性規(guī)劃法(linear programming,LP).早在1965年,線性規(guī)劃法即被應(yīng)用于分類問(wèn)題.但是直到1981年,文獻(xiàn)[13]闡明線性規(guī)劃在判別及分類上的應(yīng)用及實(shí)現(xiàn)之后,該方法才引起了更多學(xué)者的關(guān)注.線性規(guī)劃模型通過(guò)找到一組權(quán)重值,在給定的臨界值的條件下,使得所有好客戶的得分都在該臨界值之上,而所有壞客戶的得分都在這個(gè)臨界值之下從而實(shí)現(xiàn)個(gè)人信用樣本的分類.在線性規(guī)劃方法應(yīng)用于個(gè)人信用評(píng)分的基礎(chǔ)上,學(xué)者們更關(guān)注于與統(tǒng)計(jì)學(xué)方法在應(yīng)用效果上的差異,文獻(xiàn)[14]通過(guò)研究指出統(tǒng)計(jì)學(xué)方法要優(yōu)于線性規(guī)劃的方法.

        1.4 人工智能方法

        專家系統(tǒng)(expert system),作為人工智能方法應(yīng)用于個(gè)人信用評(píng)分最成功的嘗試,其核心思想為通過(guò)一個(gè)包含某特定領(lǐng)域知識(shí)的數(shù)據(jù)庫(kù)和對(duì)信息進(jìn)行遞推的規(guī)則,分析新情況并給出專家級(jí)的解決方案.文獻(xiàn)[15]介紹了CLUES專家系統(tǒng)的構(gòu)建,該系統(tǒng)可以決策是否批準(zhǔn)住房抵押貸款申請(qǐng),后被美全國(guó)金融公司采用.

        神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANNs)作為最具有代表性的人工智能方法之一,其原理是通過(guò)對(duì)變量進(jìn)行線性組合和非線性變化,然后循環(huán)修正,進(jìn)而模擬人類大腦的決策過(guò)程,利用神經(jīng)元相互觸發(fā),建立一種學(xué)習(xí)機(jī)制.文獻(xiàn)[16]在信用風(fēng)險(xiǎn)評(píng)測(cè)中引入神經(jīng)網(wǎng)絡(luò)的方法.2000年,Moody's公司公布了一套上市公司的信用風(fēng)險(xiǎn)評(píng)估模型,這套模型的主要方法為神經(jīng)網(wǎng)絡(luò).至此,研究者和實(shí)踐者開(kāi)始廣泛關(guān)注神經(jīng)網(wǎng)絡(luò)這一方法,文獻(xiàn)[17]將傳統(tǒng)的參數(shù)和非參數(shù)方法和5種不同的神經(jīng)網(wǎng)絡(luò)算法(包括混合專家系統(tǒng)、失真適應(yīng)響應(yīng)和多層感知器等)進(jìn)行了比較分析,其結(jié)果是神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性較好.

        支持向量機(jī)(support vector machine,SVM)的核心思想是通過(guò)某種事先選擇的非線性映射將輸入向量映射到一個(gè)高維特征空間,在此空間中根據(jù)區(qū)域中的樣本計(jì)算該區(qū)域的決策曲面,由此確定該區(qū)域中未知樣本的類別.SVM的出現(xiàn)解決了以往學(xué)習(xí)方法中存在的小樣本、非線性、過(guò)學(xué)習(xí)、高維數(shù)、局部極小等實(shí)際問(wèn)題,在個(gè)人信用評(píng)分中,支持向量機(jī)方法評(píng)分精度較高,預(yù)測(cè)能力強(qiáng),且受變量限制少,具有很強(qiáng)的泛化能力,因此支持向量機(jī)不僅在手寫(xiě)數(shù)字識(shí)別、文本分類、語(yǔ)音辨識(shí)等問(wèn)題上得到了廣泛應(yīng)用,在個(gè)人信用評(píng)分領(lǐng)域也成為了研究的熱點(diǎn).文獻(xiàn)[18]指出SVM算法能夠更好的捕捉變量間的非線性關(guān)系,并在SVM的基礎(chǔ)上提出了混合支持向量機(jī)算法,通過(guò)實(shí)證驗(yàn)證了混合支持向量機(jī)算法有著更高的精確度,并有效降低了第2誤判率.

        1.5 組合評(píng)分模型

        正是考慮到上述的單一信用評(píng)分方法各有優(yōu)勢(shì),由此引發(fā)了學(xué)者們對(duì)組合方法的嘗試.文獻(xiàn)[19]總結(jié)不同領(lǐng)域的大量相關(guān)研究,得出組合模型能夠取得更高預(yù)測(cè)精度的結(jié)論,成為組合預(yù)測(cè)研究的一個(gè)里程碑.受此影響,同年《預(yù)測(cè)雜志》出版了一期組合預(yù)測(cè)的專刊,進(jìn)一步激發(fā)了學(xué)者們對(duì)組合方法的熱情.組合方法主要分為線性組合和非線性組合.其中權(quán)重的確定是問(wèn)題的關(guān)鍵,權(quán)重的確定可分為固定權(quán)重和可變權(quán)重.到目前為止,比較常用的方法有簡(jiǎn)單平均法、勝出法、最優(yōu)法和回歸法.

        近年來(lái)國(guó)內(nèi)在個(gè)人信用評(píng)分組合方法的研究上也取得了不少成果.文獻(xiàn)[20]提出基于貝葉斯算法的投票式組合模型的思想,選擇Logistic回歸、聚類分析和神經(jīng)網(wǎng)絡(luò)進(jìn)行組合,既發(fā)揮了這些具有代表性的單一模型優(yōu)勢(shì),同時(shí)減少了由于權(quán)重確定產(chǎn)生的誤差.文獻(xiàn)[21]指出現(xiàn)有信用評(píng)級(jí)中存在的問(wèn)題,基于粗糙集算法對(duì)兩個(gè)混合模型FA-RS和MEPA-RS模型進(jìn)行了深入研究.

        在實(shí)際應(yīng)用中,個(gè)人信用評(píng)分模型選擇的決定因素往往來(lái)自于多個(gè)方面,如線性統(tǒng)計(jì)學(xué)模型常被有一定歷史的評(píng)分機(jī)構(gòu)所應(yīng)用,因?yàn)橐延械募夹g(shù)比較根深蒂固,而且這些機(jī)構(gòu)也傾向于使用那些已經(jīng)被使用并通過(guò)實(shí)踐檢驗(yàn)的方法.Logistic回歸多被新建機(jī)構(gòu)采用,那些為了防止嚴(yán)重的假設(shè)條件違背,或需要違約概率估計(jì)的借貸者(尤其是簽訂新巴塞爾協(xié)議的銀行)也對(duì)其更加青睞.

        2 個(gè)人信用評(píng)分模型應(yīng)用中的問(wèn)題

        2.1 信用樣本有效性及完整性問(wèn)題

        樣本有效性是國(guó)外成熟的評(píng)分模型在我國(guó)信用數(shù)據(jù)中進(jìn)行應(yīng)用面對(duì)的首要問(wèn)題.由于我國(guó)消費(fèi)信用貸款業(yè)務(wù)發(fā)展較晚,信用體系尚未完善,現(xiàn)有的信用數(shù)據(jù)相當(dāng)有限,且由于信用信息的提交和紕漏仍不規(guī)范,灰色收入等的存在,造成信用樣本數(shù)據(jù)的權(quán)威性和有效性面臨挑戰(zhàn).對(duì)于商業(yè)銀行而言,無(wú)法對(duì)每一位貸款的個(gè)體進(jìn)行數(shù)據(jù)真實(shí)性考察,如何及時(shí)的發(fā)現(xiàn)信貸業(yè)務(wù)中存在的“異常數(shù)據(jù)”,摒棄冗雜的干擾數(shù)據(jù),是目前個(gè)人信用評(píng)分領(lǐng)域需要研究的問(wèn)題之一.

        在信用樣本的完整性上,已有的個(gè)人信用評(píng)分模型都面對(duì)著一個(gè)不可忽視的數(shù)據(jù)問(wèn)題——樣本偏差(biased sample).樣本偏差來(lái)自于非隨機(jī)性的樣本獲取過(guò)程,表現(xiàn)為樣本和總體分布的非一致性,其本質(zhì)是一種樣本選擇問(wèn)題(sample selection).在個(gè)人信用評(píng)分上,樣本偏差表現(xiàn)為拒絕推論(reject inference).拒絕推論就是指在個(gè)人信用評(píng)分的過(guò)程中,銀行的評(píng)估模型是建立在已接受的信用樣本之上,而缺少那些申請(qǐng)被拒絕的樣本(拒絕樣本)的相應(yīng)數(shù)據(jù).這就導(dǎo)致了銀行的信用評(píng)分模型所用數(shù)據(jù)不是隨機(jī)樣本,不能代表整個(gè)申請(qǐng)者的“入門總體”(through-the-door population),從而導(dǎo)致評(píng)估的偏差.個(gè)人信用評(píng)分模型的準(zhǔn)確性與模型采用的訓(xùn)練數(shù)據(jù)有著密切的關(guān)系,拒絕推論問(wèn)題的存在也降低了評(píng)分模型的價(jià)值與精度.

        常用的解決樣本偏差的方法有外推法(extrapolation)、賦權(quán)法(enlargement)和重新賦權(quán)法(Re-weighting).外推法是利用已接受的樣本建立初始信用評(píng)分模型,并用于被拒絕樣本的判別,最后利用所有樣本建立最終的評(píng)分模型.重新賦權(quán)法通常與增補(bǔ)法共同使用,通過(guò)對(duì)已接受的樣本重新賦予權(quán)重來(lái)代表被拒絕的樣本.但是,文獻(xiàn)[22]認(rèn)為以上方法都是針對(duì)隨機(jī)性的樣本缺失,在解決非隨機(jī)性的拒絕推論問(wèn)題時(shí),效果并不理想.

        2.2 信用指標(biāo)體系合理性問(wèn)題

        信用評(píng)分指標(biāo)體系的確定是個(gè)人信用評(píng)分的第一步,對(duì)整個(gè)信用評(píng)分的精確性及信用風(fēng)險(xiǎn)的有效識(shí)別至關(guān)重要.目前商業(yè)銀行在個(gè)人信用評(píng)分中應(yīng)用的指標(biāo)有限且彼此不同.國(guó)內(nèi)學(xué)者又偏向于對(duì)模型的優(yōu)化與改進(jìn),對(duì)指標(biāo)體系的研究較少,導(dǎo)致我國(guó)尚未建立有效、權(quán)威的指標(biāo)體系.而我國(guó)的文化習(xí)慣和道德標(biāo)準(zhǔn)與國(guó)外相差較大,國(guó)內(nèi)不同地區(qū)間經(jīng)濟(jì)發(fā)展水平、人口結(jié)構(gòu)和生活方式,各民族間文化及道德標(biāo)準(zhǔn)也有著較大差異,這就導(dǎo)致同一指標(biāo)在不同的實(shí)際應(yīng)用中顯著性有著較大的變化,因此針對(duì)不同的數(shù)據(jù)樣本,對(duì)指標(biāo)體系中的特征變量及變量的權(quán)重有所調(diào)整,充分適應(yīng)實(shí)際業(yè)務(wù)需求十分必要.目前優(yōu)化信用指標(biāo)體系的方法主要是屬性約簡(jiǎn)法,文獻(xiàn)[23]通過(guò)SVM等方法對(duì)指標(biāo)進(jìn)行篩選,保留比較重要的指標(biāo),構(gòu)建新的指標(biāo)體系.但是屬性約簡(jiǎn)的方法在個(gè)人信用評(píng)分中的應(yīng)用效果并不理想,因?yàn)閭€(gè)人信用評(píng)分指標(biāo)體系中的指標(biāo)數(shù)量較少,約簡(jiǎn)后所得的指標(biāo)體系其有效性和代表性仍有待考證.

        2.3 模型選擇及適用性問(wèn)題

        目前,無(wú)論是學(xué)術(shù)研究還是商業(yè)銀行的實(shí)踐都致力于提高個(gè)人信用評(píng)分模型的精確性、穩(wěn)定性及解釋性,以便有效地進(jìn)行風(fēng)險(xiǎn)識(shí)別并降低信用風(fēng)險(xiǎn).但已有的模型各具優(yōu)缺點(diǎn).如判別分析法對(duì)數(shù)據(jù)有著較為苛刻的要求,要求信用樣本數(shù)據(jù)服從正態(tài)分布,且要求自變量與因變量間存在線性相關(guān)關(guān)系,但它通過(guò)不同的變量組合來(lái)探求最小化的特定分離程度,具有良好的解釋性;最近鄰法不用提前學(xué)習(xí)和訓(xùn)練模型,從而允許動(dòng)態(tài)的更改客戶信息,在解決人口漂移問(wèn)題上具有優(yōu)勢(shì),如何選擇距離公式和確定k個(gè)相近樣本投票權(quán)重卻是應(yīng)用中的難點(diǎn),且對(duì)于高維數(shù)據(jù),其在樣本空間中分布較為稀疏,絕大多數(shù)點(diǎn)附近根本沒(méi)有樣本點(diǎn),導(dǎo)致方法很難使用;決策樹(shù)法的優(yōu)點(diǎn)在于能夠充分的利用先驗(yàn)信息,受異常數(shù)據(jù)點(diǎn)影響較小,具有較高的分類精度,缺點(diǎn)則在于對(duì)特征屬性的權(quán)重缺乏判斷;傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型具有較高的預(yù)測(cè)精度但無(wú)法處理非數(shù)值型數(shù)據(jù),而且對(duì)初始中心的選取及異常值十分敏感,訓(xùn)練中易于出現(xiàn)過(guò)度擬合.同時(shí)神經(jīng)網(wǎng)絡(luò)“黑箱”化特征決定了其不具解釋性.綜上所述,統(tǒng)計(jì)學(xué)模型可以提供假設(shè)檢驗(yàn),具有一定的解釋性,但與人工智能方法相比,其精確度不高,對(duì)數(shù)據(jù)的要求比較嚴(yán)格;而人工智能方法則正好相反,精確度較高但解釋性差.在實(shí)際應(yīng)用的過(guò)程中,商業(yè)銀行的信貸政策也在不斷調(diào)整,如何根據(jù)商業(yè)銀行的政策及業(yè)務(wù)需要進(jìn)行模型選擇是目前個(gè)人信用評(píng)分所面對(duì)的一個(gè)難題.針對(duì)該問(wèn)題,文獻(xiàn)[24]指出,在個(gè)人信用評(píng)分中應(yīng)將對(duì)模型的研究與對(duì)信用評(píng)分實(shí)際應(yīng)用的研究進(jìn)行有效結(jié)合;文獻(xiàn)[25]認(rèn)為可以引入商業(yè)銀行個(gè)人信用評(píng)分的錯(cuò)分代價(jià)(misclassification cost)作為模型選擇的標(biāo)準(zhǔn).

        3 優(yōu)化算法設(shè)計(jì)

        針對(duì)上述個(gè)人信用評(píng)分研究中的問(wèn)題,本文從樣本有效性及完整性、指標(biāo)體系的合理性及模型的適用性3個(gè)方面對(duì)個(gè)人信用評(píng)分模型進(jìn)行優(yōu)化.

        針對(duì)信用樣本有效性及完整性問(wèn)題,本文提出通過(guò)對(duì)已有的樣本進(jìn)行相關(guān)性分析,提取樣本各特征變量間的相關(guān)關(guān)系,作為預(yù)警規(guī)則,對(duì)新加入的樣本進(jìn)行識(shí)別,實(shí)現(xiàn)對(duì)異常數(shù)據(jù)的預(yù)警,并通過(guò)蒙特卡洛模型生成模擬樣本,根據(jù)規(guī)則進(jìn)行樣本篩選,選取其中的“壞客戶”樣本進(jìn)行樣本補(bǔ)足.

        針對(duì)指標(biāo)體系合理性問(wèn)題,由于統(tǒng)計(jì)學(xué)模型理論基礎(chǔ)豐富,解釋能力強(qiáng),穩(wěn)健性良好,采用統(tǒng)計(jì)學(xué)模型能夠輸出個(gè)人信用評(píng)分指標(biāo)的顯著性,更有效的剖析影響個(gè)人信用的相關(guān)因素,因此,本文選取了Fisher判別分析、Logistic回歸、Probit回歸、多元線性回歸4種常用的統(tǒng)計(jì)學(xué)模型,結(jié)合投票器的方法對(duì)影響個(gè)人信用的特征向量進(jìn)行顯著性排序;又由于人工智能方法的判別精度較高,能夠有效的識(shí)別不良數(shù)據(jù),因此,在顯著性權(quán)重的計(jì)算上,采用步長(zhǎng)遍歷算法,以BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)兩種精度較高的個(gè)人信用評(píng)分模型的平均精度為判別標(biāo)準(zhǔn),輸出顯著性權(quán)重,對(duì)個(gè)人信用評(píng)分指標(biāo)體系進(jìn)行顯著性加權(quán),提高指標(biāo)體系的合理性和科學(xué)性.

        針對(duì)模型的選擇及適用性問(wèn)題,本文設(shè)計(jì)模型選擇器,選擇器中包括目前個(gè)人信用評(píng)分中最具有代表性的5個(gè)模型:Logistic回歸、分類樹(shù)、Bayes網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī),輸出每個(gè)模型的精確度、穩(wěn)健性、第1誤判率、第2誤判率及差異性作為模型選擇的指標(biāo),根據(jù)實(shí)際應(yīng)用的具體需求,輸出適用的單一模型、同類別加強(qiáng)組合模型及差異性組合模型,具體算法設(shè)計(jì)如圖1所示.

        圖1 優(yōu)化算法技術(shù)路線

        4 結(jié)論

        1)對(duì)個(gè)人信用評(píng)分模型的發(fā)展進(jìn)行了梳理總結(jié),闡明了個(gè)人信用評(píng)分模型由統(tǒng)計(jì)學(xué)方法到非參數(shù)方法、運(yùn)籌學(xué)方法再到人工智能方法的演變,同時(shí)由單一模型到組合模型的演進(jìn)過(guò)程,指出了各種個(gè)人信用評(píng)分模型在實(shí)際應(yīng)用中的優(yōu)勢(shì)及局限性.

        2)結(jié)合個(gè)人信用評(píng)分模型的發(fā)展及最新動(dòng)態(tài),指出個(gè)人信用評(píng)分研究中仍存在樣本有效性及完整性差、指標(biāo)體系合理性有待提高、模型適用性不明確、難以選擇等問(wèn)題.

        3)針對(duì)樣本的有效性及完整性問(wèn)題,本文以提升樣本有效性及完整性、指標(biāo)體系合理性及模型適用性為目標(biāo),通過(guò)規(guī)則提取及模擬樣本的加入實(shí)現(xiàn)對(duì)我國(guó)個(gè)人信貸業(yè)務(wù)中存在的“異常數(shù)據(jù)”預(yù)警,在豐富樣本集的同時(shí)使樣本結(jié)構(gòu)更接近于實(shí)際情況,優(yōu)化樣本結(jié)構(gòu);針對(duì)信用指標(biāo)的合理性問(wèn)題,本文選取解釋性好的統(tǒng)計(jì)學(xué)模型,結(jié)合投票器和步長(zhǎng)遍歷算法對(duì)信用評(píng)分指標(biāo)體系進(jìn)行顯著性加權(quán),避免指標(biāo)減少的同時(shí)充分體現(xiàn)重要的樣本屬性在評(píng)分中的作用;針對(duì)模型的選擇與適用性問(wèn)題,通過(guò)模型選擇器的設(shè)計(jì),分別設(shè)定不同的標(biāo)準(zhǔn)進(jìn)行模型的組合,比較單一模型與組合模型,旨在為商業(yè)銀行基于信貸政策目標(biāo)選擇最適用模型.

        [1]THOMAS L C.A surveyofcreditand behavioural scoring:forecasting financial risk of lending to consumers[J].International Journal of Forecasting,2000,16(2):149-172.

        [2]DURAND D.Appendix B:Application of the Method of DiscriminantFunctions to the Good-and Bad-Loan Samples[M].Cambridge,MA:NBER(Risk Elements in Consumer Instalment Financing,Technical Edition),1941:125-142.

        [3]HAND D J,HENLEY W E. Statistical classification methods in consumer credit scoring:a review[J].Journal of the Royal Statistical Society:Series A,1997,160(3):523-541.

        [4]CHEN H, CHEN Y. A comparative study of discrimination methods for credit scoring[C]//Proceedings of the 2010 40th International Conference on Computers and Industrial Engineering (CIE).Piscataway,NJ:IEEE,2010:1-5.

        [5]SRINIVASAN V,KIM Y H. Creditgranting:a comparative analysis of classification procedures[J].Journal of Finance,1987,42(3):665-683.

        [6]姜明輝,王雅林,趙欣,等.k-近鄰判別分析法在個(gè)人信用評(píng)估中的應(yīng)用[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2004,(2):143-147.

        [7]HAR-PELED S,INDYK P,MOTWANI R.Approximate nearestneighbor:towards removing the curse of dimensionality[J].Theory of Computing,2012,8(1):321-350.

        [8]VERLEYSEN M, FRAN?OIS D. The Curse of Dimensionality in Data Mining and Time Series Prediction[M]. Berlin Heidelberg Springer:Computational Intelligence and Bioinspired Systems,2005.

        [9] HOULE M E,KRIEGEL H P,KR?GER P,et al.Can shared-neighbor distances defeat the curse of dimensionality?[C]//Proceedings of the 22nd International Conference,SSDBM.Berlin Heidelberg:Springer,2010:482-500.

        [10]PORTER B W,BAREISS R,HOLTE R C.Concept learning and heuristic classification in weak-theory domains[J].Artificial Intelligence,1990,45(1):229-263.

        [11]龐素琳,鞏吉璋.C5.0分類算法及在銀行個(gè)人信用評(píng)級(jí)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2009,29(12):94-104.

        [12]CHENG E W L,CHIANG Y H,TANG B S.Alternative approach to creditscoring by DEA:evaluating borrowers with respect to PFI projects[J].Building and Environment,2007,42(4):1752-1760.

        [13]FREED N,GLOVER F.Applications and Implementation[J].Decision Sciences,1981,12(1):68-74.

        [14]NATH R,JACKSON W M,JONES T W.A comparison of the classical and the linear programming approaches to the classification problem in discriminant analysis[J].Journal of statistical computation and simulation,1992,41(1/2):73-93.

        [15]TALEBZADEH H,MANDUTIANU S,WINNER C F.Countrywide loan-underwriting expert system[J].AI magazine,1995,16(1):51-64.

        [16]WOLPERT D H.Stacked generalization[J].Neural networks,1992,5(2):241-259.

        [17]ZHANG R Q,HUANG Z S.Statistical inference on parametric part for partially linear single-index model[J].Science in China Series A:Mathematics,2009,52(10):2227-2242.

        [18]HUANG C L,CHEN M C,WANG C J.Credit scoring with a data mining approach based on support vector machines[J].Expert Systems with Applications,2007,33(4):847-856.

        [19]CLEMEN R T.Combining forecasts:A review and annotated bibliography[J].International journal of forecasting,1989,5(4):559-583.

        [20]王雪.投票式組合預(yù)測(cè)模型在個(gè)人信用評(píng)估中的應(yīng)用研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2011.

        [21]CHEN Y S,CHENG C H.Hybrid models based on rough set classifiers for setting credit rating decision rules in the global banking industry[J].Knowledge-Based Systems,2013,39:224-239.

        [22]GARCIA S,HAROU P,MONTAGNE C,et al.Models forsample selection biasin contingentvaluation:Aplication to forest biodiversity[J].Journal of Forest Economics,2009,15:59-78.

        [23]BELLOTTI T,CROOK J.Support vector machines for credit scoring and discovery of significant features[J].Expert Systems with Applications,2009,36(2):3302-3308.

        [24]MARTIN N.Assessing scorecard performance:A literature review and classification[J].Expert Systems with Applications,2013,40(16):6340-6350.

        [25]LEE T S,CHEN I F.A two-stage hybrid credit scoring model using artificial neural networks and multivariate adaptive regression splines[J].Expert Systems with Applications,2005,28(4):743-752.

        猜你喜歡
        個(gè)人信用信用指標(biāo)體系
        為食品安全加把“信用鎖”
        基于HPSO-BP神經(jīng)網(wǎng)絡(luò)的個(gè)人信用評(píng)估
        個(gè)人信用信息何以應(yīng)由憲法保護(hù)?——一個(gè)制度論證的進(jìn)路
        法大研究生(2020年2期)2020-01-19 01:43:22
        信用收縮是否結(jié)束
        層次分析法在生態(tài)系統(tǒng)健康評(píng)價(jià)指標(biāo)體系中的應(yīng)用
        供給側(cè)改革指標(biāo)體系初探
        信用中國(guó)網(wǎng)
        信用消費(fèi)有多爽?
        嚴(yán)重交通違法行為將直接與個(gè)人信用掛鉤
        汽車與安全(2016年5期)2016-12-01 05:22:05
        測(cè)土配方施肥指標(biāo)體系建立中‘3414
        61精品人妻一区二区三区蜜桃| 中国老妇女毛茸茸bbwbabes| 久久香蕉国产线看观看网| 精品亚洲一区二区99| 毛茸茸的女性外淫小视频| 国产一区二区三区久久精品| 亚洲а∨天堂久久精品2021| 国产亚洲AV无码一区二区二三区 | 失禁大喷潮在线播放| 日本精品免费一区二区三区 | 久久国产精品99精品国产987| 国产精品丝袜美女久久| 亚洲色偷偷综合亚洲avyp| 少妇高潮潮喷到猛进猛出小说| 中文 国产 无码免费| 亚洲成在人网站天堂日本| 国产精品亚洲а∨无码播放| 7777奇米四色成人眼影| 亚洲福利天堂网福利在线观看| 亚洲av高清一区二区| 亚洲av无码码潮喷在线观看| 国产三级在线观看免费| 亚洲大尺度动作在线观看一区| 天堂丝袜美腿在线观看| 内射合集对白在线| 亚洲va在线va天堂va手机| 国产精品丝袜一区二区三区在线| 久久红精品一区二区三区| 国产真人性做爰久久网站| 国产精品青草久久久久婷婷| 少妇我被躁爽到高潮在线影片| 高h小月被几个老头调教| 免费无码国产v片在线观看| 完整在线视频免费黄片| 久久av粉嫩一区二区| 麻豆影视视频高清在线观看| 久久精品免费一区二区喷潮| 麻豆夫妻在线视频观看| 国产成人a级毛片| 久久精品无码中文字幕| 欧美亚洲日韩国产人成在线播放 |