亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SVM算法的個人信用評估方法的完善

        2016-11-12 04:58:18黃巍張靚唐友
        黑龍江八一農墾大學學報 2016年2期
        關鍵詞:超平面個人信用信用

        黃巍,張靚,唐友

        (1.黑龍江財經(jīng)學院,哈爾濱 150025;2.燕京理工學院)

        基于SVM算法的個人信用評估方法的完善

        黃巍1,張靚2,唐友1

        (1.黑龍江財經(jīng)學院,哈爾濱150025;2.燕京理工學院)

        在眾多的模式識別工具中,支持向量機(Support Vector Machine,SVM)是一種非常有效的解決工具。提出了基于SVM模型提升金融機構對個人信用評估效率的方法。通過對某銀行的用戶信用數(shù)據(jù)進行的研究,設計具體評估流程,利用SVM的SMO算法處理參數(shù)優(yōu)化來構建模型,特點是分類精度高、誤判率低,具有較好的穩(wěn)健性,以此來控制消費信貸風險具有良好的適用性。處理商業(yè)銀行劃分信貸等級,應用此種模式可以解決信貸申請和政策實現(xiàn),具有一定的實際意義。

        SVM;個人信用評估;SMO算法

        近年來,隨著人們收入的增加,大家的消費觀念也在逐步改變,在當前信用關系中個人信用活動成為最具潛力的一部分。它能夠引導資金流向、刺激消費需求以及提高居民生活質量等方面發(fā)揮著比較重要的作用。

        1 個人信用評估現(xiàn)存問題

        所謂個人信用評估是根據(jù)居民收入和資產(chǎn),發(fā)生借貸情況,然后進行償還,如果出現(xiàn)信用透支或者是許多不良記錄,最終受到處罰,然后將這些信息進行記錄、存儲,根據(jù)實際需求進行評估,決定在此信用下能完成的貸款數(shù)量。個人信用管理體系是指管理、監(jiān)督與保障個人信用活動規(guī)范、健康發(fā)展的一套規(guī)章制度與行為規(guī)范。

        個人征信評估體系仍需規(guī)范,對于消費金融產(chǎn)品來說,最重要的環(huán)節(jié)就是風險管控,如何評估用戶的信用以及消費等級都要確立一套合理規(guī)范的體系,無論是數(shù)據(jù)的獲取、產(chǎn)品的完善性還是評分的準確性,都將制約金融機構對個人信用評估的效率。相比美國、德國、日本等國家,中國的個人征信體系建設起步晚,發(fā)展不完善,主要依靠銀行系統(tǒng)的金融信用數(shù)據(jù)覆蓋面有限。對于現(xiàn)有征信體系,當前最大問題仍是信息“孤島”。未來,應該嘗試建立政府、機構、企業(yè)等信息共享平臺進行數(shù)據(jù)整合,盡可能完善我國個人征信體系。隨著我國商業(yè)銀行消費信貸業(yè)務的迅猛發(fā)展,個人信用評估得到了空前的重視??茖W有效的個人信用評估方法成為了商業(yè)銀行實現(xiàn)風險控制、進一步促進消費信貸發(fā)展的關鍵。因此個人信用評估的研究也便有了重要的應用和現(xiàn)實價值。

        2 SVM原理和算法

        2.1SVM函數(shù)和分類原理

        支持向量機是Cortes和Vapnik于1995年提出的,在機器學習中通過擬合函數(shù)解決小樣本,應用于高維模式線性等模式識別中,具有特有的優(yōu)勢。

        支持向量機是一種基于分類邊界的方法,其原理是采用分類超平面把空間中兩類樣本點正確分離,同時獲得最大邊緣(即正樣本和負樣本距離超平面最?。?,對于分類聚集在不同的二維平面上,這樣就會設定該算法的目的,在設定目標,進行訓練,確定分類的邊界,這樣可以設定線性和非線性的,如果是多維的比如N維就必須先來設定空間點,再來設計相關空間維中的面,通過這個面在來設計N維中的點和面。如果設定線性分類器使用超過平面,邊界就會超出曲面。線性劃分如圖1。這樣可根據(jù)新的數(shù)據(jù)相對于分類邊界位置進行分類判斷。

        圖1 線性劃分Fig.1Linear division

        最優(yōu)分類超平面方法向量就是范數(shù)最小的滿足約束w。其目標函數(shù)和約束函數(shù)分別是上下凹的二次型,如果有凸規(guī)劃是非常嚴格的。可以根據(jù)一些理論根據(jù)來解決這種規(guī)劃問題如最優(yōu)理論再通過下面的公式來解決。

        那么約束性非線性規(guī)劃問題如下公式(1)。

        其中αi是樣本點xi的Lagrange乘子。根據(jù)Kuhn-Tunker條件定理指出:無效約束所針對的Lagrange乘子是為0;因此其物理意義是說非支持向量xi的Lagrange乘子是0。所以分類規(guī)則僅由恰好在超平面邊緣上的少數(shù)支持向量來決定,這和其他樣本沒關。即為“支持向量機”。

        而對非線形情況,只將在對偶問題中的點積通過卷積核函數(shù)K(xi,xj)來代替。針對樣本點不可分的情況,來構造軟邊緣分類面,最終獲得Wolfe對偶問題同原來是相似的,就是α多了個上限約束。因此這個上限C也代表著對錯分樣本的懲罰力度,通過在邊緣之內的樣本對分類面的構造能夠起到的作用是比較有限制的,即所謂“軟邊緣”。最后,針對求最大值是可以轉化為取負來求最小值,那么數(shù)學模型表達式如公式(3)。其中H是個半正定的對稱矩陣[yiyjK(xi,xj)]li,j=1(其線性表示(XY)T(XY),X=[x1,x2,…,xl],Y=diag(y1,y2,…,yl)),而α=[α1,α2,…,αl]T是個對偶問題也具有約束的一個二次規(guī)劃,它通過Kuhn-Tucker條件(SVM的文獻中稱為Kaush-Kuhn-Tucker,KKT)也可等價地轉換為式子(4)。其中ui是一個分類面(在非線性下不確定是超平面)函數(shù)作用在xi上的輸出式子(5)。

        對于KKT條件在研究的問題中有具體的意義:一是xi為非支持向量,處在分類面邊緣以外,其中Lagrange乘子是0,對分類面構造是無影響的;二是xi為正好在分類面上的支持向量,針對的Lagrange乘子為非0;三是xi在分類面邊緣以內甚至被錯分,其中Lagrange乘子是受到上限的限制而為0。

        2.2SMO算法和構建思路

        在計算機內存無法承受數(shù)據(jù)量時,也就是成千上萬的樣本時,我們就要采用一些辦法來解決,也就是不同的算法塊和分解等。如果我們每次訓練多個樣本就可能會同時處理兩個樣本,這里面提供SMO(串行最小化)的方法,這里包含兩個重要算法就是α的選擇,還有一個是α的更新處理。

        圖2 訓練基本流程Fig.2Basic training process

        2.2.1α的選擇算法

        事實上,許沁想錯了。許沁在葛局長的心中,早已沒有任何位置了。當然這并不是位置的問題,而是為官之道。在葛局長看來,許沁是條狗,是條隨時會咬人的狗,是條翻臉不認人的狗。一旦受到威脅或傷害,她會逮誰咬誰。葛局長不能不嚴加提防,因而斷然割斷了和許沁的任何聯(lián)系。

        通過選擇兩個與KKT條件違背的比較嚴重的兩個αi,設定為內外循環(huán)。在外層循環(huán)中通常因為邊界樣本的問題需要調整和遍歷,這是非常重要,而邊界樣本常常是不能得到進一步調整,因此留在邊界上??梢栽诖诉^程中找出(yi=1,αi<C)或(yi=-1,αi>0)的所有樣本中-yi*?(di)值最大的(這是比較可能不滿足-yi*?(αi)≤b條件的樣本)。內層循環(huán):將外層循環(huán)中選定的樣本αi,去找到這樣的樣本αj,使得樣本最大。將公式(6)中更新α的一個算式,表示的是在選定αi,那么αj為更新算子下,樣本最大。如果選擇α的過程中發(fā)現(xiàn)已經(jīng)符合了KKT條件,那么算法結束。

        2.2.2α的更新算法

        在我們使用SMO算法時,需要每次去設計樣本,或者轉化約束形式為直線約束:α1+y1y2α2=d(d

        圖3 約束轉化Fig.3Constraint Transformation

        最終獲得結果如式子(9)。

        由于在運算時使用大量的內存,這樣運算速度就會慢,當數(shù)據(jù)量大時如果采用SVM算法,那么速度就會下降。那么來設計一個好的方法,就是一邊讀取一邊運算,運算完就倒出內存,讓系統(tǒng)繼續(xù)執(zhí)行。這樣樣本在運算時就會減少,我們再設計樣本訓練時α[i]一旦達到邊界(α[i]=0或α[i]=C),α[i]就不變了,這樣樣本變小,最終通過SVM來處理樣本。我們在公式中檢驗樣本參數(shù)α[i]的值來設定達到邊界的問題,我們需要去掉邊界樣本來進行下一步運算。

        通過公式(10)所展示的,在不確定這里面參數(shù)b時,我們要想得到最優(yōu)解就需要去使用SVM(0<α[i]<C)的樣本帶入,在當前使用公式得到b的情況很多需要我們不停去探索,那種方法才是最有效的。在libSVM中,去設定y=-1與y=1的兩種支持向量求得b,然后再取平均值。

        SMO和SVM兩個算法都是將處理整個二次規(guī)劃問題,可以很好地處理小問題,那么兩者之間不同的是SMO這種方法可以去處理分解小規(guī)模,之后再來判斷兩者樣本的問題,如果我們采取問題分析理解的方式來處理的化,會完善的很好。

        我們進行個人信用評估處理和實踐上,會有不同的誤判,一是把好的客戶當做不好的來處理,在客戶到銀行辦理業(yè)務時拒絕不同意為其貸款,另外一種是將不好的客戶當做好的處理,那么不講誠信的人也能到銀行貸到款,辦成業(yè)務等等,為了避免這幾種形式錯誤產(chǎn)生,我們需要建立模型,通過不同因子來完成參數(shù)設定決定模型的可信度,那么通過建立SVM方法,設置參數(shù),為決定性參數(shù)和懲罰性因素。這樣利用SVM建立個人評估模型是非常具有說服力的,選擇RBF核函數(shù),通過這個核函數(shù)具有較強的非線性映射能力。但是如果用SMO就不能完成這樣的效果,會有一組參數(shù)來處理誤判的可能。

        3 樣本數(shù)據(jù)分析

        我們通過從某個工商銀行在最近兩年的個人信用貸款的數(shù)據(jù)中,獲得發(fā)放消費貸款等數(shù)據(jù)信息,去除掉缺失的樣本數(shù)據(jù),會獲得2 114個樣本,那么怎么來判斷違約的數(shù)據(jù),如何設置違約次數(shù),設定一個標準或者一個區(qū)域,這個標準就是用戶在分期付款時,滯后還款,或者不能保證金額還款。在西方一些發(fā)達國家同一年中出現(xiàn)違約不能超過4回,否則信用大大降低,而在我們國家信用評估才剛剛開始所以設置樣本標注要松一些,這里面我們定義10,如下面表1。

        根據(jù)這些數(shù)據(jù),我們去分開抽樣,將樣本設置違不違約。只有抽出的實例來看看這兩種情況的對比,如果因為樣本不平衡那就是模型不穩(wěn)健,如果出現(xiàn)這兩種情況非常接近的化或者很相似,然后進行穩(wěn)定處理,通過選擇高于兩倍的方差,去檢查不對的數(shù)據(jù),通過上面的方法我們選擇所有的樣本進行訓練和檢查,并隨機處理這幾個部分。一部分是1 056個樣本,在這里面有514個違約樣本,還有542個未違約樣本來進行訓練來設置模型;在第二部分1 058個樣本,里面有496個違約樣本,還有562個是未違約樣本,進行檢驗模型的應用效果。

        表1 指標和說明Table 1Index and instructions

        為了收斂模型加快,根據(jù)要處理模型來進行不同數(shù)據(jù)進行訓練和檢驗,然后進行處理,那么根據(jù)表格中的指標值去形成不同變量如離散型和連續(xù)型等等,根據(jù)上面的選擇參數(shù)來設計兩種變量(x1、x3、x4、x5、x7、x8、x9),根據(jù)最大最小進行方法完善,通過下面公式所示。其中Y∈[0,1]代表歸一變化后的變量值;Xmin與Xmax來表示不同變量X的最小值和最大值。

        針對連續(xù)型變量(x2、x6、x10),是通過對變量值的分布狀況進行處理,這3個變量變化都近似正態(tài)分布。

        4 評估模型完善

        4.1個人信用評估流程

        通過設計信用評估參數(shù),來完成操作流程設計,通過設計兩種方法,特別是SVM方法來完善模型,其流程模型如圖4。

        圖4 信用評估流程Fig. 4Credit Evaluation Process

        4.2SVM模型的建立過程

        假設訓練數(shù)據(jù)(x1,yi),…,(xl,yl),x∈Rn,y∈{+1,-1}通過設定平面(w·x)-b=0來確定分開,根據(jù)我們預測不同樣本,進行比對,根據(jù)測得距離來判定選擇的最大能力(即為邊緣最大)的分類超平面可得到最佳的推廣能力(最為穩(wěn)妥地處理兩種樣本界限),離此最近的少數(shù)樣本點來分成那些是最優(yōu)平面,通過對比樣本來設定,根據(jù)式子(12)描述樣本間隔為Δ的分類超平面。

        如果把這個分類超平面進行歸一化:讓Δ=1,通過w與b去設置不同比例縮放。根據(jù)設定離超平面最近的樣本點SVM滿足式子(13)。向量到超平面的距離為1/||w||。因此,這個最優(yōu)化問題是通過公式(1)來進行運算。

        在完成公式對偶處理后,通過樣本中的問題來支持向量形式展示,通過這方面使用SVM出測試推廣非線性情況。

        通過去創(chuàng)建SVM模型的評估系統(tǒng),開始建立這個模型,是想讓我們去分析核函數(shù),然后去設置RBF徑向基來完成較強的非線性能力,在進行較為廣泛的使用中,通過RBF來設置SVM標準,還要需要之前提到的核心函數(shù)以及又決定左右的懲罰因子等等。通過選擇參數(shù)應該具有很強的影響力,再通過不同方式的驗證來確定SVM的設定標準,這樣就能夠明確其中的最有參數(shù)是什么,利用懲罰因子的查找范圍[2-5210],核心參數(shù)查找范圍為[2-1025],重新設置Cn+1=2*Cn和γn+1=2*γn。那么我們能得到的最優(yōu)參數(shù)為來源于真是數(shù)據(jù)引入模型運算的懲罰因子C=8.0和核心參數(shù)γ=0.003 906 25。利用交叉驗證確定分類精度可達94.697%,最后在根據(jù)標準SVM算出最優(yōu)參數(shù)對樣本進行訓練,最終得到的參數(shù)w,b的結果為:w=-2.733 8與b=-0.245 840。

        根據(jù)得到的參數(shù)w,b通過公式(14)獲得SVM的決策函數(shù)值。由于個人信用評估實質上是分類的問題,所以,通過最終把樣本劃分為違約和未違約類。因此先對信用評估中出現(xiàn)的兩類誤判進行說明。在銀行與其他金融機構當中,第二類誤判是損失更大的。通過SMO算法的SVM模型在訓練樣本上的分類結果見表2。把訓練后的SVM模型應用大檢驗樣本判別,來得到分類結果。

        表2 兩類誤判結果Table 2Results of two false positives

        4.3結果分析

        根據(jù)表2可以得出,SVM在訓練樣本與檢驗樣本上,2誤判的個數(shù)比1類誤判的個數(shù)少很多,這表明研究采用SMO算法針對2誤判的控制是非常有效的,這也可以使商業(yè)銀行在實踐操作中盡量避免信用風險。在分類精度上,模型的訓練樣本與檢驗樣本上都可以達到95%,可以說效果是非常好的,相比曾經(jīng)用過的統(tǒng)計模型還有神經(jīng)網(wǎng)絡模型去得到運算結果,能說明分類效果才能達到這樣的效果。進行訓練樣本交叉檢驗樣本上分類結果的變化趨勢來看,SVM分類精度有0.94%的下降,因此該模型的穩(wěn)健性是比較理想的,對于動態(tài)變化的信用數(shù)據(jù)更具有適用性。

        5 結論

        研究采用SVM的SMO算法完善個人信用評估方法,在進行個人信用數(shù)據(jù)獲取并分析時,通過結果來分析該模型,能夠有效的控制信用評估中給銀行造成的損失,有利于規(guī)避信貸風險。因此,目前通過銀行的個人信用信息、在信用影響的環(huán)境動態(tài)變化情況下,選擇SVM模型是具有優(yōu)勢的。

        [1]Angilella S,Mazzu S.The financing of innovative SMEs:A multicriteria credit rating model[J]. European Journal of Operational Researchc,2015,26(2):344-252.

        [2]葉菁菁.P2P網(wǎng)貸個人信用評估國內外研究綜述[J].商業(yè)經(jīng)濟研究,2015(11):34-39.

        [3]陳昊潔,姜明輝.個人信用行為評估方法再思考[J].學術交流,2015(12):12-15.

        [4]王慧勤,雷剛.基于LIBSVM的風速預測方法研究[J].科學技術與工程,2011(22):23-25.

        [5]黃勇.完善我國個人信用社會征信體系的對策探討[J].征信,2012(5):67-69.

        [6]李嫻.基于GCV的LS-SVM模型選擇在個人信用評估中的應用[J].河南大學學報:自然科學版,2011,41(3):15-19.

        Perfection of Personal Credit Evaluation Method Based on SVM Algorithm

        Huang Wei1,Zhang Liang2,Tang You1
        (1.Heilongjiang Institute of Finance and Economics,Haerbin 150025;2.Yanjing Polytechnic Institute)

        Among many pattern recognition tools,Support Vector Machine(Support Vector Machine,SVM)is a very effective one.A model based on SVM was proposed to promote efficiency of financial institution of personal credit evaluation method.Through researching user credit data of a bank,designing the specific evaluation process,using the SVM SMO algorithm to build the model of processing parameter optimization,it was characterized by high classification precision and low misjudgment rate,so it was stable and could control the consumption credit risk.Dealing with commercial bank credit rating,application of this model would solve the credit application and policy implementation,which had a certain practical significance.

        SVM;personal credit evaluation;SMO algorithm

        F832.479

        A

        1002-2090(2016)02-0105-06

        10.3969/j.issn.1002-2090.2016.02.022

        2016-01-04

        黃?。?981-),女,副教授,哈爾濱工業(yè)大學畢業(yè),現(xiàn)主要從事金融投資方面的研究工作。

        唐友(1979-),男,教授,E-mail:tangyou9000@163.com。

        猜你喜歡
        超平面個人信用信用
        全純曲線的例外超平面
        涉及分擔超平面的正規(guī)定則
        為食品安全加把“信用鎖”
        基于HPSO-BP神經(jīng)網(wǎng)絡的個人信用評估
        個人信用信息何以應由憲法保護?——一個制度論證的進路
        法大研究生(2020年2期)2020-01-19 01:43:22
        信用收縮是否結束
        中國外匯(2019年9期)2019-07-13 05:46:30
        以較低截斷重數(shù)分擔超平面的亞純映射的唯一性問題
        信用中國網(wǎng)
        信用消費有多爽?
        嚴重交通違法行為將直接與個人信用掛鉤
        汽車與安全(2016年5期)2016-12-01 05:22:05
        中文字幕第一页亚洲观看 | 国产自国产自愉自愉免费24区| 成人网站免费看黄a站视频 | 99精品国产在热久久无码| 亚洲综合色成在线播放| 国产美女精品AⅤ在线老女人| 99蜜桃在线观看免费视频| 日韩国产人妻一区二区三区| 国产一区二区三区影院| 亚洲色图视频在线观看网站 | 综合无码综合网站| 国产av自拍在线观看| 少妇性l交大片7724com| 无码精品国产va在线观看| 三级全黄的视频在线观看| 尤物蜜桃视频一区二区三区| 男女猛烈无遮挡免费视频| 7777精品久久久大香线蕉| 久久婷婷免费综合色啪| av网站影片在线观看| 91呻吟丰满娇喘国产区| 4hu44四虎www在线影院麻豆 | 国产一区二区在线观看视频免费| av网站免费观看入口| 美女不带套日出白浆免费视频| 国产裸体歌舞一区二区| 超级少妇一区二区三区| 国产自拍成人免费视频| 激情影院内射美女| 91精品国产福利尤物免费| 国产偷闻女邻居av在线观看| 蜜臀av在线播放一区二区三区 | 欧美日韩国产精品自在自线| 亚洲国产一区二区在线| 91精品国产综合久久久蜜臀九色| 久久99精品久久久久麻豆| 久久亚洲私人国产精品| 久久久国产精品ⅤA麻豆百度| 国产精品白浆一区二区免费看| 免费看美女被靠的网站| 无码中文日韩Av|