劉倡 吳周震 李金香 韋明虎 吳英瑤
摘 要:本文通過SPSS、MATLAB軟件對需貸款企業(yè)大量發(fā)票信息進行定量分析研究,使其轉(zhuǎn)化為更加合理有效的可行性風險評價指標,再結(jié)合企業(yè)信譽信息,形成了信貸評價指標系統(tǒng)和決策樹數(shù)據(jù)集,并建立了基于ID3算法的決策樹初步模型。隨著問題的深入,應考慮到信貸決策時存在的最優(yōu)選擇:一是在降低風險系數(shù)的同時,應盡量提高銀行的利潤,同時防止客戶流失;二是研究不同突發(fā)因素對不同類別企業(yè)的影響程度。對此,模型引入了總利潤檢驗、客戶流失率指標以及AHP下的信貸調(diào)整策略,對決策樹模型做進一步的優(yōu)化處理。
關鍵詞:風險指標系統(tǒng);決策樹;ID3算法
一、問題背景
2020年末,全國中小微企業(yè)貸款余額15.3萬億元,增速超過30%,其中5家大型銀行增長54.8%。信貸業(yè)務是銀行的基礎業(yè)務與主要盈利業(yè)務,銀行通過前后貸出與收回資金之差獲得利潤。而處于起步階段的中小微企業(yè)是放貸主要對象,如果中小微企業(yè)由于某些因素不能履行信貸約定且無相應的抵押資產(chǎn),將導致銀行資金不能收回,出現(xiàn)爛賬與虧損。
二、問題分析
銀行在進行貸款時,審批的第一要素是風險,而不是所能獲得的利潤。當然在風險系數(shù)較低的前提下,使得所獲的利益最大,便是最優(yōu)決策。然而評價風險系數(shù)的指標較多,且有些企業(yè)相關數(shù)據(jù)需要進行合理的量化分析才能轉(zhuǎn)化為具有可行性的風險評價指標,所以如何對需要貸款中小微企業(yè)的相關數(shù)據(jù)信息進行量化分析,得到合理的評價系統(tǒng)指標,建立相匹配的決策模型對信貸策略研究尤為重要。
三、模型建立
3.1模型的建立
通過對指標以及目標決策的分析,采用決策樹模型??紤]到企業(yè)信貸風險指標的數(shù)量,以及最終目標對中小微企業(yè)的信貸策略,如何整合并定量分析企業(yè)信貸風險指標,從而做出可視化的決策樹信貸策略是研究的關鍵。
于是,確立了以下建模步驟(如圖3-1所示):
3.2 相關數(shù)據(jù)的處理
對于需要信貸企業(yè)提供的進項發(fā)票、銷項發(fā)票、作廢發(fā)票以及負數(shù)發(fā)票等不能直接反映企業(yè)信貸風險的信息進行量化處理,使其轉(zhuǎn)化為可以直接反映企業(yè)信貸風險的指標。
3.2.1 引入供求變異系數(shù)CV評價指標
變異系數(shù)CV沒有量綱,可以較為真實反映離散程度。例如,通過SPSS軟件對樣本企業(yè)E1和E10發(fā)票信息進行處理與分析,可以得到大數(shù)據(jù)下的CV1和CV10。
另一方面,通過MATLAB軟件,建立了樣本企業(yè)E1,E10近三年進項發(fā)票、銷項發(fā)票分別和開具時間的可視化聚集程度圖,進而可視化反映了樣本企業(yè)E1、E10的供求關系穩(wěn)定狀況,從而印證了供求變異系數(shù)CV的真實性和可行性(如圖3-2所示)。
3.2.2 引入無效發(fā)票比率系數(shù)WV指標
WV(作廢發(fā)票的數(shù)量加上負數(shù)發(fā)票的數(shù)量之和與總發(fā)票數(shù)之比),WV數(shù)值越大則企業(yè)信譽值越低,反之越高。
3.3 宏觀評價指標定量調(diào)整
由于相關信息的模糊性,會影響決策樹分支,導致錯誤率會大大上升。為此,首先應對評價指標進行調(diào)整,劃分區(qū)域,確定數(shù)值。
3.4 建立決策樹模型
決策樹ID3算法根據(jù)信息增益大小,對相關屬性進行分層,并且通過運算可以得到在不同屬性指標的組合下的判斷結(jié)果。
3.4.1 引入特征屬性分層指標
設有隨機變量(X,Y),其聯(lián)合概率分布以及條件熵H(Y|X)分別表示為:
(3-1)
信息增益表示為:
(3-2)
通過分別對三類指標的計算,且比較相應風險評價指標屬性的信息增益大小可以對風險指標屬性進行分層,從而形成決策樹模型。
3.4.2對指標屬性進行分層
運用MATLAB軟件進行計算信息增益Gai(β)>Gai(α)>Gai(γ),于是應該優(yōu)先對供求關系變異系數(shù)進行分支,其次再對企業(yè)信譽等級指標和無效發(fā)票率系數(shù)進行分支。
3.4.3 形成決策樹模型
輸入:訓練數(shù)據(jù)集U(見附件)、特征集A(見附件)、閾值ε
輸出:決策樹模型
3.5模型結(jié)果
3.6模型優(yōu)化
當缺少企業(yè)評級與是否違約等信息時,充分利用兩類信息在上述已經(jīng)建立的基于ID3算法決策樹模型中充當一個因變量和自變量這一條件,首先通過稅額建立起與信用評級的關系,解決了缺少因變量信息問題,同時可求出相應自變量。其次,考慮到信貸策略的最優(yōu)選擇,引入了總利潤檢驗、客戶流失率指標對模型進行進一步優(yōu)化。
鑒于各種突發(fā)因素對不同類別企業(yè)影響不盡相同,首先對企業(yè)進行分類,從而得到主要突發(fā)因素對不同類型企業(yè)的影響程度表,再利用AHP,與決策樹模型相結(jié)合,形成優(yōu)化后的信貸策略。
參考文獻:
[1]王華.互聯(lián)網(wǎng)大數(shù)據(jù)環(huán)境下的銀行信貸風控研究[D].華北電力大學(北京),2019.
[2]賴春廷.決策樹分類算法研究[J].信息與電腦(理論版),2020,32(14):59-62.