邵永運, 惠 丹
(沈陽師范大學(xué) 軟件學(xué)院, 沈陽 110034)
隨著我國市場經(jīng)濟體制的日益完善,市場競爭也越來越激烈。第四次全國經(jīng)濟普查系列報告顯示,2018年末我國中小微企業(yè)法人單位約1 807萬家,較2013年末增長115%,占全部規(guī)模企業(yè)法人單位的99.8%[1]。中小微企業(yè)在經(jīng)濟發(fā)展、科技創(chuàng)新、吸納就業(yè)方面發(fā)揮著重要作用[2],但較之大企業(yè)而言,中小微企業(yè)在融資成本、融資渠道、信貸支持等方面望塵莫及,這些因素嚴重阻礙了中小微企業(yè)的發(fā)展[3]。習(xí)近平總書記多次指出,為實體經(jīng)濟服務(wù)是金融的天職,是金融的宗旨,也是防范金融風(fēng)險的根本舉措[4]。銀行與企業(yè)之間存在著信息不對稱的問題,致使雙方難以實現(xiàn)共贏[5-7]。因此,銀行對中小微企業(yè)信貸業(yè)務(wù)的關(guān)鍵就在于對信貸風(fēng)險的預(yù)測[8-9]。本文將結(jié)合主成分分析和logistic回歸對中小微企業(yè)信貸決策問題進行建模并求解。
本研究所采用的數(shù)據(jù)為2020年全國大學(xué)生數(shù)學(xué)建模競賽中C組題目所提供的123家有信貸記錄企業(yè)的相關(guān)數(shù)據(jù)。
根據(jù)企業(yè)規(guī)模、企業(yè)信譽及供求關(guān)系穩(wěn)定性,從企業(yè)進銷項發(fā)票信息中提取10個可用指標(biāo)[10]。影響信譽評級的指標(biāo)見表1。
表1 影響信譽評級的指標(biāo)Table 1 Indicators affecting reputation rating
數(shù)據(jù)預(yù)處理工作主要是要將源數(shù)據(jù)處理成計算機可以識別的數(shù)據(jù)[11-13]。在該數(shù)據(jù)源基礎(chǔ)上需要做的處理工作包括:
1) 對數(shù)據(jù)進行去空值與去重處理;
2) 將發(fā)票狀態(tài)以及是否違約分別使用0,1進行標(biāo)記;
3) 將上述10個指標(biāo)通過計算得到其數(shù)據(jù)形式。
經(jīng)過處理的數(shù)據(jù)見表2,后續(xù)的分析工作將在此數(shù)據(jù)基礎(chǔ)上展開。
表2 預(yù)處理后的數(shù)據(jù)Table 2 Preprocessed data
首先,對所提取的10個指標(biāo)進行皮爾遜相關(guān)性分析,其結(jié)果見表3。
表3 各指標(biāo)間皮爾遜相關(guān)系數(shù)Table 3 Pearson’s correlation coefficient among various indicators
由表3可知,指標(biāo)X1與X2之間的皮爾遜相關(guān)系數(shù)為0.899 7,X3與X6的相關(guān)系數(shù)為0.889 1。該結(jié)果表明,所提取的10個指標(biāo)之間獨立性較差,需要進行降維處理,降維后使得后續(xù)的數(shù)據(jù)分析工作更加簡潔明了[14-15]。
其次,考慮到各指標(biāo)間數(shù)據(jù)范圍差異較大,所以在進行主成分分析之前對數(shù)據(jù)進行標(biāo)準化處理。標(biāo)準化公式為
(1)
式中:μ為均值;σ為標(biāo)準差。
最后,利用Pathon語言sklearn包中的PCA類對標(biāo)準化處理后的數(shù)據(jù)進行主成分分析。由圖1可知,前6個主成分反映了原始變量的87%的信息。
圖1 主成分分析可視化結(jié)果Fig.1 Principal component analysis visualization results
經(jīng)主成分分析后得到6個主成分,因此logistic回歸模型中的自變量為降維后的前6個主成分,記作F1,F2,…,F6,因變量為企業(yè)是否違約(是為“1”,否為“0”)。通過logistic回歸計算出回歸系數(shù)(見表4)和企業(yè)違約概率Pi(見表5,i代表第i個企業(yè))。logistic回歸模型如下(β為違約損失系數(shù)):
表5 企業(yè)違約概率Table 5 Probability of enterprise default
通過logistic回歸得到企業(yè)違約概率后,可通過目標(biāo)規(guī)劃確定銀行對中小微企業(yè)的具體信貸決策,主要包括是否貸款、貸款額度以及貸款利率。
1) 決策變量
設(shè)銀行對企業(yè)Ei放貸的金額為xi,貸款年利率為ri,i代表第i個企業(yè)(i=1,2,3,…,123 )。
2) 目標(biāo)函數(shù)
銀行的目標(biāo)為總貸款利潤即收益最大并且要求年總體風(fēng)險最小,所以目標(biāo)函數(shù)如下所示:
其中:xi為放貸金額;ri為貸款利率;FTP為銀行內(nèi)部資金調(diào)動利率,取0.027;α為違約系數(shù),一般取0.2;Pi為違約概率,已通過logistic回歸求出;β為違約損失系數(shù),A,B,C類企業(yè)分別對應(yīng)0.09,0.18,0.27;Li為客戶流失率。
3) 約束條件
① 銀行對每個企業(yè)的放貸額為10萬~100萬元:10≤xi≤100;
③ 貸款年利率約束:4%≤ri≤15%;
4) 信貸決策
運用pandas對上述模型進行求解,則可得到該信貸問題的最優(yōu)決策(見表6)。
表6 銀行對123家企業(yè)的信貸決策Table 6 Bank’s credit decision on 123 companies
信貸風(fēng)險的預(yù)測與信貸決策的實現(xiàn)使得企業(yè)和銀行雙方可以實現(xiàn)共贏,進而推動經(jīng)濟發(fā)展。本文通過主成分分析與logistic回歸的結(jié)合,可以有效衡量企業(yè)的違約風(fēng)險,再通過目標(biāo)規(guī)劃進行信貸決策,最終得出銀行對123家有信貸記錄的中小微企業(yè)的信貸決策。該預(yù)測模型對有信貸記錄的中小微企業(yè)的信貸問題提供了一種解決思路,同時也可將其延伸到無信貸記錄的信貸決策問題中。