亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

大數據環(huán)境下農商行信用風險評估研究

2024-04-29 00:00:00虞偉健

中國內部審計 2024年4期

[摘要]當前，在經濟處于下行的嚴峻形勢下，進一步提升農村商業(yè)銀行信用風險管理水平，促進資產質量提高顯得尤為重要。本文基于大數據環(huán)境，從決策樹和神經網絡相融合的視角出發(fā)，對信用風險評估進行研究，旨在促進農商行信用風險管理水平的提升。

[關鍵詞]大數據" "決策樹" "神經網絡" "信用風險評估

一、引言

農村商業(yè)銀行（以下簡稱農商行）作為金融機構，面臨著信用、流動性、市場、操作和科技等諸多風險，由于當前農商行的主要盈利模式仍是信貸業(yè)務，因此信用風險是其必須應對的最主要風險。自改制以來，農商行各項業(yè)務取得了較快發(fā)展，資產規(guī)模迅速壯大，盈利能力不斷增強，總體向好。但是，受到國內外復雜經濟金融形勢的影響，農商行的主要客戶群體——中小企業(yè)發(fā)展困難重重，使其信貸業(yè)

務面臨著嚴峻的挑戰(zhàn)，具體體現(xiàn)在不良貸款率持續(xù)攀升。農商行內部審計履行風險管理第三道防線的職責，促進農商行信用風險管理水平提高責無旁貸。同時，在大數據環(huán)境下，農商行原有的審計技術已難當重任，也難以滿足其高層對內部審計的期望，因此，積極探索、創(chuàng)新審計技術應用已成為內部審計人員迫在眉睫的問題?；谏鲜霰尘?，本文從決策樹和神經網絡融合的視角出發(fā)，對信用風險評估進行研究，旨在促進農商行信用風險管理水平的提高。

二、文獻回顧

當前，我國信息科技快速發(fā)展，大數據、互聯(lián)網和云計算等在各行業(yè)得到了廣泛應用。劉杰，韓洪靈等人（2019）分析了傳統(tǒng)審計在大數據背景下受到的影響，并對審計取證模式及其系統(tǒng)性的變革進行了研究，搭建了審計變革的框架，提出大數據時代審計變革的方向和途徑。王晨陽（2020）運用決策樹ID3算法和C4.5算法的相關理論和技術，建立了分類模型，并將決策樹算法應用于審計數據分析、研究，結果表明基于決策樹的分類算法能較好地對數據信息進行分類和預測。孫劍斌和魏敏（2021）以決策樹和神經網絡的相關理論和方法為基礎，分別構建了決策樹和神經網絡的信用風險評估模型，并對選取的555家上市公司進行了實證分析，結果顯示這兩種方法均取得了較高的準確率，且基于神經網絡的信用風險評估模型具有更高的準確率。胡賽楠（2022）認為內部審計為應對大數據的沖擊和影響，促進了智能化審計技術的迅速發(fā)展，指出大數據迅速發(fā)展的背景下，數字化、智能化審計已成為內部審計發(fā)展的方向，同時，通過實證分析，建立了A企業(yè)智能化內部審計的框架，取得較好效果。梁龍躍和王浩竹（2023）采用圖卷積神經網絡模型對個人信用風險進行了研究和實證分析，結果表明結合樣本相似性網絡的圖卷積神經網絡模型，在信用風險預測精度上，明顯好于忽略樣本相似性的機器學習模型。

三、信用風險特點及其評估

（一）信用風險特點

信用風險是指債務人在其經營不善等情形下，有可能未能按約償還債務而造成違約。當違約發(fā)生時，將由債權人承擔資金損失。信用風險主要有以下4種特點。

1.內在性。

借款人或債務人不能償還到期債務的主要因素是其沒有足夠的還款能力，大部分是與借款人或債務人的經營失敗或經營面臨困難相關，故信用風險有別于系統(tǒng)性風險，具有明顯的內在性特點。

2.傳染性。

在整個信用鏈條中，當一個信用主體因經營不善而違約，不能歸還到期債務，就可能產生多米諾骨牌效應，引起一系列信用風險。

3.周期性。

信用擴張與收縮交替出現(xiàn)，在經濟衰退期，借款人違約率上升，信用風險加劇；在經濟高漲期，借款人違約率下降，信用風險放緩。

4.滯后性。

由于銀企之間的信息不對稱，農商行很難及時獲取借款人生產經營狀況的不良變化，當發(fā)現(xiàn)借款人經營困難，難以償還到期債務時，往往為時已晚，從而產生信用風險。

（二）信用風險評估模型的類型及優(yōu)劣比較

1.信用風險評估模型的類型。

信用風險評估是指根據評估對象所提供的資料，采用定量和定性相結合的方法，對其所存在的信用風險狀況進行分析評估，并根據評估結果對其信用狀況給出一個客觀、合理和正確的結論。

傳統(tǒng)方法和現(xiàn)代方法是信用風險評估的兩種主要方法。傳統(tǒng)方法依賴于具有豐富經驗專家的主觀判斷，而現(xiàn)代方法則更多通過各種數學模型進行定量及客觀的分析。

傳統(tǒng)方法以定性為主，評估水平受限于個人的經驗知識，隨著銀行業(yè)務的發(fā)展和風險的復雜化，已無法滿足風險管理的需要。于是國內外先進商業(yè)銀行的專家、學者紛紛探索、研究以定量為主的基于數學模型的現(xiàn)代信用風險分析與評估方法，從而提高信用風險管理的科學性和有效性。目前，信用風險評估的數學模型主要分為基于Merton期權理論的模型、基于統(tǒng)計計量分析技術的模型和基于數據挖掘技術的模型。

（1）基于Merton期權理論的模型。

這類模型關注公司的主資產價值，由羅伯特·默頓（Robert Merton）首次提出，其使公司特征變量和利率具有動態(tài)變化的特征，并假設公司只有單一的資本結構，僅發(fā)行一種零息債券，當公司資產價值小于債券面值時，公司就會產生違約。具體包括Credit Metrics模型、Credit Risk+模型、KMV模型和Credit Portfolio View模型等。

（2）基于統(tǒng)計計量分析技術的模型。

該類模型主要基于歷史數據，通過分析信用良好公司和不好公司樣本的差異之處，找出公司特征變量和違約之間的關系。Logistic回歸模型、Probit模型、災難模型以及判別分析等是其最具代表性的模型。判別分析又可分為Altman的Z計分模型和ZETA信用風險模型。

（3）基于數據挖掘技術的模型。

隨著信息技術的迅猛發(fā)展，數據挖掘（Data Mining）技術開始盛行。數據挖掘是指從數據倉庫或其他可獲取的信息資料中提取所需要的、并具有潛在應用價值的信息，是一種介于人工智能、機器學習、數據庫技術和統(tǒng)計學等跨界新學科，其包括神經網絡、支持向量機、決策樹、遺傳算法和粗糙集方法等。目前，業(yè)界更多使用決策樹和神經網絡相融合的方法。

決策樹算法在人工智能領域受到許多專家、學者的關注，已被廣泛應用于模式識別以及經濟、金融和醫(yī)療等領域。商業(yè)銀行運用決策樹模型在開展信用風險評估中已取得較好的效果。ID3、CART、C4.5和C5.0是決策樹常用的4種算法，判斷最佳屬性所采用的量化標準不同是其關鍵區(qū)別。一般情況下，使用Gini系數、熵（Entropy）、錯誤率等3個指標來度量純度，數值越大表示數據越“不純”；越小則表示越“純”。從決策樹生成過程來看，屬性選擇和剪枝是構建決策樹的關鍵環(huán)節(jié)。

神經網絡在信息處理、模式識別、智能控制以及商業(yè)銀行信用風險評估等領域也得到了廣泛的應用。BP神經網絡和徑向基函數神經網絡（Radical Basis Function，RBF）是兩種比較常用的神經網絡。BP神經網絡由于能逼近任意連續(xù)函數，因此具有強大的非線性映射能力。同時，可根據具體情況設定網絡的中間層數、各層的處理單元數及網絡的學習系數等參數，具有較大的靈活性。RBF神經網絡則是一種高效的前饋式神經網絡，最佳逼近性能、全局最優(yōu)特性是其他前向網絡所無法比擬的，具有結構簡單、訓練速度快等優(yōu)勢。這使得其在分類能力和學習速度等方面均優(yōu)于BP神經網絡，且克服了局部極小值問題。

2.信用風險評估模型的優(yōu)劣比較。

當前，基于統(tǒng)計計量分析技術的模型和基于Merton期權理論的模型盡管被廣泛地應用，但其存在以下明顯不足：一是假設樣本呈等協(xié)方差、正態(tài)分布以及多重特征獨立性等，但這往往不符合實際情況；二是難以處理非線性復雜結構問題等。同時，由于我國尚未形成貸款的二級市場，不易獲得借貸市場及破產企業(yè)相關的財務信息，因此基于Merton期權理論的信用評估模型在我國的應用受到較大程度的限制。而基于統(tǒng)計分析計量技術的模型由于嚴格的假設條件，加上各類信用風險信息的數據庫完整性和有效性較差，也影響了這類模型的使用效果。

神經網絡、支持向量機等基于數據挖掘技術的模型不僅較好地解決了數據質量差和結構復雜等不足，還能有效獲取這些枯燥數據背后所隱含的風險因素，故其在風險評估中受到了青睞。但由于其評估的結果從經濟上不僅難以得到滿意的解釋，而且存在“黑箱”操作問題，同時，又無法與專家的知識經驗相結合，僅適合于定量指標的分析，對影響信用風險因素中的定性指標，不能得到有效處理。因此，神經網絡、支持向量機等信用風險評估模型并不是盡善盡美，也有某些不足和缺陷，其應用程度受到了一定的影響。

決策樹盡管存在計算量較大、冗余屬性影響、擬合度過高等不足，但其以信息技術和統(tǒng)計技術相結合為基礎，既克服了非參數統(tǒng)計和多元參數的短處，又保持了其長處。同時，決策樹在處理數據間非同質關系時，充分利用先驗信息，進行變量的自動選擇，并降低維數，從而使分類結果簡單易懂。因此，與其他方法相比，決策樹信用風險評估模型具有一定的優(yōu)勢。

不同方法相結合，能取長補短，優(yōu)勢互補。事實證明，決策樹和神經網絡相融合，能最大限度地避免冗余屬性和噪音的干擾。這主要有賴于神經網絡“黑箱”分類和高效分類的特點，在建立決策樹之前，對屬性進行裁減，從而可以選擇最有效的屬性來建立決策樹，其效果比單一用決策樹明顯改善。

四、基于決策樹和神經網絡相融合的信用風險評估主要流程

（一）總體思路

1.鑒于決策樹可視化功能，相關人員應通過圖表形式，將分析過程和分析結果清晰地呈現(xiàn)出來，并與專家知識相結合，便于進一步研究。

2.利用神經網絡“黑箱”分類功能，對屬性進行裁減，刪除無效屬性，減少噪音或異常數據。

3.構造決策樹時，相關人員應按照設定的判斷和選擇標準確定根節(jié)點，作為所有訓練數據集的始發(fā)點，然后對該節(jié)點的所有屬性再進行訓練，并根據訓練結果確定內部節(jié)點，如此反復，最終建立用于信用風險評估的決策樹模型。

（二）構建決策樹

1.建立指標體系。

（1）四性原則。

指標體系應體現(xiàn)“四性”原則，即可操作性、可比性、全面性和動態(tài)性。可操作性原則，是指指標體系的建立應考慮指標概念是否明確、測定方法是否標準、數據采集是否容易等，以滿足易于操作的需要?？杀刃栽瓌t，是指指標體系中涉及的財務指標在不同企業(yè)之間應具有可比性，包括指標計算口徑及其方法等。全面性原則，是指指標體系對企業(yè)的盈利能力、償債能力、營運能力和發(fā)展能力等方面的財務狀況能有一個全面、完整的反映。動態(tài)性原則，是指指標體系能動態(tài)地反映債務人的風險狀況，以體現(xiàn)與不同借款企業(yè)和不同時期相適應的特點，并能預測其未來的變化情況。

（2）指標體系。

指標體系涵蓋盈利能力、償債能力、營運能力和發(fā)展能力。盈利能力包括凈資產收益率、總資產收益率、銷售凈利率、市盈率等。償債能力，包括流動比率、速動比率、債務資本比率、資產負債率、現(xiàn)金負債比、營運資本等。營運能力，包括存貨周轉率、應收賬款周轉率、流動資產周轉率、總資產周轉率、固定資產周轉率等。發(fā)展能力，包括資本積累率、營業(yè)收入增長率等。上述財務指標在構建決策樹時如被選用即為基本屬性。

（3）樣本選取。

樣本包括訓練集樣本和測試集樣本。訓練集樣本選取的基本原則是確保選取的樣本與樣本總體的違約率相等或接近，以便用樣本推斷總體違約情況。測試集樣本選取的基本原則是選擇一家目標分支機構對公客戶為測試樣本，通過樣本測試結果檢驗基于決策樹和神經網絡相融合所構建決策樹預測客戶違約情況的準確率。

2.生成決策樹。

本文利用決策樹C4.5與RBF神經網絡的各自優(yōu)勢，即在建立決策樹之前，先對屬性按重要性原則進行排序，然后利用神經網絡“黑箱”分類及其高效的特點，對屬性進行剪枝，從而選擇出最重要的幾個屬性，用來構建決策樹。

（1）按重要性原則對特征屬性進行排序。本文采用基于熵的離散化評價標準——正規(guī)增益來確定重要的特征屬性，并按照正規(guī)增益NG值大小對屬性進行排序，可分為兩個步驟，具體步驟如下。

步驟一：計算出各個特征屬性的信息增益（Gain），計算公式如下：

（1）

步驟二：根據得出的信息增益（Gain），計算出特征屬性的正規(guī)增益值，計算公式如下：

（2）

上述假設D為訓練集樣本，目標屬性具有n個不同的值，屬性A將D分為不相交的m個子集D1，D2，...，Dm，信息熵H（D）是信息量的數學期望，Gain表示A為特征屬性對訓練數據集D的信息增益，它為集合D的經驗熵H（D）與特征屬性A給定條件下D的經驗條件熵H（D/A）之差。

（2）最優(yōu)屬性的確定。通過上述公式計算正規(guī)增益值，并篩選出若干重要屬性，利用RBF神經網絡的功能對樣本集的重要屬性進行學習和訓練，根據預測結果精度，按照屬性重要性次序向兩端分別加減一個相鄰的屬性，重復之前的訓練，并將結果與前一次的精度比較，不斷按此循環(huán)，直至最終確定最優(yōu)的k個屬性。

（3）特征屬性的確定。首先，確定根節(jié)點的特征屬性。NG最大的屬性即為根節(jié)點的最優(yōu)屬性，并根據樣本集中該屬性的所有值創(chuàng)建分枝。其次，確定分枝的其他屬性。同理，剩余屬性中NG最大的，即為該分支的后續(xù)分類屬性。

（4）建成決策樹。循環(huán)上述一步，當所有屬性均被用過或結點下各分支的訓練樣本屬于同一類時，即可建成決策樹。

（5）決策樹預測效果檢驗。利用測試集樣本的財務數據，驗證決策樹模型的預測效果。

五、信用風險評估的實證分析

本文以浙江寧波某農商行（下稱“A銀行”）一家分支機構對公客戶為例，驗證基于決策樹和神經網絡融合視角下所構建的決策樹，在信用風險評估中的有效性和準確率。

（一）選取訓練樣本

A銀行對公客戶整體違約率為13.66%，通過BDP——大數據商業(yè)智能平臺，獲取A銀行下轄有接近或相同客戶違約率的支行2家，本次選取B支行2018年末對公客戶為訓練樣本集。截至2018年12月末，B支行對公客戶117家，其中16家企業(yè)客戶發(fā)生違約，企業(yè)客戶違約率為13.68%，與A銀行整體對公客戶違約率十分接近，故可以從樣本推斷A銀行總體情況。

（二）選取測試樣本

C支行為A銀行成立三年的城區(qū)支行，本文擬將C支行同期對公客戶為測試樣本集，將得出的決策樹來評估C銀行56家對公客戶信用風險狀況，以驗證決策樹模型預測的有效性和準確率。

（三）建立基本屬性指標

本文參照商業(yè)銀行客戶信用等級評定中的財務指標建立基本屬性指標，共有12項，具體見表1。

上述財務比率，我們可以通過A銀行BDP——大數據商業(yè)智能平臺批量獲取。

（四）變量設置

考慮到對公客戶財務信息的可獲得性，在實證分析中，對公客戶的貸款違約情況視為目標變量，即以貸款客戶的五級分類形態(tài)為衡量標準，當客戶五級形態(tài)處于次級、可疑和損失時，視為違約，標簽值設為1，否則，視為履約，標簽值設為0?？傎Y產凈利潤、存貨周轉率、速動比率等其他12項變量的符號、標簽值設定情況參照表1。

（五）數據預處理

為了確保數據的真實性，對存在缺失或異常指標值的客戶信息數據進行刪除處理。經過篩選，B支行的企業(yè)貸款客戶剩余有效數為100戶，其中違約客戶13家；C支行剩余的有效客戶數為54戶。同時，為消除部分變量與其他指標值存在不兼容的影響，本文對營運資本變量的所有數據進行了適當的處理。

（六）構建決策樹

根據決策樹和神經網絡相融合的信用風險評估模型，本文以A支行100家對公客戶的財務數據為樣本集進行訓練，最終得到最優(yōu)決策樹如圖1所示。

100家對公客戶中87家為履約客戶，13家為違約客戶。在該決策樹下，訓練樣本的準確率如表2所示。總體來看，模型分類結果正確的數據有98個，準確率為98%。其中，樣本分類錯誤的有2個。即87個履約客戶中，有1個履約客戶被分類為違約客戶，概率為1.15%，86個為履約客戶，準確率為98.85%；13個違約客戶中，有1個被認為履約，概率為7.69%，12個為違約，準確率為92.31%。根據如表3所示的訓練樣本集的重合矩陣可知，第一類錯誤是指將違約客戶評估為履約客戶；第二類錯誤是將履約客戶評估為違約客戶。而對于農商行而言，第一類錯誤造成的實際損失將會更大，風險亦更大。從重合矩陣結果可知，犯第一類錯誤的概率為7.69%，犯第二類錯誤的概率僅為1.15%，錯誤率較低，其模型的預測效果較好。

（七）預測效果檢驗

本文運用構建的決策樹對C支行樣本容量為54戶的企業(yè)貸款客戶進行測試和評估，判斷其在實際運用中是否具有現(xiàn)實意義。根據如表4中的實證結果顯示，訓練樣本平均準確率為95.58%，犯第一類錯誤的比率為7.69%，即將13筆違約貸款中的1筆貸款誤判為履約，對于違約客戶的預測準確率高達92.31%；測試樣本的平均準確率為90.73%，犯第一類錯誤的比率為14.29%，即將7筆違約貸款中的1筆貸款誤判為履約，對于違約客戶的預測準確率高達85.71%，說明決策樹和神經網絡相融合信用風險評估模型的使用可以對測試樣本的信用風險進行評估，且準確率較高，擬合效果較為理想。

六、總結與展望

本文基于決策樹和神經網絡相融合的視角，為農商行高層提供了信用風險評估為主題的咨詢服務，效果明顯；提出了信用風險評估的新途徑，可以在授信業(yè)務等方面逐步推廣使用，同樣也適用于其他商業(yè)銀行。

限于篇幅，本文未涉及農商行小微企業(yè)和零售客戶的信用風險評估。同時，在評估過程中，也未從企業(yè)征信、法院涉訴等多維度可獲取的信息以及企業(yè)的經營情況、競爭能力和信譽狀況等內外部因素進行定性分析，并對采用定量方法得出的信用風險評估情況結果進行適當修正，以更客觀地反映企業(yè)的信用風險狀況。上述問題需開展更廣泛的專題研究。

當然，僅將企業(yè)信用狀況分為履約和違約兩類，這與實際情況不是很相符。因為不管從商業(yè)銀行對貸款風險的十級分類或五級分類，還是從信用評級機構對企業(yè)信用狀況九個等級的評定，履約和違約兩種情況并不能與企業(yè)的實際信用風險狀況建立對應關系，難以滿足商業(yè)銀行對企業(yè)信用風險的細分需求。所以，多分類法也將成為決策樹和神經網絡相融合信用風險評估的研究方向。

同時，靜態(tài)信用風險評估轉向動態(tài)信用風險評估是未來發(fā)展的方向。基于財務比率的信用風險評估屬于靜態(tài)評估，預測未來并不絕對準確。因此，隨著我國商業(yè)銀行客戶歷史數據積累的逐步完善，基于Credit Metrics、KMV等動態(tài)信用風險評估方法將會是未來主流的評估方法。

主要參考文獻

[1]胡賽楠.大數據下基于機器學習的A企業(yè)采購業(yè)務智能內部審計研究[D].重慶理工大學， 2022

[2]劉杰，韓洪靈，陳漢文.大數據時代的審計變革：分析框架與實現(xiàn)路徑[J].財務研究， 2019（3）：42-53

[3]孫劍斌，魏敏.基于決策樹與神經網絡的上市公司信用風險評估模型比較研究[J].中國管理信息化， 2021，24（1）：100-106

[4]王晨陽.基于決策樹算法的審計數據分析研究[J].會計之友， 2020（13）：139-143

[5]梁龍躍，王浩竹.基于圖卷積神經網絡的個人信用風險預測[J].計算機工程與應用， 2023，59（17）：275-285