亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的信貸風(fēng)險量化與決策分析

        2021-12-08 19:54:03王沼翔葛琳
        軟件工程 2021年12期
        關(guān)鍵詞:熵權(quán)法BP神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)

        王沼翔 葛琳

        摘 ?要:中小微企業(yè)在發(fā)展過程中需要信貸融資,然而部分企業(yè)的不良貸款會對金融穩(wěn)定構(gòu)成威脅。針對此問題,可以通過對企業(yè)相關(guān)財務(wù)數(shù)據(jù)進(jìn)行分析,從源頭上防范和降低信貸風(fēng)險。本文采用熵權(quán)法、數(shù)據(jù)統(tǒng)計(jì)分析法、K均值聚類和BP神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法來給出相應(yīng)的信貸策略,規(guī)避信貸風(fēng)險。實(shí)驗(yàn)基于2020 年全國大學(xué)生數(shù)學(xué)建模競賽賽題發(fā)布的公開數(shù)據(jù)集,利用MATLAB R2018a和Python 3.9等工具進(jìn)行代碼編寫。測試結(jié)果表明,本文方法可以有效地對中小微企業(yè)的信貸風(fēng)險進(jìn)行評估并制定相應(yīng)的信貸策略。

        關(guān)鍵詞:風(fēng)險評級模型;機(jī)器學(xué)習(xí);熵權(quán)法;BP神經(jīng)網(wǎng)絡(luò);K均值聚類

        中圖分類號:TP391 ? ? 文獻(xiàn)標(biāo)識碼:A

        Abstract: Medium, small and micro enterprises need credit financing in the development process, but non-performing loans of some enterprises pose a threat to financial stability. Aiming at this problem, an analysis of relevant financial data of the enterprise prevents and reduces credit risks from the source. This paper proposes corresponding credit strategies to avoid credit risks by using machine learning algorithms such as entropy weight method, data statistical analysis method, K-means clustering and BP neural network. The experiment is based on the public data set released by the 2020 National College Students Mathematical Modeling Contest, using MATLAB R2018a, Python 3.9 and other tools for code writing. Test results show that the proposed strategies can effectively evaluate the credit risk of medium, small and micro enterprises and formulate corresponding credit strategies.

        Keywords: risk rating model; machine learning; entropy weight method; BP neural network; K-means clustering

        1 ? 引言(Introduction)

        在市場經(jīng)濟(jì)運(yùn)行中,中小微企業(yè)的經(jīng)營特點(diǎn)決定了其在融資過程中存在一定的風(fēng)險,銀行在向中小微企業(yè)提供貸款時,要充分考慮多方面因素并制定合適的信貸策略。面對海量的信貸數(shù)據(jù),如何提高模型與算法對信貸企業(yè)風(fēng)險評估的精確性,已經(jīng)逐漸成為銀行業(yè)亟待解決的關(guān)鍵問題。傳統(tǒng)信貸風(fēng)險管理模式主要依賴人工運(yùn)用統(tǒng)計(jì)方法對企業(yè)借貸違約可能性的預(yù)測,以被評估者相關(guān)指標(biāo)的歷史數(shù)據(jù)為依據(jù),對被評估者的還貸能力和違約行為進(jìn)行預(yù)測和分析。隨著互聯(lián)網(wǎng)金融的興起,傳統(tǒng)的評估模型與預(yù)測算法已不能滿足評估信貸風(fēng)險的實(shí)際需要[1-4]。在大數(shù)據(jù)技術(shù)的作用下,銀行可以運(yùn)用綜合分析有效防控信貸風(fēng)險和信息不對稱問題。借助機(jī)器學(xué)習(xí)和深度學(xué)習(xí),銀行可以分析大量的企業(yè)數(shù)據(jù),預(yù)測信貸風(fēng)險,提高風(fēng)險識別能力[5]。

        本文采用熵權(quán)法、數(shù)據(jù)統(tǒng)計(jì)分析法和BP神經(jīng)網(wǎng)絡(luò),利用MATLAB R2018a和Python 3.9等工具對有信貸和無信貸記錄企業(yè)的相關(guān)數(shù)據(jù)集進(jìn)行分析,給出相應(yīng)的信貸策略,規(guī)避信貸風(fēng)險[6-8]。對于有信貸記錄企業(yè),本文運(yùn)用數(shù)據(jù)統(tǒng)計(jì)法分析中小微企業(yè)的信貸影響因素,采用熵權(quán)法計(jì)算每個影響因素的權(quán)值,并得出各企業(yè)綜合信貸風(fēng)險值,最后通過聚類分析,將各企業(yè)劃分類別,通過與信譽(yù)評級的組合來確定合適的信貸策略方案;對于無信貸記錄企業(yè),本文使用有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)對信貸策略進(jìn)行預(yù)測和分析,得到各個信譽(yù)等級數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明,本文所建立的模型可以有效地對中小微企業(yè)的信貸風(fēng)險進(jìn)行評估并制定有效的信貸策略。

        2 ? 數(shù)據(jù)預(yù)處理(Data preprocessing)

        本文以2020 年全國大學(xué)生數(shù)學(xué)建模競賽賽題發(fā)布的公開數(shù)據(jù)集為例進(jìn)行分析,該數(shù)據(jù)集包含123 家有信貸記錄企業(yè)的21萬條進(jìn)項(xiàng)發(fā)票信息、16萬條銷項(xiàng)發(fā)票信息,302 家無信貸記錄企業(yè)的39萬條進(jìn)項(xiàng)發(fā)票信息、33萬條銷項(xiàng)發(fā)票信息以及銀行貸款年利率與客戶流失率關(guān)系統(tǒng)計(jì)數(shù)據(jù)。基于Python編程完成對數(shù)據(jù)集中數(shù)據(jù)的預(yù)處理,分別實(shí)現(xiàn)有信貸記錄企業(yè)和無信貸記錄企業(yè)的銷項(xiàng)、進(jìn)項(xiàng)發(fā)票中的數(shù)據(jù)計(jì)算,通過對每個企業(yè)有效發(fā)票的金額、稅額、價稅的累加,得到各企業(yè)全部有效發(fā)票的總金額、總稅額和總價稅合計(jì)等數(shù)據(jù)信息。

        3 ?有信貸記錄企業(yè)信貸分析與決策(Credit analysis and decision-making for companies with credit records)

        對于有信貸記錄企業(yè),根據(jù)企業(yè)交易票據(jù)中的數(shù)據(jù),通過建立數(shù)學(xué)模型給出合適的信貸策略。首先,構(gòu)建人脈占有率、市場流通率、市場穩(wěn)定率、企業(yè)盈利率四個影響信貸風(fēng)險因素的評估因子;其次,基于K均值聚類算法、熵權(quán)法建立風(fēng)險評級模型,以風(fēng)險級別確定貸款額度;第三,分析客戶流失率、貸款利率以及企業(yè)評級的關(guān)系,以信譽(yù)評級確定貸款利率[2];最后,按照三類風(fēng)險評級、三類信譽(yù)評級組合成的九種企業(yè)定位確定不同額度、不同利率的信貸策略。整體流程圖如圖1所示,模型分析中所用的數(shù)學(xué)符號如表1所示。

        3.1 ? 影響因子

        對有信貸記錄企業(yè)的數(shù)據(jù)根據(jù)進(jìn)項(xiàng)、銷項(xiàng)、有效發(fā)票和發(fā)票總數(shù)進(jìn)行分析,綜合考慮企業(yè)和銀行各方面的因素,在企業(yè)實(shí)力、供求穩(wěn)定性等方面設(shè)置下列影響因子:

        將企業(yè)聚合為三個類別,對三個類別進(jìn)行綜合評分(LFD),其評分計(jì)算如公式(12)所示。將該三類企業(yè)重新進(jìn)行分類并編號,類別由強(qiáng)到弱編為S1、S2、S3,根據(jù)聚類分析得出三個類別分別對應(yīng)的部分企業(yè)如表3所示。

        利率和企業(yè)的信譽(yù)之間存在潛在關(guān)系,在A、B、C三種信譽(yù)等級的企業(yè)流失率與貸款利率呈正相關(guān)且在同等貸款利率水平下,A、B、C三種信譽(yù)評級的企業(yè)流失率依次降低。本文將年利率和貸款額度分別分為三組,如表4所示。

        銀行根據(jù)企業(yè)的信貸風(fēng)險類別和其對應(yīng)的信譽(yù)評級將企業(yè)分為九級定位,對于不同信貸風(fēng)險級別的企業(yè),確定不同貸款額度;對于不同信譽(yù)級別的企業(yè),確定不同貸款利率[4]。信貸策略各級對應(yīng)表如表5所示。

        本文所分析的數(shù)據(jù)集涉及302 家企業(yè)信息中無信譽(yù)評級等數(shù)據(jù),然而信譽(yù)評級在銀行信貸策略中具有重要的意義。首先,采用有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),對所分析的數(shù)據(jù)集中123 家有信譽(yù)評級的企業(yè)信息提取的影響因子進(jìn)行訓(xùn)練;其次,利用訓(xùn)練得到的BP神經(jīng)網(wǎng)絡(luò)對無信譽(yù)評級的企業(yè)進(jìn)行信譽(yù)評級和分析;最后,驗(yàn)證模型是否合理[6]。

        4.1 ? BP神經(jīng)網(wǎng)絡(luò)模型

        無信貸記錄企業(yè)的數(shù)據(jù)集中無信譽(yù)等級數(shù)據(jù),故而使用有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)對信貸策略進(jìn)行預(yù)測和分析,并得到各個信譽(yù)等級數(shù)據(jù)。BP神經(jīng)網(wǎng)絡(luò)模型中各符號的含義如下:

        網(wǎng)絡(luò)輸入向量;網(wǎng)絡(luò)目標(biāo)向量;中間層單元輸入向量、輸出向量;輸出層單元輸入向量、

        輸出向量;輸出層到中間層的鏈接權(quán)值;中間層到輸出層的鏈接權(quán)值;中間層每一個神經(jīng)單元的輸出閾值(即偏置向量);輸出層每一個神經(jīng)單元的輸出閾值(即偏置向量);參數(shù)。

        BP神經(jīng)網(wǎng)絡(luò)模型計(jì)算輸入輸出信息結(jié)果是否產(chǎn)生相互影響的權(quán)重,并進(jìn)行綜合分析。構(gòu)建過程如下:

        (1)初始化。對每一個神經(jīng)元的權(quán)值和、閾值和設(shè)置區(qū)間在(-1,1)內(nèi)的隨機(jī)數(shù)。

        (2)在有信貸記錄企業(yè)數(shù)據(jù)集的123 家企業(yè)中選取一組學(xué)習(xí)樣本和目標(biāo)樣本。

        (3)計(jì)算中間層單元的輸出。

        (9)隨機(jī)選取下個樣本代入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,執(zhí)行步驟(3),直到網(wǎng)絡(luò)的訓(xùn)練全局誤差達(dá)到網(wǎng)絡(luò)收斂值,學(xué)習(xí)結(jié)束[7]。本文獲得的影響企業(yè)實(shí)力的因子為四個,輸入層神經(jīng)節(jié)點(diǎn)數(shù)目為4,而本文神經(jīng)網(wǎng)絡(luò)最終輸出的只有一個企業(yè)實(shí)力數(shù)據(jù),則輸出層節(jié)點(diǎn)個數(shù)為1。隱含層節(jié)點(diǎn)數(shù)目的取值如公式(22)所示。式中,為輸入層節(jié)點(diǎn)的數(shù)目,l為輸出層節(jié)點(diǎn)的數(shù)目,為隱含層節(jié)點(diǎn)的數(shù)目。由公式(22)可得隱含層節(jié)點(diǎn)數(shù)目為2。

        4.2 ? 模型訓(xùn)練

        采用獨(dú)立測試方法,將實(shí)驗(yàn)數(shù)據(jù)分成兩部分,其一是訓(xùn)練數(shù)據(jù)。本文將有信貸記錄企業(yè)數(shù)據(jù)集中的123 家企業(yè)的樣本數(shù)據(jù)按照信譽(yù)評價分類,隨機(jī)抽取100 組數(shù)據(jù)作為實(shí)驗(yàn)培訓(xùn)數(shù)據(jù),剩下的23 組樣本數(shù)據(jù)作為測試數(shù)據(jù),用于檢測BP神經(jīng)網(wǎng)絡(luò)。利用MATLAB將訓(xùn)練樣本數(shù)據(jù)代入程序,并對該神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到的訓(xùn)練結(jié)果如圖2和圖3所示。

        通過上述訓(xùn)練,可以得到初步的訓(xùn)練結(jié)果,為了驗(yàn)證BP神經(jīng)網(wǎng)絡(luò),將測試數(shù)據(jù)代入已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)模型當(dāng)中進(jìn)行測試。為得出模型測試準(zhǔn)確度,我們構(gòu)建以下度量模型,測試結(jié)果好壞的誤差計(jì)算如公式(23)所示。式中,為模型誤差,為真實(shí)值,為評價值,為測試數(shù)據(jù)集個數(shù)。通過上述誤差公式計(jì)算得出BP神經(jīng)網(wǎng)絡(luò)的測試誤差為0.112。通過構(gòu)建并優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型,計(jì)算出無信貸記錄企業(yè)的四個指標(biāo)因素值。

        圖4中值為3對應(yīng)信譽(yù)等級為A,數(shù)量為76 個;值為2對應(yīng)信譽(yù)等級為B,數(shù)量為92 個;值為1對應(yīng)信譽(yù)等級為C,數(shù)量為86 個;值為0對應(yīng)信譽(yù)等級為D,數(shù)量為48 個。因?yàn)殂y行對信譽(yù)評級為D的企業(yè)原則上不予放貸,故將BP神經(jīng)網(wǎng)絡(luò)的信譽(yù)等級匹配到無信貸記錄企業(yè)數(shù)據(jù)集的各個企業(yè)中,將信譽(yù)評價為D級的企業(yè)剔除。對無信貸記錄企業(yè)數(shù)據(jù)集處理后的各項(xiàng)數(shù)據(jù)利用公式(1)—(4)進(jìn)行量化分析,計(jì)算出各個指標(biāo)的值,并且利用熵權(quán)法求出四個影響因子的權(quán)重,則企業(yè)風(fēng)險評級模型如公式(24)所示:

        4.3 ? 實(shí)驗(yàn)與測試

        根據(jù)無信貸記錄企業(yè)的數(shù)據(jù)計(jì)算出各個影響因子的權(quán)重,分析四個影響因子的數(shù)據(jù),進(jìn)行聚類分析,將企業(yè)聚合為三個類別,則得出分級評分如表6所示。

        由分級數(shù)據(jù)以及客戶流失率可得,當(dāng)年利率大于0.0745時,各個信譽(yù)等級企業(yè)的客戶流失率為0.5,潛在客戶大量流失,其收益也將大幅度下降,所以將客戶流失率控制在0.5之內(nèi),有利于銀行收益的可持續(xù)發(fā)展[8]。本文將客戶流失率小于0.5的年利率分為三組,S4、S5、S6部分對應(yīng)的企業(yè)信貸額度也分為三組。

        根據(jù)前文數(shù)據(jù)分析,按照企業(yè)的風(fēng)險評級和實(shí)力類別制定九種信貸策略,從而確定不同企業(yè)的貸款額度、利率,如表7所示。

        按照信貸策略分配金額,得出全體企業(yè)的貸款金額總額區(qū)間(萬元),銀行的收益總額區(qū)間(萬元)。

        由于假設(shè)中規(guī)定是1 億元定額分配貸款金額,9,050 萬元按照表7的信貸策略對企業(yè)進(jìn)行放貸。剩下950 萬元有兩種選擇策略:一是銀行利益最大化,將剩余額度優(yōu)先分配給貸款利率較高的信譽(yù)C級企業(yè);二是銀行發(fā)展持久化,將剩余額度優(yōu)先分配給信譽(yù)A級企業(yè),來降低此類高信譽(yù)級別企業(yè)的客戶流失率,為銀行積累固定客戶。

        5 ? 結(jié)論(Conclusion)

        大數(shù)據(jù)時代給各行各業(yè)提供了更多利用數(shù)據(jù)的機(jī)會,在信貸業(yè)務(wù)中存在諸多不確定因素,銀行應(yīng)及時綜合多方面因素,根據(jù)形勢調(diào)整信貸策略。本文針對銀行向中小微企業(yè)發(fā)放貸款問題,依據(jù)熵權(quán)法、K均值聚類和BP神經(jīng)網(wǎng)絡(luò)對信貸策略問題進(jìn)行模型求解,以123 家有信貸記錄企業(yè)和302 家無信貸記錄企業(yè)的財務(wù)數(shù)據(jù)為樣本進(jìn)行實(shí)證檢驗(yàn),從人脈占有率、市場流通率、市場穩(wěn)定率、企業(yè)盈利率四個影響因素對有信貸記錄企業(yè)和無信貸記錄企業(yè)的相關(guān)數(shù)據(jù)集進(jìn)行分析,最終給出合適的信貸策略選擇方案。

        信貸數(shù)據(jù)是信貸業(yè)務(wù)中的重要部分,為了實(shí)現(xiàn)精準(zhǔn)分析數(shù)據(jù)的目標(biāo),在分析信貸風(fēng)險時,銀行需要對數(shù)據(jù)進(jìn)行深入統(tǒng)計(jì)和挖掘,可通過對多種算法模型進(jìn)行組合,綜合分析企業(yè)實(shí)力、供求關(guān)系等方面信息,建立信貸授權(quán)額度模型,優(yōu)化信貸資源整體配置效率,加強(qiáng)信貸風(fēng)控系統(tǒng)的控制和管理。模型中分析問題、解決問題的一些綜合性的方法,以及信貸風(fēng)險量化分析的一些思想,對于其他的數(shù)學(xué)問題仍可以使用,可推廣到各行業(yè)的實(shí)力評價與決策等應(yīng)用中。

        參考文獻(xiàn)(References)

        [1] 李美玲.H商業(yè)銀行信貸業(yè)務(wù)全面風(fēng)險管理體系研究[D].長春:吉林大學(xué),2019.

        [2] 唐恬.商業(yè)銀行中小企業(yè)信貸風(fēng)險策略研究[J].經(jīng)營與管理,2021(04):154-158.

        [3] 李越洋.基于熵權(quán)-TOPSIS的PPP項(xiàng)目融資風(fēng)險評價[J].價值工程,2019,38(05):69-72.

        [4] 朱文雅.熵權(quán)法在銀行經(jīng)營績效評價中的應(yīng)用[J].中國鄉(xiāng)鎮(zhèn)企業(yè)會計(jì),2019(02):150-151.

        [5] OOSTERLEE C W, GRZELAK L A. Mathematical modeling and computation in finance with exercises and Python and MATLAB computer codes[M]. Singapore: World Scientific Publishing Company, 2019:3-15.

        [6] 李鈺博,裴宇恒,高曉亮.中小微企業(yè)的信貸決策問題研究[J].營銷界,2020(29):163-165.

        [7] 楊君岐,任瑞,闞立娜,等.基于BP神經(jīng)網(wǎng)絡(luò)模型的商業(yè)銀行風(fēng)險評估研究[J].會計(jì)之友,2021(05):113-119.

        [8] XU M L, XIONG D P, YANG M Y. Risk recognition and risk classification diagnosis of bank outlets based on information entropy and BP neural network[J]. Journal of Intelligent and Fuzzy Systems, 2020, 38(2):1531-1538.

        作者簡介:

        王沼翔(1999-),男,本科生.研究領(lǐng)域:大數(shù)據(jù)分析.

        葛 ?琳(1978-),女,博士,講師.研究領(lǐng)域:網(wǎng)絡(luò)信息安全,大數(shù)據(jù)分析,區(qū)塊鏈.

        猜你喜歡
        熵權(quán)法BP神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)
        大學(xué)周邊健身房滿意度調(diào)查報告
        基于熵權(quán)法的京津冀區(qū)域信息化協(xié)調(diào)發(fā)展規(guī)律模型及其應(yīng)用
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        基于BP神經(jīng)網(wǎng)絡(luò)的旅行社發(fā)展方向研究
        商情(2016年39期)2016-11-21 09:30:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        基于熵權(quán)法的西安市外向型經(jīng)濟(jì)發(fā)展綜合評價研究
        價值工程(2016年29期)2016-11-14 00:15:45
        復(fù)雜背景下的手勢識別方法
        BP神經(jīng)網(wǎng)絡(luò)在軟件質(zhì)量評價中的應(yīng)用研究 
        城市與區(qū)域經(jīng)濟(jì)可持續(xù)發(fā)展
        商(2016年27期)2016-10-17 04:35:55
        97激情在线视频五月天视频| 无码熟熟妇丰满人妻啪啪| 久久综合网天天 | 亚洲伊人成综合人影院| 久久久精品亚洲一区二区国产av| 成人精品视频一区二区| 免费大片黄在线观看| 欧美亚洲另类国产18p| 久久伊人精品中文字幕有 | 三a级做爰片免费观看| 人妻aⅴ无码一区二区三区| 狠狠色丁香婷婷久久综合2021| 97成人精品在线视频| 国产成人av乱码在线观看| 亚洲美国产亚洲av| 国产亚洲成年网址在线观看| 日韩中文字幕不卡在线| 欧美精品videosex极品| 日韩AV不卡一区二区三区无码| 亚洲av五月天天堂网| 亚洲另类丰满熟妇乱xxxx| 欧美放荡的少妇| 在线播放国产女同闺蜜| 亚洲中文字幕第一第二页| 无套内射在线无码播放| 少妇高潮潮喷到猛进猛出小说| 人妖另类综合视频网站| 国产亚洲3p一区二区| 亚洲国产成人精品无码区在线秒播| 久久人妻公开中文字幕| 在线观看免费人成视频国产| 在线观看免费日韩精品| 中国国语毛片免费观看视频| 亚洲国产一区二区三区在线视频 | 国产成人a人亚洲精品无码| 人妻在线中文字幕| 少妇人妻在线伊人春色| 欧美成人国产精品高潮| 亚洲 欧美 国产 日韩 精品| 亚洲av粉嫩性色av| 天天综合天天爱天天做|