張鈺
摘 要:根據(jù)中小板市場998家企業(yè)的財務指標數(shù)據(jù)構(gòu)建財務預警與信用評分指標體系,運用相關性與機器學習決策樹對指標進行二次篩選,并通過邏輯回歸計算各樣本的信用分值,再根據(jù)模型評估和實證結(jié)果可以推知:邏輯模型對中小企業(yè)具有較好的財務預警能力,能夠準確衡量企業(yè)信用風險水平。同時可發(fā)現(xiàn),存貨周轉(zhuǎn)率等12個財務指標是衡量中小企業(yè)信用風險的重要指標。
關鍵詞:信用評分;中小企業(yè);邏輯回歸;財務預警
中圖分類號:F276.3? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2021)30-0063-03
引言
隨著我國從經(jīng)濟體量到經(jīng)濟發(fā)展質(zhì)量的轉(zhuǎn)變,中小企業(yè)成為我國經(jīng)濟發(fā)展的重要推動力量,在我國的經(jīng)濟發(fā)展中,逐漸出現(xiàn)了企業(yè)體系中資金配置的兩極分化,這是我國異于他國的金融體系框架所導致的。但從根本上來說,中小企業(yè)發(fā)展最主要的問題是其自身財務狀況導致的融資難問題,中小企業(yè)的資金規(guī)模、技術、產(chǎn)品、服務都嚴重制約了其發(fā)展,且自有資金相對匱乏。此外,易受到外界多種因素的影響,在內(nèi)部管理、決策水平、風險控制等方面的能力也較為薄弱,管理的風險也相對較高,從而使得中小企業(yè)發(fā)展受到各個方面的制約,導致其經(jīng)營風險、管理風險、信用風險不斷加大。
在我國經(jīng)濟發(fā)展改革和經(jīng)濟體系轉(zhuǎn)變的過程中,中小企業(yè)要想扮演好自身的角色,要想有效地提高自身的經(jīng)營能力和財務能力,要想有效地從根本上或者是一定程度地解決中小企業(yè)的融資問題,最重要的是解決企業(yè)信用風險量化問題和建立良好的財務預警體系,從根本上解決金融機構(gòu)和市場主體對中小企業(yè)投資信心的問題。為較好地解決市場外部環(huán)境和中小企業(yè)與銀行之間的信息不對稱的問題,本文旨在建立一套健全的財務指標體系,較為準確地衡量中小企業(yè)的信用風險,并形成評分卡。
一、文獻綜述
在對于中小企業(yè)信用指標體系的研究中,我國許多學者都致力于尋找最合理的方法來衡量企業(yè)風險。如于善麗和遲國泰(2017)通過Fisherscore值建立了服務業(yè)小企業(yè)債信評價體系,并對1 077家企業(yè)的數(shù)據(jù)進行實證分析;孟斌等(2019)根據(jù)組合系數(shù)構(gòu)建建筑企業(yè)信用評價模型,研究表明,與單一賦權結(jié)果相比,組合賦權模型特異度和靈敏度更高;遲國泰等(2019)利用1 814家工業(yè)企業(yè)的貸款數(shù)據(jù)實證分析了其所建立的小型工業(yè)企業(yè)債信評級模型,結(jié)果表明,該指標體系能夠顯著區(qū)分該類企業(yè)的違約狀態(tài);張傳新和王光偉(2012)運用Logit模型實證分析基于主成分的信用風險體系的有效性;郭林(2020)用兩階段邏輯回歸構(gòu)建了敏感性更強、判別力更大的信用評價指標體系,并使用3 111個小企業(yè)的信貸數(shù)據(jù)實證分析了其指標體系的有效性等。
為建立較為準確的指標體系,本文基于企業(yè)財務指標,構(gòu)建指標體系,運用隨機森林和決策樹篩選指標變量,并建立邏輯回歸判別指標模型,最后得出信用分值。
二、指標變量選擇和數(shù)據(jù)處理
(一)特征變量選擇和數(shù)據(jù)預處理
本文選擇了六大類共19個財務指標,具體包括營運能力指標、償債能力指標、盈利能力指標、財務杠桿指標、流動性指標以及發(fā)展能力指標。這六大類指標都是與企業(yè)信用風險的高低有著較高的相關性的。本文數(shù)據(jù)來源于同花順網(wǎng)站中小板市場中988家公司的財務指標數(shù)據(jù),其中ST企業(yè)違約風險為1,非ST違約風險為0。而后對數(shù)據(jù)樣本進行了描述性統(tǒng)計和初步的處理。
(二)缺失值與異常值處理
從下頁表1可知,樣本數(shù)據(jù)缺失嚴重,且樣本量為988個,所以本文采用眾數(shù)、均值、隨機森林模型來填補樣本缺失值,對于較為重要的特征變量,可根據(jù)樣本其他特征變量,用隨機森林模型預測缺失特征的值來補充樣本。此外,通過箱線圖尋找異常值并剔除,所得樣本數(shù)為491個。
三、特征變量篩選
(一)相關性檢驗
根據(jù)數(shù)據(jù)的初步處理,得到491個樣本,19個特征變量,由于本文所采用的數(shù)據(jù)為財務指標數(shù)據(jù),數(shù)據(jù)指標中可能存在多重共線性,所以本文可根據(jù)變量之間的相關系數(shù),初步剔除相關性較強的指標,將相關系數(shù)大于0.5的指標進行剔除,共刪除流動資產(chǎn)周轉(zhuǎn)率、速動比率、權益負債比、凈資產(chǎn)收益率、成本費用利潤率等5個指標。
(二)決策樹深度篩選特征變量
決策樹是一個通過樹狀結(jié)構(gòu)模擬人進行決策的過程的方法,根節(jié)點后的每個分枝代表一個新的決策事件,而每個葉子代表一個最終判定所屬的類別。而決策事件的多少即為深度,不同的深度確定不同特征的重要性,本文基于改變決策樹深度(max_depth=3-20)以確定特征變量對信用違約的貢獻程度,從而得出存貨周轉(zhuǎn)率、資產(chǎn)現(xiàn)金率、流動比率等12個特征。
四、邏輯回歸模型與評估
(一)特征變量分箱,計算WOE
要得出企業(yè)的信用分值,首先要知道每一特征在不同區(qū)間上所對應的分值,即分箱,根據(jù)特征變量的取值,將不同樣本分成不同的區(qū)間。本文為簡化算法,特將每一個特征變量等距分成5個區(qū)間,即5個箱子,且區(qū)間長度相同,并將區(qū)間擴展到正無窮和負無窮。此外,為計算各箱的WOE值,必須保證每個箱中標簽均包含0和1,將無0和1的箱子與上一箱子合并,直到箱子中均含0和1為止。在每一個特征分箱后的每一個箱,將WOE計算完畢后,將其映射到數(shù)據(jù)樣本中,進行模型判別。
(二)邏輯回歸函數(shù)
將上述樣本數(shù)帶入邏輯回歸函數(shù),回歸結(jié)果顯示,截距-3.12895206,特征變量系數(shù)為-0.290402、-0.5816、0.19818等12個系數(shù)。
(三)模型評估
基于該模型為機器學習所訓練的模型,應檢驗其模型的好壞。準確度等于預測值與真實值相同的個數(shù)比上預測樣本數(shù),根據(jù)模型結(jié)果顯出正確度為96.6%,從準確得分來說,該模型具有較好的預測能力,但是由于樣本的不均衡,如果更想知道的是模型對于信用風險較大企業(yè)的預測能力,那么應該選擇ROC曲線,其能較好地評估這一能力。ROC曲線是在不同命中和不同錯誤率下所繪制而成的。AUC指ROC曲線下方的面積,面積越大,模型效果越好。一般來說,AUC值大于0.75就意味著可以接受模型,大于0.85就表示模型效果好。圖1中,AUC值為0.79,說明模型可以接受。