秦春艷 李道波 王 鈺 袁 勛
(西南財經(jīng)大學(xué)天府學(xué)院,四川 綿陽 621000)
新三板市場的開辟為很多中小微企業(yè)提供了新的融資渠道,但是調(diào)查結(jié)果顯示,銀行貸款仍然是中小微企業(yè)融資的主要手段,由于銀行跟企業(yè)之間的信息不對稱,造成了中小微企業(yè)很難獲得銀行貸款,影響企業(yè)經(jīng)營,對中小微企業(yè)進行合理的信用評級十分必要,本文力求建立適合于中小微企業(yè)的信用評級體系和計算方法,對中小微企業(yè)進行信用評級。
企業(yè)信用評級的數(shù)據(jù)一般是各個企業(yè)的年份型數(shù)據(jù),數(shù)據(jù)離散程度較高,很多模型要求數(shù)據(jù)服從正態(tài)分布,因此這類模型用于信用評級誤差較大。Logistic 回歸分析方法對數(shù)據(jù)的要求不高,不必要數(shù)據(jù)服從正態(tài)分布,所以適合于信用評級。很多學(xué)者嘗試利用Logistic 回歸分析方法進行信用評級。石慶焱等(2004)利用Logistic 回歸分析方法與判別分析、線性規(guī)劃、神經(jīng)網(wǎng)絡(luò)模型對比,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型的準確率最高,Logistic 回歸分析穩(wěn)定性最高。李志輝等(2005)將Logistic回歸分析方法與主成分分析法、Fisher、BP 神經(jīng)網(wǎng)絡(luò)模型作比較,發(fā)現(xiàn)Logistic 回歸分析對商業(yè)銀行風(fēng)險識別和預(yù)測能力較強。
機器學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)模型在信用評級中一般準確率較高,但是往往需要的數(shù)據(jù)較多,而且對過程的解釋力不強。Logistic 回歸分析的信用評級方法不僅可以用來預(yù)測分類,還能進行變量的選擇,參數(shù)估計,結(jié)果解釋性強,操作方便,對數(shù)據(jù)沒有太多要求。Logistic 回歸分析方法對數(shù)據(jù)個數(shù)與變量個數(shù)有要求,一般要求自變量個數(shù)少于分類最少的類別個數(shù)的1/10,因此自變量個數(shù)一般不能太多,然而信用評級的指標(biāo)體系一般指標(biāo)個數(shù)多,往往都是20 個以上,就要求樣本個數(shù)在1000 個左右,一般實際比較難達到這樣的數(shù)據(jù)要求,因此很多研究者采用主因子分析的方式對變量進行降維,因子分析降維具有一定的隨機性,對數(shù)據(jù)要求較高,大樣本情況下很難達到,往往結(jié)果并不理想,且結(jié)果解釋往往不合實際。本文力求尋找一種更加簡單便捷且解釋力強的降維方法,求解小樣本情況下的信用評級問題。
有序Logistic 回歸指因變量為有序的多分類數(shù)據(jù),通過擬合“因變量水平數(shù)-1”個二分類的Logistic 回歸的方法進行預(yù)測,一般稱為累計logit 模型。以因變量4 個水平為例,假設(shè)因變量取值為1,2,3,4,5,6,對應(yīng)概率分別為P1,P2,P3,P4,m 個自變量的模型如下:
本文收集了2022 年底四川省新三板上市的98 家企業(yè)財務(wù)和非財務(wù)數(shù)據(jù),刪除數(shù)據(jù)不全的6 家企業(yè),還剩92 家企業(yè)。選取的財務(wù)指標(biāo)有流動比率、速動比率、資產(chǎn)負債率、經(jīng)營現(xiàn)金流量負債比、產(chǎn)權(quán)比率、總資產(chǎn)報酬率、凈資產(chǎn)收益率、盈余現(xiàn)金保障倍數(shù)、成本費用利用率、應(yīng)收賬款周轉(zhuǎn)率、存貨周轉(zhuǎn)率、總資產(chǎn)周轉(zhuǎn)率、固定資產(chǎn)周轉(zhuǎn)率、流動資產(chǎn)周轉(zhuǎn)率、總資產(chǎn)增長率、凈利潤增長率、營業(yè)收入增長率、營業(yè)利潤增長率、參保人數(shù)、成立年限、注冊資本、專利信息、商標(biāo)信息、著作權(quán)、軟件著作權(quán)、供應(yīng)商客戶數(shù)量、控股企業(yè)個數(shù)、對外投資次數(shù)、行政處罰次數(shù)、被執(zhí)行金額等32 個指標(biāo)作為評級指標(biāo),利用下面的公式對數(shù)據(jù)進行標(biāo)準化處理。
由于指標(biāo)比較多,樣本量相對較少,因此需要對變量進行降維。首先利用SPSS 軟件,通過因子分析提取主成分的方法進行降維,結(jié)果如表1 所示。
表1 因子分析總方差解釋
由表1 可知,由于變量較多,數(shù)據(jù)量較大,因此變量之間的相關(guān)性不是很強,因子分子的降維效果不好,只提取了75.903%的信息,損失信息較多。再通過成分矩陣發(fā)現(xiàn),因子分子降維后的變量比較難解釋其實際意義。這也是信用評級問題普遍遇到的問題,變量太多須要降維,而因子分析的結(jié)果并不理想。因此本文嘗試先利用經(jīng)濟學(xué)知識主觀建模,再使用熵權(quán)法對變量進行降維。
首先從經(jīng)濟學(xué)角度出發(fā),利用財務(wù)報表相關(guān)知識主觀對指標(biāo)進行分類,這種分類方式雖然主觀,但是結(jié)果往往科學(xué)、合理、解釋力強,再結(jié)合相關(guān)性分析,去掉多余變量,建立指標(biāo)體系。然后利用熵權(quán)法計算各三級指標(biāo)在二級指標(biāo)中的權(quán)重(見表2)。
表2 三級指標(biāo)熵權(quán)法權(quán)重
熵權(quán)法計算過程如下:
(1)熵值
(2)區(qū)分度
(3)權(quán)重
然后利用下面的算式計算二級指標(biāo)變量值:
其中εi表示各變量在二級指標(biāo)中的權(quán)重,Zi是標(biāo)準化之后的數(shù)據(jù)。
表3 為降維后的部分數(shù)據(jù)形式,由表4 可知,降維后的指標(biāo)相關(guān)性較差,與因變量信用等級都是正相關(guān),均通過了p=0.05 的假設(shè)檢驗,作為評級指標(biāo)體系比較合理,適合進行回歸分析。
表3 熵權(quán)法降維后部分數(shù)據(jù)
表4 降維后二級指標(biāo)的相關(guān)性分析
首先將啟信寶網(wǎng)站各個企業(yè)綜合得分作為因變量,本文利用SPSS 軟件有序Logistic 回歸,計算得到表5。
表5 Logistic回歸模型擬合信息
從表5 對模型中所有自變量的偏回歸系數(shù)全為0 進行似然比檢驗,結(jié)果p=0.00 <0.01,說明至少有一個自變量的偏回歸系數(shù)不為零,即至少有一個自變量與因變量的關(guān)系顯著,模型有意義。
表6 平行線檢驗即檢驗?zāi)P偷南禂?shù)與分割點是否相關(guān),用于檢驗各個自變量對因變量的影響在各個方程中是否相同,是有序Logistic 回歸分析的前提,這里p=1 >0.01,說明各個回歸方程相互平行,可以使用有序Logistic 回歸分析進行分析。
表6 平行線檢驗
由表7 所有系數(shù)的P 值均小于0.01,所有系數(shù)有意義,所選自變量對因變量均有顯著影響。且各個自變量的系數(shù)均大于0,表示自變量水平提高時,會提高信用等級,例如償債能力因子系數(shù)108.82,表示企業(yè)的償債能力提高時,會提高信用等級的可能性很大。且償債能力的系數(shù)最大,說明償債能力是影響信用評級的最主要因素,償債能力指標(biāo)涵蓋了流動比率和速動比率等因素,因此應(yīng)該綜合分析企業(yè)狀況,并不是越高越好。本文測算結(jié)果與實際相符,說明計算結(jié)果可靠。根據(jù)表7 可以得到有序Logistic 回歸模型。
表7 有序Logistic回歸參數(shù)估算值
logitP1=96.145+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
logit(P1+P2)=109.71+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
logit(P1+P2+P3)=119.199+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
logit(P1+P2+P3+P4)=129.793+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
logit(P1+P2+P3+P4+P5)=139.366+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
同時計算得到有序Logistic 回歸分析預(yù)測正確率為95.6%,預(yù)測效果比較好。
本文再次利用神經(jīng)網(wǎng)絡(luò)模型對上述熵權(quán)法降維后的數(shù)據(jù)進行預(yù)測。
由表8,各個變量系數(shù)均為正,因此都與因變量評級數(shù)正相關(guān),且償債能力系數(shù)最大,對信用評級影響最大,與有序logistic 回歸結(jié)果一致,但是神經(jīng)網(wǎng)絡(luò)訓(xùn)練集正確率為92.2%,測試集準確率89.3%,不及l(fā)ogistic 回歸,且中間過程的解釋不如logistic 回歸明顯。
表8 神經(jīng)網(wǎng)絡(luò)參數(shù)估算值
本文以四川省新三板上市的中小微制造企業(yè)為研究對象,嘗試建立一種合適的中小微企業(yè)的信用評級體系和方法,中小微企業(yè)和銀行之間建立信息關(guān)系,方便中小微企業(yè)向銀行貸款以及新三板市場融資。實踐證明主觀利用經(jīng)濟學(xué)原理建立指標(biāo)體系、熵權(quán)法降維、有序logistic 回歸預(yù)測信用等級的方法可行,指標(biāo)體系解釋力強,logistic 回歸預(yù)測準確率高。償債能力是企業(yè)經(jīng)營狀況的重要標(biāo)識,也是企業(yè)信用評級的最強影響因素,預(yù)測結(jié)果與實際相符,因此本文建立的評級指標(biāo)有效,模型測算方法值得參考。