Logistic回歸模型的經驗似然統(tǒng)計方法及其應用
信用風險又稱為違約風險,是商業(yè)銀行面臨的最主要風險.要想避免其發(fā)生,首先需要解決的就是如何度量及預測風險.由于Logistic模型在數(shù)據(jù)采集、變量選擇和模型構建方面比較符合我國的實際情況,且具有可靠的識別和預測能力。故采用該模型來構建針對我國上市公司的信用風險預警模型.在對Logistic模型的參數(shù)進行估計時,采用經驗似然估計法。
經驗似然的估計方法
經驗似然方法最早由 Owen提出,其本質是在約束條件下,求非參數(shù)似然比的極大值,而總體參數(shù)由約束條件帶入極大似然比中.假設Xi(i=1,2…n)是獨立同分布的樣本,F(xiàn)為分布函數(shù),θ為p維待估參數(shù)向量.由于F分布未知,用非參數(shù)似然來對θ進行討論,定義如下非參數(shù)似然函數(shù):
把E( g( x,θ))=0作為約束條件,從而定義了似然函數(shù):
即是Qin & Lawless于1994定義的半參數(shù)模型中,參數(shù)θ的經驗似然函數(shù)。由拉格朗日乘子法,可以將問題轉化為最大化其約束條件為:
則拉格朗日函數(shù)可表示為:
則θ的對數(shù)經驗似然函數(shù)可表示為:
Logistic模型的經驗似然估計
對于Logistic模型,
參數(shù)β的對數(shù)似然函為:
關于參數(shù)β求導,化簡可得到估計方程為:
則參數(shù)β的對數(shù)經驗似然函數(shù)為:
把γ, β看成兩個獨立變量,定義
數(shù)據(jù)與指標選取
本文以滬深A股2015年18家ST公司作為風險樣本,遵循相應原則選擇不存在風險的54家非ST公司為配對樣本.Y表示t年的狀態(tài),X表示財務指標比率,使用樣本t-2年的財務數(shù)據(jù)構建信用風險預警模型.在前人基礎上選擇了常用的18個指標:凈資產收益率、總資產收益率、主營業(yè)務利潤率、每股凈資產、每股收益、固定資產與股東權益比率、應收賬款周轉率、固定資產周轉率、總資產周轉率、凈資產周轉率、資產負債率、流動比率、速度比率、產權比率、主營業(yè)務增長率、固定資產投資擴張率、總資產擴張率、凈資產增長率。
因子分析
選取的財務指標間具有很高的相關性,為了克服變量間的多重共線性,采用因子分析法對指標進行簡化.運用SPSS對數(shù)據(jù)進行標準化處理,再對變量進行KMO和Bartlett球形檢驗,其KMO值為0.696,Bartlett檢驗對應的顯著性概率為0.000,說明原變量適合做因子分析.由因子分析的總方差解釋表可知,變量相關矩陣的前 5個因子的特征值大于 1,它們解釋了總方差的 86.11%。最終選出5個因子。通過因子旋轉方法得到成分得分系數(shù)矩陣,如下表所示。
從旋轉成分矩陣中可看到,主營增長率、固定擴張增長率在第一個因子的載荷較高,反應了企業(yè)的成長能力;固定資產與股東權益比率和每股資產收益在第二個因子上載荷較大,反應了股東獲利能力;流動比率和速度比率在第三個因子上載荷較高,反應了償債能力;總資產收益率和主營業(yè)務利潤率在第四個因子上載荷較高,反應了盈利能力;固定資產周轉率在第五個因子上載荷較高,反應了運營能力。因此,由上表可得到各主成分因子的表達式f1、f2、f3、f4、f5。
Logistic模型參數(shù)估計及有效性驗證
利用R語言求出logistic模型的極大經驗參數(shù)估計值為β0=-0.38,β1=0.78,β2=0.69,β3=-0.64,β4=-2.45,β5=0.2,則logistic模型可表示為
對模型進行驗證,把24家測試樣本t-2年的數(shù)據(jù)帶入到模型中,并以0.5為最佳判別點,得到判定結果如下:
由表可以看出,在檢驗樣本中有 3 家公司被誤判,其正確率為 86%.所以文中所構建的 logistic 回歸模型的效果還是比較理想的。
將Logistic 回歸模型的經驗似然方法應用到數(shù)據(jù)的分類問題中,通過樣本篩選、模型創(chuàng)建及模型檢驗等步驟,建立了基于logistic回歸的風險評估模型.將該方法應用到實例中,其預測正確率達到了86%,是一個較為成功的模型.但本文也有很多不足,文中得到的結果都是在參數(shù)個數(shù)小于樣本容量下產生的,關于參數(shù)發(fā)散情況下Logistic模型的經驗似然方法的統(tǒng)計推斷和分類問題還有待進一步研究。
10.3969/j.issn.1001- 8972.2016.20.010