亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于ODR-BADASYN-SVM的中小企業(yè)信用風(fēng)險(xiǎn)評(píng)估

        2018-03-07 23:40:52孟杰李田苑澤明
        金融發(fā)展研究 2018年1期
        關(guān)鍵詞:分類模型企業(yè)

        孟杰 李田 苑澤明

        (天津財(cái)經(jīng)大學(xué)商學(xué)院,天津300222)

        一、引言

        融資難一直制約著中小企業(yè)的發(fā)展。中小企業(yè)在初始成長(zhǎng)階段無(wú)法積累足夠的內(nèi)部留存,加之多層次的資本市場(chǎng)尚未形成,使得信貸融資成為中小企業(yè)早期獲得資本支持的主要途徑。然而,信息不對(duì)稱、有效抵押品不足等,致使銀行為規(guī)避風(fēng)險(xiǎn)而考量的貸款條件極為“苛刻”,從而導(dǎo)致信貸配給;特別是在信貸市場(chǎng)以大型銀行為主導(dǎo)的我國(guó),中小企業(yè)融資難這一世界性難題就顯得格外突出(郭娜,2013)。對(duì)中小企業(yè)信用風(fēng)險(xiǎn)進(jìn)行評(píng)估,能夠使外部投資者了解企業(yè)實(shí)際信用狀況,避免由于道德風(fēng)險(xiǎn)與逆向選擇造成的損失,以進(jìn)一步優(yōu)化融資環(huán)境。

        近年來(lái),隨著人工智能與數(shù)據(jù)挖掘技術(shù)的發(fā)展,具有較高準(zhǔn)確性與適用性的機(jī)器學(xué)習(xí)模型被用于企業(yè)信用風(fēng)險(xiǎn)評(píng)估。支持向量機(jī)(Support Vector Mechine,以下簡(jiǎn)稱SVM)作為其中一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,由于在處理小樣本、高維度以及非線性數(shù)據(jù)時(shí)優(yōu)點(diǎn)突出,逐漸被用于信用風(fēng)險(xiǎn)的評(píng)估。

        本文采用文獻(xiàn)調(diào)研與問卷調(diào)查相結(jié)合的方法,構(gòu)建中小企業(yè)信用評(píng)估的指標(biāo)體系;在此基礎(chǔ)上,選取A股上市非金融公司中的中小企業(yè)數(shù)據(jù)作為研究樣本,利用SVM模型對(duì)中小企業(yè)信用風(fēng)險(xiǎn)進(jìn)行評(píng)估;為解決非平衡樣本對(duì)模型性能的影響這一問題,利用ODR-BADASYN方法對(duì)模型進(jìn)行改進(jìn),并以非均衡樣本分類的Gmean和Fmeasure指標(biāo)對(duì)模型性能進(jìn)行評(píng)價(jià),利用T檢驗(yàn)對(duì)模型間性能的差異性進(jìn)行檢驗(yàn)。評(píng)估結(jié)果發(fā)現(xiàn),改進(jìn)后的SVM模型在中小企業(yè)信用風(fēng)險(xiǎn)評(píng)估方面具有較高穩(wěn)定性和預(yù)測(cè)能力,能夠?yàn)橥顿Y者判斷中小企業(yè)信用風(fēng)險(xiǎn)進(jìn)而開展貸款決策提供依據(jù)。

        二、文獻(xiàn)回顧

        (一)信用風(fēng)險(xiǎn)評(píng)估及其方法

        信用風(fēng)險(xiǎn)評(píng)估是指對(duì)待評(píng)估主體可能引起信用風(fēng)險(xiǎn)的各種定性、定量的指標(biāo)進(jìn)行分析或計(jì)算,從而測(cè)度借款人違約的概率,為貸款與否提供決策依據(jù)(張目等,2009)。信用風(fēng)險(xiǎn)評(píng)估是信用風(fēng)險(xiǎn)管理的基礎(chǔ)和關(guān)鍵。

        自Beaver(1966)首次提出以單一財(cái)務(wù)比率評(píng)價(jià)公司信用風(fēng)險(xiǎn)以來(lái),信用風(fēng)險(xiǎn)評(píng)估方法隨著技術(shù)進(jìn)步日益豐富,目前可以分為因素分析法和模型分析法(沈鳳武等,2012)。

        因素分析法主要基于企業(yè)的財(cái)務(wù)因素或信用要素。其中,財(cái)務(wù)因素分析法的考察內(nèi)容較為單一,主要包括比率分析法、趨勢(shì)分析法及比較分析法等。信用要素分析法在財(cái)務(wù)因素的基礎(chǔ)上,將影響企業(yè)信用的要素納入指標(biāo)體系,主要包括“5C”、“5W”和“5P”等方法。盡管信用要素分析法在一定程度上彌補(bǔ)了前者指標(biāo)單一的不足,但由于存在內(nèi)容接近、判斷主觀、結(jié)果受主客觀影響明顯等問題(張玲等,2000),應(yīng)用程度尚不及模型分析法。

        隨著統(tǒng)計(jì)知識(shí)在經(jīng)濟(jì)學(xué)科的深入應(yīng)用,模型分析法得到逐步發(fā)展和廣泛引用,多元線性模型、Logit模型、KMV模型及以神經(jīng)網(wǎng)絡(luò)模型為代表的非參數(shù)機(jī)器學(xué)習(xí)模型等(丁欣等,2002)均屬于該范疇。Altman等(1968)利用美國(guó)破產(chǎn)企業(yè)與非破產(chǎn)企業(yè)的財(cái)務(wù)指標(biāo),構(gòu)建風(fēng)險(xiǎn)判別函數(shù),率先使用多元判別分析方法進(jìn)行風(fēng)險(xiǎn)評(píng)估;其后不斷完善評(píng)價(jià)指標(biāo),建立了Zate信用評(píng)分模型(Altman等,1977),但由于應(yīng)用條件較為苛刻(如要求數(shù)據(jù)本身服從正態(tài)分布且滿足協(xié)方差矩陣相等),限制了模型在實(shí)際應(yīng)用中的效果。Ohlson等(1981)構(gòu)建了以Logistic函數(shù)為基礎(chǔ)的Logit判別模型,在對(duì)企業(yè)違約概率進(jìn)行實(shí)際驗(yàn)證的基礎(chǔ)上,證明了其結(jié)果優(yōu)于多元線性模型。該模型隨后與主成分分析相結(jié)合,以探索最佳主成分指標(biāo)的選?。ˋguilera等,2006),提升模型的評(píng)價(jià)能力。Dong G等(2010)在比較不同模型的作用后,分析了Logit模型的優(yōu)點(diǎn),同時(shí)為提高模型精度加入隨機(jī)系數(shù),實(shí)現(xiàn)了對(duì)信貸風(fēng)險(xiǎn)的有效管理??紤]到各財(cái)務(wù)指標(biāo)之間存在錯(cuò)綜復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系,方匡南等(2016)構(gòu)建了基于網(wǎng)絡(luò)結(jié)構(gòu)的Logit模型,并應(yīng)用于企業(yè)信用風(fēng)險(xiǎn)預(yù)警。然而,囿于樣本量需求大以及財(cái)務(wù)指標(biāo)之間的多重共線性問題,Logit模型的應(yīng)用也受到局限。

        KMV模型在上市公司信用風(fēng)險(xiǎn)評(píng)價(jià)中的應(yīng)用得到肯定(蔣彧等,2015;牛曉健等,2012)。結(jié)合中國(guó)金融市場(chǎng)的特點(diǎn),蔣彧等(2015)對(duì)KMV方法進(jìn)行了修正,并運(yùn)用于我國(guó)上市公司的信用風(fēng)險(xiǎn)評(píng)估,認(rèn)為修正后的KMV在特定條件下具有較好的評(píng)估能力。但由于該模型假設(shè)評(píng)估指標(biāo)嚴(yán)格服從正態(tài)分布,并且只有通過(guò)對(duì)比分析才能得出企業(yè)違約的概率,影響了模型準(zhǔn)確性,KMV模型在中小企業(yè)信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用受到局限。

        以神經(jīng)網(wǎng)絡(luò)為代表的非參數(shù)有監(jiān)督學(xué)習(xí)模型是隨著人工智能技術(shù)發(fā)展而出現(xiàn)的一類模型評(píng)價(jià)方法。吳德勝等(2004)在研究中引入遺傳算法和BP神經(jīng)網(wǎng)絡(luò)構(gòu)建GA-BP模型,評(píng)估我國(guó)商業(yè)企業(yè)信用風(fēng)險(xiǎn),以克服傳統(tǒng)網(wǎng)絡(luò)訓(xùn)練中局部極小的缺點(diǎn),但這種BP神經(jīng)網(wǎng)絡(luò)模型在處理小樣本、高維度數(shù)據(jù)時(shí),精確度往往有所降低。

        (二)SVM模型原理及其改進(jìn)

        SVM由Vapnik和Corinna Cortes于1995年首先提出,是一種基于Mercer定理、以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則的機(jī)器學(xué)習(xí)模型。相對(duì)其他模式識(shí)別方法,SVM結(jié)合了理論驅(qū)動(dòng)、易于分析的統(tǒng)計(jì)方法與數(shù)據(jù)驅(qū)動(dòng)、靈活的機(jī)器學(xué)習(xí)方法的優(yōu)點(diǎn)(Viaene S等,2002),能很好地解決樣本數(shù)量少、維數(shù)高及非線性等實(shí)際問題(Yu L等,2005;Mitsdorffer R等,2008)。在樣本量小的情況下,SVM方法分類的準(zhǔn)確性優(yōu)于多元判別法,進(jìn)而為銀行等投資者判斷信用風(fēng)險(xiǎn)提供依據(jù)(唐建榮等,2010)。并且在這種情況下,SVM方法能夠得出特征空間的最優(yōu)解,通過(guò)分類準(zhǔn)確率這一指標(biāo)評(píng)價(jià)模型性能,發(fā)現(xiàn)其與神經(jīng)網(wǎng)絡(luò)方法相比更優(yōu),在信用風(fēng)險(xiǎn)評(píng)估中的作用更顯著(Viaene S等,2002;楊毓等,2006;李云飛,2008)。

        然而,相對(duì)正常企業(yè)的數(shù)量,實(shí)際存在信用風(fēng)險(xiǎn)的企業(yè)數(shù)量少,兩類樣本間的不平衡性會(huì)影響SVM的預(yù)測(cè)結(jié)果,使得SVM預(yù)測(cè)準(zhǔn)確率降低,且降低幅度會(huì)隨樣本不平衡性的增加而增加(李揚(yáng)等,2016)。提升SVM對(duì)不平衡樣本預(yù)測(cè)性能,可通過(guò)樣本的過(guò)采樣和欠采樣,進(jìn)行數(shù)據(jù)層面的改進(jìn)。其中,針對(duì)少數(shù)類樣本過(guò)采樣的SMOTE方法,可以通過(guò)人工生成一定量的少數(shù)類樣本來(lái)提高SVM模型的分類能力(Gong M G等,2006;Chawla N等,2002;王超學(xué)等,2014)。但SMOTE方法忽視了少數(shù)類樣本的分布特點(diǎn),容易造成樣本重疊,且存在無(wú)法處理多數(shù)類樣本的缺點(diǎn)(林宇等,2016);由此,林宇等(2016)提出自適應(yīng)抽樣合成方法(ADASYN)與逐級(jí)優(yōu)化的欠采樣方法(ODR)來(lái)改進(jìn)SVM模型。此外,針對(duì)ADASYN方法合成的新樣本分布分散、不能抵抗孤立樣本和噪聲樣本干擾等問題,洪銘等(2017)提出了改進(jìn)的BADASYN算法,只對(duì)處于邊界區(qū)域的少數(shù)類樣本進(jìn)行自適應(yīng)合成。

        (三)文獻(xiàn)述評(píng)

        現(xiàn)有研究表明,相對(duì)于因素分析法而言,模型分析法的評(píng)估結(jié)果更加客觀、有效;而模型分析法中,SVM在評(píng)估企業(yè)信用風(fēng)險(xiǎn)方面具有顯著優(yōu)勢(shì)。此外,針對(duì)研究樣本存在的不平衡性,可以通過(guò)數(shù)據(jù)層面的方法改進(jìn),有效克服樣本處理中的缺陷,提高模型的性能。借鑒已有研究,本文在利用文獻(xiàn)調(diào)研和問卷調(diào)查構(gòu)建風(fēng)險(xiǎn)評(píng)估指標(biāo)體系的基礎(chǔ)上,首次提出采用ODR與BADASYN相結(jié)合的方法,對(duì)SVM模型進(jìn)行性能改進(jìn),并率先將該模型應(yīng)用于中小企業(yè)信用風(fēng)險(xiǎn)評(píng)估,為中小企業(yè)的貸款決策提供依據(jù)。

        三、模型設(shè)計(jì)

        (一)SVM模型

        SVM的本質(zhì)是一種算法,基本思路是求解最優(yōu)分類面,即在特定空間求解能夠?qū)颖緶?zhǔn)確分類,并使得不同樣本間的分類間隔最大的最優(yōu)分類面。具體來(lái)說(shuō),在樣本線性可分時(shí),SVM在樣本空間求解最優(yōu)分類面;在樣本線性不可分時(shí),SVM便通過(guò)內(nèi)積核函數(shù)對(duì)樣本進(jìn)行內(nèi)積運(yùn)算,將其投射到高維空間模擬線性可分的情形求解最優(yōu)分類面。距離最優(yōu)分類面最近的訓(xùn)練樣本被定義為支持向量,其他訓(xùn)練樣本對(duì)定義分類界面無(wú)關(guān)(Cristianini N.等,2000;Gunn S R,1998)。

        對(duì)于中小企業(yè)來(lái)說(shuō),信用狀況的評(píng)價(jià)可以分為正常企業(yè)和違約企業(yè)兩類。設(shè)yi∈{1,-1}為指標(biāo)變量,定義當(dāng)yi=1時(shí),第i個(gè)企業(yè)為正常企業(yè);當(dāng)yi=-1時(shí),第i個(gè)企業(yè)為違約企業(yè)。同時(shí)定義xi=(xi1,xi2,…,xin)為測(cè)度第i個(gè)企業(yè)違約與否的特征變量,最終得出由特征變量與指標(biāo)變量共同構(gòu)成的樣本點(diǎn)(xi,yi)0≤i≤N。在樣本點(diǎn)()xi,yi線性可分時(shí),樣本空間判別函數(shù)的一般形式為f(x)=w*x+b,可以得出相應(yīng)分類面方程w*x+b=0,其中w是可調(diào)權(quán)值向量即分類超平面的法向量,b為分類閾值。對(duì)f(x)進(jìn)行歸一化處理,使得對(duì)于任意xi都滿足||f(xi)≥1,求出兩類支持向量間的分類間隔為2/‖w‖。SVM求解最優(yōu)分類面以使‖w‖最小的問題就可以轉(zhuǎn)化為有約束條件的優(yōu)化問題:

        在樣本點(diǎn)線性不可分時(shí),SVM引入松弛變量ξi構(gòu)建軟間隔,允許誤判樣本的存在。同時(shí)引入懲罰因子C以使2/‖w‖盡可能大,盡可能小,進(jìn)而使分類盡可能準(zhǔn)確,這時(shí)有約束條件的優(yōu)化問題轉(zhuǎn)化為如下形式:

        同時(shí),當(dāng)樣本點(diǎn)線性不可分時(shí),可以通過(guò)運(yùn)用內(nèi)積函數(shù)將樣本空間投射到高維空間,在高維空間求解最優(yōu)分類面。利用拉格朗日乘子將上述求解最優(yōu)分類面的問題轉(zhuǎn)化為對(duì)偶問題

        這里α是拉格朗日乘子,K(xp,xp)是引入的內(nèi)積核函數(shù)。通過(guò)對(duì)此二次規(guī)劃問題求解,可以得出最優(yōu)分類函數(shù)為:

        (二)提升SVM性能的ODR-BADASYN方法

        本文引入ODR和BADASYN算法,通過(guò)對(duì)正常企業(yè)樣本逐級(jí)優(yōu)化欠采樣和違約企業(yè)邊界樣本過(guò)采樣,提升SVM在不平衡數(shù)據(jù)樣本的中小企業(yè)信用風(fēng)險(xiǎn)評(píng)估中的性能。

        定義訓(xùn)練樣本集為T,其中多數(shù)類正常企業(yè)樣本集為N,少數(shù)類違約企業(yè)樣本集為P,n表示正常企業(yè)樣本集N中的樣本,p為違約企業(yè)樣本集P中的樣本,并定義某一樣本關(guān)聯(lián)集為樣本集中該樣本的K個(gè)最鄰近樣本和該樣本本身組成的樣本集。流程中步驟1—6是ODR算法,重點(diǎn)在于刪除正常企業(yè)中的噪聲樣本;步驟7—12是BADASYN算法,重點(diǎn)在于合成違約企業(yè)邊界樣本。算法最終調(diào)整原非均衡數(shù)據(jù),為SVM提供平衡的訓(xùn)練樣本,提升模型的預(yù)測(cè)性能(見表1)。

        (三)模型評(píng)價(jià)指標(biāo)

        本文所討論的中小企業(yè)信用風(fēng)險(xiǎn)評(píng)估模型是建立在非均衡樣本基礎(chǔ)上的分類器,用以判斷平衡樣本分類結(jié)果的分類準(zhǔn)確率難以科學(xué)地評(píng)價(jià)模型預(yù)測(cè)能力,尤其是對(duì)違約企業(yè)樣本的預(yù)測(cè)性能(李揚(yáng)等,2016)。在實(shí)際工作中,違約企業(yè)被錯(cuò)分的代價(jià)往往大于正常企業(yè)被錯(cuò)分的代價(jià)。因此,本文采用評(píng)判模型對(duì)于非均衡樣本分類性能的指標(biāo),即幾何平均正確率Gmean(以下簡(jiǎn)寫為G)和少數(shù)類的Fmeasure(以下簡(jiǎn)寫為F)來(lái)評(píng)價(jià)模型的性能。指標(biāo)具體構(gòu)建過(guò)程如下:

        定義|TN|和|FN|分別為被正確劃分為正常企業(yè)和被錯(cuò)誤劃分為正常企業(yè)的樣本數(shù)量,|TP|和|FP|分別為被正確劃分為違約企業(yè)和被錯(cuò)誤劃分為違約企業(yè)的樣本數(shù)量。由此得出違約企業(yè)樣本正確率(靈敏度)SE、正常企業(yè)樣本正確率(特異度)SP、違約樣本企業(yè)查準(zhǔn)率P:

        表1:算法流程描述

        其中,G權(quán)衡了多數(shù)類正常企業(yè)樣本和少數(shù)類違約企業(yè)樣本對(duì)模型性能的影響,對(duì)于其中任何一類有所偏移的最優(yōu)分類面都會(huì)影響另一類樣本的分類結(jié)果及準(zhǔn)確率,使得G變小;相反,如果模型對(duì)于兩類樣本的預(yù)測(cè)精度高,則G會(huì)變大。少數(shù)類的F指標(biāo)則將少數(shù)類違約企業(yè)樣本靈敏度與查準(zhǔn)率相結(jié)合,衡量對(duì)違約企業(yè)的預(yù)測(cè)效果,F(xiàn)越大則預(yù)測(cè)效果越好,模型性能越優(yōu)。

        四、樣本選擇及指標(biāo)選取

        (一)樣本選擇

        本文參考梁琪(2014)的做法,以A股上市非金融公司中的中小企業(yè)數(shù)據(jù)作為研究樣本,中小企業(yè)劃分標(biāo)準(zhǔn)按照工業(yè)和信息化部等四部委《中小企業(yè)劃型標(biāo)準(zhǔn)規(guī)定》和國(guó)家統(tǒng)計(jì)局《統(tǒng)計(jì)上大中小微型企業(yè)劃分辦法》。將財(cái)務(wù)失敗與否作為評(píng)判企業(yè)是否存在信用風(fēng)險(xiǎn)的標(biāo)準(zhǔn),選取了2007—2015年首次被證監(jiān)會(huì)實(shí)施特殊處理(ST)的中小企業(yè)樣本,剔除數(shù)據(jù)缺失樣本后剩余113家。同時(shí)以年份、行業(yè)為基礎(chǔ),以從業(yè)人員、資產(chǎn)規(guī)模與營(yíng)業(yè)收入三個(gè)維度為標(biāo)準(zhǔn),選取配對(duì)非ST中小企業(yè)樣本共387家,樣本不平衡度為3.42:1。

        (二)指標(biāo)選取

        在信用風(fēng)險(xiǎn)評(píng)估中,對(duì)能夠甄別企業(yè)存在信用風(fēng)險(xiǎn)與否的指標(biāo)的確定起著重要作用?;诂F(xiàn)有研究,本文設(shè)計(jì)并向科研機(jī)構(gòu)、高校、金融機(jī)構(gòu)等發(fā)放問卷415份,回收有效問卷354份,以確定用于企業(yè)信用風(fēng)險(xiǎn)評(píng)估的財(cái)務(wù)業(yè)績(jī)與非財(cái)務(wù)業(yè)績(jī)兩大指標(biāo)體系(見表2)。

        1.財(cái)務(wù)業(yè)績(jī)指標(biāo)。本文選取了企業(yè)償債能力、營(yíng)運(yùn)能力、盈利能力、成長(zhǎng)性、資本結(jié)構(gòu)和財(cái)務(wù)杠桿、現(xiàn)金流狀況以及資本市場(chǎng)表現(xiàn)等7個(gè)方面的33個(gè)財(cái)務(wù)業(yè)績(jī)指標(biāo)。為保證財(cái)務(wù)業(yè)績(jī)指標(biāo)能夠較好地預(yù)測(cè)企業(yè)信用風(fēng)險(xiǎn),也為了區(qū)分兩類樣本(正常企業(yè)與違約企業(yè))的特征,對(duì)兩類樣本財(cái)務(wù)業(yè)績(jī)指標(biāo)做了獨(dú)立樣本T檢驗(yàn),得出兩類不同樣本指標(biāo)在5%水平上差異顯著的共21個(gè)。

        2.非財(cái)務(wù)業(yè)績(jī)指標(biāo)。本文基于國(guó)內(nèi)外學(xué)者關(guān)于企業(yè)信用風(fēng)險(xiǎn)與財(cái)務(wù)失敗等方面的文獻(xiàn)檢索,從多個(gè)角度分析了表征企業(yè)信用風(fēng)險(xiǎn)的要素,即通過(guò)實(shí)際控制人類型、董事會(huì)特征、股權(quán)結(jié)構(gòu)和市場(chǎng)指標(biāo)等4個(gè)方面的信息來(lái)衡量非財(cái)務(wù)業(yè)績(jī)的指標(biāo)對(duì)企業(yè)信用風(fēng)險(xiǎn)的影響。

        (1)實(shí)際控制人。Friedman等(2003)將企業(yè)的利益?zhèn)鬏敺譃橄蛏蟼鬏數(shù)乃淼佬?yīng)與向下傳輸?shù)闹С中?yīng),其中隧道效應(yīng)是指企業(yè)的最終控制人通過(guò)各種方式侵占企業(yè)利益的行為。梁琪等人(2009)研究了企業(yè)財(cái)務(wù)失敗預(yù)警中實(shí)際控制人的控制權(quán)與所有權(quán)因素的影響,認(rèn)為控制權(quán)與所有權(quán)水平高的控制人會(huì)通過(guò)影響公司治理或者財(cái)務(wù)業(yè)績(jī)進(jìn)而對(duì)企業(yè)財(cái)務(wù)預(yù)警結(jié)果造成影響。本文選取所有權(quán)性質(zhì)指標(biāo)描述實(shí)際控制人類型。

        (2)董事會(huì)特征。Chen等(2006)認(rèn)為董事會(huì)規(guī)模與企業(yè)財(cái)務(wù)業(yè)績(jī)存在正相關(guān)的關(guān)系。于東智等(2004)也同樣認(rèn)為董事會(huì)規(guī)模影響公司業(yè)績(jī)。胡奕明等(2008)、韓立巖等(2009)和江向才等(2006)指出獨(dú)立董事比例、董事長(zhǎng)和總經(jīng)理是否合一對(duì)上市企業(yè)公司治理與財(cái)務(wù)業(yè)績(jī)有顯著影響。本文選擇代表企業(yè)董事會(huì)特征的指標(biāo)變量包括:董事會(huì)規(guī)模、獨(dú)立董事比例、監(jiān)事會(huì)規(guī)模、CEO兩職狀態(tài)等。

        (3)股權(quán)結(jié)構(gòu)。Shleifer等(1986)在早期的研究中發(fā)現(xiàn),股權(quán)集中度越高的企業(yè),股東通過(guò)公司治理機(jī)制影響經(jīng)理層經(jīng)營(yíng)的能力越強(qiáng),能有效減少經(jīng)理人員的機(jī)會(huì)主義傾向。徐莉萍等(2006)的研究表明股權(quán)集中度越高企業(yè)業(yè)績(jī)?cè)胶?,但劉銀國(guó)(2010)認(rèn)為股權(quán)集中度與企業(yè)業(yè)績(jī)存在反向變動(dòng)的關(guān)系。

        (4)市場(chǎng)指標(biāo)。市場(chǎng)指標(biāo)反映企業(yè)的流動(dòng)性。錢蘋等(2015)研究發(fā)現(xiàn),股票換手率這一指標(biāo)能夠反映企業(yè)正常經(jīng)營(yíng)與否,并指出非正常企業(yè)的股票交易不如正常企業(yè)活躍。Wang等(2013)也指出,相對(duì)于其他反映企業(yè)經(jīng)營(yíng)情況的市場(chǎng)指標(biāo),股票換手率對(duì)企業(yè)業(yè)績(jī)的反映更為靈敏。因此,在使用一般市場(chǎng)指標(biāo)的前提下,本文加入股票換手率這一指標(biāo)作為衡量企業(yè)信用風(fēng)險(xiǎn)的市場(chǎng)指標(biāo),具體指標(biāo)見表3。

        表2:財(cái)務(wù)業(yè)績(jī)指標(biāo)

        為了選擇最能夠體現(xiàn)評(píng)估企業(yè)信用風(fēng)險(xiǎn)的指標(biāo),同時(shí)考慮到已列指標(biāo)之間存在的多重共線性,本文選擇逐步回歸法篩選特征變量,設(shè)置進(jìn)入模型以及被刪除的概率分別為5%和10%,選出對(duì)企業(yè)信用風(fēng)險(xiǎn)影響顯著的指標(biāo),構(gòu)建評(píng)價(jià)中小企業(yè)信用風(fēng)險(xiǎn)狀況的指標(biāo)體系,結(jié)果見表4。

        五、模型構(gòu)建與檢驗(yàn)

        設(shè)置RBF為SVM的核函數(shù),反復(fù)試驗(yàn)選擇懲罰參數(shù)C為0.5,核函數(shù)中的g為5,KNN算法中K值為5。研究通過(guò)十折交叉驗(yàn)證選擇使得模型性能最優(yōu)的ODR參數(shù)β。本文編程部分通過(guò)matlab2012a實(shí)現(xiàn),統(tǒng)計(jì)分析部分通過(guò)SPSS22.0實(shí)現(xiàn)。

        (一)最優(yōu)ODR-BADASYN-SVM模型的構(gòu)建

        在不平衡樣本的分類中,對(duì)ODR中參數(shù)β的選擇直接影響著模型的性能。我們采用十折交叉驗(yàn)證法描述參數(shù)β在區(qū)間[0,1]上的不同取值對(duì)于模型分類性能的影響(見圖1)。

        從圖1中能夠看出,在β=0處,模型中ODR未參與抽樣,未刪除正常企業(yè)樣本,模型性能低。當(dāng)β=0.1時(shí),ODR算法對(duì)正常企業(yè)樣本進(jìn)行了欠采樣,刪除了正常企業(yè)中一定比例的噪聲樣本,再通過(guò)BADASYN算法對(duì)少數(shù)類樣本進(jìn)行合成,整個(gè)模型的性能較第一階段有了較大提高。在此后的過(guò)程中,隨著β數(shù)值的不斷增大,ODR算法對(duì)多數(shù)類樣本的刪除比例也逐漸增加,模型G性能與F性能都比較平穩(wěn)。當(dāng)β=0.8時(shí),模型G性能達(dá)到峰值,且F性能也處在較高水平。當(dāng)β臨近1時(shí),模型的G性能較之前有所降低,F(xiàn)性能降低幅度明顯。原因是ODR算法過(guò)多地刪除了多數(shù)類樣本,損失了部分有效信息,模型性能尤其是對(duì)少數(shù)類樣本的分類性能降低。

        表3:非財(cái)務(wù)業(yè)績(jī)指標(biāo)

        圖1:不同β值對(duì)模型分類性能的影響

        綜合以上分析,本文認(rèn)為當(dāng)β=0.8時(shí),ODR-BADASYN-SVM模型能夠較為均衡地處理多數(shù)類噪聲樣本與邊界少數(shù)類樣本,模型性能達(dá)到最優(yōu)。

        (二)最優(yōu)ODR-BADASYN-SVM模型與其他SVM模型的性能比對(duì)

        在以上分析中,我們得出了能使ODR-BADASYNSVM模型性能最優(yōu)的β系數(shù)。但該模型是否能夠有效提升SVM模型,需進(jìn)一步驗(yàn)證。為此,本文對(duì)最優(yōu)ODR-BADASYN-SVM模型與SVM、ODR-SVM和BADASYN-SVM模型分類性能的差異進(jìn)行了研究。

        為比較不同模型性能,設(shè)置使ODR-BADASYNSVM模型性能最優(yōu)的參數(shù)β值為0.8,ODR模型中的參數(shù)β值為1。其余模型參數(shù)與之前分析保持一致,同樣采用十折交叉驗(yàn)證法,得出不同模型性能,結(jié)果見表5。

        從表5可以看出,樣本不平衡時(shí)SVM模型的分類性能最差,G性能和F性能均處在最低的水平,在運(yùn)行過(guò)程中SVM模型將少數(shù)類違約企業(yè)樣本錯(cuò)分為正常企業(yè)樣本數(shù)量較多。由此,本文認(rèn)為未做改進(jìn)的SVM模型在不平衡樣本數(shù)量下無(wú)法有效預(yù)測(cè)中小企業(yè)的信用風(fēng)險(xiǎn)。從表中還可以看出,最優(yōu)ODR-BADASYN-SVM模型的G性能和F性能均高于ODRSVM和BADASYN-SVM模型,說(shuō)明最優(yōu)ODR-BADASYN-SVM在預(yù)測(cè)精準(zhǔn)度上高于ODR-SVM和BADASYN-SVM模型。

        為了使實(shí)證結(jié)果更具客觀性,同時(shí)更為科學(xué)地說(shuō)明以上四種模型對(duì)不平衡樣本數(shù)量下對(duì)企業(yè)信用風(fēng)險(xiǎn)預(yù)測(cè)性能的差異,本文對(duì)各個(gè)模型預(yù)測(cè)結(jié)果進(jìn)行了配對(duì)樣本T檢驗(yàn),結(jié)果如表6。

        表4:指標(biāo)回歸結(jié)果

        表5:模型性能對(duì)比

        從表6可以看出,不做任何改進(jìn)的SVM模型G性能和F性能與其他三個(gè)模型都是在1%的水平上存在顯著性差異,能夠看出在對(duì)不平衡數(shù)據(jù)的信用風(fēng)險(xiǎn)評(píng)價(jià)中,SVM模型的預(yù)測(cè)性能顯著低于ODR-SVM、BADASYN-SVM和ODR-BADASYN-SVM模型,也由此肯定了與SVM相結(jié)合的ODR、BADASYN和ODR-BADASYN對(duì)SVM模型在不平衡數(shù)據(jù)分類中的改進(jìn)作用。

        從表6也可以看出,BADASYN-SVM模型性能與ODR-BADASYN-SVM模型的性能各在1%的水平上存在顯著差異。在運(yùn)算過(guò)程中,BADASYN算法重點(diǎn)在對(duì)于違約企業(yè)邊界樣本的合成,沒有關(guān)注正常企業(yè)樣本中信息含量少的噪聲樣本,模型在分類過(guò)程中對(duì)于兩類企業(yè)的錯(cuò)分均比較多,致使BADASYN-SVM模型的G性能和F性能較低。這表明,在3.42:1的樣本不均衡程度下僅將BADASYN與SVM模型相結(jié)合只對(duì)違約企業(yè)邊界樣本進(jìn)行合成而不處理正常企業(yè)噪聲樣本的方法相對(duì)于其他兩類方法對(duì)SVM模型性能的提升貢獻(xiàn)能力有限。

        表6:模型性能差異對(duì)比

        對(duì)比ODR-SVM和ODR-BADASYN-SVM模型性能的差異程度,兩者F值在10%的水平上拒絕0假設(shè),結(jié)合模型預(yù)測(cè)性能精度表可以看出,ODR-BADASYN-SVM模型的F性能顯著優(yōu)于ODR-SVM模型的F性能。原因是在分類過(guò)程中,相對(duì)于ODR算法關(guān)注點(diǎn)在對(duì)正常企業(yè)樣本的刪除上,ODR與BADASYN相結(jié)合的算法能夠兼顧對(duì)正常企業(yè)樣本中的噪聲樣本的刪除以及少數(shù)類違約企業(yè)邊界樣本的合成。而且通過(guò)觀察兩個(gè)模型G性能的均值和標(biāo)準(zhǔn)差大小,能夠看出ODR-BADASYN-SVM模型的G性能均值大于ODR-SVM的G性能,而且前者的標(biāo)準(zhǔn)差小于后者,說(shuō)明前者的G性能較后者穩(wěn)定。再結(jié)合ODR-BADASYN-SVM模型判斷少數(shù)類違約企業(yè)的F性能顯著優(yōu)于ODR-SVM模型,本文認(rèn)為ODR-BADASYNSVM模型在判斷不平衡樣本時(shí)對(duì)SVM模型的提升能力高于ODR-SVM模型。

        由此能夠看出,將ODR和BADASYN算法相結(jié)合的SVM模型,既能通過(guò)逐級(jí)優(yōu)化遞減的方法對(duì)多數(shù)類正常企業(yè)樣本進(jìn)行欠采樣,又能對(duì)少數(shù)類違約企業(yè)的邊界樣本進(jìn)行合成,能夠克服SVM模型不適用與不平衡數(shù)據(jù)分類的問題,有效提升SVM模型的分類性能。

        綜合以上分析,在將ODR與BADASYN算法相結(jié)合的SVM模型中,對(duì)于ODR算法中參數(shù)β的選擇對(duì)于模型性能影響較大。β=0.8時(shí),ODR-BADASYN-SVM性能達(dá)到最優(yōu),該最優(yōu)ODR-BADASYN-SVM信用風(fēng)險(xiǎn)評(píng)估模型在G性能與F性能上均顯著優(yōu)于不做任何改進(jìn)的SVM模型和只處理違約企業(yè)樣本的BADASYN-SVM模型。同時(shí)最優(yōu)ODRBADASYN-SVM模型F性能顯著高于ODR-SVM的F性能,G性能相對(duì)較高且分類性能穩(wěn)定??梢钥闯觯琌DR與BADASYN算法相結(jié)合的SVM模型性能高于單獨(dú)使用ODR或者BADASYN算法的性能,并且能夠顯著提高SVM模型在不平衡數(shù)據(jù)分類中的性能。因此,結(jié)合了ODR與BADASYN算法的SVM模型能夠較為科學(xué)地預(yù)測(cè)中小企業(yè)信用風(fēng)險(xiǎn)存在與否,能夠使外部投資者更好地了解中小企業(yè)信用狀況,為更好開展中小企業(yè)質(zhì)押融資提供依據(jù)。

        六、結(jié)論與不足

        本文選取2007—2015年我國(guó)A股非金融上市公司中的中小企業(yè)為研究對(duì)象,將財(cái)務(wù)失敗與否作為判斷企業(yè)存在信用風(fēng)險(xiǎn)與否的標(biāo)準(zhǔn),構(gòu)建了3.42:1的正常企業(yè)與違約企業(yè)的樣本集。在文獻(xiàn)法、調(diào)研法的基礎(chǔ)上,通過(guò)統(tǒng)計(jì)檢驗(yàn)和逐步回歸法確定了評(píng)價(jià)企業(yè)信用風(fēng)險(xiǎn)的指標(biāo)體系。在SVM中,引入ODR算法對(duì)正常企業(yè)樣本中噪聲樣本進(jìn)行刪除,引入BADASYN算法合成違約企業(yè)邊界樣本,通過(guò)參數(shù)β的選擇構(gòu)建了最優(yōu)ODR-BADASYN-SVM模型用以評(píng)價(jià)中小企業(yè)信用風(fēng)險(xiǎn)。研究結(jié)果表明,最優(yōu)ODR-BADASYN-SVM模型的預(yù)測(cè)性能顯著優(yōu)于SVM和BADASYN-SVM模型,并且較ODR-SVM模型具有較高的F性能以及更為穩(wěn)定的G性能,說(shuō)明ODR-BADASYN結(jié)合的方法有效提高了SVM在不平衡數(shù)據(jù)中的分類性能,能夠在中小企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)過(guò)程中發(fā)揮作用。

        本文通過(guò)構(gòu)建ODR-BADASYN-SVM模型對(duì)中小企業(yè)信用風(fēng)險(xiǎn)進(jìn)行評(píng)估,能夠幫助銀行等外部投資者了解企業(yè)實(shí)際信用狀況,降低信息不對(duì)稱性以及由此造成的損失,從而為更好開展對(duì)于中小企業(yè)的貸款業(yè)務(wù)提供數(shù)據(jù)支撐。然而,本文所構(gòu)建的信用風(fēng)險(xiǎn)評(píng)估結(jié)果僅能呈現(xiàn)一種二分的預(yù)測(cè),即只能判斷出企業(yè)是正常企業(yè)或者違約企業(yè),卻不能對(duì)于企業(yè)存在的信用風(fēng)險(xiǎn)的大小程度給出度量。因此,如何改進(jìn)所構(gòu)建的不平衡樣本分類算法,以獲得中小企業(yè)信用風(fēng)險(xiǎn)程度的測(cè)量,還有待于進(jìn)一步研究。

        [1]Stiglitz J E,Weiss A.1981.Credit Rationing in Markets with Imperfect Information[J].The American Economic Review,71(3).

        [2]Beaver W H.1966.Financial ratios as predictors of failure[J].Journal of Accounting Research,4(1).

        [3]Altman E I.Financial Rations,F(xiàn)inancial Ratios,Discriminant Analysis and the Prediction of Corporate Bankruptcy.The Journal of Finance,23(4).

        [4]Ohlson J A.1981.Financial Ratios and the Probabi-listic Prediction of Bankruptcy[J].Journal of Accounting Research,18(1).

        [5]Aguilera A M,Escabias M,Valderrama M J.2006.Using principal components for estimating logistic regression with high-dimensional multicollinear data[J].Computational Statistics&Data Analysis,50(8).

        [6]Dong G,Lai K K,Yen J.2010.Credit scorecard based on logistic regression with random coefficients[J].Procedia Computer Science,1(1).

        [7]Cortes C,Vapnik V.1995.Support-vector networks[J].Machine Learning,20(3).

        [8]Vapnik V N.1995.The nature of statistical learning theory[M].NewYork:Springer.

        [9]Gong M G,Du H F,Jiao L C.2006.Optimal approximation of linear systems by artificial immune response[J].Science in China,49(1).

        [10]Chawla N V,Bowyer K W,Hall L O,et al.2002.SMOTE:synthetic minority over-sampling technique[J].Journal of Artificial Intelligence Research,16(1).

        [11]Gunn S R.1998.Support vector machines for classification and regression[J].ISIS technical report,14.

        [12]Friedman E,Johnson S,Mitton T.2003.Propping and tunneling[J].Nber Working Papers,31(4).

        [13]中國(guó)的選擇:抓住5萬(wàn)億美元的生產(chǎn)力機(jī)遇[R].麥肯錫全球研究院,2016,6.

        [14]趙岳,譚之博.電子商務(wù)、銀行信貸與中小企業(yè)融資——一個(gè)基于信息經(jīng)濟(jì)學(xué)的理論模型[J].經(jīng)濟(jì)研究,2012,(7).

        [15]郭娜.政府?市場(chǎng)?誰(shuí)更有效——中小企業(yè)融資難解決機(jī)制有效性研究[J].金融研究,2013,(3).

        [16]張目,周宗放.基于多目標(biāo)規(guī)劃和支持向量機(jī)的企業(yè)信用評(píng)估模型[J].中國(guó)軟科學(xué),2009,(4).

        [17]丁欣.國(guó)外信用風(fēng)險(xiǎn)評(píng)估方法的發(fā)展現(xiàn)狀[J].湖南大學(xué)學(xué)報(bào)社會(huì)科學(xué)版,2002,(s1).

        [18]方匡南,范新妍,馬雙鴿.基于網(wǎng)絡(luò)結(jié)構(gòu)Logistic模型的企業(yè)信用風(fēng)險(xiǎn)預(yù)警[J].統(tǒng)計(jì)研究,2016,33(4).

        [19]蔣彧,高瑜.基于KMV模型的中國(guó)上市公司信用風(fēng)險(xiǎn)評(píng)估研究[J].中央財(cái)經(jīng)大學(xué)學(xué)報(bào),2015,(9).

        [20]牛曉健,郭東博,裘翔,等.供應(yīng)鏈融資的風(fēng)險(xiǎn)測(cè)度與管理——基于中國(guó)銀行交易數(shù)據(jù)的實(shí)證研究[J].金融研究,2012,(11).

        [21]吳德勝,梁樑.遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)及信用評(píng)價(jià)研究[J].中國(guó)管理科學(xué),2004,12(1).

        [22]唐建榮,譚春暉.基于支持向量機(jī)的上市公司信用風(fēng)險(xiǎn)評(píng)估研究[J].統(tǒng)計(jì)與決策,2010,(10).

        [23]楊毓,蒙肖蓮.用支持向量機(jī)(SVM)構(gòu)建企業(yè)破產(chǎn)預(yù)測(cè)模型[J].金融研究,2006,(10).

        [24]李云飛,惠曉峰.基于支持向量機(jī)的股票投資價(jià)值分類模型研究[J].中國(guó)軟科學(xué),2008,(1).

        [25]李揚(yáng),李竟翔,馬雙鴿.不平衡數(shù)據(jù)的企業(yè)財(cái)務(wù)預(yù)警模型研究[J].數(shù)理統(tǒng)計(jì)與管理,2016,35(5).

        [26]王超學(xué),張濤,馬春森.面向不平衡數(shù)據(jù)集的改進(jìn)型SMOTE算法[J].計(jì)算機(jī)科學(xué)與探索,2014,8(6).

        [27]林宇,黃迅,淳偉德,黃登仕.基于ODRADASYN-SVM的極端金融風(fēng)險(xiǎn)預(yù)警研究[J].管理科學(xué)學(xué)報(bào),2016,19(5).

        [28]洪銘,柳培忠,黃德天,等.基于改進(jìn)ADASYN的不平衡分類算法[J].計(jì)算機(jī)應(yīng)用研究,2017,(4).

        [29]梁琪,郝項(xiàng)超.最終控制人所有權(quán)和控制權(quán)對(duì)企業(yè)財(cái)務(wù)失敗預(yù)警的影響——配對(duì)方法與嵌套模型的應(yīng)用[J].金融研究,2009,(1).

        [30]于東智,池國(guó)華.董事會(huì)規(guī)模、穩(wěn)定性與公司績(jī)效:理論與經(jīng)驗(yàn)分析[J].經(jīng)濟(jì)研究,2004,(4).

        [31]胡奕明,唐松蓮.獨(dú)立董事與上市公司盈余信息質(zhì)量[J].管理世界,2008,(9).

        猜你喜歡
        分類模型企業(yè)
        一半模型
        企業(yè)
        企業(yè)
        企業(yè)
        分類算一算
        重要模型『一線三等角』
        敢為人先的企業(yè)——超惠投不動(dòng)產(chǎn)
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        无码三级在线看中文字幕完整版| 国产在线精品一区在线观看 | 我爱我色成人网| 俄罗斯老熟妇色xxxx| 日本一区午夜艳熟免费| 色欲av一区二区久久精品| 无码人妻少妇色欲av一区二区| 久久香蕉免费国产天天看| 亚洲日韩AV秘 无码一区二区| 国产在线拍偷自拍偷精品| 免费国人成人自拍视频| 在线久草视频免费播放| 人妻少妇精品视频一区二区三区l| 国产av无码专区亚洲精品| 偷偷色噜狠狠狠狠的777米奇| 国产又色又爽无遮挡免费| 日韩最新在线不卡av| 午夜视频一区二区在线观看| 久久久精品国产性黑人| 人人人妻人人澡人人爽欧美一区| 国产国拍精品av在线观看按摩| 日韩精品无码区免费专区| 精品国产一区二区三区香蕉| 国产中文字幕亚洲综合| av影片手机在线观看免费网址| 国产成人精品免费视频大全软件| 亚洲国产精品ⅴa在线观看| 人妻aⅴ无码一区二区三区| 亚洲乱码一区AV春药高潮| 日本少妇又色又紧又爽又刺激| 国产亚洲精品久久久久久国模美| 亚洲色欲色欲www| 亚洲欧美精品91| 中文字幕人妻丝袜成熟乱| 麻豆精品一区二区三区| 国产无遮挡又黄又爽高潮| 国产97色在线 | 亚洲| 国产小视频网址| 福利一区二区三区视频在线| 亚洲捆绑女优一区二区三区| 国产精品国产亚洲精品看不卡|