亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于流形學(xué)習(xí)的企業(yè)信用風(fēng)險(xiǎn)組合評(píng)價(jià)模型

        2022-11-28 11:27:00周禮剛劉欣悅朱家明陳華友
        關(guān)鍵詞:降維信用風(fēng)險(xiǎn)決策樹(shù)

        羅 敏,周禮剛,劉欣悅,朱家明,陳華友

        (1.安徽大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,安徽 合肥 230601;2.安徽大學(xué) 應(yīng)用數(shù)學(xué)中心,安徽 合肥 230601;3.安徽大學(xué) 互聯(lián)網(wǎng)學(xué)院,安徽 合肥 230601)

        2009年10月,中國(guó)創(chuàng)業(yè)板正式上市,首批28家企業(yè)開(kāi)市交易,作為主板市場(chǎng)的重要補(bǔ)充,有效緩解了暫時(shí)無(wú)法在主板市場(chǎng)上市的中小企業(yè)、創(chuàng)業(yè)型企業(yè)的融資難題,市場(chǎng)規(guī)模迅速發(fā)展壯大。截至2021年8月4日,創(chuàng)業(yè)板總市值達(dá)135 510.81億元,累計(jì)融資10 003.63億元,上市公司數(shù)量突破1 000家。但企業(yè)大多處于創(chuàng)業(yè)成長(zhǎng)期,成立時(shí)間較短,資本規(guī)模較小,業(yè)績(jī)較不穩(wěn)定,相較于大型成熟企業(yè),抗風(fēng)險(xiǎn)能力較弱,易受政策調(diào)整、經(jīng)營(yíng)不善、經(jīng)濟(jì)下行等因素的沖擊,導(dǎo)致資金運(yùn)轉(zhuǎn)失靈,進(jìn)而產(chǎn)生信用風(fēng)險(xiǎn)。對(duì)此,金融監(jiān)管部門(mén)先后推行了創(chuàng)業(yè)板企業(yè)退市制度、創(chuàng)業(yè)板注冊(cè)制等改革,并不斷完善相關(guān)法律法規(guī),從政策層面上降低企業(yè)發(fā)生違約的概率??紤]到企業(yè)的財(cái)務(wù)指標(biāo)等信息能夠從數(shù)據(jù)層面上揭示企業(yè)的違約風(fēng)險(xiǎn),有必要分析影響企業(yè)信用風(fēng)險(xiǎn)的諸多因素,構(gòu)建科學(xué)合理的信用風(fēng)險(xiǎn)評(píng)價(jià)模型,預(yù)測(cè)企業(yè)潛在的信用風(fēng)險(xiǎn),完善風(fēng)險(xiǎn)預(yù)警機(jī)制,為創(chuàng)業(yè)板企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)提供豐富的理論依據(jù)和技術(shù)支持。

        企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)一直是國(guó)內(nèi)外學(xué)者廣泛關(guān)注和研究的課題[1-3],研究者通常將信用風(fēng)險(xiǎn)評(píng)價(jià)視為模式識(shí)別的分類(lèi)問(wèn)題,即判斷企業(yè)信用風(fēng)險(xiǎn)水平屬于正?;虍惓V?。運(yùn)用一定方法從企業(yè)歷史數(shù)據(jù)樣本中探究分類(lèi)規(guī)則,并建立評(píng)價(jià)模型判別新樣本。根據(jù)方法的不同,可分為單變量判別分析、多變量判別分析、機(jī)器學(xué)習(xí)等。BEAVER[4]最早使用單個(gè)財(cái)務(wù)指標(biāo)分析企業(yè)信用風(fēng)險(xiǎn)水平。該方法簡(jiǎn)單易理解,但單一的財(cái)務(wù)指標(biāo)不能反映企業(yè)整體的信用風(fēng)險(xiǎn)水平,利用不同指標(biāo)信息得出的評(píng)價(jià)結(jié)果也可能相互矛盾。因此,在單變量判別分析的基礎(chǔ)上擴(kuò)展出了企業(yè)信用風(fēng)險(xiǎn)多變量評(píng)價(jià)模型。典型的多變量模型包括多元判別模型[5]和多元回歸模型[6]。

        隨著現(xiàn)代信息技術(shù)的進(jìn)步,貝葉斯分類(lèi)[7]、決策樹(shù)(decision tree, DT)分類(lèi)[8]、支持向量機(jī)(support vector machine, SVM)分類(lèi)[9]、神經(jīng)網(wǎng)絡(luò)(neural networks, NNs)[10]等非線性分類(lèi)方法迅猛發(fā)展。文獻(xiàn)[7]構(gòu)建了離散型貝葉斯網(wǎng)絡(luò)模擬貸款用戶(hù)的違約概率,結(jié)果顯示貝葉斯網(wǎng)絡(luò)能夠突破傳統(tǒng)統(tǒng)計(jì)方法的諸多限制,分類(lèi)準(zhǔn)確率較高。TIAN等[11]采用梯形提升決策樹(shù)算法,預(yù)測(cè)精度達(dá)92.19%。文獻(xiàn)[9]在對(duì)德國(guó)公司違約概率的預(yù)測(cè)中,發(fā)現(xiàn)SVM分類(lèi)器的預(yù)測(cè)精度顯著高于Logistic模型,其增幅約為25%。涂艷等[12]基于“拍拍貸”平臺(tái)的真實(shí)交易數(shù)據(jù),構(gòu)建了支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)等機(jī)器學(xué)習(xí)模型,預(yù)測(cè)借款者發(fā)生違約行為的概率,結(jié)果表明,機(jī)器學(xué)習(xí)方法能有效提升預(yù)測(cè)的準(zhǔn)確率,其中神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、隨機(jī)森林算法的分類(lèi)效果更佳。

        上述方法有著各自的適用情形和限定條件,為綜合不同方法的優(yōu)點(diǎn),分散單一模型分類(lèi)錯(cuò)誤所產(chǎn)生的風(fēng)險(xiǎn),張新紅等[13]將Logistic模型和RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行組合,分析我國(guó)上市公司的信用風(fēng)險(xiǎn)情況,結(jié)果表明組合評(píng)價(jià)模型優(yōu)于單一模型。彭偉[14]將最優(yōu)組合的思想應(yīng)用到信用風(fēng)險(xiǎn)評(píng)價(jià)中,提出了基于隨機(jī)森林和Logistic回歸的組合評(píng)價(jià)模型,結(jié)果與文獻(xiàn)[13]研究成果一致,組合評(píng)價(jià)模型不僅能夠綜合各單項(xiàng)模型的優(yōu)勢(shì),提高評(píng)價(jià)的精度,還能降低單一模型評(píng)價(jià)錯(cuò)誤所帶來(lái)的風(fēng)險(xiǎn)。但是,已有的組合評(píng)價(jià)模型一方面是對(duì)方法進(jìn)行組合,另一方面是對(duì)不同單項(xiàng)評(píng)價(jià)模型的結(jié)果賦予一定的權(quán)重進(jìn)行最優(yōu)組合。事實(shí)上,不同單項(xiàng)評(píng)價(jià)模型對(duì)不同企業(yè)的評(píng)價(jià)性能是“時(shí)好時(shí)壞”的,比如說(shuō),數(shù)據(jù)差異較小時(shí)貝葉斯分類(lèi)效果更好,數(shù)據(jù)差異較大時(shí)BP神經(jīng)網(wǎng)絡(luò)分類(lèi)效果更好,組合權(quán)重體現(xiàn)了該種單項(xiàng)評(píng)價(jià)方法的重要性程度,同時(shí),單項(xiàng)評(píng)價(jià)方法在組合評(píng)價(jià)中的權(quán)系數(shù)用變權(quán)會(huì)更貼切一些,即根據(jù)單項(xiàng)評(píng)價(jià)方法的評(píng)價(jià)結(jié)果,對(duì)評(píng)價(jià)高的時(shí)刻賦予較大的權(quán)重。

        然而,在實(shí)際企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)問(wèn)題中,影響企業(yè)信用風(fēng)險(xiǎn)的指標(biāo)眾多,如果不能合理選取變量,將會(huì)產(chǎn)生嚴(yán)重的多重共線性問(wèn)題,從而降低分類(lèi)的準(zhǔn)確度和模型的解釋性。常用的數(shù)據(jù)降維方法有主成分分析和Lasso回歸方法等,但這些降維方法或丟失部分原始數(shù)據(jù)信息,或提高了數(shù)據(jù)的稀疏性,從而導(dǎo)致評(píng)價(jià)誤差的增大,因此,筆者基于流形學(xué)習(xí)的局部線性嵌入(locally linear embedding, LLE)方法對(duì)企業(yè)財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行降維。與傳統(tǒng)降維方法相比,流形學(xué)習(xí)是局部線性的,利用線性重構(gòu)的局部對(duì)稱(chēng)性質(zhì),學(xué)習(xí)非線性流形的全局結(jié)構(gòu),進(jìn)而將高維數(shù)據(jù)映射到低維空間,保持?jǐn)?shù)據(jù)在高維空間的幾何拓?fù)浣Y(jié)構(gòu)。姚明海等[15]利用LLE方法對(duì)瓷片表面樣本數(shù)據(jù)進(jìn)行降維處理,繼而利用SVM方法進(jìn)行分類(lèi)學(xué)習(xí),提出一種基于局部線性嵌入的SVM增量學(xué)習(xí)方法,結(jié)果表明,該算法提高了對(duì)高維數(shù)據(jù)的運(yùn)算速度以及分類(lèi)的精度。王波等[16]利用局部線性嵌入算法對(duì)人臉數(shù)據(jù)的特征進(jìn)行特征,并利用極限學(xué)習(xí)機(jī)算法對(duì)降維后的數(shù)據(jù)進(jìn)行分類(lèi),數(shù)據(jù)表明,與利用主成分分析算法相比,LLE算法具有更高的識(shí)別速度和識(shí)別精度。

        綜上所述,筆者對(duì)財(cái)務(wù)指標(biāo)與企業(yè)違約狀況進(jìn)行相關(guān)性分析,剔除不相關(guān)指標(biāo),為解決指標(biāo)之間的多重共線性問(wèn)題,降低冗余信息對(duì)評(píng)價(jià)結(jié)果的影響,引入局部線性嵌入的流形學(xué)習(xí)方法對(duì)財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行降維處理,考慮到已有的企業(yè)信用風(fēng)險(xiǎn)組合評(píng)價(jià)模型在組合的過(guò)程中僅使用固定權(quán)重對(duì)單項(xiàng)方法進(jìn)行賦權(quán),提出一種變權(quán)組合評(píng)價(jià)模型并隨機(jī)選取樣本進(jìn)行實(shí)驗(yàn),驗(yàn)證模型的有效性。

        1 基于流形學(xué)習(xí)與誘導(dǎo)有序集成的企業(yè)信用風(fēng)險(xiǎn)變權(quán)組合評(píng)價(jià)模型

        首先介紹基于流形學(xué)習(xí)的局部線性嵌入(LLE)方法對(duì)財(cái)務(wù)指標(biāo)數(shù)據(jù)的處理過(guò)程,分別利用貝葉斯分類(lèi)、決策樹(shù)分類(lèi)和BP神經(jīng)網(wǎng)絡(luò)3種方法對(duì)LLE處理后的數(shù)據(jù)進(jìn)行分類(lèi)學(xué)習(xí),最后,基于3種單項(xiàng)分類(lèi)模型的結(jié)果,構(gòu)建基于流形學(xué)習(xí)與誘導(dǎo)有序集成的企業(yè)信用風(fēng)險(xiǎn)變權(quán)組合評(píng)價(jià)模型。

        1.1 基于流形學(xué)習(xí)的財(cái)務(wù)指標(biāo)數(shù)據(jù)降維方法

        企業(yè)財(cái)務(wù)評(píng)價(jià)指標(biāo)種類(lèi)繁多,這將導(dǎo)致收集到的數(shù)據(jù)存在一定的冗余信息,為了降低冗余信息對(duì)評(píng)價(jià)結(jié)果的影響,基于流形學(xué)習(xí)的局部線性嵌入(LLE)法[17]對(duì)財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行降維。與傳統(tǒng)的降維方法相比,LLE方法是局部線性的,利用線性重構(gòu)的局部對(duì)稱(chēng)性質(zhì),學(xué)習(xí)非線性流形的全局結(jié)構(gòu),該方法能夠保持樣本數(shù)據(jù)的局部拓?fù)浣Y(jié)構(gòu)。假設(shè)有n個(gè)企業(yè),違約情況序列記為Yi,i=1,2,…,n,其中Yi=1表示第i個(gè)企業(yè)未違約,Yi=0表示第i個(gè)企業(yè)違約,若第i個(gè)企業(yè)的財(cái)務(wù)指標(biāo)數(shù)據(jù)為Xij=(Xi1,Xi2,…,Xim),則用矩陣表示為X=(xij)n×m。為將矩陣X降成d維矩陣Z=(zij)n×d,基于LLE方法的降維步驟如下:

        (1)尋找各樣本點(diǎn)的近鄰點(diǎn),構(gòu)建鄰域圖。對(duì)于任意樣本點(diǎn)Xij,計(jì)算與相鄰樣本點(diǎn)的歐式距離,確定其ε-鄰域內(nèi)的近鄰點(diǎn)所構(gòu)成的集合,記為Qi,將每個(gè)點(diǎn)與其近鄰點(diǎn)建立加權(quán)鄰域圖。

        (2)采用如下模型計(jì)算集合Qi中的近鄰樣本點(diǎn)對(duì)Xij進(jìn)行局部線性重構(gòu)的權(quán)重系數(shù)ωik:

        (1)

        若k?Qi,則ωik=0。

        (3)令(W)ik=ωik,由式(2)可得降維后的低維矩陣M:

        M=(I-W)T(I-W)

        (2)

        (4)對(duì)低維矩陣M進(jìn)行特征分解,即M=PΛPT,其中P為特征值所對(duì)應(yīng)的特征向量,Λ為對(duì)角線元素為特征值的對(duì)角矩陣,取Λ的最小的d個(gè)特征值所對(duì)應(yīng)的特征向量,令Λ*=diag(λ1,λ2,…,λd),則P*為d個(gè)最下特征值對(duì)應(yīng)的特征向量矩陣。

        (5)通過(guò)計(jì)算Z=P*Λ*1/2∈Rm×d,得到降維后的矩陣Z,其中,每一行代表一個(gè)樣本數(shù)據(jù)的低維坐標(biāo)。

        根據(jù)上述步驟即可得到基于流形學(xué)習(xí)的局部線性嵌入法降維后的財(cái)務(wù)指標(biāo)數(shù)據(jù)。為得到變權(quán)組合評(píng)價(jià)值,利用貝葉斯分類(lèi)、決策樹(shù)分類(lèi)和BP神經(jīng)網(wǎng)絡(luò)3種分類(lèi)方法根據(jù)財(cái)務(wù)指標(biāo)降維后的數(shù)據(jù)進(jìn)行分類(lèi)評(píng)價(jià)。

        1.2 基于貝葉斯分類(lèi)的企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)模型

        樸素貝葉斯是基于先驗(yàn)概率的一種常用的分類(lèi)學(xué)習(xí)算法,其思想是對(duì)于給定的待分類(lèi)項(xiàng),分別計(jì)算在該項(xiàng)條件下各個(gè)類(lèi)別的概率,然后選擇概率最大的,歸為該類(lèi)。

        設(shè)Yi為第i個(gè)企業(yè)的違約情況,Yi的類(lèi)別集合為C={0,1},Xij(i=1,2,…,n,j=1,2,…,m)為Yi第i個(gè)企業(yè)第j個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù),計(jì)算p(0|Yi)和p(1|Yi),若p(0|Yi)>p(1|Yi)則Yi=0,即Yi是違約的;反之則Yi=1,為未違約。

        一般情況下,p(0|Yi)和p(1|Yi)是未知的,可根據(jù)樣本集合計(jì)算各類(lèi)別下不同特征的條件概率,即pj(Xij|0)和pj(Xij|1),由貝葉斯定理可知:

        (3)

        (4)

        由于式(3)和式(4)中分母均為所有的類(lèi)別,對(duì)概率計(jì)算無(wú)影響,因此只考慮分子,假設(shè)各個(gè)特征相互獨(dú)立,則有式(5)和式(6)成立,從而得到p(0|Yi)和p(1|Yi),進(jìn)而可得Yi的分類(lèi)。

        (5)

        (6)

        1.3 基于決策樹(shù)分類(lèi)的企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)模型

        決策樹(shù)分類(lèi)是一種有監(jiān)督的分類(lèi)學(xué)習(xí)算法,能夠從樣本數(shù)據(jù)中總結(jié)出決策規(guī)則,并且用樹(shù)狀圖呈現(xiàn)分類(lèi)規(guī)則,一棵決策樹(shù)包含一個(gè)根結(jié)點(diǎn)、若干個(gè)葉結(jié)點(diǎn)和內(nèi)部節(jié)點(diǎn),從根結(jié)點(diǎn)到葉結(jié)點(diǎn)形成一條路徑作為一條分類(lèi)規(guī)則,最終在非葉結(jié)點(diǎn)上進(jìn)行決策。在識(shí)別企業(yè)是否違約的實(shí)際決策問(wèn)題中,首先將企業(yè)的樣本數(shù)據(jù)全部納入根結(jié)點(diǎn),通過(guò)判斷各指標(biāo)加入后對(duì)決策結(jié)果的影響水平,即各指標(biāo)的信息增益,若某一指標(biāo)的信息增益越大,說(shuō)明該指標(biāo)對(duì)分類(lèi)的作用越大。因此,可通過(guò)各指標(biāo)的信息增益來(lái)對(duì)指標(biāo)進(jìn)行特征劃分,選擇出最重要的指標(biāo)優(yōu)先分裂。

        假設(shè)企業(yè)是否違約的數(shù)據(jù)為Y=(y1,y2,…,yn),相應(yīng)的概率為P=(p1,p2,…,pn),則樣本Y的信息熵為:

        (7)

        則在每個(gè)指標(biāo)屬性下樣本的條件熵為:

        H(Y|Xi)=P(Xi)H(Y|Xi)

        (8)

        結(jié)合式(7)和式(8)可得第i個(gè)指標(biāo)的信息增益為:

        IG(Xi)=H(Y|Xi)-H(Y)

        (9)

        由式(9)可依次選擇指標(biāo)進(jìn)行分列,生成一棵決策樹(shù)分類(lèi),進(jìn)而根據(jù)樣本數(shù)據(jù)對(duì)企業(yè)的違約情況進(jìn)行分類(lèi)。

        于是非常的熱鬧,比方我的母親,她一點(diǎn)也不懂這行,但是她也列了席,她坐在旁邊觀看,連家里的廚子,女工,都停下了工作來(lái)望著我們,似乎他們不是聽(tīng)什么樂(lè)器,而是在看人。我們聚滿了一客廳。這些樂(lè)器的聲音,大概很遠(yuǎn)的鄰居都可以聽(tīng)到。

        1.4 基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)模型

        BP神經(jīng)網(wǎng)絡(luò)[18]最早由RUMELHART等提出,是一種誤差逆向傳播訓(xùn)練的多層神經(jīng)網(wǎng)絡(luò),由輸入層、模式層和隱藏層構(gòu)成,可用于分類(lèi)和預(yù)測(cè)問(wèn)題。它通過(guò)對(duì)訓(xùn)練結(jié)果與期望結(jié)果進(jìn)行誤差分析,不斷修正模型的權(quán)值和閾值,最終得到理想結(jié)果,如圖1所示。

        圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

        針對(duì)企業(yè)違約的二分類(lèi)問(wèn)題,假設(shè)評(píng)價(jià)企業(yè)違約情況的相關(guān)指標(biāo)數(shù)據(jù)及企業(yè)是否違約的數(shù)據(jù)集為{(Xi,Yi)},i=1,2,…,n,Xi∈Rn為第i個(gè)指標(biāo)數(shù)據(jù)的特征向量,Yi為第i個(gè)企業(yè)的違約情況,若違約則Yi=0;反之,Yi=1。令Xi為輸入變量,Yi為輸出變量,設(shè)vip(i=1,2,…,d;p=1,2,…,q)為輸入層到隱藏層的連接權(quán)重,αp為第q個(gè)隱藏層單元的輸出,則:

        (10)

        設(shè)vpj(p=1,2,…,q;j=1,2,…,q)為隱藏層到輸出層的連接權(quán)重,隱藏層第p個(gè)神經(jīng)元的閾值為γp,則第j個(gè)輸出神經(jīng)元的輸入為:

        (11)

        式中:bp=f(αp-γp),f為激活函數(shù),可選用Sigmod函數(shù)。

        最終可得到最后輸出為:Yi=f(βj-θj),θj為輸出層第j個(gè)神經(jīng)元的閾值。

        1.5 基于誘導(dǎo)有序集成的企業(yè)信用風(fēng)險(xiǎn)最優(yōu)變權(quán)組合評(píng)價(jià)模型

        同一單項(xiàng)分類(lèi)評(píng)價(jià)方法對(duì)不同企業(yè)的評(píng)價(jià)精度不同,不同單項(xiàng)評(píng)價(jià)模型由于自身特點(diǎn)對(duì)不同企業(yè)的評(píng)價(jià)性能也“時(shí)好時(shí)壞”。因此,可能出現(xiàn)某種單項(xiàng)分類(lèi)方法對(duì)某個(gè)企業(yè)的評(píng)價(jià)精度較高而對(duì)其他企業(yè)評(píng)價(jià)精度低的情況,為克服這些缺陷,引入誘導(dǎo)有序加權(quán)平均(induced ordered weighted averaging,IOWA)算子,將單項(xiàng)分類(lèi)評(píng)價(jià)方法對(duì)樣本企業(yè)的評(píng)價(jià)精度由高到低排序后進(jìn)行賦權(quán),提出一種新的變權(quán)組合評(píng)價(jià)方法。

        設(shè)Yi為第i個(gè)企業(yè)是否違約數(shù)據(jù),假設(shè)有m種分類(lèi)方法對(duì)其進(jìn)行分類(lèi)預(yù)測(cè),令第j種分類(lèi)方法對(duì)第i個(gè)企業(yè)是否違約的預(yù)測(cè)結(jié)果為Yji,稱(chēng)eji=Yji-Yi為第j種分類(lèi)方法對(duì)第i個(gè)企業(yè)的評(píng)價(jià)誤差。

        根據(jù)定義1和定義2,由第j種單項(xiàng)分類(lèi)評(píng)價(jià)方法對(duì)第i個(gè)企業(yè)的評(píng)價(jià)值Yji及實(shí)際值Yi可以得到第j種單項(xiàng)分類(lèi)評(píng)價(jià)方法在第i個(gè)企業(yè)的評(píng)價(jià)精度uji,以u(píng)ji作為Yji的誘導(dǎo)值,組成一個(gè)二維數(shù)組,記為。設(shè)u-index(ji)是第i個(gè)企業(yè)評(píng)價(jià)精度序列u1i,u2i,…,umi按從大到小排列后第j大位置對(duì)應(yīng)的下標(biāo),可得由各單項(xiàng)評(píng)價(jià)方法的精度序列u1i,u2i,…,umi所生成的基于誘導(dǎo)有序加權(quán)平均算子的第i個(gè)企業(yè)的變權(quán)組合評(píng)價(jià)值。

        (12)

        (13)

        2 實(shí)例仿真與結(jié)果分析

        2.1 數(shù)據(jù)來(lái)源

        以深圳證券交易所的300家創(chuàng)業(yè)板企業(yè)為研究樣本,其中21家ST類(lèi)公司為信用異常樣本,將這21家公司被ST前一年的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。根據(jù)與ST公司所處行業(yè)相同或相近、資產(chǎn)規(guī)模相差控制在20%以?xún)?nèi)的原則,配比279家信用正常樣本。數(shù)據(jù)來(lái)源于國(guó)泰安數(shù)據(jù)庫(kù)、上市公司企業(yè)年報(bào)等。

        綜合創(chuàng)業(yè)板企業(yè)的風(fēng)險(xiǎn)特征和已有文獻(xiàn)的研究經(jīng)驗(yàn),從盈利能力、短期償債能力、長(zhǎng)期償債能力、發(fā)展能力及運(yùn)營(yíng)效率5方面初步選取21個(gè)影響企業(yè)信用水平的指標(biāo),分別為毛利率、凈資產(chǎn)收益率、總資產(chǎn)凈利潤(rùn)率、資產(chǎn)負(fù)債率、流動(dòng)比率、速動(dòng)比率、現(xiàn)金比率、長(zhǎng)期資本負(fù)債率、產(chǎn)權(quán)比率、流動(dòng)資產(chǎn)比率、流動(dòng)負(fù)債率、凈利潤(rùn)增長(zhǎng)率、凈資產(chǎn)增長(zhǎng)率、營(yíng)業(yè)收入增長(zhǎng)率、總資產(chǎn)增長(zhǎng)率、現(xiàn)金流量增長(zhǎng)率、總資產(chǎn)周轉(zhuǎn)率、流動(dòng)資產(chǎn)周轉(zhuǎn)率、存貨周轉(zhuǎn)率、股東權(quán)益周轉(zhuǎn)率和應(yīng)收賬款周轉(zhuǎn)率。

        2.2 信用風(fēng)險(xiǎn)分類(lèi)評(píng)價(jià)指標(biāo)

        (14)

        (15)

        (16)

        (17)

        (18)

        (19)

        2.3 實(shí)證結(jié)果分析

        利用樣本數(shù)據(jù)計(jì)算企業(yè)違約情況與各指標(biāo)的相關(guān)系數(shù),結(jié)果為:0.39,0.40,0.46,-0.54,0.16,0.14,0.10,-0.31,-0.40,-0.33,0.07,0.16,0.43,0.11,0.16,0.06,0.23,0.16,-0.01,0.22,-0.01,并剔除相關(guān)性弱的指標(biāo),分別為流動(dòng)比率、速動(dòng)比率、現(xiàn)金比率、流動(dòng)負(fù)債率、凈利潤(rùn)增長(zhǎng)率、營(yíng)業(yè)收入增長(zhǎng)率、總資產(chǎn)增長(zhǎng)率、現(xiàn)金流量增長(zhǎng)率、流動(dòng)資產(chǎn)周轉(zhuǎn)率、存貨周轉(zhuǎn)率和應(yīng)收賬款周轉(zhuǎn)率??紤]到剩余指標(biāo)之間可能存在多重共線性問(wèn)題,采用基于流形學(xué)習(xí)的局部線性嵌入法對(duì)指標(biāo)進(jìn)行約簡(jiǎn)。從300家創(chuàng)業(yè)板企業(yè)中隨機(jī)選取2組樣本,每組樣本中,包含270家訓(xùn)練樣本及30家測(cè)試樣本。再利用貝葉斯分類(lèi)模型、決策樹(shù)模型、BP神經(jīng)網(wǎng)絡(luò)模型和最優(yōu)組合模型對(duì)2組樣本進(jìn)行分類(lèi)評(píng)價(jià)。

        圖2 隨機(jī)樣本1模型測(cè)試結(jié)果

        由式(14)~式(19)可得各模型的分類(lèi)準(zhǔn)確率,結(jié)果如表1所示,可知在訓(xùn)練樣本和測(cè)試樣本中,組合分類(lèi)評(píng)價(jià)模型的分類(lèi)精度在4個(gè)模型中均為最高。在測(cè)試樣本中,組合模型對(duì)總體識(shí)別的正確率為96.67%,高于3種單項(xiàng)分類(lèi)方法;對(duì)異常樣本的識(shí)別正確率為83.33%,與決策樹(shù)方法相同,遠(yuǎn)高于貝葉斯方法和BP神經(jīng)網(wǎng)絡(luò)方法;對(duì)正常樣本的識(shí)別正確率為100%,高于3種單項(xiàng)分類(lèi)方法。

        表1 創(chuàng)業(yè)板企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)方法識(shí)別精度比較(隨機(jī)樣本1) %

        為驗(yàn)證模型的穩(wěn)定性,隨機(jī)選取第2個(gè)樣本,進(jìn)行再次驗(yàn)證,結(jié)果如圖3所示,可知組合分類(lèi)模型的預(yù)測(cè)準(zhǔn)確率高于3種單項(xiàng)分類(lèi)模型。

        圖3 隨機(jī)樣本2模型測(cè)試結(jié)果

        由式(14)~式(19)可得各模型的分類(lèi)準(zhǔn)確率,結(jié)果如表2所示,可知在訓(xùn)練樣本和測(cè)試樣本中,組合評(píng)價(jià)模型的分類(lèi)精度在4個(gè)模型中仍為最高,與隨機(jī)樣本1的結(jié)論保持一致。在測(cè)試樣本中,組合模型對(duì)總體識(shí)別的正確率為93.33%,高于3種單項(xiàng)分類(lèi)方法;對(duì)異常樣本識(shí)別的正確率為66.67%,與決策樹(shù)方法相同,遠(yuǎn)高于其他兩種方法;對(duì)正常樣本識(shí)別的正確率為100%,高于3種單項(xiàng)分類(lèi)方法。綜上,相較于正常樣本的識(shí)別問(wèn)題,組合模型能顯著改善部分單項(xiàng)方法對(duì)異常樣本識(shí)別正確率較低的問(wèn)題,具有現(xiàn)實(shí)意義和應(yīng)用價(jià)值,提出的基于誘導(dǎo)有序集成的變權(quán)組合分類(lèi)評(píng)價(jià)模型是合理有效的。

        表2 創(chuàng)業(yè)板企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)方法識(shí)別精度比較(隨機(jī)樣本2) %

        3 結(jié)論

        (1)選取了21個(gè)影響企業(yè)信用的評(píng)價(jià)指標(biāo),基于300家創(chuàng)業(yè)板企業(yè)的樣本數(shù)據(jù),首先計(jì)算各評(píng)價(jià)指標(biāo)與企業(yè)違約情況的相關(guān)性,并剔除了相關(guān)性弱的指標(biāo);其次利用基于流形學(xué)習(xí)的LLE方法對(duì)指標(biāo)進(jìn)行約簡(jiǎn),以消除冗余信息對(duì)模型的影響;繼而利用貝葉斯分類(lèi)、決策樹(shù)模型以及BP神經(jīng)網(wǎng)絡(luò)3種分類(lèi)模型對(duì)企業(yè)是否違約進(jìn)行分類(lèi)評(píng)價(jià)。結(jié)果表明3種分類(lèi)方法對(duì)不同企業(yè)的評(píng)價(jià)精度“忽高忽低”,為融合不同方法所提供的有效信息,構(gòu)建基于誘導(dǎo)有序集成的變權(quán)組合評(píng)價(jià)模型,并隨機(jī)選擇兩組訓(xùn)練樣本和測(cè)試樣本,結(jié)果表明,組合評(píng)價(jià)模型能有效提高分類(lèi)精度,并分散由單一模型分類(lèi)錯(cuò)誤所帶來(lái)的風(fēng)險(xiǎn)。這說(shuō)明筆者提出的模型在解決企業(yè)信用評(píng)價(jià)分類(lèi)問(wèn)題時(shí)效果顯著。

        (2)在未來(lái)的研究中,一方面,考慮繼續(xù)挖掘數(shù)據(jù)特征,利用深度學(xué)習(xí)方法進(jìn)行評(píng)價(jià)。另一方面,考慮將文本信息等非結(jié)構(gòu)化數(shù)據(jù)與財(cái)務(wù)數(shù)據(jù)相結(jié)合,構(gòu)建基于結(jié)構(gòu)化與非結(jié)構(gòu)化融合的組合評(píng)價(jià)模型,進(jìn)一步提高模型的分類(lèi)精度及適用性。

        猜你喜歡
        降維信用風(fēng)險(xiǎn)決策樹(shù)
        混動(dòng)成為降維打擊的實(shí)力 東風(fēng)風(fēng)神皓極
        降維打擊
        海峽姐妹(2019年12期)2020-01-14 03:24:40
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
        決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        淺析我國(guó)商業(yè)銀行信用風(fēng)險(xiǎn)管理
        基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
        京東商城電子商務(wù)信用風(fēng)險(xiǎn)防范策略
        個(gè)人信用風(fēng)險(xiǎn)評(píng)分的指標(biāo)選擇研究
        基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
        信用風(fēng)險(xiǎn)的誘發(fā)成因及對(duì)策思考
        国产一区二区精品久久| 国产亚洲精品在线播放| 国产真实伦视频在线视频| 亚洲av天堂久久精品| 午夜男女靠比视频免费| 亚洲a无码综合a国产av中文| 欧美人妻aⅴ中文字幕| 国产精品毛片久久久久久久| 夜夜春精品视频| 日本熟妇中文字幕三级| 在线亚洲精品免费视频| 嫩呦国产一区二区三区av| 樱桃视频影院在线播放| 久久AV老司机精品网站导航| 中文字幕日韩熟女av| 中文字幕亚洲视频一区| 日本熟妇美熟bbw| 女人做爰高潮呻吟17分钟| 日韩欧美国产自由二区| 亚洲精品国产二区在线观看| 偷拍一区二区三区四区视频| 末成年女a∨片一区二区| 亚洲av色先锋资源电影网站 | 熟妇与小伙子露脸对白| 精品国产黄一区二区三区| 暖暖 免费 高清 日本 在线| 亚洲熟女乱色综合亚洲av| 人人妻人人澡人人爽精品欧美| 国产人成视频免费在线观看| 白白色发布的在线视频| 亚洲国产午夜精品理论片在线播放| 狠狠躁夜夜躁AV网站中文字幕 | 91青青草久久| 午夜麻豆视频在线观看| 国产一区二区三区在线观看完整版| 亚洲av无码专区在线播放中文| 调教在线播放黄| 精品一区二区三区国产av| 国产精品久久久久精品一区二区| 国产精品久免费的黄网站| 一本久道视频无线视频试看|