亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的債券信用評(píng)級(jí)研究

        2024-05-19 19:12:59陳湘州劉佳
        現(xiàn)代商貿(mào)工業(yè) 2024年10期
        關(guān)鍵詞:信用評(píng)級(jí)主成分分析

        陳湘州 劉佳

        摘?要:當(dāng)前債券違約事件屢見(jiàn)不鮮且愈演愈烈,鑒于此,該文提出了基于機(jī)器學(xué)習(xí)的債券信用等級(jí)評(píng)估模型,以在交易所市場(chǎng)發(fā)行債券的主體為研究對(duì)象,首先通過(guò)極端梯度提升(eXtreme?Gradient?Boosting)預(yù)測(cè)出債券發(fā)行主體是否會(huì)違約以及違約的概率,再使用主成分分析(Principal?Component?Analysis)對(duì)高維數(shù)據(jù)進(jìn)行降維,最后運(yùn)用K-means算法將債券樣本劃分為9類(lèi)。檢驗(yàn)發(fā)現(xiàn),該模型的評(píng)估結(jié)果能夠真實(shí)地反映債券違約情況,對(duì)幫助投資者識(shí)別違約風(fēng)險(xiǎn)具有一定的借鑒意義。

        關(guān)鍵詞:信用評(píng)級(jí);極端梯度提升;主成分分析;K-means

        中圖分類(lèi)號(hào):F23?????文獻(xiàn)標(biāo)識(shí)碼:A??????doi:10.19311/j.cnki.16723198.2024.10.049

        0?引言

        對(duì)于債券評(píng)級(jí)的研究主要分為以下兩類(lèi):第一類(lèi)是指標(biāo)遴選的研究。遲國(guó)泰等(2016)對(duì)指標(biāo)進(jìn)行偏相關(guān)分析和Probit回歸分析,刪除信息冗余的指標(biāo),最后對(duì)留下指標(biāo)進(jìn)行Probit回歸分析,判別企業(yè)的違約狀態(tài)。李戰(zhàn)江等(2016)使用逼近理想點(diǎn)賦權(quán)模型確定指標(biāo)權(quán)重后,再運(yùn)用ward聚類(lèi)對(duì)樣本進(jìn)行分類(lèi)。周穎(2021)運(yùn)用信息增益和相關(guān)分析方法篩選出指標(biāo)后建立信用評(píng)級(jí)體系。第二類(lèi)是評(píng)級(jí)方法的研究。吳建華等(2021)建立了動(dòng)態(tài)評(píng)價(jià)信用質(zhì)量的貝葉斯模型進(jìn)行信用評(píng)級(jí)。張東玲和高齊圣(2010)基于有序Logitic回歸建立了企業(yè)質(zhì)量信用等級(jí)評(píng)價(jià)模型。

        現(xiàn)有的債券信用評(píng)價(jià)等級(jí)指標(biāo)繁多,不僅增加了數(shù)據(jù)的儲(chǔ)存空間,減緩了算法的運(yùn)算速度。鑒于此,該文引入了主成分分析法對(duì)樣本特征進(jìn)行降維,再結(jié)合極端梯度提升和K-means機(jī)器學(xué)習(xí)算法進(jìn)行債券信用等級(jí)評(píng)估。

        1?債券信用等級(jí)評(píng)估模型構(gòu)建

        該文以Python軟件為建模的載體,運(yùn)用多種機(jī)器學(xué)習(xí)方法展開(kāi)債券信用等級(jí)評(píng)估工作。在債券樣本數(shù)據(jù)集中,有M個(gè)樣本{X1,X2,…,XM},每個(gè)樣本包含N個(gè)特征Xi=[xi1,xi2,…,xiN]T和標(biāo)簽(yi,yi=0,1)兩個(gè)部分,正常樣本的標(biāo)簽是0,債券違約樣本的標(biāo)簽是1。該信用評(píng)級(jí)模型的步驟主要如下:

        第一步:進(jìn)行數(shù)據(jù)預(yù)處理。采用歸一化方法處理數(shù)據(jù)量綱不同的問(wèn)題,公式為:

        x′=x-min(x)max(x)-min(x)(1)

        第二步:利用XGBoost預(yù)測(cè)每個(gè)債券樣本是否違約以及違約的概率。極端梯度提升屬于集成算法中的提升法,在眾多研究領(lǐng)域中被廣泛使用,其公式為:

        y^i(0)=0y^i(1)=y^i(0)+f1(Xi)y^i(2)=y^i(1)+f2(Xi)...y^i(t)=y^i(t-1)+ft(Xi)(2)

        其中ft(Xi)為每次增加的決策樹(shù),y^i(t)為第t輪模型的預(yù)測(cè)值,而每次選取樹(shù)的標(biāo)準(zhǔn)是為了降低損失函數(shù),XGBoost的目標(biāo)函數(shù)(損失函數(shù))如下:

        Obj(t)=∑ni=1l(yi,y^i(t-1)+ft(xi))+Ω(ft)+C(3)

        式(3)中l(wèi)(·)為損失函數(shù),經(jīng)過(guò)泰勒展開(kāi)上述公式并加入懲罰函數(shù)得到:

        Obj(t)=∑ni=1[γΤ+Gjωj+12(Hj+λ)ωj2](4)

        式(4)中γ和λ為對(duì)葉子節(jié)點(diǎn)的懲罰力度,T為葉子節(jié)點(diǎn)的個(gè)數(shù),Gj為對(duì)損失函數(shù)一階偏導(dǎo)的值,ωj為最終葉子節(jié)點(diǎn)的值,Hj為對(duì)損失函數(shù)二階偏導(dǎo)的值。

        第三步:利用PCA對(duì)債券高維特征降維。PCA是通過(guò)對(duì)投影距離方差的運(yùn)用,將降維問(wèn)題轉(zhuǎn)換為求最值的問(wèn)題,主要步驟如下:

        (1)對(duì)所有特征進(jìn)行中心化處理,即對(duì)每一個(gè)特征求平均值,公式如下:

        X1=1M∑Mi=1xi1X2=1M∑Mi=1xi2…XN=1M∑Mi=1xiN(5)

        式(5)中中X1是特征X1的平均值,xiN代表第i個(gè)樣本的第N個(gè)特征,M代表樣本的個(gè)數(shù)。

        (2)求協(xié)方差矩陣,其計(jì)算公式如下:

        C=cov(X1,X1)cov(X1,X2)cov(X2,X1)cov(X2,X2)(6)

        式(6)中cov(X1,X1)代表X1的方差,cov(X1,X2)代表X1和X2的協(xié)方差,公式如下:

        cov(X1,X1)=∑Mi=1(xi1-x1)(xi1-x1)M-1(7)

        (3)計(jì)算協(xié)方差矩陣對(duì)應(yīng)的特征值λ和特征向量u,使得Cu=λu。

        (4)將原始特征投影到選取的特征向量上,得到p維特征,從而達(dá)到了降維的目的,公式如下:

        si1si2…sip=u1T*(xi1,xi2,…,xiN)Tu2T*(xi1,xi2,…,xiN)T…upT*(xi1,xi2,…,xiN)T(8)

        式(8)中si1,si2,…,sikT是投影后新的特征,由之前的N維特征降低到p維。

        第四步:將降維后的新特征用于K-means分析,數(shù)據(jù)集被劃分為九個(gè)簇,計(jì)算每一簇違約概率。

        K-means屬于聚類(lèi)算法,將具有相似特征的樣本歸為一類(lèi),其具體流程如下:

        (1)隨機(jī)地選取k個(gè)數(shù)據(jù)作為簇的質(zhì)心,C=C1,C2,…,Ck。

        (2)計(jì)算每個(gè)樣本點(diǎn)到每個(gè)質(zhì)心的距離,將樣本分配到距離其最近的簇,通常使用歐氏距離度量。

        dis=∑pt=1(xit-cjt)2,1≤i≤m,1≤j≤k(9)

        式(9)中xit表示第i個(gè)樣本的第t個(gè)特征,cjt表示第j個(gè)質(zhì)心的第t個(gè)特征,通過(guò)計(jì)算距離后得到k個(gè)簇R1,R2,…,RK。

        (3)對(duì)于每個(gè)簇Cj,重新計(jì)算每個(gè)簇的質(zhì)心。

        Cj=1aj∑x∈Cjx(10)

        式(10)中aj表示Cj中數(shù)據(jù)點(diǎn)個(gè)數(shù)。

        (4)重復(fù)步驟(2)和(3),直到每個(gè)樣本不再發(fā)生變動(dòng),算法完成收斂。

        2?樣本和特征指標(biāo)的選擇

        2.1?樣本的選擇

        該文以在中國(guó)證券市場(chǎng)公開(kāi)發(fā)行債券的公司為研究對(duì)象,選取2014年1月—2022年3月發(fā)生信用債違約的公司作為債券違約主體,違約當(dāng)年記作t年,采用t-1年的數(shù)據(jù)作為違約主體的樣本數(shù)據(jù)集,正常債券樣本選取交易所市場(chǎng)存量債券公司。將缺失值較多的樣本刪除,得到了1539個(gè)樣本,數(shù)據(jù)主要來(lái)源于wind數(shù)據(jù)庫(kù)。

        2.2?指標(biāo)的選取

        在已有研究基礎(chǔ)上,該文選取了18個(gè)財(cái)務(wù)指標(biāo),考慮到特征的重要性與多樣性,因此,該文增加了非財(cái)務(wù)指標(biāo),綜上所選的指標(biāo)如表1所示。

        3?模型參數(shù)尋優(yōu)與結(jié)果分析

        3.1?XGBoost算法超參數(shù)尋優(yōu)

        為了保證XGBoost算法更準(zhǔn)確地預(yù)測(cè)樣本是否違約以及違約的概率,該文將所有數(shù)據(jù)按80%:20%的比例劃分為訓(xùn)練集與測(cè)試集。該文利用了學(xué)習(xí)曲線對(duì)各個(gè)超參數(shù)進(jìn)行調(diào)整,以期尋找最佳值,XGBoost算法的超參數(shù)包括:生成樹(shù)的數(shù)目、學(xué)習(xí)率、隨機(jī)采樣的比例、樹(shù)的最大深度等;最后利用測(cè)試集對(duì)訓(xùn)練好的模型進(jìn)行檢驗(yàn)。通過(guò)學(xué)習(xí)曲線尋找超參數(shù)最優(yōu)值的過(guò)程如圖1所示。

        a????????????b

        c????????????d

        圖1?超參數(shù)最佳值選取過(guò)程

        極端梯度提升算法中每一棵樹(shù)都是相關(guān)的,每增加一棵決策樹(shù)便會(huì)學(xué)習(xí)一個(gè)新的函數(shù),來(lái)擬合上個(gè)模型預(yù)測(cè)的殘差。圖1中縱坐標(biāo)代表債券預(yù)測(cè)準(zhǔn)確率,橫坐標(biāo)代表各個(gè)超參數(shù)取值范圍,每個(gè)小圖都有兩條折現(xiàn)分別代表訓(xùn)練集和測(cè)試集的預(yù)測(cè)準(zhǔn)確率。從圖中可以看出決策樹(shù)棵數(shù)(決策數(shù)的數(shù)量)最佳值選擇90,學(xué)習(xí)率最佳值為0.20,子采樣最佳值為0.84,決策樹(shù)的最大深度(指決策數(shù)模型所允許的最大分支深度,即從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的最長(zhǎng)距離)最佳值為5。

        3.2?PCA與K-means超參數(shù)尋優(yōu)

        該文使用PCA對(duì)數(shù)據(jù)特征進(jìn)行降維,PCA中一個(gè)重要的參數(shù)是n_components,指降維后的維度,累計(jì)可解釋性方差比例可以幫助選擇最佳值,其代表降維后特征所帶有原始數(shù)據(jù)集的信息比例。當(dāng)保留5個(gè)特征時(shí),獲取原數(shù)據(jù)的信息已經(jīng)超過(guò)90%?,為了達(dá)到數(shù)據(jù)可視化的目的,該文將n_components保留到3,其可解釋性方差的貢獻(xiàn)率超過(guò)了80%,保留了原始數(shù)據(jù)的大量信息。

        K-means算法主要應(yīng)用于數(shù)據(jù)分類(lèi),但其屬于無(wú)監(jiān)督學(xué)習(xí),所以不知道樣本標(biāo)簽,只能將相似的樣本歸為一類(lèi),非常適合于債券信用等級(jí)評(píng)估,而劃分為k個(gè)類(lèi)簇,是需要著重考慮的問(wèn)題,該文借助輪廓系數(shù)和inertia系數(shù)來(lái)選擇k值。對(duì)于選擇的k值,其輪廓系數(shù)越大越好,inertia系數(shù)越小越好,但這不是絕對(duì)衡量指標(biāo),還需要結(jié)合實(shí)際情況確定最佳的k值。該文根據(jù)市場(chǎng)債券信用等級(jí)AAA、AA、A、BBB、BB、B、CCC、CC、C的實(shí)際分布情況選擇k=9,其inertia系數(shù)為22相對(duì)較低,且輪廓系數(shù)為0.61相對(duì)偏高,具有很好的分類(lèi)效果,最后通過(guò)K-means算法將樣本分別劃分為9類(lèi)。

        3.3?實(shí)驗(yàn)結(jié)果分析

        實(shí)驗(yàn)結(jié)果為:預(yù)測(cè)為AAA等級(jí)一類(lèi)的有359個(gè)樣本,其中沒(méi)有違約債券主體,且違約概率均值最低為0.25%;AA和A等級(jí)的違約概率均值不到1%,都只存在一個(gè)違約債券主體;BBB?和BB等級(jí)的違約概率較低,處于1%~2%之間;但B等級(jí)的違約概率呈現(xiàn)指數(shù)式暴增,高達(dá)52.17%,分類(lèi)結(jié)果也證明了該等級(jí)的違約比例較高為64.29%,28個(gè)樣本中有18個(gè)違約主體;CCC等級(jí)違約概率逐步增加為61.70%,50個(gè)樣本中存在35個(gè)違約主體;CC等級(jí)全部為違約樣本;?C等級(jí)違約概率均值最高為96.09%,84個(gè)樣本中存在82個(gè)違約主體,其違約比例高達(dá)97.62%。

        從Wind數(shù)據(jù)庫(kù)收集資料,統(tǒng)計(jì)了實(shí)際違約樣本的債信等級(jí)分布情況,聚類(lèi)分析中違約樣本共150個(gè),其中A等級(jí)及以上違約的債券發(fā)行主體共56個(gè),占違約總數(shù)的37.30%,BBB、BB、B等級(jí)違約的共33個(gè),占違約總數(shù)的22%,CCC?、CC、C等級(jí)違約的共51個(gè),占違約總數(shù)的34%,通過(guò)統(tǒng)計(jì)分析發(fā)現(xiàn)A等級(jí)及以上的違約樣本最多,不符合債信等級(jí)越高違約概率越低的原則,揭示了債券信用評(píng)級(jí)虛高的現(xiàn)象。而通過(guò)模型分類(lèi)后的樣本,其債信評(píng)級(jí)更具有真實(shí)性與客觀性,A等級(jí)及以上違約的樣本共2個(gè),其中AAA等級(jí)中不存在違約樣本,而大部分的違約樣本被分類(lèi)為B、CCC、CC、C等級(jí),與現(xiàn)實(shí)生活中實(shí)際違約債券發(fā)行主體的信用等級(jí)相比較,該債券信用等級(jí)評(píng)估模型具有良好的分類(lèi)效果。

        4?債券信用等級(jí)評(píng)估模型檢驗(yàn)

        為了檢驗(yàn)債券信用等級(jí)評(píng)估模型的有效性,該文從Wind數(shù)據(jù)庫(kù)收集了2022年4月至2022年9月債券違約發(fā)行主體的數(shù)據(jù)信息,考慮到數(shù)據(jù)可得性,僅收集了交易所市場(chǎng)的11個(gè)違約樣本,并用相同的債券信用評(píng)級(jí)方法進(jìn)行預(yù)測(cè)分類(lèi),現(xiàn)實(shí)情況為:11個(gè)違約樣本中有8個(gè)債券發(fā)行主體違約前的評(píng)級(jí)在A等級(jí)及以上,其中3個(gè)擁有最高債券信用評(píng)級(jí)AAA等級(jí),再次證實(shí)了現(xiàn)有債券信用評(píng)級(jí)存在虛高的事實(shí)。而通過(guò)模型評(píng)估后,這11個(gè)違約樣本中有8個(gè)被分類(lèi)為最低債券信用評(píng)級(jí)C等級(jí),3個(gè)被分類(lèi)為CCC等級(jí),證明該債券信用等級(jí)評(píng)估模型能夠客觀準(zhǔn)確地進(jìn)行評(píng)級(jí),幫助投資者排除潛在的違約風(fēng)險(xiǎn)。

        5?結(jié)論

        人工智能技術(shù)的發(fā)展為債券信用評(píng)級(jí)研究提供了更高效的技術(shù)支持,在債券違約事件頻繁爆發(fā)的經(jīng)濟(jì)背景下,該文對(duì)中國(guó)交易所市場(chǎng)2014年1月—2022年3月發(fā)生違約的公司進(jìn)行研究,并以2022年4月—2022年9月的樣本數(shù)據(jù)進(jìn)行檢驗(yàn),實(shí)驗(yàn)結(jié)果表明該模型具有良好的分類(lèi)效果。該文的主要特色為:

        (1)使用PCA對(duì)高維特征降維,降維后的特征保留了原有數(shù)據(jù)80%以上的信息,既消除了數(shù)據(jù)噪音,又加快了算法運(yùn)算速度,避免誤刪對(duì)債券違約預(yù)測(cè)結(jié)果有重大貢獻(xiàn)的指標(biāo)。

        (2)將?XGBoost預(yù)測(cè)債券發(fā)行主體違約概率作為信用評(píng)級(jí)標(biāo)準(zhǔn),滿足了違約概率越高,則債券信用等級(jí)越低的規(guī)律,有效地劃分了債券樣本信用等級(jí)。

        (3)運(yùn)用K-means等機(jī)器學(xué)習(xí)方法進(jìn)行債券信用等級(jí)評(píng)估是符合大環(huán)境下人工智能崛起背景的,為債券違約研究領(lǐng)域貢獻(xiàn)了一種新的方法。

        參考文獻(xiàn)

        [1]遲國(guó)泰,張亞京,石寶峰,等.基于Probit回歸的小企業(yè)債信評(píng)級(jí)模型及實(shí)證[J].管理科學(xué)學(xué)報(bào),2016,19(06):136156.

        [2]李戰(zhàn)江,句芳,修長(zhǎng)柏,等.銀行信用風(fēng)險(xiǎn)小樣本評(píng)級(jí)模型的構(gòu)建[J].統(tǒng)計(jì)與決策,2016,(09):3943.

        [3]周穎.基于信息增益的小型工業(yè)企業(yè)信用評(píng)級(jí)模型[J].運(yùn)籌與管理,2021,30(01):209216.

        [4]吳建華,張穎,原雪梅,等.動(dòng)態(tài)貝葉斯信用評(píng)級(jí)的宏觀經(jīng)濟(jì)沖擊模型[J/OL].數(shù)理統(tǒng)計(jì)與管理:113[20221125].

        [5]張東玲,高齊圣.企業(yè)質(zhì)量信用等級(jí)評(píng)價(jià)研究:以青島市家電產(chǎn)業(yè)為例[J].系統(tǒng)管理學(xué)報(bào),2010,19(01):8388.

        猜你喜歡
        信用評(píng)級(jí)主成分分析
        關(guān)于資產(chǎn)證券化中信用評(píng)級(jí)行為的分析
        我國(guó)房地產(chǎn)企業(yè)信用評(píng)級(jí)財(cái)務(wù)指標(biāo)體系研究
        互聯(lián)網(wǎng)金融征信建設(shè)存在的問(wèn)題及對(duì)策探討
        基于NAR模型的上海市房產(chǎn)稅規(guī)模預(yù)測(cè)
        主成分分析法在大學(xué)英語(yǔ)寫(xiě)作評(píng)價(jià)中的應(yīng)用
        江蘇省客源市場(chǎng)影響因素研究
        SPSS在環(huán)境地球化學(xué)中的應(yīng)用
        考試周刊(2016年84期)2016-11-11 23:57:34
        長(zhǎng)沙建設(shè)國(guó)家中心城市的瓶頸及其解決路徑
        我國(guó)信用評(píng)級(jí)業(yè)存在的問(wèn)題及應(yīng)對(duì)策略
        服務(wù)貿(mào)易結(jié)構(gòu)優(yōu)化路徑研究
        亚洲中文字幕在线第二页 | 成人无码无遮挡很H在线播放| 国产亚洲精品视频在线| 亚洲av日韩综合一区在线观看| 中文字幕色av一区二区三区| 色欲av亚洲一区无码少妇| 国产精品一区2区三区| av永远在线免费观看| 人妻少妇偷人精品久久人妻| 女人av天堂国产在线| 激情内射日本一区二区三区| 日韩国产一区| 性视频毛茸茸女性一区二区| 国产精品亚洲综合久久系列| 亚洲精品少妇30p| 久久久久久人妻一区精品| 波多野结衣的av一区二区三区| 丰满少妇高潮惨叫久久久一| 在线精品一区二区三区 | 日韩我不卡| 日本精品αv中文字幕| 毛片a级毛片免费观看| 91久久精品国产91久久| 国产91在线精品福利| 亚洲天堂av大片暖暖| av网站一区二区三区| 人妻色中文字幕免费视频| 日本a级免费大片网站| 国产男女猛烈无遮挡免费网站| 精品久久久久一区二区国产| 91桃色在线播放国产| 天天躁夜夜躁狠狠是什么心态| 国产精品久久无码不卡黑寡妇 | 91短视频在线观看免费| 国产丝袜高跟美腿一区在线| av网站免费在线不卡| 亚洲日韩精品AⅤ片无码富二代| 亚洲av免费高清不卡| 韩国av一区二区三区不卡| 亚洲av电影天堂男人的天堂| 永久无码在线观看|