白鈺銘, 姜昱汐
(大連交通大學(xué)經(jīng)濟(jì)管理學(xué)院,大連 116028)
近年來,我國債券市場(chǎng)飛速發(fā)展,中國人民銀行金融市場(chǎng)司發(fā)布的《2021 年金融市場(chǎng)運(yùn)行情況》[1]中指出,2021 年全年我國債券市場(chǎng)共發(fā)行各類債券61.9 萬億,同比增長8.0%,截至2021 年末,我國債券市場(chǎng)托管余額133.5 萬億元,同比增長16.5 萬億元,已成為全球第二大債券市場(chǎng)。債券市場(chǎng)快速發(fā)展的同時(shí)也出現(xiàn)了債券違約頻發(fā)。2014 年“11 超日債”違約是我國第一次發(fā)生實(shí)質(zhì)性債券違約,根據(jù)中央結(jié)算公司發(fā)布的《2021 年我國債券市場(chǎng)違約回顧與展望》[2],截至2021 年末,我國債券市場(chǎng)累計(jì)有243 家發(fā)行人發(fā)生違約,共涉及到期違約債券685 期,到期違約金額合計(jì)約6 184.17 億元。找出影響債券違約的關(guān)鍵因素,并建立違約鑒別精度高且具備實(shí)用性的債券違約預(yù)警模型,對(duì)投資者和中國債券市場(chǎng)的健康穩(wěn)定發(fā)展都具有重要意義。
當(dāng)前關(guān)于債券違約預(yù)警的相關(guān)研究,主要可分為三個(gè)方面。
一是債券違約影響因素研究。蔣敏等[3]發(fā)現(xiàn),過度負(fù)債和經(jīng)濟(jì)下行會(huì)導(dǎo)致高績效企業(yè)債券違約,資金周轉(zhuǎn)不足和經(jīng)濟(jì)下行會(huì)導(dǎo)致低績效企業(yè)債券違約;肖艷麗和向有濤[4]發(fā)現(xiàn),剩余期限(年)、票面利率、流動(dòng)比率、長期負(fù)債占比和應(yīng)收賬款周轉(zhuǎn)率等五個(gè)指標(biāo)特征是引起債券違約風(fēng)險(xiǎn)的主要因素,影響貢獻(xiàn)度占到80%,有形資產(chǎn)比率和長期負(fù)債占比超過相應(yīng)閾值時(shí),會(huì)分別產(chǎn)生拉低和拉高債券違約的風(fēng)險(xiǎn);Li 等[5]指出,債券違約率與發(fā)債公司能源消耗成正相關(guān),與發(fā)債公司的社會(huì)責(zé)任感、公司治理能力以及財(cái)務(wù)表現(xiàn)呈負(fù)相關(guān);羅朝陽等[6]研究了金融周期和全要素生產(chǎn)率與債券違約的關(guān)系,研究發(fā)現(xiàn)金融周期頂部發(fā)生債券違約的概率較大,全要素生產(chǎn)率與債券違約呈負(fù)相關(guān)。
二是債券信用評(píng)級(jí)指標(biāo)體系研究。陳學(xué)彬等[7]從債券發(fā)行公司的財(cái)務(wù)指標(biāo)、債券市場(chǎng)指標(biāo)、債券評(píng)級(jí)指標(biāo)、宏觀經(jīng)濟(jì)環(huán)境指標(biāo)、行業(yè)景氣指標(biāo)、地區(qū)經(jīng)濟(jì)景氣指標(biāo)等六個(gè)方面構(gòu)建指標(biāo)體系;Ma 等[8]從債券基本信息、債券發(fā)行主體基本信息、債券信用評(píng)級(jí)情況、債券發(fā)行主體財(cái)務(wù)信息以及宏觀因素等五個(gè)方面構(gòu)建指標(biāo)體系;Giesecke 等[9]從股票收益率、股票收益波動(dòng)率、無風(fēng)險(xiǎn)利率、信用利差、消費(fèi)增長、知識(shí)產(chǎn)權(quán)增長、通貨膨脹率、GDP 增長等八個(gè)方面構(gòu)建指標(biāo)體系;姚瀟等[10]從債券發(fā)行人基本信息和財(cái)務(wù)指標(biāo)中選取8 個(gè)因素構(gòu)建指標(biāo)體系。
三是債券違約預(yù)警方法研究。按照債券違約預(yù)警方法的發(fā)展階段,可將其分為三類,分別是以因子評(píng)分和Z-score 為代表的財(cái)務(wù)指標(biāo)類分析法[11–14]、以Credit Metirics、Credit Portfolio View、CreditRisk+、KMV 等為代表的量化指標(biāo)信用風(fēng)險(xiǎn)分析方法[15–19]和以邏輯回歸、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林等單模型和集成模型為代表的機(jī)器學(xué)習(xí)算法[10,20–22]。
從現(xiàn)有研究來看,當(dāng)前關(guān)于債券違約預(yù)警的相關(guān)研究已經(jīng)取得了很多成果,但還存在一定的不足。
債券違約影響因素方面,已有文獻(xiàn)主要集中在發(fā)債主體的個(gè)別財(cái)務(wù)情況、企業(yè)經(jīng)營情況、企業(yè)屬性、所在地區(qū)宏觀環(huán)境以及債券基本信息等,而這些影響因素只是說明了哪些指標(biāo)會(huì)影響到債券違約,但不能對(duì)債券違約進(jìn)行預(yù)警。
債券信用評(píng)級(jí)指標(biāo)體系方面,已有文獻(xiàn)的指標(biāo)體系主要從部分債券基本信息、債券發(fā)行公司財(cái)務(wù)指標(biāo)、債券發(fā)行公司非財(cái)務(wù)指標(biāo)以及宏觀情況等方面構(gòu)成債券信用評(píng)級(jí)指標(biāo)體系。但都是只考慮某一方面的指標(biāo),并沒有從上述多個(gè)維度全面反映債券違約風(fēng)險(xiǎn)特征。
債券違約預(yù)警方法方面,財(cái)務(wù)指標(biāo)分析方法通常只關(guān)注某一方面的指標(biāo)而忽視掉其余的影響因素。因此,這種分析方法只能確定影響因素,卻無法進(jìn)行違約預(yù)測(cè);對(duì)基于量化指標(biāo)信用風(fēng)險(xiǎn)分析方法的系列模型,Credit Metirics、Credit Portfolio View 和CreditRisk+等是基于大量違約統(tǒng)計(jì)信息,適用于相關(guān)數(shù)據(jù)完整度高的研究對(duì)象,而KMV 模型考慮的指標(biāo)不僅較少,還假定了資產(chǎn)收益等固定不變,與債券實(shí)際情況不符;基于機(jī)器學(xué)習(xí)的違約預(yù)警方法主要分為傳統(tǒng)機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法。很多傳統(tǒng)機(jī)器學(xué)習(xí)算法存在降維效果差、精度不高或計(jì)算速度慢等各類問題,深度學(xué)習(xí)方法則因?yàn)槟P蛷?fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)導(dǎo)致計(jì)算結(jié)果的可解釋性不強(qiáng),這對(duì)需要考慮經(jīng)濟(jì)意義可解釋性的債券違約預(yù)警問題并不適合,且采用深度學(xué)習(xí)模型要想獲得比較高的一個(gè)精度,需要較大的樣本數(shù)據(jù)和計(jì)算時(shí)間。
此外,以上三個(gè)方面的實(shí)證研究中,關(guān)于債券違約預(yù)警影響指標(biāo)的數(shù)據(jù)時(shí)間窗包括t、t ?1 和t ?2(即債券違約發(fā)生在t期,違約預(yù)警指標(biāo)數(shù)據(jù)為同期、滯后一期和兩期),但是現(xiàn)有研究通常是主觀選取一個(gè)時(shí)間窗,對(duì)選擇哪一個(gè)時(shí)間窗更合理并沒有依據(jù),且沒有考慮債券違約預(yù)測(cè)中,違約和非違約樣本數(shù)量差距大會(huì)導(dǎo)致的樣本非均衡問題,這也影響了預(yù)測(cè)結(jié)果的精度。
根據(jù)上述分析,本文從以上幾個(gè)方面進(jìn)行改進(jìn)。第一,本文從發(fā)債主體內(nèi)部財(cái)務(wù)指標(biāo)、發(fā)債主體內(nèi)部非財(cái)務(wù)指標(biāo)和發(fā)債主體外部指標(biāo)三個(gè)方面出發(fā),對(duì)已有文獻(xiàn)的指標(biāo)進(jìn)行歸類整理,其中已有文獻(xiàn)中的“債券發(fā)行公司財(cái)務(wù)指標(biāo)”對(duì)應(yīng)本文的“發(fā)債主體內(nèi)部財(cái)務(wù)指標(biāo)”、“債券發(fā)行公司非財(cái)務(wù)指標(biāo)”對(duì)應(yīng)本文的“發(fā)債主體內(nèi)部非財(cái)務(wù)指標(biāo)”,“債券基本信息”和“宏觀情況”合并為本文的“發(fā)債主體外部指標(biāo)”,最終以19 個(gè)維度,615 個(gè)指標(biāo)構(gòu)建初始指標(biāo)池,彌補(bǔ)現(xiàn)有研究中指標(biāo)體系結(jié)構(gòu)不清晰信息不充分的不足。第二,采用SMOTE 方法對(duì)樣本進(jìn)行均衡化處理,消除樣本類別不均衡對(duì)預(yù)測(cè)精度的影響。第三,通過XGBoost 方法構(gòu)建違約預(yù)警模型,選取不同時(shí)間窗數(shù)據(jù)進(jìn)行計(jì)算,并根據(jù)計(jì)算結(jié)果反推最優(yōu)違約預(yù)警特征指標(biāo)組合和最優(yōu)預(yù)測(cè)時(shí)間窗,保證了以較精簡的指標(biāo)體系達(dá)到較高預(yù)測(cè)精度的目標(biāo),并改變了現(xiàn)有研究主觀選取違約預(yù)警時(shí)間窗的弊端。通過本文模型與其他常用違約預(yù)測(cè)模型的結(jié)果對(duì)比分析,本文模型具有降維效果好、計(jì)算速度快、穩(wěn)定性好和可解釋性強(qiáng)的優(yōu)勢(shì)。
1.1.1 缺失值處理
缺失值是指不能獲取的指標(biāo)值,對(duì)于缺失值處理的整體思路是用最差值填補(bǔ)缺失值。按照指標(biāo)的性質(zhì),可將指標(biāo)分為定量指標(biāo)和定性指標(biāo)。指標(biāo)的性質(zhì)不同,填補(bǔ)缺失值的方法也不同。
1) 定量指標(biāo)填補(bǔ)缺失值方法
定量指標(biāo)是指可以用具體數(shù)值表示的指標(biāo),從指標(biāo)對(duì)預(yù)測(cè)結(jié)果的影響又可將定量指標(biāo)細(xì)分為正向指標(biāo)、負(fù)向指標(biāo)和區(qū)間指標(biāo)。
正向指標(biāo)是指指標(biāo)值越大,越不容易違約,例如流動(dòng)比率、速動(dòng)比率等指標(biāo);負(fù)向指標(biāo)是指標(biāo)值越小,越不容易違約,例如有形資產(chǎn)負(fù)債率、長期資本負(fù)債率等指標(biāo);而區(qū)間指標(biāo)是指當(dāng)指標(biāo)值處于某一特定區(qū)間時(shí)越不容易違約,指標(biāo)值與這一特定區(qū)間的距離越遠(yuǎn)越容易違約,例如管理層平均年齡等指標(biāo)。
設(shè)i為第i個(gè)指標(biāo),j為第j支債券,v′ij為用于填補(bǔ)的指標(biāo)值,vij為原始指標(biāo)值,m為債券總數(shù),qi1為區(qū)間指標(biāo)的區(qū)間最小值,qi2為區(qū)間指標(biāo)的區(qū)間最大值,(qi1+qi2)/2 為區(qū)間指標(biāo)的區(qū)間的中間值。
正向指標(biāo)對(duì)于用來填補(bǔ)缺失值的數(shù)值的計(jì)算公式為
若按照公式(1)的計(jì)算結(jié)果偏離了該指標(biāo)的合理范圍,則用已知指標(biāo)值中的最小值填補(bǔ),計(jì)算公式為
例如流動(dòng)比率這一指標(biāo),永遠(yuǎn)不可能小于0,若公式(1)的計(jì)算結(jié)果小于0,則用公式(2)計(jì)算[23]。
負(fù)向指標(biāo)對(duì)于用來填補(bǔ)缺失值的數(shù)值的計(jì)算公式為
同樣,若公式(3)的計(jì)算結(jié)果偏離了該指標(biāo)的合理范圍,則用已知指標(biāo)中的最大值填補(bǔ)公式,具體如下[23]
區(qū)間指標(biāo)對(duì)于用來填補(bǔ)缺失值的數(shù)值的計(jì)算思路是計(jì)算與最優(yōu)指標(biāo)區(qū)間距離最遠(yuǎn)的那個(gè)已知指標(biāo)值,并用那個(gè)指標(biāo)值填補(bǔ),區(qū)間指標(biāo)的填補(bǔ)值的計(jì)算公式如下[23]
2) 定性指標(biāo)填補(bǔ)缺失值方法
定性指標(biāo)是指不能直接將指標(biāo)值代入數(shù)學(xué)模型進(jìn)行計(jì)算的指標(biāo),如產(chǎn)權(quán)性質(zhì)等指標(biāo)。對(duì)定性指標(biāo),填補(bǔ)缺失值的思路是將定性指標(biāo)的指標(biāo)值按類別分成不同的等級(jí),然后用最差的等級(jí)填補(bǔ)缺失值。
1.1.2 指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化
未經(jīng)過標(biāo)準(zhǔn)化的數(shù)據(jù)經(jīng)常存在三個(gè)問題,即定性指標(biāo)的非結(jié)構(gòu)化數(shù)據(jù)處理及標(biāo)準(zhǔn)化、數(shù)據(jù)存在異常值、不同指標(biāo)數(shù)據(jù)之間的量級(jí)及單位不同等,本文采用下面的方法進(jìn)行處理,將其轉(zhuǎn)換為標(biāo)準(zhǔn)化數(shù)據(jù)。
1) 定性指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化
定性指標(biāo)的非結(jié)構(gòu)化數(shù)據(jù)需要將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并將指標(biāo)值按等級(jí)劃分好的各個(gè)檔次進(jìn)行賦值。本文在賦值時(shí),根據(jù)現(xiàn)有研究的常用處理辦法,按照對(duì)結(jié)果的影響程度等距賦予[0,1]之間的值[24–25]。
2) 異常值處理
異常值處理的整體思路是將異常值進(jìn)行縮尾處理,即整個(gè)數(shù)據(jù)集的前后1%的數(shù)據(jù)視為異常值,然后將前后1%的異常值分別用最臨界的非異常值替換。
3) 指標(biāo)數(shù)據(jù)歸一化
指標(biāo)數(shù)據(jù)的歸一化是將所有指標(biāo)數(shù)據(jù)轉(zhuǎn)化為[0,1]之間的數(shù)值[26–27],不同性質(zhì)的指標(biāo)數(shù)據(jù)的歸一化方法不同,按照缺失值中指標(biāo)的分類,三類指標(biāo)的具體歸一化公式如下:
令i對(duì)應(yīng)指標(biāo),j對(duì)應(yīng)債券,xij是第j支債券第i個(gè)指標(biāo)的標(biāo)準(zhǔn)化數(shù)據(jù),vij為原始指標(biāo)數(shù)據(jù)值,m為債券總數(shù)。正向指標(biāo)數(shù)據(jù)歸一化的公式如式(6)所示,負(fù)向指標(biāo)數(shù)據(jù)歸一化的公式如式(7)所示[28–29]。
令qi1為區(qū)間指標(biāo)i的下界,qi2為區(qū)間指標(biāo)i的上界,區(qū)間指標(biāo)數(shù)據(jù)歸一化公式如式(8)所示[30–31]。
1.1.3 基于SMOTE 的非均衡樣本處理
雖然我國債券違約的數(shù)量在逐年增多,但我國債券市場(chǎng)上非違約債券的數(shù)量仍遠(yuǎn)大于違約債券。因此,債券數(shù)據(jù)是非均衡樣本,而采用非均衡樣本進(jìn)行分類預(yù)測(cè),模型的預(yù)測(cè)結(jié)果會(huì)偏向于樣本數(shù)量多的那一類,將其應(yīng)用于債券違約預(yù)測(cè),容易導(dǎo)致對(duì)違約債券識(shí)別精度降低,而違約是債券違約鑒別中更關(guān)注的問題,即為金融領(lǐng)域重點(diǎn)關(guān)注的第二類錯(cuò)誤(type II error,即將違約樣本預(yù)測(cè)為非違約樣本占總違約樣本的比例)。因此,為提高模型的預(yù)測(cè)精度和實(shí)用性,需要用有效方法解決樣本非均衡問題。
本文采用SMOTE 過采樣方法解決樣本非均衡問題,相比隨機(jī)過采樣等方法通過復(fù)制樣本來增加少數(shù)類樣本,SMOTE 過采樣通過少數(shù)類樣本的鄰近樣本合成新的少數(shù)類樣本,最后使得少數(shù)類樣本與多數(shù)類樣本的樣本數(shù)量相同,該方法得到的數(shù)據(jù)在滿足樣本數(shù)量增大的同時(shí)提高了樣本質(zhì)量。
用SMOTE 方法合成違約債券的步驟如下。
每個(gè)債券有n個(gè)指標(biāo),每個(gè)指標(biāo)數(shù)據(jù)可以通過公式(9)生成。對(duì)于每個(gè)指標(biāo)重復(fù)上述過程,得到m0?m1個(gè)新的違約債券樣本數(shù)據(jù)。
1.2.1 債券違約預(yù)警指標(biāo)體系構(gòu)建思路
本文構(gòu)建債券違約預(yù)警指標(biāo)體系的思路是在盡可能保證模型預(yù)測(cè)精度的基礎(chǔ)上,選取更精簡且具備經(jīng)濟(jì)意義完備性的指標(biāo)體系,保證模型預(yù)測(cè)的可靠性和實(shí)用性,包括指標(biāo)海選、指標(biāo)篩選和指標(biāo)體系確定等幾個(gè)步驟。
1.2.2 指標(biāo)海選
依據(jù)全面反映債券違約風(fēng)險(xiǎn)特征的指標(biāo)體系建立條件,根據(jù)債券違約風(fēng)險(xiǎn)的影響因素,參考惠譽(yù)、標(biāo)普、穆迪、中誠信等國內(nèi)外專業(yè)評(píng)級(jí)機(jī)構(gòu)的評(píng)級(jí)指標(biāo)體系,梳理國內(nèi)外經(jīng)典、高質(zhì)量文獻(xiàn)中的指標(biāo)體系以及債券違約影響因素,從多個(gè)維度進(jìn)行指標(biāo)海選。
1.2.3 基于數(shù)據(jù)可獲性的第一次指標(biāo)篩選
為保證數(shù)據(jù)的完整性以及實(shí)證部分的可行性,刪除不可獲得和極少數(shù)債券才有數(shù)據(jù)的指標(biāo),以此來確保最后保留的指標(biāo)其數(shù)據(jù)具備可獲得性。
1.2.4 基于特征選擇和違約鑒別的第二次指標(biāo)篩選
特征選擇是指在不損失特征信息的前提下,從選取的高維特征指標(biāo)中刪除信息重復(fù)和對(duì)違約鑒別影響低的指標(biāo),選擇反映預(yù)測(cè)精度好和指標(biāo)體系規(guī)模小的特征指標(biāo)集,從而降低模型復(fù)雜度,提高模型預(yù)測(cè)精度。
本文采用XGBoost 方法的指標(biāo)篩選是一種嵌入式特征選擇方法,該方法將特征選擇過程與學(xué)習(xí)器訓(xùn)練過程融為一體,二者在同一優(yōu)化過程中完成,相比其他兩類常用降維方法(過濾式和封裝式),該方法計(jì)算效率高、降維效果好且計(jì)算簡便。
1.2.5 根據(jù)計(jì)算結(jié)果反推最優(yōu)特征指標(biāo)集和預(yù)警時(shí)間窗
依據(jù)指標(biāo)體系需要同時(shí)滿足指標(biāo)體系精簡且預(yù)測(cè)精度高的指標(biāo)體系構(gòu)建條件,對(duì)采用上述方法用不同期數(shù)據(jù)計(jì)算得到的結(jié)果進(jìn)行對(duì)比分析,從違約鑒別精度和模型精簡性兩個(gè)方面,確定包含最優(yōu)特征的指標(biāo)體系,并確定違約預(yù)測(cè)最優(yōu)時(shí)間窗。
1.3.1 XGBoost 算法
本研究是根據(jù)債券違約的特征因素來對(duì)其違約狀態(tài)進(jìn)行預(yù)測(cè),選取的研究對(duì)象是我國上市公司債券,而我國債券市場(chǎng)缺少足夠的違約統(tǒng)計(jì)信息,因此,CreditRisk+、KMV 等基于大量違約統(tǒng)計(jì)信息的模型不適合本文的研究問題,而根據(jù)違約特征預(yù)測(cè)違約狀態(tài)的問題是機(jī)器學(xué)習(xí)中常見的有監(jiān)督的分類問題,通過對(duì)現(xiàn)有監(jiān)督問題的算法進(jìn)行分析,最終采用穩(wěn)定性好、預(yù)測(cè)準(zhǔn)確率高、解釋性強(qiáng)的XGBoost 算法[32],其屬于集成學(xué)習(xí)算法,是通過多個(gè)學(xué)習(xí)器來完成學(xué)習(xí)任務(wù)。相比單一學(xué)習(xí)器構(gòu)建的預(yù)警模型,集成學(xué)習(xí)將多個(gè)學(xué)習(xí)器結(jié)合起來,泛化性能更好,其中XGBoost 算法不僅計(jì)算速度快、精度高,而且在目標(biāo)函數(shù)中加入了正則項(xiàng)實(shí)現(xiàn)降維。因此,適用于債券違約預(yù)測(cè)模型的特征篩選和違約預(yù)警模型構(gòu)建。
XGBoost 的預(yù)測(cè)結(jié)果為每棵樹的預(yù)測(cè)結(jié)果之和,具體為
其中fk是每棵樹的預(yù)測(cè)結(jié)果,xi是第i個(gè)特征樣本的特征向量值。
XGBoost 算法的目標(biāo)函數(shù)為
其中l(wèi)(·)代表損失函數(shù),用來度量預(yù)測(cè)值?yi和實(shí)際值yi的差別,?是正則項(xiàng),具體為
其中g(shù)i和hi分別代表一階和二階導(dǎo)數(shù)。
考慮優(yōu)化計(jì)算中常數(shù)項(xiàng)不起作用,因此刪除常數(shù)項(xiàng),得到目標(biāo)函數(shù)
將公式(12)代入公式(15)后,得到目標(biāo)函數(shù)
令Gj=∑gi,Hj=∑hi,當(dāng)ωj=?Gj/(Hj+λ)時(shí),目標(biāo)函數(shù)的最小值為
XGBoost 的模型尋優(yōu)是通過給定參數(shù)下進(jìn)行樹分裂實(shí)現(xiàn),樹分裂點(diǎn)的計(jì)算公式為
其中Gain 代表結(jié)構(gòu)評(píng)分,其值越大,表明切分后的目標(biāo)函數(shù)值越低,GL、HL、GR和HR分別對(duì)應(yīng)節(jié)點(diǎn)分裂后左右兩邊的子樹。
1.3.2 模型評(píng)估
為驗(yàn)證模型的有效性,需要對(duì)模型進(jìn)行預(yù)測(cè)精度檢驗(yàn),綜合已有的關(guān)于違約鑒別的文獻(xiàn)[26,28,33–34],本文共引用了7 個(gè)判別精度標(biāo)準(zhǔn)對(duì)模型進(jìn)行檢驗(yàn),分別為精確率(precision)、樣本總體預(yù)測(cè)精度(accuracy)、f1分?jǐn)?shù)(f1-score)、AUC(Area Under the ROC Curve)、第一類錯(cuò)誤(type I error)、第二類錯(cuò)誤(type II error)、幾何平均值(g-mean),選取的這7 個(gè)判別精度標(biāo)準(zhǔn)不僅包含了對(duì)整體預(yù)測(cè)精度衡量,還包含對(duì)違約和非違約兩個(gè)類別預(yù)測(cè)精度的衡量。因此,可以更全面地度量模型預(yù)測(cè)精度,各項(xiàng)精度判別指標(biāo)的計(jì)算公式中涉及到的參數(shù)如表1 所示。
表1 指標(biāo)參數(shù)
精確率的計(jì)算公式
precision 的值越大表示模型判別違約的效果越好。樣本總體預(yù)測(cè)精度的計(jì)算公式
accuracy 的值越大,表示模型的預(yù)測(cè)性能越好。f1分?jǐn)?shù)的計(jì)算公式
f1-score 是精確率與召回率的調(diào)和平均,f1-score 的值越大,表示模型的預(yù)測(cè)性能越好。AUC 是ROC 曲線與X軸圍成的面積。AUC 的值越接近1,模型的判別能力越好,當(dāng)AUC 值小于0.5 時(shí),認(rèn)為模型無效[35]。第一類錯(cuò)誤的計(jì)算公式
g-mean 的值越大表明模型的預(yù)測(cè)效果越好。
2.1.1 樣本數(shù)據(jù)的選取
現(xiàn)有研究通常采用3 組違約預(yù)測(cè)時(shí)間窗,即t ?m(m= 0,1,2),m代表指標(biāo)體系中各指標(biāo)數(shù)據(jù)滯后期,即用第t ?m年的指標(biāo)數(shù)據(jù),預(yù)測(cè)債券第t年的違約狀態(tài)。
債券違約預(yù)警的目的是根據(jù)影響債券違約的特征指標(biāo)數(shù)據(jù),采用預(yù)警模型預(yù)測(cè)其未來的違約狀態(tài),而m= 0 的時(shí)間窗口無法實(shí)現(xiàn)提前預(yù)警目的。因此,本文采用滯后1 期和2 期的時(shí)間窗作為備選預(yù)警時(shí)間窗口,并通過預(yù)測(cè)結(jié)果來確定最優(yōu)時(shí)間窗。
因?yàn)橹袊鴤袌?chǎng)在2014 年才出現(xiàn)發(fā)生實(shí)質(zhì)性違約的債券,因此,本文所選取的債券樣本為2012~2020 年上市公司發(fā)行的在市債券,包括公司債和金融債。
2.1.2 樣本數(shù)據(jù)的來源
本文從國泰安數(shù)據(jù)庫獲取2012 年1 月至2020 年12 月的中國債券基本信息數(shù)據(jù)以及發(fā)債主體的財(cái)務(wù)數(shù)據(jù)和發(fā)債主體的非財(cái)務(wù)數(shù)據(jù),從銳思數(shù)據(jù)庫獲取債券違約數(shù)據(jù),從中國經(jīng)濟(jì)社會(huì)大數(shù)據(jù)研究平臺(tái)獲取宏觀環(huán)境數(shù)據(jù)。初始指標(biāo)池共提取615 個(gè)指標(biāo),其中包含發(fā)債主體財(cái)務(wù)指標(biāo)375 個(gè),發(fā)債主體非財(cái)務(wù)指標(biāo)178 個(gè),債券基本信息指標(biāo)58 個(gè),宏觀指標(biāo)4 個(gè),其中指標(biāo)數(shù)據(jù)為2012~2020 年,違約狀態(tài)為2013~2021 年。
2.2.1 構(gòu)建t ?m時(shí)間窗口樣本
根據(jù)2.1.1 節(jié)的分析可知,本文選取的樣本的違約預(yù)警時(shí)間窗分別為t ?1 年和t ?2 年,其中t ?1 年包含45 878 支債券,t ?2 年包含13 671 支債券。
2.2.2 原始數(shù)據(jù)預(yù)處理及標(biāo)準(zhǔn)化
將原始數(shù)據(jù)進(jìn)行填補(bǔ)缺失值的預(yù)處理,然后將處理后的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(異常值處理和歸一化)。在填補(bǔ)缺失值時(shí),從控制風(fēng)險(xiǎn)的角度出發(fā),用指標(biāo)樣本中的最差值填補(bǔ)缺失的指標(biāo)值,采用公式(1)~(5)來進(jìn)行缺失值填補(bǔ)。采用前后1%的縮尾來完成異常值處理。采用公式(6)~(8)來進(jìn)行指標(biāo)數(shù)據(jù)歸一化。
2.2.3 基于SMOTE 方法的非均衡樣本處理
根據(jù)1.1.3 介紹的SMOTE 方法,對(duì)于每個(gè)t ?m(m=1,2)年時(shí)間窗口樣本進(jìn)行非平衡數(shù)據(jù)處理,保證樣本中的違約樣本總數(shù)與非違約樣本總數(shù)達(dá)到1:1,即得到違約狀態(tài)均衡的樣本。本文采用Python 語言編程,實(shí)現(xiàn)非平衡樣本處理過程,經(jīng)過SMOTE 處理前后的樣本數(shù)如表2 所示。
表2 經(jīng)過SMOTE 處理前后的樣本數(shù)
2.2.4 樣本數(shù)據(jù)劃分
本文將經(jīng)過SMOTE 處理后的樣本經(jīng)過兩次劃分,劃分為訓(xùn)練樣本,驗(yàn)證樣本和測(cè)試樣本。第一次劃分:劃分初始訓(xùn)練樣本與測(cè)試樣本。將樣本按照初始訓(xùn)練樣本和測(cè)試樣本為8 : 2 的比例進(jìn)行隨機(jī)劃分,為了保證隨機(jī)劃分的樣本保持類別均衡,在該過程采用分層隨機(jī)抽樣。為了避免隨機(jī)抽樣結(jié)果的不穩(wěn)定,共進(jìn)行5 次抽樣,得到5 組初始訓(xùn)練樣本與測(cè)試樣本。第二次劃分:將第一次劃分得到的初始訓(xùn)練樣本按照十折交叉驗(yàn)證的方法進(jìn)行樣本劃分并應(yīng)用于XGBoost 模型訓(xùn)練,即占總樣本80%的初始訓(xùn)練樣本劃分為樣本量為9 : 1 的新的訓(xùn)練樣本與驗(yàn)證樣本,而占總樣本20%的測(cè)試樣本不加入模型訓(xùn)練,只用于模型精度檢驗(yàn)。
跟所有樣本都參加十折交叉驗(yàn)證相比,本文的測(cè)試集沒有影響模型訓(xùn)練。因此,測(cè)試精度更能反映預(yù)測(cè)模型的泛化能力。
2.3.1 基于數(shù)據(jù)可獲性的第一次指標(biāo)篩選
刪除不可獲得和極少數(shù)債券才有數(shù)據(jù)的指標(biāo)。第一次指標(biāo)篩選從初始的615 個(gè)指標(biāo)中刪除了358 個(gè)指標(biāo),保留了257 個(gè)指標(biāo)。第一次指標(biāo)篩選結(jié)果如表3 所示。
表3 第一次指標(biāo)篩選結(jié)果
2.3.2 基于特征選擇和違約鑒別的第二次指標(biāo)篩選
在本部分,首先基于網(wǎng)格搜索法確定超參數(shù),然后根據(jù)不同時(shí)間窗的預(yù)測(cè)精度和降維效果確定指標(biāo)體系,完成指標(biāo)第二次篩選。
1) 網(wǎng)格搜索法
網(wǎng)格搜索法[36]是指將指定的參數(shù)進(jìn)行枚舉,通過將評(píng)估函數(shù)中的參數(shù)進(jìn)行交叉驗(yàn)證得到最優(yōu)參數(shù)的算法。具體操作時(shí),把需要優(yōu)化的參數(shù)取值規(guī)定在一定范圍內(nèi)并劃分成網(wǎng)格,這樣之后遍歷網(wǎng)格內(nèi)所有的取值,然后依次將這些數(shù)據(jù)放入分類器中進(jìn)行訓(xùn)練,并采用交叉驗(yàn)證法對(duì)參數(shù)的表現(xiàn)進(jìn)行評(píng)估,在遍歷了所有參數(shù)組合之后,比較訓(xùn)練集分類的準(zhǔn)確率,找到分類效果最好的那組參數(shù)組合。
本文采用的是網(wǎng)格搜索與十折交叉驗(yàn)證相結(jié)合的方法尋找XGBoost 模型的最優(yōu)超參數(shù),得到的最優(yōu)超參數(shù)具體見表4。
表4 XGBoost 參數(shù)說明
2) 指標(biāo)體系確定
根據(jù)計(jì)算結(jié)果,分別對(duì)t ?1 期和t ?2 期的最優(yōu)指標(biāo)體系進(jìn)行對(duì)比分析,其中t ?1 期時(shí)間窗的預(yù)測(cè)結(jié)果最好,根據(jù)t ?1 年時(shí)間窗數(shù)據(jù)得到第二次指標(biāo)篩選結(jié)果如表5 所示。
表5 t ?1 年第二次指標(biāo)篩選結(jié)果
從表5 可以看出,經(jīng)過第二次篩選得到的評(píng)價(jià)指標(biāo)對(duì)應(yīng)金融界普遍認(rèn)可的5C 原則,即品質(zhì)、能力、資本、擔(dān)保和環(huán)境,證明本文得到的指標(biāo)體系在經(jīng)濟(jì)意義上符合業(yè)界共識(shí),可為投資者和監(jiān)管部門提供決策和監(jiān)管參考,具有經(jīng)濟(jì)意義。
本部分首先計(jì)算混淆矩陣的相關(guān)指標(biāo),然后根據(jù)混淆矩陣計(jì)算其他7 個(gè)精度指標(biāo),根據(jù)預(yù)測(cè)結(jié)果得到的最優(yōu)預(yù)測(cè)時(shí)間窗為t ?1。因此,本部分只給出根據(jù)t ?1 年指標(biāo)得到的最優(yōu)預(yù)測(cè)精度,對(duì)不同時(shí)間窗和不同模型的7 個(gè)精度指標(biāo)對(duì)比見本文的2.5。
在t ?1 年根據(jù)模型訓(xùn)練組(訓(xùn)練集和驗(yàn)證集)的預(yù)測(cè)情況,計(jì)算得到混淆矩陣如表6。根據(jù)表6 的混淆矩陣,采用公式(19)~(24),計(jì)算得到債券違約鑒別模型訓(xùn)練組的精度,其中precision = 97.24%, acc = 98.28%,f1-score = 98.30%, AUC = 99.69%, type I error=2.82%, type II error=0.63%,g-mean=98.27%。
表6 訓(xùn)練組混淆矩陣
顯然,不論是模型總體的鑒別精度,還是對(duì)違約和非違約債券的鑒別精度,均在97.1%以上,說明模型對(duì)債券的違約鑒別能力較強(qiáng)。
根據(jù)訓(xùn)練得到的模型,采用t ?1 年測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),得到測(cè)試集混淆矩陣如表7 所示。
表7 測(cè)試集混淆矩陣
根據(jù)測(cè)試集混淆矩陣,采用公式(19)~(24),計(jì)算得到債券違約鑒別模型測(cè)試集的精度,其中precision=97.58%, acc=98.45%,f1-score=98.47%, AUC=99.75%, type I error=2.47%, type II error=0.62%,g-mean=98.45%。
綜上可見,不論是模型總體的鑒別精度,還是對(duì)違約和非違約債券的鑒別精度,均在97.5%以上,說明本文構(gòu)建的違約預(yù)警模型對(duì)債券的違約鑒別能力較強(qiáng)。
下面從不同時(shí)間窗和不同模型的預(yù)測(cè)精度兩個(gè)方面進(jìn)行對(duì)比分析,確定最優(yōu)債券違約預(yù)測(cè)模型和違約預(yù)警時(shí)間窗。
2.5.1 不同時(shí)間窗的對(duì)比分析
綜合考慮預(yù)測(cè)精度和指標(biāo)體系精簡度,確定最優(yōu)債券違約預(yù)測(cè)模型和最優(yōu)預(yù)警時(shí)間窗。表8 和表9 給出了t?1 和t?2 時(shí)間窗分別對(duì)應(yīng)的最優(yōu)預(yù)測(cè)模型的計(jì)算結(jié)果,其中指標(biāo)體系規(guī)模對(duì)比如表8 所示,測(cè)試樣本精度如表9 所示。為方便計(jì)算平均精度,在表9 中將所有評(píng)估指標(biāo)均轉(zhuǎn)化為正向指標(biāo),即精度越高代表預(yù)測(cè)效果越好,即對(duì)表9 第6 行第3 列的type I error,在t ?1 期的負(fù)向評(píng)估指標(biāo)值2.47%,轉(zhuǎn)換后變?yōu)?7.53%,代表type I error 在t ?1 期的正向評(píng)估指標(biāo)值。
表8 各時(shí)間窗最優(yōu)指標(biāo)體系的指標(biāo)個(gè)數(shù)
表9 各時(shí)間窗最優(yōu)小組的測(cè)試集精度對(duì)比(%)
根據(jù)表8 可知,t ?1 期的指標(biāo)個(gè)數(shù)為55,t ?2 期的指標(biāo)個(gè)數(shù)為75,因此t ?1 期的指標(biāo)體系規(guī)模小于t ?2 期,該指標(biāo)體系更精簡。
根據(jù)表9 可知,t ?1 期所有評(píng)估指標(biāo)的精度均優(yōu)于t ?2 期,因此t ?1 期的預(yù)測(cè)精度要好于t ?2 期。
綜合表8 和表9 的計(jì)算結(jié)果可知,當(dāng)時(shí)間窗口為t ?1 期時(shí),模型預(yù)測(cè)精度高且指標(biāo)體系規(guī)模小,可以作為最優(yōu)債券違約預(yù)警時(shí)間窗。
2.5.2 不同模型違約預(yù)測(cè)結(jié)果的對(duì)比分析
本部分選取7 個(gè)在違約鑒別領(lǐng)域常用的分類模型,從指標(biāo)體系規(guī)模、預(yù)測(cè)精度和計(jì)算時(shí)間三個(gè)方面,進(jìn)行模型預(yù)測(cè)對(duì)比分析。具體采用的模型為邏輯回歸(Logistic Regression, LG)[37]、支持向量機(jī)(Support Vector Machine, SVM)[38]、Adaboost(Adaptive Boosting, Ada)[39]、隨機(jī)森林(Random Forest, RF)[35]、線性判別模型(Linear Discriminate Analysis, LDA)[40]、樸素貝葉斯(Naive Bayes, NB)[41]、隨機(jī)梯度下降(Stochastic Gradient Descent, SGD)[42]。
指標(biāo)規(guī)模對(duì)比分析結(jié)果如表10 所示,表10 的指標(biāo)體系規(guī)模排名是將指標(biāo)體系規(guī)模由小及大排名的,即指標(biāo)體系規(guī)模越小越靠前。
表10 各模型指標(biāo)體系規(guī)模對(duì)比
從指標(biāo)體系的規(guī)模進(jìn)行對(duì)比分析。觀察表10 可以發(fā)現(xiàn),XGBoost 的指標(biāo)個(gè)數(shù)為55,是所有對(duì)比模型中指標(biāo)個(gè)數(shù)最少的,因此XGBoost 是降維效果最好的模型。
精度對(duì)比分析結(jié)果如表11 所示,表11 的每一個(gè)評(píng)估指標(biāo)對(duì)應(yīng)兩行數(shù)據(jù),第一行為模型精度指標(biāo),第二行為該精度指標(biāo)在8 個(gè)模型中的排名,序號(hào)越小精度越好;type I error 和type II error 中分別包含了這兩個(gè)指標(biāo)的正向和負(fù)向精度及排名,type I error 和type II error 正向精度的計(jì)算方式同2.5.1。
表11 各模型精度對(duì)比(%)
從模型違約鑒別精度進(jìn)行對(duì)比分析。觀察表11 可以發(fā)現(xiàn),XGBoost 的精度檢驗(yàn)結(jié)果都較好,平均精度最高。
表12 為各模型的運(yùn)行時(shí)間對(duì)比,第一行為計(jì)算時(shí)間,第二行為排序,當(dāng)時(shí)間越短,排序越靠前。
表12 各模型計(jì)算時(shí)間對(duì)比
從模型運(yùn)行時(shí)間的角度進(jìn)行對(duì)比分析。觀察表12 發(fā)現(xiàn),XGBoost 的運(yùn)行時(shí)間雖然比大部分非集成學(xué)習(xí)的單一算法要長,但是卻比其他集成學(xué)習(xí)(Ada 和RF)的計(jì)算時(shí)間短。
綜合表10~12 的計(jì)算結(jié)果可以看出,雖然XGBoost 的計(jì)算時(shí)間略高與NB、SVM 等單學(xué)習(xí)器模型,但是XGBoost 在指標(biāo)體系規(guī)模和精度上要明顯占優(yōu);且同集成學(xué)習(xí)的算法相比,無論是計(jì)算精度、降維效果還是計(jì)算時(shí)間,XGBoost 都優(yōu)于RF 和Ada。因此,綜合違約預(yù)警指標(biāo)體系精簡度、預(yù)測(cè)精度、計(jì)算時(shí)間三個(gè)方面,XGBoost 模型的綜合表現(xiàn)最好,是實(shí)現(xiàn)債券違約預(yù)警的有效算法。
本文選取的對(duì)比模型中沒有使用當(dāng)前比較流行的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)(如ChatGPT 采用的Transformer),一是從模型的可解釋性角度來講,以Transformer 為代表的大模型依賴大量數(shù)據(jù)實(shí)現(xiàn)參數(shù)優(yōu)化,訓(xùn)練過程為黑箱,導(dǎo)致了模型的可解釋性較差,而金融領(lǐng)域中的債券違約預(yù)警,在考慮預(yù)警精度的同時(shí),也要考慮模型的經(jīng)濟(jì)可解釋性,只有具有可解釋性的模型才能支持債券風(fēng)險(xiǎn)管控,從這個(gè)角度來說,基于XGBoost 構(gòu)建的違約預(yù)警模型比基于Transformer 的深度學(xué)習(xí)大模型更具有優(yōu)勢(shì);二是從模型的工作效率上來講,基于Transformer 的大模型參數(shù)太多,存在對(duì)樣本需求量太大、模型訓(xùn)練時(shí)間長、硬件成本高等弊端,對(duì)基于特征指標(biāo)體系進(jìn)行違約預(yù)警的問題并不適用,且本文基于XGBoost 訓(xùn)練得到模型已經(jīng)達(dá)到較高的預(yù)測(cè)精度。因此,在有限樣本條件下,本文構(gòu)建預(yù)警模型的方法效率更高。
下面,本文根據(jù)得到的最優(yōu)違約預(yù)警模型,計(jì)算該模型對(duì)應(yīng)的特征指標(biāo)權(quán)重,以確定各特征的重要性,特征指標(biāo)的重要性程度計(jì)算結(jié)果如表13 所示。
表13 特征指標(biāo)的重要性
由表13 可知,特征指標(biāo)的權(quán)重是歸一化的,可以直觀地了解各個(gè)指標(biāo)的重要程度,不僅證明了XGBoost 算法具有可解釋性,還使本文所選取的指標(biāo)體系經(jīng)濟(jì)意義更明確,這也是該方法得到的模型相比其他方法的模型(特別是深度學(xué)習(xí)模型)在債券投資和風(fēng)險(xiǎn)管理上的重要優(yōu)勢(shì)。
本文所提出的基于t ?1 期的債券違約預(yù)警時(shí)間窗符合預(yù)測(cè)精度高和指標(biāo)體系精簡的目標(biāo),相比現(xiàn)有研究人為設(shè)定預(yù)警時(shí)間窗更合理。本文以預(yù)測(cè)精度高且指標(biāo)體系規(guī)模小為目標(biāo)反推最優(yōu)債券違約預(yù)警時(shí)間窗,經(jīng)過多個(gè)時(shí)間窗的精度以及指標(biāo)體系規(guī)模的對(duì)比發(fā)現(xiàn),t ?1 期的債券違約預(yù)警效果最好,即滯后一期是指標(biāo)數(shù)據(jù)的最優(yōu)預(yù)警時(shí)間窗。
本文所提出的指標(biāo)體系相較于現(xiàn)有研究有較大改進(jìn),所涵蓋的信息更完備,且符合金融界認(rèn)可的5C 原則。本文所提出的指標(biāo)體系不僅涵蓋了發(fā)債主體內(nèi)部財(cái)務(wù)指標(biāo)、非財(cái)務(wù)指標(biāo),還包括外部宏觀指標(biāo)和債券基本信息。相比現(xiàn)有研究,本文選取的最優(yōu)模型比現(xiàn)有的指標(biāo)體系在財(cái)務(wù)指標(biāo)上增加了“長期借款與總資產(chǎn)比”、“應(yīng)收賬款與收入比”等指標(biāo);在非財(cái)務(wù)指標(biāo)上增加了“兩權(quán)分離率”、“產(chǎn)權(quán)性質(zhì)”等指標(biāo);在外部宏觀指標(biāo)上增加了“所在省城鎮(zhèn)居民家庭人均可支配收入”;在債券基本信息上增加了“可回售性”等指標(biāo)。篩選后建立的指標(biāo)體系符合5C 原則,經(jīng)濟(jì)意義合理。
本文采用XGBoost 算法,在保證違約鑒別精度的同時(shí)對(duì)指標(biāo)體系起到降維的效果,并給出關(guān)鍵因素重要性程度。經(jīng)與7 個(gè)在違約鑒別領(lǐng)域較為常用的分類模型比較,本文的模型相較于其他模型具有降維效果好、計(jì)算速度快、穩(wěn)定性好以及可解釋性強(qiáng)的特點(diǎn)。