王曉菲 劉繼端 詹梓雯 劉彥清 張燕玲 周燕
作者簡介:王曉菲(1993— ),女,漢族,廣東廣州人。主要研究方向:企業(yè)信用管理。
摘 要:由于房地產(chǎn)企業(yè)是屬于高負(fù)債企業(yè),對財(cái)務(wù)金融杠桿的依賴性極高,具有長周期性等高風(fēng)險特征。再加上如今國家宏觀調(diào)控緊、地方微觀調(diào)控嚴(yán),房地產(chǎn)企業(yè)步入了資金收緊、盈利減少的階段,面臨難融資、融資少的問題,導(dǎo)致房地產(chǎn)企業(yè)風(fēng)險進(jìn)一步放大,阻礙了房地產(chǎn)企業(yè)的發(fā)展。所以,房地產(chǎn)企業(yè)要想持續(xù)發(fā)展,就要加強(qiáng)風(fēng)險管控和防范。本文通過專業(yè)的信用管理知識將機(jī)器學(xué)習(xí)AI模型與傳統(tǒng)信用風(fēng)險度量模型結(jié)合來度量房地產(chǎn)企業(yè)的信用違約風(fēng)險。因?yàn)闄C(jī)器學(xué)習(xí)AI模型能夠補(bǔ)充傳統(tǒng)信用風(fēng)險度量模型在財(cái)務(wù)數(shù)據(jù)方面外的空白,而傳統(tǒng)信用風(fēng)險度量模型能夠通過其在金融領(lǐng)域的研究經(jīng)驗(yàn)為機(jī)器學(xué)習(xí)提供研究方向,所有將兩者進(jìn)行結(jié)合能通過多角度對房地產(chǎn)企業(yè)的信用違約風(fēng)險進(jìn)行更加精準(zhǔn)的度量。
關(guān)鍵詞:機(jī)器學(xué)習(xí);房地產(chǎn);風(fēng)險度量;模型融合
中國的房地產(chǎn)行業(yè)經(jīng)歷幾十年的發(fā)展,已經(jīng)成為國民經(jīng)濟(jì)和金融體系中不可或缺的一部分。房地產(chǎn)企業(yè)在這個過程中也在不斷調(diào)整和改變,但房地產(chǎn)企業(yè)高負(fù)債和長周期的經(jīng)營模式一直是房地產(chǎn)企業(yè)的一個特點(diǎn)。高負(fù)債和長周期的經(jīng)營模式不但帶來了高杠桿、高回報,也帶來了高風(fēng)險。而企業(yè)風(fēng)險度量一直是當(dāng)前不斷探索和解決的問題,尤其是房地產(chǎn)企業(yè)。但當(dāng)前企業(yè)使用的風(fēng)險度量模型還是基于傳統(tǒng)的一些風(fēng)險度量模型,比如KMV、Z模型、CreditVaR系列模型等,而傳統(tǒng)風(fēng)險度量模型由于年限較長,再加上大部分來自于國外學(xué)者研究,對當(dāng)今復(fù)雜多變的市場度量信用風(fēng)險時,難免會有較大的偏差。本文將大數(shù)據(jù)技術(shù)和機(jī)器學(xué)習(xí)AI技術(shù)與傳統(tǒng)的風(fēng)險度量模型結(jié)合,從而打破僅僅通過財(cái)務(wù)數(shù)據(jù)的單一角度來度量風(fēng)險的傳統(tǒng)思維,使用更新、更多角度、更與時俱進(jìn)的方法和思維來設(shè)計(jì)和打造出適用于當(dāng)下市場環(huán)境的風(fēng)險度量模型。
一、信用違約風(fēng)險建模
本文采用的算法模型有遺傳算法、KMV模型、LGB模型、SnowNLP模型、LR回歸模型,其中遺傳算法模型負(fù)責(zé)解出最優(yōu)解;KMV模型作為傳統(tǒng)風(fēng)險度量模型負(fù)責(zé)解出企業(yè)違約概率和違約距離;LGB模型和LR回歸模型負(fù)責(zé)擬合樣本數(shù)據(jù),對樣本進(jìn)行預(yù)測分類;SnowNLP模型負(fù)責(zé)對文本數(shù)據(jù)進(jìn)行情感分析。根據(jù)以上四個模型,進(jìn)行風(fēng)險度量建模。
(一)遺傳算法KMV模型
首先,采用遺傳算法對全國所有行業(yè)的上市公司訓(xùn)練出適合我國國情的KMV模型,即訓(xùn)練出適合我國國情的長期負(fù)債系數(shù)和短期負(fù)債系數(shù)。
在適合中國國情的KMV模型中,其短期負(fù)債系數(shù)和長期負(fù)債系數(shù)分別為0.948和0.264。根據(jù)遺傳算法訓(xùn)練出來的KMV模型簡稱為“QG_KMV”模型,本文通過QG_KMV模型去度量全國109個行業(yè)的信用違約風(fēng)險。
由于房地產(chǎn)行業(yè)高負(fù)債的特點(diǎn),導(dǎo)致應(yīng)用QG_KMV模型度量房地產(chǎn)行業(yè)風(fēng)險時,房地產(chǎn)的違約風(fēng)險偏高,所以本文將放棄使用全國所有行業(yè)的上市公司去訓(xùn)練KMV模型,而改用全國所有房地產(chǎn)行業(yè)的上市公司去訓(xùn)練KMV模型,如圖1所示:
從圖 1中可知,利用全國所有房地產(chǎn)行業(yè)的上市公司訓(xùn)練KMV模型訓(xùn)練出的短期負(fù)債系數(shù)和長期負(fù)債系數(shù)分別為0.0438和0.0783,本文將該模型簡稱為“FDC_KMV”模型。
通過“FDC_KMV”模型計(jì)算出各行業(yè)違約概率如下:
由圖 2中可知,相較之前的KMV模型,“FDC_KMV”模型在房地產(chǎn)企業(yè)的平均違約距離和概率大幅下降,信用等級從D上升到A,更加適用于房地產(chǎn)企業(yè),且全國地產(chǎn)的信用等級明顯優(yōu)于區(qū)域地產(chǎn)。
(二)LGB_KMV模型
同時通過將機(jī)器學(xué)習(xí)LIGHTGBM模型與KMV模型結(jié)合,采取全國3541家上市公司(其中3355家非ST公司和186家ST公司)作為訓(xùn)練數(shù)據(jù)。其中ST公司是指連續(xù)兩年虧損或者凈資產(chǎn)低于股票面值的公司,非ST則相反。但由于兩類公司數(shù)量不一致,導(dǎo)致數(shù)據(jù)不平衡,經(jīng)過SMOTE算法進(jìn)行上采樣之后,共計(jì)6710條數(shù)據(jù)樣本,其中包含ST公司和非ST公司樣本各3355條。
圍繞著這6710條數(shù)據(jù)樣本進(jìn)行建模,將數(shù)據(jù)集以8:2的比例切分為訓(xùn)練集和測試集,采用的數(shù)據(jù)特征有流動負(fù)債、非流動負(fù)債、總市值、收益率波動率、總負(fù)債,以及通過KMV模型計(jì)算得出的違約距離及違約概率。同時將樣本數(shù)據(jù)特征分為兩組,一組是加入KMV模型計(jì)算出來的違約概率和違約距離特征,稱為LGB模型;另一組是沒有加入KMV模型計(jì)算出來的違約概率和違約距離特征,稱為LGB_KMV模型。通過對兩組數(shù)據(jù)進(jìn)行建模分析。LGB_KMV模型在測試數(shù)據(jù)集中的表現(xiàn)優(yōu)于LGB模型,其中LGB_KMV模型預(yù)測的準(zhǔn)確度達(dá)88%,而LBG模型的準(zhǔn)確度為83.9%,所以融合了KMV模型之后的LGB_KMV模型比沒有融合KMV模型的LGB模型準(zhǔn)確度提高了4.1%。
(三)SNOWNLP模型
通過python的SNOWNLP自然語言情感分析庫對房地產(chǎn)上市公司公告進(jìn)行情感分析,對每一年中發(fā)布的每一條上市公司公告進(jìn)行打分,分值為[0-1],其中得分越接近1,說明該公告攜帶的信息表現(xiàn)為越積極,反之,得分越接近0,說明該公告攜帶的信息表現(xiàn)為越消極,將公告得分大于0.5分判斷為積極公告,小于0.5分判斷為消極公告,等于0.5分的判斷為中立公告。
以萬科2020年公告做一個情感判斷為例,結(jié)果如圖 3所示:
如圖 3所示,SNOWNLP模型能夠?qū)γ織l公告信息進(jìn)行一個情感分析并且進(jìn)行情感評分。
(四)LGB_LR模型
股市是一個消息市,股票市場中股民會參考公司披露的公告信息來投資股票,所以上市公司的公司公告發(fā)布會對股價造成一定程度的影響,股價的變動會影響公司的市值。正如KMV模型中通過公司的市值,從而計(jì)算出公司的價值來度量風(fēng)險,那么公司的股票價格的變動就會與公司的風(fēng)險相關(guān)聯(lián)。
將公告的文本信息進(jìn)行數(shù)據(jù)處理,再采用詞嵌入的方法,即應(yīng)用TF_IDF方案。TF是指單詞詞頻,即一個詞在文章中出現(xiàn)的頻率,從客觀的角度出發(fā)一些詞出現(xiàn)的頻率越高,說明這個詞的重要性可能是比較高的。IDF是指逆文本頻率,即該詞越少越能代表該篇文章,因?yàn)橐黄恼轮锌赡苡写蠖嗟慕樵~或者代詞,這些詞都沒有特別大的意義,例如‘的、‘將、‘通過、‘你、‘我、‘他等等詞語。將處理后的公告信息通過LGB_LR模型進(jìn)行預(yù)測出下一天股價的變化趨勢。
二、風(fēng)險量化
綜上,本文將通過定量的方法,對房地產(chǎn)行業(yè)中的10家房地產(chǎn)企業(yè)風(fēng)險進(jìn)行量化處理,其中包括5家ST公司,5家非ST公司。將引入一個信用風(fēng)險值,這個值涵蓋各個模型所得結(jié)果及影響因素。通過信用風(fēng)險值來衡量房地產(chǎn)公司的風(fēng)險大小,信用風(fēng)險值與信用風(fēng)險成正比關(guān)系。
信用風(fēng)險值的計(jì)算公式如下:
其中和分別為KMV模型輸出的違約概率和違約距離,為LGB_KMV模型的準(zhǔn)度,為LGB_KMV模型預(yù)測值,為LGB_LR模型的準(zhǔn)度,為LGB_LR模型預(yù)測值,為SNOWNLP模型輸出的情緒值,常數(shù)項(xiàng)1.7147是違約距離的臨界值。
Sigmoid函數(shù)計(jì)算公式如下:
Sigmoid函數(shù)能夠?qū)⑦B續(xù)變量映射到(0,1)范圍內(nèi),0.5為企業(yè)違約的閾值,風(fēng)險值達(dá)到0.5表明企業(yè)可能發(fā)生違約事件,風(fēng)險值越接近1表明發(fā)生違約事件的可能性越高。本文中的風(fēng)險等級分為低風(fēng)險、中低風(fēng)險、中高風(fēng)險、高風(fēng)險四個等級,對應(yīng)的信用風(fēng)險值為(0,0.25]、[0.25,0.5]、[0.5,0.75],[0.75,1)。
通過4個模型的輸出結(jié)果,進(jìn)行計(jì)算10家房地產(chǎn)企業(yè)的信用風(fēng)險值的大小,如表 1所示:
如表1所示,通過對比ST和非ST兩類企業(yè)信用風(fēng)險值可知,本文的模型能夠更加具體的度量出兩類企業(yè)的信用風(fēng)險值,并且ST企業(yè)的信用風(fēng)險值明顯高于非ST企業(yè)。
通過兩類企業(yè)的對比,驗(yàn)證了本文模型在房地產(chǎn)企業(yè)的信用風(fēng)險度量上的效果,證實(shí)了本文模型的可信度。
三、結(jié)語
本文主要研究房地產(chǎn)公司信用風(fēng)險的度量,主要研究結(jié)果和結(jié)論如下所示:
(1)從度量結(jié)果可知,ST房地產(chǎn)企業(yè)的信用風(fēng)險值屬于中高、高風(fēng)險區(qū)域,違約可能性大,相比之下非ST房地產(chǎn)企業(yè)的信用風(fēng)險值屬于中低、低風(fēng)險區(qū)域,履約能力較強(qiáng)。
(2)加入傳統(tǒng)風(fēng)險度量模型能夠提高機(jī)器學(xué)習(xí)預(yù)測的準(zhǔn)確率,在本文中準(zhǔn)確率提高了4.1%。
(3)傳統(tǒng)的KMV模型不適用于房地產(chǎn)行業(yè)。
(4)“全國地產(chǎn)”行業(yè)信用水平高于“區(qū)域地產(chǎn)”行業(yè)。
參考文獻(xiàn):
[1]馮雅情.基于改進(jìn)的KMV-LBGoost的信用債風(fēng)險度量[D].2020.
[2]王慧,張國君.KMV模型在我國上市房地產(chǎn)企業(yè)信用風(fēng)險度量中的應(yīng)用[J].經(jīng)濟(jì)問題,2018(03):36-40.
[3]袁琦富.基于Logistic模房地產(chǎn)上市公司違約風(fēng)險度量研究[D].天津財(cái)經(jīng)大學(xué),2018.
[4]潘義.我國上市公司信用風(fēng)險度量研究[D].安徽工業(yè)大學(xué),2010.
[5]余佳坤.制造業(yè)上市公司信用違約風(fēng)險度量[D].山東大學(xué),2020.
[6]周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016:12-16.
[7]邱偉棟.基于LightGBM模型的P2P網(wǎng)貸違約預(yù)測研究[D].江西財(cái)經(jīng)大學(xué),2020:6.
[8]羅欣.中國房地產(chǎn)市場融資現(xiàn)狀分析[J].現(xiàn)代商業(yè),2011(33):48-49.
[9]高國華.嚴(yán)調(diào)控趨勢下房企信用風(fēng)險分析[J].債券,2017(07):61-66.
[10]劉君紅.我國房地產(chǎn)行業(yè)信用風(fēng)險評價研究[D].北京交通大學(xué),2012.
[11]劉敏.基于判別分析法的房地產(chǎn)企業(yè)信用風(fēng)險度量研究[J].財(cái)會通訊,2013(20):107-108.