陳藝云
(華南理工大學(xué) 經(jīng)濟(jì)與金融學(xué)院,廣東 廣州 510006)
融資難一直是困擾中小企業(yè)發(fā)展的焦點(diǎn)問題,究其根源還是在于信息不對稱,資金提供方難以獲得充分有效的信息來準(zhǔn)確評價(jià)中小企業(yè)的信用風(fēng)險(xiǎn)。在我國經(jīng)濟(jì)步入新常態(tài)、增長速度放緩的背景下,企業(yè)經(jīng)營業(yè)績開始下滑,違約事件頻發(fā),而實(shí)力弱、風(fēng)險(xiǎn)高、信息透明度低的中小企業(yè)更是首當(dāng)其沖,信用風(fēng)險(xiǎn)對我國金融市場的穩(wěn)定和宏觀經(jīng)濟(jì)的可持續(xù)發(fā)展提出了嚴(yán)峻挑戰(zhàn)。以往對企業(yè)信用風(fēng)險(xiǎn)評價(jià)的量化分析大多是以財(cái)務(wù)數(shù)據(jù)、市場交易數(shù)據(jù)等定量信息為基礎(chǔ)的,往往會(huì)導(dǎo)致違約概率與信用價(jià)差的低估而產(chǎn)生“信用價(jià)差之謎”,這可能是公開信息不完全導(dǎo)致的[1],但實(shí)際上這些基于定量數(shù)據(jù)的研究對公開信息的分析并不充分,只注重對財(cái)務(wù)數(shù)據(jù)、市場交易數(shù)據(jù)等定量信息的分析,而沒有考慮公開的各種定性信息,如企業(yè)的信息披露、新聞媒體報(bào)道、論壇和微博的在線評論等,標(biāo)準(zhǔn)普爾早在2003年就指出為傳統(tǒng)研究忽視的定性信息中包含著區(qū)分信用風(fēng)險(xiǎn)的重要信息[2]。大數(shù)據(jù)時(shí)代的到來為準(zhǔn)確評價(jià)和管理信用風(fēng)險(xiǎn)帶來了海量信息和更先進(jìn)的技術(shù)和方法,通過對互聯(lián)網(wǎng)海量文本內(nèi)容的分析來發(fā)掘更多有價(jià)值的信息以準(zhǔn)確預(yù)測中小企業(yè)的財(cái)務(wù)困境,對于有效防范信用危機(jī)和債務(wù)危機(jī)具有重要的理論和現(xiàn)實(shí)意義。
由于財(cái)務(wù)報(bào)表直接反映了企業(yè)的經(jīng)營情況和財(cái)務(wù)狀況,因而可以財(cái)務(wù)比率等會(huì)計(jì)信息為基礎(chǔ),采用單變量與多元判別分析、定性響應(yīng)模型、聚類分析和K近鄰判別分析等非參數(shù)統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等人工智能方法等方法尋找對財(cái)務(wù)困境有重要解釋力的變量,評估這些變量的顯著性,構(gòu)建評價(jià)模型來確定分類規(guī)則[3,4]。會(huì)計(jì)信息已成為財(cái)務(wù)困境預(yù)測和信用風(fēng)險(xiǎn)評價(jià)的重要基礎(chǔ),但許多研究都表明基于會(huì)計(jì)信息的信用風(fēng)險(xiǎn)量化分析會(huì)受諸多因素的影響[5],如會(huì)計(jì)信息作為歷史信息不足以用來判斷企業(yè)未來的經(jīng)營狀況和財(cái)務(wù)狀況,穩(wěn)健性和歷史成本原則會(huì)導(dǎo)致對企業(yè)資產(chǎn)價(jià)值的低估,會(huì)受到企業(yè)盈余管理行為的影響,以及難以考慮企業(yè)資產(chǎn)價(jià)值波動(dòng)性的影響等,特別是對于信息不對稱問題嚴(yán)重、信息透明度差的中小企業(yè)而言,會(huì)計(jì)信息的可靠性不足。
以會(huì)計(jì)信息來分析企業(yè)的信用風(fēng)險(xiǎn)缺乏理論基礎(chǔ),難以解釋企業(yè)的違約原因,而證券市場的交易價(jià)格可以用來衡量企業(yè)資產(chǎn)的價(jià)值及波動(dòng)性,由此就可以分析其違約的內(nèi)在原因[6]。與會(huì)計(jì)信息相比,市場信息不僅反映了會(huì)計(jì)信息,還反映了其他來源的信息,市場變量也不會(huì)受到企業(yè)會(huì)計(jì)政策的影響,弱化了經(jīng)理人盈余管理行為的影響,而市場交易價(jià)格是投資者對企業(yè)未來預(yù)期現(xiàn)金流價(jià)值的預(yù)期,由此對企業(yè)信用風(fēng)險(xiǎn)的評價(jià)將更為準(zhǔn)確。
不過基于市場信息的研究是建立在一系列嚴(yán)格假設(shè)基礎(chǔ)上的,如假設(shè)收益率服從正態(tài)分布,不區(qū)分各種類型的債務(wù),資產(chǎn)價(jià)值和波動(dòng)性需要根據(jù)市場價(jià)格計(jì)算而不能直接獲取從而導(dǎo)致潛在很大的誤差,財(cái)務(wù)困境企業(yè)更容易出現(xiàn)市場價(jià)格偏離公允價(jià)值等問題[7],一些實(shí)證研究發(fā)現(xiàn)在控制一系列其他變量后,市場信息模型的預(yù)測能力非常低[8]。對于中小企業(yè)而言,基于市場信息來評價(jià)信用風(fēng)險(xiǎn)也不可行,絕大多數(shù)中小企業(yè)并沒有上市交易,無法獲取相關(guān)的市場信息來進(jìn)行評價(jià)和分析。
從公開信息的角度來看,除了定量的會(huì)計(jì)信息和市場信息以外,還存在著大量與企業(yè)經(jīng)營狀況和未來前景相關(guān)的定性文本信息。
首先,從信息披露的角度來看,除了定量財(cái)務(wù)數(shù)據(jù)直觀反映了企業(yè)經(jīng)營和財(cái)務(wù)狀況以外,企業(yè)在發(fā)布的定期和不定期報(bào)告、業(yè)績說明會(huì)等各種信息披露報(bào)告中包含了大量描述性文本內(nèi)容,這是對經(jīng)營情況和財(cái)務(wù)狀況的具體說明和分析。企業(yè)可能會(huì)通過提高負(fù)面信息的分析成本來弱化市場對負(fù)面信息的反應(yīng),傾向于以更直接、更清晰的方式來陳述正面消息,以更為復(fù)雜、更多中性或含義模糊而不是悲觀和負(fù)面的詞語來描述負(fù)面消息或表達(dá)對未來前景的擔(dān)憂,這樣就可以通過對企業(yè)信息披露文本內(nèi)容的分析來判斷其違約傾向。為此,一些學(xué)者在財(cái)務(wù)困境或破產(chǎn)預(yù)測的研究中加入了信息披露文本的量化指標(biāo),如不少基于年報(bào)文本的研究都表明企業(yè)信息披露文本是對定量財(cái)務(wù)數(shù)據(jù)的有效補(bǔ)充,在財(cái)務(wù)困境預(yù)測和信用風(fēng)險(xiǎn)評價(jià)模型中加入這些文本的量化指標(biāo)可以提高模型的效力[9~11]。不過信息披露的頻率相對較低,與財(cái)務(wù)數(shù)據(jù)一樣會(huì)存在時(shí)滯性問題。
其次,傳統(tǒng)新聞媒體與新興互聯(lián)網(wǎng)媒體上存在著大量對企業(yè)的報(bào)道和評論,大量關(guān)于媒體報(bào)道對資本市場影響的研究都表明媒體有助于促進(jìn)信息的分散和傳播,緩解信息不對稱問題,媒體報(bào)道的內(nèi)容通常具有明顯的傾向性,還會(huì)傳遞對企業(yè)經(jīng)營現(xiàn)狀、未來發(fā)展、盈余預(yù)期等樂觀或悲觀的觀點(diǎn)[12]。由于新聞媒體,特別是互聯(lián)網(wǎng)和社交媒體會(huì)對企業(yè)存在的問題予以迅速報(bào)道和反饋,這樣就可以為財(cái)務(wù)困境預(yù)測和信用風(fēng)險(xiǎn)評價(jià)提供時(shí)效性更強(qiáng)的信息,而且媒體報(bào)道的傾向會(huì)對投資者和消費(fèi)者的心理與行為產(chǎn)生重要影響,媒體的負(fù)面報(bào)道一方面會(huì)使市場交易價(jià)格會(huì)偏離內(nèi)在價(jià)值,導(dǎo)致對企業(yè)信用狀況的錯(cuò)誤評價(jià),另一方面還會(huì)影響資金提供者對企業(yè)還本付息的信心,債券投資者可能會(huì)因此出售企業(yè)發(fā)行的債券,貸款者可能會(huì)提前收回資金,商業(yè)授信方會(huì)要求提前付款、不再提供商業(yè)信用等,這些都會(huì)增加企業(yè)的資金壓力,使企業(yè)陷入財(cái)務(wù)困境或進(jìn)一步加重財(cái)務(wù)危機(jī)。近年來,一些學(xué)者將新聞報(bào)道、互聯(lián)網(wǎng)文本內(nèi)容的分析引入到財(cái)務(wù)困境預(yù)測和信用風(fēng)險(xiǎn)評價(jià)中,結(jié)果表明對新聞報(bào)道文本內(nèi)容的分析可以預(yù)測企業(yè)財(cái)務(wù)困境或信用評級變動(dòng)[13~16],還有些學(xué)者則從債務(wù)成本的角度發(fā)現(xiàn)媒體關(guān)注與報(bào)道傾向隱含著關(guān)于債務(wù)人信用風(fēng)險(xiǎn)的有用信息[17,18]。
這些研究表明文本信息對于企業(yè)的財(cái)務(wù)困境預(yù)測和信用風(fēng)險(xiǎn)評價(jià)都會(huì)帶來一定的增量信息,但選取的文本信息往往局限于某一類文本信息,沒有考慮多種文本信息的影響。為此,本文以我國上市中小企業(yè)為研究對象,利用網(wǎng)絡(luò)爬蟲獲取企業(yè)信息披露和互聯(lián)網(wǎng)媒體新聞報(bào)道的文本內(nèi)容,采用情感分析方法對文本內(nèi)容進(jìn)行量化分析,再與定量財(cái)務(wù)數(shù)據(jù)相結(jié)合對不同文本內(nèi)容的量化指標(biāo)在財(cái)務(wù)困境預(yù)測中的信息價(jià)值以及預(yù)測能力進(jìn)行實(shí)證檢驗(yàn)。本文的研究貢獻(xiàn)在于:一是在財(cái)務(wù)困境預(yù)測的研究中考慮了不同來源文本信息的影響,拓展了信用風(fēng)險(xiǎn)評價(jià)的信息基礎(chǔ);二是對于互聯(lián)網(wǎng)媒體新聞在財(cái)務(wù)困境預(yù)測中信息價(jià)值的分析有助于豐富對新聞媒體信息中介、監(jiān)督功能等治理效應(yīng)的研究;三是在以詞袋方法為基礎(chǔ)進(jìn)行自動(dòng)文本分析時(shí),考慮不同來源文本信息的特點(diǎn)采用不同詞表為基礎(chǔ)來進(jìn)行分析,對于金融領(lǐng)域文本分析方法的選擇有一定的參考價(jià)值。
考慮到中小企業(yè)財(cái)務(wù)數(shù)據(jù)難以獲取,本文選取了在深圳中小企業(yè)板塊上市的中小企業(yè)為研究對象,參照國內(nèi)研究的一般做法,將因財(cái)務(wù)狀況異常而被特別處理作為企業(yè)出現(xiàn)財(cái)務(wù)困境的標(biāo)志。由于我國上市企業(yè)在t年是否被特別處理與t-1年的年報(bào)公布發(fā)生在同一年度,因而參照石曉軍等的做法[19],采用了上市企業(yè)t-2年的數(shù)據(jù)建立模型來預(yù)測其是否會(huì)在t年會(huì)出現(xiàn)財(cái)務(wù)困境。由于中小企業(yè)板塊在2003年上市初期很少出現(xiàn)特別處理問題,并考慮到2008年金融危機(jī)的影響,本文選取了2012年到2018年被特別處理的上市中小企業(yè)為樣本,對應(yīng)的數(shù)據(jù)區(qū)間為2010年~2016年,并剔除了金融類企業(yè)以及跨市場在B股和H股上市的企業(yè)。在對樣本進(jìn)行處理時(shí),不考慮2010年之前已被特別處理的企業(yè),以及被特別處理后進(jìn)一步降級或撤銷特別處理的問題,最后樣本中包括761家企業(yè),其中48家企業(yè)被特別處理,共4500個(gè)企業(yè)-年度觀測值。
為了避免配對抽樣導(dǎo)致的樣本量受限問題,并考慮財(cái)務(wù)困境發(fā)生概率會(huì)隨時(shí)間變化的特點(diǎn),本文選取Shumway的離散時(shí)間風(fēng)險(xiǎn)模型[20]作為建?;A(chǔ)。企業(yè)i在t+1時(shí)刻出現(xiàn)信用風(fēng)險(xiǎn)的離散概率滿足:
(1)
其中Xi,t表示企業(yè)i在t時(shí)刻的協(xié)變量,αt表示時(shí)變的基準(zhǔn)風(fēng)險(xiǎn)率,這樣就可以利用所有可觀測的企業(yè)-年度樣本,消除靜態(tài)模型中的選擇性偏誤問題。在實(shí)證分析中,本文首先以單變量分析為基礎(chǔ)對各種文本信息量化指標(biāo)在財(cái)務(wù)困境預(yù)測中的作用進(jìn)行比較分析,然后以財(cái)務(wù)比率模型為基礎(chǔ)對不同文本信息量化指標(biāo)的作用進(jìn)行比較分析,然后再對文本量化指標(biāo)對財(cái)務(wù)困境預(yù)測的信息含量進(jìn)行檢驗(yàn),最后利用十分位檢驗(yàn)的方法對文本量化指標(biāo)預(yù)測財(cái)務(wù)困境的能力進(jìn)行分析。
以往財(cái)務(wù)困境預(yù)測的研究中選取的財(cái)務(wù)變量與市場變量非常多,考慮到本文以上市中小企業(yè)為樣本,并考慮到研究結(jié)論可進(jìn)一步推廣到眾多非上市中小企業(yè),因而在定量數(shù)據(jù)方面,沒有考慮市場變量,僅以財(cái)務(wù)變量為基礎(chǔ)。本文重點(diǎn)在于檢驗(yàn)文本量化指標(biāo)在財(cái)務(wù)困境預(yù)測中的作用,因而參照Shumway等的研究從規(guī)模、盈利能力、負(fù)債比率和利息償付能力等方面選取了四個(gè)財(cái)務(wù)變量:總資產(chǎn)規(guī)模(ASSET,總資產(chǎn)的對數(shù))、總資產(chǎn)收益率(ROA)、資產(chǎn)負(fù)債率(LEV)和利息保障倍數(shù)(INTCOV)。
本文利用網(wǎng)絡(luò)爬蟲從以下兩個(gè)方面獲取文本信息:一是企業(yè)的信息披露,來自巨潮資訊的年度報(bào)告,并從中提取管理層討論與分析(MD&A)部分的內(nèi)容,分別以年報(bào)全文和MD&A部分為基礎(chǔ)對文本內(nèi)容傳遞的管理層語調(diào)進(jìn)行分析;二是互聯(lián)網(wǎng)新聞媒體報(bào)道,利用企業(yè)名稱及簡稱作為關(guān)鍵詞從百度新聞搜索引擎中爬取相關(guān)的文本內(nèi)容,并進(jìn)行預(yù)處理和清洗,如去除企業(yè)主動(dòng)發(fā)布的各種報(bào)告等,再對媒體報(bào)道的傾向進(jìn)行分析。
對金融文本的自動(dòng)分析主要有兩種方法,一是詞袋方法,利用特定詞典或詞表對特征詞的劃分來對文本進(jìn)行分類,Loughran和McDonald指出從其他領(lǐng)域引入的成熟詞典或詞表對金融文本的特殊性考慮不足,應(yīng)以特定金融文本為基礎(chǔ)來構(gòu)建專門用于金融文本情感或語調(diào)分析的詞表[21];二是機(jī)器學(xué)習(xí)方法,通過特定算法對訓(xùn)練集文本進(jìn)行訓(xùn)練,確定文本分類規(guī)則再應(yīng)用于全部文本。Loughran和McDonald指出機(jī)器學(xué)習(xí)方法需要選擇訓(xùn)練集,這會(huì)受研究者主觀性的影響[22],而詞袋方法在確定詞典和詞表后可以很好的規(guī)避這一問題,為此本文采用了詞袋方法來進(jìn)行分析。由于年報(bào)與媒體報(bào)道來自于不同主體,文本內(nèi)容的撰寫上存在著一定的差異,為此采用了不同的處理方式:對年報(bào)文本,借鑒謝德仁和林樂的方法[23],以Loughran和McDonald構(gòu)建的詞表為基礎(chǔ),參照中文年報(bào)內(nèi)容翻譯后構(gòu)建對信息披露文本分析的詞表;對互聯(lián)網(wǎng)新聞媒體報(bào)道的分析則以You等構(gòu)建的新聞報(bào)道傾向詞表為基礎(chǔ)[24]。
在利用詞袋方法計(jì)算文本的情感傾向時(shí)的另一個(gè)關(guān)鍵問題在于特征詞的權(quán)重問題,常用方法是假設(shè)各個(gè)詞語的權(quán)重相同,但Loughran和McDonald指出特征詞的權(quán)重應(yīng)考慮詞語在全部文檔中的重要性,因此本文以詞頻-逆向文檔頻率(TFIDF)為基礎(chǔ)來設(shè)置特征詞權(quán)重,計(jì)算文本內(nèi)容的情感傾向。
在中文分詞的工具方面,現(xiàn)有中文文本分詞技術(shù)較多,為確保結(jié)果的穩(wěn)健性,本文以R語言為基礎(chǔ)同時(shí)采用兩種方法:一是結(jié)巴中文分詞工具JiebaR;二是基于中科院ICTCLAS中文分詞算法的Rwordseg工具。通過自動(dòng)分詞,利用R語言的文本挖掘工具TM創(chuàng)建文檔詞語矩陣,再利用上述詞表來統(tǒng)計(jì)正面和負(fù)面的情感詞語詞頻POS和NEG(分別表示正面和負(fù)面情感詞語數(shù)量占全部詞語總數(shù)的比例),直接以NEG來衡量管理層的負(fù)面語調(diào)以及媒體報(bào)道的負(fù)面傾向,同時(shí)以POS和NEG來構(gòu)建管理層的凈語調(diào)以及媒體報(bào)道的整體傾向TONE:
(2)
對于信息披露文本傳遞的管理層語調(diào),分別以年報(bào)全文和管理層討論與分析部分為基礎(chǔ)來進(jìn)行衡量,結(jié)合分詞工具的不同,構(gòu)建了八個(gè)管理層語調(diào)變量:JTNEG_AR、JTTONE_AR、RTNEG_AR、RTTONE_AR、JTNEG_MDA、TTONE_MDA、RTNEG_MDA、RTTONE_MDA。由于一段時(shí)期內(nèi)對單個(gè)企業(yè)會(huì)存在大量新聞媒體報(bào)道,本文從兩個(gè)方面來構(gòu)建媒體報(bào)道傾向的衡量指標(biāo):一是對一段時(shí)期內(nèi)的負(fù)面傾向和整體傾向進(jìn)行加權(quán)平均,由此構(gòu)建JTNEG_NE、JTTONE_ NE、RTNEG_ NE、RTTONE_ NE四個(gè)報(bào)道傾向指標(biāo);二是采用You等(2018)的方法,根據(jù)一篇報(bào)道中負(fù)面詞與正面詞的數(shù)量來衡量整體報(bào)道傾向,負(fù)面詞更多的為負(fù)面報(bào)道,計(jì)算負(fù)面報(bào)道篇數(shù)占該時(shí)期內(nèi)全部報(bào)道篇數(shù)的比例,由此構(gòu)建JTNEGB_NE和RTNEGB_ NE兩個(gè)負(fù)面報(bào)道比例變量。
本文首先對選取的財(cái)務(wù)變量、計(jì)算的年報(bào)管理層語調(diào)變量、新聞報(bào)道傾向和負(fù)面報(bào)道比例變量是否具有預(yù)測中小上市企業(yè)財(cái)務(wù)困境的能力進(jìn)行檢驗(yàn),檢驗(yàn)中都加入了常數(shù)項(xiàng),結(jié)果如表1所示。
表1 文本信息預(yù)測財(cái)務(wù)困境的能力:基于單變量的比較分析
在財(cái)務(wù)變量中,資產(chǎn)規(guī)模ASSET的預(yù)測能力最差,其原因在于選取的上市中小企業(yè)規(guī)模相差不大,因而企業(yè)規(guī)模因素的影響較??;資產(chǎn)收益率ROA的預(yù)測能力最強(qiáng),其原因在于上市企業(yè)特別處理的主要依據(jù)在于盈利能力,連續(xù)虧損的企業(yè)被特別處理的概率自然會(huì)更高,因而資產(chǎn)收益率會(huì)有較強(qiáng)的預(yù)測能力。
在年報(bào)文本指標(biāo)中,分詞工具的影響很小,基本可以忽略;由年報(bào)全文以及由管理層討論與分析部分計(jì)算的管理層語調(diào)在預(yù)測財(cái)務(wù)困境時(shí)的效果差異較小,同樣可以忽略;在負(fù)面語調(diào)和凈語調(diào)中,負(fù)面語調(diào)的信息價(jià)值高于凈語調(diào)。
在媒體報(bào)道傾向變量中,與管理層語調(diào)變量相似,分詞工具的選擇不會(huì)帶來太大差異;整體傾向變量的效果要遠(yuǎn)好于負(fù)面報(bào)道傾向,而負(fù)面報(bào)道比例的效果同樣較好,接近于整體傾向,這主要是由于負(fù)面報(bào)道的判斷與整體傾向變量的計(jì)算相似,都依賴于報(bào)道中負(fù)面詞語與正面詞語的對比情況。
為了進(jìn)一步檢驗(yàn)管理層語調(diào)、媒體報(bào)道傾向等文本信息變量在財(cái)務(wù)困境預(yù)測中的作用,本文以財(cái)務(wù)變量模型為基礎(chǔ),在控制年度和行業(yè)效應(yīng)的情況下,分別加入文本信息變量對模型進(jìn)行重新估計(jì)。
表2 管理層語調(diào)的對比分析
3.2.1 管理層語調(diào)變量的對比分析
表2報(bào)告了在財(cái)務(wù)變量模型中加入管理層語調(diào)變量的估計(jì)結(jié)果。在以年報(bào)全文為基礎(chǔ)的分析中:首先,負(fù)面語調(diào)的估計(jì)系數(shù)顯著為正,表明信息披露文本傳遞的管理層語調(diào)越負(fù)面,企業(yè)出現(xiàn)財(cái)務(wù)困境的可能性越大,而凈語調(diào)的估計(jì)系數(shù)顯著為負(fù),但僅在10%水平下顯著,表明凈語調(diào)越正面,出現(xiàn)財(cái)務(wù)困境的可能性越小;其次,兩種分詞工具得到的結(jié)果在財(cái)務(wù)困境預(yù)測中效果基本相同;最后,從模型的擬合情況來看,加入負(fù)面語調(diào)后模型擬合效果相對更好,表明負(fù)面語調(diào)在財(cái)務(wù)困境預(yù)測中的信息價(jià)值相對更高。
在以年報(bào)管理層討論與分析部分內(nèi)容為基礎(chǔ)的分析中:首先,負(fù)面語調(diào)依然顯著為負(fù),而凈語調(diào)變量則不再顯著;其次,兩種分詞工具同樣沒有太大差別;最后,從模型的擬合情況來看,加入負(fù)面語調(diào)后模型擬合效果相對更好。實(shí)證結(jié)果與基于年報(bào)全文的分析基本相似,這些結(jié)果都表明負(fù)面語調(diào)具有更高的信息價(jià)值。
3.2.2 媒體報(bào)道傾向變量的比較分析
表3報(bào)告了媒體報(bào)道傾向變量的實(shí)證結(jié)果。在控制財(cái)務(wù)變量、年度和行業(yè)效應(yīng)的基礎(chǔ)上,兩個(gè)負(fù)面傾向變量都不顯著,且加入后模型的擬合程度沒有提高,而兩個(gè)整體傾向變量都顯著,加入后都可以提高預(yù)測模型的擬合程度,即整體傾向的信息價(jià)值要高于負(fù)面傾向,從這點(diǎn)來說,對媒體報(bào)道傾向的分析與管理層語調(diào)不同,對媒體報(bào)道應(yīng)更注重對整體傾向的分析。此外,同樣可以看到不同分詞工具得到的結(jié)果并沒有顯著的差異。在兩個(gè)負(fù)面報(bào)道比例變量中,估計(jì)結(jié)果都顯著為正,表明負(fù)面報(bào)道的比例越多,企業(yè)出現(xiàn)財(cái)務(wù)困境的可能性就越大,之所以與前面對整體傾向的分析相似,原因在于負(fù)面報(bào)道的確定與整體傾向的計(jì)算方法類似;同樣兩種分詞工具帶來的影響非常小。
表3 媒體報(bào)道傾向的對比分析
表3 結(jié)合不同文本信息的實(shí)證結(jié)果
3.2.3 不同文本信息相結(jié)合的分析
為進(jìn)一步對管理層語調(diào)、媒體報(bào)道傾向和負(fù)面報(bào)道比例在財(cái)務(wù)困境預(yù)測中的作用進(jìn)行檢驗(yàn),本文以基于年報(bào)全文的負(fù)面語調(diào)JTNEG_AR和RTNEG_AR分別與對應(yīng)分詞工具得到的媒體報(bào)道整體傾向JTTONE_ NE和RTTONE_ NE、負(fù)面報(bào)道比例JTNEGB_NE和RTNEGB_ NE兩兩結(jié)合來進(jìn)行估計(jì),結(jié)果如表3所示。由表3可見,管理層負(fù)面語調(diào)和媒體負(fù)面報(bào)道比例變量都顯著為正,而媒體報(bào)道整體傾向都顯著為負(fù),模型的擬合效果也相對比較接近,進(jìn)一步驗(yàn)證了管理層負(fù)面語調(diào)、媒體報(bào)道整體傾向、媒體負(fù)面報(bào)道比例在財(cái)務(wù)困境預(yù)測中的信息價(jià)值。
為進(jìn)一步確認(rèn)文本信息量化指標(biāo)對財(cái)務(wù)困境預(yù)測的信息增量價(jià)值,本文基于離散時(shí)間風(fēng)險(xiǎn)模型對文本信息變量的信息含量進(jìn)行了檢驗(yàn)。前面的分析顯示分詞工具的影響很小,因而只選取了結(jié)巴分詞的三個(gè)變量JTNEG_AR、JTTONE_ NE和JTNEGB_NE進(jìn)行檢驗(yàn),首先以財(cái)務(wù)變量模型的估計(jì)結(jié)果來預(yù)測各觀測樣本出現(xiàn)財(cái)務(wù)困境的邏輯分值SFINANCIAL,然后將其與三個(gè)文本信息變量單變量估計(jì)結(jié)果預(yù)測的邏輯分值SJTNEG_AR、SJTTONE_ NE和SJTNEGB_NE相結(jié)合,結(jié)果如表4所示。模型1只加入了財(cái)務(wù)變量模型預(yù)測的邏輯分值SFINANCIAL,模型2~4分別在SFINANCIAL的基礎(chǔ)上加入了三個(gè)文本信息變量預(yù)測的邏輯分值,模型5和6以SFINANCIAL為基礎(chǔ),將文本信息變量兩兩結(jié)合進(jìn)一步檢驗(yàn)其信息增量。SFINANCIAL在所有模型中都顯著為正且在1%水平下顯著,表明財(cái)務(wù)信息在財(cái)務(wù)困境預(yù)測中有著非常重要的作用;三個(gè)文本信息變量預(yù)測的邏輯分值都顯著為正,模型擬合程度也都有一定的改進(jìn),表明文本信息中確實(shí)包含了預(yù)測企業(yè)財(cái)務(wù)困境的重要信息。
表4 信息量檢驗(yàn)與信息增量的估計(jì)結(jié)果
表5 十分位數(shù)檢驗(yàn)的結(jié)果
本文采用Shumway的十分位數(shù)檢驗(yàn)方法,將前述模型預(yù)測的違約概率按照十分位數(shù)分成十等分,計(jì)算十分位數(shù)中財(cái)務(wù)困境企業(yè)的比例,結(jié)果如表5所示。由表5可見,以財(cái)務(wù)變量模型預(yù)測的結(jié)果為基準(zhǔn),加入年報(bào)負(fù)面語調(diào)JTNEG_AR后盡管第一個(gè)十分位預(yù)測的準(zhǔn)確率略有降低,但第二個(gè)十分位有顯著提高;加入媒體報(bào)道整體傾向變量JTTONE_ NE后前兩個(gè)十分位的預(yù)測準(zhǔn)確率都有所提高;而加入媒體負(fù)面報(bào)道比例JTNEGB_NE后在第一個(gè)十分位預(yù)測的準(zhǔn)確率就有明顯提高;在同時(shí)加入年報(bào)負(fù)面語調(diào)和媒體報(bào)道整體傾向后,盡管第一個(gè)十分位的預(yù)測準(zhǔn)確率不變,但第二個(gè)十分位預(yù)測的準(zhǔn)確率有顯著提升;同時(shí)加入年報(bào)負(fù)面語調(diào)變量和媒體負(fù)面報(bào)道比例變量后第一個(gè)十分位預(yù)測的準(zhǔn)確率有大幅提升,第二個(gè)十分位預(yù)測的準(zhǔn)確率也有所提高。由此可見,盡管年報(bào)負(fù)面語調(diào)變量對財(cái)務(wù)困境模型預(yù)測能力的改善相對有限,但媒體報(bào)道整體傾向與負(fù)面報(bào)道比例都有較強(qiáng)的預(yù)測能力,因而在財(cái)務(wù)困境預(yù)測和信用風(fēng)險(xiǎn)評價(jià)的研究中加入文本信息的量化指標(biāo)確實(shí)可以提高模型的效力和預(yù)測能力。
本文針對絕大多數(shù)中小企業(yè)缺少市場信息,而財(cái)務(wù)數(shù)據(jù)披露不規(guī)范的問題,以上市中小企業(yè)為樣本,通過對企業(yè)信息披露和互聯(lián)網(wǎng)新聞媒體報(bào)道文本內(nèi)容的量化分析構(gòu)建管理層語調(diào)與媒體報(bào)道傾向變量,對這些文本量化指標(biāo)在財(cái)務(wù)困境預(yù)測中的信息價(jià)值進(jìn)行了實(shí)證檢驗(yàn),主要結(jié)論如下:
首先,企業(yè)的信息披露與互聯(lián)網(wǎng)新聞媒體報(bào)道的文本內(nèi)容都可以提高財(cái)務(wù)困境模型的預(yù)測能力。單變量分析以及在財(cái)務(wù)變量模型中加入文本信息變量后的結(jié)果都顯示文本信息變量可以提高模型的擬合程度,且不會(huì)因?yàn)榉衷~工具而出現(xiàn)變化。信息量檢驗(yàn)的結(jié)果進(jìn)一步確認(rèn)了這一結(jié)論,而十分位檢驗(yàn)的結(jié)果表明文本信息變量對財(cái)務(wù)困境確實(shí)具有一定的預(yù)測能力。
其次,采用詞袋方法對不同類文本進(jìn)行情感分析時(shí)應(yīng)有不同的側(cè)重點(diǎn),采用不同的方法。在年報(bào)文本內(nèi)容的分析中,負(fù)面語調(diào)在財(cái)務(wù)困境預(yù)測中的效果更好,凈語調(diào)變量的效果較差,且在離散時(shí)間風(fēng)險(xiǎn)模型的估計(jì)中不顯著;在對互聯(lián)網(wǎng)新聞媒體報(bào)道的分析中,整體傾向的效果更好,而負(fù)面傾向的效果較差,但負(fù)面報(bào)道數(shù)量的比例變量則具有較好的效果。
再次,從財(cái)務(wù)困境預(yù)測的角度來看,以年報(bào)全文和管理層討論與分析部分文本內(nèi)容構(gòu)建的管理層負(fù)面語調(diào)和凈語調(diào)在離散時(shí)間風(fēng)險(xiǎn)模型中的估計(jì)結(jié)果基本相似,表明年報(bào)全文與管理層討論與分析部分文本內(nèi)容的信息價(jià)值不存在顯著的差別。
盡管本文對文本信息在中小企業(yè)財(cái)務(wù)困境預(yù)測中作用的研究針對的是中小上市企業(yè),但在實(shí)證研究中僅考慮了主要的財(cái)務(wù)變量,因而基于文本分析來構(gòu)建財(cái)務(wù)困境預(yù)測模型的方法可以推廣到非上市中小企業(yè),如以中小企業(yè)的信息披露、主要股東的相關(guān)信息來代替上市企業(yè)的年報(bào),并獲取對中小企業(yè)及外部環(huán)境的新聞媒體報(bào)道,就可以構(gòu)建基于文本信息的中小企業(yè)財(cái)務(wù)困境預(yù)測和信用風(fēng)險(xiǎn)管理模型,強(qiáng)化對其信用風(fēng)險(xiǎn)的評價(jià)與管理。