——基于管理層語意的LSTM深度學習研究"/>
楊七中,馬蓓麗
(1.南京財經(jīng)大學會計學院,江蘇 南京 210023;2.江蘇理工學院商學院,江蘇 常州 213001)
東方文明深受“儒家文化”的熏陶和影響,人們在交流信息時,習慣于間接隱晦、繞彎子的表達方式,甚至有些信息只可意會不可言傳,即東方社會是一個高語境傳播的社會(Hall,1976)[1]。那么當企業(yè)管理層向資本市場傳遞公司私有信息,特別是一些非財務信息時,投資者能否聽懂這些話里話、弦外音呢?能否吸收這些非量化、描述性信息呢?對這一問題進行研究,有助于理解資本市場異象,提高資本配置效率,緩解股價崩盤風險。
前期文獻研究了信息傳遞時的資本市場反應,其中多數(shù)聚焦于可量化的財務信息披露,如盈余、收入和分析師薦股等對市場反應的影響,但對于那些難以量化的非財務信息披露,由于缺乏客觀量化非財務信息的方法,長期以來針對投資者能否有效地吸收這些非財務信息的研究還不多見。近年來隨著計算機自然語言處理技術的發(fā)展,已經(jīng)有文獻使用文本分析技術來量化非財務信息的內容和情緒(Tetlock et al.,2008;Loughran et al.,2011;謝德仁等,2015;林樂等,2016,2017)[2][3][4][5][6],其中使用最多的是“詞袋法”,然而“詞袋法”存在一定的局限性:不同學科的詞典并不兼容;詞與詞之間缺乏因果關系,容易導致語義誤判,造成虛假回歸(Jegadeesh et al.,2013)[7],盡管后期有學者采用構建或擴充專業(yè)詞典的研究方式(林樂等,2016)[5],但解決上述問題仍需要尋求新的文本量化技術。
本文選用LSTM深度學習技術,對我國上市公司年度業(yè)績說明會上的管理層回復進行文本分析,試圖研究投資者能否聽懂管理層所表達的真正語意。用Python程序爬取2010~2014年全景網(wǎng)站(http://www.p5w.net/)所有上市公司年度業(yè)績說明會上管理層和投資者之間問答文本,經(jīng)過數(shù)據(jù)清洗,構建人工標注和玻森中文語義平臺(BosonNLP)相互印證的語料庫,利用python的Jieba分詞庫、tensorflow庫等基于LSTM神經(jīng)網(wǎng)絡技術進行深度學習,以分析管理層回復的“弦外之音”。進一步利用事件研究法分析相關上市公司業(yè)績說明會的市場反應和管理層語意之間的相關性,以檢驗投資者能否聽懂管理層的“弦外之音”。研究表明,投資者能夠理解管理層的真實語意,資本市場對正面語意做出顯著的正向反應,對負面語意做出顯著的負向反應,但是對正面語意的反應存在一定滯后期,未發(fā)現(xiàn)證據(jù)支持投資者會把管理層語意作為交易策略因子。
本文主要有以下幾方面貢獻:一是采用的LSTM深度學習技術,顧及詞語之間的因果關系,可以降低語意誤判率,避免陷入虛假回歸陷阱,是對傳統(tǒng)“詞袋法”文本分析技術的改進;二是發(fā)現(xiàn)管理層語意的確具有信息含量,在前期Fama-French五因子模型基礎上,未來可否考慮將一些非財務信息作為影響資產(chǎn)定價的因子納入模型,這為行為金融量化研究提供有益的啟示;三是研究表明上市公司和投資者之間以業(yè)績說明會這樣的互動敞開方式溝通,起到了有效的信息披露作用,為監(jiān)管部門思考如何進一步提高管理層討論與分析質量和完善投資者保護環(huán)境提供經(jīng)驗證據(jù)。
作為上市公司年報的重要組成部分,管理層討論與分析(MD&A)是針對一些非常重要,但卻無法通過定量財務指標進行揭示的機遇、挑戰(zhàn)和風險向投資者做出說明,以便投資者做出合理的決策判斷。上市公司業(yè)績說明會本身又作為MD&A的一種補充,類似于美國的自愿性分析師盈余電話會議,最初源于2004年深交所針對中小企業(yè)發(fā)布的《深圳證券交易所中小企業(yè)板塊上市公司誠信建設指引》,規(guī)定“上市公司應在每年年度報告披露后舉行年度報告說明會,向投資者真實、準確地介紹公司的發(fā)展戰(zhàn)略、生產(chǎn)經(jīng)營、新產(chǎn)品和新技術開發(fā)、財務狀況和經(jīng)營業(yè)績、投資項目等各方面情況,并將說明會的文字資料放置于公司網(wǎng)站供投資者查閱”。深交所在2005年、2010年、2015年多次修訂的《深圳證券交易所中小企業(yè)板創(chuàng)業(yè)板上市公司規(guī)范運作指引》做了更為明確的規(guī)定“上市公司舉行業(yè)績說明會、分析師會議、路演等投資者關系活動,為使所有投資者均有機會參與,可以采取網(wǎng)上直播的方式”“公司應當在年度報告披露后十個交易日內舉行年度報告說明會,公司董事長(或者總經(jīng)理)、財務負責人、獨立董事(至少一名)、董事會秘書、保薦代表人(至少一名)應當出席說明會”。2009年10月,創(chuàng)業(yè)板正式上市,深交所發(fā)布《深圳證券交易所創(chuàng)業(yè)板上市公司規(guī)范運作指引》規(guī)定“鼓勵上市公司通過召開新聞發(fā)布會、投資者懇談會、網(wǎng)上說明會等方式擴大信息的傳播范圍,以使更多投資者及時知悉了解公司重大信息”。除中小企業(yè)創(chuàng)業(yè)板之外,證監(jiān)會并不強制要求主板上市公司舉行業(yè)績說明會,但隨著互聯(lián)網(wǎng)自媒體熱潮席卷,許多主板上市公司為了自身的發(fā)展,自愿舉行業(yè)績說明會向資本市場傳遞當下和未來的經(jīng)營發(fā)展信息。隨著時間推移,每年越來越多的大公司借助互聯(lián)網(wǎng),自愿舉行網(wǎng)上業(yè)績說明會,逐漸變成公司管理層和投資者之間交流的主要平臺。
與MD&A和分析師盈余電話會議等信息披露方式相比,通過分析我國上市公司網(wǎng)上業(yè)績說明會的形式與內容,發(fā)現(xiàn)其具有一些鮮明的披露特征:第一,時間點較集中。業(yè)績說明會一般集中在年報披露之后的14個交易日之后舉行(林樂,2016)[5],就事件研究而言,可以避免盈余公告效應以及其他跨期外生事件對股票超額累計收益率的干擾;第二,高管參與度高。八成以上公司由董事長、總經(jīng)理和獨立董事親自參與業(yè)績說明,保證了信息披露的權威性、正規(guī)性及可信性;第三,開放互動包容。相對于美國盈余電話會議主要是公司高管和分析師參加而言,我國上市公司業(yè)績說明會更加開放,現(xiàn)有和潛在投資者、分析師及各類感興趣的人均可在線參與提問。由于采用網(wǎng)絡在線問答,實時隨機互動,問題兼容并包;第四,交流內容多元。從行業(yè)狀況、公司戰(zhàn)略、生產(chǎn)經(jīng)營、募集資金使用、新產(chǎn)品新市場開發(fā),到公司營銷、技術、財務及發(fā)展前景等方面存在的困難和損失,甚至還包含個人興趣愛好,涵蓋投資者關心的大多方面,信息琳瑯滿目,內容豐富多元;第五,語言含蓄內斂。由于受到中國文化情境影響和基于商業(yè)機密的考慮,管理層在回答投資者等提問時,常常表現(xiàn)出語言含蓄、避而不答或者程式化答案,這給傳統(tǒng)的文本分析方法帶來了研究挑戰(zhàn)。
國外學者通過計算機自然語言處理技術,提取出非財務文本所包含的語意或情感變量,來研究文本語意與公司價值和投資者行為等的關系,發(fā)現(xiàn)其與未來盈利水平、投資者行為、股票預期收益率甚至是管理層欺詐行為具有關聯(lián)性(Price et al.,2012;Mayew et al.,2018)[8][9]。有的學者從文本的可讀性方面進行研究,發(fā)現(xiàn)迷霧指數(shù)越高的公司(即年報越難讀懂),其盈利水平越差(Feng Li,2008)[10],報告越易讀懂,則小股東越愿意持股(Lawrence,2013)[11]。還有的學者從文本的語調方面進行研究,發(fā)現(xiàn)MD&A和盈余電話會議語調越正向,則股票收益率越高、波動性越低(Price,2012)[8],盈余電話會議中管理者特定語調與未來業(yè)績正相關,即語調越正向,未來四個季度的資產(chǎn)報酬率越高(Davis,2015)[12]。在檢驗10-K披露的市場反應時,發(fā)現(xiàn)正向語調和負向語調與市場反應顯著相關(Jegadeesh and Wu,2013)[7],甚至可以預測管理層欺詐(Purda and Skillicorn,2015)[13]。近年,國外對非財務信息的文本分析已經(jīng)從語調走向語音研究,如利用測謊軟件分析盈余電話會議上管理層音頻聲調和情感真實度,發(fā)現(xiàn)正向語調會引起當期超額收益率(Mayew,2018)[9]。
國內會計與財務領域的非財務信息文本分析研究處于剛剛興起階段。有的學者從文本的可讀性特征進行研究,如彭紅楓(2016)[14]發(fā)現(xiàn)借款陳述的迷霧指數(shù)和文本長度都與借款成功率呈“倒U型”關系,并與實際借款利率存在線性正相關關系。有的從文本的語調角度進行研究,如謝德仁等(2015)[4]基于業(yè)績說明會發(fā)現(xiàn)管理層正面語調與公司下一年業(yè)績正相關。林樂等(2016)[5]發(fā)現(xiàn)投資者對管理層正面語調做出顯著的正向反應。朱朝暉等(2018)[15]基于A股上市公司MD&A樣本,檢驗管理層語調離差策略對分析師預測的影響,發(fā)現(xiàn)業(yè)績較差的公司會策略性地安排管理層語調詞的分布,且這樣安排對分析師預測有顯著影響。有的從文本主題類型方面進行研究,如孔翔宇等(2016)[16]挖掘了財經(jīng)新聞主題內容與股市的相關性,發(fā)現(xiàn)國際貿(mào)易以及城市化新聞主題與股市變動密切,能準確預測當日股市漲跌。還有學者研究社交媒體的投資者情緒影響股票未來收益(徐巍等,2016;金德環(huán)等,2017)[17][18]。
相較于其他披露方式,管理層業(yè)績說明會受到各地證監(jiān)局的大力支持,上市公司自身的積極響應和深交所的嚴格管制,無論是披露時點、內容還是形式都比較規(guī)范。另外,參會的管理層是實名的,投資者是匿名的,雙方可就主要問題開誠布公交流,相關問題的回答比較徹底,信息挖掘比較深入,有的問題甚至會經(jīng)過多輪重復博弈,特別是采取網(wǎng)絡在線、實時動態(tài)的交流方式,使得一些無法事先預設、即問即答的話題能夠原汁原味地呈現(xiàn)出來,有助于降低管理層和投資者之間的潛在信息選擇性偏差和道德風險,預期可以給資本市場帶來新的信息增量:(1)降低信息選擇性偏差。由于信息披露具有經(jīng)濟后果,管理層有可能為了特殊利益而選擇性地披露信息,如時間、內容和方式的選擇來影響投資者的預期,對管理層業(yè)績說明會這一開放互動披露方式而言,投資者可以就自己關心的問題反復追問管理層,從而降低了信息不對稱風險,大大減少了公司只披露對自己有利信息而規(guī)避對自己不利信息的逆向選擇行為;(2)減少道德風險。公司通常的季報、年報和公告等其他披露方式是以集體名義披露,存在搭便車問題。而管理層業(yè)績說明會采取實名制,管理層個體要為自己說的話負責,最終交由資本市場去檢驗,即所有的信息都能承包到戶、責任到人,另外管理層對他們的聲譽資本是非常敏感的(李增泉等,2000)[19],這就意味著資本市場的聲譽約束機制可以抑制管理層的“語言膨脹”,減少道德風險。
不確定性是影響宏觀經(jīng)濟運行的潛在因子(Bloom et al.,2018)[20]。Ball and Sadka(2015)認為用會計盈余對經(jīng)濟增長的預測雖然合理,但實際情況更為復雜,真正起到資產(chǎn)定價作用的是盈余風險(Beaver et al.,1970;Fama and French,1995),盈余風險映射了微觀經(jīng)濟不確定性,可誘導宏觀經(jīng)濟更大幅波動。行為經(jīng)濟學的前景理論認為人們往往對損失比對獲得更敏感,即投資者在決策時對損失風險更敏感,考慮到我國尚處弱式有效市場、信息披露質量并不高,投資者對于正負語意信息的反應可能有所不同。對于正面語意信息,投資者為了決策更穩(wěn)健,需要花費更多的時間和渠道去驗證正面語意信息,而對于負面語意信息,投資者往往抱著“寧可信其有,不可信其無”的心態(tài),反而會及時做出風險規(guī)避決策。實驗研究也表明投資者在使用會計信息進行風險評估時,更看重負向預期而不是正向預期。在投資者情緒的作用下,會計準則變革引發(fā)的企業(yè)財務行為的變化通過一種加速傳導機制作用于資本市場和宏觀經(jīng)濟,學者們發(fā)現(xiàn)投資者情緒能夠引發(fā)資本市場波動和跨市場效應,即損失風險映射了微觀經(jīng)濟不確定性,可誘導資本市場乃至宏觀經(jīng)濟更大幅波動。因此,我們預期當面臨不確定性時,投資者對負向非預期盈余的反應大于對正向非預期盈余的反應,即投資者對負向語調的反應更及時并且也更顯著。
基于以上分析,本文選擇管理層業(yè)績說明會作為文本分析樣本,利用LSTM神經(jīng)網(wǎng)絡深度學習技術,提取管理層的語意,再把語意區(qū)分為正面語意和負面語意,并提出以下待檢驗假設H1和H2。
H1:在其他條件相同的情況下,資本市場會對管理層正面語意做出正向反應,但存在滯后期。
H2:在其他條件相同的情況下,資本市場會對管理層負面語意會做出更及時、更顯著地負向反應。
目前比較主流的文本分析方法是詞袋法(Bag of words),原理是忽略文本的詞序和語法,假定文本中每個詞不依賴于其他的詞,都是獨立的,僅將其看作是若干詞語所組成的集合。具體執(zhí)行步驟首先是通過分詞庫對文本進行分詞(中文如Jieba分詞庫,英文如NLTK庫),然后通過詞頻-逆文檔算法(TF-IDF)篩選出每個文本中一些關鍵詞,再載入語意/情感詞典進行比照,最終計算得到文本語意/情感概率值。
其中最關鍵的就是情感詞典的選用。國外相關研究主要基于四種英文情感詞典:(1)Henry詞典;(2)Harvard GI詞典;(3)Diction詞典;(4)Loughran and McDonald詞典。國內比較常見的中文情感詞典有臺灣大學情感詞典(NYU)、Hownet情感詞典、英文字典漢化(謝德仁等,2015;林樂等,2017)[4][6]。情感詞典最大的局限性就是缺乏普適性,特別是缺乏在財務會計領域的普適性。Loughran and McDonald(2011)[3]曾批評過Harvard詞典和Diction詞典的高誤判率,用Harvard和Diction詞典發(fā)現(xiàn)年報中MD&A的管理層語意和未來業(yè)績不存在正向關聯(lián)。Harvard詞典中75%的負向詞語,在金融文本中并不一定表示負向情緒,比如“稅收”“成本”“債務”和“折舊”等在詞典中被歸入負向詞語,但在年報文本中隨處可見,只不過是會計專業(yè)名詞,未必表示負向情緒。與前三種詞典相比較而言,盡管Loughran and McDonald詞典的主要特點是考慮了情緒詞典在財務會計領域的適用性,但在判斷準確率方面仍然差強人意,本文分別使用LSTM和詞袋法在對測試集樣本驗證后發(fā)現(xiàn),LSTM的總預測準確率約86.25%,高于詞袋法的總預測準確率75.65%。
人的思維具有連貫性,通常在閱讀時,人類不會孤立地理解所閱讀到的詞語,而會基于對前面詞語的理解來推斷后面詞語的意思。關于這一點,傳統(tǒng)的神經(jīng)網(wǎng)絡卻無法做到。比如你打算對一部電影里的某個鏡頭進行分析,想了解它正在上演什么。傳統(tǒng)的神經(jīng)網(wǎng)絡只能孤立地看待每一個鏡頭,而無法把上一個鏡頭串聯(lián)到下一個鏡頭發(fā)生的事情(Christopher Olah’s blog, 2015)[注]http://colah. github. jo/posts/2015-09-NN-Types-FP/?,F(xiàn)在RNN(循環(huán)神經(jīng)網(wǎng)絡)解決了這個問題,就是能夠讓信息在網(wǎng)絡中再次循環(huán)。LSTM(Long Short-Term Memory,譯為長短期記憶網(wǎng)絡)是一種特殊的RNN,能夠重復學習并記憶以前的信息,并連接到當前的任務中來?;诖?,本文雇傭10名會計和金融專業(yè)研究生,首先對2005~2007年業(yè)績說明會文本進行人工標注(正面語意標注為1,負面語意標注為0),并相互比對,保留標注一致性的文本作為語料庫(其中管理層正向語意20001條,負向語意20435條),然后利用LSTM讀取語料庫并深度學習出管理層語意特征,最后去識別2010~2014年度的業(yè)績說明會的管理層語意。LSTM法避免了詞袋法沒有考慮上下文因果邏輯和普適性不足的缺陷,較好地切合所研究樣本的語境特點,實現(xiàn)了文本分析法的改進。
本文借鑒Loughran and McDonald(2011)、Price(2012)、林樂(2016,2017)[3][4][5][8]等的方法,構建上市公司業(yè)績說明會管理層語意(MEANING)衡量指標如下:
MEANING_pos=POSNUM/(POSNUM+NEGNUM)當POSNUM>NEGNUM
MEANING_neg=-NEGNUM/(POSNUM+NEGNUM)當POSNUM 其中,MEANING_pos是t年第i家上市公司業(yè)績說明會管理層正向語意,等于管理層正向回答問題數(shù)目(POSNUM)占全部問題數(shù)目的比例,0.5 本文研究樣本來自全景網(wǎng)投資者關系互動平臺(http://rs.p5w.net),利用Python程序爬取2010~2014年全景網(wǎng)所有上市公司年度業(yè)績說明會上管理層和投資者之間問答文本,刪除ST公司和針對IPO前召開的業(yè)績說明會,經(jīng)過數(shù)據(jù)清洗,最終得到12萬余條文本,合計3276個公司年觀測值,其中1710個公司年觀測值呈現(xiàn)正向語意,1566個公司年觀測值呈現(xiàn)負向語意,168個公司年觀測值呈現(xiàn)中性語意。本研究所需的其他數(shù)據(jù)來源于CSMAR和WIND數(shù)據(jù)庫。在回歸前,對所有連續(xù)變量上下1%進行winsorize,以避免異常值影響。數(shù)據(jù)清洗和統(tǒng)計分析使用Pandas庫和STATA統(tǒng)計軟件。 本文采用事件研究法,借鑒林樂等(2016;2017)[5][6]、Loughran and McDonald(2011)[3]等研究,構建了如下市場反應與管理層語意的多元回歸模型: CAR=β0+β1MEANING+β2SUE+β3SIZE+β4LEV+β5ROA+β6GROWTH+ β7AGE+∑IND+∑YEAR+ε (1) 在模型(1)中,被解釋變量是股票超額累計收益率(CAR),包括短窗口期CAR[0,3]、中窗口期CAR[0,10]和長窗口期CAR[0,20]。解釋變量是管理層語意(MEANING),分為正面語意(MEANING_pos)和負面語意(MEANING_neg)。根據(jù)假說H1和H2,預期MEANING_pos的系數(shù)顯著為正,MEANING_neg的系數(shù)顯著為負??刂谱兞坑校篢年末未預期盈余(SUE)、T年末上市公司資產(chǎn)規(guī)模對數(shù)(SIZE)、T年末財務杠桿(LEV)、T年末資產(chǎn)收益率(ROA)、T年成長率(GROWTH)、截至T年末上市年限(AGE)。同時還控制了行業(yè)(IND)和年度(YEAR)。 表1給出了全樣本和子樣本下CAR單變量均值檢驗結果,在全樣本情況下CAR[0,3]的均值是0.0153(t值是3.38),在1%水平上顯著;CAR[0,10]的均值是0.0353(t值是6.98),在1%水平上顯著,可見業(yè)績說明會無論在短窗口期還是在中長窗口期,市場反應均顯著不等于0,這表明業(yè)績說明會具有信息含量;在劃分為正面語意和負面語意兩組子樣本情況下,正面語意樣本CAR[0,3]均值不顯著異于0,而CAR[0,10]在1%水平上顯著大于0,說明正面語意的市場反應可能存在一定滯后期;負面語意樣本無論是短窗口期CAR[0,3]還是在中長窗口期CAR[0,10],市場反應均顯著不等于0;此外,負面語意樣本比正面語意樣本短窗口期CAR[0,3]均值大0.0113(t值是2.66),中長窗口期CAR[0,10]均值大0.0281(t值是2.98),均在1%水平上顯著,說明負面語意樣本市場反應比正面語意樣本更強烈。 表1 全樣本及子樣本CAR單變量均值檢驗 注*、** 和*** 分別表示10%、5%和1%的顯著性水平,CAR值取絕對值。 表2是主要變量的描述性統(tǒng)計結果。其中,管理層正面語意比負面語意的觀測數(shù)稍多一些(1710:1566),這比較符合業(yè)績說明會的答疑實質,即大多數(shù)投資者在業(yè)績說明會上就自己關心的問題提出各種質疑,更多的時候是表現(xiàn)出負面情緒,而管理層是盡可能地用正面語意來回答投資者的各種質疑,LSTM深度學習的結果準確地捕捉了這一雙方勢均力敵的博弈情況。正面語意的均值(中值)是0.6413(0.6250),標準差是0.0946,最大值是1,最小值是0.5048,負面語意的均值(中值)是-0.6311(-0.6111),標準差是0.0922,最大值是-0.4717,最小值是-1。未預期盈余(SUE)的均值和中值為負,資產(chǎn)規(guī)模的對數(shù)(SIZE)均值是21.4571,ROA的均值(中位數(shù))是0.0458(0.1312)均為正,說明公司整體盈利能力良好,其余變量與前期文獻基本一致。 本文對主要變量進行了Pearson和Spearman相關性檢驗,在正面語意樣本組,MEANING_pos與CAR[0,3]、CAR[0,10]正向但不顯著相關,與CAR[0,20]在10%水平上顯著正相關。在負面語意樣本組,MEANING_neg與CAR[0,3]、CAR[0,10]和CAR[0,20]均在1%水平上顯著負相關。其他控制變量的VIF均小于5,故模型不存在多重共線性問題。 表2 多變量描述性統(tǒng)計 本文對正面語意和負面語意兩個樣本組,分別按照正面語意和負面語意(MEANING_pos/MEANING_neg)從小到大五等分,并對CAR[0,3]、CAR[0,10]和CAR[0,20]三個短、中、長窗口進行均值差異檢驗。首先對MEANING_pos分五組,最大組和最小組短窗口期CAR[0,3]的均值差異為0.0375(t值是1.27),中窗口期CAR[0,10]的均值差異為0.0407(t值是1.36),在10%水平上不顯著,長窗口期CAR[0,20]的均值差異為0.0669(t值是2.21),在5%水平上顯著,可見,管理層正面語意越大,CAR值越大,但兩者在短中窗口期CAR[0,3]、CAR[0,10]并不顯著正相關,但在長窗口期CAR[0,20]呈現(xiàn)顯著正相關性。然后對MEANING_neg分五組,最大組和最小組CAR[0,3]的均值差異為-0.0289(t值是-1.87),在10%水平上顯著,CAR[0,10]的均值差異為-0.0409(t值是-2.59),在1%水平上顯著,CAR[0,20]的均值差異為-0.0645(t值是-2.75),在1%水平上顯著,這說明管理層負面語意越大,CAR值越大,兩者在短、中窗口期和長窗口期均顯著負相關。 表3報告了多元回歸模型的回歸結果:(1)在正面語意樣本組中,管理層正面語意(MEANING_pos)對CAR[0,3]的回歸系數(shù)為0.0206(t值為1.31),在10%水平上不顯著,CAR[0,10]的回歸系數(shù)為0.0407(t值為1.37),在10%水平上不顯著,而CAR[0,20]的回歸系數(shù)為0.1255(t值為3.02),在1%水平上顯著,說明資本市場上的投資者并未及時對管理層正面語意做出反應,存在一定的滯后期,基本支持研究假說H1。(2)在負面語意樣本組中,管理層負面語意(MEANING_neg)對CAR[0,3]的回歸系數(shù)為-0.2688(t值為-3.58),在1%水平上顯著,CAR[0,10]的回歸系數(shù)為-0.3425(t值為-3.94),在1%水平上顯著,CAR[0,20]的回歸系數(shù)為-0.4413(t值為-4.69),在1%水平上顯著。再進一步對CAR[0,3]和CAR[0,10]的回歸系數(shù)作組間差異性檢驗,結果為-0.074(Chi2值為0.05),在10%水平上不顯著。CAR[0,3]和CAR[0,20]組間回歸系數(shù)差異的結果為-0.173(Chi2值為0.28),在10%水平上不顯著,表明投資者在短窗口已經(jīng)開始對管理層負面語意做出及時并且顯著的負向反應,從而支持研究假說H2。本文的研究發(fā)現(xiàn)與行為經(jīng)濟學的前景理論和相關前期文獻的結論是一致的。 本文的研究一方面為行為經(jīng)濟學的前景理論提供了經(jīng)驗證據(jù),另一方面提供了政策啟示:第一,上市公司業(yè)績說明會這樣的非財務信息披露形式,是財務信息披露的有益補充,有利于提高資本市場配置效率。監(jiān)管部門未來可在非財務信息披露的形式多樣性、內容互動性、現(xiàn)場即時性等方面做進一步拓展,積極引導上市公司實時、主動、全方位地披露財務和非財務信息,切實有效地保護公司外部投資者的利益。第二,加大規(guī)范非財務信息披露的內容和質量。從目前業(yè)績說明會上管理層回答的內容來看,并不是每家公司都會做全面細致的披露,存在避重就輕、欲說還休的情形。監(jiān)管部門應當在現(xiàn)有的“規(guī)范指引”基礎上,進一步規(guī)范公司非財務信息內容的廣度和深度,加強約束、拉高準繩。第三,完善技術手段,建立非財務信息預警體系。如果說公司非財務信息具有信息增量,能夠修正投資者情緒,那么對于建立非財務信息預警體系,緩解未來股價崩盤風險具有重大實踐意義。 表3 多元回歸結果 注:括號內為t值,*、** 和*** 分別表示10%、5%和1%的顯著性水平。 本文進一步研究管理層語意可否作為投資者股票交易策略的因子之一?基于Fama and French(1993)三因子模型,通過計算管理層語意在低分位組和高分位組之間,三因子模型的Alpha值是否存在顯著差異,用以驗證該問題。具體步驟如下:(1)先根據(jù)上一年度的管理層語意,對所有樣本公司進行五分位排序;(2)再對下一年度第一分位和第五分位的公司進行三因子模型回歸;(3)最后比較五分位前后Alpha值是否存在顯著差異。如果存在顯著差異,則說明投資者在進行股票交易時,會把管理層語意作為股票交易策略因子之一。 表4 基于三因子模型的管理層語意分位回歸結果 注:括號內為t值,*、** 和*** 分別表示10%、5%和1%的顯著性水平。 表4是2010~2014五個年度分別根據(jù)上一年度管理層正面語意,分位前后的三因子模型回歸結果。可以發(fā)現(xiàn)2010、2011和2013三個年度的Alpha值在分位前后均不顯著異于0,2012和2014年Alpha值雖然顯著大于0,但分位前后的差異并不顯著(t值分別是1.32和1.05),說明基于正面語意分位,并未給投資者帶來超額Alpha收益,因此本文沒有證據(jù)支持投資者在進行股票交易時,會把管理層語意作為交易策略因子之一。同樣基于管理層負面語意的分位研究,得到類似的結果(限于篇幅,圖表省略)。 為了確保結論的穩(wěn)健性,本文進行了多種穩(wěn)健性檢驗:(1)采用幼稚模型(Naive Model)重新計算CAR[0,3]和CAR[0,10],用窗口(-200,-20)作為估計期,回歸結果保持不變。(2)選用不同長度的窗口計算CAR值。具體包括短窗口(-3,1)、(-3,3)以及長窗口(3,30)、(3,60)和(3,90),回歸結果保持一致。(3)分別基于用四因子和五因子模型,對管理層語意進行分位回歸,回歸結果基本一致。仍然支持假說H1和H2。 本文基于2010~2014年間我國上市公司年度業(yè)績說明會上管理層披露的文本內容,選用LSTM深度學習技術,對管理層的回答文本進行分析,研究投資者能否聽懂管理層所表達的真正語意并做出相應的反應(用業(yè)績說明會前后的市場異?;貓髞砗饬?。研究發(fā)現(xiàn)投資者對正面語意在短窗口期內并未做出顯著的正向反應,但卻在長窗口期內做出顯著的正向反應,而投資者對負面語意無論是在短窗口還是長窗口期內都做出顯著的正向反應。這些結果說明,我國資本市場上的投資者能夠聽懂管理層所傳遞的“話里話、弦外音”,不過投資者對好消息的反應存在一定滯后期,對壞消息的反應更為及時,驗證了行為經(jīng)濟學領域的前景理論。此外也說明作為一種新興的非財務信息披露渠道,管理層業(yè)績說明會確實具有信息含量,是一種行之有效的實踐操作方式。 不同于前期文獻普遍采用的詞袋文本分析法,本文率先選用LSTM深度學習技術,某種程度上可以避免詞袋法存在的不同學科詞典不兼容、無法捕捉文本因果關系以及詞義誤判等缺陷,正如Leuz and Wysocki(2016)[21]所指出,文本應當是試圖反映所屬行業(yè)領域的經(jīng)濟現(xiàn)實,倘若將文本與行業(yè)背景相分離,那將是影響所有會計質量指標的基本問題。而LSTM深度學習是基于前期管理層業(yè)績說明會自身文本信息,最少損失地提取文本特征并用于分析后期業(yè)績說明會文本信息,既可以消除了詞典的兼容問題,又可以捕捉文本因果關系,最終降低詞義誤判,提高回歸準確率。該方法具有良好的普適性,可以推廣到其他非財務信息披露研究領域,但是必須指出的是,對語料庫的準確標注是決定LSTM深度學習成功的關鍵因素。 未來在研究方法和研究領域方面可做進一步拓展:(1)在文本分析法基礎上,結合聲音軟件(比如測謊軟件)、圖像識別技術等測量管理層語氣和相貌等特征,捕捉全方位、多維度的非財務信息;(2)可借助剛剛興起的“從微觀數(shù)據(jù)到宏觀經(jīng)濟”理論框架,以管理層語意為切入點,研究其在宏觀經(jīng)濟預測中的應用價值及作用機制,服務于經(jīng)濟政策制定和微觀企業(yè)實踐。(二)樣本與數(shù)據(jù)
(三)研究模型與變量
四、實證結果及分析
(一)描述性統(tǒng)計
(二)多元回歸分析
(三)基于三因子模型的進一步分析
(四)穩(wěn)健性檢驗
五、結 論