上市公司披露的社會(huì)責(zé)任信息“通俗易懂”嗎？

2022-07-16 11:48:29段釗周紅周輝

宏觀質(zhì)量研究 2022年4期

關(guān)鍵詞：可讀性企業(yè)社會(huì)責(zé)任機(jī)器學(xué)習(xí)

段釗周紅周輝

摘要：文本的“通俗易懂”是證券市場信息披露質(zhì)量的前提與保證，為此提供了一個(gè)上市公司社會(huì)責(zé)任報(bào)告可讀性質(zhì)量評(píng)估的解決方案：首先，結(jié)合證券市場信息披露動(dòng)機(jī)及閱讀行為分析，提出了一個(gè)基于“閱讀效率”與“適應(yīng)水平”的兩維度可讀性質(zhì)量評(píng)估模型;其次，設(shè)計(jì)并驗(yàn)證了一個(gè)基于機(jī)器學(xué)習(xí)的信息披露文本可讀性質(zhì)量評(píng)估的方法;最后，對(duì)我國上市公司2009-2017年發(fā)布的社會(huì)責(zé)任報(bào)告可讀性質(zhì)量水平進(jìn)行了測度，并對(duì)全樣本的總體與結(jié)構(gòu)特征進(jìn)行了數(shù)據(jù)分析。研究發(fā)現(xiàn)：我國上市公司社會(huì)責(zé)任報(bào)告可讀性水平整體呈正態(tài)分布且逐年提升;不同行業(yè)與年份組間差異顯著，行業(yè)異質(zhì)性和外部政策變化可能是差異出現(xiàn)的主要原因。上述模型為信息披露質(zhì)量評(píng)估提供了一個(gè)新的思路，評(píng)價(jià)方法有效減少了可讀性質(zhì)量評(píng)估中主觀性干擾問題;同時(shí)研究結(jié)果為后續(xù)實(shí)證研究提供了一組新的量化數(shù)據(jù)，也為證券市場信息披露監(jiān)管提供了新的啟示。

關(guān)鍵詞：信息披露;企業(yè)社會(huì)責(zé)任;機(jī)器學(xué)習(xí);可讀性

一、引? 言

2020年10月，國務(wù)院印發(fā)了《關(guān)于進(jìn)一步提高上市公司質(zhì)量的意見》，明文要求“上市公司及其他信息披露義務(wù)人要充分披露投資者作出價(jià)值判斷和投資決策所必需的信息，并做到簡明清晰、通俗易懂”;同時(shí)，為了落實(shí)新證券法，完善信息披露制度，證監(jiān)會(huì)在2021年5月開始實(shí)施的《上市公司信息披露管理辦法》中，新增了信息披露中“通俗易懂”的原則性要求。顯而易見，伴隨注冊制的推行與信息披露規(guī)則體系的完善，披露文本可讀性不僅將成為我國證券市場監(jiān)管的一個(gè)重要對(duì)象，也成為衡量信息披露質(zhì)量的重要指標(biāo)之一，有必要對(duì)其開展系統(tǒng)與深入的研究，實(shí)現(xiàn)對(duì)“通俗易懂”水平的客觀、準(zhǔn)確與量化評(píng)估。

作為信息披露質(zhì)量的保證與前提（Chen，2020;張秀敏等，2017），披露文本的可讀性對(duì)于降低市場不確定性、提升溝通效率、保護(hù)投資者，以及信用評(píng)級(jí)、分析師預(yù)測等方面具有重要影響（Bonsall，2017;Luo，2018;Ahsan，2018;Hassan，2019;Muslu，2019;Seifzadeh，2020）。近年來，相關(guān)的實(shí)證研究提出了一些中文披露信息可讀性的評(píng)估方法：如有文獻(xiàn)采用公式法針對(duì)深市B股公司年報(bào)采用公式法對(duì)其進(jìn)行了可讀性評(píng)估（閻達(dá)五等，2002），在此基礎(chǔ)上有研究者借鑒Smith等（1992）的方法，設(shè)計(jì)完形填空測試，讓具有會(huì)計(jì)專業(yè)背景被試者參與評(píng)估（孫蔓莉，2004）;還有研究者以A股上市公司的年報(bào)為樣本，選取平均單句詞數(shù)以及難詞的比例為指標(biāo)衡量可讀性，借助Python語言對(duì)全樣本進(jìn)行了可讀性評(píng)估（葉勇等，2018）;也有學(xué)者借鑒英文可讀性中常用的Fog指數(shù)（Li，2008），并結(jié)合中文相關(guān)語言學(xué)研究成果，從分句平均字?jǐn)?shù)、每句話中副詞和連詞比例以及前兩者的簡單算術(shù)平均這三個(gè)角度構(gòu)建可讀性評(píng)價(jià)指標(biāo)（徐巍等，2021）。此外，有研究認(rèn)為文本間的邏輯關(guān)系正是導(dǎo)致讀者理解難度上升的主要因素，從文本邏輯和字詞兩方面構(gòu)建了文本可讀性評(píng)估變量（王克敏等，2018）。但總體來說，由于目前缺乏權(quán)威性的標(biāo)準(zhǔn)，披露文本可讀性評(píng)估研究中仍存在依賴評(píng)價(jià)者的主觀經(jīng)驗(yàn)，隨意性較強(qiáng)，以及信息接受者需求導(dǎo)向不明確等問題。

另一方面，現(xiàn)有研究大部分基于內(nèi)容與格式有明確規(guī)定的年報(bào)或董事會(huì)報(bào)告展開，針對(duì)更容易進(jìn)行語義操縱和實(shí)施印象管理的企業(yè)社會(huì)責(zé)任（CSR）報(bào)告較為少見。而CSR報(bào)告作為非財(cái)務(wù)信息披露的主要形式，向市場傳遞著企業(yè)可持續(xù)發(fā)展能力的信號(hào)（段釗等，2017），對(duì)利益相關(guān)者的決策發(fā)揮著越來越重要的影響（Ben A.，2018;劉媛媛等，2019;唐國平等，2019）。相對(duì)于年報(bào)而言，CSR報(bào)告具有更高的自主性、靈活性、多樣性與不確定性;并且通常由專業(yè)人員進(jìn)行編制，有著篇幅長、議題豐富、表述相對(duì)正式、專業(yè)詞匯使用較多、語義相對(duì)固定，邏輯復(fù)雜度高等特征，在其可讀性質(zhì)量評(píng)估中需要有針對(duì)性地設(shè)計(jì)。雖然有文獻(xiàn)通過對(duì)CSR報(bào)告的封面色彩、平均句長、頁數(shù)與圖片數(shù)量進(jìn)行標(biāo)準(zhǔn)化處理得到可讀性指數(shù)（吉利等，2016），但是，類似的變量設(shè)計(jì)考慮更多的是“易讀性”問題，注重披露信息的外在形態(tài)，而未涉及文本表意的明確與否，對(duì)“通俗易懂”的內(nèi)涵表達(dá)尚不夠充分。

針對(duì)現(xiàn)有研究中的主要問題，本文首先結(jié)合信息披露動(dòng)機(jī)及閱讀行為分析，構(gòu)建了一個(gè)基于效率與適應(yīng)水平的兩維度可讀性質(zhì)量評(píng)估模型，給出了一個(gè)基于時(shí)間數(shù)據(jù)的CSR報(bào)告可讀性質(zhì)量評(píng)估的思路;設(shè)計(jì)并驗(yàn)證了一個(gè)基于機(jī)器學(xué)習(xí)的披露文本可讀性質(zhì)量評(píng)估的方法，并對(duì)我國2009-2017年上市公司發(fā)布的CSR報(bào)告的全樣本進(jìn)行了測度;最后，對(duì)上市公司整體、各行業(yè)、各年份以及不同產(chǎn)權(quán)性質(zhì)下的CSR報(bào)告可讀性的總體以及結(jié)構(gòu)與分布特征進(jìn)行了分析與討論。本文可能的邊際貢獻(xiàn)在于：第一，本文提出的CSR報(bào)告可讀性質(zhì)量評(píng)估模型緊扣“通俗易懂”這一信息披露質(zhì)量要求，在評(píng)估方法上相較于以往的評(píng)價(jià)主觀性強(qiáng)、缺乏可比性等問題，具有客觀性強(qiáng)、標(biāo)準(zhǔn)統(tǒng)一、可量化對(duì)比、有效可靠與自適應(yīng)的特點(diǎn)，并可以為相關(guān)場景的應(yīng)用提供借鑒;第二，通過全樣本、橫縱向分析，得到了一組全新的、系統(tǒng)與可量化的上市公司信息披露質(zhì)量的特征數(shù)據(jù)，為相關(guān)理論與應(yīng)用研究提供了重要的基礎(chǔ);第三，在實(shí)踐中，有助于“印象管理”與市場操縱行為的識(shí)別，為信息披露質(zhì)量評(píng)估與監(jiān)管提供了一個(gè)新的工具。

二、文獻(xiàn)回顧與CSR信息披露中的可讀性

（一）可讀性質(zhì)量評(píng)估模型

“通俗易懂”的內(nèi)涵并不復(fù)雜，即更多的人更容易理解信息傳遞的內(nèi)容，但如何有效衡量與測度卻并不容易。受到閱讀者的知識(shí)背景、興趣愛好、閱讀動(dòng)機(jī)、閱讀策略與認(rèn)知能力等因素的影響（李廣建，1989），不同的閱讀者對(duì)于相同文本評(píng)估結(jié)果會(huì)有很大的差異，情境因素也會(huì)對(duì)閱讀者的感受產(chǎn)生干擾。顯而易見，根據(jù)專家或者實(shí)驗(yàn)被試者的閱讀感受，直接得出定性或定量結(jié)論，這種“以己度人”的方式很難消除主觀性與標(biāo)準(zhǔn)不一致的問題;雖然，一些研究通過問卷調(diào)查、回答問題與完形填空等方式（Taylor，1953），力求建立一個(gè)相對(duì)客觀的判斷標(biāo)準(zhǔn)，但也會(huì)面臨抽樣與樣本完整性的挑戰(zhàn)（張秀敏等，2017），針對(duì)特定人群的小樣本評(píng)估效果可能有一定的效果，而在多主體、大樣本的評(píng)估在實(shí)踐中往往很難開展。此外，根據(jù)披露文本中的專業(yè)術(shù)語密度、次常用字密度、句法復(fù)雜度與句子結(jié)構(gòu)等（Lu，2010;Flor，2013;陳銀娥等，2017;任宏達(dá)等，2018）等指標(biāo)來量化，不僅在特征變量選擇、模型構(gòu)建上易受到研究者知識(shí)、經(jīng)驗(yàn)和偏好的影響，在指標(biāo)的賦權(quán)上也會(huì)存在缺乏依據(jù)的情況，從而導(dǎo)致統(tǒng)計(jì)值與真實(shí)值之間的偏差（孫文章等，2019）?？傮w來說，語言的模糊性與認(rèn)知的主觀性和復(fù)雜性，造成披露文本可讀性評(píng)估往往是“知易行難”。從實(shí)踐目的出發(fā)，解決問題的關(guān)鍵需要緊扣 “通俗易懂”這一信息披露政策要求，基于CSR信息披露者與閱讀者目的與行為特征，以及證券市場信息披露情境，重新理解與界定“可讀性”。

基于信號(hào)傳遞理論，信息披露的主要目的是降低信息發(fā)送者與接收者之間的信息不對(duì)稱程度（Li，2008），減少對(duì)利益相關(guān)者帶來的困惑和猶豫。上市公司在編制CSR報(bào)告時(shí)，能否將信息清晰地、實(shí)質(zhì)性地傳遞出去，滿足合規(guī)性的要求，理論上是其首先考慮的因素;而文采是否優(yōu)美和在陳述與修辭上進(jìn)行修飾以達(dá)成契合與共鳴等，通常并不是報(bào)告編寫中的主要出發(fā)點(diǎn)。在這樣的披露動(dòng)機(jī)下，披露的信息并不是要達(dá)到“一千個(gè)讀者眼中有一千個(gè)哈姆雷特”的效果，而是要盡可能地讓不同信息接收者達(dá)成對(duì)報(bào)告理解的一致性狀態(tài)，這種一致性包含兩個(gè)方面：與信息發(fā)送方所表達(dá)含義一致，以及不同信息接收者之間在理解上的一致。然而，由于語言的模糊性，現(xiàn)實(shí)中披露方在編制文本時(shí)一般擁有很大的策略空間，從自利的考慮出發(fā)，一些情況下，上市公司會(huì)刻意操縱可讀性水平，如設(shè)置一些特定的邏輯關(guān)系，采用抽象描述或特定語法結(jié)構(gòu)等，以達(dá)到文本操縱與印象管理的目的（田利輝等，2017;Bacha，2019;Ben A和Belgacem，2018;Loughran，2020），從而造成披露方意圖表達(dá)的信息與實(shí)質(zhì)信息往往存在差異。因而，站在質(zhì)量評(píng)估與監(jiān)管的立場，CSR信息披露是否“通俗易懂”，意味著是否能夠適應(yīng)信息接收者不同認(rèn)知水平，容易達(dá)成對(duì)實(shí)質(zhì)信息理解上的趨同。即不同的人在閱讀同一信息達(dá)成正確判斷時(shí)，其認(rèn)知成本差異較小，達(dá)成一致性正確判斷所花的代價(jià)較低。我們將這一可讀性質(zhì)量評(píng)估維度稱為“適應(yīng)水平”。

對(duì)信息接收方而言，CSR報(bào)告的讀者一般為利益相關(guān)方，閱讀目的通常是想從公開信息中發(fā)現(xiàn)企業(yè)可持續(xù)發(fā)展能力的特定信號(hào)以提高決策效率。即使在現(xiàn)階段參與者以中小投資者為主的我國證券市場，也有證據(jù)顯示，投資者仍然具有強(qiáng)烈的投資理性和獲得各類信息的動(dòng)機(jī)，以便資產(chǎn)價(jià)值能夠在投機(jī)干擾下回歸理性（趙子夜等，2019）。因而，一般情況下，在閱讀的過程中，他們在主觀上會(huì)保持一種理性與謹(jǐn)慎的態(tài)度;因?yàn)橐坏┐嬖诶斫馍系钠?，閱讀者可能會(huì)承受相應(yīng)的經(jīng)濟(jì)與社會(huì)行為后果。但是，與財(cái)務(wù)指標(biāo)為主的內(nèi)控信息不同，CSR報(bào)告閱讀的過程中，相關(guān)決策知識(shí)的形成往往來自于利益相關(guān)者對(duì)搜尋到的信息的再加工，并不容易從文本中直接獲得?；诖?，從信息接收方的目的與行為方式出發(fā)，應(yīng)主要考慮閱讀者對(duì)文本中的有效信息搜尋與編碼的效率，即信息接收者越容易找到對(duì)其決策有幫助的內(nèi)容，并做出正確的判斷，CSR報(bào)告越是“通俗易懂”，反之亦然。我們將這一評(píng)估維度稱為“閱讀效率”。

根據(jù)上述兩個(gè)維度，從考察是否能實(shí)現(xiàn)有效信息傳遞以達(dá)到“通俗易懂”，我們將CSR信息披露文本可讀性分為四種不同類型，如圖1所示。其中，第1種類型閱讀者信息搜尋與再加工的效率最高，且容易與他人形成一致的正確理解。第2種與第3種類型可讀性處于中間水平，代表“易懂不通俗”和“通俗不易懂”的兩種情況，這也是文本操縱與印象管理中最常見的方式?！耙锥煌ㄋ住敝搁喿x者從披露文本中搜尋到有效信息的難度并不大，但不同類型的閱讀者據(jù)此形成的知識(shí)具有差異，常見的情況是在框定效應(yīng)的作用下（Hellmann，2017;Chung，2019），專業(yè)知識(shí)的欠缺和信息的弱勢的閱讀者會(huì)被披露方所“誤導(dǎo)”;而“通俗不易懂”指披露文本一般歧義較少，但其中存在大量冗余信息，找到關(guān)鍵信息并形成決策知識(shí)并不容易，閱讀者要花費(fèi)較大的信息搜尋與編碼成本。

（二）可讀性的測度

對(duì)披露文本的閱讀效率與適應(yīng)水平進(jìn)行系統(tǒng)、可量化的測度，是實(shí)現(xiàn)可讀性質(zhì)量評(píng)估的關(guān)鍵。從現(xiàn)有可讀性測度技術(shù)路線來看，可大致分為兩類：一類是基于公式計(jì)量的方式，一類是基于機(jī)器學(xué)習(xí)的方式。公式計(jì)量源于美國學(xué)者Lively等（1923），1923年他們通過對(duì)初中英文教材詞匯難度進(jìn)行的考察，構(gòu)建了第一個(gè)英文文本可讀性評(píng)估公式;此后Vogel等（1928）在1928年提出了Winnetka公式，通過使用回歸方程的方法，將詞匯和語法等文本特征納入可讀性公式來評(píng)估兒童文本的理解程度;伴隨著研究的深入，一些研究者從不同角度對(duì)可讀性公式進(jìn)行改進(jìn)，比較有影響的如Flesch與Dale-Chall（Flesch，1948;Dale，1948）以及近年來使用頻繁的Fog指數(shù)（Li，2008）和Bog指數(shù)（Bonsall，2017）等測量公式。中文文本可讀性的評(píng)估起步相對(duì)較晚，早期研究多集中于教育領(lǐng)域，主要借鑒國外可讀性公式設(shè)計(jì)思路，結(jié)合具體的應(yīng)用場景，提出中文文本可讀性測量公式（Yang，1970;孫剛，2015;荊溪昱，1995;宋曜廷等，2013）：如有文獻(xiàn)（張寧志，2000）對(duì)29部常用教材的語料進(jìn)行分析，設(shè)計(jì)了中文可讀性公式的雛形;還有研究者（王蕾，2017）基于對(duì)外漢語教學(xué)的分析，提出了一個(gè)衡量記敘性文本的難易度的可讀性公式。伴隨著信息技術(shù)的發(fā)展，研究者開始將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于該問題，通過人工標(biāo)注語料庫，學(xué)習(xí)不同難度級(jí)別語料特征，構(gòu)建分類器或比較器模型，對(duì)目標(biāo)文本進(jìn)行可讀性難度級(jí)別分析。如Si（2001）將一元詞串隸屬度模型引入可讀性研究，首次將文本可讀性分析與機(jī)器學(xué)習(xí)聯(lián)系起來;Collins-Thompson（Colins，2004）等在Si的研究基礎(chǔ)上加大了訓(xùn)練模型，采用Good-Turing平滑算法，提高了文本可讀性預(yù)測的準(zhǔn)確性。近年來，機(jī)器學(xué)習(xí)的方法在一些領(lǐng)域顯示出較好的應(yīng)用前景（Kate，2010;Kim，2012;McNamara，2015;Nandhini，2016;Jin，2018）。

從目前的研究進(jìn)展來看，由于中文與英文在語言特征上存在差異（顧曰國，1992;孟慶濤，2009），基于中文字、詞、句長度與音節(jié)等結(jié)構(gòu)性特征構(gòu)建的公式，其有效性還有待進(jìn)一步驗(yàn)證;同時(shí)，CSR報(bào)告作為一種規(guī)范性的信息披露文本在陳述方式上往往非常相似，結(jié)構(gòu)特征差異并不明顯，采用公式計(jì)量的方式，用一把通用的“尺子”，很難將結(jié)構(gòu)類似文本的可讀性有效區(qū)分開來。而在機(jī)器學(xué)習(xí)研究中，語料庫通常需要進(jìn)行人工標(biāo)注，除成本高外，也難以排除標(biāo)注過程中的主觀性干擾，涉及大規(guī)模標(biāo)注時(shí)，標(biāo)準(zhǔn)的一致性又難以保證，存在分類的可靠性與穩(wěn)定性問題。相對(duì)而言，如果能解決語料庫構(gòu)建的問題，基于機(jī)器學(xué)習(xí)構(gòu)建分類器的方式，在中文披露文本的可讀性測度上會(huì)更具有優(yōu)勢。

可讀性本質(zhì)上源于個(gè)體主觀感受，我們可能都會(huì)認(rèn)同某一文本的確“通俗易懂”，但不同的人從不同的經(jīng)驗(yàn)出發(fā)，往往會(huì)做出不同程度的判斷。而這些沒有量綱的描述，通常是不可以直接進(jìn)行比較的。例如，在給定相同的語料與標(biāo)注說明的情況下，不同的標(biāo)注者往往會(huì)達(dá)成相同的意見，但卻給出不同的評(píng)估絕對(duì)值;雖然可以運(yùn)用排序方法得到文本的兩兩相對(duì)難度關(guān)系（Schlkopf，2006;Tanaka-Ishii，2010），但一般只能做到文檔的相互比較，難以達(dá)到段落或篇章水平兩兩比較，且大規(guī)模標(biāo)注的成本很高。提高客觀性與評(píng)估標(biāo)準(zhǔn)的一致性是本文測度方法設(shè)計(jì)的主要考慮。從“通俗易懂”原則出發(fā)，我們認(rèn)為閱讀效率與適應(yīng)水平兩個(gè)可讀性質(zhì)量評(píng)估維度，涉及個(gè)體和群體信息搜尋成本，而信息搜尋成本可以通過時(shí)間這一客觀指標(biāo)，轉(zhuǎn)化為閱讀者行為特征來進(jìn)行有效測量?；诖?，本文用同一語料多個(gè)閱讀者的耗費(fèi)時(shí)間均值來測度閱讀效率;由同一語料多個(gè)閱讀者的耗費(fèi)時(shí)間標(biāo)準(zhǔn)差來測度適應(yīng)水平。這樣，不僅很好地滿足了兩維度測量的構(gòu)念效度，也可以有效解決語料標(biāo)注中的主觀性問題，保證了可讀性質(zhì)量評(píng)估結(jié)果的可靠性。

三、CSR信息披露可讀性質(zhì)量評(píng)估方法

（一）CSR報(bào)告語料采集

目前尚未有專門針對(duì)CSR報(bào)告的人工標(biāo)注語料庫，需要研究者進(jìn)行自行設(shè)計(jì)與構(gòu)建。除滿足語料庫構(gòu)建中的一般性原則外，CSR報(bào)告可讀性語料還需從文本特殊性出發(fā)，考慮提供真實(shí)的數(shù)據(jù)資源和深層次的語言信息的功能。文本抽樣是一個(gè)關(guān)鍵性問題，如果所抽取的樣本存在較大的系統(tǒng)性偏差或代表性偏差，將直接影響機(jī)器學(xué)習(xí)的有效性。在抽樣數(shù)量有限的約束下，若通過隨機(jī)抽樣，樣本結(jié)構(gòu)與總體結(jié)構(gòu)存在差異的可能性會(huì)很大，如果代表性偏差不能很好控制，那就意味著，語料庫可能只適用于某一話語特征文本的評(píng)價(jià)。與之相對(duì)應(yīng)，CSR報(bào)告同一文本中上下文表述類型差異較小，因而通過人工控制進(jìn)行分層抽樣，可以有效提取出更多類型的文本，且保證系統(tǒng)性偏差的可控。另外，CSR報(bào)告總體上數(shù)量并不大，且人工標(biāo)注成本較高，分層抽樣也有利于提升機(jī)器學(xué)習(xí)的效率。

我們對(duì)所收集的報(bào)告按類型隨機(jī)抽樣、文本分割、主題合并、分層抽樣的流程，盡可能控制了抽樣偏差的出現(xiàn)，并結(jié)合閱讀者的習(xí)慣，對(duì)提取的語料進(jìn)行了人工編輯，以保證將各種話語類型包含在語料樣本中，提高自動(dòng)評(píng)估的效果。具體分為五個(gè)步驟：第一步，根據(jù)報(bào)告陳述模式的類型與主題篇幅分布，將所有報(bào)告分為四個(gè)類型：質(zhì)性均勻、質(zhì)性不均勻、混合均勻與混合不均勻;第二步，在樣本庫中按行業(yè)和年份比重，進(jìn)行類型隨機(jī)，由兩名研究人員同時(shí)進(jìn)行初步研讀，在意見一致的前提下進(jìn)行人工分類，意見無法形成一致的樣本作為第五類，直至抽取各類型報(bào)告數(shù)量至少達(dá)到20份，總量達(dá)到200份;第三步，綜合國際、國內(nèi)和行業(yè)各類編制指南與標(biāo)準(zhǔn)，按照6個(gè)信息披露主題對(duì)報(bào)告文本進(jìn)行內(nèi)容分割，并在同一主題下進(jìn)行文本合并，得到6個(gè)一級(jí)子類，這6個(gè)主題分別是：公司概況、股東、客戶和消費(fèi)者、供應(yīng)商、員工、環(huán)境社區(qū)公益;第四步，對(duì)于每一子類中的報(bào)告片段，按敘事型、闡述型與混合型修辭方式進(jìn)行分層，段落中句子多以人物、事件或地點(diǎn)作為起點(diǎn)，使用放射型推進(jìn)方式的為敘事型，若在邏輯上與上文保持聯(lián)系，或者是對(duì)上文某個(gè)部分的擴(kuò)展或依附為闡述性型，兩者兼有為混合型，并最終得到18個(gè)層;第五步，按“總字?jǐn)?shù)占比”在18個(gè)層中分別隨機(jī)抽取段落片段，經(jīng)人工比對(duì)合并、調(diào)整與編輯，控制字?jǐn)?shù)在300字左右（±3%），最終得到600個(gè)語料片段。

語料抽取后，首先針對(duì)每一個(gè)片段，經(jīng)過至少2人的仔細(xì)判讀，提取其中可能會(huì)影響決策的有效信息;在達(dá)成共識(shí)的基礎(chǔ)上，按照統(tǒng)一的句子長度、語法結(jié)構(gòu)、難易水平設(shè)計(jì)兩道判斷題，最終得到包含300字左右文本片段和兩道判斷題在內(nèi)的600個(gè)數(shù)據(jù)集;接著，根據(jù)采集的語料，本文設(shè)計(jì)開發(fā)了一個(gè)可讀性標(biāo)注平臺(tái)，通過網(wǎng)頁答題的方式提供給標(biāo)注者，600個(gè)語料片段被隨機(jī)分成24組標(biāo)注數(shù)據(jù)集，每組標(biāo)注數(shù)據(jù)集包含25個(gè)語料與50道判斷題;最后，通過預(yù)實(shí)驗(yàn)對(duì)語料進(jìn)行完善，并測算出每組語料正常標(biāo)注的總耗時(shí)應(yīng)不低于25分鐘。

（二）CSR報(bào)告可讀性評(píng)估數(shù)據(jù)集構(gòu)建

利用眾包方式構(gòu)建語料庫，已成為研究者解決數(shù)據(jù)集不足問題的一條常見的途徑（Schumacher，2016;Vajjala，2017），基于可讀性標(biāo)注平臺(tái)，我們設(shè)計(jì)了一個(gè)眾包實(shí)驗(yàn)來記錄被試的閱讀時(shí)間特征，閱讀過程本身就是標(biāo)注。保證過程可控與結(jié)果可靠是實(shí)驗(yàn)設(shè)計(jì)的主要出發(fā)點(diǎn)：第一，選擇了與現(xiàn)實(shí)中CSR報(bào)告閱讀者認(rèn)知特征相似的被試，不事先告知研究的真實(shí)目的，避免實(shí)驗(yàn)者偏差和偶然減員;第二，進(jìn)行有效的啟動(dòng)，通過目標(biāo)激勵(lì)與分心物抑制，保證被試閱讀過程中的持續(xù)專注;第三，注意避免選擇性偏差，同一語料隨機(jī)分配給多個(gè)閱讀者，以記錄均值與方差;第四，注意過程控制，被試在閱讀完語料后，會(huì)進(jìn)入下一頁面回答兩道判斷題，測試其對(duì)語料中關(guān)鍵信息搜尋的效果，如果答題錯(cuò)誤，將自動(dòng)返回語料頁面，被試再次閱讀后答題，重復(fù)過程直至答案全部正確，并只記錄在語料頁面停留的合計(jì)時(shí)間;第五，保證測量的一致性，根據(jù)語料中關(guān)鍵信息編寫的判斷題，在句子長度、語法結(jié)構(gòu)、難易水平上等方面基本一致;第六，保證標(biāo)注數(shù)據(jù)的可靠性，對(duì)于每段語料對(duì)應(yīng)的多個(gè)被試閱讀的時(shí)間數(shù)據(jù)，在去除極值與異常值后計(jì)算閱讀時(shí)間均值與標(biāo)準(zhǔn)差。

參與眾包標(biāo)注實(shí)驗(yàn)的被試主要由高校經(jīng)管專業(yè)本科與研究生、企業(yè)管理人員與政府部門工作人員構(gòu)成，總計(jì)483人。我們提前通知他們將進(jìn)行專業(yè)知識(shí)測試，結(jié)果與考核或獎(jiǎng)勵(lì)有關(guān)，并要求其預(yù)留好時(shí)間。實(shí)驗(yàn)中，每組標(biāo)注數(shù)據(jù)集在線并行發(fā)放給了15個(gè)以上的被試，當(dāng)系統(tǒng)后臺(tái)收到18個(gè)正常返回結(jié)果（總耗時(shí)大于25分鐘）后，將自動(dòng)停止發(fā)放該組數(shù)據(jù)。剔除返回的組異常結(jié)果與組數(shù)據(jù)縮尾處理后，共獲得600個(gè)語料對(duì)應(yīng)的9000個(gè)時(shí)間數(shù)據(jù)。進(jìn)一步針對(duì)單個(gè)語料對(duì)應(yīng)的15個(gè)時(shí)間數(shù)據(jù)進(jìn)行第二次縮尾處理，最終得到6000個(gè)時(shí)間標(biāo)注數(shù)據(jù)。根據(jù)兩維度評(píng)估模型，我們計(jì)算了每條語料的10個(gè)有效閱讀時(shí)間均值和標(biāo)準(zhǔn)差，并按這兩個(gè)指標(biāo)的中位數(shù)，對(duì)600個(gè)語料進(jìn)行了分類，在兩個(gè)維度上各得到高低水平的不同的300條標(biāo)注結(jié)果，為分類器的構(gòu)建提供了基礎(chǔ)，實(shí)驗(yàn)數(shù)據(jù)如圖2所示。

（三）CSR報(bào)告可讀性分類器構(gòu)建

由于標(biāo)注的成本較大的原因，完全依賴標(biāo)注數(shù)據(jù)集進(jìn)行有監(jiān)督學(xué)習(xí)的實(shí)現(xiàn)難度較大，因此，在大多數(shù)情況下，我們所面臨的只是少量數(shù)據(jù)或者少量標(biāo)注數(shù)據(jù)的情況。同時(shí)，弱監(jiān)督學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)之一，不少學(xué)者也在不斷嘗試將弱監(jiān)督學(xué)習(xí)應(yīng)用到小數(shù)據(jù)集機(jī)器學(xué)習(xí)中（Wang，2016;Wang，2018;Boney，2018）。目前常用的一種方式是在一個(gè)大數(shù)據(jù)集上對(duì)模型進(jìn)行預(yù)訓(xùn)練，并在特定任務(wù)上對(duì)其進(jìn)行微調(diào)，以控制過擬合的情況。2018年Bert模型的推出為弱監(jiān)督學(xué)習(xí)應(yīng)用提供了重要的基礎(chǔ)，近年來在文本分類、問答系統(tǒng)，情感分析，垃圾郵件過濾，命名實(shí)體識(shí)別等任務(wù)有了較廣泛的應(yīng)用，現(xiàn)有的一些研究也表明，基于Bert模型預(yù)訓(xùn)練，在小數(shù)據(jù)集的情況下也能實(shí)現(xiàn)顯著的分類效果?；诖?，本研究借助Howard（2018）提出的方法，構(gòu)建了基于閱讀效率（閱讀時(shí)間）和適應(yīng)水平（標(biāo)準(zhǔn)差）的兩維度的分類器，然后通過對(duì)兩個(gè)維度學(xué)習(xí)速率的變化來微調(diào)語言模型，讓模型更快地在小樣本數(shù)據(jù)集上收斂。

在預(yù)訓(xùn)練的基礎(chǔ)上，如何利用有限的標(biāo)注數(shù)據(jù)提高分類準(zhǔn)確性是一個(gè)關(guān)鍵問題。由于CSR信息披露文本的特殊性，相對(duì)于數(shù)據(jù)增強(qiáng)，從語文教育等相關(guān)領(lǐng)域進(jìn)行知識(shí)結(jié)構(gòu)遷移存在較大不確定性。因而，按照常見的機(jī)器學(xué)習(xí)方法，我們首先加載了Bert中文模型，進(jìn)行了無監(jiān)督的預(yù)訓(xùn)練;在此基礎(chǔ)上用標(biāo)注好的數(shù)據(jù)進(jìn)行了微調(diào)。由于進(jìn)行有監(jiān)督微調(diào)的標(biāo)注數(shù)據(jù)集中只有600條語料，為避免過擬合的情況，我們設(shè)置了閱讀時(shí)間和標(biāo)準(zhǔn)差兩個(gè)分類器模型（核心代碼詳見附錄1），以減少特征維度提高特征數(shù)據(jù)集重復(fù)利用率。同時(shí)，由于小數(shù)據(jù)集的本質(zhì)問題在于數(shù)據(jù)量過少，從而造成分類準(zhǔn)確率偏低，我們采用了早期針對(duì)數(shù)據(jù)增強(qiáng)的方法，對(duì)數(shù)據(jù)應(yīng)用了一組變換來增加樣本量，并且考慮到采用同義詞替換、回譯、隨機(jī)插入與刪除等方式，可能會(huì)改變文本可讀性水平，相比而言中文閱讀習(xí)慣性下，句子和詞的順序不會(huì)對(duì)理解有太大影響，故采用了打亂句與詞順序的方式，進(jìn)行了數(shù)據(jù)增強(qiáng)，并經(jīng)人工逐條閱讀進(jìn)行了確認(rèn)。

數(shù)據(jù)增強(qiáng)后，按照9∶1的比例將標(biāo)注數(shù)據(jù)集劃分為訓(xùn)練集和測試集。完成訓(xùn)練后，經(jīng)過測試發(fā)現(xiàn)，對(duì)平均分類準(zhǔn)確率達(dá)到了85.3%。我們也選取了其他幾種分類算法對(duì)CSR報(bào)告的分類準(zhǔn)確性進(jìn)行了對(duì)比（如表1所示）。結(jié)果表明，基于Bert模型預(yù)訓(xùn)練的可讀性分類效果較好，基本滿足對(duì)CSR報(bào)告文本進(jìn)行可讀性質(zhì)量評(píng)估的要求。

（四）CSR報(bào)告可讀性綜合評(píng)估

相對(duì)于文學(xué)作品而言，CSR報(bào)告在整體上層次較為清晰，情感傾向不明顯，長句多，上下文通常和總分、順接、轉(zhuǎn)折、例證、因果與對(duì)照等關(guān)系直接相關(guān)，閱讀過程中句與段落在信息傳遞與搜尋功能上的獨(dú)立性較強(qiáng)。針對(duì)這一特征，本文采用了對(duì)CSR報(bào)告進(jìn)行分段處理;以段落為粒度進(jìn)行自動(dòng)分類;并進(jìn)行無量綱賦權(quán)與數(shù)據(jù)降維的方法;最終計(jì)算出篇章和整個(gè)文檔的可讀性程度。

首先，在扎根的基礎(chǔ)上，我們結(jié)合中國人基本閱讀速度，將報(bào)告中的段落按句號(hào)為準(zhǔn)，按300字左右整合為一段，據(jù)此計(jì)算出單個(gè)報(bào)告的總段數(shù);接著應(yīng)用閱讀時(shí)間與適應(yīng)水平分類器，對(duì)報(bào)告進(jìn)行可讀性類別自動(dòng)判斷，得到每個(gè)類別的段落數(shù);然后計(jì)算每個(gè)分類類別段落數(shù)占總段落數(shù)的比例，可以得到閱讀效率高低與適應(yīng)水平高低兩兩結(jié)合類型段落數(shù)占總段落數(shù)的比例四個(gè)指標(biāo);最后，我們借鑒了郭亞軍（2011，2017）等人的研究，提出了一個(gè)基于主客觀信息綜合判斷的拉開檔次法，對(duì)數(shù)據(jù)進(jìn)行降維處理，盡可能拉大被評(píng)價(jià)指標(biāo)間整體差異的同時(shí)，并兼顧考慮到專家主觀信息及各個(gè)指標(biāo)本身的相對(duì)重要程度，最終得到披露文本篇章和文檔級(jí)的可讀性質(zhì)量評(píng)估數(shù)據(jù)。

四個(gè)評(píng)價(jià)指標(biāo)分別為閱讀時(shí)間短標(biāo)準(zhǔn)差小x1、閱讀時(shí)間短標(biāo)準(zhǔn)差大x2、閱讀時(shí)間長標(biāo)準(zhǔn)差小 x3、閱讀時(shí)間長標(biāo)準(zhǔn)差大x4，指標(biāo)均為極大型指標(biāo)。具體計(jì)算步驟如下：

記xij為被評(píng)價(jià)對(duì)象i在評(píng)價(jià)指標(biāo)j下的觀測值，其中i=1，2，…，n;j=1，2，…，m，x*ij表示經(jīng)過無量綱化后處理的指標(biāo)值，不失一般性，記無量綱化處理后的數(shù)值仍為xij。

（1）對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行無量綱化處理。本文采用極值處理法對(duì)原始數(shù)據(jù)進(jìn)行無量綱化處理，即x*ij=（xij-xminj）/（xmaxj-xminj）。

（2）非線性因子的選取。記評(píng)價(jià)指標(biāo)xj關(guān)于n個(gè)被評(píng)價(jià)對(duì)象取值的方差為 D（xj），各被評(píng)價(jià)對(duì)象間整體離散程度的貢獻(xiàn)率為μj，則μj=D（xj）∑mj=1D（xj）。根據(jù)該公式計(jì)算可讀性各評(píng)價(jià)指標(biāo)關(guān)于CSR報(bào)告間整體離散程度的貢獻(xiàn)率μj，計(jì)算結(jié)果為（0.274，0.304，0.270，0.152），結(jié)合專家的相關(guān)建議，事先確定給定的指標(biāo)離散程度對(duì)各被評(píng)價(jià)對(duì)象間差異影響的貢獻(xiàn)率的閾值α為0.29，由于μ2=0.304>0.29，因此指標(biāo)x2為非線性因子。

（3）評(píng)價(jià)指標(biāo)序關(guān)系的判斷。邀請5位相關(guān)領(lǐng)域?qū)＜医Y(jié)合自身的知識(shí)經(jīng)驗(yàn)對(duì)本研究中確定的可讀性評(píng)價(jià)指標(biāo)的重要程度進(jìn)行排序，排序結(jié)果為x1>x2>x3>x4。設(shè)根據(jù)主觀判斷給出的評(píng)價(jià)指標(biāo)xk-1與 xk的重要程度之比為rk=wk-1/wk（k=m，m-1，…，2），wk表示指標(biāo)相應(yīng)權(quán)重，rk的取值如表2所示。由于專家根據(jù)主觀信息很難準(zhǔn)確地給出rk的確定值，最終，結(jié)合幾個(gè)專家的一致意見確定排序后相鄰兩個(gè)評(píng)價(jià)指標(biāo)重要程度的比值rk的取值范圍，如表3所示。

（4）確定評(píng)價(jià)指標(biāo)權(quán)重。為了使各被評(píng)價(jià)對(duì)象間的差異盡可能地拉大，各被評(píng)價(jià)對(duì)象間的整體差異可以用各被評(píng)價(jià)對(duì)象綜合評(píng)價(jià)值的方差進(jìn)行衡量。即

s2=1n∑ni=1（yi-y-）2=（yi）Tyin-（y-）2（1）

因此為了使各被評(píng)價(jià)對(duì)象間的差異最大，就是使式（1）的方差最大，因此按如下規(guī)劃求解來計(jì)算評(píng)價(jià)指標(biāo)權(quán)重：

max（s2）=max（yi）Tyin-（y-）2

s.t.r-k≤wk-1wk≤r+k0

根據(jù)規(guī)劃模型中計(jì)算得到的指標(biāo)權(quán)重，按式（3）計(jì)算各被評(píng)價(jià)對(duì)象最終的評(píng)價(jià)值yi，本文評(píng)價(jià)指標(biāo)數(shù)據(jù)xij均大于等于0。

yi=∑mj=1j≠k0xijwj+（xk0）2wk0，xij均大于（小于）等于0時(shí)∑mj=1j≠k0xijwj+（xk0）3wk0，其他情形（3）

根據(jù)式（1）及規(guī)劃模型（2）計(jì)算可讀性各評(píng)價(jià)指標(biāo)的權(quán)重系數(shù)，本文運(yùn)用Python軟件進(jìn)行編碼計(jì)算（核心代碼見附錄2），計(jì)算得出w1，w2，w3，w4分別為0.443，0.277，0.173，0.107。

（5）將計(jì)算得出的評(píng)價(jià)指標(biāo)權(quán)重系數(shù)wj帶入式（3）中，即可計(jì)算出各被評(píng)價(jià)對(duì)象最終的綜合評(píng)價(jià)結(jié)果，得到上市公司CSR報(bào)告樣本的最終可讀性評(píng)價(jià)得分分值。

四、數(shù)據(jù)分析與結(jié)果討論

（一）樣本選取

我們從企業(yè)社會(huì)責(zé)任中國網(wǎng)等上市公司信息披露官方網(wǎng)站收集了2009-2017年的CSR報(bào)告全樣本共5183篇。以2009年為樣本起點(diǎn)進(jìn)行研究分析，除2009年前樣本量很少外，缺乏披露指南，樣本質(zhì)量參差不齊也是一個(gè)重要因素。上市公司一般是在次年初中期才會(huì)發(fā)布上一年度的社會(huì)責(zé)任報(bào)告，而本研究樣本收集截止時(shí)間到2019年3月，只有小部分企業(yè)發(fā)布了2018年的CSR報(bào)告，因此目前只對(duì)2009-2017年的數(shù)據(jù)進(jìn)行了分析研究。本文使用的企業(yè)財(cái)務(wù)信息主要從國泰安和銳思數(shù)據(jù)庫獲得;行業(yè)分類主要來源于國家統(tǒng)計(jì)局發(fā)布的分類標(biāo)準(zhǔn)。同時(shí)，對(duì)于存在修訂公告以及樣本量過少的行業(yè)，本文均予以剔除，最終得到2009-2017年涉及12個(gè)行業(yè)的5088個(gè)有效樣本。

（二）描述性統(tǒng)計(jì)

不同行業(yè)報(bào)告的可讀性數(shù)據(jù)統(tǒng)計(jì)情況見表4。從表中可以看出，制造業(yè)披露的CSR報(bào)告數(shù)量最多，樣本數(shù)量為2902篇，占總體樣本的57.04%;其次是金融業(yè)，樣本數(shù)量為373篇，占樣本總數(shù)的7.33%;而樣本量最少的行業(yè)為租賃和商務(wù)服務(wù)業(yè)，其樣本數(shù)量為23篇，僅占總樣本的0.45%?？勺x性得分均值最高的是文化、體育與娛樂業(yè)，達(dá)到了0.331048，其次是建筑業(yè)，它的可讀性得分均值達(dá)到了0.322493，都高于樣本均值0.302245。可讀性最低的行業(yè)是農(nóng)、林、牧、漁業(yè)其報(bào)告可讀性僅為0.287223。

報(bào)告可讀性均值按年份統(tǒng)計(jì)情況如表5、圖3所示，從表5中可以看出，2009年企業(yè)發(fā)布的報(bào)告最少，僅為165篇，2017年發(fā)布的報(bào)告數(shù)量最多，達(dá)到了731篇，數(shù)量呈逐年上升趨勢，其中2009年到2010年報(bào)告數(shù)量增長速度最快。從不同年份報(bào)告的可讀性均值來看，分值最高的是2013年，其值為0.305952，高于總樣本均值0.302245，報(bào)告可讀性數(shù)據(jù)均值最低的年份是2009年，其值為0.288167，明顯低于總樣本均值。

由圖3可以看到，整體上CSR報(bào)告可讀性得分均值隨年份變化比較明顯，2009-2013年間發(fā)布的CSR報(bào)告可讀得分均值快速上升，但在2014年可讀性數(shù)據(jù)平均得分略有回調(diào)，并隨后基本保持穩(wěn)定。初步推斷這一變化趨勢與2009-2013年間信息披露規(guī)則體系逐步完善有關(guān)，由于報(bào)告編寫有了相應(yīng)的標(biāo)準(zhǔn)與指南，顯現(xiàn)出較強(qiáng)的學(xué)習(xí)效應(yīng);而在2014年后報(bào)告可讀性分?jǐn)?shù)回調(diào)，可能是因?yàn)榕斗皆谑煜は嚓P(guān)標(biāo)準(zhǔn)之后，在編寫報(bào)告的過程中進(jìn)行了策略優(yōu)化，以保證披露信息的規(guī)范性與減少披露風(fēng)險(xiǎn)。

（三）數(shù)據(jù)分析

（1）正態(tài)檢驗(yàn)

在描述性統(tǒng)計(jì)后，本文根據(jù)可讀性數(shù)據(jù)，進(jìn)行了全樣本的正態(tài)分布檢驗(yàn)，直方圖檢驗(yàn)如圖4所示。從圖中可以看出，大部分報(bào)告的可讀性分值在0.20～0.40分之間，處于中間位置，而處于兩端的可讀性得分占樣本總量較少。進(jìn)一步檢測數(shù)據(jù)的正態(tài)分布情況，如圖5所示，由樣本可讀性實(shí)測值和預(yù)期的正態(tài)值組成的散點(diǎn)圖基本上都落在直線附近，只有少部分兩端的可讀性極端值與直線的值相差較大。因此，可以推斷出可讀性分值基本上服從正態(tài)分布。

（2）方差分析

在對(duì)數(shù)據(jù)正態(tài)檢驗(yàn)后，進(jìn)一步對(duì)不同行業(yè)、不同年份、不同產(chǎn)權(quán)性質(zhì)的可讀性分值進(jìn)行了方差齊性檢驗(yàn)，結(jié)果顯示除了按照不同行業(yè)進(jìn)行分組后的可讀性數(shù)據(jù)方差不齊外，其他兩個(gè)組的數(shù)據(jù)符合方差齊性。首先，本文采用獨(dú)立樣本 Kruskal-Wallis 檢驗(yàn)對(duì)不同行業(yè)的可讀性分值進(jìn)行分析。由表6可以看出，不同行業(yè)獨(dú)立樣本Kruskal-Wallis 檢驗(yàn)結(jié)果顯著性小于0.05，表明不同行業(yè)之間可讀性評(píng)分存在顯著差異，行業(yè)異質(zhì)性是影響CSR信息可讀性水平的重要因素。

結(jié)合已有的經(jīng)驗(yàn)證據(jù)推斷，在自身CSR行為與績效的描述中，經(jīng)營范疇的差異會(huì)對(duì)可讀性產(chǎn)生相應(yīng)的影響。例如，由于行業(yè)原因一些報(bào)告里面存在較多的專業(yè)術(shù)語，如果沒有對(duì)其進(jìn)行解釋的話，那么報(bào)告的可讀性就會(huì)大打折扣，而文化、體育與娛樂業(yè)，在經(jīng)營內(nèi)容上比較容易理解;此外，一些環(huán)境敏感型行業(yè)，為修飾其社會(huì)責(zé)任表現(xiàn)，可能會(huì)有意進(jìn)行語義操縱。另一個(gè)原因則可能是行業(yè)樣本分布不均勻所致（冼迪曦，2012）。

由于不同產(chǎn)權(quán)性下的報(bào)告可讀性分值既服從正態(tài)分布又是等方差的，因此本文采取方差分析對(duì)不同產(chǎn)權(quán)性質(zhì)下的CSR報(bào)告可讀性分值進(jìn)行了檢驗(yàn)。檢驗(yàn)結(jié)果如表7所示，表明產(chǎn)權(quán)特征并不是可讀性高低的主要影響因素。

同樣，本文采用方差分析對(duì)不同年份間的CSR報(bào)告可讀性分值進(jìn)行了檢驗(yàn)，檢驗(yàn)結(jié)果如表8中所示。從表8可以看出，不同年份的CSR報(bào)告可讀性數(shù)據(jù)F值顯著性水平低于5%，說明不同年份的可讀性得分存在差異。

為了更準(zhǔn)確地發(fā)現(xiàn)具體哪些年份的報(bào)告可讀性得分存在差異，本文采用了LSD法，對(duì)可讀性分值數(shù)據(jù)進(jìn)行了多重比較，具體結(jié)果如表9所示。

從表9可以看出，2011-2017年中，每一年與其他年份可讀性分值都沒有顯著性的差異，2009年與其他年份可讀性分值均有顯著性的差異。結(jié)合政策研究可基本確定，這一現(xiàn)象是外部政策的結(jié)果，2009-2010年前后，相繼發(fā)布了《社會(huì)責(zé)任績效分類指引》、《社會(huì)責(zé)任指南》等標(biāo)準(zhǔn)，中國上市公司CSR報(bào)告的編寫逐漸趨向標(biāo)準(zhǔn)化;除此之外，一些上市公司還積極與GRI等國際標(biāo)準(zhǔn)接軌，在報(bào)告的內(nèi)容和形式等方面不斷提升，大大增強(qiáng)了利益相關(guān)者的投資決策效率。

（3）異常值分析

為進(jìn)一步發(fā)現(xiàn)報(bào)告可讀性分值中存在的異常值，我們采用了箱型圖的方式對(duì)可讀性異常值進(jìn)了描述分析。結(jié)果如圖6所示。

由圖6可以看到，僅有兩個(gè)行業(yè)中沒有存在異常值，表明文化體育與娛樂業(yè)、租賃和商務(wù)服務(wù)業(yè)報(bào)告可讀性得分比較均勻。異常值最多的是制造業(yè)，其中編號(hào)為199的樣本為2010年浙江某橡膠股份有限公司發(fā)布的報(bào)告，經(jīng)查閱判斷可讀性水平相對(duì)較低，主要是由于這篇報(bào)告結(jié)構(gòu)比較混亂，語言表述模糊，容易產(chǎn)生歧義。而得分比較高的3215號(hào)樣本為2015年安徽某水泥股份有限公司發(fā)布的CSR報(bào)告，可讀性強(qiáng)的原因是編制中邏輯清晰，描述中確定性程度高，歧義表達(dá)少。通過箱型圖可以快速地發(fā)現(xiàn)樣本可讀性得分中的異常值，通過比對(duì)找出異常原因，為質(zhì)量評(píng)估與市場監(jiān)管提供依據(jù)。

（4）有效性檢驗(yàn)

為明確本文提出的信息披露文本可讀性質(zhì)量評(píng)估方法在實(shí)際應(yīng)用中的效果，我們采用了與專家評(píng)分對(duì)比實(shí)驗(yàn)的方法，來檢驗(yàn)整體方案的實(shí)用性和穩(wěn)定性。通常情況下，專家給出的是定性判斷，需要對(duì)本文得到的數(shù)據(jù)進(jìn)行離散化處理。由于可讀性得分主要分布于0.20～0.45之間，因此采用五分量表法，把區(qū)間分為5等份，對(duì)應(yīng)賦值區(qū)間分別為1～5分，分別代表：可讀性非常低、可讀性低、可讀性一般、可讀性高、可讀性非常高。具體情況如表10所示。

根據(jù)實(shí)例分析中得到的結(jié)果，我們在每一個(gè)可讀性得分區(qū)間分別隨機(jī)抽取了一篇報(bào)告，分別為《600352浙江龍盛：2014年度社會(huì)責(zé)任報(bào)告》《601107四川成渝：2013年度社會(huì)責(zé)任報(bào)告》《600383金地集團(tuán)：2016年度社會(huì)責(zé)任報(bào)告》《000883湖北能源：2016年度社會(huì)責(zé)任報(bào)告》《600372中航電子：2015年度社會(huì)責(zé)任報(bào)告》，可讀性分值分別為0.238619、0.261585、0.338352、0.391487、0.423627，分別對(duì)應(yīng)5分法中的1～5分值。

我們聯(lián)系了非財(cái)務(wù)信息披露評(píng)價(jià)專業(yè)機(jī)構(gòu)中的5位專家，明確告知其評(píng)價(jià)對(duì)象為樣本整體上閱讀和理解的容易程度，并請他們對(duì)抽樣的5篇報(bào)告按照5分量表進(jìn)行分別評(píng)分。結(jié)果如表11所示，對(duì)于同一份CSR報(bào)告來說，不同專家之間的可讀性評(píng)分具有一致性。同時(shí)，我們計(jì)算了5位專家評(píng)估的平均值，通過對(duì)比分析可得，專家法得到的平均值和本文研究結(jié)果基本一致，從而在一定程度上驗(yàn)證了本文提出的方法在實(shí)際應(yīng)用中具有良好的評(píng)估效果，以及實(shí)例分析結(jié)果的可靠性與有效性。

五、研究結(jié)論與不足

信息披露的可讀性自動(dòng)評(píng)估，作為一種預(yù)測性的手段，具有客觀性和經(jīng)濟(jì)性的優(yōu)點(diǎn)（吳思遠(yuǎn)等，2018）。由于人類語言和認(rèn)知的復(fù)雜性，面向通用領(lǐng)域的自動(dòng)評(píng)估往往具有很大的難度;特定應(yīng)用場景下的研究，由于可以結(jié)合情境、文本特征、作者心理與閱讀者行為等因素，進(jìn)行更具體和有針對(duì)性的分析，而展現(xiàn)出較好的研究前景和應(yīng)用價(jià)值。過去十多年來，伴隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展，可讀性評(píng)估方法與實(shí)踐有了很大的進(jìn)展，但如何控制標(biāo)注過程中因人的主觀性差異所帶來的標(biāo)準(zhǔn)不同，目的不同和結(jié)果不一致，仍然是一個(gè)尚待解決的問題。在文本閱讀過程中，相對(duì)于心理與認(rèn)知層面的測量，對(duì)人的行為特征的觀察會(huì)更直接與準(zhǔn)確，解決問題的關(guān)鍵在于找到一個(gè)能夠合理聯(lián)系閱讀行為特征與文本可讀性的理論框架及有效測量方法。

從這一研究目的出發(fā)，本文從評(píng)估“通俗易懂”的質(zhì)量評(píng)估與監(jiān)管要求出發(fā)，針對(duì)CSR信息披露中的特點(diǎn)，在信息披露方與接收方的動(dòng)機(jī)與行為分析的基礎(chǔ)上，構(gòu)建了一個(gè)基于閱讀效率與適應(yīng)水平的兩維度評(píng)估模型，提出了一個(gè)從信息搜尋的效率與達(dá)成理解一致性的成本進(jìn)行評(píng)估的思路。這一模型的重要意義在于，將特定場景下的閱讀行為特征與報(bào)告可讀性聯(lián)系起來，并可以根據(jù)同一披露報(bào)告不同人閱讀時(shí)間均值與標(biāo)準(zhǔn)差，客觀區(qū)分不同文本可讀性之間的差異。根據(jù)這一認(rèn)識(shí)，本文進(jìn)一步設(shè)計(jì)了一個(gè)完整有效的方法，結(jié)合我國2009-2017年A股上市公司披露的CSR報(bào)告，采集了CSR報(bào)告語料，并采用眾包實(shí)驗(yàn)對(duì)語料進(jìn)行人工標(biāo)注，同時(shí)結(jié)合機(jī)器學(xué)習(xí)和改進(jìn)的拉開檔次法，最終得到了篇章級(jí)CSR信息披露可讀性數(shù)據(jù);同時(shí)在此基礎(chǔ)上，我們對(duì)所得到數(shù)據(jù)根據(jù)不同行業(yè)、年份、產(chǎn)權(quán)性質(zhì)進(jìn)行了分析，結(jié)構(gòu)顯示我國CSR報(bào)告的可讀性水平整體上服從正態(tài)分布;產(chǎn)權(quán)性質(zhì)對(duì)CSR信息披露可讀性影響不大，而不同行業(yè)與年份可讀性分值差異較為顯著;行業(yè)異質(zhì)性和外部政策的變化可能是差異性形成的主要原因。

同時(shí)，本文也存在一定的局限性：第一，信息披露文本可讀性質(zhì)量評(píng)估的兩維度理論模型的提出，主要基于“通俗易懂”的非財(cái)務(wù)信息披露質(zhì)量評(píng)估與監(jiān)管的政策要求，能否滿足其他場景的要求還有待進(jìn)一步檢驗(yàn);第二，CSR報(bào)告的可讀性語料庫的規(guī)模仍較小，雖然進(jìn)行了基于Bert模型的預(yù)訓(xùn)練和數(shù)據(jù)增強(qiáng)，但仍然可能存在過擬合的情況;第三，眾包標(biāo)注實(shí)驗(yàn)采用了在線方式，雖然通過數(shù)據(jù)處理進(jìn)行了誤差控制，對(duì)被試行為的監(jiān)測仍然相對(duì)較弱，尚不能完全排除標(biāo)注過程中環(huán)境因素的影響;第四，本文從“通俗易懂”的政策要求出發(fā)，主要針對(duì)的是信息披露文本的可讀性質(zhì)量，雖然我們對(duì)抽象圖片內(nèi)容進(jìn)行了文字識(shí)別，而CSR報(bào)告中常見的實(shí)景圖片也可能在利益相關(guān)者查閱報(bào)告時(shí)對(duì)其產(chǎn)生影響，從而造成可讀性程度的偏差，對(duì)于這些存在的問題，我們將會(huì)在未來研究中進(jìn)行有針對(duì)性地優(yōu)化和改進(jìn)，并在更大范圍對(duì)研究結(jié)果進(jìn)行檢驗(yàn)。

參考文獻(xiàn)：

[1] 陳銀娥、江媛，2017：《管理層權(quán)力、制度環(huán)境與董事會(huì)報(bào)告可讀性—— 來自我國上市公司的經(jīng)驗(yàn)證據(jù)》，《珞珈管理評(píng)論》第3期。

[2] 段釗、何雅娟、鐘原，2017：《企業(yè)社會(huì)責(zé)任信息披露是否客觀——基于文本挖掘的我國上市公司實(shí)證研究》，《南開管理評(píng)論》第4期。

[3] 顧曰國，1992：《禮貌、語用與文化》，《外語教學(xué)與研究：外國語文雙月刊》第4期。

[4] 郭亞軍、馬鳳妹、董慶興，2011：《無量綱化方法對(duì)拉開檔次法的影響分析》，《管理科學(xué)學(xué)報(bào)》第5期。

[5] 郭亞軍、阮泰學(xué)、宮誠舉，2017：《基于主客觀信息綜合判斷的非線性拉開檔次法》，《運(yùn)籌與管理》第6期。

[6] 吉利、張麗、田靜，2016：《我國上市公司社會(huì)責(zé)任信息披露可讀性研究——基于管理層權(quán)力與約束機(jī)制的視角》，《會(huì)計(jì)與經(jīng)濟(jì)研究》第1期。

[7] 荊溪昱，1995：《中文國文教材的適讀性研究：適讀年級(jí)值的推估》，《教育研究資訊》第5期。

[8] 李廣建，1989：《略論閱讀能力》，《圖書館建設(shè)》第3期。

[9] 劉媛媛、田言，2019：《財(cái)務(wù)報(bào)表誤述、誤述風(fēng)險(xiǎn)與自愿性信息披露——基于企業(yè)社會(huì)責(zé)任報(bào)告的證據(jù)》，《會(huì)計(jì)研究》第4期。

[10] 孟慶濤，2009：《英漢語用禮貌原則跨文化交際運(yùn)用探析》，《現(xiàn)代語文（語言研究版）》第2期。

[11] 任宏達(dá)、王琨，2018：《社會(huì)關(guān)系與企業(yè)信息披露質(zhì)量——基于中國上市公司年報(bào)的文本分析》，《南開管理評(píng)論》第5期。

[12] 宋曜廷、陳茹玲、李宜憲，等，2013：《中文文本可讀性探討：指標(biāo)選取、模型建立與效度驗(yàn)證》，《中華心理學(xué)刊》第1期。

[13] 孫剛，2015：《基于線性回歸的中文文本可讀性預(yù)測方法研究》，南京大學(xué)。

[14] 孫蔓莉，2004：《論上市公司信息披露中的印象管理行為》，《會(huì)計(jì)研究》第3期。

[15] 孫文章、李延喜、朱佳瑋，2019：《基于MC-AHP與灰色關(guān)聯(lián)度的企業(yè)中文年度報(bào)告可讀性綜合評(píng)價(jià)體系及實(shí)證檢驗(yàn)研究》，《當(dāng)代會(huì)計(jì)評(píng)論》第1期。

[16] 唐國平、劉忠全，2019：《環(huán)境保護(hù)稅法》對(duì)企業(yè)環(huán)境信息披露質(zhì)量的影響——基于湖北省上市公司的經(jīng)驗(yàn)證據(jù)》，《湖北大學(xué)學(xué)報(bào)（哲學(xué)社會(huì)科學(xué)版）》第1期。

[17] 田利輝、王可第，2017：《社會(huì)責(zé)任信息披露的“掩飾效應(yīng)”和上市公司崩盤風(fēng)險(xiǎn)——來自中國股票市場的DID-PSM分析》，《管理世界》第11期。

[18] 王克敏、王華杰、李棟棟，等，2018：《年報(bào)文本信息復(fù)雜性與管理者自利——來自中國上市公司的證據(jù)》，《管理世界》第12期。

[19] 王蕾，2017：《初中級(jí)日韓學(xué)習(xí)者漢語文本可讀性公式研究》，《語言教學(xué)與研究》第5期。

[20] 吳思遠(yuǎn)、蔡建永、于東，等，2018：《文本可讀性的自動(dòng)分析研究綜述》，《中文信息學(xué)報(bào)》第12期。

[21] 冼迪曦，2012：《基于會(huì)計(jì)視角的企業(yè)社會(huì)責(zé)任報(bào)告研究》，廣東工業(yè)大學(xué)。

[22] 徐巍、姚振曄、陳冬華，2021：《中文年報(bào)可讀性：衡量與檢驗(yàn)》，《會(huì)計(jì)研究》第3期。

[23] 閻達(dá)五、孫蔓莉，2002：《深市B股發(fā)行公司年度報(bào)告可讀性特征研究》，《會(huì)計(jì)研究》第5期。

[24] 葉勇、王涵，2018：《盈余管理對(duì)企業(yè)年度報(bào)告可讀性的影響研究》，《四川理工學(xué)院學(xué)報(bào)（社會(huì)科學(xué)版）》第6期。

[25] 張寧志，2000：《漢語教材語料難度的定量分析》，《世界漢語教學(xué)》第3期。

[26] 張秀敏、劉星辰、汪瑾，2017：《閱讀難易程度與信息披露質(zhì)量——基于易讀衡量和關(guān)聯(lián)因素視角的分析》，《當(dāng)代經(jīng)濟(jì)管理》第6期。

[27] 趙子夜、楊慶、楊楠，2019：《言多必失？管理層報(bào)告的樣板化及其經(jīng)濟(jì)后果》，《管理科學(xué)學(xué)報(bào)》第3期。

[28] Ahsan， H. and Mostafa， M. H.，2018，Business strategies and annual report readability， Accounting & Finance，60 （3）.

[29] Bacha， S. and Ajina， A.，2019，CSR performance and annual report readability： evidence from France， Corporate Governance： The International Journal of Business in Society，20 （2）：201-215.

[30] Ben A， W. and Belgacem， I.，2018，Do socially responsible firms provide more readable disclosures in annual reports？ Corporate Social Responsibility and Environmental Management，25（5）：1009-1018.

[31] Boney， R. and Ilin， A. Semi-supervised few-shot learning with MAMLl.in： Proc. of the ICLR （Workshop）， 2018.

[32] Bonsall， S. B. and Miller， B. P.，2017，The impact of narrative disclosure readability on bond ratings and the cost of debt， Review of Accounting Studies，22 （2）：608-643.

[33] Bonsall， S. B.，Leone， A. J. and Miller， B. P.， et al，2017，A Plain English Measure of Financial Reporting Readability， Journal of Accounting and Economics，63 （2-3）：329-357.

[34] Chen， T. K. and Tseng， Y. J.，2020，Readability of Notes to Consolidated Financial Statements and Corporate Bond Yield Spread， The European accounting review，1-31.

[35] Chung， S. W. and Lee， S. Y.，2019，Visual CSR Messages and the Effects of Emotional Valence and Arousal on Perceived CSR Motives， Attitude， and Behavioral Intentions， Communication Research，46 （7）：926-947.

[36] Colins， T. K. and Callan， J.，2004，A Language Modeling Approach to Predicting Reading Difficulty，Human Language Technologies： the 2004 Conference of the North American Chapter of the Association for Computational Linguistics.，Association for Computational Linguistics，193-200.

[37] Dale， E. and Chall， J.，1948，A Formula for Predicting Readability： Instructions， Educational Research Bulletin，27 （2）.

[38] Flesch， R.，1948，A New Readability Yardstick， Journal of Applied Psychology，32 （3）：221-233.

[39] Flor， M.，Klebanov， B. B. and Sheehan， K. M.，2013，Lexical Tightness and Text Complexity，Workshop of Natural Language Processing for Improving Textual Accessibility，

[40] Hassan， M. K.，Abu Abbas， B. and Garas， S. N.，2019，Readability， governance and performance： a test of the obfuscation hypothesis in Qatari listed firms， Corporate Governance： The International Journal of Business in Society，19 （2）：270-298.

[41] Hellmann， A.，Yeow， C. and De Mello， L.，2017，The influence of textual presentation order and graphical presentation on the judgements of non-professional investors， Accounting and business research，47 （4）：455-470.

[42] Howard， J. and Ruder， S.，2018，Universal Language Model Fine-tuning for Text Classification，Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics，328-339.

[43] Jin， T. and Lu， X.，2018，A Data-Driven Approach to Text Adaptation in Teaching Material Preparation： Design， Implementation， and Teacher Professional Development， TESOL Quarterly，52 （2）：457-467.

[44] Kate， R. J.，Luo， X. and Siddharth， P.， et al，2010，Learning to Predict Readability using Diverse Linguistic Features，23rd International Conference on Computational Linguistics，546-554.

[45] Kim， J. Y.，Kevyn， C. T. and Bennett， P.， et al，2012，Characterizing web content， user interests， and search behavior by reading level and topic，ACM International Conference on Web Search and Data Mining，ACM，213-222.

[46] Li， F.，2008，Annual report readability， current earnings， and earnings persistence， Journal of Accounting and Economics，45 （2-3）：221-247.

[47] Lively， B. A. and Pressey， S. L.，1923，A Method for Measuring the “vocabulary Burden” of Textbooks， Educational administration and supervision，（9）：298-389.

[48] Loughran， Tim and McDonald， Bill，2020，Textual Analysis in Finance， Annual Review of Financial Economics，（12）： 357-375.

[49] Lu， X. F.，2010，Automatic analysis of syntactic complexity in second language writing， International Journal of Corpus Linguistics，15 （4）：474-496.

[50] Luo， J.，Li， X. and Chen， H.，2018，Annual report readability and corporate agency costs， China Journal of Accounting Research，11 （3）：187-212.

[51] McNamara， D. S.，Crossley， S. A. and Roscoe， R. D.， et al，2015，A hierarchical classification approach to automated essay scoring， Assessing Writing，（23）：35-59.

[52] Muslu， V.，Mutlu， S. and Radhakrishnan， S.， et al，2019，Corporate Social Responsibility Report Narratives and Analyst Forecast Accuracy， Journal of Business Ethics，154 （4）：1119-1142.

[53] Nandhini， K. and Balasundaram， S. R.，2016，Improving Readability through Individualized Summary Extraction， Using Interactive Genetic Algorithm， Applied Artificial Intelligence，30 （7）：635-661.

[54] Schlkopf， B.，John， P. and Hofmann， T.，2006，TrueSkillTM： A Bayesian Skill Rating System，Advances in Neural Information Processing Systems 19： Proceedings of the 2006 Conference，MITP，569-576.

[55] Schumacher， E.，Eskenazi， M. and Frishkoff， G.， et al，2016，Predicting the Relative Difficulty of Single Sentences With and Without Surrounding Context，Proceedings of Conference on Empirical Methods in Natural Language Processing，1871-1881.

[56] Seifzadeh， M.，Salehi， M. and Abedini， B.， et al，2020，The relationship between management characteristics and financial statement readability， EuroMed Journal of Business.

[57] Si， L. and Callan， J.，2001，A statistical model for scientific readability，Proceedings of the 2001 ACM CIKM International Conference on Information and Knowledge Management，ACM，574-576.

[58] Smith， M. and Taffler， R.，1992，Readability and Understandability： Different Measures of the Textual Complexity of Accounting Narrative， Accounting， Auditing & Accountability Journal，5 （4）：84-98.

[59] Tanaka-Ishii， K.，Tezuka， S. and Terada， H.，2010，Sorting Texts by Readability， Computational Linguistics，36 （2）：203-227.

[60] Taylor，1953，“Cloze Procedure”： A New Tool For Measuring Readability， The Journalism Quarterly，30 （4）：415-433.

[61] Vajjala， S.，2017，Automated Assessment of Non-Native Learner Essays： Investigating the Role of Linguistic Features， International Journal of Artificial Intelligence in Education，28 （1）：79-105.

[62] Vogel， M. and Washburne， C.，1928，An Objective Method of Determining Grade Placement of Children’s Reading Material， The Elementary School Journal，28 （5）：373-381.

[63] Wang， Y X and Hebert， M. Learning from small sample sets by combining unsupervised meta-training with CNNs. in： Advances in Neural Information Processing Systems， 2016.

[64] Wang， Y X，Girshick， R. and M， Hebert. Low-shot learning from imaginary data. in： Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition， 2018.

[65] Yang， S.，1970，A Readability Formula for Chinese Language，University of Wisconsin-Madison.

Is the Social Responsibility Information Disclosed By Listed Companies ‘Easy to Understand’？

—Readability Quality Assessment and Empirical Research Based on Machine Learning

Duan Zhao1，2， Zhou Hong1，2， and Zhou Hui1

（1.School of Information Management， Central China Normal University;2. Center for Corporate Social Responsibility， Central China Normal University）

Abstract：Text readability is the premise and guarantee for the quality of information disclosure in the securities market. This paper attempts to provide a solution to the evaluation of the readability and quality of social responsibility reports released by the listed companies. Firstly， combined with the analysis of the motivation of information disclosure and reading behavior in the securities market， a two-dimension readability evaluation model based on the efficiency and adaptability level is proposed. Then， a method for assessing the readability of information disclosure text based on machine learning is designed and validated. And finally， the readability level of the full sample of social responsibility reports released by the Chinese listed companies from 2009 to 2017 is measured， while the overall and structural characteristics of the samples are analyzed. The results show that the readability level of social responsibility reports released by the listed companies in China is normally distributed and it increases year by year. The readability level of samples in different industries and years is significantly different， and the industry heterogeneity and external policy changes may be the main reasons for the differences. The model proposed in this paper provides a new way of thinking for the evaluation of the quality of information disclosure， and the evaluation method can effectively reduce the subjective interference in readability evaluation. At the same time， the research results provide a new set of quantitative data for the follow-up empirical research， and also provide new guidance for the supervision of information disclosure in the securities market.

Key Words：information disclosure; corporate social responsibility report; machine learning; readability

責(zé)任編輯郝偉

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

上市公司披露的社會(huì)責(zé)任信息“通俗易懂”嗎？