馬文超+吳商碩+黃麒+劉培基
[摘 要]企業(yè)社會(huì)責(zé)任(CSR)報(bào)告越來(lái)越受重視,其披露內(nèi)容和質(zhì)量成為學(xué)者們研究的重點(diǎn)。文章回顧了以往對(duì)CSR報(bào)告的質(zhì)量評(píng)價(jià)、文本挖掘等領(lǐng)域的研究,通過(guò)研究發(fā)現(xiàn)不同企業(yè)報(bào)告質(zhì)量有差異,不同年份間質(zhì)量相關(guān)性高,利用文本挖掘技術(shù)從個(gè)體和上市公司群體角度分析了CSR報(bào)告,認(rèn)為文本挖掘技術(shù)便利了CSR報(bào)告的信息獲取,為研究建構(gòu)CSR報(bào)告的本體提供了參考,并做出政策建議。文章還對(duì)文本挖掘在這一領(lǐng)域內(nèi)的不足做了述評(píng)。
[關(guān)鍵詞]文本挖掘;CSR;報(bào)告;企業(yè)社會(huì)責(zé)任;信息披露
[DOI]10.13939/j.cnki.zgsc.2018.04.016
1 引 言
現(xiàn)代社會(huì),CSR問(wèn)題的頻頻出現(xiàn)引發(fā)了嚴(yán)重的信任危機(jī)。社會(huì)要求企業(yè)在關(guān)注自身利益時(shí),充分關(guān)注國(guó)家和社會(huì)的共同利益。對(duì)企業(yè)而言,履行社會(huì)責(zé)任一方面可以降低與利益相關(guān)者之間的信息不對(duì)稱(chēng);另一方面,這也是進(jìn)行公共關(guān)系的有效手段。CSR報(bào)告作為企業(yè)向公眾傳達(dá)履行社會(huì)責(zé)任信息的主要途徑,重要性不言而喻。但是,目前CSR報(bào)告的發(fā)展面臨窘境,報(bào)告披露的信息多是樂(lè)觀、空洞的,況且一個(gè)沒(méi)有強(qiáng)制審計(jì)的報(bào)告并不能作為投資者決策的依據(jù),也沒(méi)有造假的必要,更可能是企業(yè)粉飾門(mén)面的廣告而已。
企業(yè)發(fā)布CSR報(bào)告的壓力主要來(lái)自證交所和行政壓力、有影響的組織機(jī)構(gòu)和社會(huì)團(tuán)體,上交所要求,“上證公司治理板塊”樣本公司、發(fā)行境外上市外資股的公司以及金融類(lèi)公司必須披露CSR報(bào)告,鼓勵(lì)其他有條件的公司披露報(bào)告。此外,有做大做強(qiáng)動(dòng)機(jī)的企業(yè)也表現(xiàn)出發(fā)布CSR報(bào)告的愿望,一個(gè)證據(jù)是2012年自愿披露CSR報(bào)告的企業(yè)比例為32.47%,2015年達(dá)到了42.23%(見(jiàn)表1)。但目前CSR報(bào)告市場(chǎng)上也存在阻力:監(jiān)管上,缺少?gòu)?qiáng)制性要求;操作上,第三方審驗(yàn)機(jī)構(gòu)收費(fèi)高昂,不經(jīng)過(guò)審計(jì)的報(bào)告公正性和客觀性有問(wèn)題,進(jìn)行審計(jì)又不一定能給公司帶來(lái)切實(shí)利益,企業(yè)也陷入兩難。
2 文獻(xiàn)綜述與假設(shè)
2.1 CSR報(bào)告質(zhì)量的評(píng)價(jià)
陶文杰等(2013)研究了A股上市公司CSR披露和公司績(jī)效間的關(guān)系,并引入中介變量媒體關(guān)注度。[1]齊麗云等(2016)構(gòu)建了CSR報(bào)告的質(zhì)量評(píng)價(jià)體系,將報(bào)告的實(shí)質(zhì)性、完整性、回應(yīng)性、可行性和包容性歸類(lèi)為核心維度,[2]指明了提高CSR報(bào)告質(zhì)量的關(guān)鍵,我們要做的是根據(jù)一定的標(biāo)準(zhǔn),利用數(shù)據(jù)挖掘工具,衡量CSR報(bào)告的質(zhì)量,因此提出假設(shè):使用文本挖掘技術(shù)可以提高CSR報(bào)告信息獲取的效率。段釗等(2017)認(rèn)為企業(yè)披露信息的真實(shí)性在文本主客觀描述的差異中有所表現(xiàn),并指出我國(guó)上市公司CSR報(bào)告中主觀文本占比呈現(xiàn)歷年上升態(tài)勢(shì),不同年份、不同行業(yè)間差異顯著,[3]這有助于CSR報(bào)告質(zhì)量的判斷,基于此我們假設(shè),橫向上,CSR報(bào)告質(zhì)量有行業(yè)區(qū)分,甚至企業(yè)差別;縱向上,不同年份的CSR報(bào)告質(zhì)量有差別。
2.2 基于知識(shí)發(fā)現(xiàn)的文本挖掘技術(shù)
文本挖掘(Text Mining)是一種從文本中提取隱含有用信息的計(jì)算機(jī)處理技術(shù),在商業(yè)領(lǐng)域取得了良好的效果,其操作方法一般包括分詞技術(shù)、詞頻分析、聚類(lèi)分析、可視化技術(shù)和情感分析等。陸宇杰等(2012)舉例詳細(xì)敘述了文本挖掘技術(shù)在社會(huì)科學(xué)領(lǐng)域的應(yīng)用,[4]應(yīng)用在CSR報(bào)告的研究上,我們認(rèn)為篇章分析、情感分析和本體建構(gòu)分析是實(shí)用的。通過(guò)規(guī)范概念、術(shù)語(yǔ),數(shù)據(jù)挖掘可以助力CSR報(bào)告披露標(biāo)準(zhǔn)或質(zhì)量評(píng)價(jià)體系的建立。除了將財(cái)報(bào)的審計(jì)規(guī)范挪用到CSR報(bào)告上,基于文本挖掘進(jìn)行半自動(dòng)的本體建構(gòu)大有可為。M.Foucault等(2009)研究認(rèn)為,政府首腦就職演說(shuō)中優(yōu)先級(jí)更高的部門(mén)和任內(nèi)財(cái)政預(yù)算的分配沒(méi)有關(guān)系,[5]這一發(fā)現(xiàn)打破了傳統(tǒng)觀念,CSR報(bào)告中所說(shuō)與企業(yè)實(shí)際所做也可能大有差別。
3 研究設(shè)計(jì)
3.1 數(shù)據(jù)來(lái)源
我們選擇了100家上交所上市公司CSR報(bào)告作為研究主體,剔除了金融業(yè)企業(yè)、ST公司和以圖片為CSR報(bào)告主要形式的公司(對(duì)圖表形式的報(bào)告,文本挖掘技術(shù)無(wú)能為力,但我們承認(rèn)這種形式的有用性),剩下58家企業(yè),從上交所網(wǎng)站下載報(bào)告,采用ANSI編碼將PDF格式的報(bào)告轉(zhuǎn)換成TXT格式的文本。另一部分?jǐn)?shù)據(jù)來(lái)自潤(rùn)靈環(huán)球發(fā)布的2012—2015年CSR報(bào)告評(píng)級(jí)數(shù)據(jù)庫(kù)。潤(rùn)靈環(huán)球從整體性、內(nèi)容性、技術(shù)性和行業(yè)性四個(gè)零級(jí)指標(biāo)出發(fā)建構(gòu)了完整的評(píng)級(jí)體系(MCT 2012_1.2i),其中,內(nèi)容性(Content)包含經(jīng)濟(jì)績(jī)效、勞工與人權(quán)、環(huán)境、公平運(yùn)營(yíng)、消費(fèi)者和社區(qū)參與及發(fā)展等6個(gè)一級(jí)指標(biāo),下分更細(xì)的二、三級(jí)指標(biāo)。顯然,若不是十分熟悉潤(rùn)靈體系并將其納入CSR報(bào)告的編寫(xiě)參考,企業(yè)的報(bào)告很難在評(píng)分中拿到理想成績(jī)。
3.2 假設(shè)檢驗(yàn)
以證監(jiān)會(huì)分類(lèi)標(biāo)準(zhǔn)為自變量,潤(rùn)靈環(huán)球的評(píng)分為因變量,借助SPSS 22軟件做方差分析,原假設(shè)為各行業(yè)無(wú)差異,該檢驗(yàn)的p值為0.206,這表明CSR報(bào)告質(zhì)量不存在行業(yè)差異,這與學(xué)者所說(shuō)不同,我們認(rèn)為是由于企業(yè)CSR報(bào)告得分整體偏低、行業(yè)間沒(méi)有形成規(guī)范所致。以行業(yè)為分組依據(jù)分割文件,此時(shí)自變量為不同企業(yè),檢驗(yàn)各行業(yè)企業(yè)間CSR報(bào)告質(zhì)量是否存在差異,該檢驗(yàn)的p值小于0.01,結(jié)果表明各企業(yè)間的CSR報(bào)告存在差異。以歷年的評(píng)分為變量做相關(guān)分析,相關(guān)性在0.01上顯著(雙尾),尤其是2014年和2015年報(bào)告得分,相關(guān)性達(dá)到了0.922,這說(shuō)明不同年份的企業(yè)CSR報(bào)告質(zhì)量不存在差別。
3.3 文本挖掘方法的使用
我們使用沈陽(yáng)教授研發(fā)的ROST Content Mining軟件進(jìn)行文本挖掘,選擇潤(rùn)靈評(píng)級(jí)中得分較高的兗州煤業(yè)為代表做數(shù)據(jù)挖掘個(gè)案分析,再以其所在的采掘業(yè)為代表做行業(yè)分析,最后,用收集的58個(gè)樣本企業(yè)做上市公司CSR報(bào)告的整體分析。通過(guò)上市公司群體的分析,我們希望降低有關(guān)企業(yè)特色和行業(yè)特色的詞匯比重,建立基于CSR更本質(zhì)的語(yǔ)義網(wǎng)絡(luò)。endprint
4 結(jié)論解釋
我們處理了所有樣本企業(yè)的CSR報(bào)告,參考潤(rùn)靈環(huán)球MCTi指標(biāo)體系和過(guò)濾后的高頻詞表,將這些詞(見(jiàn)表2)作為關(guān)鍵詞納入數(shù)據(jù)庫(kù)進(jìn)行分析。通過(guò)納入C指標(biāo)數(shù)量多少與潤(rùn)靈評(píng)級(jí)中C指標(biāo)得分高低的匹配,p值小于0.01,因此我們認(rèn)為文本挖掘技術(shù)可以提高CSR報(bào)告信息獲取的效率。高頻詞間的關(guān)系可以通過(guò)共現(xiàn)矩陣進(jìn)行描述,通過(guò)分析兗州煤業(yè)CSR報(bào)告高頻詞共現(xiàn)矩陣,發(fā)現(xiàn)部分高頻詞間較少甚至沒(méi)有共現(xiàn)過(guò),我們認(rèn)為這是因?yàn)椴煌P(guān)鍵詞處在報(bào)告的不同部分,分工不同。
兗州煤業(yè)CSR報(bào)告篇幅較長(zhǎng),可以達(dá)到行業(yè)內(nèi)其他企業(yè)的3倍以上,以報(bào)告頁(yè)數(shù)和潤(rùn)靈評(píng)分為變量做相關(guān)分析,p值小于0.01,Pearson相關(guān)系數(shù)達(dá)0.902,由此得出結(jié)論,報(bào)告頁(yè)數(shù)和評(píng)分高低正相關(guān),我們認(rèn)為可能是因?yàn)轫?yè)數(shù)越多,披露信息量越大,得分點(diǎn)相對(duì)而言也就越多。在采掘業(yè)報(bào)告的高頻詞表中我們認(rèn)為代表兗州煤業(yè)企業(yè)特色關(guān)鍵詞的比重已經(jīng)下降,但不是特別明顯,限于篇幅,行業(yè)分析就不展開(kāi)了。
最后是上市公司群體的分析。基于兗州煤業(yè)CSR報(bào)告高頻詞共現(xiàn)矩陣如表3所示,ROST軟件繪制了關(guān)鍵詞語(yǔ)義網(wǎng)絡(luò)圖。我們看到,無(wú)論是個(gè)案(行業(yè))還是上市公司群體,“安全”“員工”“管理”“環(huán)境”等一直處在CSR報(bào)告的核心地位,一方面是因?yàn)槲募?,?008年上交所《環(huán)境披露指引》;另一方面員工權(quán)益、安全管理等也是社會(huì)關(guān)注的重點(diǎn)。不同于單個(gè)企業(yè)的CSR報(bào)告,行業(yè)和上市公司群體的CSR報(bào)告的內(nèi)容和質(zhì)量能對(duì)市場(chǎng)的規(guī)范化提供參考,因此呈現(xiàn)出的關(guān)鍵詞不能根據(jù)賦權(quán)簡(jiǎn)單地認(rèn)定重要與否,語(yǔ)義網(wǎng)絡(luò)中不起眼的,不代表不能提供有效信息;處于邊緣地位的,亦有可能是未來(lái)的方展方向。我們特意用9×9的矩陣讓大家看到,關(guān)鍵詞“股東”與前8個(gè)高頻詞甚至沒(méi)有一次共現(xiàn)的情況,這在以往的研究中或許被忽視,但共現(xiàn)矩陣發(fā)現(xiàn)了它。
5 展望與不足
5.1 展望
通過(guò)研究文本挖掘技術(shù)在CSR報(bào)告中的應(yīng)用,我們可以為相關(guān)制度的出臺(tái)提供參考,規(guī)范企業(yè)的社會(huì)責(zé)任行為,也能幫助開(kāi)拓完善CSR報(bào)告的評(píng)價(jià)體系,還能為公眾閱讀理解CSR報(bào)告提供便利。但是,基于某些方面的考慮,部分信息企業(yè)可能都不愿意披露,重要概念、術(shù)語(yǔ)也沒(méi)有規(guī)范,基于文本挖掘的本體建構(gòu)就不會(huì)全面,所以在事先立法設(shè)規(guī)時(shí)就應(yīng)將有關(guān)事項(xiàng)予以明確。從另一個(gè)角度看,不同企業(yè)CSR報(bào)告質(zhì)量存在差異,但這種差異不是不可以消除,相關(guān)行業(yè)視情況應(yīng)出臺(tái)一些指導(dǎo)性意見(jiàn)用以自律,但不應(yīng)越權(quán)管理或強(qiáng)制執(zhí)行。此外,對(duì)于包括但不限于文本挖掘研究的成果,企業(yè)得到反饋后可能在之后的報(bào)告中做出改變,加強(qiáng)重要相關(guān)信息的準(zhǔn)確度,而對(duì)其他敏感信息故意模糊,[6]使文本挖掘的成果無(wú)法運(yùn)用到下一期,因此文本挖掘技術(shù)的應(yīng)用有不可避免的滯后性,起不到預(yù)測(cè)作用。
5.2 研究不足
研究的不足之處,大體上可分為方法上和技術(shù)上兩類(lèi)。我們認(rèn)為,CSR報(bào)告中關(guān)鍵詞越多,報(bào)告越全面;主觀文本越少,報(bào)告越客觀。這樣的假設(shè)存在兩個(gè)問(wèn)題,一是與履行CSR無(wú)關(guān)的詞匯在報(bào)告中大量出現(xiàn),[7]它們并不屬于關(guān)鍵詞,這使得報(bào)告全面性不夠;二是語(yǔ)義分析雖然可以從非結(jié)構(gòu)化的文本中提取有用信息,但前提是企業(yè)信息披露是充分、準(zhǔn)確的,這在現(xiàn)實(shí)中很難做到,以上是方法上的不足。技術(shù)上,我們的分詞技術(shù)并不完善,在一定程度上,行業(yè)術(shù)語(yǔ)的暴力切分不影響本體建構(gòu)的基礎(chǔ),但總歸是不令人滿(mǎn)意,還有就是同一個(gè)詞在上下文的意義不盡相同,這使得確定關(guān)鍵詞、統(tǒng)計(jì)頻數(shù)和構(gòu)造共現(xiàn)矩陣上存在很大問(wèn)題。
參考文獻(xiàn):
[1]陶文杰,金占明.媒體關(guān)注下的CSR信息披露與企業(yè)財(cái)務(wù)績(jī)效關(guān)系研究及啟示——基于我國(guó)A股上市公司CSR報(bào)告的實(shí)證研究[J].中國(guó)管理科學(xué),2013,21(4):162-170.
[2]齊麗云,張碧波,李騰飛.企業(yè)社會(huì)責(zé)任報(bào)告質(zhì)量評(píng)價(jià)研究[J].科研管理,2016(4):644-651.
[3]段釗,何雅娟,鐘原.企業(yè)社會(huì)責(zé)任信息披露是否客觀——基于文本挖掘的我國(guó)上市公司實(shí)證研究[J].南開(kāi)管理評(píng)論,2017,20(4):62-72.
[4]陸宇杰,許鑫,郭金龍.文本挖掘在人文社會(huì)科學(xué)研究中的典型應(yīng)用述評(píng)[J].圖書(shū)情報(bào)工作,2012,56(8):18-25.
[5]Foucault M,F(xiàn)ranois A.General Policy Speech of Prime Ministers and Fiscal Choices in France:“Preach Water and Drink Wine!”[M].//Do They Walk Like They Talk?.New York:Springer,2009:131-154.
[6]Li F.Annual Report Readability,Current Earnings,and Earnings Persistence[J].Journal of Accounting and Economics,2008,45(2):221-247.
[7]李慧云,周華艷,胡欣蕾,等.自愿性信息披露質(zhì)量評(píng)判方法的架構(gòu)與實(shí)現(xiàn)[J].統(tǒng)計(jì)與決策,2017(8):70-73.
[8]趙美,黃麒.文本挖掘在企業(yè)社會(huì)責(zé)任報(bào)告研究中的應(yīng)用探析[J].中國(guó)市場(chǎng), 2017(19).
[9]陳茜,連婉琳.基于文本挖掘技術(shù)的互聯(lián)網(wǎng)股票新聞的情感分類(lèi)[J].中國(guó)市場(chǎng),2015(24).
[10]王澤恩.我國(guó)企業(yè)社會(huì)責(zé)任探究[J]. 中國(guó)市場(chǎng),2017(4).
[11]王月恒,王晶,劉欣俠.大數(shù)據(jù)時(shí)代新型對(duì)外貨物貿(mào)易統(tǒng)計(jì)體系研究[J]. 中國(guó)市場(chǎng),2017(19).endprint