耿冕
西方媒體是如何報道中國的?這是一個持續(xù)引發(fā)關注的問題。至少在2019年,中國普通民眾也清晰感受到西方媒體涉華報道中的歧視和偏見。這種歧視和偏見,不少都是通過被冠以“主流”的西方媒體對相關事件進行選擇性報道所展現(xiàn)的。不過,偏偏有人嘗試用所謂更“科學”的方法,挑戰(zhàn)這種普遍感受,揭示某種“反直覺”的深層觀點。比如網(wǎng)上流傳著一篇題為《大數(shù)據(jù)告訴你,外媒是否熱衷報道中國的負面新聞?》的文章,就是此類嘗試的典型。
文章作者聲稱借助一個名為GDELT項目的數(shù)據(jù),評估各國媒體報道的“褒貶指數(shù)”,據(jù)此得出結論是“最偏見的媒體很可能就是中國媒體”,而“西方大國媒體對中國的報道都以褒揚為主”。這樣的研究結論當然有視覺沖擊力,那么如此“科學”的研究,也必然是可檢驗或者說可復現(xiàn)的吧?
文章作者使用的GDELT項目,是美國喬治城大學一位教授2013年創(chuàng)建并發(fā)布的一個新聞數(shù)據(jù)庫。該數(shù)據(jù)庫對全球新聞事件進行抓取,然后使用一個名為“沖突與調解事件觀察活動和演員代碼手冊”(縮寫為“CAMEO”)中界定的方法進行編碼。被前述作者稱為“褒貶指數(shù)”的是GDELT項目數(shù)據(jù)文件中的一個字段,名為“AvgTone”。根據(jù)項目提供的解釋,這個字段表示提及某一事件的所有文檔的“平均基調”。其分值范圍從-100(極度消極)到+100(極度積極),常用值介于-10和+10之間,0表示中性。這可以被用作過濾事件“上下文”的方法,對某一事件重要性及其影響進行測量。
前述網(wǎng)文并未提供“褒貶指數(shù)”的原文表述,但從GDELT項目的數(shù)據(jù)來源看,應該就是“AvgTone”這個字段。既然是這樣,那么這篇文章的內容和結論就很值得商榷了。
就研究的問題來說,人們關注的問題是西方媒體在涉華報道中主要表現(xiàn)出來的是對中國的褒揚還是貶低,但這個問題是否可以等價轉化為在涉及中國的報道中,西方媒體更多使用了表達負面情緒還是表達正面情緒的詞匯?
從已有實際案例來看,這個轉換是存在問題的。一個顯而易見的例子,就是去年香港發(fā)生街頭暴亂,歐美一些媒體將其美化為所謂“靚麗的風景線”。這類報道中使用了正面詞匯,但這樣就能表示這個報道是對中國的“褒揚”嗎?恰恰相反,這種表述越多,表明偏見越高。
就研究的方法來說,在使用數(shù)據(jù)庫進行分析時,需要明確數(shù)據(jù)的意涵,而非僅僅滿足于數(shù)字的計算。很顯然,即使是數(shù)據(jù)庫的編纂者,在設置字段時關注的也是事件本身的重要性,測度的是其影響力,而非認為通過對特定類型情緒的詞匯統(tǒng)計賦值,就能描述媒介的態(tài)度。對于此類數(shù)據(jù)的使用和解讀,仍應遵循創(chuàng)設者的原意,盡量避免使用者本身的預設立場干擾對數(shù)據(jù)的使用和解讀。
就研究的過程來看,更加謹慎和科學的研究,是對編碼手冊本身進行必要的考察,因為這本手冊本身如果存在某種偏差的話,那么對數(shù)據(jù)的使用就有進行校正或修訂闡釋的必要。CAM?EO手冊對每個編碼都有闡釋,并提供“樣本文本”,簡單檢索就可以發(fā)現(xiàn)一些非常有趣的細節(jié)。比如,“巴勒斯坦”這個單詞出現(xiàn)了62次,在主語位置時,基本都是與負面新聞相關的,核心主題是巴勒斯坦襲擊以色列;而在正面或中性場合提到的范文,都是以色列對巴勒斯坦示好的詞條。這樣的編碼手冊本身就存在著嚴重的偏見甚至歧視,據(jù)此得出的結論是否公正就可想而知了。
技術發(fā)展豐富了研究手段,但從事研究的終究是人,如何避免出現(xiàn)靚麗方法包裝下的各種有意或無意的誤讀,尤其不要出現(xiàn)“西方媒體對中國的報道都以褒揚為主”這樣明顯有違常識甚至可笑的結論,是值得人們重視和努力解決的重要問題。▲
(作者是媒體行業(yè)觀察家)