邢竹天,徐揚(yáng)
(北京大學(xué) 信息管理系,北京 100871)
研究表明,不同的語(yǔ)言和語(yǔ)境中反諷的特征表現(xiàn)并不一致。網(wǎng)絡(luò)的半虛擬性使得反諷成為網(wǎng)絡(luò)語(yǔ)言中的重要特點(diǎn),因此對(duì)于反諷修辭特征的識(shí)別在語(yǔ)篇的風(fēng)格分析和網(wǎng)絡(luò)輿論的探知過(guò)程中有重要的意義。利用計(jì)算機(jī)理解文本語(yǔ)義時(shí),一個(gè)重要問(wèn)題是解析文本的修辭。語(yǔ)境與修辭的存在使得語(yǔ)句或者篇章的真實(shí)含義偏離其字面本意,從而導(dǎo)致了單純的單詞(字)翻譯算法并不能滿意地從語(yǔ)料中準(zhǔn)確抽取語(yǔ)義?;ヂ?lián)網(wǎng)語(yǔ)料具有動(dòng)態(tài)多變的特性,比報(bào)刊文件等正式出版物更接近自然的漢語(yǔ),本文試圖探討一種能夠在特定的語(yǔ)境中識(shí)別互聯(lián)網(wǎng)上漢語(yǔ)反諷修辭的算法,并構(gòu)建模型。
根據(jù)日常經(jīng)驗(yàn),人們往往把“反諷(irony)”、“諷刺(sarcasm)”、“含沙射影(innuendo)”等相近的修辭格混為一談。但在修辭學(xué)的體系中,這些修辭格間的差異都有明顯區(qū)分。實(shí)際上,西方學(xué)者對(duì)于反諷的定義和理解是漸進(jìn)且多維的,修辭學(xué)領(lǐng)域?qū)Ψ粗S的討論從古希臘就開始了。柏拉圖認(rèn)為,在蘇格拉底之前,反諷表示說(shuō)大話或輕蔑,“含有狡猾、嘲笑、偽裝和欺騙之意”;蘇格拉底之后,其定義主要與“意義與所說(shuō)的相反”相聯(lián)系[1]。Liddell和Scott認(rèn)為,反諷(irony)被理解為“被人覺察的假裝無(wú)知”或一種幽默[2]。Burgers等人認(rèn)為反諷是一種二元性或者模糊性,即使在面對(duì)面的交談中,也可能為一些人所不察覺[3]。Partington認(rèn)為反諷是一種有意的不真實(shí)的表達(dá)[4]??傊?,關(guān)于“反諷是什么”這樣一個(gè)問(wèn)題,很多人給出了答案:反諷中包含著一種不一致。
國(guó)內(nèi)學(xué)者如馮翠華、趙巧紅等人認(rèn)為,反諷又稱反話﹑倒辭,是故意使用與本來(lái)意思相反的詞語(yǔ)或句子,或是言過(guò)其實(shí),或是用過(guò)于謙虛和禮貌等不真實(shí)言語(yǔ)來(lái)表達(dá)本意的一種修辭手段;而諷刺則是指用尖酸刻薄的譏諷話,甚至是嚴(yán)厲的叱責(zé),也可用直敘法對(duì)個(gè)人的缺點(diǎn)、過(guò)失或社會(huì)上的丑惡現(xiàn)象及黑暗面進(jìn)行諷刺、挖苦;含沙射影常以暗示或兜圈子、拐彎兒的方法來(lái)表達(dá)對(duì)敘述對(duì)象的輕蔑或貶損,以避免引起對(duì)象的傷感與不快[5-6]。這樣一些描述性的定義,并不能很好地區(qū)分反諷、諷刺、含沙射影等語(yǔ)言現(xiàn)象。因?yàn)檫@些描述有其含糊性,并不能真正用來(lái)判斷具體一段話語(yǔ)是否是“反諷”。不過(guò),一個(gè)基本和西方學(xué)者一致的結(jié)論是,反諷是言語(yǔ)的所指(實(shí)際意義)和意指(字面意義)存在著矛盾沖突的詞或者句子。
修辭學(xué)將反諷分為言語(yǔ)反諷(verbal irony)、情景反諷(situational irony)和戲劇反諷(dramatical irony)三類[7]。言語(yǔ)反諷是指“語(yǔ)言外殼與真實(shí)意指之間的對(duì)照與矛盾”;情景反諷是文本的主題立意、情節(jié)編撰、敘事結(jié)構(gòu)等文體要素共同孕育的一種內(nèi)在張力;戲劇反諷則是觀眾(讀者)的全知全能與劇中人的無(wú)知之間的張力。在這三類反諷中,言語(yǔ)反諷最簡(jiǎn)單而易于識(shí)別。趙毅衡分析了網(wǎng)絡(luò)時(shí)代的反諷特征,即各種網(wǎng)絡(luò)社群使得人與人空間隔斷,一個(gè)非社群化的社群不必強(qiáng)求一致也能找到必要的共識(shí),其半虛擬性使得反諷成為網(wǎng)絡(luò)語(yǔ)言的重要特點(diǎn)[8]。這些文學(xué)意義上所界定的反諷普遍比較寬泛,不能作為識(shí)別反諷的依據(jù),例如所謂隱蔽性反諷只在交際時(shí)引起聽話對(duì)象的注意,只可期待不可預(yù)測(cè),否則就失去意義。
語(yǔ)用學(xué)對(duì)反諷的研究一方面承認(rèn)“反諷應(yīng)該隱含著與字面義相反的含義”,另一方面強(qiáng)調(diào)過(guò)去的知識(shí)在理解反諷中的作用,反諷話語(yǔ)都提述先前或未來(lái)交際雙方共有過(guò)的事件、思想?,F(xiàn)代語(yǔ)義學(xué)對(duì)反諷的研究方法主要是分析孤立語(yǔ)句的語(yǔ)義結(jié)構(gòu)特征。Clift提出,語(yǔ)義焦點(diǎn)的存在性是反諷語(yǔ)句的必要不充分條件[8]。由此可以認(rèn)定,反諷的第三個(gè)特征是反諷言語(yǔ)必須包含語(yǔ)義焦點(diǎn)。在計(jì)算語(yǔ)言學(xué)中,一種常見的發(fā)現(xiàn)語(yǔ)義焦點(diǎn)的方法是尋找焦點(diǎn)敏感算子。在中文環(huán)境下,語(yǔ)義焦點(diǎn)除依靠音調(diào)的標(biāo)識(shí)外還通過(guò)焦點(diǎn)敏感算子(大多是一些副詞,如:“只”、“甚至”、“居然”、“真”、“都”、“最”等)所標(biāo)識(shí)。曾衍桃指出,反諷主要出現(xiàn)在表達(dá)斷言性言語(yǔ)行為的命題中[6]。據(jù)此,反諷存在的另一個(gè)特征是反諷出現(xiàn)的言語(yǔ)是斷言性的或者評(píng)價(jià)性的,這依然是一個(gè)必要不充分條件。
綜上所述,反諷作為一種修辭其特征得以大致概括。但是每一個(gè)特征都不是具有強(qiáng)相關(guān)性的判據(jù)。因此我們希望綜合利用這些特征構(gòu)造一個(gè)判別模型。筆者將這些特征分別歸納為字面義與實(shí)際意的矛盾、語(yǔ)言張力、語(yǔ)義焦點(diǎn)的存在以及斷言性或評(píng)價(jià)性的言語(yǔ)情境。
為了方便描述特征計(jì)算的模型,對(duì)一些基本概念作如下定義。
定義1 言語(yǔ)是指一段表達(dá)一定觀點(diǎn)或情感的話語(yǔ)。它表達(dá)觀點(diǎn)或情感的對(duì)象是一段稱為討論主題的文字。
定義2 對(duì)應(yīng)一段討論主題Ti的言語(yǔ)是
依照前文對(duì)反諷特征的總結(jié),反諷修辭可以具有以下幾個(gè)特征用以計(jì)算機(jī)識(shí)別。
從定義可以看出,反諷修辭中存在實(shí)際意義和字面意義有矛盾沖突的詞或者句子。假定一段言語(yǔ)的字面意義可以通過(guò)其關(guān)鍵詞表征。一種直觀的反諷判別方法是利用關(guān)鍵詞來(lái)捕捉該段言語(yǔ)的字面意義,再結(jié)合語(yǔ)境去分析出實(shí)際意義,最后測(cè)量二者的矛盾沖突。這一方法的難點(diǎn)在于計(jì)算機(jī)無(wú)法通過(guò)文本本身解析出其實(shí)際意義。
本文采用一種特殊的方法解決該問(wèn)題。對(duì)于一段討論主題T與言語(yǔ)S,分別用其關(guān)鍵詞作為向量代表它們的字面義。即定義待判別言語(yǔ)的“討論主題”,把“討論主題”的字面義看作其對(duì)應(yīng)言語(yǔ)的實(shí)際意義的估計(jì)量。用討論主題的關(guān)鍵詞和言語(yǔ)的關(guān)鍵詞的偏移量的反面——相關(guān)度(記為Re)來(lái)反映這種意指義和字面義的差別。顯然,根據(jù)我們之前的討論,相關(guān)度越大表示意指義和字面義的差別越小。Re應(yīng)該和這段言語(yǔ)包含反諷的概率呈負(fù)相關(guān)。
定義3 對(duì)于Ti和,都有含權(quán)關(guān)鍵詞向量,其中是對(duì)i的第j個(gè)關(guān)鍵詞,wj是的歸一化權(quán)重。
其中,
自然語(yǔ)言里詞語(yǔ)的數(shù)目是非常大的,所以計(jì)算時(shí)k的下角標(biāo)延伸到很大,把自然語(yǔ)言假設(shè)為平穩(wěn)隨機(jī)過(guò)程時(shí)|αYTiY|是遠(yuǎn)大于|α()|的常數(shù),不妨令其為1。則:
此外,反諷言語(yǔ)中存在張力。由于反諷常出現(xiàn)在斥責(zé)、壓抑等環(huán)境中,反諷言語(yǔ)帶有一種緊張感,言語(yǔ)的情感表現(xiàn)飄忽不定,讓人困惑。定義情感張力E來(lái)描述一段言語(yǔ)中情感的起伏程度。
反諷言語(yǔ)一般還應(yīng)該包含語(yǔ)義焦點(diǎn),而語(yǔ)義焦點(diǎn)可以通過(guò)焦點(diǎn)敏感算子來(lái)發(fā)現(xiàn)。所以焦點(diǎn)敏感算子的缺失支持了反諷可能不存在。命名文中常見的可能成為焦點(diǎn)敏感算子的詞為“特征詞”,用特征詞累積分?jǐn)?shù)F來(lái)推斷反諷的出現(xiàn)概率。
Holdcrof提出評(píng)價(jià)性和斷言性作為反諷出現(xiàn)概率的指標(biāo)[10]。在設(shè)計(jì)算法時(shí),將言語(yǔ)是否具有評(píng)價(jià)性定義為評(píng)價(jià)性因子P。評(píng)價(jià)性因子本文用言語(yǔ)的形容詞密度來(lái)測(cè)量。而言語(yǔ)是否具有斷言性定義斷言因子A,用以判斷言語(yǔ)是否為斷言性的0-1二值函數(shù)表示。
定義7
Fig.1 System structure of irony detection圖1 反諷識(shí)別系統(tǒng)架構(gòu)
根據(jù)圖1,算法構(gòu)建步驟如下:
1)從QQ新聞、新浪財(cái)經(jīng)、天涯論壇等新聞網(wǎng)站的網(wǎng)頁(yè)上隨機(jī)選取15篇財(cái)經(jīng)方面的報(bào)道T1到T15。選取財(cái)經(jīng)報(bào)道的考慮是基于主題的相似性可以減小情感詞典的規(guī)模,同時(shí)使得反諷的特征在一定的領(lǐng)域內(nèi)更加突出。
2)使用Lucene軟件包中加載mmseg4j的中文分詞器對(duì)隨機(jī)抽取的屬于T1到T15的2795條言語(yǔ)作為訓(xùn)練文檔切分。使用TextRank[10]算法計(jì)算一段文本i的第j個(gè)關(guān)鍵詞和權(quán)重wj,利用FudanNLP[11]工具包進(jìn)行詞性標(biāo)注。
3)情感詞典的收錄詞同時(shí)參考清華大學(xué)自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室的中文褒貶義詞典V1.0和切分Sji產(chǎn)生的詞匯,并標(biāo)記為強(qiáng)烈正向(E =1),正向(E =0.5),中性(E =0),負(fù)向(E = -0.5),強(qiáng)(E = -1)5。 ,, ,烈負(fù)向 類 根據(jù)經(jīng)驗(yàn) 假設(shè)中的ρ= 且為了簡(jiǎn)化計(jì)算 假定?i,fi=1,取5個(gè)焦點(diǎn)敏感算子。
這樣就可以計(jì)算所有的言語(yǔ)特征:如對(duì)題為“星巴克:售價(jià)高因中國(guó)客人一待就是幾小時(shí)”的一篇新聞報(bào)道,有α(T)= (1×中國(guó),0.44×星巴克,0.41×美國(guó),0.25×咖啡,0.23×咖啡館,…,0.1×電視臺(tái),0.1×相當(dāng),0.1×主張,0.1×原材料),而屬于T的某條言語(yǔ)=“星巴克本來(lái)就是美國(guó)垃圾文化的代表?!庇笑粒剑?×代表,1×星巴克,0.1×垃圾,0.1×文化)。且Re(T,)=(0.44×1)/(2 &1+1+1+1),E()=1,再查詢情感詞典則有ε()=(0,0,0,0,-1,0,0,0)。又P()=0/8=0(注意其實(shí)此處“垃圾”為形容詞化的名詞,但由于詞典和算法的粗糙性誤判為名詞)。通過(guò)含不含有疑問(wèn)詞和問(wèn)號(hào)判斷A()=1。
為了確定該算法的效率與效果,實(shí)驗(yàn)中將算法的識(shí)別結(jié)果和人工標(biāo)注的數(shù)據(jù)進(jìn)行對(duì)比。由于因變量為言語(yǔ)是否存在反諷的二值函數(shù),采用IBM SPSS Statistics 20中運(yùn)行的Logistic回歸擬合2602條言語(yǔ)的人工標(biāo)注數(shù)據(jù),結(jié)果如表1所示。本文剔除了F),P()是因?yàn)樗鼈兒湍P徒Y(jié)果的相關(guān)性沒有通過(guò)F檢驗(yàn),而從回歸結(jié)果來(lái)看,A)亦沒有通過(guò)t檢驗(yàn),在95%的置信水平下影響反諷識(shí)別的證據(jù)并不充足。
由于反諷在自然語(yǔ)言條件下的存在是稀疏的,為了得到較寬泛而準(zhǔn)確的識(shí)別,需要對(duì)分類閾值做出調(diào)整。(事實(shí)上在篩選數(shù)據(jù)集的時(shí)候已經(jīng)人為將反諷出現(xiàn)的概率設(shè)定在20%左右)。用從困惑矩陣中計(jì)算出的準(zhǔn)確率P,召回率R,F(xiàn)值(F=,β取1和0.5)三個(gè)指標(biāo)來(lái)衡量不同的分類閾值,步距取0.05,如表2所示。
表1 獨(dú)立變量和控制變量的相關(guān)性Table 1 Relationship of independent variables and control variables
表2 不同β和分類閾值對(duì)應(yīng)的F值Table 2 F-measure with different beta and cut-off threshold
根據(jù)表2,在偏重召回率的情況下,為了準(zhǔn)確率的不明顯提高需要付出極大的召回率代價(jià)。因此,為了保證F值的穩(wěn)健性,仍令β取1,閾值取0.25,這時(shí)模型如表3所示。
表3 回歸系數(shù)和顯著水平Table 3 Regression coefficients and their significance
為了檢驗(yàn)反諷修辭識(shí)別的Logistic模型是否有效,另從互聯(lián)網(wǎng)以相同的方式抓取了來(lái)自三篇新聞報(bào)道的50條言語(yǔ)作為測(cè)試文檔,此三篇報(bào)道在主題內(nèi)容上和上述用以訓(xùn)練模型的報(bào)道是相互獨(dú)立的。用問(wèn)卷方式搜集了10個(gè)人對(duì)測(cè)試文檔的反諷特征標(biāo)注結(jié)果,以計(jì)分的方式選取了普遍認(rèn)可度高的11條反諷言語(yǔ)。結(jié)果按0.25閾值計(jì)算,識(shí)別結(jié)果42條,命中9條;按0.5閾值計(jì)算,識(shí)別結(jié)果25條,命中7條。驗(yàn)證結(jié)果表明閾值的絕對(duì)數(shù)值波動(dòng)較大,最好根據(jù)實(shí)際情況如反諷在語(yǔ)料中所占的比例來(lái)確定閾值。但無(wú)論在哪種情況下召回率都較高,即必須對(duì)被評(píng)估的言語(yǔ)中反諷出現(xiàn)的頻率有先驗(yàn)的知識(shí),才能又準(zhǔn)確又全面地識(shí)別出結(jié)果。同時(shí)通過(guò)特征參數(shù)計(jì)分的模型來(lái)識(shí)別互聯(lián)網(wǎng)上的反諷修辭的方法是有效的。在IBM SPSS Statistics 20中運(yùn)行C4.5算法決策樹和BP神經(jīng)網(wǎng)絡(luò)的結(jié)果均不好于Logistic模型,如表4所示的困惑矩陣比較了不同模型的預(yù)測(cè)能力。
在大規(guī)模試驗(yàn)中我們比較了三種不同模型下的指標(biāo)和在英語(yǔ)、巴西葡萄牙語(yǔ)等其他語(yǔ)言上進(jìn)行諷刺識(shí)別的結(jié)果[12-15],如圖2所示。需要指出的是這些結(jié)果并不具有完全的可比性,因?yàn)檎Z(yǔ)料的質(zhì)量,反諷言語(yǔ)所占的比例等參數(shù)都不相同,但可以粗略的看到,英語(yǔ)語(yǔ)境中的諷刺識(shí)別是研究的最為完整透徹的一個(gè)問(wèn)題,準(zhǔn)確率,召回率和精確度都達(dá)到70%,巴西葡萄牙語(yǔ)的高準(zhǔn)確率是語(yǔ)料的反諷言語(yǔ)所占的比例高達(dá)50%的結(jié)果。如果不考慮這一點(diǎn),意大利語(yǔ)和巴西葡萄牙語(yǔ)的模型指標(biāo)略低于英語(yǔ),而在中文組中,召回率近乎達(dá)到當(dāng)前最好的水平,但是準(zhǔn)確度偏低是一個(gè)值得重視和進(jìn)一步研究的問(wèn)題。
表4 不同模型之間的預(yù)測(cè)能力比較Table 4 Confusion matrices of prediction results with different models
Fig.2 Comparison of precision,recall and accuracy of irony detection in different languages圖2 不同語(yǔ)言反諷識(shí)別的準(zhǔn)確率,召回率和精確度對(duì)比
反諷等一系列修辭特征的識(shí)別在語(yǔ)篇的風(fēng)格分析和網(wǎng)絡(luò)輿論的探知過(guò)程中有重要的意義,通過(guò)系統(tǒng)的識(shí)別過(guò)濾,可以提高人工識(shí)別的效率。本文對(duì)反諷修辭的識(shí)別雖然是基于特征規(guī)則,但在每一項(xiàng)具體特征的抽取中帶有濃厚的統(tǒng)計(jì)色彩,所以語(yǔ)料的規(guī)模和算法的精細(xì)程度對(duì)特征數(shù)據(jù)的質(zhì)量有非常大的影響。例如,在中文切詞中出現(xiàn)的錯(cuò)誤,詞性標(biāo)注的錯(cuò)誤,包括詞典的同義詞不對(duì)應(yīng)(如切分出的“中央”、“電視臺(tái)”不能和“央視”匹配)都使實(shí)際數(shù)據(jù)偏離特征的真實(shí)反映。因此要達(dá)到較高準(zhǔn)確度,人工的輔助仍是必不可少的。
本文的主要貢獻(xiàn)包括提供了一種看待修辭的新思路:將修辭看作是在具體某種語(yǔ)言中的現(xiàn)象,并捕捉其特征,這加深了我們對(duì)這種語(yǔ)言的認(rèn)識(shí)。同時(shí),本文提供了一種計(jì)算機(jī)識(shí)別修辭現(xiàn)象的方法,為計(jì)算機(jī)更加正確的理解文本語(yǔ)義提供了基礎(chǔ)。
影響識(shí)別效果的另一個(gè)因素是網(wǎng)絡(luò)語(yǔ)言的不規(guī)范性,包括錯(cuò)別字、標(biāo)點(diǎn)符號(hào)的缺失和不符合標(biāo)準(zhǔn)漢語(yǔ)習(xí)慣。例如,如果一部分語(yǔ)料帶有西南官話才有的特征詞,而另一部分語(yǔ)料使用粵語(yǔ)語(yǔ)法,那么這將給詞典的編制、進(jìn)一步的反諷語(yǔ)法特征提取造成困難。在現(xiàn)有的分詞技術(shù)和語(yǔ)言模型下,進(jìn)一步優(yōu)化系統(tǒng)應(yīng)該更多地從細(xì)化情感詞典的粒度和如何更好地刻畫意指義和字面義的偏離程度等方面考慮,特別是如何判斷一段言語(yǔ)是否含有“弦外之音”,這些問(wèn)題還有待進(jìn)一步研究。
[1]Welldon J E C.The Rhetoric of Aristotle[M].Whitefish:Nabu Press,2010.
[2]Liddell H G.An Intermediate Greek-English Lexicon-Founded Upon the Seventh Edition of Liddell and Scott’s Greek-English Lexicon[M].Oxford:Benediction Classics,2010.
[3]Burgers C M,van Mulken M,Schellens P J.Type of Evaluation and Marking of Irony:The Role of Perceived Complexity and Comprehension[J].Journal of Pragmatics,2012,44:231-42.
[4]Partington A.Phrasal irony:Its form,F(xiàn)unction and Exploitation[J].Journal of Pragmatics,2011,43(6):1786-1800.
[5]馮翠華.英語(yǔ)修辭大全[M].北京:外語(yǔ)教學(xué)與研究出版社,2005.
[6]趙巧紅.《高級(jí)英語(yǔ)》中的Irony、Innuendo、Ridicule、Sarcasm之辨析[J].楚雄師范學(xué)院學(xué)報(bào),2011(7):84-87.
[7]趙毅衡.反諷:表意形式的演化與新生[J].文藝研究,2011(1):18-27.
[8]Clift R.Irony in Conversation[J].Language In Society,1999,28(4):523-553.
[9]Holdcroft D.Irony as Trope,and Irony as Discourse[J].Poetics Today,1983,4(3):493-511.
[10]Xu L,Zhang Q,Wang DD,et al.Research of Chinese Segmentation Based on MMSeg and Double Array TRIE[J].Advanced Research on Automation,Communication,Architectonics and Materials,2011,225-226(1-2):945-948.
[11]Cruz F,Troyano J A,Enriquez F.Supervised TextRank[J].Advances in Natural Language Processing,2006,4139:632-639.
[12]de Freitas,Larissa A,Hogetop D.Pathways for Irony Detection in Tweets[C]∥Proceedings of the 29thAnnual ACM Symposium on Applied Computing,2014.
[13]Reyes A,Rosso P,Veale T.A Multidimensional Approach for Detecting Irony in Twitter[J].Language Resources and E-valuation,2013,47:239-68.
[14]Li R,Shi S,Huang H.A Mothod of Polarity Computation of Chinese Sentiment Words Based on Gaussian Distribution[C]∥Computational Linguistics and Intelligent Text Processing CICLing2014,Part II:53-61.
[15]Hao Y F,Veale T.An Ironic Fist in a Velvet Glove:Creative Misrepresentation in the Construction of Ironic Similes[J].Minds and Machines,2010,20(4):635-650.