劉依歡
摘? ? 要: 文本情感分析的主要任務(wù)是識(shí)別和判斷文本中的情感單元,情感單元既包括直接決定了文本情感傾向的評(píng)價(jià)詞,又考慮了對(duì)情感傾向有間接影響的上下文。本文提出了評(píng)價(jià)詞的確定原則,從不同的角度對(duì)評(píng)價(jià)詞進(jìn)行分類,并論述了影響文本情感強(qiáng)度的語(yǔ)言因素,包括詞匯、語(yǔ)境、固定搭配、語(yǔ)法手段、標(biāo)點(diǎn)符號(hào)和表情等,試圖將文本中帶有情感傾向的成分識(shí)別出來(lái),提高文本情感分析的效果。
關(guān)鍵詞: 情感分析? ? 評(píng)價(jià)詞? ? 情感單元? ? 語(yǔ)言因素
1.情感分析
文本的情感分析又稱意見挖掘,主要任務(wù)是對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理,情感色彩是指文本體現(xiàn)出來(lái)的評(píng)價(jià)者的立場(chǎng)、態(tài)度和情感傾向。與詞語(yǔ)的情感色彩分類相同,文本的情感色彩(傾向)也分為褒義、貶義和中性三類。褒義是指評(píng)價(jià)者對(duì)評(píng)價(jià)對(duì)象持積極、正向、贊揚(yáng)的態(tài)度,貶義是評(píng)價(jià)者持消極、負(fù)面、貶斥的態(tài)度,中性是評(píng)價(jià)者持中立態(tài)度。
在文本情感的處理過(guò)程中,為了方便表達(dá)和計(jì)算,引入極性和極值這兩個(gè)概念。這里的極性是指情感傾向的性質(zhì),即上文所說(shuō)的正面、負(fù)面和中性,極值是對(duì)極性的賦值。在不考慮強(qiáng)度的情況下,當(dāng)文本極性為正向時(shí),極值為1,極性為負(fù)面時(shí),極值為-1,極性為中性時(shí),極值為0。
以書面形式呈現(xiàn)的文本,主要依靠帶有情感傾向的詞語(yǔ)來(lái)表達(dá)情感,而非借助眼神表情等身體語(yǔ)言,也即情感詞語(yǔ)是評(píng)價(jià)者表達(dá)情感的主要依據(jù)。這里所說(shuō)的情感詞語(yǔ)是指情感評(píng)價(jià)單元,評(píng)價(jià)單元是以情感詞為核心的,長(zhǎng)度更長(zhǎng)的,帶有評(píng)論者主觀情感的語(yǔ)言單位。它既包括直接決定文本情感的評(píng)價(jià)詞,也考慮了間接影響情感傾向的上下文。在比較簡(jiǎn)短的文本中,評(píng)價(jià)詞周圍沒(méi)有影響情感傾向的上下文,這時(shí)評(píng)價(jià)詞就是評(píng)價(jià)單元,因此這兩個(gè)概念并不是整體和部分的關(guān)系,它們有時(shí)是相等的。
在分析文本的情感傾向和強(qiáng)度時(shí),關(guān)鍵是識(shí)別和判斷文本中的評(píng)價(jià)單元。目前學(xué)界和工業(yè)界大都采用基于統(tǒng)計(jì)的方法,研究了各種算法和模型,在識(shí)別評(píng)價(jià)對(duì)象、屬性尤其是情感單元方面取得了不錯(cuò)的成果。但是現(xiàn)有系統(tǒng)對(duì)情感單元的語(yǔ)言特點(diǎn)研究得較少,因此本文將以汽車評(píng)價(jià)文本為基礎(chǔ),從語(yǔ)言學(xué)的角度探討如何確定評(píng)價(jià)文本中評(píng)價(jià)詞和情感單元,并分析和總結(jié)影響文本情感強(qiáng)度的因素。
2.評(píng)價(jià)詞的確定及分類
2.1評(píng)價(jià)詞的確定
情感分析的難點(diǎn)是確定文本中的評(píng)價(jià)詞及影響情感極性強(qiáng)度的上下文,以及基礎(chǔ)上進(jìn)行的情感分析。汽車評(píng)價(jià)文本中的評(píng)價(jià)詞是指體現(xiàn)了評(píng)價(jià)者對(duì)汽車某實(shí)體某屬性的態(tài)度、傾向的詞,如“好、舒服、滿意、討厭”等。
由于分析的層面不同,在具體的文本語(yǔ)境中,某些本身并無(wú)情感傾向的詞在文本中表現(xiàn)出了明顯的情感傾向,文本層面的情感詞比詞匯層面的情感詞范圍更廣。比如“高”“低”這類詞從詞匯角度來(lái)說(shuō),它們本身并無(wú)色彩義,但是當(dāng)置于具體語(yǔ)境,與實(shí)際的屬性組合時(shí),詞語(yǔ)就產(chǎn)生了相應(yīng)的情感傾向,被處理成情感單元的評(píng)價(jià)詞。這一過(guò)程的實(shí)現(xiàn)依賴于社會(huì)常識(shí),比如“汽車油耗高”,根據(jù)日常生活的常識(shí),油耗越高,燃油越多,說(shuō)明汽車性能低消耗大,是與評(píng)價(jià)者期望相反的消極表現(xiàn),因此極值為-1。
確定文本評(píng)價(jià)詞的原則是,直接決定評(píng)價(jià)者對(duì)評(píng)價(jià)對(duì)象態(tài)度的詞即為評(píng)價(jià)詞。需要注意的是在文本中,直接決定文本情感的成分有時(shí)也可能是詞組,比如“還需努力”、“比不上其他車”等,這些詞組找不出具體的評(píng)價(jià)詞,與一般的情感單元有所區(qū)別。
2.2評(píng)價(jià)詞的分類
我們可以從詞性、評(píng)價(jià)對(duì)象、極性變化等角度對(duì)評(píng)價(jià)詞進(jìn)行分類,通過(guò)分類,能夠更加全面了解評(píng)價(jià)詞,準(zhǔn)確地找出文本的情感單元。
(1)從詞性角度分類
根據(jù)詞性可以將評(píng)價(jià)詞大致分為三類,形容詞性情感詞、名詞性情感詞、動(dòng)詞性情感詞。通過(guò)分析具體的汽車語(yǔ)料,發(fā)現(xiàn)形容詞性情感詞的比重最高,常見的形容詞性情感詞有“不錯(cuò)”“好”“大”“舒服”等。名詞性情感詞的比重較小,常見的名詞性感情詞為“亮點(diǎn)”“弊病”等,有時(shí)名詞性的情感詞既能體現(xiàn)評(píng)價(jià)者的態(tài)度,也能幫助判斷文本所評(píng)價(jià)的屬性,這時(shí)的評(píng)價(jià)詞也是屬性詞,比如“異響”,即體現(xiàn)了評(píng)價(jià)者消極的態(tài)度,也標(biāo)明了文本評(píng)價(jià)的屬性(汽車某部件的聲音)。動(dòng)詞性情感詞比名詞性情感詞更多一些,常見的動(dòng)詞性情感詞有“符合”“喜歡”“犧牲”等。形容詞性情感詞大都是對(duì)屬性的直接修飾,動(dòng)詞性情感詞則更側(cè)重評(píng)價(jià)者的感受。
(2)從對(duì)象角度分類
評(píng)論文本最完整的情感表達(dá)是評(píng)論者評(píng)價(jià)實(shí)體屬性后給出自己態(tài)度,但是觀察語(yǔ)料后發(fā)現(xiàn),有些文本只是從實(shí)體的屬性出發(fā),給出與屬性相關(guān)的具體評(píng)價(jià),但沒(méi)有出現(xiàn)評(píng)價(jià)者的直接態(tài)度。有些則從評(píng)論者的感受出發(fā),只給出自己的感受和傾向。省略評(píng)論者的態(tài)度或者屬性的修飾詞后,仍然能判斷出評(píng)價(jià)者的態(tài)度,原因與上文提到的本身無(wú)情感色彩的詞在語(yǔ)境中能夠體現(xiàn)評(píng)價(jià)者的態(tài)度一樣,即社會(huì)常識(shí)背景的支撐使我們能夠?qū)⑶楦行畔⒀a(bǔ)充完整。如“最滿意的一點(diǎn)性價(jià)比”和“性價(jià)比當(dāng)時(shí)上市的時(shí)候沒(méi)有優(yōu)惠多少”。根據(jù)這一角度,可以將評(píng)價(jià)詞分為具體評(píng)價(jià)詞和直接態(tài)度詞兩類,具體評(píng)價(jià)詞多與屬性直接相關(guān),直接態(tài)度詞則與評(píng)價(jià)者態(tài)度相關(guān),以心理動(dòng)詞為典型。
(3)從極性變化角度分類
情感詞的極性并不都是固定的,從這一角度出發(fā)可以將情感詞分為兩類。一類是情感傾向固定的詞,如“好”“不錯(cuò)”“差”“滿意”“喜歡”等,我們將其稱為靜態(tài)詞,另一類為情感傾向不固定,詞語(yǔ)的極性只有在具體語(yǔ)境中才能確定的動(dòng)態(tài)評(píng)價(jià)詞,如“高”“重”“大”“輕”等,我們稱之為動(dòng)態(tài)詞?!捌囉秃母摺薄捌囆詢r(jià)比高”,這兩個(gè)例子評(píng)價(jià)詞都是“高”,但是極值卻相反。對(duì)于這兩類詞,在建立情感詞典時(shí)需要尤其注意,目前流行的做法是分類建立動(dòng)態(tài)和靜態(tài)詞典,相對(duì)于靜態(tài)情感詞來(lái)說(shuō),動(dòng)態(tài)情感詞由于涉及到更多的社會(huì)常識(shí)和領(lǐng)域知識(shí),建立難度較大。
3.情感單元與極性強(qiáng)度
3.1情感單元
情感單元除了直接決定文本情感傾向的評(píng)價(jià)詞外,還包括能影響情感強(qiáng)度和極性的上下文。使用公式Ui=<ei, wi,fi>(i=1,3,4..)來(lái)表示情感單元,其中Ui是情感單元,wi是評(píng)價(jià)詞,ei和fi分別是上文、下文詞語(yǔ),關(guān)于ei和fi的長(zhǎng)度,從理論上來(lái)說(shuō)是沒(méi)有上限的(也即情感單元的長(zhǎng)度沒(méi)有上限),文本中除了評(píng)價(jià)的實(shí)體和屬性,所有的詞語(yǔ)都可以作為評(píng)價(jià)詞的上下文。
上下文按照對(duì)文本情感的影響按程度可分為兩類,第一類是改變極性的否定副詞以及表示否定的固定搭配,如“說(shuō)不過(guò)去”“比不上”等,第二類是影響極性強(qiáng)度語(yǔ)言因素,比如大部分程度副詞、感嘆詞及文本中的其他成分。因此即使是不考慮情感強(qiáng)度的文本情感分析,只識(shí)別出評(píng)價(jià)詞也是不夠的,不能忽略評(píng)價(jià)詞的上下文對(duì)整個(gè)文本的情感傾向的影響。
3.2情感強(qiáng)度
極性強(qiáng)度是對(duì)情感分析的更高級(jí)的處理,它不僅需要分析文本的極性,還要分析情感的強(qiáng)烈程度。對(duì)于考慮情感強(qiáng)度的文本傾向性分析,極性賦值的情況相應(yīng)地變得更復(fù)雜。電子商務(wù)平臺(tái)多采用星級(jí)評(píng)定(通常是5星)的方式來(lái)呈現(xiàn)用戶對(duì)產(chǎn)品的情感強(qiáng)度,現(xiàn)有的情感自動(dòng)分析系統(tǒng)則采用數(shù)值賦值,取值的范圍在-3-3之間。負(fù)值仍然代表負(fù)面情感,正值代表正面情感,數(shù)值越大情感越強(qiáng)烈,0代表中立態(tài)度。
計(jì)算情感強(qiáng)度的方法主要有兩種,一是基于規(guī)則的方法,根據(jù)語(yǔ)感人為地規(guī)定影響情感強(qiáng)度的因素的分值,識(shí)別出所有的上下文后,進(jìn)行數(shù)值計(jì)算。這種方法比較機(jī)械,對(duì)于詞典的依賴也較高,而且根據(jù)語(yǔ)感得到的強(qiáng)度值主觀性比較大。另外一種是統(tǒng)計(jì)與語(yǔ)義相結(jié)合的方法,首先讓計(jì)算機(jī)學(xué)習(xí)已經(jīng)標(biāo)注好情感強(qiáng)度的文本,抽取文本中影響情感強(qiáng)度的上下文及其強(qiáng)度值,再根據(jù)語(yǔ)義相似度,得到與這些上下文相似的成分的強(qiáng)度值。這種方法相對(duì)來(lái)說(shuō)顆粒度更細(xì),而且客觀性較強(qiáng),但也忽略了語(yǔ)義之間的不平等性,影響了計(jì)算結(jié)果的準(zhǔn)確性。
4.影響極性強(qiáng)度的語(yǔ)言因素
文本中影響情感強(qiáng)度的因素繁復(fù)多樣,現(xiàn)有的計(jì)算文本情感強(qiáng)度的情感分析系統(tǒng)對(duì)這些因素的處理比較簡(jiǎn)單粗糙,大都將重點(diǎn)放在了詞匯方面,對(duì)于語(yǔ)境、固定句式、語(yǔ)法手段、標(biāo)點(diǎn)、表情等方面的關(guān)注并不多。忽略這些因素可能會(huì)丟失文本中有價(jià)值的情感成分,影響強(qiáng)度計(jì)算的準(zhǔn)確度。下文將詳細(xì)地分析這些因素,解釋它們影響情感強(qiáng)度的原因,并說(shuō)明在計(jì)算時(shí)考慮這些因素的必要性。
4.1詞匯方面
影響文本情感強(qiáng)度最主要的因素是構(gòu)成文本的詞匯,按照不同的詞性闡述詞匯對(duì)于極性強(qiáng)度的影響。
(1)副詞
副詞是影響文本情感傾向最典型的因素,根據(jù)語(yǔ)義范疇將副詞分為四類,分別為否定副詞、程度副詞、語(yǔ)氣副詞和范圍副詞,其中否定副詞和程度副詞對(duì)于極性強(qiáng)度的影響最為明顯。
否定副詞可以直接改變極值的正反,但并不是簡(jiǎn)單地變成相反的極性,極性的強(qiáng)度也會(huì)發(fā)生變化。如“便宜”和“不便宜”的強(qiáng)度絕對(duì)值并不相等。對(duì)于這一現(xiàn)象的解釋是,否定詞“沒(méi)有”“不”對(duì)語(yǔ)義的影響比較復(fù)雜。在語(yǔ)義的情感極性方面,否定副詞的最主要的功能是使極性變得相反,如“不滿意汽車的外觀”,另一種可能是不改變極性,即否定冗余,如“不要太便宜”,雖然出現(xiàn)了否定副詞,但是文本的情感傾向還是沒(méi)有改變,仍然表達(dá)了正面積極的態(tài)度。類似的,在極性強(qiáng)度方面否定副詞的功能也比較復(fù)雜。根據(jù)語(yǔ)感,“便宜”和“貴”這兩個(gè)評(píng)價(jià)詞極性相反,強(qiáng)度相等,再比較“不便宜”和“貴”,得出“貴”表示的價(jià)格比“不便宜”的高,這樣就推出“便宜”和“不便宜”在強(qiáng)度上不相等。同等條件下,消費(fèi)者更能接受價(jià)格低的產(chǎn)品,那么假設(shè)“貴”的極值是-1,“不便宜”的極值應(yīng)該是介于-1到0。
現(xiàn)有系統(tǒng)對(duì)程度副詞的處理方法是根據(jù)強(qiáng)度的差異,將其細(xì)分成四個(gè)等級(jí),再給這四個(gè)強(qiáng)度分配不同的值,進(jìn)行情感計(jì)算。表格1對(duì)程度副詞分級(jí),并給出每一級(jí)別的具體副詞例示(董麗麗,2014)。
(2)形容詞
在評(píng)價(jià)文本中,形容詞在多數(shù)情況下是情感單元的核心,即評(píng)價(jià)詞。形容詞在確定極性時(shí)至關(guān)重要,此外形容詞對(duì)舉使用時(shí),也能夠體現(xiàn)評(píng)價(jià)者的情感強(qiáng)度。比如前面說(shuō)到的“不錯(cuò)”和“完美”。再如“便宜”和“實(shí)惠”,雖然這組詞語(yǔ)義相近而且極性一致,但是在極性強(qiáng)度上,后者明顯強(qiáng)于前者。相較于副詞,形容詞對(duì)強(qiáng)度的影響表現(xiàn)并不是很明顯。
(3)動(dòng)詞
除了帶有明顯情感傾向的動(dòng)詞,也就是直接態(tài)度詞,如“喜歡”“滿意”“肯定”之外,能愿動(dòng)詞如“可以”“能”也能體現(xiàn)評(píng)價(jià)者的態(tài)度,影響情感強(qiáng)度。這類詞的語(yǔ)義功能主要是表達(dá)評(píng)價(jià)對(duì)象具備某種屬性或者能力的肯定。如果文本中出現(xiàn)了能愿動(dòng)詞,也沒(méi)有否定副詞等能夠改變情感極性的詞的話,極值是正值的頻率遠(yuǎn)遠(yuǎn)高于負(fù)值的頻率。一般的動(dòng)作動(dòng)詞,如“符合”“接受”“優(yōu)化”“看中”等,這些詞本身的語(yǔ)義中就體現(xiàn)了正面積極的情感,因此當(dāng)這些詞出現(xiàn)在文本中時(shí)也能夠幫助判斷情感傾向,至于情感強(qiáng)度,相對(duì)而言影響比較微弱。
(4)名詞
名詞對(duì)極性的影響與一般的動(dòng)作動(dòng)詞類似,主要是作為判斷評(píng)價(jià)文本情感傾向的輔助依據(jù),對(duì)于情感強(qiáng)度的影響并不明顯。如“缺陷”“異味”“通病”“亮點(diǎn)”這些詞本身的語(yǔ)義就帶有消極負(fù)面的含義,因此出現(xiàn)在文本中,體現(xiàn)評(píng)價(jià)者對(duì)于評(píng)價(jià)對(duì)象的態(tài)度。
(5)語(yǔ)氣詞
語(yǔ)氣詞與語(yǔ)氣副詞一樣,通過(guò)語(yǔ)氣的強(qiáng)弱來(lái)輔助情感強(qiáng)度的表達(dá)。語(yǔ)氣詞分為四大類,第一類陳述語(yǔ)氣,如“吧”“也好”“罷了”“著呢”等,這類語(yǔ)氣詞通常表達(dá)的是評(píng)價(jià)者妥協(xié)或者無(wú)所謂的態(tài)度,通常能夠削弱情感的強(qiáng)度;第二類疑問(wèn)語(yǔ)氣,如“嗎”“呢”等,這類詞在表示反問(wèn)時(shí)對(duì)情感影響才體現(xiàn)出來(lái);第三類是祈使語(yǔ)氣,如吧、了、啊這類詞結(jié)合特點(diǎn)句式一起使用時(shí)才能對(duì)情感強(qiáng)度產(chǎn)生影響;最后一類是感嘆語(yǔ)氣,感嘆詞“啊”本身就是加強(qiáng)語(yǔ)氣的嘆詞,感嘆語(yǔ)氣結(jié)合標(biāo)點(diǎn)符號(hào)如嘆號(hào),兩者結(jié)合使用能夠使文本表達(dá)的情感強(qiáng)度更加強(qiáng)烈。
(6)嘆詞
嘆詞本身的功能,即用來(lái)表示感嘆。當(dāng)評(píng)價(jià)者對(duì)評(píng)價(jià)對(duì)象的態(tài)度強(qiáng)烈時(shí),通常會(huì)使用嘆詞輔助表達(dá)情感,因此情感單元應(yīng)該要包括文本中出現(xiàn)的嘆詞。
(7)擬聲詞
汽車評(píng)價(jià)文本中出現(xiàn)擬聲詞的頻率比較小,在描述評(píng)價(jià)對(duì)象的屬性(通常是聲音)時(shí),可以使得屬性具體化,也起到了加深情感強(qiáng)度的效果,如“汽車異響”和“汽車噼里啪啦的響”后者更加的感官化,強(qiáng)度更強(qiáng)。
(8)關(guān)聯(lián)詞
除了實(shí)詞外,虛詞也會(huì)影響文本的情感強(qiáng)度,其中作用比較明顯的是連詞。連詞的功能是連接句子成分,以顯示成分之間的邏輯關(guān)系。雖然不具備實(shí)詞表義的功能,但是具體的邏輯關(guān)系能夠體現(xiàn)成分之間的語(yǔ)義關(guān)系。如表示遞進(jìn)關(guān)系的“不僅……,而且……”這組關(guān)聯(lián)詞的使用顯然會(huì)影響前后兩句語(yǔ)義情感強(qiáng)度值的分配,表示遞進(jìn)關(guān)系的“雖然……,但是……”對(duì)文本情感的影響不僅體現(xiàn)在強(qiáng)度上,而且能夠作為判讀極性正負(fù)的輔助依據(jù),比如“這臺(tái)機(jī)器雖然價(jià)格高,但是性能很好。”這里有一個(gè)對(duì)比和偏向,評(píng)價(jià)者對(duì)于性能的傾向更加明顯,所以我們?cè)谟?jì)算時(shí),分配更高的強(qiáng)度值更加合理,而且前后兩句的轉(zhuǎn)折在情感上體現(xiàn)在兩句的極性值是相反的。表格2根據(jù)連詞的含義進(jìn)行分配強(qiáng)度的表格(董麗麗),這種分配結(jié)果基本符合語(yǔ)感。
雖然目前的情感分析系統(tǒng)是以詞匯為重點(diǎn),但也只關(guān)注副詞、形容詞、動(dòng)詞、關(guān)聯(lián)詞這些對(duì)極性強(qiáng)度影響比較明顯的因素,對(duì)名詞和語(yǔ)氣詞等的關(guān)注相對(duì)少一些。但是對(duì)比“可以?!焙汀翱梢园。。?!”“質(zhì)量還可以”以及“質(zhì)量還可以吧”,這兩組例子中,第二句由于使用了語(yǔ)氣詞,文本的情感強(qiáng)度顯然發(fā)生了變化。在計(jì)算時(shí),忽略這些因素可能會(huì)影響情感強(qiáng)度計(jì)算的精確度。
4.2語(yǔ)境
這里所說(shuō)的語(yǔ)境不僅是指情感單元中評(píng)價(jià)詞的上下文,也指評(píng)價(jià)文本的評(píng)價(jià)對(duì)象和屬性。情感單元內(nèi)的上下文前面已經(jīng)論述得比較詳細(xì)了,因此這里的語(yǔ)境主要強(qiáng)調(diào)的是評(píng)價(jià)單元外的上下文。上文提到過(guò),對(duì)于動(dòng)態(tài)評(píng)價(jià)詞,其情感極性會(huì)因?yàn)樵u(píng)價(jià)對(duì)象和屬性的不同而不同,比如“耗能高”和“性價(jià)比高”,除了動(dòng)態(tài)詞外,某些靜態(tài)詞在評(píng)價(jià)不同的對(duì)象或?qū)傩詴r(shí),情感強(qiáng)度也會(huì)不同。例如“不錯(cuò)”,在評(píng)價(jià)“價(jià)格”和“外觀”時(shí),兩者所表達(dá)的情感強(qiáng)度不同。原因可能是,對(duì)屬性“價(jià)格”來(lái)說(shuō),比“不錯(cuò)”強(qiáng)度更加強(qiáng)烈的詞語(yǔ)比較有限,情感能夠增強(qiáng)的可能性比較小,但是對(duì)于“外觀”來(lái)說(shuō),“漂亮”“完美”等都是比“不錯(cuò)”情感強(qiáng)度更加強(qiáng)烈的表達(dá),情感能夠加深的空間還很大,因此前者的強(qiáng)度值要大一些。
4.3固定句式和搭配
文本中某些固定句式在選擇語(yǔ)境時(shí),會(huì)體現(xiàn)出對(duì)某一固定極性的傾向,比如“到底是”,通常出現(xiàn)在極性為正的句子中,如“到底是蘋果的手機(jī),分辨率很高”。而“擺在那里”“說(shuō)不過(guò)去”“還談什么”“竟然還”,這些固定搭配通常出現(xiàn)在極性為負(fù)的句子中,如“畢竟價(jià)格擺在那里,質(zhì)量好不到哪里”。
造成這種現(xiàn)象的原因與語(yǔ)義韻有關(guān),這里的語(yǔ)義韻是指情感在語(yǔ)篇中流動(dòng)所形成的語(yǔ)篇情感氛圍,某些原本不帶情感的詞出現(xiàn)的語(yǔ)篇情感氛圍比較固定,由于長(zhǎng)久受到這種氛圍的影響,這些詞似乎也體現(xiàn)出一種情感傾向。由于這類詞依賴于帶有確定情感的評(píng)價(jià)詞,所以它們一般都不會(huì)獨(dú)立的出現(xiàn)在評(píng)價(jià)文本中,只是作為情感單元的上下文影響文本情感的強(qiáng)度。
4.4語(yǔ)法手段
這里要說(shuō)的語(yǔ)法手段主要是重復(fù),使用重復(fù)通常能夠加深強(qiáng)化情感。重復(fù)可以是詞匯的重復(fù),也可以是句子的重復(fù),標(biāo)點(diǎn)的重復(fù),更細(xì)致的還可以是詞匯內(nèi)部的重復(fù)(重疊)如美美的,漂漂亮亮。由于收集的是網(wǎng)絡(luò)評(píng)價(jià)文本,文本比較偏向口語(yǔ),因此在文本中會(huì)出現(xiàn)較多的重復(fù)。
4.5標(biāo)點(diǎn)
上文中提到感嘆語(yǔ)氣搭配感嘆號(hào),能夠加強(qiáng)評(píng)價(jià)者的態(tài)度。除此之外省略號(hào)、句號(hào)的使用和重復(fù)使用也能夠影響極性強(qiáng)度。尤其是針對(duì)網(wǎng)絡(luò)文本,省略號(hào)的使用和句號(hào)的重復(fù)使用都能夠體現(xiàn)評(píng)價(jià)者的情感傾向。評(píng)價(jià)者有時(shí)重復(fù)的使用句號(hào)或者省略號(hào)來(lái)表達(dá)無(wú)奈或者無(wú)語(yǔ)的情感,這能夠作為判斷文本極性的輔助依據(jù),同時(shí)也加深其貶斥的態(tài)度,會(huì)影響極性強(qiáng)度。
4.6表情
網(wǎng)絡(luò)文本的一個(gè)特點(diǎn)是經(jīng)常使用輔助表達(dá)感情的表情和表情包,出現(xiàn)在文本的中表情符號(hào)或者表情包能夠幫助我們理解說(shuō)話者的態(tài)度和感情,在一定程度上能夠影響極性強(qiáng)度,當(dāng)評(píng)價(jià)者表達(dá)對(duì)一件商品的不滿時(shí),可以使用生氣,暴怒等表情,這種通過(guò)表情體現(xiàn)的情感強(qiáng)度上的加深,應(yīng)該在文本情感分析中加以區(qū)別。
語(yǔ)境、固定搭配、語(yǔ)法手段、標(biāo)點(diǎn)符號(hào)、表情這些因素與詞匯因素相比,它們?cè)谖谋局斜憩F(xiàn)地比較隱性,或者不屬于典型的語(yǔ)言因素,因此在現(xiàn)有的情感分析系統(tǒng)中通常被忽視,通過(guò)分析我們可以看到,這些因素同樣能夠產(chǎn)生明顯的影響。
5.小結(jié)
本文論述了情感單元中評(píng)價(jià)詞的確定原則,從三個(gè)不同的角度對(duì)評(píng)價(jià)詞進(jìn)行了分類。并研究了作為情感單元中影響情感強(qiáng)度的上下文,除了分析現(xiàn)有的情感分析系統(tǒng)比較關(guān)注的詞匯因素外,本文還詳細(xì)地分析了語(yǔ)境、固定搭配、語(yǔ)法手段、標(biāo)點(diǎn)符號(hào)和表情等其他因素對(duì)文本情感強(qiáng)度的影響。
參考文獻(xiàn):
[1]周詠梅,楊佳能,陽(yáng)愛民.面向文本情感分析的中文情感詞典構(gòu)建方法[J].山東大學(xué)學(xué)報(bào)(工學(xué)版),2013(4):27-33.
[2]鄭麗娟,王洪偉,基于情感本體的在線評(píng)論情感極性及強(qiáng)度分析:以手機(jī)為例[J].管理工程學(xué)報(bào),2017(2):47-54.
[3]杜嘉忠,徐健,劉穎.網(wǎng)絡(luò)商品評(píng)論的特征——情感詞本體構(gòu)建與情感分析研究[J].現(xiàn)代圖書情報(bào)技術(shù),2014(5):74-81.
[4]張紫瓊,葉強(qiáng),李一軍.互聯(lián)網(wǎng)商品評(píng)論情感分析研究綜述[J].管理科學(xué)學(xué)報(bào),2010(6):84-96.
[5]郗亞輝.產(chǎn)品評(píng)價(jià)中領(lǐng)域情感詞典的構(gòu)建[J].中文信息學(xué)報(bào),2016(5):136-144.
[6]董麗麗,趙繁榮,張翔.基于領(lǐng)域本體、情感詞典的商品評(píng)論傾向性分析[J].計(jì)算機(jī)應(yīng)用與軟件,2014(12):104-108.
[7]熊祖濤.基于Web文本信息抽取的微博輿情分析[D].西安:西安科技大學(xué),2012.
[8]杜偉夫.文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010.
[9]吳文婷,劉雪芹.冗余否定格式“不要太A”試析[J].文教資料,2009(7):41-43.
[10]靳俊杰.文學(xué)語(yǔ)篇中情感詞匯的韻律結(jié)構(gòu)研究[J].長(zhǎng)春大學(xué)學(xué)報(bào),2017(11):35-40.
[11]王雅剛,劉正光.語(yǔ)義韻研究的理論增長(zhǎng)點(diǎn)-構(gòu)式語(yǔ)法視角[J].外語(yǔ)教學(xué),2017(6):18-23.
[12]黃伯榮,廖序東.現(xiàn)代漢語(yǔ)[M].北京:高等教育出版社,2011.