尉譯心
(山西警察學院,太原 030000)
現(xiàn)在人們可以通過網(wǎng)絡在第一時間獲取新聞信息,并且在互聯(lián)網(wǎng)平臺上進行交流互動,對各種社會問題來表達自身的態(tài)度與看法??梢哉f網(wǎng)絡輿情代表了廣大網(wǎng)民利用互聯(lián)網(wǎng)對社會事件的真實反映,同時一定程度上的社會輿論表現(xiàn)。但是基于互聯(lián)網(wǎng)自身特點,決定了網(wǎng)絡輿情傳播速度更快,影響范圍更廣,尤其是從情感傾向分析,情感態(tài)度對人們的引導性更強,其存在的危害程度也就更高,因此必須要提高對網(wǎng)絡輿情的重視,做好突發(fā)事件網(wǎng)絡輿情的預警,避免造成社會不良影響。
網(wǎng)絡平臺現(xiàn)在已經(jīng)成為全新的輿情載體,而在網(wǎng)絡下發(fā)生的輿情即可稱之為網(wǎng)絡輿情,即在一定網(wǎng)絡空間內(nèi),公眾在互聯(lián)網(wǎng)上對某種社會現(xiàn)象所發(fā)表且對事件現(xiàn)象有一定影響力和傾向性的共同意見。可以將網(wǎng)絡輿情簡單的看作為,特定時間內(nèi)網(wǎng)絡環(huán)境中,公眾對某特定社會事件或現(xiàn)象提出的觀點、評論以及意見集合,其表現(xiàn)出了所有評論者的情感傾向,與傳統(tǒng)媒體相比,網(wǎng)絡輿情外延更為寬廣[1]。
1.2.1 互動性
基于互聯(lián)網(wǎng)載體的特點,在其環(huán)境下發(fā)生的網(wǎng)絡輿情,具有更強的傳播性與互動性,用戶不僅可以針對現(xiàn)象來發(fā)表自身看法,還可以獲得其他用戶的觀點信息,對于觀點不一致的情況則會進行交互討論,進而能夠更大程度上來促使用戶的觀點意見得到體現(xiàn)。
1.2.2 自由性
所有用戶在面對網(wǎng)絡環(huán)境時,理論上來講均是完全自由的,不僅可以接收獲取各種信息,同時還可以成為信息的發(fā)布者,基于互聯(lián)網(wǎng)平臺來無障礙的發(fā)表意見與看法。
1.2.3 廣泛性
網(wǎng)絡輿情的廣泛性,主要是指網(wǎng)絡輿情信息載體形式的多樣性。并且用戶可以對多種社會現(xiàn)象以及事件來發(fā)表意見和相互討論,涉及到信息非常廣泛,囊括了社會方方面面,并且因為參與用戶數(shù)量基數(shù)重大,獲取的信息更為完善,同時影響也更廣泛。
1.2.4 隱匿性
基于網(wǎng)絡匿名特點,用戶在互聯(lián)網(wǎng)背景下可以暢所欲言,更是因為無需關心個人信息問題,更多言論觀點多貼近于實際想法,所釋放的情緒也更真實。但是也正是因為隱匿性,使得人們的顧慮減輕,無需顧慮過多,存在較多情感上的發(fā)泄,或者是為追求某種目的而發(fā)布虛假消息,引導公眾產(chǎn)生壞的輿論影響。
1.2.5 突發(fā)性
網(wǎng)絡信息傳播速度非常快,且參與人數(shù)眾多,在短時間內(nèi)就可以將關注度較高的社會事件推動成輿論熱點,同時集合了大量公眾意見與看法,迅速形成公共意見,影響輿情的發(fā)展。
突發(fā)事件即突然發(fā)生,存在可能造成或者造成嚴重社會危害,必須要及時采取應急處理措施的自然災害、事故災難、社會安全事件、公共衛(wèi)生事件等,其根據(jù)對社會產(chǎn)生的危害程度以及影響范圍,可以將其劃分為特別重大、重大、較大和一般四個級別。突發(fā)事件均具有一個完整生命周期,依次經(jīng)過潛伏期、萌動期、爆發(fā)期、成熟期以及衰退期五個階段。其具有較長的生命周期,且對社會影響大,涉及到較大范圍,且發(fā)展階段越多情況的演化越嚴重,對社會產(chǎn)生的影響也更嚴重。對突發(fā)事件特點進行分析,具有擴散性、爆發(fā)性、公共性、不確定性以及非常規(guī)性。事件可能發(fā)生于任何社會公共領域,以社會公眾群體為對象,發(fā)生后將會引起廣泛關注,對社會造成負面影響。更是因為突發(fā)事件的突發(fā)性,無論是采取任何措施應對,均會存在滯后性問題,管理部門需要承擔巨大壓力與困難,在最短時間內(nèi)果斷將措施落實,積極調(diào)動各項社會資源,將損失控制在最小,以免引起社會恐慌。
互聯(lián)網(wǎng)作為網(wǎng)絡輿情平臺,其具有信息量大、傳播速度快、互動性強以及涉及面廣等特點,可以為公眾提供信息。突發(fā)事件作為社會問題與社會矛盾集中體現(xiàn),發(fā)生后公眾可以通過網(wǎng)絡平臺來就其發(fā)表評論和意見,并且不同用戶之間可以相互討論。通過頻繁的信息互動,使得突發(fā)事件與網(wǎng)絡輿情之間聯(lián)系密切。突發(fā)事件的形成、發(fā)展以及變化為網(wǎng)絡輿情形成、發(fā)展的前提,并且網(wǎng)絡輿情也會影響社會公眾對突發(fā)事件的看法與態(tài)度,對事件后續(xù)發(fā)展以及政府處理方式產(chǎn)生影響。同時,網(wǎng)絡輿情不斷傳播過程中,還會存在可能誘發(fā)新的社會問題,形成新的突發(fā)事件,嚴重的則會形成連環(huán)突發(fā)事件,導致政府在處理上需要面臨更大難度。
3.1.1 詞匯情感傾向
一方面,基于情感詞典。以情感傾向性詞典作為依據(jù),通過分詞等技術對待測詞匯與基準詞之間語義的相似度進行判斷,以此來確定其傾向性。例如WordNet基準詞詞匯,利用其它與待測詞匯相關信息對待測詞匯的情感傾向性進行判斷。另一方面,基于語料庫。即通過對語料庫手工標注,以語料庫作為依據(jù),利用詞匯之間同現(xiàn)、搭配以及語義等關系,對詞匯情感傾向性進行判斷。例如SO-PMI方法,即通過待測詞匯與具有強烈正面傾向詞匯或者強烈反面傾向詞匯進行比較,計算確定待測詞匯與種子詞匯之間的互信息,以此來判斷詞匯的情感傾向性,作為了解網(wǎng)絡輿論的基礎[2]。
3.1.2 語句情感傾向
語句情感傾向性分析,即對話題內(nèi)評論集中的語句情感傾向性進行分析,在對詞匯情感傾向性檢測結果基礎上,結合上下文以及特定語境情況分析。語句情感傾向性分析的對象為主客觀句子,完成主觀句子情感傾向性分析。一般將不具備情感表現(xiàn)的客觀部分刪除,然后從評論集中選取主觀部分,對其情感傾向進行分析。例如CRE句子情感傾向性分析方法,基于多重標記,結合主客觀性判斷、褒貶分類以及褒貶分級,使得語句情感傾向性分析結果可靠性與準確性更高。
3.1.3 篇章情感傾向
將某篇評論文本只有一個評論對象的情況作為研究內(nèi)容,分析確定該文本情感傾向性,例如通過機器學習方法對篇章情感傾向性進行分析。設計Opinion Observer以網(wǎng)絡平臺上商品評論信息為對象,獲得市場反饋數(shù)據(jù),保證網(wǎng)絡評估意見的客觀性,抽取主題對商品評論的傾向性進行深入分析,從眾多評論內(nèi)的分析確定最終結果。
詞匯情感傾向值計算的依據(jù)為情感詞典,選擇具有代表性的k對基準詞,且每對基準詞內(nèi)包括一個褒義詞一個貶義詞。以p表示褒義基準詞,q表示貶義基準詞,詞匯w情感傾向值為Orient(w)的計算公式為:
Orient(w)數(shù)值大小代表了詞匯w褒貶強烈程度,且Sim(key,w)表示詞匯w與基準詞之間語義相似度。
往往同一個詞匯在不同文本內(nèi)代表不同義項,且每個義項同時有存在多個義原,將詞匯相似度計算轉(zhuǎn)變成義項相似度計算,并且又可以將義項相似度計算解析成若干義原相似度計算。則兩個義原間語義相似度定義為:
式中,Y1、Y2表示兩個義項;t1、t2表示為兩個義項的屬性個數(shù);1/2t-i+1表示義項定義種不同位置的屬性權重值。由此便可得到兩個詞匯間語義相似度:
式中,W1、W2表示兩個詞匯,其中詞匯W1存在M個義項,即Y1,Y2,…YM;詞匯W1存在N個義項,即Z1,Z2,…ZN。
3.2.1 否定詞匯
部分情感詞匯添加了否定前綴,這樣就使得整個詞匯的情感傾向發(fā)生變化,對此類詞匯的傾向值進行計算:
式中,m表示添加否定前綴的情感詞匯;u表示否詞詞匯出現(xiàn)次數(shù)。
另外還存在部分詞匯添加有程度副詞修飾,也會對詞匯自身的情感傾向產(chǎn)生影響,則此類詞匯的傾向值計算:
式中,n表示添加程度副詞的情感詞匯;G(v)表示程度副詞v強度值。
經(jīng)由上述分析可知,文本話題評論的情感傾向分析,可以通過ICTCLAS漢語分詞系統(tǒng)進行中文分詞與詞性標注,然后對文本評論內(nèi)帶有情感傾向的詞匯進行查找,然后利用情感詞典對其情感傾向值進行記錄。同時,還需要判斷評論內(nèi)是否存在否定詞或者程度副詞,然后對修飾后的詞匯情感傾向值進行計算。最終得到話題評論的情感傾向值:
式中,Opinion(di)表示話題評論di的情感強度;w表示話題評論內(nèi)未被修飾的情感詞匯;m表示添加否定詞修飾的情感詞匯;n表示添加程度副詞修飾的情感詞匯。
對突發(fā)事件網(wǎng)絡輿論情感傾向進行分析,除了要對詞匯情感傾向值進行計算以外,還需要對其所處語義模式進行分析,才能夠更全面和真實的反映出評論情感傾向程度。進行分析時需要構建語義模式,完成權重計算,包括局部權重計算與全局權重計算。基于話題評論集中來提取語義模式,通過語義模式庫的搜索確定完成匹配,成功匹配后便可計算權重,匹配失敗則需要對語義模式庫進行填充并設置其權重。如果為單句評論,可計算其全部權重;段落評論則需要先計算局部權重,然后進行全局權重計算。對于不同長度的文本,所對應提取的語義模式差異較大,文本越長語義模式越多,情感傾向分析也就更準確,因此話題評論集全局權重為每條評論單句局部權重以及段落全局權重的和,以及其文本長度的商。權重計算完畢后,便可通過比較計算后的全局權重與設定閾值,確定其情感傾向程度。
網(wǎng)絡輿情的產(chǎn)生、形成與發(fā)展整個過程全部是以網(wǎng)絡為載體,涉及到的信息分散且融入到大量數(shù)據(jù)內(nèi),包括新聞網(wǎng)站、網(wǎng)絡社區(qū)等新興網(wǎng)絡媒體,含有與話題相關的大量潛在信息。想要確定突發(fā)事件網(wǎng)絡輿情是否具有威脅性,就需要進行信息采集、數(shù)據(jù)挖掘、輿情分析、威脅評估以及預警監(jiān)測等環(huán)節(jié),確保突發(fā)事件處理的有效性與及時性,將其造成的影響控制到最低[8]。
4.2.1 多屬性決策法
選擇此種方法進行突發(fā)事件網(wǎng)絡輿情威脅評估,需要構造據(jù)測方案集與屬性集,確定每個威脅目標為一個備選方案,然后將多個威脅目標組成決策方案集[9]。然后還需要構造決策矩陣,創(chuàng)建目標威脅估計模型。最后通過逼近理想排序法對每個方案來進行目標威脅程度排序。
4.2.2 模糊綜合評價法
選擇此種方法進行事件威脅評估時,應組合應用模糊數(shù)學與多屬性決策方法,以模糊數(shù)學對“模糊性”事物進行評價。即以模糊隸屬度理論作為依據(jù),對定性指標進行定量化處理,具有較高的可信度。同時,還能夠解決評估指標單一的缺陷,實際操作更為簡單,且計算結果可靠性高。
基于網(wǎng)絡平臺突發(fā)事件發(fā)生后,公眾參與度更高,在發(fā)表評論與意見的同時伴隨著明顯的情感傾向,為避免突發(fā)事件對社會帶來不良影響,必須要基于情感傾向來對突發(fā)事件網(wǎng)絡輿情進行分析,確定其威脅程度,然后進行可靠預警,為提高政府管理工作的開展效率提供依據(jù)。