摘要:對于各行各業(yè)來說,使用情感分析技術(shù)挖掘中文文本數(shù)據(jù),并通過中文文本查找情感信息非常重要。因此,情感分析已成為自然語言處理領(lǐng)域最為活躍的部分之一。本文針對基于深度學(xué)習(xí)的中文情感分析模型進(jìn)行了基本研究,以CNN為重點分析對象,分別對多通道和多注意力CNN的情感分析模型進(jìn)行了深入探索。
關(guān)鍵詞:深度學(xué)習(xí);中文情感分析;CNN
引言
隨著網(wǎng)絡(luò)信息技術(shù)的飛快發(fā)展,社交網(wǎng)絡(luò)已成為人們生活必不可少的一部分。通過網(wǎng)絡(luò)平臺,人們可以更加自由地表達(dá)意見,并產(chǎn)生了大量帶有情感信息的中文數(shù)據(jù)。近年來,深度學(xué)習(xí)在自然語言處理領(lǐng)域得到了更加廣泛的應(yīng)用,基于深度學(xué)習(xí)的中文情感分析取得了良好的效果。
一、情感分析模型--CNN
2006年,Hinton首次提出了深度學(xué)習(xí)的概念,而卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)的模型之一。該模型最初主要是用于圖像識別和視覺開發(fā),特別是在圖像識別領(lǐng)域,CNN的應(yīng)用帶來了質(zhì)的飛躍[1]。一九九八年,有著“CNN之父”之稱的YannLeCun教授在其論文中提出了LeNet-5模型,這是CNN首次在數(shù)字識別中得到了成功應(yīng)用。CNN創(chuàng)建了一種監(jiān)督學(xué)習(xí)算法,通過減少空間的相對關(guān)系來減少參數(shù)的數(shù)量,從而提高模型訓(xùn)練性能。從本質(zhì)上來看,CNN使用數(shù)學(xué)中的卷積概念通過池化層以及卷積層從文本中提取特征。因此,它主要是由卷積層和池化層組成。
(一)卷積層
卷積層是CNN的關(guān)鍵部分,主要是由節(jié)點組成,每個節(jié)點的輸入由上一層神經(jīng)網(wǎng)絡(luò)中的一塊組成。對于大小不同的窗口,其過濾器通常是卷積層的一部分,并且大小取決于實際操作。過濾器是用于識別特征的識別器。通過使用相同的過濾器以減少參數(shù)的數(shù)量。過濾器也被稱為卷積核,是卷積層的核心部分。卷積過程可以理解為使用過濾器掃描整個圖矩陣并獲得新的矩陣,卷積層會更深入地分析神經(jīng)網(wǎng)絡(luò)的每個小塊,并獲得更多的抽象特征。
(二)池化層
它的作用主要是通過減少參數(shù)來篩選特征,也可以視為是一種刪除參數(shù)的過程,并留下主要參數(shù)計算數(shù)量。卷積將導(dǎo)致大量的特征圖數(shù)據(jù)龐大,訓(xùn)練數(shù)據(jù)也不足,從而導(dǎo)致過度擬合的問題。卷積層的主要特征之一是特征的不變性,例如圖像是一只小動物,在壓縮之后依然可以看出是一只小動物。在壓縮過程中,僅僅刪除了與小動物無關(guān)的信息。第二,特征尺寸減小。如果圖片具有過多的信息和特征,下一步則需要簡化其復(fù)雜性,刪除不相關(guān)的部分信息,并保留最重要的特征。
二、多通道CNN的情感分析模型
基于CNN的情感分類模型可以充分挖掘中文的情感特征信息,接收詞匯向量輸入,并通過不同大小的卷積核提取出輸入中文的豐富特征。在完成中文情感分析模型的過程中,由于中文文本中包含的信息有限,為了提取更豐富的情感特征,一些研究將這種詞向量和獨特的情感特征信息作為CNN輸入,在文本中挖掘隱藏的情感特征[2]。盡管該方法增加了情感特征,并取得了比傳統(tǒng)方法更好的效果,但該方法在情感特征使用上通常取決于人工情感詞典,無法充分利用其他方法中的特征信息。為了解決這些問題,基于多通道CNN的情感分析模型已被廣泛使用。該模型采用詞性向量來表達(dá)中文中的情感詞,可以在訓(xùn)練過程中學(xué)習(xí)到更多細(xì)微的情感特征。通過介紹詞匯的位置特征,可以表達(dá)出詞匯在中文文本中的重要性。最后,通過多通道接收不同特征的組合信息,挖掘中文中豐富的特征信息。
三、多注意力CNN的情感分析模型
通過調(diào)整注意力矩陣,可以在訓(xùn)練過程中更加注意某些信息。例如,在特定目標(biāo)的情感分析過程中,網(wǎng)絡(luò)模型可以通過在訓(xùn)練過程中通過注意力特征映射,來密切關(guān)注特定目標(biāo)句子的情感信息,從而正確識別不同目標(biāo)的情感特征。為了更加關(guān)注情感信息分析的特定目標(biāo),有效識別目標(biāo)特征,基于多注意力CNN的情感分析模型的提出顯得非常重要。通過將注意力機(jī)制與接收并行輸入的CNN相互結(jié)合,模型的訓(xùn)練速度與順序神經(jīng)網(wǎng)絡(luò)相比較更快。同時,基于多注意力CNN的情感分析模型增加了一些詞性關(guān)注機(jī)制,以另一種方式更加關(guān)注特定目標(biāo)的情感信息,從而更好地利用句子中特定目標(biāo)的特征信息。
(一)注意力機(jī)制
在情感分析模型的特定任務(wù)中,結(jié)合注意力機(jī)制的深度網(wǎng)絡(luò)模型可以通過調(diào)整注意力矩陣,識別同一句子中不同目標(biāo)的信息。該機(jī)制最初主要是應(yīng)用于圖像處理,這使得神經(jīng)網(wǎng)絡(luò)在處理數(shù)據(jù)時能夠處理到一些重要的信息。2014年,mnih等人提出將注意力機(jī)制在圖像分類任務(wù)中加以應(yīng)用,證明了該機(jī)制在圖像處理領(lǐng)域的有效性,并使神經(jīng)網(wǎng)絡(luò)與該機(jī)制的結(jié)合成為深度學(xué)習(xí)領(lǐng)域的研究熱點。
(二)多注意力卷積神經(jīng)網(wǎng)絡(luò)
本文將介紹如何通過CNN輸入層中的三種注意力機(jī)制將其與不同類型的注意機(jī)制結(jié)合起來,主要包括以下幾個部分:
(1)輸入矩陣。存儲了三種不同注意力機(jī)制的矩陣信息;
(2)操作層。針對三種不同的注意力矩陣,使用不同的操作來構(gòu)造輸入文本的特征表示,這使得模型在訓(xùn)練過程中從不同形式更加關(guān)注特定目標(biāo);
(3)卷積層。為了簡化網(wǎng)絡(luò)模型,使用卷積層提取不同注意機(jī)制信息的特征,通過對多個窗口和卷積核的卷積運算,可以獲得更加豐富的輸入特征;
(4)池化層。對于通過不同卷積運算獲得的輸入信息的局部特征,分別進(jìn)行池化處理,挖掘不同注意力機(jī)制中最重要的情感特征;
(5)合并層。從上一層次中提取的重要信息用作合并層的輸入,以形成文本的深度特征向量表示,合并層的輸出向量可以用作完整連接層的輸入;
四、結(jié)束語
近年來,深度學(xué)習(xí)已在自然語言處理領(lǐng)域得到了越來越廣泛的應(yīng)用,并取得了良好效果。中文情感分析模型是自然語言處理領(lǐng)域的研究熱點之一,通過在中文中提取出情感信息加以應(yīng)用,對許多行業(yè)都具有重要意義。該領(lǐng)域的許多專家已經(jīng)進(jìn)行了深入研究,本文只是基于他們的理論進(jìn)行了初步探索,仍有許多需要改進(jìn)的地方,未來還將對基于深度學(xué)習(xí)的中文情感分析進(jìn)行深入學(xué)習(xí)和研究。
參考文獻(xiàn)
[1]楊丹,張夢,朱毅.基于深度學(xué)習(xí)的中文情感分析研究[J].電腦知識與技術(shù)學(xué)術(shù)版,2019(7X):188-190.
[2]金相宇.基于深度學(xué)習(xí)的中文短文本情感分析[D].沈陽工業(yè)大學(xué)
[3] 范濤, 吳鵬, 曹琪. 基于深度學(xué)習(xí)的多模態(tài)融合網(wǎng)民情感識別研究[J]. 信息資源管理學(xué)報, 2020(1):39-48.
[4] 羅元, 王薄宇, 陳旭. 基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)的研究綜述[J]. 半導(dǎo)體光電, 2020, 41(1).
[5] 余傳明, 李浩男, 王曼怡,等. 基于深度學(xué)習(xí)的知識表示研究:網(wǎng)絡(luò)視角*[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2020, 4(1).
作者簡介:賈鵬(1995-),男,漢族,山西省呂梁市人,碩士,單位:西華大學(xué)計算機(jī)與軟件工程學(xué)院,研究方向:情感分析