蘇瑩 張勇 胡珀 涂新輝
摘 要:針對情感分析需要大量人工標(biāo)注語料的難點,提出了一種面向無指導(dǎo)情感分析的層次性生成模型。該模型將樸素貝葉斯(NB)模型和潛在狄利克雷分布(LDA)相結(jié)合,僅僅需要合適的情感詞典,不需要篇章級別和句子級別的標(biāo)注信息即可同時對網(wǎng)絡(luò)評論的篇章級別和句子級別的情感傾向進(jìn)行分析。該模型假設(shè)每個句子而不是每個單詞擁有一個潛在的情感變量;然后,該情感變量再以樸素貝葉斯的方式生成一系列獨立的特征。在該模型中,樸素貝葉斯假設(shè)的引入使得該模型可以結(jié)合自然語言處理(NLP)相關(guān)的技術(shù),例如依存分析、句法分析等,用以提高無指導(dǎo)情感分析的性能。在兩個情感語料數(shù)據(jù)集上的實驗結(jié)果顯示,該模型能夠自動推導(dǎo)出篇章級別和句子級別的情感極性,該模型的正確率顯著優(yōu)于其他無指導(dǎo)的方法,甚至接近部分半指導(dǎo)或有指導(dǎo)的研究方法。
關(guān)鍵詞:情感分析;主題模型;潛在狄利克雷分布;樸素貝葉斯;意見挖掘
中圖分類號: TP391.1 文獻(xiàn)標(biāo)志碼:A英文標(biāo)題