邱云飛,倪學(xué)峰,邵良杉
QIU Yunfei1,NI Xuefeng1,SHAO Liangshan2
1.遼寧工程技術(shù)大學(xué) 軟件學(xué)院,遼寧 葫蘆島125100
2.遼寧工程技術(shù)大學(xué) 系統(tǒng)工程研究所,遼寧 葫蘆島125100
1.Software College,Liaoning Technical University,Huludao,Liaoning 125100,China
2.Institute of Systems,Liaoning Technical University,Huludao,Liaoning 125100,China
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,消費(fèi)者更喜歡在網(wǎng)絡(luò)上發(fā)布一些自己內(nèi)心真實(shí)的觀點(diǎn),如去網(wǎng)站論壇發(fā)布一些針對(duì)某商品或服務(wù)的評(píng)論,同時(shí)在消費(fèi)之前也會(huì)上網(wǎng)瀏覽下他人的觀點(diǎn)意見。這些評(píng)論中往往包含了用戶的最真實(shí)的觀點(diǎn)意見,因此,評(píng)論挖掘作為非結(jié)構(gòu)化信息挖掘的一個(gè)新興研究領(lǐng)域也隨之而生。目前對(duì)于網(wǎng)絡(luò)評(píng)論挖掘的問題,學(xué)者Popescu[1]將其歸結(jié)為以下幾個(gè)重要問題:(1)挖掘重要產(chǎn)品特征;(2)挖掘用戶對(duì)產(chǎn)品特征的主要觀點(diǎn);(3)判斷評(píng)論觀點(diǎn)的情感導(dǎo)向;(4)根據(jù)觀點(diǎn)的重要性進(jìn)行排名。
國內(nèi)外對(duì)商品特征提取的研究方法正處于發(fā)展階段,文獻(xiàn)[2]提出如何從消費(fèi)者評(píng)論中挖掘商品特征,但只能處理英文文本,并不適用于中文評(píng)論。文獻(xiàn)[3]采用基于句法分析技術(shù)的評(píng)論對(duì)象抽取方法;文獻(xiàn)[4]采用基于關(guān)聯(lián)規(guī)則分類的產(chǎn)品特征挖掘算法,這兩種方法雖然能很好的處理中文文本評(píng)論,但提取出的全部都是顯式評(píng)價(jià)對(duì)象。而文獻(xiàn)[5]采用特征詞庫對(duì)評(píng)論進(jìn)行特征標(biāo)注,雖然特征標(biāo)注的準(zhǔn)確率能達(dá)到87.47%,但是需要人工核查獲取特征詞庫,其中耗費(fèi)了大量的人力、物力。商品評(píng)論中的商品特征可以分為顯示特征和隱式特征[6],本文稱之為顯式評(píng)價(jià)對(duì)象和隱式評(píng)價(jià)對(duì)象。如果一個(gè)特征f出現(xiàn)在一個(gè)評(píng)估文本r中,那么被稱為r的一個(gè)顯式特征。如果f沒有在r中出現(xiàn),但是被暗指,那么將其稱為r的一個(gè)隱式特征。例如“這家店位置非常好下車就看到了”,就能簡(jiǎn)單地識(shí)別出“位置”這一顯式屬性。而“地方不好找但是交通還是很方便的”,需要通過分析理解才能識(shí)別出“位置”這一屬性?,F(xiàn)有的產(chǎn)品特征抽取方法所提取出的大都是產(chǎn)品的顯式特征,也就是通過各種模型提取出產(chǎn)品評(píng)論中的個(gè)別詞或詞組作為評(píng)價(jià)對(duì)象,但是這樣一來好多評(píng)價(jià)對(duì)象雖然描述不同但評(píng)價(jià)對(duì)象卻從屬于同一個(gè)方面。
本文提出并實(shí)現(xiàn)了一種有監(jiān)督的商品隱式評(píng)價(jià)對(duì)象提取方法。第2 章詳細(xì)描述隱式評(píng)價(jià)對(duì)象提取的相關(guān)工作,主要包括候選評(píng)價(jià)對(duì)象提取、候選評(píng)價(jià)對(duì)象聚類、特征詞權(quán)值計(jì)算以及隱式評(píng)價(jià)對(duì)象識(shí)別。第3 章敘述了對(duì)大規(guī)模真實(shí)文本的實(shí)驗(yàn),并與相關(guān)的研究工作進(jìn)行了比較。最后是對(duì)工作的一個(gè)小結(jié)。
本文提出的商品隱式評(píng)價(jià)對(duì)象提取的方法,首先從評(píng)論語料中根據(jù)評(píng)價(jià)對(duì)象模型提取出候選評(píng)價(jià)對(duì)象,并根據(jù)k-means 算法[7]將候選評(píng)價(jià)對(duì)象聚類從而提取出隱式評(píng)價(jià)對(duì)象及其相關(guān)的特征詞集合,然后計(jì)算出每個(gè)特征詞指示隱式評(píng)價(jià)對(duì)象的能力,最后根據(jù)特征詞指示能力的引導(dǎo)抽取出用戶在評(píng)論語料中提出的觀點(diǎn)。圖1給出了實(shí)驗(yàn)方法框架圖。
圖1 實(shí)驗(yàn)方法框架圖
2.1.1 評(píng)價(jià)對(duì)象模型
由于評(píng)論內(nèi)容比較短,評(píng)論子句大都是由簡(jiǎn)單的詞或短語以一定的順序組合而成的,而且每條評(píng)論子句通常也就只描述了某一事物的一個(gè)特征,因此采用句式語義的形式分析方法提取出評(píng)論子句的主干[8],并構(gòu)建一個(gè)二元組C(np,ap)或C(np,vp),其中np、ap、vp分別表示具有名詞、形容詞、動(dòng)詞詞性的詞或短語,且np即為此評(píng)論子句中的候選評(píng)價(jià)對(duì)象,ap或vp即為該候選評(píng)價(jià)對(duì)象的特征詞。二元組的構(gòu)建遵循如下三條原則(定義N為詞的個(gè)數(shù)):
2.1.2 特征詞擴(kuò)充
針對(duì)評(píng)論子句僅由數(shù)個(gè)詞或詞組構(gòu)成,評(píng)論子句中對(duì)評(píng)價(jià)對(duì)象的描述不夠清晰,相應(yīng)的評(píng)價(jià)對(duì)象特征詞也不足以明確的指示該評(píng)價(jià)對(duì)象,為此需要尋求一種解決辦法,能從簡(jiǎn)單的評(píng)論子句中獲取充足的指示特征詞,使得候選評(píng)價(jià)對(duì)象模型中有價(jià)值的信息有所增加。正是由于候選評(píng)價(jià)對(duì)象模型是由一個(gè)包含兩個(gè)元素的二元組組成,借此可以憑借這兩個(gè)詞或短語相似的詞擴(kuò)充到特征詞集合T中。
HowNet(《知網(wǎng)》)是一個(gè)以漢語和英語的詞語所代表的概念為描述對(duì)象,以揭示概念與概念之間的概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識(shí)知識(shí)庫[9]。對(duì)于漢語詞匯,知網(wǎng)中的描述基于“義原”這一基本概念。義原,可以被認(rèn)為是漢語中最基本的、不易于再分隔的最小語義單位。將通過HowNet 獲取的np、ap、vp義原npi、apj、vpk擴(kuò)充到特征詞集合T中,最終得到的候選評(píng)價(jià)對(duì)象模型為C(np,T),其中,T=(ap,N,A)或T=(vp,N,V),N=(np1,np2,…,npr),A=(ap1,ap2,…,aps),V= (vp1,vp2,…,vpt)。
根據(jù)評(píng)價(jià)對(duì)象模型獲取的候選評(píng)價(jià)對(duì)象分布不夠集中,排列比較松散,不能明確的展現(xiàn)出用戶的觀點(diǎn)態(tài)度,而且存在一種多個(gè)候選評(píng)價(jià)對(duì)象模型實(shí)際描述的卻是同一個(gè)評(píng)價(jià)對(duì)象的現(xiàn)象。為此采用k-means 聚類算法將候選評(píng)價(jià)對(duì)象C(np,T)根據(jù)T=(ap,N,A)或T=(vp,N,V)的相似度聚類。k-means 聚類算法的核心思想是找出k個(gè)聚類中心c1,c2,…,ck,使得每一個(gè)數(shù)據(jù)點(diǎn)xi和與其最近的聚類中心cr的平方距離和被最小化(該平方距離和被稱為偏差D)[10]?;趉-means 算法的候選評(píng)價(jià)對(duì)象聚類算法描述如下:
Algorithmk-means(k,D)
Input:候選評(píng)價(jià)對(duì)象集合D;聚類數(shù)k
Output:聚類結(jié)果
Procedure:
步驟1隨機(jī)選擇k個(gè)候選評(píng)價(jià)對(duì)象作為初始的聚類中心Ki
步驟2迭代循環(huán):每個(gè)候選評(píng)價(jià)對(duì)象Cj
計(jì)算Cj與各候選評(píng)價(jià)對(duì)象類之間的相似度Similarity
將Cj分配到相似度Similarity最大的聚類中心
步驟3重新計(jì)算聚類中心Ki
步驟4終止條件不成立跳轉(zhuǎn)到步驟2,否則結(jié)束
終止條件:
1.沒有候選評(píng)價(jià)對(duì)象被重新分配給不同的聚類
2.沒有聚類中心發(fā)生變化
候選評(píng)價(jià)對(duì)象C(np,T)之間的相似度計(jì)算基于劉群在文獻(xiàn)[11]中計(jì)算兩個(gè)義項(xiàng)集合的相似度算法來計(jì)算評(píng)價(jià)對(duì)象模型中特征詞集合T中元素之間的相似度,從而根據(jù)特征詞集合中元素相似度的算術(shù)平均值得出候選評(píng)價(jià)對(duì)象的相似度[12]。候選評(píng)價(jià)對(duì)象Ci與Cj之間的相似度計(jì)算公式如下公式(1)所示(如下公式(1)、(2)中將T=(ap,N,A) 或T=(vp,N,V) 統(tǒng)一寫成T=(t1,T1,T2)的形式):
將k-means 聚類算法得出的k個(gè)聚類中心Kj(npj,Tj)中的npj作為最終要提取的評(píng)價(jià)對(duì)象,Tj以及聚類中其他候選評(píng)價(jià)對(duì)象Ci(npi,Ti)中的npi和Ti組成一個(gè)新的集合Γ作為評(píng)價(jià)對(duì)象npj的特征詞集合,形成最終的評(píng)價(jià)對(duì)象模型A(n,Γ)=(npj,Γ)。
χ2統(tǒng)計(jì)量(CHI)衡量的是特征項(xiàng)ti和類別Cj之間的關(guān)聯(lián)程度[13],并假設(shè)ti和Cj之間符合具有一階自由度的χ2分布。特征對(duì)于某一類別的χ2統(tǒng)計(jì)值越高,它與該類之間的相關(guān)性越大,攜帶信息也較多,反之則較少。利用χ2統(tǒng)計(jì)量(CHI)在訓(xùn)練語料中衡量特征詞ti對(duì)于隱式評(píng)價(jià)對(duì)象Aj的指示能力,也就是說特征詞ti對(duì)于隱式評(píng)價(jià)對(duì)象Aj的χ2統(tǒng)計(jì)值χ2(ti,Aj)越高,它與該隱式評(píng)價(jià)對(duì)象之間的相關(guān)性也就越大,指示該隱式評(píng)價(jià)對(duì)象的能力就越強(qiáng)。計(jì)算特征詞對(duì)每個(gè)隱式評(píng)價(jià)對(duì)象的χ2統(tǒng)計(jì)值的公式(3)所示:
其中,n表示語料庫中評(píng)論子句的總數(shù),|Aj|表示語料庫中評(píng)論了隱式評(píng)價(jià)對(duì)象的Aj評(píng)論子句總數(shù),α表示是評(píng)論了隱式評(píng)價(jià)對(duì)象Aj且包含特征詞ti的評(píng)論子句數(shù),β表示未評(píng)論Aj但包含特征詞ti的評(píng)論子句數(shù),γ表示評(píng)論了Aj但不包含特征詞ti的評(píng)論子句數(shù),d表示既未評(píng)論Aj也不包含特征詞ti的評(píng)論子句數(shù)。上述4 種情況可從表1 中清晰看出。
表1 屬性關(guān)聯(lián)詞ti 與屬性Aj 關(guān)系示意圖
需要分析的評(píng)論子句C=w1w2…wp,由p個(gè)詞組成,這p個(gè)詞中必有q個(gè)特征詞,即C≥t1t2…tq。隱式評(píng)價(jià)對(duì)象提取過程中,根據(jù)該條評(píng)論語句,與隱式評(píng)價(jià)對(duì)象的特征詞集合I中每個(gè)特征詞ti的χ2統(tǒng)計(jì)值χ2(ti)=(χ2(ti,A1),χ2(ti,A2),…,χ2(ti,Am)),將評(píng)論語句中所有特征詞對(duì)某一隱式評(píng)價(jià)對(duì)象的χ2統(tǒng)計(jì)值的和記為該評(píng)論語句指示這一隱式評(píng)價(jià)對(duì)象的能力。定義公式(5),根據(jù)評(píng)論語句的χ2統(tǒng)計(jì)值提取出隱式評(píng)價(jià)對(duì)象。
(1)實(shí)驗(yàn)數(shù)據(jù)采集
利用網(wǎng)絡(luò)爬蟲[14]從網(wǎng)絡(luò)上下載用戶評(píng)論文本作為實(shí)驗(yàn)的語料數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理。本研究以大眾點(diǎn)評(píng)網(wǎng)、飯統(tǒng)網(wǎng)、丁丁網(wǎng)等網(wǎng)站上針對(duì)餐館的評(píng)論數(shù)據(jù)為例形成評(píng)論語料庫。
(2)對(duì)評(píng)論語料進(jìn)行語句拆分
本文根據(jù)句子邊界的啟發(fā)式搜索算法將一條評(píng)論語句分割成若干子句,而且通過對(duì)語料庫的分析,發(fā)現(xiàn)人們喜歡用“……”、“~”、“!!”、“!!!”、“。?!?、“~~”等一些特殊標(biāo)點(diǎn)符號(hào)或是一些表轉(zhuǎn)折、并列等的連詞來提示上下文談?wù)搯栴}的轉(zhuǎn)變[15]。因此,需要將這些特殊符號(hào)和連詞作為初始的句子邊界。
(3)對(duì)評(píng)論語料分詞和詞性標(biāo)注
本文對(duì)評(píng)論語料采用中國科學(xué)院計(jì)算機(jī)技術(shù)研究所在多年研究工作積累的基礎(chǔ)上,研制出的漢語詞法分析系統(tǒng)ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)進(jìn)行分詞。分詞后根據(jù)詞性標(biāo)注的結(jié)果以及文獻(xiàn)[4]中提出的短語提取模式提取出名詞短語、形容詞短語、動(dòng)詞短語。
(4)提取候選評(píng)價(jià)對(duì)象
在評(píng)論語料庫中利用評(píng)價(jià)對(duì)象模型提取出候選評(píng)價(jià)對(duì)象,并通過HowNet 獲取評(píng)價(jià)對(duì)象特征詞的義原以擴(kuò)充特征詞集合。
(5)隱式評(píng)價(jià)對(duì)象提取
采用聚類算法對(duì)候選評(píng)價(jià)對(duì)象聚類從而提取出評(píng)論語料庫中所涉及的隱式評(píng)價(jià)對(duì)象,以及評(píng)價(jià)對(duì)象特征詞集合。
(6)特征詞權(quán)重計(jì)算
根據(jù)訓(xùn)練語料對(duì)步驟5得出的隱式評(píng)價(jià)對(duì)象特征詞集合中的各個(gè)元素,按照公式(3)進(jìn)行特征詞權(quán)重計(jì)算。
(7)隱式評(píng)價(jià)對(duì)象識(shí)別
根據(jù)公式(5)提取出實(shí)驗(yàn)語料中評(píng)論子句的隱式評(píng)價(jià)對(duì)象。
本實(shí)驗(yàn)從大眾點(diǎn)評(píng)網(wǎng)(http://www.dianping.com)下載了關(guān)于北京、大連、廈門、鞍山4 個(gè)城市的10 家餐館的1 135 條評(píng)論,作為測(cè)試集進(jìn)行實(shí)驗(yàn),評(píng)論語料分布如表2 所示。
表2 評(píng)論語料
對(duì)評(píng)論語句進(jìn)行語句分割后得到5 684 條評(píng)論子句,其中有1 624 條子句是陳述事實(shí)等與分析無關(guān)的評(píng)論子句,根據(jù)構(gòu)建候選評(píng)價(jià)對(duì)象模型的3 條規(guī)則對(duì)剩余的有價(jià)值的評(píng)論子句進(jìn)行候選評(píng)價(jià),對(duì)象建模后得出3 732 個(gè)候選評(píng)價(jià)對(duì)象。
4.2.1 特征詞擴(kuò)充對(duì)比
為了驗(yàn)證本文針對(duì)評(píng)論文本內(nèi)容短、稀疏性高的特點(diǎn),提出的特征詞擴(kuò)充技術(shù)能否有效提高聚類效果,進(jìn)行此項(xiàng)實(shí)驗(yàn)。將根據(jù)評(píng)論子句構(gòu)建的候選評(píng)價(jià)對(duì)象數(shù)據(jù)集1 與根據(jù)HowNet 義原擴(kuò)充特征詞集合的候選評(píng)價(jià)對(duì)象數(shù)據(jù)集2 進(jìn)行比較,來測(cè)評(píng)兩類數(shù)據(jù)集的聚類效果。由于人們關(guān)心的餐館特征一般在7 個(gè)左右,所以預(yù)分類的聚簇?cái)?shù)K值在范圍[4,14]中進(jìn)行實(shí)驗(yàn),對(duì)于聚類效果的評(píng)估采用整個(gè)聚類結(jié)果的平均純度purityavg(D)作為評(píng)價(jià)指標(biāo),purityavg(D)值越大說明一個(gè)聚類中僅包含一個(gè)類別的數(shù)據(jù)的程度越高。圖2 給出了在數(shù)據(jù)集1 和數(shù)據(jù)集2 上分別進(jìn)行分裂的層次聚類的結(jié)果。
圖2 在數(shù)據(jù)集1和數(shù)據(jù)集2上分別進(jìn)行分裂的層次聚類的結(jié)果
4.2.2 聚類結(jié)果對(duì)比
本文的方法對(duì)3 732 個(gè)候選評(píng)價(jià)對(duì)象按照k-means聚類算法對(duì)選取的不同聚簇?cái)?shù)K聚類,最終將各個(gè)聚簇中心作為評(píng)價(jià)對(duì)象,結(jié)果如表3 所示。
4.2.3 評(píng)估隱式評(píng)價(jià)對(duì)象提取
為了驗(yàn)證本文提出的隱式評(píng)價(jià)對(duì)象方法反映用戶觀點(diǎn)的全面性和準(zhǔn)確性,除了采取了文本處理問題研究中普遍使用的性能評(píng)估指標(biāo):查全率recall和查準(zhǔn)率precision之外,還添加了絕對(duì)偏差值MAE作為度量標(biāo)準(zhǔn)。絕對(duì)偏差值MAE是通過計(jì)算系統(tǒng)識(shí)別出的隱式評(píng)價(jià)對(duì)象與手工標(biāo)注的隱式評(píng)價(jià)對(duì)象之間的偏差來度量分析的準(zhǔn)確性,MAE值越小分析質(zhì)量越高。對(duì)于隱式評(píng)價(jià)對(duì)象Ai的查全率、查準(zhǔn)率和絕對(duì)偏差值的計(jì)算方法如公式(6)、(7)、(8)所示,公式中的參數(shù)如表4 所示。
對(duì)于實(shí)驗(yàn)數(shù)據(jù)在選取不同聚簇?cái)?shù)K,即不同隱式評(píng)價(jià)對(duì)象數(shù)量下進(jìn)行隱式評(píng)價(jià)對(duì)象提取的查全率、查準(zhǔn)率和絕對(duì)偏差值的實(shí)驗(yàn),結(jié)果如表5。
圖2 顯示隨著聚簇?cái)?shù)K值得不斷增加,聚類結(jié)果的平均純度purityavg(D)也隨之上升,雖然K值越大聚類結(jié)果的純度就越大,但是根據(jù)表3 聚類結(jié)果顯示當(dāng)K值增加到9 時(shí)聚類之間的相似度也在隨之的增加,本文算法的查全率隨之上升但是查準(zhǔn)率在不斷降低,絕對(duì)偏差值卻在一再的升高。因此,在K的選擇上不僅要考慮k-means 聚類過程結(jié)果的平均純度,還要結(jié)合類間相似度,以及Recall和Precision二者的平衡點(diǎn)選擇最優(yōu)的K值。
表3 k-means聚類結(jié)果
表4 參數(shù)列表
表5 隱式評(píng)價(jià)對(duì)象提取測(cè)評(píng)表
本文利用分類算法實(shí)現(xiàn)了一個(gè)商品隱式評(píng)價(jià)對(duì)象提取的系統(tǒng),可分為候選評(píng)價(jià)對(duì)象提取,利用k-means 算法對(duì)候選評(píng)價(jià)對(duì)象聚類,特征詞權(quán)重計(jì)算和隱式評(píng)價(jià)對(duì)象識(shí)別4 部分,結(jié)合用戶在網(wǎng)上發(fā)表的評(píng)論進(jìn)行訓(xùn)練得出每個(gè)特征詞的指示能力,并根據(jù)特征詞的指示能力對(duì)實(shí)驗(yàn)語料進(jìn)行評(píng)估。實(shí)驗(yàn)結(jié)果表明本研究方法是合理有效的,但是實(shí)驗(yàn)結(jié)果受候選評(píng)價(jià)對(duì)象提取的影響很大。下一步,可以結(jié)合其他方法改進(jìn)候選評(píng)價(jià)對(duì)象提取的方法,從而提高整個(gè)隱式評(píng)價(jià)對(duì)象識(shí)別方法的準(zhǔn)確性。
[1] Popescu A M,Etzioni O.Extracting product features and op inions from reviews[C]//Proceedings of HLT-EMNLP 2005,2005:339-346.
[2] Hu Minqing,Liu Bing.Mining opinion features in customer reviews[C]//Proceedings of the 19th National Conference on Artificial Intellgience,San Jose,USA,2004.
[3] 劉鴻宇,趙妍妍,秦兵,等.評(píng)價(jià)對(duì)象抽取及其傾向性分析[J].中文信息學(xué)報(bào),2010,24(1):84-88.
[4] 李實(shí),葉強(qiáng),李一軍,等.中文網(wǎng)絡(luò)客戶評(píng)論的產(chǎn)品特征挖掘方法研究[J].管理科學(xué)學(xué)報(bào),2009,12(2):142-152.
[5] 潘宇,林鴻飛.基于語義極性分析的餐館評(píng)論挖掘[J].上海:計(jì)算機(jī)工程,2008,34(17):208-210.
[6] Hu Minqing,Liu Bing.Mining and summarizing customer reviews[C]//Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New Yorks:ACM Press,2004:168-177.
[7] 任江濤,孫婧昊,施瀟瀟,等.一種用于文本聚類的改進(jìn)的K均值算法[J].計(jì)算機(jī)應(yīng)用,2006,26:73-75.
[8] 姚天昉,婁德成.漢語語句主題語義傾向分析方法的研究[J].中文信息學(xué)報(bào),2007,21(5):73-79.
[9] HowNet.HowNets Home Page[EB/OL].[2013-08-15].http://www.keenage.com.
[10] 孫吉貴,劉杰,趙連宇.聚類算法研究[J].北京:軟件學(xué)報(bào),2008,19(1):48-61.
[11] 劉群,李素建.基于《知網(wǎng)》的詞匯語義相似度的計(jì)算[C]//第三屆漢語詞匯語義學(xué)研討會(huì),中國臺(tái)北,2002:59-76.
[12] 游彬,嚴(yán)岳松,孫英閣,等.基于HowNet 的信息量計(jì)算語義相似度算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013,22(1):129-133.
[13] 肖婷,唐雁.改進(jìn)的卡方統(tǒng)計(jì)文本特征選擇方法[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(14):136-140.
[14] 鄭力明,易平.基于HTMLParser 信息提取的網(wǎng)絡(luò)爬蟲設(shè)計(jì)[J].微計(jì)算機(jī)期刊,2009,25(3):67-69.
[15] 趙妍妍,秦兵,車萬翔,等.基于句法路徑的情感評(píng)價(jià)單元識(shí)別[J].軟件學(xué)報(bào),2011,22(5):887-898.