亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于短語(yǔ)結(jié)構(gòu)文法的評(píng)價(jià)關(guān)系識(shí)別研究

        2020-12-17 03:17:12王玉玲
        江漢學(xué)術(shù) 2020年1期
        關(guān)鍵詞:句法情感評(píng)價(jià)

        何 偉,王玉玲

        (1 中國(guó)傳媒大學(xué) 人文學(xué)院,北京 100024;2 清華大學(xué) 人文學(xué)院,北京 100084)

        評(píng)價(jià)分析是中文智能信息處理領(lǐng)域的一個(gè)研究熱點(diǎn),有著廣泛的應(yīng)用前景。例如對(duì)購(gòu)物平臺(tái)上海量的用戶評(píng)論進(jìn)行自動(dòng)分析,獲取用戶對(duì)產(chǎn)品的真實(shí)評(píng)價(jià),這顯然有著巨大的商業(yè)價(jià)值。[1]評(píng)價(jià)分析通常采用三元組[2]〈評(píng)價(jià)對(duì)象、評(píng)價(jià)詞語(yǔ)、褒貶極性〉或五元組[3]〈評(píng)價(jià)對(duì)象、評(píng)價(jià)主體、評(píng)價(jià)詞語(yǔ)、褒貶極性、程度〉作為評(píng)價(jià)單元,分析的過程就是正確抽取出評(píng)價(jià)句中的評(píng)價(jià)單元。

        例1:拍照挺給力的,就是指紋解鎖不靈敏。

        評(píng)價(jià)分析的結(jié)果:〈拍照,給力,1〉〈指紋解鎖,不靈敏,-1〉

        例1 是一條用戶針對(duì)某款手機(jī)的評(píng)論,評(píng)價(jià)分析的結(jié)果就是正確抽取出句子中所包含的兩個(gè)三元組〈拍照,給力,1〉〈指紋解鎖,不靈敏,-1〉,其中 1 代表褒義,-1 代表貶義。

        評(píng)價(jià)句中往往包含著多個(gè)評(píng)價(jià)對(duì)象和評(píng)價(jià)詞語(yǔ),評(píng)價(jià)對(duì)象和評(píng)價(jià)詞語(yǔ)之間存在著對(duì)應(yīng)關(guān)系,也就是評(píng)價(jià)關(guān)系。準(zhǔn)確地識(shí)別出評(píng)價(jià)句中的評(píng)價(jià)關(guān)系,將評(píng)價(jià)詞語(yǔ)和其所指向的評(píng)價(jià)對(duì)象對(duì)應(yīng)起來,就是本文所說的評(píng)價(jià)關(guān)系識(shí)別,這也是評(píng)價(jià)分析的難點(diǎn)所在。

        目前,關(guān)于評(píng)價(jià)關(guān)系識(shí)別的方法大致有基于最短距離、基于機(jī)器學(xué)習(xí)、基于句法語(yǔ)義規(guī)則三類方法?;谧疃叹嚯x的方法通常選取距離評(píng)價(jià)對(duì)象最近的評(píng)價(jià)詞語(yǔ)作為其對(duì)應(yīng)的情感詞[4],此類方法過于簡(jiǎn)單,沒有考慮句法語(yǔ)義關(guān)聯(lián)和長(zhǎng)距離搭配問題。基于機(jī)器學(xué)習(xí)的方法通常是引入機(jī)器學(xué)習(xí)算法來習(xí)得評(píng)價(jià)對(duì)象和評(píng)價(jià)詞語(yǔ)的關(guān)系。例如Zhang S 等人使用條件隨機(jī)場(chǎng)模型來識(shí)別評(píng)價(jià)對(duì)象,然后根據(jù)評(píng)價(jià)對(duì)象的最近鄰和句法樹來發(fā)現(xiàn)情感詞[5]。王榮洋等將語(yǔ)義標(biāo)注特征引入條件隨機(jī)場(chǎng)(conditional random field,CRF),認(rèn)為評(píng)價(jià)對(duì)象通常會(huì)擔(dān)任某個(gè)謂詞的施事者或者受事者,考察了語(yǔ)義標(biāo)注、詞法、依存關(guān)系、相對(duì)位置,對(duì)抽取英文語(yǔ)料評(píng)價(jià)對(duì)象性能做了比較研究[6]。Duyu Tang 等人利用深層記憶網(wǎng)絡(luò)(deep memory networks,DMN)方法獲取上下文詞語(yǔ)對(duì)評(píng)價(jià)對(duì)象的重要性信息,隨后利用重要性信息計(jì)算對(duì)象在當(dāng)前句子環(huán)境中的表示,并判定情感極性。實(shí)驗(yàn)結(jié)果顯示該方法比長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)效果更好[7]。機(jī)器學(xué)習(xí)方法的主要制約因素是難以獲取大量的人工標(biāo)注訓(xùn)練語(yǔ)料。

        基于句法語(yǔ)義規(guī)則的方法往往采用依存句法分析和語(yǔ)義角色標(biāo)注,然后通過規(guī)則或算法來識(shí)別評(píng)價(jià)關(guān)系。例如,Kamal A 等人基于語(yǔ)義分析設(shè)計(jì)了相關(guān)規(guī)則以實(shí)現(xiàn)“評(píng)價(jià)對(duì)象—情感詞對(duì)”的抽?。?]。Poria S 等人基于依存結(jié)構(gòu)樹設(shè)計(jì)了相關(guān)規(guī)則抽取評(píng)價(jià)對(duì)象—情感詞對(duì)[9]。顧正甲等人利用主謂結(jié)構(gòu)(subject-verb,SBV)極性傳遞法,即利用句法分析中的依存關(guān)系抽取評(píng)價(jià)對(duì)象和情感詞,然后采用定中關(guān)系鏈算法和互信息算法相結(jié)合的方法修正評(píng)價(jià)對(duì)象邊界[10]。江騰蛟等人提出基于淺層語(yǔ)義與語(yǔ)法分析相結(jié)合的評(píng)價(jià)對(duì)象—情感詞對(duì)抽取方法。具體操作為,針對(duì)金融評(píng)論語(yǔ)料進(jìn)行依存語(yǔ)法及語(yǔ)義標(biāo)注,而后根據(jù)情感詞在句中充當(dāng)?shù)木浞ǚ殖纱_定其語(yǔ)義指向,繼而抽取情感詞修飾的評(píng)價(jià)對(duì)象[11]。此類方法對(duì)依存句法分析或者語(yǔ)義標(biāo)注的準(zhǔn)確率要求較高,但是目前依存句法分析的性能還有待完善。

        與依存句法分析相比,短語(yǔ)結(jié)構(gòu)文法更加成熟,從詞到短語(yǔ)到分句到句子的結(jié)構(gòu)清晰,對(duì)名詞短語(yǔ)(noun phrase,NP)和動(dòng)詞短語(yǔ)(verb phrase,VP)的識(shí)別率高,非常適合提取短語(yǔ)形式的評(píng)價(jià)對(duì)象和評(píng)價(jià)詞語(yǔ),因此本文提出基于短語(yǔ)結(jié)構(gòu)文法的評(píng)價(jià)關(guān)系識(shí)別方法。

        一、評(píng)價(jià)詞語(yǔ)及候選評(píng)價(jià)對(duì)象提取

        評(píng)價(jià)關(guān)系的識(shí)別首先需要提取評(píng)價(jià)詞語(yǔ)和候選評(píng)價(jià)對(duì)象,評(píng)價(jià)詞語(yǔ)的提取主要依靠情感詞典和組詞規(guī)則,候選評(píng)價(jià)對(duì)象的提取主要是識(shí)別出句子中的NP 短語(yǔ),以下分別簡(jiǎn)要介紹。

        (一)評(píng)價(jià)詞語(yǔ)提取

        評(píng)價(jià)詞語(yǔ)可以看作由(程度副詞)+(否定詞)+情感詞組成[12],括號(hào)內(nèi)的成分表示可能出現(xiàn),也可能不出現(xiàn)。如下面這句用戶評(píng)論。

        例2:手機(jī)性能很好,發(fā)貨速度快,外觀好看,就是指紋解鎖不靈敏。

        上例中的評(píng)價(jià)詞語(yǔ)“很好”是程度副詞“很”+情感詞“好”組成的,“快”“好看”是情感詞直接做評(píng)價(jià)詞,“不靈敏”是否定詞“不”+情感詞“靈敏”組成的。情感詞是指能夠反映說話人褒貶態(tài)度的詞語(yǔ),一般預(yù)先存儲(chǔ)在情感詞典中,并標(biāo)注上褒貶極性,如“好,形容詞,正面評(píng)價(jià)”。識(shí)別評(píng)價(jià)詞語(yǔ)時(shí)首先匹配句子中的情感詞,然后再判斷該情感詞是否和程度副詞、否定詞進(jìn)行搭配;程度副詞不會(huì)改變?cè)星楦性~情感傾向,否定詞則會(huì)改變其修飾的情感詞的情感傾向,使原情感詞極性反轉(zhuǎn)。例2 句子中評(píng)價(jià)詞語(yǔ)的提取結(jié)果如表1 所示。

        表1 評(píng)價(jià)詞語(yǔ)提取示例

        例2 句共有4 個(gè)評(píng)價(jià)詞語(yǔ),表1 中的每個(gè)評(píng)價(jià)詞語(yǔ)記錄,“id”為句中位置,“word”為詞形,“pos”為句法標(biāo)記,“tag”為詞性標(biāo)記,“pol”表示褒貶極性。如“[id:16,word:不靈敏,pos:VA,tag:a,pol:-1]”,記錄評(píng)價(jià)詞語(yǔ)“不靈敏”信息:在句中位置為16,句法標(biāo)記“VA”表示形容詞作謂語(yǔ),詞性標(biāo)記為“a”形容詞,褒貶極性“pol:-1”表示該評(píng)價(jià)詞語(yǔ)為負(fù)面傾向。

        (二)候選評(píng)價(jià)對(duì)象提取

        候選評(píng)價(jià)對(duì)象主要由名詞性成分構(gòu)成,包括單個(gè)名詞和名詞性短語(yǔ)。例如主謂評(píng)價(jià)句“發(fā)貨速度很快”“手機(jī)性能很好”“電池很耐用”“屏幕清晰”等,此時(shí)名詞性主語(yǔ)成分“發(fā)貨速度”“手機(jī)性能”“電池”“屏幕”即為評(píng)價(jià)對(duì)象。賓語(yǔ)中的名詞性成分也可能成為評(píng)價(jià)對(duì)象,如“我就是討厭華為的海軍”中“華為的海軍”就是評(píng)價(jià)對(duì)象。名詞性的中心語(yǔ)成分也可能成為評(píng)價(jià)對(duì)象,如“很不錯(cuò)的手機(jī)”中“手機(jī)”就是評(píng)價(jià)對(duì)象。

        圖1 候選評(píng)價(jià)對(duì)象提取流程圖

        候選評(píng)價(jià)對(duì)象抽取流程圖如圖1 所示,首先將含有評(píng)價(jià)詞語(yǔ)的評(píng)價(jià)句輸入句法分析器進(jìn)行短語(yǔ)結(jié)構(gòu)文法分析,句法分析器采用斯坦福句法分析器。然后進(jìn)入候選評(píng)價(jià)對(duì)象抽取階段。候選評(píng)價(jià)對(duì)象抽取,需要利用分詞結(jié)果、評(píng)價(jià)詞語(yǔ)抽取結(jié)果、句法分析結(jié)果等信息。這些所需信息均保留在每個(gè)切分單詞中,每個(gè)單詞均保留其句中位置、詞性標(biāo)記、句法標(biāo)記、詞形、是否評(píng)價(jià)詞及褒貶極性等信息。候選評(píng)價(jià)對(duì)象的抽取主要分兩步進(jìn)行。第一步為詞性過濾,可初步過濾肯定不為評(píng)價(jià)對(duì)象的詞性,如標(biāo)點(diǎn)符號(hào)(w)、連詞(c)、副詞(d)等。第二步為抽取句子中最長(zhǎng)名詞性成分,即最大名詞性短語(yǔ)NP,如果無名詞短語(yǔ)NP 則抽取單個(gè)名詞。最大名詞性短語(yǔ)NP 的識(shí)別過程就是判斷圍繞某一名詞能否構(gòu)成最大NP。判斷兩個(gè)詞是否能構(gòu)成名詞短語(yǔ)NP,需要找到兩個(gè)結(jié)點(diǎn)的最低公共父節(jié)點(diǎn)是否是NP。如圖2 所示句子“手機(jī)性能很好,發(fā)貨速度快,外觀好看,就是指紋解鎖不靈敏”的句法結(jié)構(gòu)樹,其中“手機(jī)”句法標(biāo)記為“NN”即為普通名詞,該詞與后一個(gè)詞“性能”最低公共父節(jié)點(diǎn)為“NP”,即兩者可構(gòu)成名詞性NP 短語(yǔ)“手機(jī)性能”,而“外觀”不與周圍詞構(gòu)成更大NP,自身構(gòu)成名詞短語(yǔ)NP。

        圖2 最大名詞性短語(yǔ)NP 提取示例

        圖3 可能的評(píng)價(jià)關(guān)系

        二、利用句法路徑識(shí)別評(píng)價(jià)關(guān)系

        要想確定某一評(píng)價(jià)對(duì)象與某一評(píng)價(jià)詞語(yǔ)是否具有語(yǔ)義關(guān)聯(lián)或者指向關(guān)系,需要判定兩者句法路徑是否合法,即是否在一個(gè)從句IP 之內(nèi)。圖2 所示句子“手機(jī)性能很好,發(fā)貨速度快,外觀好看,就是指紋解鎖不靈敏”中含有候選評(píng)價(jià)對(duì)象“手機(jī)性能”“發(fā)貨速度”“外觀”“指紋解鎖”與評(píng)價(jià)詞語(yǔ)“很好”“快”“好看”“不靈敏”,它們可能存在如圖3 所示的評(píng)價(jià)關(guān)系。其中多數(shù)為不合法的句法路徑,如評(píng)價(jià)詞語(yǔ)“很好”和候選評(píng)價(jià)對(duì)象“發(fā)貨速度”兩者的句法路徑為“很好↑VA↑VP↑VP↑IP↑IP↓IP↓NP↓NN↓發(fā)貨速度”,不在一個(gè)IP 之內(nèi)是不合法的,應(yīng)予以排除。對(duì)于評(píng)價(jià)詞語(yǔ)和候選評(píng)價(jià)對(duì)象之間存在合法句法路徑的,可以進(jìn)一步判斷兩者是否具有評(píng)價(jià)關(guān)系,分為三種情況:1.評(píng)價(jià)對(duì)象為主語(yǔ),評(píng)價(jià)詞語(yǔ)為謂語(yǔ);2.評(píng)價(jià)對(duì)象為賓語(yǔ),評(píng)價(jià)詞語(yǔ)為后指動(dòng)詞;3.評(píng)價(jià)詞語(yǔ)為修飾語(yǔ),評(píng)價(jià)對(duì)象為中心語(yǔ)。

        (一)評(píng)價(jià)對(duì)象為主語(yǔ),評(píng)價(jià)詞語(yǔ)為謂語(yǔ)

        例3:手機(jī)說實(shí)話很一般,什么超聲波解鎖也很垃圾。

        path:手機(jī)↑NN↑NP↑IP↓VP↓VP↓VA↓一般

        fromWord:手機(jī) toWord:一般

        path:超聲波↑NN 解鎖↑NN↑NP↑NP↑IP↓VP↓VP↓NP↓NN↓垃圾

        fromWord:超聲波解鎖 toWord:垃圾

        例句3 的短語(yǔ)結(jié)構(gòu)樹如圖4 所示,圖中加粗的黑線表示評(píng)價(jià)詞語(yǔ)和評(píng)價(jià)對(duì)象之間合法的句法路徑。第一個(gè)小句中主語(yǔ)即評(píng)價(jià)對(duì)象“手機(jī)”,核心評(píng)價(jià)詞語(yǔ)為“一般”。兩者之間還有程度副詞“很”,插入語(yǔ)“說實(shí)話”(句法分析器無插入語(yǔ)標(biāo)記,故標(biāo)注為副詞),評(píng)價(jià)對(duì)象和核心評(píng)價(jià)詞語(yǔ)之間的句法路徑為“手機(jī)↑NN↑NP↑IP↓VP↓VP↓VA↓一般”。所以副詞或者插入語(yǔ)不會(huì)影響主語(yǔ)謂語(yǔ)之間的句法路徑,仍包含“NP↑IP↓VP”。同樣第二個(gè)小句中,主語(yǔ)為評(píng)價(jià)對(duì)象“超聲波解鎖”,核心評(píng)價(jià)詞為“垃圾”,句法路徑為“超聲波↑NN 解鎖↑NN↑NP↑NP↑IP↓VP↓VP↓NP↓NN↓垃圾”,所以謂語(yǔ)“垃圾”與主語(yǔ)“超聲波解鎖”構(gòu)成評(píng)價(jià)關(guān)系。

        圖4 例句3 的短語(yǔ)結(jié)構(gòu)樹

        (二)評(píng)價(jià)對(duì)象為賓語(yǔ),評(píng)價(jià)詞語(yǔ)為后指動(dòng)詞

        例4:小米不錯(cuò),便宜好用,我就是討厭華為的海軍才買小米的。

        path:討厭↑VV↑VP↓NP↓NP↓NN↓華為的海軍

        fromWord:討厭 toWord:華為的海軍

        例句4 的短語(yǔ)結(jié)構(gòu)樹如圖5 所示。第一個(gè)小句“小米不錯(cuò),便宜好用”為主謂句句式,主語(yǔ)即評(píng)價(jià)對(duì)象“小米”,評(píng)價(jià)詞語(yǔ)“不錯(cuò)”“便宜”“好用”同時(shí)指向“小米”。第二個(gè)小句“我就是討厭華為的海軍才買小米的”,評(píng)價(jià)詞語(yǔ)為謂詞“討厭”,指向的對(duì)象為賓語(yǔ)“華為的海軍”,所以評(píng)價(jià)對(duì)象為賓語(yǔ)“華為的海軍”,第二個(gè)小句的句法路徑為“討厭↑VV↑VP↓NP↓NP↓NN↓華為的海軍”,路徑起始節(jié)點(diǎn)的評(píng)價(jià)詞“討厭”為后指動(dòng)詞作謂語(yǔ),路徑終止節(jié)點(diǎn)“華為的海軍”為后指動(dòng)詞的賓語(yǔ),路徑包含“VV↑VP↓NP”,為合法路徑,所以謂語(yǔ)“討厭”與賓語(yǔ)“華為的海軍”構(gòu)成評(píng)價(jià)關(guān)系。

        圖5 例句4 的短語(yǔ)結(jié)構(gòu)樹

        (三)評(píng)價(jià)對(duì)象為中心語(yǔ),評(píng)價(jià)詞語(yǔ)為修飾語(yǔ)

        例5:很不錯(cuò)的手機(jī),性價(jià)比高。

        path:很不錯(cuò)↑JJ↑ADJP↑ADJP↑DNP↑NP↓NP↓NN 手機(jī)

        fromWord:很不錯(cuò) toWord:手機(jī)

        圖6 例句5 的短語(yǔ)結(jié)構(gòu)樹

        例句5 的短語(yǔ)結(jié)構(gòu)樹如圖6 所示。第一個(gè)小句“很不錯(cuò)的手機(jī)”為NP 短語(yǔ),定語(yǔ)“很不錯(cuò)”和其指向的中心語(yǔ)“手機(jī)”兩者之間句法路徑為“很不錯(cuò)↑JJ↑ADJP↑ADJP↑DNP↑NP↓NP↓NN 手機(jī)”,路徑起始節(jié)點(diǎn)的評(píng)價(jià)詞“很不錯(cuò)”為修飾成分作定語(yǔ),路徑終止節(jié)點(diǎn)“手機(jī)”中心語(yǔ),路徑包含“DNP↑NP↓NP”為合法路徑,所以修飾語(yǔ)“很不錯(cuò)”與中心語(yǔ)“手機(jī)”構(gòu)成評(píng)價(jià)關(guān)系。

        三、實(shí)驗(yàn)及結(jié)果

        (一)評(píng)價(jià)單元抽取

        實(shí)際應(yīng)用中,需要將具有評(píng)價(jià)關(guān)系的評(píng)價(jià)對(duì)象和評(píng)價(jià)詞語(yǔ)組合成評(píng)價(jià)單元,評(píng)價(jià)單元為三元組形式〈評(píng)價(jià)對(duì)象,評(píng)價(jià)詞語(yǔ),情感極性〉。因此獲取合法路徑后,抽取路徑起始節(jié)點(diǎn)和終止結(jié)點(diǎn),并判斷兩結(jié)點(diǎn)哪個(gè)為評(píng)價(jià)對(duì)象,哪個(gè)為評(píng)價(jià)詞語(yǔ),將評(píng)價(jià)詞語(yǔ)的情感極性也寫入,最后組成三元組形式,如下所示。

        例6:手機(jī)很好,輕巧,京東送貨速度很快。

        評(píng)價(jià)單元:〈手機(jī),很好,1〉

        〈手機(jī),輕巧,1〉

        〈京東送貨速度,很快,1〉

        (二)京東手機(jī)商品評(píng)論分析實(shí)驗(yàn)

        實(shí)驗(yàn)語(yǔ)料為京東商城某品牌手機(jī)商品評(píng)論,針對(duì)1000 條商品評(píng)論人工標(biāo)注了〈評(píng)價(jià)對(duì)象;評(píng)價(jià)詞語(yǔ);情感極性〉三元組答案。依據(jù)本文方法所建立的系統(tǒng)為CUCeval,對(duì)比系統(tǒng)為中國(guó)傳媒大學(xué)有聲媒體中心CUCsas 系統(tǒng),對(duì)比系統(tǒng)CUCsas 曾在2013 年中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦的第二屆自然語(yǔ)言處理與中文計(jì)算會(huì)議(NLPCC2013)微博觀點(diǎn)句評(píng)價(jià)對(duì)象抽取及褒貶極性判定評(píng)測(cè)任務(wù)中取得了第一名。實(shí)驗(yàn)結(jié)果如表2 所示。

        與對(duì)比系統(tǒng)相比,本文系統(tǒng)CUCeval 的準(zhǔn)確率、召回率、F1 值均大為提高?;夭閷?shí)驗(yàn)數(shù)據(jù),發(fā)現(xiàn)本文方法主要存在以下四方面優(yōu)勢(shì):

        表2 京東手機(jī)商品評(píng)論分析實(shí)驗(yàn)結(jié)果

        第一,容錯(cuò)率更高。商品評(píng)論語(yǔ)言較不規(guī)范,很多句子或者缺少標(biāo)點(diǎn)或者之間無標(biāo)點(diǎn)等。本文方法以句法結(jié)構(gòu)為依據(jù),標(biāo)點(diǎn)符號(hào)只是形式上的分隔,不能割裂句法結(jié)構(gòu),句法路徑仍然不會(huì)變化。如“手機(jī)挺好,就是充電口不一樣,有點(diǎn)不方便”中評(píng)價(jià)詞語(yǔ)“不方便”與評(píng)價(jià)對(duì)象“充電口”之間雖然間隔“,”,但“有點(diǎn)不方便”是“充電口”的謂語(yǔ)VP,兩者之間的句法路徑不會(huì)變化。

        第二,評(píng)價(jià)對(duì)象邊界識(shí)別準(zhǔn)確率更高。評(píng)價(jià)對(duì)象邊界的識(shí)別主要為名詞短語(yǔ)組塊的識(shí)別,這實(shí)際上是句法分析的任務(wù),利用較為成熟的短語(yǔ)結(jié)構(gòu)句法分析,就會(huì)取得較好性能。

        第三,避免了規(guī)則沖突問題?;诰浞ㄕZ(yǔ)義規(guī)則的系統(tǒng)容易出現(xiàn)規(guī)則眾多、規(guī)則之間相互沖突的情況。本文系統(tǒng)抽取評(píng)價(jià)單元依賴句法路徑篩選,規(guī)則較少,避免了此類情況,性能較穩(wěn)定。

        第四,遠(yuǎn)距離搭配識(shí)別準(zhǔn)確率更高。評(píng)價(jià)對(duì)象和評(píng)價(jià)詞語(yǔ)之間距離較遠(yuǎn)時(shí),兩者間的評(píng)價(jià)關(guān)系較難抽取。如“機(jī)子還不錯(cuò),只是沒有配耳機(jī)、鋼化膜和保護(hù)套不太滿意”中評(píng)價(jià)詞語(yǔ)“不太滿意”指向三個(gè)評(píng)價(jià)對(duì)象“耳機(jī)”“鋼化膜”“保護(hù)套”,其中“耳機(jī)”和“不太滿意”間隔較遠(yuǎn),借助短語(yǔ)結(jié)構(gòu)句法分析,能夠有效的識(shí)別出“耳機(jī)”“鋼化膜”“保護(hù)套”具有共同的謂詞“不太滿意”,成功抽取評(píng)價(jià)關(guān)系。

        四、結(jié) 語(yǔ)

        本文提出利用相對(duì)成熟的短語(yǔ)結(jié)構(gòu)句法分析進(jìn)行評(píng)價(jià)關(guān)系識(shí)別,并在商品評(píng)論分析實(shí)驗(yàn)中取得了較好的結(jié)果。但是商品評(píng)論語(yǔ)言結(jié)構(gòu)比較簡(jiǎn)單,無論是評(píng)價(jià)對(duì)象還是評(píng)價(jià)詞語(yǔ)顆粒度均較小,句式上也多為簡(jiǎn)單句,而人類的語(yǔ)言豐富多彩,在涉及人物、事件的評(píng)價(jià)時(shí),往往采用更加隱晦、間接的評(píng)價(jià)方式,例如新聞、娛樂等領(lǐng)域的評(píng)論語(yǔ)言,此時(shí)評(píng)價(jià)分析的結(jié)果往往不盡如人意。因此,評(píng)價(jià)關(guān)系的識(shí)別仍然有許多值得進(jìn)一步探索與研究之處,以下列出可能的幾個(gè)方面:

        1.比較句的評(píng)價(jià)對(duì)象抽取。本文沒有對(duì)比較句進(jìn)行研究,在此認(rèn)為比較句應(yīng)該單獨(dú)研究。比較句的評(píng)價(jià)對(duì)象抽取工作重點(diǎn)在于,第一,抽取兩個(gè)比較對(duì)象或者多個(gè)比較對(duì)象;第二,抽取比較結(jié)果,即判斷兩個(gè)或者多個(gè)比較對(duì)象哪個(gè)更優(yōu)。

        2.領(lǐng)域情感詞典的自動(dòng)構(gòu)建。本文評(píng)價(jià)詞語(yǔ)的抽取及褒貶極性判定均依賴于通用情感詞典,實(shí)驗(yàn)語(yǔ)料也只有1000 條,當(dāng)需要分析涉及眾多領(lǐng)域的海量規(guī)模的商品評(píng)論時(shí),通用情感詞典顯然不能滿足需求,將導(dǎo)致某些領(lǐng)域情感詞無法識(shí)別,因此領(lǐng)域情感詞典的自動(dòng)構(gòu)建尤為重要。

        3.混和語(yǔ)法分析。本文候選評(píng)價(jià)對(duì)象的抽取主要依賴短語(yǔ)結(jié)構(gòu)句法分析器,短語(yǔ)結(jié)構(gòu)語(yǔ)法的優(yōu)勢(shì)是名詞組塊邊界識(shí)別較準(zhǔn)確,組塊內(nèi)部的識(shí)別錯(cuò)誤不影響評(píng)價(jià)對(duì)象的抽取,這點(diǎn)優(yōu)于依存句法分析,但依存語(yǔ)法通過依存關(guān)系分析能夠更加準(zhǔn)確地判斷評(píng)價(jià)對(duì)象與評(píng)價(jià)詞語(yǔ)的指向關(guān)系。因此,如果對(duì)評(píng)價(jià)句進(jìn)行混和語(yǔ)法分析,使用短語(yǔ)結(jié)構(gòu)語(yǔ)法抽取評(píng)價(jià)對(duì)象,使用依存語(yǔ)法確定評(píng)價(jià)對(duì)象與評(píng)價(jià)詞語(yǔ)的指向關(guān)系,可能獲得更高的準(zhǔn)確率。

        猜你喜歡
        句法情感評(píng)價(jià)
        句法與句意(外一篇)
        SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
        石油瀝青(2021年4期)2021-10-14 08:50:44
        述謂結(jié)構(gòu)與英語(yǔ)句法配置
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        句法二題
        詩(shī)詞聯(lián)句句法梳理
        基于Moodle的學(xué)習(xí)評(píng)價(jià)
        中文字幕亚洲无线码一区女同| 欧美成人高清手机在线视频| 精品黄色av一区二区三区| 宅男视频一区二区三区在线观看| 免费a级毛片无码免费视频首页| 亚洲一区 日韩精品 中文字幕 | 我和丰满老女人性销魂| 亚洲精品一区二区高清| 亚洲a∨无码一区二区三区| 国产av一区二区三区日韩| 一区二区三区国产高潮| 日韩av水蜜桃一区二区三区| 天天做天天爱夜夜爽女人爽| 一区二区传媒有限公司| 国产乱子伦精品免费女| 偷拍熟女露出喷水在线91| 女人18片毛片60分钟| 全部孕妇毛片| A阿V天堂免费无码专区| 日韩五码一区二区三区地址| 日本另类αv欧美另类aⅴ| 7777精品久久久大香线蕉| 日本高清中文一区二区三区| 偷拍一区二区三区四区视频| 亚洲熟妇少妇任你躁在线观看无码| 国产黑丝在线| 精品亚洲视频免费观看网站| 精品国产一区二区三区18p| 激情航班h版在线观看| 五月中文字幕| 国产大屁股白浆一区二区三区| 人人爽久久久噜人人看| 无码人妻品一区二区三区精99| 亚洲午夜无码久久久久软件| 天天射综合网天天插天天干| 亚洲精品乱码久久久久久日本蜜臀 | 国产主播一区二区三区在线观看| 久久精品综合国产二区| 91精品国产在热久久| 毛多水多www偷窥小便| 日韩在线视精品在亚洲|