亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向商品評(píng)價(jià)的情感要素抽取

        2016-02-08 11:33:54馮倉(cāng)龍蔡?hào)|風(fēng)
        關(guān)鍵詞:傾向性詞典聚類(lèi)

        馮倉(cāng)龍,白 宇,蔡?hào)|風(fēng)

        (沈陽(yáng)航空航天大學(xué) 人機(jī)智能研究中心,沈陽(yáng) 110136)

        面向商品評(píng)價(jià)的情感要素抽取

        馮倉(cāng)龍,白 宇,蔡?hào)|風(fēng)

        (沈陽(yáng)航空航天大學(xué) 人機(jī)智能研究中心,沈陽(yáng) 110136)

        商品評(píng)價(jià)的細(xì)粒度傾向性分析的目標(biāo)是對(duì)評(píng)價(jià)信息中所涉及評(píng)價(jià)對(duì)象的各個(gè)側(cè)面進(jìn)行情感極性判別,進(jìn)而準(zhǔn)確反映用戶(hù)的商品評(píng)價(jià)意圖。情感要素抽取是商品評(píng)價(jià)的細(xì)粒度傾向性分析的關(guān)鍵步驟。提出了一種面向商品評(píng)價(jià)細(xì)粒度分析的情感要素抽取方法,該方法將情感要素詞典及聚類(lèi)代碼引入CRF模型中,實(shí)現(xiàn)情感對(duì)象和情感詞同步抽取。在3類(lèi)不同領(lǐng)域的商品評(píng)價(jià)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),準(zhǔn)確率平均達(dá)到了96.06%,召回率平均達(dá)到了91.39%,F(xiàn)值平均達(dá)到了93.66%,在混合商品評(píng)價(jià)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果顯示,準(zhǔn)確率、召回率、F值分別達(dá)到了96.84%、93.34%和95.06%。

        傾向性分析;商品評(píng)價(jià);情感要素抽取

        在線(xiàn)商品評(píng)價(jià)是消費(fèi)者對(duì)購(gòu)買(mǎi)商品的主觀評(píng)論信息(包括對(duì)商品的整體評(píng)價(jià)和對(duì)性能、規(guī)格、材質(zhì)、外觀等商品屬性)的細(xì)粒度評(píng)價(jià)。通常,商品評(píng)價(jià)信息具有情感傾向性,能夠被用于消費(fèi)決策或產(chǎn)品監(jiān)測(cè)的評(píng)價(jià)信息主要是對(duì)商品的積極評(píng)價(jià)和消極評(píng)價(jià),對(duì)商品評(píng)價(jià)進(jìn)行情感傾向性分析的目的就是從大量主觀評(píng)價(jià)信息中判別評(píng)價(jià)信息的情感傾向。

        如表1所示,從情感傾向性表達(dá)方面看,評(píng)論內(nèi)容可分為無(wú)傾向性(中立)、單一傾向性評(píng)價(jià)(積極、消極)和復(fù)合傾向性評(píng)價(jià)。

        表1 評(píng)價(jià)內(nèi)容舉例

        單一傾向性評(píng)價(jià)指在評(píng)價(jià)內(nèi)容中僅對(duì)評(píng)價(jià)對(duì)象的某一側(cè)面進(jìn)行評(píng)價(jià)或?qū)υu(píng)價(jià)對(duì)象的多個(gè)側(cè)面給出相同極性的評(píng)價(jià)結(jié)果(如積極、消極等)。目前,商品評(píng)論傾向性分析的相關(guān)研究主要針對(duì)這類(lèi)單一傾向性評(píng)價(jià)內(nèi)容開(kāi)展[1-3]。復(fù)合傾向性評(píng)價(jià)指在評(píng)價(jià)內(nèi)容中對(duì)評(píng)價(jià)對(duì)象的多個(gè)側(cè)面給出不同極性的評(píng)價(jià)結(jié)果。細(xì)粒度傾向性分析的目標(biāo)即是分別對(duì)復(fù)合傾向性評(píng)價(jià)中所涉及評(píng)價(jià)對(duì)象的各個(gè)側(cè)面進(jìn)行情感極性判別,進(jìn)而準(zhǔn)確反映用戶(hù)的商品評(píng)價(jià)意圖??傮w流程如圖1所示。

        圖1 細(xì)粒度評(píng)價(jià)傾向性分析總體流程

        其中,情感要素(情感對(duì)象或情感詞)抽取是商品細(xì)粒度傾向性分析的關(guān)鍵步驟,包括情感對(duì)象、情感詞的識(shí)別與對(duì)齊。如評(píng)論d =“設(shè)計(jì)的很合理,機(jī)身拿起來(lái)手感超好,屏幕比較出色,顯示細(xì)膩,有正規(guī)發(fā)票,客服不錯(cuò)?!敝?,情感對(duì)象A={“設(shè)計(jì)”,“機(jī)身”,“手感”,“屏幕”,“顯示”,“發(fā)票”,“客服” },情感詞E = {“很合理”,“超好”,“出色”,“細(xì)膩”,“正規(guī)”,“不錯(cuò)”},經(jīng)過(guò)情感要素抽取后得到的情感對(duì)象、情感詞詞對(duì)Ω= {<設(shè)計(jì),很合理>,<手感,超好>,<屏幕,出色>,<顯示,細(xì)膩>,<發(fā)票,正規(guī)>,<客服,不錯(cuò)>}。

        本文提出的情感要素抽取方法將情感對(duì)象和情感詞作為詞對(duì)來(lái)進(jìn)行抽取,實(shí)驗(yàn)結(jié)果表明,該方法有效地解決了情感詞與被修飾的情感對(duì)象不匹配的問(wèn)題。同時(shí),在詞對(duì)的抽取方面獲得了較高的綜合指標(biāo)。

        1 相關(guān)工作

        Kushmerick[4]提出一種基于規(guī)則的信息抽取,需要預(yù)先構(gòu)造抽取規(guī)則集,相對(duì)于基于詞典的信息抽取有一定的擴(kuò)展性。Liu 等[5]采用關(guān)聯(lián)規(guī)則方式抽取產(chǎn)品屬性,并將產(chǎn)品屬性附近的情感詞作為評(píng)價(jià)詞,實(shí)現(xiàn)一套產(chǎn)品評(píng)論分析系統(tǒng)。王鑫等[6]采用依存句法樹(shù)為基礎(chǔ)的論元識(shí)別手段,通過(guò)制約論元與特定詞性的詞在依存句法樹(shù)中的距離來(lái)過(guò)濾優(yōu)秀的候選論元集合。Yue等人[7]給出一系列轉(zhuǎn)換規(guī)則,并提供了抽取活動(dòng)圖的方法,實(shí)現(xiàn)數(shù)據(jù)抽取。陳炯等人[8]借助同義詞詞林構(gòu)建產(chǎn)品屬性模板,使用屬性模板識(shí)別產(chǎn)品屬性。上述基于規(guī)則的方法在文本信息抽取中雖然可以取得較好的成績(jī),但在商品評(píng)價(jià)中經(jīng)常出現(xiàn)不規(guī)則的語(yǔ)法結(jié)構(gòu),在文字表達(dá)上多為口語(yǔ),再加上網(wǎng)絡(luò)新詞的不斷涌現(xiàn),導(dǎo)致商品評(píng)價(jià)情感要素的抽取存在障礙。

        W.Jin等[9]利用隱馬爾科夫模型(HMM)對(duì)詞序列進(jìn)行序列標(biāo)注,可以有效地抽取未登錄詞。徐冰等人[10]使用CRF識(shí)別情感對(duì)象,系統(tǒng)在模型的訓(xùn)練過(guò)程中引入淺層句法信息和啟發(fā)式位置信息,同時(shí)在不增加領(lǐng)域詞典的情況下,有效提高了系統(tǒng)的精確率。孫曉等[11]提出將情感對(duì)象及情感詞視為CRFs中不同標(biāo)記的詞,因此能使用CRFs同步抽取。Kim 等[12]將語(yǔ)義角色加入特征集合,在觀點(diǎn)及主題抽取中取得較好效果。W.Wei等[13]針對(duì)產(chǎn)品屬性層次關(guān)系沒(méi)被充分利用的限制,提出了一種基于分層學(xué)習(xí)情感本體樹(shù)的抽取算法。張旭成等[14]介紹了基于文本統(tǒng)計(jì)類(lèi)別信息熵的關(guān)鍵詞抽取技術(shù)。Qiu等[15]通過(guò)觀察名詞與形容詞的依存句法關(guān)系,制定了一種雙向傳播的規(guī)則擴(kuò)展種子詞,最終可抽取出名詞性評(píng)價(jià)特征和形容詞性情感詞典,實(shí)驗(yàn)取得了不錯(cuò)的效果,并提出一種可抽取觀點(diǎn)表達(dá)式并判斷極性的組合模型。吳苑斌等[16]等利用樹(shù)核函數(shù)抽取產(chǎn)品特征和觀點(diǎn)表達(dá)式。在商品評(píng)價(jià)信息抽取中,情感要素是以詞對(duì)的形式出現(xiàn)的,上述方法在解決這一問(wèn)題上還需要對(duì)情感對(duì)象和情感詞做詞對(duì)齊處理,本文提出的將二者作為詞對(duì)抽取的方法可以有效地解決這一問(wèn)題。

        2 情感要素的抽取

        2.1 特征說(shuō)明

        在情感要素抽取任務(wù)中,基于CRF模型的方法通常使用的特征包括詞、詞性及淺層句法特征等,如表2所示。

        表2 基本特征表

        文獻(xiàn)[11]在上述特征的基礎(chǔ)上還使用了語(yǔ)法成分特征(Gram)及句法父節(jié)點(diǎn)語(yǔ)法成分特征(PGram)。其中,句法父節(jié)點(diǎn)是依存句法分析樹(shù)中當(dāng)前詞的父節(jié)點(diǎn),而語(yǔ)法成分包括主語(yǔ)、謂語(yǔ)、賓語(yǔ)等。本文考慮到詞類(lèi)信息對(duì)詞對(duì)抽取結(jié)果的影響,引入情感要素特征和聚類(lèi)代碼特征。

        2.2 情感要素特征

        在商品評(píng)價(jià)數(shù)據(jù)集合中,每句帶有傾向性的評(píng)論均應(yīng)包括情感詞和情感對(duì)象詞,因此,可將詞的語(yǔ)義角色分為情感詞、情感對(duì)象詞和其他詞3類(lèi),且各語(yǔ)義角色類(lèi)別在數(shù)據(jù)集中的分布均勻。本文將情感對(duì)象詞和情感詞的語(yǔ)義角色作為情感要素特征,并通過(guò)情感對(duì)象和情感詞詞典進(jìn)行特征標(biāo)記。

        情感對(duì)象特征(Emo)函數(shù)

        情感詞特征(Obj)函數(shù)

        其中,A={情感對(duì)象};E={情感詞};wi=詞。

        情感對(duì)象和情感詞詞典可以從訓(xùn)練語(yǔ)料的標(biāo)注信息中直接獲得。

        2.3 聚類(lèi)代碼特征

        聚類(lèi)代碼特征(Clu)通過(guò)聚類(lèi)操作可以將具有相同詞義的情感對(duì)象或情感詞聚集到一起,在情感要素的抽取方面可以間接幫助識(shí)別同類(lèi)情感要素;同時(shí)可以把每個(gè)小類(lèi)看成是一個(gè)詞典,這樣相當(dāng)于得到多個(gè)細(xì)粒度的詞典,起到輔助情感要素詞典識(shí)別情感對(duì)象和情感詞的作用。

        詞聚類(lèi)需要將詞進(jìn)行向量化處理,向量化是用N維行向量(N1,N2,N3,…,Nn)來(lái)表示一個(gè)詞,通過(guò)詞向量可以計(jì)算詞與詞之間的相似度。本文采用word2Vec模型對(duì)文本建模,為充分體現(xiàn)詞與詞的語(yǔ)義關(guān)系,理論上訓(xùn)練詞向量的語(yǔ)料規(guī)模越大越好。實(shí)驗(yàn)采用搜狗新聞?wù)Z料2.19G及混合商品評(píng)論語(yǔ)料231288條作為訓(xùn)練數(shù)據(jù),訓(xùn)練word2Vec詞向量模型,并得到情感對(duì)象和情感詞的向量化表示,進(jìn)而進(jìn)行聚類(lèi)操作,并為每個(gè)類(lèi)賦予一個(gè)編號(hào)作為聚類(lèi)代碼特征,聚類(lèi)模型選用K-means[17-18],對(duì)于測(cè)試集中的詞利用KNN模型進(jìn)行分類(lèi)操作從而得到聚類(lèi)代碼。

        3 實(shí)驗(yàn)數(shù)據(jù)及其結(jié)果分析

        3.1 數(shù)據(jù)說(shuō)明

        實(shí)驗(yàn)數(shù)據(jù)全部來(lái)自天貓和京東商城的商品評(píng)價(jià)信息。為體現(xiàn)領(lǐng)域差距,分別選取手機(jī)、電飯煲和馬桶3個(gè)領(lǐng)域差距較大的數(shù)據(jù)集,其中手機(jī)電商評(píng)價(jià)數(shù)據(jù)共2 064條,1264條用作訓(xùn)練,800條用作測(cè)試;電飯煲電商評(píng)價(jià)數(shù)據(jù)共2123條,1323條用作訓(xùn)練,800條用作測(cè)試;馬桶電商評(píng)價(jià)數(shù)據(jù)共2118條,1318條用作訓(xùn)練,800條用作測(cè)試,以及3個(gè)領(lǐng)域的混合商品評(píng)價(jià)數(shù)據(jù)4705條用作訓(xùn)練,2400條用作測(cè)試。

        3.2 訓(xùn)練集構(gòu)建

        本實(shí)驗(yàn)采用有監(jiān)督模型進(jìn)行情感要素的抽取,因此需要人工標(biāo)注語(yǔ)料,標(biāo)注規(guī)則的復(fù)雜性導(dǎo)致標(biāo)注需要耗費(fèi)大量時(shí)間。本實(shí)驗(yàn)使用已開(kāi)發(fā)好的標(biāo)注應(yīng)用程序進(jìn)行操作,其好處是避免標(biāo)注人員直接接觸文本數(shù)據(jù)而造成數(shù)據(jù)篡改,同時(shí)可以為以后的標(biāo)注任務(wù)提供方便。由80名學(xué)生組成的標(biāo)注團(tuán)隊(duì),每組20人分別標(biāo)注所有語(yǔ)料,第一輪將全部語(yǔ)料標(biāo)注4遍,之后打亂數(shù)據(jù)重新分配,進(jìn)行第二輪標(biāo)注,取同一條數(shù)據(jù)中標(biāo)注一致性最強(qiáng)的標(biāo)簽作為待選標(biāo)簽可以減少誤標(biāo)注率,最后進(jìn)行人工校對(duì)以增強(qiáng)結(jié)果的準(zhǔn)確性。本文采用與文獻(xiàn)[11]相同的標(biāo)注集進(jìn)行標(biāo)注,標(biāo)注集合如表3所示。

        表3 標(biāo)注集說(shuō)明

        3.3 實(shí)驗(yàn)結(jié)果分析

        采用條件隨機(jī)場(chǎng)模型(CRF)在電飯煲、馬桶、手機(jī)及混合數(shù)據(jù)上做了4組特征的對(duì)比試驗(yàn),特征組合選取見(jiàn)表4所示。

        表4 特征組合說(shuō)明

        表5至表7分別列出了不同特征組合在測(cè)試集上的準(zhǔn)確率、召回率及F值的實(shí)驗(yàn)結(jié)果。

        通過(guò)對(duì)比特征組合T和T_EF發(fā)現(xiàn),將情感要素詞典特征引入CRF模型,無(wú)論準(zhǔn)確率還是召回率都會(huì)有很明顯的提升,這說(shuō)明在詞對(duì)抽取方面將規(guī)則模塊融入CRF模型可以起到很好的效果,詞典不但可以帶來(lái)語(yǔ)義信息,更重要的是還能將規(guī)則抽取方法的優(yōu)勢(shì)融入統(tǒng)計(jì)模型。

        表5 準(zhǔn)確率

        表6 召回率

        表7 F值

        同時(shí),比較T和T_Clu特征組合發(fā)現(xiàn),引入聚類(lèi)代碼特征使詞對(duì)抽取的各項(xiàng)指標(biāo)得到了提升,一方面聚類(lèi)代碼可以起到多個(gè)細(xì)粒度詞典的作用,判斷信息是否為情感要素;另一方面,將詞義信息引入模型中可以間接幫助識(shí)別同類(lèi)情感要素。然而通過(guò)聚類(lèi)得到的詞類(lèi)準(zhǔn)確率沒(méi)有詞典高,在情感要素識(shí)別方面的效果較詞典略差,因此不能全面取代詞典特征。從實(shí)驗(yàn)結(jié)果來(lái)看,商品電飯煲和馬桶抽取的準(zhǔn)確率與召回率略微下降。分析推測(cè),這是由于電飯煲和馬桶的商品屬性數(shù)量與手機(jī)等電子產(chǎn)品相比較少,且關(guān)于產(chǎn)品的屬性描述略微單一化,因此聚類(lèi)效果不佳,然而從手機(jī)評(píng)價(jià)數(shù)據(jù)以及混合數(shù)據(jù)的實(shí)驗(yàn)效果來(lái)看,結(jié)果有很大的提升,說(shuō)明聚類(lèi)代碼對(duì)于詞對(duì)抽取是有積極影響作用的。

        特征組合T_S是在T的基礎(chǔ)上加入語(yǔ)法成分特征,實(shí)驗(yàn)結(jié)果表明,該特征受句法分析準(zhǔn)確率的影響較大,因此在詞對(duì)抽取過(guò)程中沒(méi)能達(dá)到很好的效果。

        綜上,本文嘗試將情感要素詞典和聚類(lèi)代碼同時(shí)引入CRF模型,發(fā)現(xiàn)二者的融合在詞對(duì)抽取方面可以達(dá)到更好的效果,且避免了句法分析準(zhǔn)確率對(duì)詞對(duì)抽取的影響。對(duì)比3個(gè)領(lǐng)域的商品評(píng)價(jià)數(shù)據(jù)集上的實(shí)驗(yàn)發(fā)現(xiàn),只有在馬桶評(píng)價(jià)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果沒(méi)有得到提升。通過(guò)分析商品的評(píng)價(jià)語(yǔ)料發(fā)現(xiàn),由于產(chǎn)品本身屬性描述的不規(guī)范性,導(dǎo)致聚類(lèi)的準(zhǔn)確率下降,因此對(duì)于詞典特征的補(bǔ)充效果不是很好,但是從其他類(lèi)的語(yǔ)料以及混合語(yǔ)料上的實(shí)驗(yàn)效果來(lái)看,將詞典特征與聚類(lèi)代碼特征結(jié)合是可以得到較為理想的抽取效果的。綜合來(lái)看,通過(guò)5折交叉驗(yàn)證的方式,在3類(lèi)不同數(shù)據(jù)的實(shí)驗(yàn)中,F(xiàn)值平均達(dá)到93.66%,在混合數(shù)據(jù)集上的實(shí)驗(yàn)中,F(xiàn)值達(dá)到了95.06%,充分表明了本實(shí)驗(yàn)方法在<情感對(duì)象,情感詞>詞對(duì)抽取方面的有效性。

        4 結(jié)論

        本文將情感要素詞典及聚類(lèi)代碼引入條件隨機(jī)場(chǎng)模型(CRF)中,實(shí)現(xiàn)情感對(duì)象和情感詞的同步抽取,采用此方法將規(guī)則信息抽取的優(yōu)勢(shì)融入統(tǒng)計(jì)模型,從而提高了統(tǒng)計(jì)方法的效率,并通過(guò)在不同領(lǐng)域評(píng)價(jià)信息上的實(shí)驗(yàn)證明了方法的可靠性。

        從實(shí)驗(yàn)可以看出詞典在詞對(duì)抽取的效率方面提供了明顯的支持,當(dāng)測(cè)試集與訓(xùn)練集來(lái)自不同領(lǐng)域商品評(píng)價(jià)信息時(shí),通過(guò)訓(xùn)練集構(gòu)建情感要素的詞典在測(cè)試集中可能出現(xiàn)未登錄詞,對(duì)于這種情況可以采用動(dòng)態(tài)構(gòu)建情感要素詞典的方法。在構(gòu)建情感對(duì)象詞典方面,可以設(shè)計(jì)詞性序列模板獲得候選商品屬性詞集,并采用統(tǒng)計(jì)方法篩選候選商品屬性詞[19],如表8所示,從而得到較全面的情感對(duì)象集合。

        表8 詞性序列模板

        在情感詞典的擴(kuò)建方面,可以在基礎(chǔ)情感詞典的基礎(chǔ)上采用計(jì)算互信息的方式構(gòu)建擴(kuò)展情感詞典。目前,現(xiàn)有的基礎(chǔ)情感詞典主要有知網(wǎng)的“情感分析用詞語(yǔ)集”和大連理工大學(xué)的“情感詞匯本體”,前者將情感詞分成正、負(fù)2個(gè)方面并提供了包含6個(gè)級(jí)別的程度詞語(yǔ)集,后者則給出更為詳細(xì)的情感詞說(shuō)明,包括情感強(qiáng)度、極性、及詞義數(shù)等信息。通過(guò)此類(lèi)方法可以得到較全面的情感詞集。商品評(píng)價(jià)信息中的大量錯(cuò)別字及口語(yǔ)化現(xiàn)象導(dǎo)致詞典的構(gòu)建存在障礙,進(jìn)而影響詞典特征的準(zhǔn)確率,下一步考慮通過(guò)引入拼音等中間媒介還原詞義的方法來(lái)解決錯(cuò)別字及口語(yǔ)化現(xiàn)象。

        [1]TURNEY P D.Thumbs Up or Thumbs Down?Semantic orientation applied to unsupervised classification of reviews[C]//Proceedings of ACL-02,40th Annual Meeting of the Association for Computational Linguistics,2002:417-424.

        [2]PANG B,LEE L,Vaithyana than S.Thumbs up?Sentiment classification using machine learning techniques[C]//Proceedings of EMNLP-02,the Conference on Empirical Methods in Natural Language Processing.Philadelphia,2002:79-86.

        [3]YI J,NASUKAWA T,BUNESCU R,et al.Sentiment analyzer:extracting sentiments about a given topic using natural language processing techniques[C]//Proceedings of the 3rd IEEE International Conference on Data Mining(ICDM-2003).Melbourne,2003:427-434.

        [4]KUSHMERICK N.Wrapper induction:efficiency and expressiveness [J].Artificial Intelligence,2000,118(01):15-68.

        [5]LIU B,HU M Q,CHENG J S.Opinion observer:analyzing and comparing opinions on the web[C]//Proc of the 14th International Conference on World Wide Web.Chiba,2005:342-351.

        [6]王鑫,穗志方.基于依存樹(shù)距離識(shí)別論元的語(yǔ)義角色標(biāo)注系統(tǒng)[J].中文信息學(xué)報(bào),2012,26(2):40-45.

        [7]YUE T,BRIAND L.An automated approach to trans form use cases into activity diagrams[C]//Proceedings of the 6th European Conference on Modeling Foundations and Applications.Paris,2010:337-353.

        [8]陳炯,張虎,曹付元,等.面向中文客戶(hù)評(píng)論的產(chǎn)品屬性抽取方法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(3):1245-1250.

        [9]JIN W,HO H.A novel lexicalized HMM-based learning framework for web opinion mining[C]//Proceedings of the 26th Annual International Conference on Machine Learning,Ouebec,2009:465-472.

        [10]徐冰,趙鐵軍,王山雨,等.基于淺層句法特征的評(píng)價(jià)對(duì)象抽取研究[J].自動(dòng)化學(xué)報(bào),2011,37(10):1241-1247.

        [11]孫曉,唐陳意.基于層疊模型細(xì)粒度情感要素抽取及傾向分析[J].模式識(shí)別與人工智能,2015,28(6):513-520.

        [12]KIM S M,HOVY E.Determining the sentiment of opinions[C]//Proc of the 20th International Conference on Computational Linguistics.Geneva,2004:1367-1373.

        [13]WEI W,GGULLA J A.Sentiment learning on product reviews via sentiment ontology Tree[C]//Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics,Morristown:ACL,Uppsala,2010:404-413.

        [14]張旭成,宋傳寶.基于文本類(lèi)別信息熵的中文文檔關(guān)鍵詞提取[C].武漢:中文信息處理國(guó)際會(huì)議,2007.

        [15]QIU G,LIU B,BU J J,et al.Expanding domain sentiment lexicon through double propagation[C]//Proceedings of the 21st international joint conference on Artificial intelligence,California,2009:1199-1204.

        [16]WU Y B,ZHANG Q,HUANG X J,et al.Phrase dependency parsing for opinion mining[C]//Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing,Morristown:ACL,Stroudsburg,2009:1533-1541.

        [17]馮超.K-means聚類(lèi)算法的研究[D].大連:大連理工大學(xué),2007.

        [18]周愛(ài)武,于亞飛.K-means聚類(lèi)算法的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(2):62-65.

        [19]LI CHUNLIANG,ZHU YANHUI,XU YEQIANG.Research of attribute word extraction method in chinese product comment[J].Computer Engineering,2011,37(12):26-28.

        (責(zé)任編輯:劉劃 英文審校:趙亮)

        Emotional factors extraction for commodity reviews

        FENG Cang-long,BAI Yu,CAI Dong-feng

        (Research Center for Human-computer Intelligence,Shenyang Aerospace University,Shenyang 110136,China)

        The objective of the fine-grained orientation analysis on commodity reviews is to recognize the emotional polarity of the various sides of a commented object and reflect the intention of user’s reviews accurately.An emotional factor extraction is the key step in the analysis of the fine grain orientation of commodity reviews.This paper presented an approach for the extracting these factors.We introduced the dictionary of emotional factors and the clustering code into the CRF model,and then extracted emotional objects and corresponding emotional words simultaneously.Through experiment on the commodity reviews data sets in 3 different fields,we got 96.06% in precision,91.39% in recall and 93.66% in F-measure averagely.Finally,the experimental results showed that it has 96.84% in precision,93.34% in recall and 95.06% in F-measure on the mixed data set.

        propensity analysis;commodity reviews;emotional factors extraction

        2016-10-28

        國(guó)家科技支撐計(jì)劃(項(xiàng)目編號(hào):2015BAH20F)

        馮倉(cāng)龍(1987-),男,黑龍江佳木斯人,碩士研究生,主要研究方向:人工智能與自然語(yǔ)言處理,E-mail:fd0724@163.com;蔡?hào)|風(fēng)(1958-),男,遼寧沈陽(yáng)人,教授,主要研究方向:人工智能與自然語(yǔ)言處理,E-mail:caidf@vip.163.com。

        2095-1248(2016)06-0071-06

        TP391.1

        A

        10.3969/j.issn.2095-1248.2016.06.012

        猜你喜歡
        傾向性詞典聚類(lèi)
        基于模糊數(shù)學(xué)法的阿舍勒銅礦深部巖體巖爆傾向性預(yù)測(cè)
        米沃什詞典
        文苑(2019年24期)2020-01-06 12:06:50
        評(píng)《現(xiàn)代漢語(yǔ)詞典》(第6版)
        基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
        詞典例證翻譯標(biāo)準(zhǔn)探索
        基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
        關(guān)于醫(yī)患沖突報(bào)道的傾向性分析——以“湘潭產(chǎn)婦死亡案”為例
        “沒(méi)準(zhǔn)兒”“不一定”“不見(jiàn)得”和“說(shuō)不定”的語(yǔ)義傾向性和主觀性差異
        一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
        一種面向博客群的主題傾向性分析模型
        性动态图av无码专区| 日本免费一区二区在线视频播放| 女人的精水喷出来视频| 国产精品爽黄69天堂a| 日韩二三区| 亚洲色图视频在线观看,| 国产亚洲成人精品久久| 久久精品人妻无码一区二区三区| 无码中文字幕在线DVD| 国产一区二区三区观看视频| 久草视频这里只有精品| 少妇激情一区二区三区视频| 国产精品二区在线观看| 亚洲免费成年女性毛视频| 免费黄片小视频在线播放| 久久久精品国产sm调教网站 | 日韩欧美中文字幕不卡| 成人精品国产亚洲av久久| 虎白女粉嫩粉嫩的18在线观看| 午夜视频在线在免费| 免费成人福利视频| 淫秽在线中国国产视频| 欧美丰满少妇xxxx性| 欧美丰满大屁股ass| 中文字幕午夜AV福利片| 极品美女调教喷水网站| 久久精品国产精品| 在线观看视频亚洲| 最全精品自拍视频在线| 久久精品中文字幕无码绿巨人| 少妇spa推油被扣高潮| 青青草视频在线视频播放| 久久在一区二区三区视频免费观看| 国产免费av片在线播放| 亚洲最大无码AV网站观看| 国产精品高清国产三级国产av| 性刺激的大陆三级视频| 久久精品无码鲁网中文电影| 国产av一区二区三区在线| 无码国产精成人午夜视频一区二区| 成人黄色网址|