亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中文軟件評論挖掘系統(tǒng)的設(shè)計與實(shí)現(xiàn)

        2013-11-30 05:01:28濤,楊達(dá),李
        計算機(jī)工程與設(shè)計 2013年1期
        關(guān)鍵詞:特征詞極性觀點(diǎn)

        文 濤,楊 達(dá),李 娟

        (中國科學(xué)院軟件研究所 互聯(lián)網(wǎng)軟件技術(shù)實(shí)驗(yàn)室,北京100190)

        0 引 言

        網(wǎng)絡(luò)化軟件以服務(wù)大眾為目標(biāo),強(qiáng)調(diào)以用戶的期望為著手點(diǎn),通過多種途徑使得自己提供的產(chǎn)品或服務(wù)達(dá)到或超越用戶期望,獲得用戶滿意。傳統(tǒng)的用戶滿意度研究是通過確定用戶滿意度模型以及問卷調(diào)查的方式得到。然而這種方式由于數(shù)據(jù)收集過程繁瑣、冗長,并且調(diào)查受眾有限,很顯然已經(jīng)不能滿足網(wǎng)絡(luò)化時代的要求,特別是針對近幾年來興起的各類移動應(yīng)用,其軟件版本更新速度非常之快,若不能及時掌握用戶需求,則會被市場所淘汰。

        網(wǎng)絡(luò)上存在著大量的用戶對軟件的評論,這些評論大都為用戶使用軟件后對其功能和性能的評價,通過對這些評論進(jìn)行分析,可以得到大眾用戶對軟件各方面的總體傾向,從而使軟件開發(fā)者了解到自身產(chǎn)品的不足和用戶的實(shí)際需求,為下一版本的改進(jìn)依據(jù)。但是網(wǎng)絡(luò)上的評論信息數(shù)據(jù)量巨大、來源眾多,例如,僅Android Market上應(yīng)用軟件的總數(shù)量目前就已達(dá)40萬[1],并且還在不斷增長,一些熱門軟件的用戶評論也是高達(dá)上萬條,如果采用人工閱讀的方式將會耗費(fèi)大量的時間和精力,而目前并沒有相關(guān)的對中文軟件評論進(jìn)行分析的工具,因此一個有效的中文軟件評論挖掘系統(tǒng)將會給開發(fā)者帶來具大的幫助。

        目前,評論挖掘是一個非常熱門的研究領(lǐng)域,具有很大的研究價值和應(yīng)用價值,正受到國內(nèi)外越來越多的研究機(jī)構(gòu)和組織的重視。評論挖掘在英文領(lǐng)域的起步比中文領(lǐng)域早,技術(shù)也相對成熟,已有了一些原型系統(tǒng)和產(chǎn)品,并且有些還在商業(yè)中得到了應(yīng)用。比較有代表性地如Liu[2]等人所開發(fā)的系統(tǒng)Opinion Observer,該系統(tǒng)從網(wǎng)上獲取關(guān)于產(chǎn)品的評論,分析該評論中用戶所針對的產(chǎn)品特征及所持的情感傾向,然后采用可視化方式對多種產(chǎn)品的特征的綜合評價進(jìn)行比較。微軟公司的 Gamon[3]等人開發(fā)的“Pulse”系統(tǒng)可以自動獲取網(wǎng)絡(luò)上有關(guān)汽車的評論,并挖掘這些評論中所包含的褒貶信息及強(qiáng)弱程度。

        中文方面,由于中英文之間的諸多差異,一些針對英文評論挖掘方面的研究成果無法在中文評論挖掘中直接應(yīng)用,再加之中文評論挖掘研究起步較晚,目前已有的中文評論挖掘系統(tǒng)相對較少,最具代表性的是姚天昉[4]等人研究開發(fā)的一個用于漢語汽車評論的意見挖掘系統(tǒng)。該系統(tǒng)從各門戶網(wǎng)站和汽車論壇上獲取有關(guān)汽車的評論,然后挖掘用戶在評論中對汽車各性能指標(biāo)所持的觀點(diǎn),判斷這些觀點(diǎn)的極性以及強(qiáng)弱并給出可視化的結(jié)果。但是系統(tǒng)需要以人工的方式建立汽車本體,移植性較差,并且當(dāng)產(chǎn)品屬性發(fā)生變化時其本體還需要重建。因此,該系統(tǒng)對其它領(lǐng)域很難適用,特別是軟件這一領(lǐng)域,軟件功能的增加或變化是相當(dāng)頻繁的。

        為此,本文構(gòu)建了一個中文軟件評論挖掘的系統(tǒng)。系統(tǒng)通過抓取網(wǎng)絡(luò)上的軟件評論數(shù)據(jù),然后采用自然語言處理、機(jī)器學(xué)習(xí)、意見挖掘等技術(shù),識別出評論中的關(guān)鍵信息(軟件、特征、評價),通過對這些信息的細(xì)粒度情感傾向性分析,最終得到大眾用戶對軟件各方面的滿意度并將結(jié)果以可視化的方式進(jìn)行展示。

        1 系統(tǒng)設(shè)計

        系統(tǒng)主要包含數(shù)據(jù)收集、意見挖掘和結(jié)果展示3個部分。詳細(xì)的結(jié)構(gòu)如圖1所示。

        圖1 系統(tǒng)總體架構(gòu)

        各個部分的主要功能如下:

        (1)數(shù)據(jù)收集。它是整個系統(tǒng)的基礎(chǔ)部分,主要負(fù)責(zé)從 Android Market(http://market.android.com)上抓取軟件的相關(guān)信息和評論數(shù)據(jù)。Android是近年來興起的智能手機(jī)操作系統(tǒng),其平臺上擁有大量的應(yīng)用程序和用戶。Android Market正是提供基于Android平臺軟件下載的一個大的站點(diǎn),用戶數(shù)量巨大,為本文的研究提供了大量的數(shù)據(jù)來源。同時Android Market開放了一些對外的API,這也方便了本系統(tǒng)數(shù)據(jù)的獲取。

        (2)意見挖掘。它由數(shù)據(jù)預(yù)處理、軟件特征抽取、<特征詞、觀點(diǎn)詞>對識別、情感極性判斷及強(qiáng)度計算4個模塊組成,是整個系統(tǒng)的核心部分。主要功能是利用自然語言處理、機(jī)器學(xué)習(xí)的一些技術(shù)從軟件評論文本中抽取出軟件特征、評價詞等關(guān)鍵信息,然后通過對這些信息進(jìn)行細(xì)粒度的情感分析,得到大眾用戶對軟件各方面的滿意程度。

        (3)結(jié)果展示。它的主要功能是將軟件評論進(jìn)行意見挖掘分析之后的結(jié)果,以可視化的方式進(jìn)行展示,方便開發(fā)者查看。

        系統(tǒng)采用B/S結(jié)構(gòu)進(jìn)行開發(fā),整個系統(tǒng)的流程大致可描述如下:首先用戶通過交互界面輸入軟件名稱(如圖2所示),然后數(shù)據(jù)收集模塊在Android Market中查找相關(guān)軟件的信息并將檢索結(jié)果反饋給用戶,用戶在結(jié)果頁面選取某一款具體的軟件后,數(shù)據(jù)收集模塊再次啟動抓取其評論數(shù)據(jù),存儲到數(shù)據(jù)庫中。接著意見挖掘模塊對評論數(shù)據(jù)進(jìn)行挖掘分析,將結(jié)果傳送給展示模塊。最終結(jié)果展示模塊以可視化的方式將結(jié)果進(jìn)行顯示。結(jié)果展示的界面如圖3所示,以軟件特征為粒度,顯示其正負(fù)評論數(shù),點(diǎn)擊數(shù)字可以查看具體的評論信息。

        圖2 系統(tǒng)交互界面

        系統(tǒng)的實(shí)現(xiàn)和運(yùn)行表明,各模塊間只通過數(shù)據(jù)進(jìn)行聯(lián)系,降低了模塊之間的耦合度,提高了實(shí)現(xiàn)的效率并方便了后續(xù)對各模塊的改進(jìn)。

        圖3 結(jié)果展示界面

        2 關(guān)鍵技術(shù)及實(shí)現(xiàn)

        軟件評論挖掘系統(tǒng)的有效與否主要在于其結(jié)果是否真實(shí)、準(zhǔn)確。因此系統(tǒng)意見挖掘部分所涉及到的軟件特征抽取、<特征詞、觀點(diǎn)詞>對識別、情感極性判斷及強(qiáng)度計算等技術(shù)是其關(guān)鍵的技術(shù)。

        2.1 軟件特征抽取

        軟件特征為用戶對軟件進(jìn)行評論時的關(guān)注點(diǎn),一般為描述軟件功能或性能的詞或短語。Hu和Liu[5]最早使用關(guān)聯(lián)規(guī)則算法Apriori來進(jìn)行產(chǎn)品特征的抽取。但是該方法并沒有充分考慮評價對象的結(jié)構(gòu)特征以及評價對象的領(lǐng)域相關(guān)性,直接用會產(chǎn)生很大噪聲。國內(nèi)的李實(shí)[6-7]等人對中文評論中產(chǎn)品特征的抽取進(jìn)行了研究,他們在Apriori算法的基礎(chǔ)上,設(shè)計了一些剪枝算法來提高特征挖掘的正確率和召回率。這與本文的方法比較相似,但是在剪枝策略的設(shè)計上有明顯的不同。同是我們還注意到,對于軟件這一領(lǐng)域,在利用頻繁k項(xiàng)集(K>=2)生成特征時,還需要考慮詞的順序問題。如有頻繁二項(xiàng)集 {省電,功能},描述的特征應(yīng)為 “省電功能”而不是 “功能省電”,而有時還存在前后順序都合理的情況,如 “垃圾清理功能”和 “清理垃圾功能”?;诖?,本文的特征提取方法在剪枝后還加入了順序還原的過程。方法基本步驟如下:

        (1)對評論語料進(jìn)行預(yù)處理,主要是將每一條評論語句進(jìn)行分詞和詞性標(biāo)注。本研究中利用了中國科學(xué)院計算所開發(fā)的分詞軟件ICTCLAS進(jìn)行。

        (2)在詞性標(biāo)注的語料中,提取出句子中的所有名詞、動詞以及字符,同時過濾停用詞、情感詞,最終形成的結(jié)果作為關(guān)聯(lián)規(guī)則的事務(wù)文件。

        (3)使用關(guān)聯(lián)規(guī)則挖掘的Apriori算法尋找所有的頻繁項(xiàng)集并將其作為候選特征集。

        (4)距離剪枝。在中文評論中,假設(shè)fk是頻繁規(guī)則k項(xiàng)集,表示為 {Q1,Q2,…Qk},評論語句S包含fk,S分完詞也可以表示成詞語序列的形式 {W1,W2,…Wn}。這樣,S包括fk的最短摘要定義為包含fk中所有詞的最短詞語序列,比如從 Wi到Wj(0<i<j≤n)。定義fk的距離為表達(dá)式(1)所示

        式中:S(fk)——fk包含的所有評論語句的集合,length-OfAbs(s,fk)——s中包含fk的最短摘要的長度,Size(S(fk))——集合的大小。

        遍歷所有的頻繁k項(xiàng)集(K>=2)fk,將Dist(fk)>α的項(xiàng)從候選項(xiàng)集中移除,這里α為設(shè)定的一個閾值,本系統(tǒng)中設(shè)置為4。此技術(shù)主要為了找出頻繁出現(xiàn)的短語候選特征。

        (5)冗余過濾。如果某一頻繁項(xiàng)集的所有項(xiàng)被更高的頻繁項(xiàng)集所包含,則將該頻繁項(xiàng)集從候選特征集中刪除。這一步驟主要是為了防止生成冗余的特征。

        (6)還原順序。對于K>=2的頻繁K項(xiàng)集,在生成特征時,還需要考慮其順序。如對于頻繁二項(xiàng)集 {省電、功能},需要確定最終的特征是 “省電功能”還是 “功能省電”。本文的方法是對該頻繁項(xiàng)集在其評論語句中的出現(xiàn)順序進(jìn)行頻次統(tǒng)計,若某種順序出現(xiàn)的頻次大于閾值β,則認(rèn)為是合理的順序,本系統(tǒng)中設(shè)置為3,之所以不直接取頻次最高的是因?yàn)榭赡艽嬖诙喾N順序都是合理的情況。例如:“病毒掃描功能”和 “掃描病毒功能”都是合理的且為同為同一特征,但不同的用戶的表達(dá)不同而已。對于多種順序都合理的情況,選取出現(xiàn)頻次最多的為該特征的標(biāo)準(zhǔn)表示,其余合理的形式為其同義表示加入特征列表中。

        2.2 <特征詞,觀點(diǎn)詞>對識別

        在構(gòu)建出軟件的特征庫后,針對每一條評論語句需要進(jìn)一步識別出其中包含的<特征詞,觀點(diǎn)詞>對。我們通過對真實(shí)軟件評論中出現(xiàn)的特征詞和觀點(diǎn)詞進(jìn)行了觀察分析,發(fā)現(xiàn)特征詞和觀點(diǎn)詞在句子內(nèi)部存在一定的語法關(guān)系。如 “好看的界面,強(qiáng)大的功能,我喜歡”這一評論中,特征詞 “界面”、“功能”分別與觀點(diǎn)詞 “好看”,“強(qiáng)大”形成修飾關(guān)系。因此在句子特征詞已知的情況下,可利用語法關(guān)系識別出對應(yīng)的觀點(diǎn)詞。本文正是通過引入依存句法分析技術(shù)完成<特征詞,觀點(diǎn)詞>對的識別。依存句法主要是通過分析句子內(nèi)部各個語言單位成分的依存關(guān)系來表示句子的句法結(jié)構(gòu)。通過對軟件評論句子的依存關(guān)系仔細(xì)研究,我們得到特征詞和觀點(diǎn)詞的依存關(guān)系主要有如下3種:

        (1)定語結(jié)構(gòu)(amod)。若特征詞出現(xiàn)在句子的定語結(jié)構(gòu)中,則結(jié)構(gòu)中的形容詞即為該特征對應(yīng)的觀點(diǎn)詞。如對于評論語句 “真/d是/vshi一/m 款/n好/a軟件/n”,其中包括了結(jié)構(gòu) “amod(軟件-6,好-5)”,則可以識別出<特征詞,觀點(diǎn)詞>對<軟件,好>。

        (2)主謂結(jié)構(gòu)(nsubj)。評論中有一類語句是特征詞為主語的情況,這時觀點(diǎn)詞一般為謂語或補(bǔ)語。首先遍歷句子中所有出現(xiàn)特征詞的主謂結(jié)構(gòu),若謂語為形容詞,則該形容詞即為修飾該特征詞的觀點(diǎn)詞;若謂語為動詞,還需要繼續(xù)尋找包含該動詞的補(bǔ)語結(jié)構(gòu),將修飾動詞的補(bǔ)語作為該特征對應(yīng)的觀點(diǎn)詞。如表1的兩個例子就對應(yīng)了這兩種情況(ccomp表示補(bǔ)語結(jié)構(gòu))。

        (3)動賓結(jié)構(gòu)(dobj)。除了形容詞能作為觀點(diǎn)詞外,動詞通常也可以用來表達(dá)用戶的情感,如 “喜歡”、“討厭”等。動賓結(jié)構(gòu)就是為了處理特征詞和觀點(diǎn)詞的這一類對應(yīng)關(guān)系。如在評論語句 “比較/d喜歡/vi隱私保護(hù)功能/n,/wd不怕/v別人/rr愉看/v手機(jī)/n”中,就存在結(jié)構(gòu) “dobj(喜歡-2,隱私保護(hù)功能-3)”,因此識別出<隱私保護(hù)功能,手機(jī)>。

        表1 評論中的主謂結(jié)構(gòu)

        我們使用了Stanford Parser[8]的中文自然語言處理工具來得到一個句子的依存關(guān)系,然后基于上述3種結(jié)構(gòu),在已知特征詞的前提下,定位句子中相對應(yīng)的觀點(diǎn)詞,生成<特征詞,觀點(diǎn)詞>對

        2.3 情感極性判斷及強(qiáng)度計算

        為了獲得<特征詞,觀點(diǎn)詞>的極性,需要借助極性詞典。本文所提到的極性詞典主要由三部分構(gòu)成:①基礎(chǔ)極性詞典。直接使用了知網(wǎng)[9]公布出的情感詞匯資源,包含負(fù)面評價詞語(3116個),負(fù)面情感詞語(1254個),正面評論詞語(3730個),正面情感詞語(836個)。②網(wǎng)絡(luò)極性詞典。由于網(wǎng)絡(luò)上的用戶評論中口語化比較普遍,僅僅利用書面的一些觀點(diǎn)詞并不能滿足需求。因此本文構(gòu)建了網(wǎng)絡(luò)極性詞典,它主要由兩部分構(gòu)成,一是從現(xiàn)有的《中國網(wǎng)絡(luò)用語詞典》中挑選了83個觀點(diǎn)詞語。二是從真實(shí)評論語料中,人工隨機(jī)瀏覽500條評論,從中抽取出具有觀點(diǎn)傾向的網(wǎng)絡(luò)詞語。③領(lǐng)域極性詞典。某些詞語只有結(jié)合其使用的領(lǐng)域才能判斷出其表達(dá)的情感極性。如 “大”這個詞,在 “屏幕很大”與 “內(nèi)存占用很大”中就表現(xiàn)出完全相反的極性。本文通過人工的方式,構(gòu)建了一個軟件領(lǐng)域常用的極性詞詞典。

        對于在極性詞典中檢索不到的詞,本文采用了基于知網(wǎng)的極性計算方法[10]。對于某個觀點(diǎn)詞word,其靜態(tài)極性計算如下:

        (1)選取22對褒貶基準(zhǔn)詞。這里基準(zhǔn)詞指褒貶態(tài)度非常明顯,具有代表性的詞語。基本思想就是:與褒義基準(zhǔn)詞聯(lián)系越緊密,則詞語的褒義傾向性越強(qiáng)烈;與貶義基準(zhǔn)詞聯(lián)系越緊密,則詞語的貶義傾向性越強(qiáng)。

        (2)利用選取的基準(zhǔn)詞通過表達(dá)式(2)計算出word的正面接近程度Positive(word)。

        式中:pwi——某個褒義基準(zhǔn)詞,m——褒義基準(zhǔn)詞的個數(shù),Similarity(word,pwi)——利用HowNet計算兩個單個詞之間的相似度結(jié)果。具體而言,就是利用知網(wǎng)計算兩個詞匯義原之間的相似度,并取兩個詞匯義原之間相似度的最大值作為Similarity(word,pwi)的結(jié)果。同理,也可以計算出word負(fù)面接近的程序。

        (3)最終word的極性得分為

        在考慮<特征詞,觀點(diǎn)詞>對的極性強(qiáng)度時,還不能夠忽視程度詞和否定詞的影響。例如對于評論語句 “界面比較好看”,“界面非常好看”,“界面不好看”,抽取出的都為<界面,好看>這一二元關(guān)系對,但前兩句的情感強(qiáng)度是遞增的,最后一句情感極性會反轉(zhuǎn)。顯然,為了更準(zhǔn)確表達(dá)用戶的情感傾向,必須要考慮修飾情感詞的程度副詞和否定副詞。本文總結(jié)了一些常用的程度詞,根據(jù)它們的程度分為了4個級別,賦值從0到1,分別為 {0.2,0.5,0.8,1.0}。否定詞會對句子的情感傾向產(chǎn)生反轉(zhuǎn)的影響,同樣,本文總結(jié)了部分常用的否定詞,建立的常用的否定詞詞典。最終,情感強(qiáng)度的計算為表達(dá)式(4)所示

        式中:Score(senWord)——情感詞senWord的分值,它可以通過查表或式(3)計算。Score(degWord)——程度詞的分值,num表示句子中否定詞的個數(shù),我們知道雙重否定表示肯定,通過句子中否定詞的個數(shù)是奇數(shù)還是偶數(shù)能決定是否發(fā)生反轉(zhuǎn)。但是一般情況下并不能直接取反,例如,“不好看”并不代表 “難看”,“不是不好看”也不并能等價于 “好看”,因此本文設(shè)置否定詞的反轉(zhuǎn)參數(shù)為-0.5。

        3 實(shí)驗(yàn)結(jié)果與分析

        為了驗(yàn)證系統(tǒng)的有效性,本文對系統(tǒng)中使用的關(guān)鍵技術(shù)的效果進(jìn)行了實(shí)驗(yàn)評估。我們選取了Android Market上4款使用較多的軟件的用戶評論評論作為實(shí)驗(yàn)數(shù)據(jù),分別為 “QQ手機(jī)管家”、“搜狗手機(jī)輸入法”、“UC瀏覽器”和“360手機(jī)衛(wèi)士”。

        由于網(wǎng)絡(luò)評論中存在大量的噪音,有很多句子并不是用戶對軟件的評論語句。本文將包含軟件特征的句子設(shè)定為評論句,這樣就濾掉了一部分無用的句子。同時,對于一些結(jié)構(gòu)比較復(fù)雜的句子,進(jìn)行了人工斷句處理。最后通過在這些數(shù)據(jù)集上的實(shí)驗(yàn),和人工標(biāo)注的結(jié)果作對比,得到了方法在特征抽取和極性判斷兩個方面的效果,結(jié)果見表2和表3。

        表2 軟件特征抽取結(jié)果

        表3 特征情感傾向判斷結(jié)果

        從表2可以看到,對于軟件特征抽取結(jié)果,4個數(shù)據(jù)集上的F值都在0.6左右,結(jié)果比較穩(wěn)定。通過進(jìn)一步分析特征抽取錯誤的結(jié)果發(fā)現(xiàn)其主要原因包括以下三點(diǎn):①一些軟件特征為比較復(fù)雜的短語結(jié)構(gòu);②特征之間存在層次關(guān)系,例如 “軟件速度很快”,“雙核殺毒速度很快”,前者的“速度”表示軟件整體運(yùn)行速度,后者的 “速度”為 “雙核殺毒”的速度,而本文并沒有考慮。③一些分詞和詞性標(biāo)注的結(jié)果不準(zhǔn)確。因此,如何挖掘出復(fù)雜短語結(jié)構(gòu)的軟件特征、分析軟件特征之間的層次關(guān)系以及減少分詞錯誤對特征抽取結(jié)果的影響都將是今后進(jìn)一步工作的改進(jìn)方向。

        情感傾向判斷的結(jié)果如表3所示,由于情感傾向判斷是以軟件特征抽取為前提的,因此會存在錯誤的疊加,但通過結(jié)果對比可以看出,情感傾向判斷的F值(0.539)相比于軟件特征抽取的F值(0.616)并沒有低很多,由此可以得到在抽取出的正確的特征上,情感傾向的判斷結(jié)果大都是正確的,這也充分說明了系統(tǒng)的有效性。

        4 結(jié)束語

        如何快速獲取用戶對軟件的滿意度,從而發(fā)現(xiàn)用戶期望,為軟件的改進(jìn)提供依據(jù),一直是軟件開發(fā)者關(guān)注的問題。特別是隨著移動互聯(lián)網(wǎng)的興起,大量移動應(yīng)用的涌現(xiàn),加之移動應(yīng)用軟件版本快速更新的特點(diǎn)使得這一需求更加迫切。為此,本文構(gòu)建了一個中文軟件評論挖掘的系統(tǒng)。系統(tǒng)利用網(wǎng)絡(luò)上用戶的海量評論數(shù)據(jù),通過自然語言處理、機(jī)器學(xué)習(xí)等技術(shù),識別出評論中的軟件特征和用戶對這些特征所表達(dá)的情感傾向,最終通過可視化技術(shù)將結(jié)果進(jìn)行展現(xiàn),方便了開發(fā)者及時了解用戶反饋,從而發(fā)現(xiàn)用戶期望,為軟件的改進(jìn)提供了依據(jù)。同時,通過在Android Market上的測試,驗(yàn)證了系統(tǒng)的有效性。

        當(dāng)然,這個系統(tǒng)還存一些不足的地方,如軟件特征抽取時只考慮了顯示出現(xiàn)的軟件特征;觀點(diǎn)詞識別的效果依賴于句法分析的精度,而目前中文句法分析的技術(shù)還不是很成熟等。這些也將是本系統(tǒng)下一步改進(jìn)的方向。

        [1]Distimo.Google android market[EB/OL] .[2011-11-30].Http://www.distimo.com/appstores/stores/view/19-Google _Android_M(jìn)arket.

        [2]Liu B,Hu M,Cheng J.Opinion observer:Analyzingand comparing opinions on the Web[C]//New York:Proceedings of the 14th International Conference of World Wide Web,2005:342-351.

        [3]Gamon M,Aue A,Corston-oliver S,et al.Pulse:Mining customer opinions from free text[C]//Madrid:The 6th International Symposium on Intelligent Data Analysis,2005:121-132.

        [4]YAO Tianfang.An opinion mining system for chinese automobile reviews[C]//Beijing:Proceedings of the 25th Chinese Information Processing Society,2006:260-281(in Chinese).[姚天昉.一個用于漢語汽車評論的意見挖掘系統(tǒng)[C]//北京:中國中文信息學(xué)會二十五周年學(xué)術(shù)會議,2006:260-281.]

        [5]Hu Minqing,Liu Bing.Opinion extraction and summarization on the web[C]//Boston:Proceedings of the National Conference on Artificial Intelligence,2006:1621-1624.

        [6]LI Shi,LI Qiushi.Research on pruning algorithm of product feature mining in Chinese review[J].Computer Engineering,2011,37(23):43-45(in Chinese).[李實(shí),李秋實(shí).中文評論中產(chǎn)品特征挖掘的剪枝算法研究[J].計算機(jī)工程,2011,37(23):43-45.]

        [7]LI Shi,LI Qiushi.Improving the performance of features extraction from Chinese customer reviews[C]//Hong Kong:The 2th International Conference on Communication Systems,Networks and Applications,2010:26-29.

        [8]Stanford Parser web page[EB/OL].[2012-01-10].http://nlp.stanford.edu.software/lex-parser.shtml.

        [9]DONG Zhendong,Dong Qiang.HowNet[EB/OL].[2012-02-01].Http://www.keenage.com(in Chinese).[董振東,董強(qiáng).知網(wǎng)[OL].[2012-02-01].Http://www.keenage.com.]

        [10]ZHU Yanlan.Semantic orientation computing based on HowNet[J].Journal of Chinese Information Processing,2006,20(1):14-20(in Chinese).[朱嫣嵐.基于HowNet的詞匯語義傾向計算[J].中文信息學(xué)報,2006,20(1):14-20.]

        猜你喜歡
        特征詞極性觀點(diǎn)
        跟蹤導(dǎo)練(四)
        基于改進(jìn)TFIDF算法的郵件分類技術(shù)
        觀點(diǎn)
        產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
        表用無極性RS485應(yīng)用技術(shù)探討
        一種新型的雙極性脈沖電流源
        面向文本分類的特征詞選取方法研究與改進(jìn)
        業(yè)內(nèi)觀點(diǎn)
        營銷界(2015年22期)2015-02-28 22:05:04
        新銳觀點(diǎn)
        清風(fēng)(2014年10期)2014-09-08 13:11:04
        關(guān)于“方言特征詞”理論的回顧及思考
        在线观看免费人成视频国产| 柠檬福利第一导航在线| 免费观看又污又黄的网站| 午夜精品一区二区三区无码不卡| 国产喷白浆精品一区二区豆腐 | 一道本加勒比在线观看| 成年女人免费v片| 白天躁晚上躁麻豆视频| 国产免费网站看v片元遮挡| 日韩精品综合在线视频| 真实夫妻露脸自拍视频在线播放 | 久久精品国产亚洲片| 国产精品视频白浆免费视频| 成在线人av免费无码高潮喷水 | 亚洲图片日本视频免费| 日本欧美国产精品| 精品无码AV无码免费专区| 日本高清二区视频久二区| 一区二区视频在线观看地址| 丁香六月久久婷婷开心| 亚洲精品中文字幕无乱码麻豆 | 亚洲av无码一区二区乱子伦as| 久久久高清免费视频| 青青草手机视频免费在线播放| 成年站免费网站看v片在线| 1000部精品久久久久久久久| 亚洲国产精品免费一区| 人妻少妇中文字幕久久| 99久久国产综合精品五月天| 日韩精品国产自在欧美| 亚洲美女一区二区三区三州| 久久精品国产自在天天线| 巨大欧美黑人xxxxbbbb| 日韩精品一二区在线视频| 中文字幕在线亚洲三区| 国产成人午夜精华液| 国产精品亚洲综合天堂夜夜| 加勒比婷婷色综合久久| 国产一区二区三区四区五区加勒比| 亚洲a∨天堂男人无码| 激情免费视频一区二区三区|