亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多種自然語言的商品評論情感傾向性分析系統(tǒng)

        2019-05-10 09:52:46劉思佳華南師范大學(xué)計算機(jī)學(xué)院
        數(shù)碼世界 2019年4期
        關(guān)鍵詞:傾向性文檔預(yù)處理

        劉思佳 華南師范大學(xué)計算機(jī)學(xué)院

        引言

        互聯(lián)網(wǎng)的快速發(fā)展推動了電子商務(wù)的不斷普及,依托于電商平臺的商品不斷興起,而商品帶來的商品評論中的情感傾向性分析逐漸成為當(dāng)前的研究熱點。本系統(tǒng)的目的是通過充分挖掘網(wǎng)上豐富的評論資源,研究并創(chuàng)建一個具有實用性的互聯(lián)網(wǎng)商品評價情感分析系統(tǒng)。此系統(tǒng)能夠自動分析來自互聯(lián)網(wǎng)的海量評論,同時分析結(jié)果的表達(dá)方式也因顧客的需求有所不同,這樣可以對商品的市場反饋進(jìn)行分析,為生產(chǎn)商提供熱銷品的類別,同時也幫助顧客對商品進(jìn)行了篩選。

        1 市場需求

        面對如此所參差不齊的評論,商品的生產(chǎn)商或服務(wù)的提供商無法提供精準(zhǔn)滿足客戶需要的商品,從而在生產(chǎn)的過程中做了很多無用功。而依據(jù)本文設(shè)計的系統(tǒng)生產(chǎn)商和服務(wù)商能夠及時了解本企業(yè)所提供的商品或服務(wù)的反饋信息,為改善產(chǎn)品性能、提高服務(wù)質(zhì)量贏得更快和更有效的機(jī)遇,這相當(dāng)于為企業(yè)節(jié)約了大量的市場調(diào)研和市場反饋信息獲取的成本,間接地加快了企業(yè)產(chǎn)品、服務(wù)升級的進(jìn)程。

        2 系統(tǒng)模塊

        圖1 系統(tǒng)框架示意圖

        2.1 網(wǎng)頁評論自動獲取與預(yù)處理

        2.1.1 自動獲取評論內(nèi)容

        為了提高程序運行速度、可讀性,提高編寫抓取程序的效率,本文運用了python的擴(kuò)展庫lxml以及xpath。XPath可用來在XML文檔中對元素和屬性進(jìn)行遍歷,可以在XML文檔中查找信息。而lxml庫則可以快速正確地分析xml文檔。將HTML看成是XML的特殊形式,所以可以使用Xpath來表示一個評論在此HTML文檔中的具體位置,并且xpath可以使用工具自動生成,保證了準(zhǔn)確率和效率。此后使用lxml提供的方法,可以高效的提取出需要的信息。

        2.1.2 預(yù)處理

        經(jīng)過自動獲取評論內(nèi)容這個步驟之后,后續(xù)重要的一步是進(jìn)行預(yù)處理。預(yù)處理包含兩個步驟,第一,去除噪音字符。此外,重復(fù)的標(biāo)點符號再這一步也應(yīng)該相應(yīng)的去除。由于抽取出的文本不含結(jié)構(gòu)化信息,是自然文本,所以如果存在兩個相同的標(biāo)點,“斷句”處理勢必會造成錯誤,影響進(jìn)一步的分析。此外空行空格也要去除。第二,“斷句”和“分詞”。漢語中要想表達(dá)一個完整的意思,最小的組成單位是一個句子,所以關(guān)鍵詞的選取必須要以“句”為基礎(chǔ),之后再逐個分析句中詞匯,若斷句或分詞錯誤,勢必影響系統(tǒng)的最終結(jié)果。所以預(yù)處理是整個系統(tǒng)的前提,也是關(guān)鍵。

        2.2 自然語言處理技術(shù)抽取文本的語義信息

        在日然語言處理過程中涉及的基本問題是詞性標(biāo)注和分詞,但因為語言的復(fù)雜性,甚多情況下文本信息的提取有偏差,基于以上存在的問題,對文本進(jìn)行語義理解和語法結(jié)構(gòu)分析的時候采用了更為先進(jìn)的自然語言處理技術(shù)。為了達(dá)到更高的句中感情細(xì)膩度的表達(dá),首先對評價對象的特征進(jìn)行了挖掘,并進(jìn)一步找出其對應(yīng)的情感詞,舉例來說評價對象為餐廳的話,其特征就有環(huán)境、服務(wù)、餐飲等。

        3 研究成果

        本項目基于自然語言處理,機(jī)器學(xué)習(xí)技術(shù),使用文本傾向性分析技術(shù),自動分析提取評論關(guān)鍵內(nèi)容,為用戶量身定制商品特征分類規(guī)則,顏色標(biāo)記評論關(guān)鍵信息,評論結(jié)果以圖形形式顯示,最終設(shè)計并實現(xiàn)商品評論傾向性分析系統(tǒng)。使得用戶可以快速獲取海量評論信息的真正價值,其分析結(jié)果只管、清晰、界面友好。可根據(jù)用戶需要對商品特征進(jìn)行歸類,對于類似商品的比對功能可以給用戶提供方便,使得用戶在選購商品時更加科學(xué)、高效、方便。

        猜你喜歡
        傾向性文檔預(yù)處理
        基于模糊數(shù)學(xué)法的阿舍勒銅礦深部巖體巖爆傾向性預(yù)測
        有人一聲不吭向你扔了個文檔
        基于預(yù)處理MUSIC算法的分布式陣列DOA估計
        基于RI碼計算的Word復(fù)制文檔鑒別
        淺談PLC在預(yù)處理生產(chǎn)線自動化改造中的應(yīng)用
        關(guān)于醫(yī)患沖突報道的傾向性分析——以“湘潭產(chǎn)婦死亡案”為例
        Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
        絡(luò)合萃取法預(yù)處理H酸廢水
        “沒準(zhǔn)兒”“不一定”“不見得”和“說不定”的語義傾向性和主觀性差異
        語言與翻譯(2015年4期)2015-07-18 11:07:43
        基于自適應(yīng)預(yù)處理的改進(jìn)CPF-GMRES算法
        波多野结衣av一区二区全免费观看| 亚洲免费无毛av一区二区三区| 国产成人av一区二区三| 国产精品一区二区三区专区| 久久久久成人片免费观看蜜芽| 国产羞羞视频在线观看| 亚洲国产无套无码av电影| 国产精品白浆一区二区免费看| 国产精品欧美成人片| 日韩人妖干女同二区三区| 国产色欲av一区二区三区 | 国产在线精品一区二区不卡| 无码伊人66久久大杳蕉网站谷歌| 亚洲三级香港三级久久| 亚洲午夜久久久久久久久电影网 | 天天爽夜夜爽夜夜爽| 国产成人精品日本亚洲18| 国产精品亚洲婷婷99久久精品 | 综合久久久久6亚洲综合| 日韩在线不卡一区三区av| 精品成在人线av无码免费看| 人妻在卧室被老板疯狂进入国产| 天堂女人av一区二区| 一区二区亚洲精品在线| 日日碰狠狠添天天爽无码| 中文人妻无码一区二区三区信息| 国产午夜在线观看视频| 欧美xxxxx在线观看| 国产乱妇乱子视频在播放| 久久久久久人妻一区精品| 亚洲国产天堂久久综合网| 狠狠色婷婷久久一区二区三区 | 久久水蜜桃亚洲av无码精品麻豆| av无码天堂一区二区三区| 青青草在线免费观看视频| 国产成人午夜无码电影在线观看| 欧美一级欧美一级在线播放| 色婷婷亚洲一区二区在线| 性欧美丰满熟妇xxxx性久久久| 亚洲av无码片在线观看| 久久九九有精品国产尤物|