亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于產(chǎn)品評論的消費(fèi)者偏好模型構(gòu)建研究

        2019-02-12 02:03:44胡龍茂胡戴新
        長春大學(xué)學(xué)報(bào) 2019年12期
        關(guān)鍵詞:短語特征用戶

        胡龍茂,胡戴新

        (1.合肥工業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,合肥 230601;2.安徽財(cái)貿(mào)職業(yè)學(xué)院,合肥 230601)

        隨著網(wǎng)購市場交易規(guī)模不斷增長,消費(fèi)者發(fā)表的購后評論也越來越多。海量的評論信息無論對消費(fèi)者還是企業(yè)來說都是可以開發(fā)和利用的寶貴資源。對于企業(yè)來說,消費(fèi)者對產(chǎn)品以及產(chǎn)品具體特征的評價(jià),往往隱含消費(fèi)者對產(chǎn)品特征的某種偏好。在競爭日趨激烈的環(huán)境下,只有掌握消費(fèi)者具體偏好哪些特征,企業(yè)才能制定相應(yīng)的差異化營銷策略,從而提升產(chǎn)品的辨識度及競爭力。

        目前,很多學(xué)者采用自然語言處理技術(shù)對產(chǎn)品評論進(jìn)行細(xì)粒度挖掘,利用各種方法從評論中抽取“產(chǎn)品特征─評價(jià)短語”對(也稱評價(jià)單元)。Hu等人[1]首次提出應(yīng)用關(guān)聯(lián)規(guī)則方法提取英文評論中的產(chǎn)品特征,并將產(chǎn)品特征附近的形容詞作為評價(jià)詞。后續(xù)研究者結(jié)合詞性、語法及句法提煉抽取規(guī)則,識別評論中的評價(jià)單元[2-4]。由于受制于評論的口語化及隨意性,上述基于規(guī)則的方法的抽取精度很難得到進(jìn)一步提升,不少學(xué)者嘗試使用監(jiān)督方法進(jìn)行抽取。學(xué)者們大多從詞、詞性、語法及語義等角度提取特征,利用條件隨機(jī)場(CRF)抽取評價(jià)單元[5-7]。胡新明[8]在利用模板抽取評價(jià)單元的基礎(chǔ)上,進(jìn)一步利用情感詞典計(jì)算偏好程度,構(gòu)建了用戶偏好矩陣,實(shí)驗(yàn)結(jié)果表明,由偏好矩陣計(jì)算出的偏好值和用戶評分之間沒有顯著差異。

        現(xiàn)有研究主要集中于評價(jià)單元的抽取,針對消費(fèi)者偏好的研究極少,且文獻(xiàn)[8]用產(chǎn)品特征的評價(jià)均值來度量消費(fèi)者偏好的方法和我們的觀察不符。如有以下用戶評論:

        例1電池中度使用也可以用一天半左右,就是有點(diǎn)發(fā)熱!值得購買!4.0分

        例2機(jī)子是個(gè)裸機(jī),是低端版的,價(jià)錢稍貴。電池不怎么耐用,一天要充兩回電。好在機(jī)子速度不錯,也是正品,贊!5.0分

        在例1中可以抽取的產(chǎn)品特征、評價(jià)短語及評價(jià)值(量化為1~5分)為<電池,一天半左右,4><發(fā)熱,有點(diǎn),2>,按照文獻(xiàn)[8]的方法,用戶評論的評分應(yīng)為3分,而實(shí)際上用戶給出的評分為4分。在例2中,可抽取<價(jià)錢,稍貴 2><電池,不怎么耐用,2><速度,不錯 4>,按照文獻(xiàn)[8]的方法,用戶評論的評分應(yīng)為3分,但用戶評分為5分。分析以上兩個(gè)例子,我們發(fā)現(xiàn),用戶并不會同等看待所有產(chǎn)品特征,而是對某些特征有所偏好,從而對產(chǎn)品進(jìn)行總體評分時(shí)會將偏好的特征賦予較大的權(quán)重。如例1的用戶偏好“電池”;例2的用戶明顯偏好“速度”。因此,提出一種新的方法從產(chǎn)品評論中挖掘消費(fèi)者偏好。首先,從產(chǎn)品評論中挖掘產(chǎn)品特征、特征評價(jià)值及消費(fèi)者信息。然后,利用Logistic回歸構(gòu)建消費(fèi)者偏好模型,并實(shí)證考察不同消費(fèi)人群的偏好信息。

        1 模型構(gòu)建框架及關(guān)鍵技術(shù)

        通過網(wǎng)絡(luò)爬蟲從B2C電子商務(wù)網(wǎng)站中抓取某種產(chǎn)品的所有評論信息,從評論中挖掘出產(chǎn)品特征、產(chǎn)品特征評價(jià)值(通過將特征對應(yīng)的觀點(diǎn)及強(qiáng)度轉(zhuǎn)化為具體的數(shù)值得到)以及消費(fèi)者的信息,最后利用二元Logistics回歸分析確定不同類別消費(fèi)者關(guān)于產(chǎn)品特征的偏好。系統(tǒng)的總體框架如圖1所示。

        圖1 產(chǎn)品評論中消費(fèi)者偏好模型構(gòu)建框架

        1.1 評論文本抓取

        主流的電商網(wǎng)站有京東、天貓、蘇寧和亞馬遜等,前三家均存在好評返現(xiàn)等情況,評論的可信度不高,而亞馬遜更注重評論的真實(shí)性和質(zhì)量,因而編寫網(wǎng)絡(luò)爬蟲從亞馬遜中國網(wǎng)站爬取某熱門手機(jī)的評論信息,包括用戶鏈接、評論文本和評分。為識別消費(fèi)者信息,抽取評論中的用戶鏈接,根據(jù)用戶鏈接爬取此用戶發(fā)表的所有商品評論信息(包括用戶名以及每條商品評論的商品名、評論標(biāo)題、評論文本)。由于在后續(xù)消費(fèi)者偏好的挖掘處理中,消費(fèi)者的性別及產(chǎn)品特征的評價(jià)值均通過機(jī)器學(xué)習(xí)得到,故分別抓取同一廠商熱銷的兩款手機(jī)評論數(shù)據(jù)(分別稱為A款和B款),其中A款評論數(shù)據(jù)用于模型訓(xùn)練,B款評論數(shù)據(jù)用于預(yù)測。以A款評論數(shù)據(jù)為例,包括A款手機(jī)評論文本、評分及A款手機(jī)用戶發(fā)表的所有評論信息。

        1.2 消費(fèi)者性別識別

        消費(fèi)者的昵稱、購買的商品名稱、評論標(biāo)題或文本中指示身份的詞語、評論文本的用詞習(xí)慣等都會隱含指示消費(fèi)者的信息[9]。人工對用戶發(fā)表的所有評論進(jìn)行閱讀,標(biāo)注性別信息,以文獻(xiàn)[9]中的方法抽取特征,采用最大熵方法建模,然后用模型預(yù)測未標(biāo)注的用戶性別。

        1.3 評價(jià)單元抽取及評價(jià)賦值

        1.3.1 評價(jià)單元抽取

        評價(jià)單元的抽取主要包括兩種方法:一是基于規(guī)則模板的方法,這種方法無須人工標(biāo)注數(shù)據(jù),但抽取精度不太高;另一種是基于條件隨機(jī)場的方法,該方法需要人工標(biāo)注語料,如果能夠構(gòu)造好的特征,往往能取得不錯的抽取精度。由于抽取精度是關(guān)系到后續(xù)偏好識別的關(guān)鍵步驟,本文采用CRF方法。對評論文本進(jìn)行分詞和詞性標(biāo)注,在特征選取中除采用傳統(tǒng)的詞及詞性特征外,提取相關(guān)詞、句首距離、后指轉(zhuǎn)折詞及前指副詞4種語義特征,并在CRF抽取評價(jià)單元的基礎(chǔ)上,對孤立的產(chǎn)品特征采用Stanford NLP依存句法分析,抽取其對應(yīng)的評價(jià)短語。4種語義特征如下所示。

        (1)如果中的相關(guān)詞一個(gè)詞是產(chǎn)品特征詞,則與其相關(guān)度高的詞很有可能也是產(chǎn)品特征詞。利用擴(kuò)展同義詞林計(jì)算兩個(gè)詞語的相似度[10],再計(jì)算詞語的語素相似度[11],將二者結(jié)合,形成詞語的相似度,公式如下:

        (1)

        式中NS(w1,w2)表示兩個(gè)詞的相似度,CS(w1,w2)為詞林相似度,MS(w1,w2)為語素相似度。

        產(chǎn)品特征主要由名詞和名詞詞組組成,利用相似度計(jì)算名詞相關(guān)詞的公式如下:

        RWlist(w1)={w2|NS(w1,w2)≥λ,

        (2)

        式中λ代表閾值(通過實(shí)驗(yàn)調(diào)整優(yōu)化,最終設(shè)置為0.5)。統(tǒng)計(jì)每個(gè)名詞在評論中出現(xiàn)的頻次,取相關(guān)詞列表中頻次最高的詞為當(dāng)前詞的相關(guān)詞。

        (2)句首距離。用戶往往采用開門見山的方式對某個(gè)產(chǎn)品特征進(jìn)行評價(jià)[12],這使得在分句句首或離分句句首很近的詞成為產(chǎn)品特征的可能性增大。如分詞后的用戶評論“手機(jī)反應(yīng)還一般吧,外形不錯”中存在“反應(yīng)”“外形”兩個(gè)產(chǎn)品特征,其中“反應(yīng)”的句首距離為2,“外形”的句首距離為1。

        (3)后指轉(zhuǎn)折詞。轉(zhuǎn)折詞表明用戶會對某個(gè)產(chǎn)品特征持有負(fù)面評價(jià)。常見的轉(zhuǎn)折詞有“就是”“只是”等。

        (4)前指副詞?!耙病薄岸肌薄安弧薄按_實(shí)”和“真的”等副詞后面往往是評價(jià)語,其前面往往是所評價(jià)的產(chǎn)品特征。

        采用上述特征對CRF模型進(jìn)行訓(xùn)練,然后用訓(xùn)練后的模型對評論進(jìn)行標(biāo)注,標(biāo)注結(jié)果中包含產(chǎn)品特征和評價(jià)短語。如果產(chǎn)品特征附近有評價(jià)短語,則配對成評價(jià)單元;否則,產(chǎn)品特征成為孤立產(chǎn)品特征。采用文獻(xiàn)[7]中提出的nsubj關(guān)系抽取孤立產(chǎn)品特征對應(yīng)的評價(jià)詞,然后將與評價(jià)詞依存關(guān)系為advmod和neg的詞抽取作為評價(jià)詞的修飾詞,最后將評價(jià)詞和修飾詞組成評價(jià)短語。

        由于用戶評論存在隨意性(如沒有斷句)和口語化現(xiàn)象,一些產(chǎn)品特征未能被CRF模型識別。將CRF模型識別超過一定次數(shù)的產(chǎn)品特征作為頻繁特征,在評論文本中進(jìn)行查找,如果未被CRF模型標(biāo)注,則進(jìn)行標(biāo)注,并按依存關(guān)系抽取其后的評價(jià)短語,構(gòu)成遺漏的頻繁評價(jià)單元。

        經(jīng)上述抽取過程,我們能夠抽取到顯式的評價(jià)單元。然而,用戶評論中還存在一些隱式評價(jià)單元,如在評論“便宜,配置不低,細(xì)節(jié)之處還有提升的空間”中,便宜指的是價(jià)格,評論中存在隱式評價(jià)單元<價(jià)格,便宜>。中文詞語之間存在固定的搭配關(guān)系,特定的形容詞往往只會修飾固定的幾個(gè)名詞[13],如在手機(jī)評論語料中,與形容詞“好”經(jīng)常搭配的名詞有“手感”“信號”和“質(zhì)量”。抽取評價(jià)短語中的形容詞(即評價(jià)詞),將相同評價(jià)詞修飾的產(chǎn)品特征歸集到一起,統(tǒng)計(jì)出現(xiàn)頻率最高的產(chǎn)品特征,如果頻率超過某個(gè)閾值,將此產(chǎn)品特征作為此評價(jià)詞默認(rèn)評價(jià)的產(chǎn)品特征。在標(biāo)注后的評論句中查找評價(jià)詞,如果評價(jià)詞前面沒有產(chǎn)品特征,則將評價(jià)詞前面最近的名詞作為產(chǎn)品特征,然后將評價(jià)詞前面的副詞作為評價(jià)詞修飾詞,從而形成隱式評價(jià)單元。

        1.3.2 合并同類產(chǎn)品特征

        由于用戶表述習(xí)慣不同,相同的產(chǎn)品特征會用不同的詞語表示,如“價(jià)格”還會說成“價(jià)錢”和“價(jià)位”。另外,用戶還會對同類特征的不同方面進(jìn)行評價(jià),如對于“外觀”,可能的評價(jià)有“正面”“背面”或“側(cè)面”。為減少特征的稀疏性,需對同類產(chǎn)品特征進(jìn)行合并。為保證后續(xù)偏好分析的精度,采用人工方式對同類產(chǎn)品特征進(jìn)行合并。

        1.3.3 特征評價(jià)值

        用戶對產(chǎn)品特征的評價(jià)不但有極性,還有強(qiáng)度上的差異。極性詞通常為形容詞(如“好”),也包括少數(shù)動詞(如“喜歡”)。強(qiáng)度詞通常為程度副詞,如“非?!钡?。用知網(wǎng)情感詞典和評價(jià)詞典標(biāo)注評價(jià)短語中的評價(jià)詞,正面評價(jià)詞標(biāo)注為1,負(fù)面評價(jià)詞標(biāo)注為-1;對于未出現(xiàn)在知網(wǎng)情感詞典中的評價(jià)詞,人工標(biāo)注其情感傾向。在文獻(xiàn)[14]的基礎(chǔ)上,將情感強(qiáng)度詞設(shè)置如表1所示。

        表1 情感強(qiáng)度詞

        評價(jià)短語的情感分計(jì)算公式如下所示:

        特征評價(jià)值=程度級別×極性

        (3)

        根據(jù)式(3)計(jì)算得出評價(jià)值后,仿照用戶評分,將評價(jià)值離散化為5個(gè)等級如公式(4)所示。

        (4)

        式中,score_dfea表示離散化的評價(jià)值,scorefea表示未離散化的評價(jià)值。

        1.4 Logistics回歸

        Logistics回歸模型是一種對二分類因變量 (因變量取值有1或0兩種可能) 進(jìn)行回歸分析時(shí)經(jīng)常采用的非線性分類統(tǒng)計(jì)方法[15]。借助該模型能夠分析多個(gè)自變量(連續(xù)變量或分類變量)與一個(gè)二分類因變量變化的依存關(guān)系[16]。公式如下所示:

        (5)

        式中:P為事件(用戶的評分為好評)發(fā)生的概率;x1,x2,…,xk為自變量,表示特征評價(jià)值(1~5分);β0為截距;β1,β2,…,βk為回歸系數(shù)。由于自變量都是同量綱的,回歸系數(shù)越大,其對應(yīng)的自變量對因變量的貢獻(xiàn)越大,故回歸系數(shù)可以看成是消費(fèi)者對產(chǎn)品特征的偏好系數(shù)。

        2 實(shí)驗(yàn)結(jié)果與分析

        2.1 數(shù)據(jù)環(huán)境及數(shù)據(jù)集

        為驗(yàn)證模型的有效性,編寫網(wǎng)絡(luò)爬蟲從亞馬遜中國網(wǎng)站爬取某國產(chǎn)手機(jī)廠商兩款(分別稱為A款和B款)暢銷產(chǎn)品的用戶評論,并且對于每條用戶評論,爬取此用戶對所購其他產(chǎn)品的評論。評論數(shù)據(jù)中共包含A款手機(jī)評論1 169條(對應(yīng)爬取此1 169個(gè)用戶對于其他產(chǎn)品的評論)。B款手機(jī)評論1 033條(對應(yīng)爬取此1 033個(gè)用戶對于其他產(chǎn)品的評論),A款手機(jī)評論用于評價(jià)單元識別模型的構(gòu)建;A款手機(jī)用戶對其他產(chǎn)品的評論用于性別識別模型的構(gòu)建,B款手機(jī)評論及B款手機(jī)用戶對其他產(chǎn)品的評論用于從構(gòu)建好的模型抽取評價(jià)單元及識別用戶性別。

        實(shí)驗(yàn)所用編程語言采用python,自然語言處理工具采用Stanford NLP,條件隨機(jī)場采用CRF++0.58,Logistics回歸分析采用SPSS 20。

        2.2 用戶性別識別

        采用A款手機(jī)評論數(shù)據(jù),按文獻(xiàn)[9]構(gòu)建最大熵模型,利用此模型識別B款手機(jī)評論中1 033個(gè)用戶的性別,其中女性用0表示,男性用1表示。

        2.3 評價(jià)單元抽取

        采用A款手機(jī)評論數(shù)據(jù),構(gòu)建2.3.1節(jié)提出的CRF評價(jià)單元識別模型,在B款手機(jī)評論中,共識別出評價(jià)單元586個(gè)。將出現(xiàn)次數(shù)超過3次的產(chǎn)品特征作為頻繁特征,再次在評論文本中進(jìn)行標(biāo)注和識別,共識別遺漏的評價(jià)單元354個(gè)。

        將上兩步抽取的評價(jià)單元中的評價(jià)短語分類,統(tǒng)計(jì)評價(jià)詞對應(yīng)的產(chǎn)品特征的頻次,表2顯示了出現(xiàn)10個(gè)常見評價(jià)詞對應(yīng)的頻率最高的三個(gè)產(chǎn)品特征。

        表2 評價(jià)詞對應(yīng)的頻率最高的三個(gè)產(chǎn)品特征

        設(shè)置出現(xiàn)頻率超過30%的產(chǎn)品特征為評價(jià)詞對應(yīng)的默認(rèn)產(chǎn)品特征,如表2中粗體所示。按照默認(rèn)產(chǎn)品特征,從評論文本中抽取了評價(jià)單元137對。

        經(jīng)過上述三個(gè)步驟,從評論文本中共獲得評價(jià)單元1 077個(gè),其中共評價(jià)了102個(gè)產(chǎn)品特征。人工識別同類產(chǎn)品特征,共識別為16類,分別為:運(yùn)行、外觀、電池、屏幕、質(zhì)量、拍照、性價(jià)比、發(fā)熱、價(jià)格、信號、系統(tǒng)、手感、配置、音質(zhì)、功能、通話。在人工識別時(shí)發(fā)現(xiàn),“系統(tǒng)”存在兩種含義,一種是“操作系統(tǒng)”(評價(jià)詞為“人性化”“好用”或其反義詞等),仍將其標(biāo)識為“系統(tǒng)”;另一種是“運(yùn)行”(評價(jià)詞為“快”“流暢”或其反義詞等),將其重新標(biāo)識為“運(yùn)行”。表3顯示了部分同類產(chǎn)品特征。

        表3 部分同類產(chǎn)品特征

        按照公式(3)計(jì)算出產(chǎn)品特征的評價(jià)值。統(tǒng)計(jì)產(chǎn)品特征出現(xiàn)的次數(shù)及評價(jià)均值,如圖2所示。

        圖2 產(chǎn)品特征出現(xiàn)次數(shù)及評價(jià)均值

        從圖2中可以看出,用戶評價(jià)次數(shù)最多的產(chǎn)品特征依次為“運(yùn)行”“外觀”和“電池”,評價(jià)次數(shù)最少的產(chǎn)品特征依次為“通話”“功能”和“音質(zhì)”。評價(jià)均值較高的產(chǎn)品特征依次為“性價(jià)比”“運(yùn)行”和“手感”,評價(jià)均值較低的產(chǎn)品特征依次為“質(zhì)量”“發(fā)熱”和“音質(zhì)”。用戶的評價(jià)值和手機(jī)廠商的產(chǎn)品宣傳還是比較一致的,此款手機(jī)為華為的千元級智能手機(jī),主打性價(jià)比和運(yùn)行的流暢性,對音質(zhì)沒有過多的訴求。由于主打性價(jià)比,限制了設(shè)計(jì)和軟硬件成本,質(zhì)量較難管控,導(dǎo)致用戶對質(zhì)量評價(jià)較低,用戶反映最多的為“黑屏”“死機(jī)”和“按鍵失靈”。

        2.4 模型構(gòu)建和分析

        從評價(jià)單元的抽取結(jié)果中可以看出,不少用戶只是對產(chǎn)品給出總體評價(jià)而沒有針對具體的產(chǎn)品特征展開評價(jià),還有少數(shù)用戶使用混合評價(jià),既對產(chǎn)品特征評價(jià),也對服務(wù)(如快遞、電商平臺)展開評價(jià)。在這兩種評價(jià)中,用戶給出的評分不是(或不純粹是)產(chǎn)品特征評價(jià)的綜合,在構(gòu)建偏好模型時(shí)需要丟棄。通過丟棄上述兩種評價(jià),共獲得用于構(gòu)建偏好模型的有效評論521條,評價(jià)單元1 027個(gè)。

        用戶通常只會評價(jià)比較關(guān)注的特征,如果某類特征出現(xiàn)次數(shù)較少,說明用戶關(guān)注度較低,不宜放到偏好模型中。取出現(xiàn)次數(shù)超過10%的特征作為常見特征,包含運(yùn)行、外觀、電池、屏幕、質(zhì)量、拍照、性價(jià)比和發(fā)熱共8個(gè)特征。觀察發(fā)現(xiàn),即使是用戶關(guān)注度較高的8個(gè)常見特征,也存在很多缺失值。因此,用戶如果對某個(gè)常見特征沒有作出顯式評價(jià),表明其態(tài)度為不置可否,由于本文中正面評價(jià)取值為1,負(fù)面評價(jià)值為-1,故可將用戶沒有評價(jià)的產(chǎn)品特征的評價(jià)值設(shè)置為0。補(bǔ)充缺失值后,按照公式(4)將評價(jià)值離散化為1~5分。為便于Logistics回歸分析,將用戶評分二值化,參照亞馬遜中國網(wǎng)站的設(shè)置,將評分小于等于3分作為差評(用0表示),4分及5分作為好評(用1表示)。用戶性別及評分的統(tǒng)計(jì)數(shù)據(jù)如表4所示。

        表4 用戶性別及評分分布

        將八個(gè)常見產(chǎn)品特征的評價(jià)值(分別用x1~x8表示)和用戶性別(x9)作為自變量,將二值化的用戶評分作為因變量,利用SPSS 20進(jìn)行二元Logistics回歸分析,自變量的加入方式采用向前步進(jìn),獲得全體用戶的Logistics模型如式(5)所示:

        logit(P)=-25.103+1.136x1+0.839x2+1.264x3+1.197x4+2.959x5+1.321x8,

        (5)

        從式(5)中可以看出,拍照(x6)、性價(jià)比(x7)和性別(x9)在模型中不顯著,而質(zhì)量(x5)、發(fā)熱(x8)和電池(x3)的系數(shù)最大??傮w而言,用戶最為偏好質(zhì)量,其次為發(fā)熱情況,再次為電池,而拍照、性價(jià)比和性別對評分的影響不大。

        提取女性用戶的數(shù)據(jù),嘗試建立女性用戶的偏好模型。由于女性用戶的差評數(shù)據(jù)為31條(見表4),而在Logistics回歸模型中,為保證統(tǒng)計(jì)意義,每個(gè)水平的數(shù)據(jù)應(yīng)至少為自變量個(gè)數(shù)的10倍[17],故選取最常見特征中的3個(gè)作為自變量構(gòu)建模型,結(jié)果如式(6)所示:

        logit(P)=-14.498+1.789x1+1.120x3+2.281x5,

        (6)

        類似地,提取男性用戶的數(shù)據(jù),將前5個(gè)最常見的產(chǎn)品特征作為自變量,構(gòu)建男性用戶偏好模型如公式(7)所示:

        logit(P)=-16.103+1.124x1+1.485x3+3.111x5,

        (7)

        從式(6)和式(7)可以看出,女性用戶和男性用戶的共同點(diǎn)是最為偏好質(zhì)量(x5)。其差異為女性用戶除質(zhì)量外,更為偏好運(yùn)行(x1),其次才是電池(x3);而男性用戶除質(zhì)量外,更為偏好電池(x3),其次為運(yùn)行(x1)。模型的差異反映出女性用戶偏感性,偏好手機(jī)運(yùn)行更加流暢,這也可能是蘋果手機(jī)吸引女性用戶的一個(gè)主要原因,而男性用戶更看重電池是否耐用,這也可能是與男性用戶出門攜帶物品力求精簡有關(guān)。

        2.5 建議

        B款手機(jī)的廠家應(yīng)嚴(yán)把質(zhì)量關(guān),提升品控能力,讓用戶用得放心;另外,廠家還應(yīng)改進(jìn)設(shè)計(jì),提高手機(jī)的散熱效果。分用戶群體來說,此款手機(jī)的主要用戶為男性,為提升用戶體驗(yàn),應(yīng)適當(dāng)提高電池容量或減少系統(tǒng)的耗電量,使得用戶不再為充電而焦慮,將電池性能作為主要賣點(diǎn)著力宣傳;雖然女性群體用戶只占約五分之一,但女性的消費(fèi)能力強(qiáng),如果希望獲得女性用戶的青睞,應(yīng)優(yōu)化系統(tǒng)設(shè)計(jì),使得運(yùn)行更加流暢,有效宣傳給女性用戶。

        3 結(jié)語

        本文首先采用CRF模型抽取評價(jià)單元、頻繁特征抽取遺漏評價(jià)單元、評價(jià)詞抽取隱式評價(jià)單元3種方法,從評論中抽取評價(jià)單元,利用情感詞典計(jì)算評價(jià)短語的情感分,然后在獲得用戶的所有評論的基礎(chǔ)上構(gòu)建最大熵模型識別用戶性別,最后以常見產(chǎn)品特征為自變量、用戶評分為因變量,利用Logistics模型分別構(gòu)建了總體偏好模型及不同性別用戶偏好模型,分析了群體用戶和不同性別用戶的偏好并給出了相應(yīng)建議。

        本文也存在一些不足,主要是評論樣本不夠多,篩選不出足夠的評價(jià)多個(gè)產(chǎn)品特征的評論文本,使得產(chǎn)品特征評價(jià)值矩陣中缺失值過多,雖然采用中性評價(jià)值代替缺失值的方法比較合理,但離用戶的真實(shí)評價(jià)仍會有偏差,勢必會影響后續(xù)偏好模型的解釋效果。下一步研究中應(yīng)選擇評論數(shù)量更多的產(chǎn)品進(jìn)行偏好挖掘,并提高評價(jià)單元的抽取精度。

        猜你喜歡
        短語特征用戶
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        抓住特征巧觀察
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        中文字幕精品一二三区| 忘忧草社区www日本高清| 一区二区三区一片黄理论片| 亚洲国产一区二区,毛片| 大奶白浆视频在线观看| 77777_亚洲午夜久久多人| 久久精品女人天堂av免费观看| 久久久久久曰本av免费免费| 国产精品丝袜黑色高跟鞋| 国产午夜亚洲精品不卡福利| 国产精品高潮av有码久久| 国产盗摄一区二区三区av| 一本色道久久88加勒比| 青青手机在线观看视频| 久久无码专区国产精品s| 国产无遮挡又黄又爽在线视频| 熟妇人妻AV中文字幕老熟妇 | 手机在线精品视频| 亚洲一区二区丝袜美腿| 蜜桃国产精品视频网站| 一区二区三区四区草逼福利视频 | 青青青国产免A在线观看| 日本一区二区三区的免费视频观看 | 亚洲色欲综合一区二区三区| 久久精品成人欧美大片| 日本欧美在线播放| 国产女主播在线免费观看| 日本一区二区三区爱爱视频| 亚洲国产性夜夜综合另类| 成年免费a级毛片免费看无码 | 日韩欧美第一页| 中文无码免费在线| 亚洲激情综合中文字幕| 亚洲精品久久激情国产片| 国产香蕉国产精品偷在线| 无码精品国产va在线观看| 国产品精品久久久久中文| 成人性生交大片免费看7| 人妻少妇精品中文字幕专区| 曰批免费视频播放免费直播| 五月天综合网站|