亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LDA主題模型的某品牌手機評論數(shù)據(jù)分析

        2023-06-22 05:52:32吳楠楠石家程劉勝強
        現(xiàn)代信息科技 2023年2期
        關(guān)鍵詞:品牌手機

        吳楠楠 石家程 劉勝強

        摘? 要:在互聯(lián)網(wǎng)高度發(fā)展和智能技術(shù)普及的大環(huán)境下,電商平臺出現(xiàn)了大量的評論數(shù)據(jù),它們對挖掘用戶需求和建立商品口碑具有重要價值。文章爬取了京東電商平臺上某品牌手機的評論數(shù)據(jù),并基于預(yù)處理之后的數(shù)據(jù)進行了傾向性分析和LDA主題模型分析。研究結(jié)果表明,該品牌手機具有外觀好看、充電快、性價比高和拍照功能強大等優(yōu)勢,但也有新品定價偏貴、保值率低、售后服務(wù)差、部分包裝零件不全等不足之處。所得結(jié)論為該品牌手機升級提供一定的參考依據(jù)。

        關(guān)鍵詞:傾向性分析;LDA主題模型;品牌手機

        中圖分類號:TP181? 文獻標識碼:A? 文章編號:2096-4706(2023)02-0012-03

        Analysis of Comment Data of a Brand Mobile Phone Based on LDA Theme Model

        WU Nannan, SHI Jiacheng, LIU Shengqiang

        (School of Mathematical & Computing Science, Guilin University of Electronic Technology, Guilin? 541004, China)

        Abstract: In the context of the high development of the Internet and the popularization of intelligent technology, a large number of review data have emerged on E-commerce platforms, which are of great value in mining user needs and establishing product reputation. It crawls the review data of a brand's mobile phone on JD E-commerce platform, and conducts a tendentiousness analysis and LDA theme model analysis based on the pre processed data. The research results show that the mobile phone of this brand has the advantages of good-looking appearance, fast charging, high cost performance and strong photographing function, but it also has the disadvantages of expensive new product pricing, low value preservation rate, poor after-sales service, and incomplete parts of some packaging. The conclusion provides a reference for the upgrading of the mobile phone of this brand.

        Keywords: tendentiousness analysis; LDA theme model; brand mobile phone

        0? 引? 言

        隨著互聯(lián)網(wǎng)的高度發(fā)展以及智能技術(shù)的普及,網(wǎng)絡(luò)購物已成為一種熱潮,也成為人們購物的一種主要方式。電商評論數(shù)據(jù)是指用戶在電商平臺完成購物后,對已購買的商品進行評論所產(chǎn)生的文本數(shù)據(jù),這些數(shù)據(jù)里蘊涵了顧客購買后的主觀感受,反映了購買者對商品及服務(wù)的態(tài)度、立場和意見,因此這些評論數(shù)據(jù)也是潛在客戶在購物之前的決策參考,從而越來越多的商家和顧客關(guān)注電商評論數(shù)據(jù)[1]。傾向性分析是指通過分析和歸納用戶對事件或商品的評論文本,進而發(fā)現(xiàn)或找到用戶所持有的觀點[2]。因此,傾向性分析能從用戶的評論數(shù)據(jù)中挖掘出顧客的主觀感受,這些感受或信息可以幫助商家改善自身缺點,提高其服務(wù)質(zhì)量,從而吸引更多顧客購買。

        某品牌手機作為中國乃至全世界的知名品牌手機,它的發(fā)展屬于中高端市場,雖然在國外的發(fā)展中具有一定的優(yōu)勢,但在國內(nèi)的市場中所占份額不大,這說明中國手機行業(yè)的競爭非常激烈,同時該品牌手機在國內(nèi)市場中也存在某些競爭劣勢。為能挖掘出該品牌手機在國內(nèi)市場上的優(yōu)勢和不足之處,本文對該品牌手機電商進行了傾向性分析以及LDA主題模型分析。

        1? LDA主題模型的簡介

        LDA主題模型,即潛在狄利克雷分配,由Blei等人在2003年提出[3],該模型對詞匯、主題和文檔的三層結(jié)構(gòu)進行貝葉斯概率分布,認為每個文檔由多個主題構(gòu)成,每個主題由多個特征詞匯構(gòu)成,文檔中的每個詞匯都是按照“以一定的概率選擇了某個主題,并從該主題中以一定的概率選擇了某個詞匯”的方式來獲得,將上述步驟重復(fù)即可獲得整個文檔[4]。

        LDA模型一種采用詞袋的模型,它將每個文檔視為詞頻向量,并將文本信息轉(zhuǎn)換為易于建模的數(shù)字信息。LDA主題模型基于三個假設(shè)[5]:

        (1)假設(shè)某一商品的評論集D由M篇評論(文檔)構(gòu)成,記為D=d1, d2,…, dM;每篇評論(文檔)中存在K個互相獨立的主題Zm,i(i=1, 2,…, K),并由K個主題隨機混合組成;每個主題下由N個詞wm,n(n=1, 2,…, N)構(gòu)成評論,每個詞是一個L維向量(1, 0, 0, …, 0, 0)。

        (2)每篇評論(文檔)在主題上服從多項式分布,每個主題在單個詞上服從多項式分布。

        (3)每一篇文檔在主題上的多項式分布的先驗分布是參數(shù)為α的Dirichlet分布,每一個主題在詞匯上的多項式分布的先驗分布是參數(shù)為β的Dirichlet分布。在以上假設(shè)下,對于評論(文檔)集D中的評論(文檔)dm,LDA模型生成文本的方式如下[3,5,6]:

        1)從參數(shù)為α的Dirichlet分布中進行采樣,生成第m個評論(文檔)的主題多項式分布θm。

        2)從主題多項式分布θm中進行采樣,生成第m個評論(文檔)第n個詞匯的主題Zm,n。

        3)從參數(shù)為β的Dirichlet分布中進行采樣,生成主題Zm,n所對應(yīng)的詞匯多項式分布φk。

        4)從φk中進行采樣,最終生成匯wm,n,其中,m∈[1, M ],n∈[1, Nm],k∈[1, K ],M為待處理評論(文檔)數(shù),Nm為第m個文本的總詞匯數(shù),K為待分類主題數(shù)。

        LDA主題模型可采用變分最大期望法或Gibbs抽樣方法進行參數(shù)估計,訓(xùn)練出圖1中文本的主題分布概率θm以及主題對應(yīng)的詞匯分布概率φk[6]。

        2? 實證分析

        2.1? 數(shù)據(jù)的獲取與預(yù)處理

        本文通過Python軟件對“京東商城”中“某品牌手機銷售”商品的評論數(shù)據(jù)的爬取,主要爬取評論數(shù)據(jù)中的好評與差評數(shù)據(jù),約800條。在京東商城平臺上,若電商產(chǎn)品在用戶確認收貨的一段時間后未給出評價,則系統(tǒng)會默認好評,這種文本數(shù)據(jù)對本文的分析無實質(zhì)作用,故需刪除。同時,論中夾雜著許多數(shù)字與字母,以及較高頻率出現(xiàn)“京東”“京東商城”等詞,但它們對本次分析也無實質(zhì)作用,因此在分詞之前也將這些數(shù)據(jù)清洗掉。

        2.2? 傾向性分析

        2.2.1? 匹配傾向性詞

        在商品評論中,可以理解為用戶對該商品表達自身觀點所持的態(tài)度是支持、反對還是中立。本文采用2007年10月知網(wǎng)分布的“傾向性分析用詞(beta版)”詞典匹配的方法,主要使用“中文正面評價”“中文負面評價”詞表。將每個“中文正面評價”詞語賦予初始權(quán)重1,作為本文的正面評價表;將每個“中文負面評價”賦予每個詞語初始權(quán)值-1,作為本文的負面評價表。

        在匹配評價詞的時候,較多詞語在網(wǎng)絡(luò)購物評論上出現(xiàn),但不在本次匹配表的詞庫中,因此要進行詞語的優(yōu)化。例如“滿意”“好評”“很快”“還好”“還行”等根據(jù)詞語傾向添加至對應(yīng)的中文正面詞表內(nèi);同樣的,將“差評”“貴”“問題”等詞語添加到中文負面詞表內(nèi)。

        2.2.2? 修正傾向性詞語

        詞語的傾向性修正是指通過查看傾向性詞的前兩個位置的詞中是否具有否定詞來判斷傾向性詞的正確性,如果存在否定詞,則當否定詞出現(xiàn)奇數(shù)次時,表示否定意義,將該詞調(diào)整為相反的傾向性詞性;而當否定詞出現(xiàn)偶數(shù)次時,表示的是肯定詞性,此時不需要調(diào)整詞性。如果傾向性詞的前兩個位置的詞中沒有否定詞,則也不需要調(diào)整詞性。本次分析所使用的否定詞主要有19個,分別是:不、沒有、無、非、莫等。

        2.2.3? 檢驗傾向性詞分析結(jié)果

        將原始評論的評論類型與基于詞表的傾向性詞分析進行比較,得到評論類型的混淆矩陣,如表1所示。在不存在選好評的標簽而寫了差評內(nèi)容的情況下,基于詞表的傾向性詞分析的準確率為87.82%,這表明通過詞表的傾向性詞分析去判斷某文檔的傾向程度是有效的。

        2.3? 基于LDA模型的主題分析

        運用LDA主題模型,可以求得詞匯在主題中的概率分布,并獲得屬于該主題的概率及同一主題下的其他特征詞,從而解決多個指代的問題。

        計算主題間的平均余弦距離,該值最小,則相對應(yīng)的主題數(shù)最優(yōu)。正面評論和負面評論主題間平均余弦距離圖分別如圖2和圖3所示。圖2中橫軸代表主題數(shù),縱軸代表平均余弦,該圖表示當主題數(shù)為3時主題間的平均余弦相似度。因此,對于正面評論數(shù)據(jù)做LDA模型分析時,主題數(shù)為3。同理,由圖3可得,負面評論數(shù),當主題數(shù)為4時,主題間的平均余弦相似度最低。

        使用Python語言gensim庫和LdaModel庫下的LDA l函數(shù),對正面評論數(shù)據(jù)和負面評論數(shù)據(jù)分別構(gòu)建LDA主題模型。經(jīng)過LDA主題分析后,在每個主題下生成10個最有可能出現(xiàn)的詞語,隨后對主題分析的結(jié)果進行評價,潛在的正負面主題分別如表2和表3所示。

        由表2可知,主題1中的高頻特征詞主要是:不錯、屏幕、清晰、效果、很快、充電等,主要反映了該品牌手機屏幕顯示效果清晰,充電速度很快;主題2中的高頻特征詞主要是:拍照、好看、流暢、價格、性價比等,主要反映了該品牌手機拍照功能強大,深受用戶喜愛,且性價比高;主題3中的高頻特征詞主要是:外觀、運行、快、物流、滿意等、主要反映了該品牌手機外觀好看,運行速度快、物流快。

        由表3可知,主題1中的高頻特征詞主要是:卡、降價、使用、價格等,主要反映了該品牌手機有卡頓現(xiàn)象,降價快,保值率低;主題2中的高頻特征詞主要是:慢、反應(yīng)、時間、發(fā)現(xiàn)、無充等,主要反映了該品牌手機反應(yīng)慢,存在有些包裝沒有配套充電器的問題;主題3中的高頻特征詞主要是:不好、貴、客服、差評等,主要反映了該品牌手機貴,客服態(tài)度不好的問題;主題4中的高頻特征詞主要是:感覺、網(wǎng)絡(luò)、差評等,主要反映了該品牌手機存在用戶購買體驗較差的問題。

        綜合以上對主題及其中對高頻特征詞的分析得出,該品牌手機的優(yōu)勢主要有以下幾個方面:外觀好看、充電快、性價比高、拍照功能強大等。相對而言,用戶對該品牌手機的抱怨點主要在新品定價偏貴、保值率低、售后服務(wù)差、部分包裝零件不全等。

        3? 結(jié)? 論

        本文采用LDA模型對京東網(wǎng)站的某品牌手機的評論數(shù)據(jù)進行了文本分析。由正面傾向性詞分析得出用戶對該手機品牌的評論主要是外觀好看、充電快、性價比高、拍照功能強大等??梢钥闯?,用戶對該電商產(chǎn)品的品質(zhì)還是認可的,這些被用戶認可的地方,應(yīng)繼續(xù)加強管理,讓產(chǎn)品在眾多商品中脫穎而出。由負面傾向性詞的研究分析得出該品牌手機的新品定價偏貴、保值率低、售后服務(wù)差、部分包裝零件不全等。

        本文的研究結(jié)論為該品牌手機升級提供了一定的參考依據(jù)。

        參考文獻:

        [1] 劉玉林,菅利榮.基于文本情感分析的電商在線評論數(shù)據(jù)挖掘 [J].統(tǒng)計與信息論壇,2018,33(12):119-124.

        [2] 李天辰,殷建平.基于主題聚類的情感極性判別方法 [J].計算機科學(xué)與探索,2016,10(7):989-994.

        [3] BLEI D M,NG A Y,JORDAN M I. Latent Dirichlet Allocation [J].Journal of Machine Learning Research,2003(3):993-1022.

        [4] 王鵬飛,張斌.基于文獻計量的國內(nèi)LDA主題模型研究進展分析 [J].圖文情報研究,2020,13(2):85-91+111.

        [5] 王麗君.詞向量和文本隱含主題的聯(lián)合學(xué)習研究 [D].武漢:華中師范大學(xué),2018.

        [6] 袁揚,李曉,楊雅婷.基于LDA主題模型的維吾爾語無監(jiān)督詞義消岐 [J].廈門大學(xué)學(xué)報:自然科學(xué)報,2020,59(2),198-205.

        作者簡介:吳楠楠(2002.05—),男,漢族,湖北武穴人,本科在讀,研究方向:數(shù)據(jù)分析;石家程(2001.11—),男,漢族,海南樂東人,本科在讀,研究方向:數(shù)據(jù)分析;劉勝強(1998.01—),男,漢族,廣西桂林人,JAVA技術(shù)顧問,本科,研究方向:軟件開發(fā)。

        收稿日期:2022-09-06

        基金項目:廣西大學(xué)生創(chuàng)新創(chuàng)業(yè)項目(201910595202)

        猜你喜歡
        品牌手機
        基于品牌設(shè)計下的商業(yè)展示空間色彩分析研究
        設(shè)計(2023年16期)2023-09-01 16:25:20
        “復(fù)制”品牌手機的背后
        檢察風云(2023年11期)2023-06-21 11:39:30
        如何實現(xiàn)跨品牌零流量高速互傳
        萍鄉(xiāng)搗毀制售假手機窩點
        國內(nèi)手機市場出貨量 同比下降18.2%。
        【至美一拍】
        初中生(2016年16期)2016-07-14 02:50:58
        應(yīng)用馬爾可夫鏈對品牌手機市場占有率進行預(yù)測
        中國移動自主品牌手機能走多遠?
        通信世界(2014年17期)2014-09-04 01:31:50
        中移動自有品牌手機曝光成功關(guān)鍵在于打包銷售
        通信世界(2013年19期)2013-02-14 19:40:23
        術(shù)業(yè)有專攻:中移動自有手機恐無勝算
        通信世界(2012年47期)2012-07-10 10:19:56
        亚洲一本之道高清在线观看| 国产一区二区三区毛片| 国产精品毛片无遮挡| 亚洲中文字幕无码中文字在线| 精品国精品国产自在久国产应用| japanese色国产在线看视频| 亚洲天码一区二区三区| а√天堂8资源中文在线| 欧美午夜刺激影院| 一级毛片60分钟在线播放| 亚洲香蕉av一区二区蜜桃| 亚洲综合精品一区二区| 亚洲a∨无码精品色午夜| 国产人妻丰满熟妇嗷嗷叫| 中文字幕在线免费 | caoporon国产超碰公开| 亚洲熟女乱一区二区三区| 国产精品一卡二卡三卡| 国产人成精品综合欧美成人| 成人女同av免费观看| 亚洲天堂av黄色在线观看| 97se狠狠狠狠狼鲁亚洲综合色| 国产黄a三级三级三级av在线看 | 久久麻豆精亚洲av品国产蜜臀| 日韩av一区二区网址| a级毛片高清免费视频就| 蜜臀av免费一区二区三区| 国产人妖赵恩静在线视频| 白浆国产精品一区二区| 曰韩无码无遮挡a级毛片| 欧美多毛肥胖老妇做爰| 亚洲乱码中文字幕综合| 国产一区亚洲二区三区| 女性女同性aⅴ免费观女性恋 | 欧美高清精品一区二区| 自愉自愉产区二十四区| 小12萝8禁在线喷水观看| 亚洲国产成人久久综合三区| 日本a级一级淫片免费观看| 国产精品亚洲一区二区三区在线| 国产老妇伦国产熟女老妇高清|