亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LSTM-LDA算法和IPA分析的在線品牌社群用戶關(guān)注熱點(diǎn)研究*

        2021-10-08 13:54:00孫玲玲胡彥蓉劉洪久
        情報(bào)雜志 2021年9期
        關(guān)鍵詞:汽車(chē)文本滿意度

        孫玲玲 胡彥蓉 劉洪久

        (1.浙江農(nóng)林大學(xué) 信息工程學(xué)院 杭州 311300;2.浙江省林業(yè)智能監(jiān)測(cè)與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室 杭州 311300)

        0 引 言

        《2017年中國(guó)新媒體行業(yè)全景報(bào)告》統(tǒng)計(jì)顯示,中國(guó)在線社群數(shù)量超過(guò)300萬(wàn)個(gè),在線社群用戶超過(guò)2.7億人,在線社群市場(chǎng)經(jīng)濟(jì)規(guī)模超過(guò)3 000億元[1]。在線社群數(shù)量、用戶及市場(chǎng)經(jīng)濟(jì)規(guī)模持續(xù)增長(zhǎng)下,社群經(jīng)濟(jì)與之興起,在線社群成為用戶社交活動(dòng)發(fā)展新趨勢(shì)。據(jù)《2020社交零售白皮書(shū)》統(tǒng)計(jì),隨著“全民社交”,中國(guó)社交零售滲透率達(dá)到71%,用戶參與相關(guān)社群的比例高達(dá)77%,傳播態(tài)勢(shì)由集中化向去中心化轉(zhuǎn)變。如何在傳播過(guò)程中,著重于創(chuàng)造用戶關(guān)注熱點(diǎn)內(nèi)容,實(shí)時(shí)檢測(cè)用戶關(guān)注主題發(fā)展趨勢(shì),在開(kāi)拓下沉市場(chǎng)同時(shí)開(kāi)發(fā)以用戶為中心的私域流量,提高品牌競(jìng)爭(zhēng)力,增強(qiáng)用戶黏性是企業(yè)亟待解決問(wèn)題。

        作為用戶分享產(chǎn)品信息、購(gòu)買(mǎi)體驗(yàn)、表達(dá)產(chǎn)品滿意度的重要場(chǎng)所。在線品牌社群中包含了大量對(duì)企業(yè)的市場(chǎng)營(yíng)銷[2]、推廣新產(chǎn)品[3]、培養(yǎng)用戶忠誠(chéng)度[4]、售后服務(wù)[5]、提升品牌知名度[6]、產(chǎn)品優(yōu)化等有價(jià)值的信息。企業(yè)不僅可以通過(guò)在線品牌社群實(shí)時(shí)獲取用戶需求信息,并進(jìn)行產(chǎn)品開(kāi)發(fā)[7];獲取用戶消費(fèi)體驗(yàn)評(píng)價(jià),提供優(yōu)質(zhì)產(chǎn)品服務(wù)[8];與用戶溝通交流,建立企業(yè)與用戶長(zhǎng)期共生關(guān)系[9]。潛在用戶也可從相關(guān)信息中了解產(chǎn)品使用者的總體評(píng)價(jià)狀況,為其購(gòu)買(mǎi)決策提供有利支持。在線社群成為企業(yè)建立“用戶—品牌”聯(lián)系的重要支點(diǎn)[10]。因此,挖掘在線社群中的隱含信息,及時(shí)了解用戶關(guān)注熱點(diǎn)的發(fā)展態(tài)勢(shì)具有重要現(xiàn)實(shí)意義。

        針對(duì)在線社群用戶互動(dòng)行為的相關(guān)研究。景奉杰等[11]通過(guò)問(wèn)卷調(diào)查法將用戶情緒作為中介效應(yīng),研究結(jié)果表明用戶之間的互動(dòng)對(duì)品牌滿意度有正向影響。Bruhn等[12]得出的結(jié)論是,在線社群用戶的互動(dòng)交流有利品牌忠誠(chéng)度的提高,互動(dòng)質(zhì)量對(duì)品牌在線社群的符號(hào)性、體驗(yàn)性、功能性效益有積極影響。Wang等[13]對(duì)企業(yè)在Facebook上的信息進(jìn)行了分析,發(fā)現(xiàn)使用社交媒體有助于企業(yè)實(shí)現(xiàn)客戶管理,增強(qiáng)市場(chǎng)能力。申光龍等[14]通過(guò)結(jié)構(gòu)方程模型,證實(shí)了社群用戶的體驗(yàn)價(jià)值對(duì)用戶參與價(jià)值的正面影響。荊磊等[15]通過(guò)調(diào)查問(wèn)卷分析了在線品牌社群優(yōu)化,認(rèn)為文化認(rèn)同、社群維護(hù)、體驗(yàn)交流等行為對(duì)購(gòu)買(mǎi)意愿有顯著的正向影響。黃鄭超等[16]通過(guò)對(duì)移動(dòng)社群信息的分析,傳播中的負(fù)面口碑對(duì)品牌用戶忠誠(chéng)度產(chǎn)生差異化影響。劉宇涵等[17]分析了消費(fèi)者體驗(yàn)、優(yōu)化共創(chuàng)價(jià)值與網(wǎng)絡(luò)輿情的關(guān)系,提出根據(jù)社群用戶間的不同需求點(diǎn),開(kāi)展在線社群活動(dòng)以滿足用戶多需求。Ghose等[18]指出,網(wǎng)絡(luò)負(fù)面信息的集合降低了用戶購(gòu)買(mǎi)欲望,影響用戶對(duì)品牌的情感信任度。雷宇[19]提出將具有相同消費(fèi)偏好、消費(fèi)觀點(diǎn)的用戶聚集在一起,企業(yè)可以提取這一群體的消費(fèi)潛力。高海霞等[20]通過(guò)運(yùn)用SOR模型對(duì)社交購(gòu)物的用戶信息進(jìn)行特征提取,發(fā)現(xiàn)購(gòu)物分析信息顯著影響用戶的隱性需求。

        從國(guó)內(nèi)外學(xué)者的研究現(xiàn)狀可以看出,網(wǎng)絡(luò)社群信息挖掘研究已成為學(xué)術(shù)界關(guān)注熱點(diǎn),但是目前研究還存在以下問(wèn)題:a.現(xiàn)有在線社群研究主要以傳統(tǒng)統(tǒng)計(jì)學(xué)分析方法為主。在數(shù)據(jù)來(lái)源上,以抽樣調(diào)查方式獲取數(shù)據(jù), 數(shù)據(jù)是實(shí)際調(diào)查或觀察中的一些個(gè)體, 這使得樣本分析的效果存在明顯局限性;在分析方法上,以“假設(shè)—驗(yàn)證”為分析思路,利用數(shù)據(jù)信息建立的理論模型和主觀判斷來(lái)驗(yàn)證這一假設(shè),人的主觀判斷會(huì)對(duì)調(diào)查過(guò)程和結(jié)果產(chǎn)生影響,結(jié)論是單一性、片面性的[21]。b.現(xiàn)有研究分析主要集中在模式分析和創(chuàng)新上[22],基于用戶角度的網(wǎng)絡(luò)在線社群文獻(xiàn)相對(duì)較少,其中對(duì)汽車(chē)用戶需求研究更少。c.現(xiàn)有研究在主題挖掘上較少考慮時(shí)序參數(shù)信息,缺乏時(shí)間維度上的演化性。需要特別指明的是,社群化為企業(yè)帶來(lái)了許多裨益,但是少有研究著眼于在線社群用戶評(píng)論的文本挖掘的研究,缺乏對(duì)個(gè)案的分析和建議。

        為此,本文提出一種基于LSTM-LDA算法和IPA分析的在線品牌社群關(guān)注熱點(diǎn)研究方法。采用LSTM-LDA算法,獲取在線社群用戶關(guān)注熱點(diǎn)和滿意度隨時(shí)間的變化趨勢(shì),并運(yùn)用IPA方法,構(gòu)建了在線品牌社群用戶的產(chǎn)品使用體驗(yàn)要素結(jié)構(gòu),分析用戶關(guān)注熱點(diǎn)主題的發(fā)展趨勢(shì)。該方法的主要特點(diǎn)在于:a.以大數(shù)據(jù)技術(shù)對(duì)在線品牌社群進(jìn)行研究。以“發(fā)現(xiàn)—總結(jié)”為分析思路,利用大數(shù)據(jù)驅(qū)動(dòng),通過(guò)對(duì)海量的數(shù)據(jù)進(jìn)行快速的分析和價(jià)值挖掘,整合分析多維度、多角度的數(shù)據(jù),突破原有的數(shù)據(jù)分析范式,從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,實(shí)現(xiàn)對(duì)數(shù)據(jù)內(nèi)在聯(lián)系和價(jià)值的最大可能挖掘和分析。b.首先基于時(shí)序窗口利用LDA進(jìn)行主題建模,結(jié)合時(shí)間離散分析方法,對(duì)用戶評(píng)論文本主題進(jìn)行動(dòng)態(tài)追蹤,并通過(guò)計(jì)算困惑度來(lái)確定最佳主題數(shù),保證文檔聚類效果,有效識(shí)別在線社群隱含主題,劃分用戶主題偏好,識(shí)別主題特征。困惑度是衡量LDA模型準(zhǔn)確性的有效方法[23]。同時(shí),婁巖等[24]證明了通過(guò)LDA抽取文本主題以獲取用戶的關(guān)注熱點(diǎn)和態(tài)度的可行性。c.引入邊緣評(píng)論概念,剔除邊緣評(píng)論,避免邊緣評(píng)論對(duì)用戶關(guān)注熱點(diǎn)主題識(shí)別造成的干擾。d.利用LSTM網(wǎng)絡(luò)提取用戶評(píng)論文本情感,完整獲取評(píng)論文本的非結(jié)構(gòu)化上下文信息,避免過(guò)多依賴情感詞典的構(gòu)建,準(zhǔn)確挖掘用戶的情感態(tài)度。e.將文本挖掘法與IPA模型結(jié)合,從用戶需求供給側(cè)出發(fā),構(gòu)建品牌關(guān)注要素結(jié)構(gòu),并對(duì)其特征進(jìn)行深入分析,以新的研究視角豐富在線品牌社群用戶需求挖掘的研究?jī)?nèi)容。

        1 基于LSTM-LDA和IPA的在線品牌社群用戶關(guān)注熱點(diǎn)模型構(gòu)建

        1.1問(wèn)題描述及解決框架隨著Web2.0的發(fā)展,用戶日常使用的社群、微信小程序/公眾號(hào)、平臺(tái)/社交電商、微博等,越來(lái)越成為用戶喜愛(ài)的“種草”工具。品牌營(yíng)銷已從單向、單一的傳播模式轉(zhuǎn)向強(qiáng)社交、多觸點(diǎn)的傳播模式。對(duì)于企業(yè)而言,如何有效利用社群渠道強(qiáng)化品牌營(yíng)銷影響力,深入多場(chǎng)景和用戶建立觸點(diǎn),及時(shí)識(shí)別銷售機(jī)遇,激發(fā)用戶興趣、帶動(dòng)用戶決策、持續(xù)受到用戶喜愛(ài),是企業(yè)亟待解決的問(wèn)題。本文從用戶需求視角,設(shè)計(jì)出基于LSTM-LDA算法和IPA分析的在線品牌社群用戶關(guān)注熱點(diǎn)分析方法,有效挖掘用戶評(píng)論中的有效信息,加強(qiáng)與用戶的信息交流,梳理內(nèi)部機(jī)制快速迭代新品,形成基于用戶評(píng)論數(shù)據(jù)的建議、推斷和決策。本文構(gòu)建的在線品牌社群用戶關(guān)注熱點(diǎn)分析框架如圖1所示。

        圖1 用戶關(guān)注熱點(diǎn)分析框架

        1.2 LDA主題模型

        1.2.1 LDA主題提取 使用LDA模型從評(píng)論文本中提取主題。是由Blei等[25]在2003年提出的概率主題模型。作為三層貝葉斯概率模型,具有 “詞、主題、文檔”三層結(jié)構(gòu)。LDA主題模型認(rèn)為,一個(gè)文檔有幾個(gè)主題,一個(gè)主題由幾個(gè)詞來(lái)體現(xiàn)。利用LDA獲取文本主題信息的分布,文檔是具有一定概率的潛在主題的隨機(jī)組合;每個(gè)主題是詞匯一定概率的組合,如圖2所示。

        圖2 LDA模型的矩陣表示

        其中,D表示“文檔-詞匯”矩陣;φ表示“主題-單詞”矩陣;θ表示為“文檔-主題”矩陣。使用LDA從頻率文本中提取主題的基本計(jì)算過(guò)程:使用公式(1),從矩陣D中,通過(guò)無(wú)監(jiān)督學(xué)習(xí)得到矩陣φ和θ。

        (1)

        其中,α為文檔參數(shù);β為詞匯參數(shù);θ為從β中采樣的“文檔-主題”矩陣;φ為從β中采樣的“主題-詞匯”矩陣;t為θ中采樣的主題;N為文檔集合中的單詞總數(shù)。

        對(duì)于主題模型,本文利用困惑度來(lái)確定最優(yōu)主題數(shù)K,以保證主題提取效能。困惑度是評(píng)價(jià)語(yǔ)言模型性能的常用指標(biāo)。一般來(lái)說(shuō),困惑度越低,說(shuō)明聚類效果越好,主題擬合性越高。困惑度計(jì)算公式如式(2)所示。

        (2)

        其中,D為所需測(cè)試文檔集的數(shù)量,wd為d的詞匯序列,Nd為d的詞量。

        1.2.2 熱點(diǎn)主題特征詞提取 根據(jù)式(1),得到“文檔-主題”矩陣φ。如式(3)所示,矩陣中共有m個(gè)主題和n個(gè)詞匯,每一列為各詞匯在m各主題中的分布概率,每一行為各主題在n個(gè)詞匯的分布概率。

        (3)

        根據(jù)公式(1),得到“主題-詞匯”矩陣θ。如公式(4)所示,矩陣中共有s個(gè)文檔和m個(gè)主題,每一列為各主題在s個(gè)文檔中的分布概率,每一行為各文檔在m個(gè)主題中的分布概率。

        (4)

        (5)

        為更好地揭示主題間的結(jié)構(gòu)信息,本文引入邊緣評(píng)論概念。邊緣評(píng)論指的是,如果某一評(píng)論與所有文檔-主題概率都很低,則認(rèn)為該評(píng)論主題不明確,對(duì)其進(jìn)行剔除處理,避免邊緣評(píng)論對(duì)主題變化趨勢(shì)產(chǎn)生不利影響。因此,本文認(rèn)為,當(dāng)文檔-主題概率值小于α?xí)r,該評(píng)論屬于邊緣評(píng)論。

        1.2.3 熱點(diǎn)主題關(guān)注度計(jì)算 根據(jù)式(1),可以計(jì)算得出文檔集合中每個(gè)文檔對(duì)應(yīng)各個(gè)主題的分布概率,通常以最大分布概率對(duì)應(yīng)的主題作為該文檔所屬的主題。但是,對(duì)于這些主題,哪些是常見(jiàn)主題,哪些是熱門(mén)主題,需要區(qū)分開(kāi)來(lái)。由此,依據(jù)文檔主題支持度的思想,認(rèn)為在某段時(shí)間內(nèi)該主題是熱點(diǎn)主題,則在線品牌社群評(píng)論文本集合中屬于該主題的評(píng)論文檔占據(jù)一定比例。根據(jù)蔣翠清等[26](主題演化)提出的平均熱度方法,將每個(gè)主題演化應(yīng)用到結(jié)果分析中,該方法利用LDA模型提取文檔集的潛在主題,并以評(píng)論時(shí)間信息檢查不同離散時(shí)間段的主體分布情況,從而對(duì)主題進(jìn)行歸一化平滑處理,統(tǒng)計(jì)不同時(shí)間段用戶討論主題的關(guān)注度趨勢(shì),最終形成評(píng)論數(shù)據(jù)集合的整體主題演變趨勢(shì)。各時(shí)間段內(nèi)主題關(guān)注度按式(6)計(jì)算。

        (6)

        1.3 LSTM模型

        1.3.1 LSTM網(wǎng)絡(luò)結(jié)構(gòu) 長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short Term Memory Neural Network, LSTM)是一種用于處理時(shí)間序列數(shù)據(jù)的專用網(wǎng)絡(luò)[27],傳統(tǒng)RNN神經(jīng)網(wǎng)絡(luò)的神經(jīng)元通過(guò)輸入函數(shù)計(jì)算輸出單元,而LSTM神經(jīng)網(wǎng)絡(luò)是將神經(jīng)元轉(zhuǎn)為記憶單元,每個(gè)記憶單元由輸入門(mén)、遺忘門(mén)和輸出門(mén)三部分組成,單元圖如圖3所示。

        圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)

        其中,c為長(zhǎng)期狀態(tài),用來(lái)儲(chǔ)存長(zhǎng)期記憶信息,保存序列的長(zhǎng)期狀態(tài),并傳送到下一層。從左往右第一個(gè)框?yàn)檫z忘門(mén),用于c的更新,丟棄過(guò)時(shí)信息,它接收上一時(shí)刻ht-1和當(dāng)前輸入的xt經(jīng)過(guò)wf得到另一個(gè)向量,由此才經(jīng)過(guò)σ。遺忘門(mén)的增加解決了RNN梯度消失和爆炸的問(wèn)題。

        xt數(shù)據(jù)到達(dá)網(wǎng)絡(luò)后,同上時(shí)刻的輸出ht-1作為輸入,更新Ct-1,到新Ct,計(jì)算公式如公式(7)所示。

        (7)

        在進(jìn)行sigmod計(jì)算后,和更新后的Ct進(jìn)行計(jì)算,得到該時(shí)刻下的ht,ht計(jì)算公式如下式(8)所示。

        (8)

        1.3.2 熱點(diǎn)主題滿意度計(jì)算 根據(jù)所提取主題的基礎(chǔ)上進(jìn)行文本分類構(gòu)建。由于論壇帖子回復(fù)大多是短文本,每個(gè)用戶語(yǔ)言習(xí)慣不同,在進(jìn)行分類前需如1.1步驟進(jìn)行文本預(yù)處理、詞向量訓(xùn)練。LSTM后,使用Dropout來(lái)防止模型過(guò)擬合并增強(qiáng)模型的適用性。由此對(duì)論壇帖子文本進(jìn)行情感分析。將論壇帖子文本分為正、負(fù)兩種情感集合。根據(jù)9:1比例,將數(shù)據(jù)集分為訓(xùn)練集、測(cè)試集。大量實(shí)驗(yàn)證明,構(gòu)建LSTM網(wǎng)絡(luò)分類器進(jìn)行文本分類所得到的結(jié)果遠(yuǎn)遠(yuǎn)高于樸素貝葉斯、邏輯回歸、SVM等機(jī)器學(xué)習(xí)算法[28-30]。最后根據(jù)分類結(jié)果計(jì)算主題滿意度,計(jì)算公式如式(9)所示。

        (9)

        其中,νk,t為t時(shí)間下主題k的滿意度,ht為t時(shí)間下k主題的好評(píng)文檔數(shù)量,Mk,t為時(shí)間t下的k主題評(píng)論個(gè)數(shù)。

        1.4 IPA分析IPA(Importance Performance Analysis; IPA)分析法。最早由Martilla和James[31]于1997提出。其基本思想是對(duì)影響用戶滿意度的各種因素的重要性和用戶實(shí)際使用感知進(jìn)行評(píng)估和分析,找出企業(yè)優(yōu)、劣勢(shì)。常采樣“重要性”:I、“績(jī)效/滿意度”:P建立二維坐標(biāo)系。通過(guò)I、P各自均值分為四象限,分別為第一象限:優(yōu)勢(shì)區(qū);第二象限:維持區(qū);第三象限:改進(jìn)區(qū);第四象限:弱勢(shì)區(qū),如圖4 所示。

        圖4 IPA四象限圖

        (10)

        (11)

        2 實(shí)證研究

        2.1數(shù)據(jù)源說(shuō)明本文以愛(ài)卡汽車(chē)論壇帖子作為數(shù)據(jù)來(lái)源。愛(ài)卡汽車(chē)社區(qū)是全球最大的汽車(chē)主題社區(qū),也是國(guó)內(nèi)第一家社會(huì)化的汽車(chē)網(wǎng)絡(luò)互動(dòng)媒體。它擁有著廣泛的客戶和更全面的數(shù)據(jù)。其次,本文將大眾作為研究品牌,選取大眾旗下高爾夫、途安、邁騰、途觀L、帕薩特、速騰,6個(gè)車(chē)型作為研究對(duì)象,主要原因?yàn)椋涸撈放茷槲覈?guó)認(rèn)知度較高汽車(chē)品牌,且在選取研究車(chē)型時(shí)包含轎車(chē)、SUV,符合我國(guó)汽車(chē)購(gòu)買(mǎi)習(xí)慣,更具代表性。

        通過(guò)使用“爬蟲(chóng)”軟件在愛(ài)卡汽車(chē)論壇上抓取信息抓取。收集的內(nèi)容包括標(biāo)題、發(fā)帖人、發(fā)帖時(shí)間、回復(fù)次數(shù)、瀏覽次數(shù)、最新回復(fù)者、最新回復(fù)時(shí)間、帖子類型和回復(fù)文本,共形成168 810個(gè)初始實(shí)驗(yàn)數(shù)據(jù)集。對(duì)初始數(shù)據(jù)集進(jìn)行合并、無(wú)關(guān)數(shù)據(jù)和重復(fù)數(shù)據(jù)刪除處理,形成研究語(yǔ)料庫(kù),最終有效評(píng)論數(shù)據(jù)共計(jì)134 110條。丟棄重復(fù)、異常條目數(shù)據(jù)。將數(shù)據(jù)格式轉(zhuǎn)變?yōu)橛?jì)算機(jī)程序可識(shí)別形式。依據(jù)關(guān)鍵詞頻率,對(duì)同時(shí)出現(xiàn)多個(gè)汽車(chē)品牌的關(guān)鍵詞帖子,將其規(guī)劃到某一汽車(chē)品牌。為保證研究成果的正確性和科學(xué)性,將收集到的數(shù)據(jù)整理如下:

        ①初步處理數(shù)據(jù)。首先,整理分析帖子信息,找出與該汽車(chē)車(chē)型不相關(guān)的帖子,刪除無(wú)關(guān)數(shù)據(jù), 減少無(wú)關(guān)這些評(píng)論數(shù)據(jù)對(duì)最后結(jié)果的影響。②文本去重。同一個(gè)人可能會(huì)出現(xiàn)重復(fù)評(píng)論,有價(jià)值的即為第一條評(píng)論,將評(píng)論中重復(fù)部分除去。③機(jī)械壓縮去詞。收集的汽車(chē)評(píng)論信息中夾雜著大量無(wú)意義的內(nèi)容,文本去重之后,仍有許多信息需要處理。如:“哈哈哈”以及“非常好非常好”。④建立歸并詞表。即統(tǒng)一汽車(chē)的外觀、配置、性能等定義:如將“前臉”“正臉”等統(tǒng)一替換為“車(chē)頭”,將“后尾”“尾部”轉(zhuǎn)換為“車(chē)尾”等。⑤建立自定義詞表。建立與汽車(chē)相關(guān)聯(lián)的詞匯,精確分詞,使本文研究更加具有真實(shí)性。⑥去停用詞。⑦分詞。

        2.2基于LDA的用戶關(guān)注熱點(diǎn)關(guān)注度分析

        2.2.1 主題抽取和特征詞選取 按照主題關(guān)注度算法步驟對(duì)汽車(chē)評(píng)論文檔數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)評(píng)論文本使用LDA主題模型建模,挖掘主題詞及詞頻。根據(jù)經(jīng)驗(yàn)值,模型的超參數(shù)取α=50/K,β=0.01,各主題關(guān)鍵詞數(shù)為20。根據(jù)式(3)計(jì)算不同主題數(shù)目下困惑度,結(jié)果如圖5所示,可以看出,K取8時(shí),LDA主題模型困惑度產(chǎn)生局部最小值,之后Perplexity逐漸增加。同時(shí),調(diào)用PyLDAvis包對(duì)各主題間距離進(jìn)行可視化呈現(xiàn),由圖6所示,當(dāng)K=8時(shí),主題區(qū)分度明顯。因此,確定LDA最佳主題數(shù)K為8。

        圖5 主題困惑度變化趨勢(shì)

        圖6 主題距離圖

        本文設(shè)置閾值α=0.2,去除3 697條邊緣評(píng)論,剩余130 413條評(píng)論。在此基礎(chǔ)上,針對(duì)在線品牌社群用戶關(guān)注熱點(diǎn)信息進(jìn)行深層次挖掘與分析。

        利用訓(xùn)練好的LDA主題模型,對(duì)在線品牌社群評(píng)論文本進(jìn)行主題抽取,得到矩陣:“文檔-主題”“主題-詞匯”,根據(jù)式(1)對(duì)“主題-詞匯”計(jì)算出每個(gè)主題的特征詞,分別如表1和表2所示。

        表1 文檔主題矩陣的部分示例

        表2 主題詞匯矩陣的部分示例

        從實(shí)驗(yàn)結(jié)果看,用戶對(duì)汽車(chē)品牌的關(guān)注主題呈現(xiàn)出范圍廣、多樣性的特點(diǎn)。不僅涵蓋了汽車(chē)價(jià)格、汽車(chē)制動(dòng)、汽車(chē)保養(yǎng)等領(lǐng)域,還包括對(duì)汽車(chē)行業(yè)前景、用戶對(duì)汽車(chē)產(chǎn)品接受程度等話題的討論。以topic0為例,相關(guān)評(píng)論主要與汽車(chē)外形、顏色、車(chē)型設(shè)計(jì)、空間大小、配置問(wèn)題密切相關(guān),因此將主題描述為汽車(chē)總體結(jié)構(gòu)問(wèn)題?;诖朔椒ǚ謩e對(duì)topic1- topic7的主題進(jìn)行描述為:汽車(chē)制動(dòng)、汽車(chē)配置定制、汽車(chē)保養(yǎng)、汽車(chē)輪胎、汽車(chē)相關(guān)配件及其價(jià)格、汽車(chē)車(chē)友交流、汽車(chē)行車(chē)。

        2.2.2 熱點(diǎn)主題關(guān)注度計(jì)算 對(duì)于主題抽取,根據(jù)式(5)進(jìn)行主題關(guān)注度計(jì)算,分析各主題關(guān)注度隨時(shí)間的變化,得到汽車(chē)各主題關(guān)注度隨時(shí)間演變情況如圖7所示。在2017年12月至2018年4月期間,用戶對(duì)各主題的關(guān)注度有如下趨勢(shì):相關(guān)討論以topic0為主,在此期間topic0主題關(guān)注度一直高于其余7個(gè)主題。相關(guān)討論以topic0、topic1為主,這些為用戶的主要關(guān)注熱點(diǎn);topic2占比處于第3,屬于用戶主要關(guān)注點(diǎn),但其波動(dòng)呈現(xiàn)先增加后下降趨勢(shì),說(shuō)明用戶對(duì)該主題有所關(guān)注,但關(guān)注度呈現(xiàn)下降趨勢(shì);topic3-topic7的關(guān)注相對(duì)穩(wěn)定,波動(dòng)幅度不大。用戶在不同時(shí)間對(duì)不同主題的關(guān)注熱度不同,可能與相關(guān)政策或汽車(chē)推出有關(guān)。如在2017年,大眾集團(tuán)在“2025年變革”會(huì)議中大眾產(chǎn)品攻勢(shì)正式啟動(dòng),將陸續(xù)推出多款車(chē)型,大眾在華發(fā)起最大規(guī)模的產(chǎn)品攻勢(shì),旨在成為中國(guó)市場(chǎng)領(lǐng)先SUV品牌。此后,用戶對(duì)與汽車(chē)車(chē)型相關(guān)主題的關(guān)注以及討論迅速增加,且明顯高于其余主題,并在2018年1月達(dá)到最高值,且該主題在用戶討論中占據(jù)較大比重,表明汽車(chē)總體架構(gòu)為用戶的主要關(guān)注熱點(diǎn)。企業(yè)可圍繞用戶核心需求,實(shí)時(shí)獲取用戶對(duì)產(chǎn)品的需求和偏好,快速迭代,不斷更新提升產(chǎn)品,同用戶建立長(zhǎng)遠(yuǎn)信賴關(guān)系,驅(qū)動(dòng)社交裂變,增強(qiáng)品牌在線社群的影響力。

        圖7 汽車(chē)評(píng)論主題關(guān)注度時(shí)間演化

        2.3基于LSTM的用戶關(guān)注熱點(diǎn)滿意度分析在模型數(shù)據(jù)訓(xùn)練方面,根據(jù)9:1尺度將評(píng)論文本集分為訓(xùn)練集、測(cè)試集。為了達(dá)到理想的情感分類效果,進(jìn)行了LSTM模型參數(shù)的調(diào)整實(shí)驗(yàn)。Droput設(shè)置為0.2,共執(zhí)行5個(gè)訓(xùn)練周期。模型的準(zhǔn)確率在訓(xùn)練集上達(dá)93.4%,在測(cè)試集上超過(guò)90%。 最后由評(píng)論文本得到的分類結(jié)果為:正面評(píng)論:91 588條;負(fù)面評(píng)論:38 825條,見(jiàn)表3。

        表3 熱點(diǎn)主題的情感分布情況

        依據(jù)式(8)進(jìn)行主題滿意度計(jì)算,具體結(jié)果如圖8所示??梢园l(fā)現(xiàn)用戶對(duì)汽車(chē)評(píng)論滿意度普遍以積極情感為主,對(duì)各主題的滿意度存在差異性。例如,用戶對(duì)topic0、topic1的積極情感在2017年1月趨向于消極情感,在2017年12月達(dá)到最大值,并逐漸趨向于平穩(wěn)趨勢(shì)??梢钥闯鲇脩魧?duì)汽車(chē)車(chē)型和汽車(chē)制動(dòng)的態(tài)度隨產(chǎn)品的持續(xù)出新,用戶消極情感有所上升,可能是發(fā)現(xiàn)某些汽車(chē)設(shè)計(jì)對(duì)用戶存在不便之處。用戶對(duì)topic6和topic7的積極情緒逐漸增加,并在2018年1月達(dá)到最大值,然后逐漸趨于穩(wěn)定,負(fù)面情緒增加,但主要以積極情緒為主。說(shuō)明隨著一系列政策的出臺(tái),更多用戶對(duì)汽車(chē)制動(dòng)表現(xiàn)看好,少部分用戶持消極觀點(diǎn)。用戶對(duì)余下主題的積極情感出現(xiàn)持續(xù)上升再有所下降趨勢(shì),用戶對(duì)主題情感趨向于積極態(tài)度,消極情感均低于積極情感。

        圖8 汽車(chē)評(píng)論主題滿意度時(shí)間演化

        2.4用戶關(guān)注熱點(diǎn)IPA分析在品牌形象感知各要素的關(guān)注度與滿意度的基礎(chǔ)上,用IPA方法計(jì)算該汽車(chē)產(chǎn)品感知的表現(xiàn)性數(shù)值和重要性數(shù)值,結(jié)果如圖9所示。進(jìn)入第一象限的關(guān)注要素有:汽車(chē)制動(dòng)、汽車(chē)配置要素,即用戶對(duì)這些主題要素關(guān)注度、滿意度高,說(shuō)明大眾汽車(chē)的汽車(chē)制動(dòng)、汽車(chē)配置性能良好,用戶享受了優(yōu)質(zhì)產(chǎn)品服務(wù)及其情感體驗(yàn)。

        圖9 用戶關(guān)注熱點(diǎn)IPA分析結(jié)果

        落在第二象限的關(guān)注要素為:汽車(chē)輪胎、汽車(chē)行車(chē)要素,雖然用戶對(duì)這些要素關(guān)注度較低,但用戶對(duì)其評(píng)價(jià)價(jià)值較高,說(shuō)明雖然用戶對(duì)大眾汽車(chē)的汽車(chē)輪胎、汽車(chē)行車(chē)的感知相對(duì)較低但較為滿意,在產(chǎn)品使用過(guò)程中獲得良好使用體驗(yàn)。

        進(jìn)入第三象限的要素有3個(gè),分別為:汽車(chē)保養(yǎng)、汽車(chē)配件及其價(jià)格、汽車(chē)車(chē)友交流,用戶對(duì)這些要素不僅感知重要性低,而且對(duì)其滿意度也較為低下,是大眾汽車(chē)未來(lái)產(chǎn)品研發(fā)方向和線上線下交流活動(dòng)有待優(yōu)化的方面。汽車(chē)保養(yǎng)要素不足主要表現(xiàn)在汽車(chē)保養(yǎng)費(fèi)用較高;保養(yǎng)地點(diǎn)較少,不方便;此外,在市場(chǎng)上有著 “開(kāi)不壞的豐田,修不好的大眾”的俗語(yǔ)。后期問(wèn)題出現(xiàn)時(shí),進(jìn)行保養(yǎng)修護(hù)比較困難。汽車(chē)車(chē)友交流的不足在于車(chē)友交流互動(dòng)不夠?qū)崟r(shí),有滯后性;活動(dòng)較少。

        在第四象限的要素為:汽車(chē)總體架構(gòu),說(shuō)明用戶要素是影響其使用感價(jià)值的重要因素,大眾企業(yè)需采取相應(yīng)處理措施進(jìn)行有效優(yōu)化提升以提高優(yōu)化滿意度水平。從總體來(lái)看,大眾汽車(chē)優(yōu)化使用體驗(yàn)滿意度平均值為0.29,滿意度為負(fù)值時(shí),情感趨向于消極情緒,高于0時(shí)為積極情緒,除topic0以外其余情感均趨向于正向情感,說(shuō)明大眾作為日系車(chē)的一大巨頭,用戶整體使用體驗(yàn)感質(zhì)量相對(duì)較高。

        3 結(jié) 論

        本研究基于“愛(ài)卡汽車(chē)論壇”相關(guān)數(shù)據(jù),提出了基于LSTM-LDA算法和IPA分析方法,探索在線品牌社群用戶在不同時(shí)間片內(nèi)的參與交流評(píng)論的情況,勾勒熱點(diǎn)主題的關(guān)注度、滿意度的時(shí)序發(fā)展趨勢(shì),并通過(guò)構(gòu)建IPA分析模型,明確當(dāng)前熱點(diǎn)主題發(fā)展態(tài)勢(shì)。經(jīng)過(guò)實(shí)證研究得出如下結(jié)論:

        a.從主題討論信息來(lái)看,在線品牌社群用戶通過(guò)論壇關(guān)注汽車(chē)信息以及交流使用心得,用戶關(guān)注主題具有范圍廣、類型多的特點(diǎn)。不僅涵蓋了汽車(chē)總體結(jié)構(gòu)、汽車(chē)制動(dòng)、汽車(chē)配置定制、汽車(chē)保養(yǎng)、汽車(chē)輪胎等多種企業(yè)品牌產(chǎn)品特性,還包括了售后服務(wù)等問(wèn)題的探討。

        b.從主題時(shí)序發(fā)展態(tài)勢(shì)來(lái)看,主題關(guān)注度的演變趨勢(shì)反應(yīng)了用戶對(duì)汽車(chē)品牌的關(guān)注情況,品牌用戶對(duì)各主題關(guān)注度變化趨勢(shì)呈現(xiàn)較為平穩(wěn)狀態(tài),用戶在不同階段所關(guān)注的主題側(cè)重點(diǎn)具有一定差異性。主題滿意度的演變趨勢(shì)反應(yīng)了用戶對(duì)汽車(chē)品牌的情感態(tài)度,用戶對(duì)品牌總體滿意度趨向于正向,用戶主體滿意度較高。以topic0為例,其情感趨向于負(fù)向,這表明汽車(chē)產(chǎn)品周邊服務(wù)未能達(dá)到用戶期望值。

        c.根據(jù)IPA四象限分析,挖掘品牌形象感知各要素。定位出處于改進(jìn)區(qū)的要素為:汽車(chē)保養(yǎng)、汽車(chē)配件及其價(jià)格、汽車(chē)車(chē)友交流;處于弱勢(shì)區(qū)的要素為:汽車(chē)總體架構(gòu)。用戶作為產(chǎn)品的最終使用者,其使用反饋有利于汽車(chē)制造商、經(jīng)營(yíng)商了解用戶需求及其發(fā)展趨勢(shì),幫助相關(guān)企業(yè)制定產(chǎn)品開(kāi)發(fā)戰(zhàn)略和產(chǎn)品優(yōu)化策略,以此滿足不同用戶的不同需求,提升用戶滿意度。

        本文證明了利用在線品牌社群挖掘用戶關(guān)注熱點(diǎn)及其發(fā)展態(tài)勢(shì)的可行性,具有一定理論意義,在以往研究中,多集中于直接使用LDA模型訓(xùn)練結(jié)果進(jìn)行主題分析。相對(duì)于傳統(tǒng)的聚類主題挖掘,本文結(jié)合LDA與多時(shí)間窗口,從時(shí)間維度上梳理用戶關(guān)注主題演變趨勢(shì),與此同時(shí),通過(guò)過(guò)濾邊緣評(píng)論,充分考慮相似度低的評(píng)論對(duì)動(dòng)態(tài)主題挖掘的影響,豐富了在線品牌社群用戶需求挖掘的結(jié)果研究。

        研究結(jié)果還能為相關(guān)企業(yè)在進(jìn)行產(chǎn)品創(chuàng)新、前景路線規(guī)劃、市場(chǎng)營(yíng)銷等工作提供參考。一方面,當(dāng)品牌進(jìn)入市場(chǎng)疲軟期時(shí),用戶關(guān)注度明顯下降,企業(yè)可提供感知結(jié)果,以便市場(chǎng)營(yíng)銷部門(mén)根據(jù)用戶關(guān)注主題類型及其關(guān)注度的變化趨勢(shì),及時(shí)了解并預(yù)測(cè)用戶的興趣主題及時(shí)調(diào)整營(yíng)銷方向。為用戶提供個(gè)性化資源推薦和話語(yǔ)內(nèi)容反饋。例如,具有相似關(guān)注主題的討論貼、興趣小組等。另一方面,在主題演變周期的基礎(chǔ)上,實(shí)現(xiàn)對(duì)市場(chǎng)流程預(yù)警、引導(dǎo)、控制的管理。在滿意度低下階段,注重產(chǎn)品評(píng)價(jià),探索產(chǎn)品出現(xiàn)的問(wèn)題,形成預(yù)案,避免造成客戶群體流失,增強(qiáng)用戶市場(chǎng)黏合力。

        本研究?jī)H局限于愛(ài)卡汽車(chē)論壇,數(shù)據(jù)覆蓋面和研究對(duì)象范圍有限。在后續(xù)研究中,拓寬數(shù)據(jù)獲取渠道,對(duì)不同網(wǎng)絡(luò)、不同搜索引擎及不同車(chē)系信息進(jìn)行收集,以便對(duì)該類問(wèn)題做更深入細(xì)致的研究。

        猜你喜歡
        汽車(chē)文本滿意度
        多感謝,生活滿意度高
        16城市公共服務(wù)滿意度排行
        小康(2021年7期)2021-03-15 05:29:03
        淺談如何提升脫貧攻堅(jiān)滿意度
        活力(2019年19期)2020-01-06 07:34:38
        在808DA上文本顯示的改善
        明天村里調(diào)查滿意度
        雜文月刊(2019年15期)2019-09-26 00:53:54
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        汽車(chē)的“出賣(mài)”
        汽車(chē)們的喜怒哀樂(lè)
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        3D 打印汽車(chē)等
        決策探索(2014年21期)2014-11-25 12:29:50
        无码在线观看123| 亚洲av网站首页在线观看| 亚洲精品国产不卡在线观看| 日韩精品久久伊人中文字幕| 国产在线一区二区三区四区| 女人张开腿让男桶喷水高潮| 久久精品日韩av无码| 亚洲av综合色区在线观看| 精品国产夫妻自拍av| 手机在线观看日韩不卡av| 国产女人高潮叫床视频| 国产91精选在线观看麻豆| 精品日产一区2区三区| 9久久婷婷国产综合精品性色| 亚洲人成色7777在线观看| 国产AV无码专区久久精品网站| 亚洲av午夜福利精品一区二区| 91精品国产综合久久久蜜| 亚洲精品无码永久中文字幕| 欧美饥渴熟妇高潮喷水水| 无遮无挡三级动态图| 久久精品国产成人午夜福利| 精彩视频在线观看一区二区三区| 国产人妻人伦精品1国产| 一本加勒比hezyo无码人妻| 国产亚洲午夜精品| 亚洲av极品尤物不卡在线观看| 人妻少妇满足中文字幕| 50岁退休熟女露脸高潮| 98在线视频噜噜噜国产| 亚洲精品国产第一区三区| 国产精品亚洲а∨无码播放| 久久久久久久久久久国产| 国产成年无码aⅴ片在线观看| 成熟的女人毛茸茸色视频| 少妇扒开毛茸茸的b自慰| 乱码一二区在线亚洲| 毛片色片av色在线观看| 国产丝袜美腿在线播放| 乱人妻中文字幕| 国产夫妻av|