亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶評論情感分析的生活類App用戶滿意度預(yù)測模型*

        2022-04-26 11:53:00江帆邢巍王佳佳張波
        自動化技術(shù)與應(yīng)用 2022年4期
        關(guān)鍵詞:詞匯滿意度情感

        江帆,邢巍,王佳佳,張波

        (國家電網(wǎng)有限公司客戶服務(wù)中心互聯(lián)網(wǎng)運營分析及風(fēng)險管理,天津 300309)

        1 引言

        生活類APP 占據(jù)APP 市場重要地位,隨著人們生活品質(zhì)逐漸改善,對軟件服務(wù)需求不斷提高。從基礎(chǔ)的生存需求擴展到便捷服務(wù)、甚至情感訴求。正如人本主義理論中所表示的人類需求最終會發(fā)展為自我實現(xiàn)與私人定制。共享經(jīng)濟的出現(xiàn),使生活類APP展示出強大的綜合服務(wù)能力,逐漸向多元化方向創(chuàng)新,追求更高的商業(yè)價值。但是一款A(yù)PP成功與否主要取決于用戶體驗,越來越多的用戶習(xí)慣在網(wǎng)絡(luò)上發(fā)表自己的體驗感受,對這些評論中體現(xiàn)出現(xiàn)的情感進行研究能夠創(chuàng)造巨大商業(yè)價值,因此用戶評論情感是預(yù)測滿意程度的主要依據(jù)。

        近年來有關(guān)用戶評論情感分析的研究較多,盧偉聰?shù)热颂岢鲆环N基于二分網(wǎng)絡(luò)的評論情感分析方法。建立“用戶—產(chǎn)品”的二分網(wǎng)絡(luò),根據(jù)該網(wǎng)絡(luò)投影和情感分析結(jié)果分別獲得APP 與用戶的單頂點網(wǎng)絡(luò),對其做中心性和平均聚類系數(shù)研究,獲得評論情感差異和產(chǎn)品特性之間的聯(lián)系,從而實現(xiàn)用戶評論情感挖掘[1]。喻影等人在關(guān)鍵詞與關(guān)鍵字抽取基礎(chǔ)上對用戶評論情感進行分析。在情感分析中最重要的任務(wù)是結(jié)合用戶發(fā)表的評論內(nèi)容對其情感進行判斷,不同詞語和句子都存在不同情感貢獻度,通過句法關(guān)系研究句子結(jié)構(gòu);獲取和情感有關(guān)的詞語做加權(quán)處理,改善分類性能;將關(guān)鍵句抽取與分類器算法相融合,綜合分析情感詞屬性,使信任度最高的子分類器決定分類效果,實現(xiàn)對用戶評論情感的分類[2]。

        上述兩種用戶評論情感分析方法適用于對評論的全局分析,無法分析文本局部特征,使語義信息丟失,降低情感分析準(zhǔn)確率,從而影響預(yù)測模型精度。為此,本文利用注意卷積神經(jīng)網(wǎng)絡(luò)(Attention Convolutional Neural Network ACNN)方法分析用戶評價情感,該方法在卷積神經(jīng)網(wǎng)絡(luò)算法基礎(chǔ)上引入注意機制,使分析模型更加注重局部特征。同時在深度學(xué)習(xí)與灰色預(yù)測基礎(chǔ)上利用少量信息對事物發(fā)展規(guī)律進行模糊描述,構(gòu)建預(yù)測模型。

        2 生活類APP滿意度影響因素分析

        2.1 用戶屬性

        用戶是評論生活類APP 滿意度的主體,也是滿意度主觀因素表現(xiàn)。感知是軟件使用情況的直觀感受,其價值是影響滿意度的主要因素[3],也是用戶主要的子屬性,其中感知有用性、愉悅性屬于用戶感知關(guān)鍵內(nèi)容。因此,本文提出的滿意度影響因素中有關(guān)用戶子屬性的內(nèi)容如表1所示。

        表1 用戶子屬性內(nèi)容表

        2.2 軟件屬性

        本文分析了軟件質(zhì)量影響用戶滿意度的多種屬性。在預(yù)測APP用戶滿意度時,這些屬性可以體現(xiàn)軟件自身特征。APP子屬性內(nèi)容如表2所示。

        表2 軟件子屬性內(nèi)容表

        2.3 環(huán)境屬性

        環(huán)境對提升APP 服務(wù)質(zhì)量與顧客滿意度產(chǎn)生重要影響,在不同環(huán)境中,用戶滿意度也有所差別。在APP 中,環(huán)境因素對滿意度造成的影響通常最容易被忽視。在互聯(lián)網(wǎng)中,網(wǎng)絡(luò)性能對用戶滿意度起到?jīng)Q定性作用[4]。APP加載過程中會受到網(wǎng)速影響,如果加載時間過長,會降低用戶體驗感,進而影響用戶粘性,導(dǎo)致用戶數(shù)量減少,因此本文將網(wǎng)絡(luò)當(dāng)作環(huán)境子屬性。

        表3 環(huán)境子屬性內(nèi)容

        本文從主觀與客觀兩方面分析,將用戶、軟件與環(huán)境作為響應(yīng)滿意度的主要因素。

        3 基于用戶評論情感分析的滿意度預(yù)測模型構(gòu)建

        3.1 評論文本預(yù)處理

        對用戶評論文本進行預(yù)處理的主要目標(biāo)是將文本變換為可以被計算機所處理的形式。傳統(tǒng)的文本預(yù)處理方法是詞袋模型,此模型將評論文本當(dāng)作由詞匯構(gòu)成的集合,結(jié)合輸入信息建立大小為V的詞匯表,V與輸入的詞匯數(shù)量相等。對詞匯多少進行統(tǒng)計,針對某條評論,將其通過一個長度是V的矢量進行描述,矢量中存在的分量代表此評論中詞匯出現(xiàn)次數(shù)。在此基礎(chǔ)上,進行n元特征提取,如果n=1,特征表達和詞袋模型一致,稱其為一元特征;如果n>1,詞匯表由長度是n的詞語組成,稱其為二元特征。此種特征提取方式雖然可以檢測到詞語之間關(guān)聯(lián)程度,但是處理精度還需進一步提高。因此本文對其改進,利用TF-IDF加權(quán)法對每個詞匯賦予合理權(quán)重。該方法能降低在整體評論中出現(xiàn)頻率較高的詞匯,因為這類詞語含有的信息內(nèi)容通常不重要,此外,還能提高出現(xiàn)頻率較少的詞語權(quán)重[5],因為這類詞語通常涵蓋較為重要的信息。針對某個評論中任意詞匯t,其權(quán)重計算公式為:

        公式(1)~(3)中,Nt代表已知評論中詞匯t出現(xiàn)的頻率,Ntd描述評論中詞語總數(shù)量,D表示評論總數(shù),Dt為包含詞語t的評論總數(shù)。因此能夠得出,若詞語t在所有評論中都出現(xiàn),則IDF(t)=0,此時詞語t的權(quán)重為零。因此可通過詞匯權(quán)重不同完成評論文本預(yù)處理,剔除冗余信息[6]。

        3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的用戶評論情感分析

        針對大多數(shù)情感分析方法不能感知局部特征的缺陷,本文利用注意力卷積神經(jīng)網(wǎng)絡(luò)對用戶評論情感進行分析。通過注意力機制重點分析局部特征,同時對不同局部特征進行注意力賦權(quán)來實現(xiàn)更加準(zhǔn)確的評論情感表達。本文構(gòu)建ACNN用戶情感評價模型,該模型分為三部分,以下通過介紹模型各部分內(nèi)容實現(xiàn)用戶評論情感分析。

        3.2.1 詞嵌入層

        對于APP 的評論是由長短不同的句子構(gòu)成,任意一條評論都能當(dāng)作由不同數(shù)量詞匯組合而成。為注重詞匯出現(xiàn)的順序,提高模型對語義理解能力[7],利用連續(xù)低維詞匯進行特征表達,詞匯t可通過下述低維矢量進行描述:

        公式(4)中,w∈Rv,Rv表示V維實數(shù)矢量空間,屬于一個one-hot矢量,因此該矢量中詞匯出現(xiàn)位置值等于1,其它位置的值等于零。L∈Rd×v代表某個詞的嵌入矩陣,L的第i列就是詞匯表中第i個詞匯的矢量表示,d代表詞向量維度。本文利用預(yù)訓(xùn)練詞矢量建立嵌入矩陣L。

        ACNN情感分析模型把用戶評論當(dāng)作由不同詞匯構(gòu)成的序列[8-10],利用詞匯表將其變換為不同類型矢量,再通過嵌入層將評論映射成低維詞矢量集合:

        公式(5)中,yi∈Rd表示任意詞匯經(jīng)過嵌入層形成的低維矢量,d為矢量維度。

        3.2.2 卷積層

        卷積層是情感分析模型關(guān)鍵部分,其利用空間結(jié)構(gòu)練習(xí)學(xué)習(xí)局部特征,降低模型參數(shù)數(shù)量。本文通過設(shè)置一定大小的卷積核來獲取評論局部特性。卷積層輸入是通過詞嵌入獲得一些詞語矢量review∈Rd×n,假設(shè)窗口是k的卷積核權(quán)重W∈Rd×k,則通過下述公式獲取局部特征ci:

        公式(6)中,W的權(quán)值就是模型需要的訓(xùn)練參數(shù),*表示卷積操作,xi:i+k是輸入某個長度是k的詞矢量序列,b是模型偏置參數(shù),φ則代表卷積結(jié)果中的非線性函數(shù)。經(jīng)過卷積計算后獲得整體輸入特性序列:

        公式(7)中,c是獲取的特征張量,ci屬于局部特征。僅利用一個卷積層能夠減少模型參數(shù),提高訓(xùn)練速度,同時加強對輸入特性的表達。

        3.2.3 注意力機制

        傳統(tǒng)的情感分析方法會在卷積操作后通過池化層獲取更多特征以此減少訓(xùn)練參數(shù),本文的ACNN 模型利用注意力機制代替池化,避免池化過程中信息損失。

        通過卷積層獲得輸入中任意部分的局部特性,但是針對比較復(fù)雜的評論,不同字段對感情貢獻度有所區(qū)別,例如一些評論在結(jié)尾處才體現(xiàn)出情感傾向。這就必須形成一種可以從整體上編碼用戶評論的方法,從而獲得比較豐富的長評論特性。利用ACNN 模型對評論進行編碼,構(gòu)成中間特性s'∈Rm。將中間特性s'和卷積層內(nèi)局部特性做對比,判斷輸入內(nèi)容中每部分重要程度。分析s'與ci之間的相似度對局部特性進行注意力權(quán)重賦值。權(quán)重值隨相似度的提高而增加,權(quán)重值ai表達式為:

        式(8)中:

        式(9)中sim()函數(shù)可判斷兩個輸入量之間的相似程度,因此有:

        獲取注意力權(quán)重后,評論特征表達式為:

        S屬于每條評論最終的特征表示,將其引入到情感分類器做分類處理。

        為實現(xiàn)誤差逆向傳輸?shù)秸麄€網(wǎng)絡(luò),達到訓(xùn)練參數(shù)目的,通過Softmax函數(shù),將函數(shù)值當(dāng)作最終輸出結(jié)果:

        公式(12)中,hj屬于第j個初始輸出,K是情感分類數(shù)量,則模型最終輸出的情感分析結(jié)果表示為:

        3.3 基于灰色理論的預(yù)測模型構(gòu)建

        通過上述對用戶評論情感的分析,結(jié)合分析結(jié)果實現(xiàn)對APP用戶滿意度的預(yù)測?;疑到y(tǒng)雖然本身在局部表現(xiàn)上不夠清晰,但是整體有序有界,其中還包括一些規(guī)律。由于影響用戶滿意度原因很多,存在一定不確定性,因此本文在評論情感分析基礎(chǔ)上構(gòu)建灰色預(yù)測模型GM(1,1)完成滿意度預(yù)測。

        將設(shè)定的時間段當(dāng)作單位時間,則單位時間內(nèi)APP 用戶滿意度表示為:

        公式(14)中,p(r)表示第r個時間段內(nèi)用戶較為積極的評價數(shù)量,n'(r)代表此時間段內(nèi)用戶消極評價數(shù)量,因此p(r)+n'(r)即為評價總數(shù)量。

        如果某APP 在n'個時間段內(nèi)滿意度的初始序列表示為s0={s0(1),s0(2),…,s0(n)},此時GM(1,1)預(yù)測模型構(gòu)建過程如下:

        步驟一:對初始序列做累計處理,降低數(shù)據(jù)的隨機性和變化性,形成新的滿意度序列:

        公式(15)中s1(t)=s0(k)代表初始序列前r項和。

        步驟二:對s1(r)構(gòu)建一階微分方程,表達式如下:

        式(16)中,α表示發(fā)展系數(shù),μ屬于內(nèi)生控制系數(shù),α的取值范圍是(-2,2),假設(shè)=(α,μ)T,只需獲取的值,即可形成新的滿意程度序列s1(r),因此能夠計算出初始序列s0(r)內(nèi)下一個時間段的滿意度情況。

        綜上所述,將某個生活類APPr個時間段內(nèi)滿意度序列s0={s0(1),s0(2),…,s0(n')},當(dāng)作預(yù)測模型輸入,如果r<n',則可獲得滿意度擬合值,若r=n',則可得到下一個時間段的用戶滿意度預(yù)測值。

        4 仿真實驗數(shù)據(jù)分析與研究

        為驗證本文構(gòu)建的預(yù)測模型性能,仿真實驗環(huán)境設(shè)置如下。軟件環(huán)境:操作系統(tǒng)為Windows10,利用的編程語言是Python3.5,模型在Tensor flow框架下實現(xiàn),同時引入Numpy第三方Python庫協(xié)助進行。硬件環(huán)境為:Intel Corei5的處理器,其內(nèi)存是10GB,具有加速訓(xùn)練的能力。引入下述兩個指標(biāo)對本文方法、基于二分網(wǎng)絡(luò)方法、基于關(guān)鍵詞和關(guān)鍵句抽取方法進行對比。

        (1)準(zhǔn)確率:表示模型分類正確的評論情感樣本占總樣本比例,公式如下:

        公式(21)中,Ncorrect表示分類正確的樣本數(shù)量,Ntotal是全部樣本數(shù)量。

        (2)召回率:又稱作查全率,代表全部樣本中被分析模型正確分類的比例,計算公式為:

        三種方法對情感分類結(jié)果如表4所示。

        表4 不同方法情感分類結(jié)果表

        由表4可知,所提方法在準(zhǔn)確率與召回率方面均高于其它兩種方法。這是因為該方法在卷積神經(jīng)網(wǎng)絡(luò)中引入注意力機制,避免用戶評價信息丟失,更加全面地分析用戶情感,提高情感分類準(zhǔn)確度。

        圖1表明,本文獲得的預(yù)測結(jié)果與真實值最為接近,由于對用戶情感分析較為精準(zhǔn),引入灰色理論解決了預(yù)測過程中的不確定性因素,從而得到理想預(yù)測效果。

        圖1 不同方法用戶滿意度預(yù)測結(jié)果

        5 結(jié)束語

        隨著生活類APP 受到越來越多人的關(guān)注,對該類型軟件進行滿意度預(yù)測十分重要。本文利用注意力卷積神經(jīng)網(wǎng)絡(luò)對用戶評論情感進行分析,結(jié)合分析結(jié)果構(gòu)建灰色滿意度預(yù)測模型。仿真結(jié)果表明,該方法得到的預(yù)測值與實際值較為接近。有助于對APP的完善與改進。但是本文只從用戶、軟件與環(huán)境方面分析了影響滿意度的主要因素,不夠全面,在今后研究中需不斷完善,并進一步分析這些因素之間的關(guān)系。

        猜你喜歡
        詞匯滿意度情感
        多感謝,生活滿意度高
        工會博覽(2023年3期)2023-04-06 15:52:34
        16城市公共服務(wù)滿意度排行
        小康(2021年7期)2021-03-15 05:29:03
        本刊可直接用縮寫的常用詞匯
        如何在情感中自我成長,保持獨立
        一些常用詞匯可直接用縮寫
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        淺談如何提升脫貧攻堅滿意度
        活力(2019年19期)2020-01-06 07:34:38
        情感
        明天村里調(diào)查滿意度
        雜文月刊(2019年15期)2019-09-26 00:53:54
        本刊可直接用縮寫的常用詞匯
        日韩无码尤物视频| 国产成人a在线观看视频免费| 4hu四虎永久在线观看| 国产精品嫩草影院AV| 无码久久精品蜜桃| 日韩国产精品一区二区三区| 美国少妇性xxxx另类| 性一交一乱一伦a片| 亚洲 无码 制服 丝袜 自拍| 国产精品又黄又爽又色| 中文字幕亚洲熟女av| 区二区三区玖玖玖| 久久国产人妻一区二区| 久久久精品456亚洲影院| 久久精品亚洲中文无东京热| 无码专区无码专区视频网址| 国产精品毛片毛片av一区二区| 亚洲 日本 欧美 中文幕| 久久久精品人妻一区二区三区蜜桃 | 久久久亚洲免费视频网| 亚洲精品久久7777777| 亚洲成色在线综合网站| 国产成人综合亚洲av| 日韩五码一区二区三区地址| 无码一区二区三区免费视频| 精品久久久无码中文字幕| 无码一区二区三区人| 中文字幕日韩有码国产| 亚洲国产成人片在线观看| 九九99久久精品在免费线18| 久久精品国产亚洲av调教| 蜜桃精品人妻一区二区三区| 欧美最猛性xxxxx免费| 91精品久久久久含羞草| 午夜视频一区二区三区在线观看| 久久精品国产自在天天线| 女人与牲口性恔配视频免费| 熟女人妻中文字幕一区| 国产亚洲精品国产精品| 亚洲国产美女精品久久久| 中字亚洲国产精品一区二区|