亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        深度學(xué)習(xí)下的情感分析與推薦算法

        2018-10-09 03:05:24慧,柳林,劉曉,程
        測繪通報 2018年9期
        關(guān)鍵詞:聚類神經(jīng)網(wǎng)絡(luò)情感

        郭 慧,柳 林,劉 曉,程 鵬

        (山東科技大學(xué)測繪科學(xué)與工程學(xué)院,山東 青島 266590)

        如今的餐飲越來越離不開網(wǎng)絡(luò),在篩選商家時歷史評價起到至關(guān)重要的作用。傳統(tǒng)的美食推薦算法只是基于用戶的地理位置、歷史消費及瀏覽記錄,未充分利用用戶的反饋數(shù)據(jù)。本研究利用情感分析技術(shù)將海量的評價數(shù)據(jù)作為個性化推薦的依據(jù)。情感分析(sentiment analysis,SA)是通過用戶對產(chǎn)品的評價,判斷用戶情感態(tài)度的分類過程[1],主要包括語義方法與機器學(xué)習(xí)方法[2]。利用機器學(xué)習(xí)進行情感分析的結(jié)果更精準(zhǔn),有廣闊的研究空間[3]。最早,Pang等[4]作了初步探索,此后,Mikolov等[5-6]系統(tǒng)性提出word2vec框架,Socher等[7-8]提出利用循環(huán)神經(jīng)網(wǎng)絡(luò)進行情感分析。基于前人的研究,本文將重點討論利用優(yōu)化循環(huán)神經(jīng)網(wǎng)絡(luò)對美食評價數(shù)據(jù)進行情感分析與推薦算法的實現(xiàn)。

        1 傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)的情感分析

        循環(huán)神經(jīng)網(wǎng)絡(luò)是一種對序列數(shù)據(jù)建模的網(wǎng)絡(luò)[9],其結(jié)構(gòu)如圖1所示。

        圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        a〈n〉=g1(Waaa〈n-1〉+WaxX〈n〉+ba)

        (1)

        (2)

        式中,g1為tanh或Rell激勵函數(shù);g2為sigmoid激勵函數(shù);ba、by為偏重值。

        2 多重屬性聚類加權(quán)輸出的循環(huán)神經(jīng)網(wǎng)絡(luò)

        2.1 屬性聚類

        不同用戶評價時采用的屬性詞不同,為避免龐大的計算量[10],本研究提出一種屬性聚類的方法。首先,根據(jù)評價主題,建立n個母類屬性W母類={W1,…,Wn},然后識別評價中的屬性詞w={w1,…,wm}(n

        similarity(W母類,w)=

        (3)

        計算結(jié)果越大表示此屬性詞與該母類屬性的含義越相似。不同于傳統(tǒng)PMI計算表達式,本公式經(jīng)試驗調(diào)試引入?yún)?shù),增大共現(xiàn)概率的準(zhǔn)入口徑以提高特定主題評價信息的權(quán)重。

        2.2模型結(jié)構(gòu)

        傳統(tǒng)利用循環(huán)神經(jīng)網(wǎng)絡(luò)進行情感分析的方法僅僅是多對一的RNN結(jié)構(gòu),不利于捕捉用戶對店鋪不同屬性的情感態(tài)度。因此,本研究提出一種基于聚類屬性加權(quán)輸出的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN-multiple attribute clustering weighting output,RNN-MACWO)模型,如圖2所示。

        圖2 多重屬性聚類加權(quán)輸出的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        對第一個屬性“味道”的態(tài)度詞進行情感分析后,得到第一部分的分析結(jié)果,然后參數(shù)重置,分析下一個屬性的情感得分,最終將每一個屬性得分按照注意力機制分配得出該條評價總體的情感態(tài)度。

        2.3 注意力機制

        為了符合情感表達的一般特點,對評價內(nèi)容的分析需要有所側(cè)重,因此,引入注意力機制,提高特定詞句的注意力參數(shù),參數(shù)計算公式為

        (4)

        2.4 模型訓(xùn)練

        本模型的情感分類器采用多分類模型,訓(xùn)練分類器時選用Softmax函數(shù)[11],將交叉熵作為損失函數(shù),L2函數(shù)作正則化(如式(5)所示),利用反向傳播進行參數(shù)的修正[12]。

        (5)

        3 基于店鋪屬性與用戶聚類推薦

        3.1 建立商鋪數(shù)據(jù)庫

        為了利用RNN-MACWO模型更高效地分析海量評價信息,建立商鋪數(shù)據(jù)庫,該數(shù)據(jù)庫包含屬性、好評、中評、差評4個字段,屬性字段中包括環(huán)境、味道等屬性詞,在好、中、差評價中分別添加與更新店鋪的名稱。

        3.2 用戶聚類與用戶數(shù)據(jù)庫

        每位用戶對店鋪的關(guān)注點和挑剔度不同,而這些信息往往體現(xiàn)在其評價中,基于這兩個特征聚類相似用戶并建立數(shù)據(jù)庫,使之作為推薦商家的依據(jù),具有更強的匹配度與個性化。

        (6)

        式中,j為店鋪;i為用戶,分別設(shè)定0、1、2為低、中、高挑剔度的標(biāo)簽。將每位用戶的關(guān)注點與其挑剔度映射到某一空間,采用余弦相似度計算公式(如式(7)所示)對用戶進行相似聚類并為每位用戶建立數(shù)據(jù)庫,包含用戶名、關(guān)注點、挑剔度、相似用戶4個字段。

        (7)

        3.3 構(gòu)建推薦算法

        (8)

        4 試驗過程與驗證

        4.1 數(shù)據(jù)預(yù)處理

        本文利用GooSeeker數(shù)據(jù)爬取工具得到美團軟件中2016—2018年80家店鋪的美食評價數(shù)據(jù),總計3萬條。數(shù)據(jù)涵蓋:店鋪名稱、人均消費、評價用戶、評價時間、評價內(nèi)容與星級評分。綜合用戶的評價與評分,人工為評價的情感態(tài)度建立標(biāo)簽,然后引用jieba分詞工具對數(shù)據(jù)進行分詞操作后刪除停用詞,再進行文本數(shù)字化[13]。

        4.2 建立詞庫

        建立屬性詞庫。根據(jù)評價內(nèi)容,確定10個關(guān)于美食店鋪的母類屬性詞,包含環(huán)境、味道、服務(wù)等,利用本文提出的屬性聚類方法,將評價數(shù)據(jù)中其他的屬性詞依次聚類到母類屬性詞中得到屬性詞庫。強注意力詞句庫的建立,包含否定詞、程度詞、轉(zhuǎn)折詞,將“下次再去”等這類表示高度認可的詞語納入強注意力詞庫中。

        4.3 試驗流程

        本試驗的主要流程如圖3所示。

        4.4 RNN-MACWO模型試驗對比分析

        本試驗共3萬條評價數(shù)據(jù),將其中80%作為訓(xùn)練數(shù)據(jù),20%作為交叉驗證數(shù)據(jù)。對訓(xùn)練結(jié)果評價的指標(biāo)主要包括:精準(zhǔn)率(precision)、召回率(recall)和F1-Measure[14]。

        經(jīng)過3項指標(biāo)檢測,得到RNN-MACWO模型的測試結(jié)果,見表1。

        圖3 情感分析與店鋪推薦試驗流程

        標(biāo)簽precisionrecallF1好評0.860760.837960.84920中評0.811540.819800.81564差評0.878640.893360.88593

        為更好驗證本研究所提出模型作情感分析的質(zhì)量,利用相同試驗數(shù)據(jù)分別對多層全連接神經(jīng)網(wǎng)絡(luò)模型(multilayer fully connected neural network,MFCNN)與長短記憶神經(jīng)網(wǎng)絡(luò)模型(long short-term memory,LSTM)作試驗對比[15],測評結(jié)果見表2、表3。

        表2 MFCNN模型測試結(jié)果

        表3 LSTM模型測試結(jié)果

        為了更直觀地比較分析測評結(jié)果,將其可視化,如圖4、圖5、圖6所示。

        由圖可知,RNN-MACWO模型相較于另外兩種模型的準(zhǔn)確率有所提高,尤其體現(xiàn)在好評與差評的分類上,因為本模型結(jié)合屬性多輸出結(jié)果,并引入注意力參數(shù),增強了模型對情感態(tài)度的敏感度,使情感特征更清晰。且本模型具有更高的召回率,因為本模型提高轉(zhuǎn)折詞與否定詞后的評價內(nèi)容的權(quán)重,使模型對消極情感的捕捉更精準(zhǔn)可靠。

        圖4 3種模型的準(zhǔn)確率對比圖

        圖5 3種模型的召回率對比圖

        圖6 3種模型的F1值對比圖

        4.5 推薦算法試驗分析

        為驗證本文提出推薦算法的準(zhǔn)確性,基于80%的訓(xùn)練數(shù)據(jù)為其余20%的用戶做推薦,將得分排名前8的商鋪作為最終推薦商家,利用標(biāo)簽中的好評商鋪驗證推薦效果。

        根據(jù)標(biāo)簽信息,該20%評價數(shù)據(jù)中包含2249條好評,經(jīng)測算,利用推薦算法得到的推薦商鋪在好評商鋪中占比高達92%,由此可見,本推薦算法具有較高的可靠性,符合用戶對優(yōu)質(zhì)商鋪快速篩選的需求。

        5 結(jié) 語

        本文利用深度學(xué)習(xí)提出了一種RNN-MACWO情感分析模型。該模型挖掘出用戶潛在興趣點,利用注意力機制得到細粒度的分析結(jié)果。綜合考慮大量語料與特定主題下屬性詞的相似度,提出了一種屬性聚類算法,實現(xiàn)屬性詞聚類更全面準(zhǔn)確的效果,并結(jié)合商鋪數(shù)據(jù)與用戶偏好構(gòu)建推薦算法,達到個性化推薦效果,也為商家及時得到用戶反饋,提升店鋪品質(zhì)創(chuàng)造了可能。

        猜你喜歡
        聚類神經(jīng)網(wǎng)絡(luò)情感
        如何在情感中自我成長,保持獨立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        情感
        如何在情感中自我成長,保持獨立
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
        重型機械(2016年1期)2016-03-01 03:42:04
        基于改進的遺傳算法的模糊聚類算法
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
        中国精学生妹品射精久久 | 日本人妖熟女另类二区| 天天噜日日噜狠狠噜免费| 欧美极品少妇性运交| 久久久久久AV无码成人| 久久精品国产自产对白一区| 免费无码又爽又高潮视频| 国产自偷亚洲精品页65页| 福利网在线| 最新日本女优中文字幕视频| 日本熟妇人妻xxxx| 看曰本女人大战黑人视频| 精品人妻少妇一区二区中文字幕| 伊人狼人大香线蕉手机视频| 亚洲无av在线中文字幕| 亚洲av无码片在线观看| 国产在线天堂av| 国产精品一区二区熟女不卡| 影音先锋色小姐| 亚洲成a人片在线| 亚洲免费看三级黄网站| 国产精品国产三级第一集| 台湾无码av一区二区三区| 久久99热精品免费观看欧美| 日本女同av在线播放| 精品久久久bbbb人妻| 亚洲自偷自偷偷色无码中文| 水蜜桃视频在线观看免费18| 中文有码人妻字幕在线| 久久久久人妻精品一区蜜桃| 在线视频一区二区日韩国产| 中文乱码字幕人妻熟女人妻| 精品日韩亚洲av无码| 国产午夜福利短视频| 人妻少妇久久精品一区二区| 国产亚洲超级97免费视频| 色八a级在线观看| 国产亚洲精品综合在线网址| 日本一区二区三区熟女俱乐部| 欧美亚洲熟妇一区二区三区| 精品无码久久久九九九AV|