亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        深度學習下的情感分析與推薦算法

        2018-10-09 03:05:24慧,柳林,劉曉,程
        測繪通報 2018年9期
        關鍵詞:聚類神經(jīng)網(wǎng)絡情感

        郭 慧,柳 林,劉 曉,程 鵬

        (山東科技大學測繪科學與工程學院,山東 青島 266590)

        如今的餐飲越來越離不開網(wǎng)絡,在篩選商家時歷史評價起到至關重要的作用。傳統(tǒng)的美食推薦算法只是基于用戶的地理位置、歷史消費及瀏覽記錄,未充分利用用戶的反饋數(shù)據(jù)。本研究利用情感分析技術將海量的評價數(shù)據(jù)作為個性化推薦的依據(jù)。情感分析(sentiment analysis,SA)是通過用戶對產(chǎn)品的評價,判斷用戶情感態(tài)度的分類過程[1],主要包括語義方法與機器學習方法[2]。利用機器學習進行情感分析的結果更精準,有廣闊的研究空間[3]。最早,Pang等[4]作了初步探索,此后,Mikolov等[5-6]系統(tǒng)性提出word2vec框架,Socher等[7-8]提出利用循環(huán)神經(jīng)網(wǎng)絡進行情感分析?;谇叭说难芯?,本文將重點討論利用優(yōu)化循環(huán)神經(jīng)網(wǎng)絡對美食評價數(shù)據(jù)進行情感分析與推薦算法的實現(xiàn)。

        1 傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡的情感分析

        循環(huán)神經(jīng)網(wǎng)絡是一種對序列數(shù)據(jù)建模的網(wǎng)絡[9],其結構如圖1所示。

        圖1 循環(huán)神經(jīng)網(wǎng)絡結構

        a〈n〉=g1(Waaa〈n-1〉+WaxX〈n〉+ba)

        (1)

        (2)

        式中,g1為tanh或Rell激勵函數(shù);g2為sigmoid激勵函數(shù);ba、by為偏重值。

        2 多重屬性聚類加權輸出的循環(huán)神經(jīng)網(wǎng)絡

        2.1 屬性聚類

        不同用戶評價時采用的屬性詞不同,為避免龐大的計算量[10],本研究提出一種屬性聚類的方法。首先,根據(jù)評價主題,建立n個母類屬性W母類={W1,…,Wn},然后識別評價中的屬性詞w={w1,…,wm}(n

        similarity(W母類,w)=

        (3)

        計算結果越大表示此屬性詞與該母類屬性的含義越相似。不同于傳統(tǒng)PMI計算表達式,本公式經(jīng)試驗調(diào)試引入?yún)?shù),增大共現(xiàn)概率的準入口徑以提高特定主題評價信息的權重。

        2.2模型結構

        傳統(tǒng)利用循環(huán)神經(jīng)網(wǎng)絡進行情感分析的方法僅僅是多對一的RNN結構,不利于捕捉用戶對店鋪不同屬性的情感態(tài)度。因此,本研究提出一種基于聚類屬性加權輸出的循環(huán)神經(jīng)網(wǎng)絡(RNN-multiple attribute clustering weighting output,RNN-MACWO)模型,如圖2所示。

        圖2 多重屬性聚類加權輸出的循環(huán)神經(jīng)網(wǎng)絡結構

        對第一個屬性“味道”的態(tài)度詞進行情感分析后,得到第一部分的分析結果,然后參數(shù)重置,分析下一個屬性的情感得分,最終將每一個屬性得分按照注意力機制分配得出該條評價總體的情感態(tài)度。

        2.3 注意力機制

        為了符合情感表達的一般特點,對評價內(nèi)容的分析需要有所側重,因此,引入注意力機制,提高特定詞句的注意力參數(shù),參數(shù)計算公式為

        (4)

        2.4 模型訓練

        本模型的情感分類器采用多分類模型,訓練分類器時選用Softmax函數(shù)[11],將交叉熵作為損失函數(shù),L2函數(shù)作正則化(如式(5)所示),利用反向傳播進行參數(shù)的修正[12]。

        (5)

        3 基于店鋪屬性與用戶聚類推薦

        3.1 建立商鋪數(shù)據(jù)庫

        為了利用RNN-MACWO模型更高效地分析海量評價信息,建立商鋪數(shù)據(jù)庫,該數(shù)據(jù)庫包含屬性、好評、中評、差評4個字段,屬性字段中包括環(huán)境、味道等屬性詞,在好、中、差評價中分別添加與更新店鋪的名稱。

        3.2 用戶聚類與用戶數(shù)據(jù)庫

        每位用戶對店鋪的關注點和挑剔度不同,而這些信息往往體現(xiàn)在其評價中,基于這兩個特征聚類相似用戶并建立數(shù)據(jù)庫,使之作為推薦商家的依據(jù),具有更強的匹配度與個性化。

        (6)

        式中,j為店鋪;i為用戶,分別設定0、1、2為低、中、高挑剔度的標簽。將每位用戶的關注點與其挑剔度映射到某一空間,采用余弦相似度計算公式(如式(7)所示)對用戶進行相似聚類并為每位用戶建立數(shù)據(jù)庫,包含用戶名、關注點、挑剔度、相似用戶4個字段。

        (7)

        3.3 構建推薦算法

        (8)

        4 試驗過程與驗證

        4.1 數(shù)據(jù)預處理

        本文利用GooSeeker數(shù)據(jù)爬取工具得到美團軟件中2016—2018年80家店鋪的美食評價數(shù)據(jù),總計3萬條。數(shù)據(jù)涵蓋:店鋪名稱、人均消費、評價用戶、評價時間、評價內(nèi)容與星級評分。綜合用戶的評價與評分,人工為評價的情感態(tài)度建立標簽,然后引用jieba分詞工具對數(shù)據(jù)進行分詞操作后刪除停用詞,再進行文本數(shù)字化[13]。

        4.2 建立詞庫

        建立屬性詞庫。根據(jù)評價內(nèi)容,確定10個關于美食店鋪的母類屬性詞,包含環(huán)境、味道、服務等,利用本文提出的屬性聚類方法,將評價數(shù)據(jù)中其他的屬性詞依次聚類到母類屬性詞中得到屬性詞庫。強注意力詞句庫的建立,包含否定詞、程度詞、轉(zhuǎn)折詞,將“下次再去”等這類表示高度認可的詞語納入強注意力詞庫中。

        4.3 試驗流程

        本試驗的主要流程如圖3所示。

        4.4 RNN-MACWO模型試驗對比分析

        本試驗共3萬條評價數(shù)據(jù),將其中80%作為訓練數(shù)據(jù),20%作為交叉驗證數(shù)據(jù)。對訓練結果評價的指標主要包括:精準率(precision)、召回率(recall)和F1-Measure[14]。

        經(jīng)過3項指標檢測,得到RNN-MACWO模型的測試結果,見表1。

        圖3 情感分析與店鋪推薦試驗流程

        標簽precisionrecallF1好評0.860760.837960.84920中評0.811540.819800.81564差評0.878640.893360.88593

        為更好驗證本研究所提出模型作情感分析的質(zhì)量,利用相同試驗數(shù)據(jù)分別對多層全連接神經(jīng)網(wǎng)絡模型(multilayer fully connected neural network,MFCNN)與長短記憶神經(jīng)網(wǎng)絡模型(long short-term memory,LSTM)作試驗對比[15],測評結果見表2、表3。

        表2 MFCNN模型測試結果

        表3 LSTM模型測試結果

        為了更直觀地比較分析測評結果,將其可視化,如圖4、圖5、圖6所示。

        由圖可知,RNN-MACWO模型相較于另外兩種模型的準確率有所提高,尤其體現(xiàn)在好評與差評的分類上,因為本模型結合屬性多輸出結果,并引入注意力參數(shù),增強了模型對情感態(tài)度的敏感度,使情感特征更清晰。且本模型具有更高的召回率,因為本模型提高轉(zhuǎn)折詞與否定詞后的評價內(nèi)容的權重,使模型對消極情感的捕捉更精準可靠。

        圖4 3種模型的準確率對比圖

        圖5 3種模型的召回率對比圖

        圖6 3種模型的F1值對比圖

        4.5 推薦算法試驗分析

        為驗證本文提出推薦算法的準確性,基于80%的訓練數(shù)據(jù)為其余20%的用戶做推薦,將得分排名前8的商鋪作為最終推薦商家,利用標簽中的好評商鋪驗證推薦效果。

        根據(jù)標簽信息,該20%評價數(shù)據(jù)中包含2249條好評,經(jīng)測算,利用推薦算法得到的推薦商鋪在好評商鋪中占比高達92%,由此可見,本推薦算法具有較高的可靠性,符合用戶對優(yōu)質(zhì)商鋪快速篩選的需求。

        5 結 語

        本文利用深度學習提出了一種RNN-MACWO情感分析模型。該模型挖掘出用戶潛在興趣點,利用注意力機制得到細粒度的分析結果。綜合考慮大量語料與特定主題下屬性詞的相似度,提出了一種屬性聚類算法,實現(xiàn)屬性詞聚類更全面準確的效果,并結合商鋪數(shù)據(jù)與用戶偏好構建推薦算法,達到個性化推薦效果,也為商家及時得到用戶反饋,提升店鋪品質(zhì)創(chuàng)造了可能。

        猜你喜歡
        聚類神經(jīng)網(wǎng)絡情感
        如何在情感中自我成長,保持獨立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        神經(jīng)網(wǎng)絡抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        情感
        如何在情感中自我成長,保持獨立
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
        重型機械(2016年1期)2016-03-01 03:42:04
        基于改進的遺傳算法的模糊聚類算法
        復數(shù)神經(jīng)網(wǎng)絡在基于WiFi的室內(nèi)LBS應用
        基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡的PID整定
        美女脱掉内裤扒开下面让人插| 国产在线美女| 好爽~又到高潮了毛片视频| 亚洲精品456在线播放狼人| 亚洲熟女精品中文字幕| 国精品无码一区二区三区在线| 国产免费av片在线观看播放| 日韩美女人妻一区二区三区| 国产黄色av一区二区三区| 伊人久久大香线蕉综合网站| 国产高清无码91| 亚洲av色香蕉第一区二区三区| 日韩中文字幕有码午夜美女| 女邻居的大乳中文字幕| 色999欧美日韩| 国产精品一区又黄又粗又猛又爽 | 日产精品久久久久久久性色| 久久这里都是精品一区| 亚洲精品一区二区三区四区| 精品av熟女一区二区偷窥海滩| 午夜丰满少妇性开放视频| 91精品国产91久久综合桃花| 亚洲一区二区三区在线看| av狠狠色丁香婷婷综合久久| 伊人久久网国产伊人| 精品蜜桃视频在线观看| 久久九九精品国产av| 久久亚洲色www成人欧美| 亚洲国产精品国语在线| 国产精品美女主播在线| 国产夫妇肉麻对白| 婷婷综合久久中文字幕蜜桃三电影| 亚洲av噜噜狠狠蜜桃| 人妻久久一区二区三区蜜桃| 女人被爽到呻吟gif动态图视看 | 国产精品v片在线观看不卡| 午夜性刺激免费视频| 亚洲日本国产一区二区三区| 久久久久久自慰出白浆| 法国啄木乌av片在线播放| 午夜视频福利一区二区三区 |