亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        引入用戶情感偏好矩陣的ItemCF算法研究

        2019-07-08 03:41:08岳強(qiáng)郭強(qiáng)李仁德
        軟件導(dǎo)刊 2019年6期
        關(guān)鍵詞:推薦算法

        岳強(qiáng) 郭強(qiáng) 李仁德

        摘 要:傳統(tǒng)基于物品的協(xié)同過濾算法(ItemCF)利用物品間的相似性為用戶提供個性化推薦,然而該方法僅考慮了評分?jǐn)?shù)據(jù),而未關(guān)注用戶情感偏好?;趶脑u論中的emoji表情提煉出的用戶情感偏好,提出一種引入用戶情感編號矩陣的ItemCF算法。該方法利用物品共現(xiàn)矩陣與用戶情感偏好矩陣計算物品相似度,進(jìn)而進(jìn)行個性化推薦。根據(jù)某在線互聯(lián)網(wǎng)教育實證數(shù)據(jù)集的實驗結(jié)果表明,該方法相比于傳統(tǒng)基于物品的協(xié)同過濾算法,在準(zhǔn)確率和召回率上都有所提升,在Top1-5推薦均值上分別提高了0.02和0.03。

        關(guān)鍵詞:推薦算法;ItemCF;用戶情感偏好;emoji表情

        DOI:10. 11907/rjdk. 182557

        中圖分類號:TP312

        文獻(xiàn)標(biāo)識碼:A文章編號:1672-7800(2019)006-0056-04

        Abstract: The traditional item-based collaborative filtering (ItemCF) algorithm makes use of similarity between items to make individual recommendation to users. However, ItemCF only considers rating data and does not pay attention to usersemotional preferences. Based on user emotional preferences extracted from emoji expressions in reviews, an ItemCF algorithm with user emotional numbering matrix is proposed. This method uses the item co-occurrence matrix and the users affective preference matrix to calculate the item similarity, and then carries on the personalized recommendation. Experimental results on an online Internet education data set show that the proposed method outperforms the traditional item-based collaborative filtering algorithm in terms of accuracy and recall, and improves by 0.02 and 0.03 respectively on the average of Top1-5 recommendation.

        Key Words: recommendation algorithms; ItemCF; user emotional preferences; emoji exprersions

        0 引言

        推薦是解決當(dāng)今互聯(lián)網(wǎng)信息過載問題的主要途徑之一[1],為此國內(nèi)外眾多專家、學(xué)者們研究了各類推薦算法。其中,協(xié)同過濾(Collaboration Filtering)推薦是目前應(yīng)用最廣泛的個性化推薦算法[2]。其核心思想是,利用目標(biāo)用戶的相似用戶對特定物品的評價,產(chǎn)生該用戶對此物品的評價預(yù)測[3-5]。協(xié)同過濾算法的最大優(yōu)點是對推薦對象沒有特殊要求,能處理電影、音樂等難以進(jìn)行文本結(jié)構(gòu)化表示的對象[6-7]。但協(xié)同過濾算法存在評分?jǐn)?shù)據(jù)稀疏性等問題,并且只考慮了用戶評分?jǐn)?shù)據(jù),卻忽略了用戶本身的情感偏好[8]。

        與此同時,emoji表情已成為當(dāng)今世界人們相互溝通的一個必不可少的工具[9-10],幾乎所有社交平臺都在廣泛使用emoji表情符號[11-12]。Novak等[13]認(rèn)為emoji表情是用于表達(dá)情感和想法,并將情感可視化的一種符號;Vidal等[14]研究發(fā)現(xiàn),在推特上12 260條關(guān)于早餐、午餐和晚餐的推文中,emoji表情比文字更頻繁地用來表達(dá)用戶情感。對emoji表情的分析與研究是未來的趨勢[15],為此本文嘗試從評論的emoji表情中提煉出用戶情感偏好,提出一種引入用戶情感偏好矩陣的ItemCF推薦算法。通過提取評論中的emoji表情,依據(jù)情感分成積極、中立和消極3類,并分別給每類情感賦予不同權(quán)重;然后計算不同類emoji表情數(shù)量的加權(quán)和以表征用戶情感,構(gòu)建出用戶情感偏好矩陣;最后利用物品同現(xiàn)矩陣計算物品間的相似度,進(jìn)而進(jìn)行個性化推薦。

        1 情感計算

        本文采用某在線互聯(lián)網(wǎng)教育中的用戶評論數(shù)據(jù)集,評估本文算法的性能。該數(shù)據(jù)集包含2017年1~3月間共1 324 501條用戶評論記錄,其中用戶評論是指用戶在選擇過的某一社團(tuán)刊物(下文簡稱為“社刊”)上發(fā)表的評論,一個用戶可對某一社刊進(jìn)行多次評論。本文定義上述實證數(shù)據(jù)為原始數(shù)據(jù),在原始數(shù)據(jù)中不難發(fā)現(xiàn)用戶會在社刊上發(fā)表帶有emoji表情的評論。經(jīng)統(tǒng)計可知,有emoji表情評論記錄的社刊占所有社刊數(shù)量的89%。

        1.1 emoji表情提取

        在計算用戶情感之前,需要對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與emoji表情提取。首先刪除不含emoji表情的評論記錄;其次,用戶在評論中發(fā)表的不同emoji表情數(shù)量通常不大于3種,為防止用戶灌水,即在一條評論中發(fā)送很多不同的emoji表情,刪除表情種類多于3種的記錄;接下來考慮到極少社刊擁有的用戶數(shù)小于3個,其中擁有用戶數(shù)為1的社刊,唯一一個用戶為社刊創(chuàng)刊者,為保證社刊品質(zhì),刪除擁有用戶數(shù)小于3個的社刊記錄。

        本文定義原始數(shù)據(jù)在經(jīng)過上述3個步驟后保留下來的數(shù)據(jù)為篩選數(shù)據(jù)。為了獲得更稠密的數(shù)據(jù),本文在篩選數(shù)據(jù)上構(gòu)造了投影網(wǎng)絡(luò)[16],即將某用戶評論過某一社刊視作一個新單元節(jié)點,若與其它單元節(jié)點存在相同用戶或社刊則產(chǎn)生連邊。最后,在投影網(wǎng)絡(luò)上應(yīng)用k核分解[17]。實驗中k取最大值3 442,便可得到最核心的單元節(jié)點。

        從上述最大k值所對應(yīng)的單元節(jié)點中,保留用戶和社刊信息,并分別定義該部分用戶與社刊為核心用戶和核心社刊,再從篩選數(shù)據(jù)中篩選出包含該部分核心用戶與社刊的評論數(shù)據(jù),即篩選后的評論數(shù)據(jù)是由核心用戶對核心社刊所發(fā)表的包含emoji表情的評論數(shù)據(jù),本文定義該部分?jǐn)?shù)據(jù)為實驗數(shù)據(jù)。至此,數(shù)據(jù)清洗及emoji表情提取工作全部結(jié)束。

        1.2 用戶情感計算

        經(jīng)過數(shù)據(jù)清洗,得到15 370條數(shù)據(jù)記錄。在這些記錄中共提取出126種emoji表情,并由7名志愿者將所有表情主觀地分成3類,分別為:積極、中立和消極。為了檢驗志愿者主觀分類結(jié)果的一致性,避免出現(xiàn)某個志愿者胡亂分類的情況,本文對分類結(jié)果進(jìn)行了Krippendorff's alpha檢驗[18]。當(dāng)Alpha值大于基準(zhǔn)值0.6時,表明不同志愿者分類結(jié)果間的差異是可以被接受的[19]。文中實驗的Alpha值為0.706 9,大于基準(zhǔn)值0.6,所以志愿者的分類結(jié)果是可取的。之后,對7名志愿者的分類結(jié)果取眾數(shù),即獲得相應(yīng)emoji表情的所屬分類。

        4 結(jié)語

        emoji表情已成為互聯(lián)網(wǎng)時代必不可少的元素之一,是人們表達(dá)情感的重要載體。通過分析海量emoji表情信息,可以了解用戶情緒狀況、對某個社會現(xiàn)象的觀點,以及對某款產(chǎn)品的偏好等。本文從用戶情感角度入手,將emoji表情引入到ItemCF推薦算法中,但推薦效果依賴于評論中emoji 表情轉(zhuǎn)化成用戶情感的準(zhǔn)確性。因此,未來工作可對文中emoji表情進(jìn)行更加細(xì)致的分類,使提煉出的用戶情感更為精確,從而提高推薦效果。

        參考文獻(xiàn):

        [1] 劉建國,周濤,郭強(qiáng),等. 個性化推薦系統(tǒng)評價方法綜述[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2009, 6(3): 1-10.

        [2] 周軍鋒,湯顯,郭景峰. 一種優(yōu)化的協(xié)同過濾推薦算法[J]. 計算機(jī)研究與發(fā)展,2004, 41(10): 1842-1847.

        [3] 鄧曉懿,金淳, 韓慶平,等. 基于情境聚類和用戶評級的協(xié)同過濾推薦模型[J]. 系統(tǒng)工程理論與實踐,2013,33(11): 2945-2953.

        [4] 熊聰聰,鄧瀅,史艷翠,等. 基于協(xié)同過濾的美食推薦算法[J]. 計算機(jī)應(yīng)用研究,2017,34(7):1985-1988.

        [5] 鄧愛林,左子葉,朱揚(yáng)勇. 基于項目聚類的協(xié)同過濾推薦算法[J]. ?小型微型計算機(jī)系統(tǒng),2004,25(9):1665-1670.

        [6] 羅辛,歐陽元新,熊璋,等. 通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[J]. 計算機(jī)學(xué)報, 2010,33(8): 1437-1445.

        [7] 榮輝桂,火生旭,胡春華,等. 基于用戶相似度的協(xié)同過濾推薦算法[J]. 通信學(xué)報,2014,13(2):16-24.

        [8] 馬宏偉,張光衛(wèi),李鵬. 協(xié)同過濾推薦算法綜述[J]. 小型微型計算機(jī)系統(tǒng),2009,30(7):1282-1288.

        [9] 趙屹星垚. Emoji表情中的受眾心理研究[J]. 設(shè)計藝術(shù)研究, 2016,6(1):46-49.

        [10] 金芊芊. Emoji表情符號的藝術(shù)價值[J]. 常州工學(xué)院學(xué)報:社科版,2017,35(3): 52-55.

        [11] 楊莞桐. 青年群體emoji表情符號使用情況調(diào)查與研究[J]. 人間,2016,217(22):17-19.

        [12] TANG D, QIN B, LIU T. Document modeling with gated recurrent neural network for sentiment classification[C]. Conference on Empirical Methods in Natural Language Processing,2015: 1422-1432.

        [13] NOVAK P K, SMAILOVI? J, SLUBAN B, et al. Sentiment of emojis[J]. ?PloS one, 2015, 10(12): e0144296.

        [14] VIDAL L, ARES G, JAEGER S R. Use of emoticon and emoji in tweets for food-related emotional expression[J]. Food Quality & Preference, 2015, 49(6): 119-128.

        [15] 許雅. 移動社交語境下Emoji表情的傳播態(tài)勢與功能探究[J]. ?新媒體研究,2016, 2(8): 24-28.

        [16] J?SCHKE R,MARINHO L,HOTHO A,et al. Tag recommendations in folksonomies[M]. Knowledge Discovery in Databases:PKDD 2007. Springer Berlin Heidelberg, 2007:506-514.

        [17] BATAGELJ V, ZAVER?NIK M. Generalized cores[J]. arXiv preprint cs/0202039,2002.

        [18] KRIPPENDORFF K. Agreement and information in the reliability of coding[J]. Communication Methods and Measures,2011,5(2): 93-112.

        [19] HAYES A F. SPSS macro for computing Krippendorff's alpha[J]. ?Retrieved September, 2006, 6(4):17-20.

        [20] 項亮. 推薦系統(tǒng)實踐[M]. 北京:人民郵電出版社,2012.

        (責(zé)任編輯:黃 ?。?/p>

        猜你喜歡
        推薦算法
        基于內(nèi)容的互聯(lián)網(wǎng)推薦算法
        一種改進(jìn)用戶相似度的協(xié)同過濾推薦算法
        XGBoost算法在電子商務(wù)商品推薦中的應(yīng)用
        基于二分Kmeans的協(xié)同過濾推薦算法
        校園社交平臺中標(biāo)簽系統(tǒng)的研究
        基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
        社交網(wǎng)絡(luò)推薦系統(tǒng)
        混合推薦算法在電影推薦中的研究與評述
        一種改進(jìn)的基于位置的推薦算法
        基于情景感知的高校移動社交網(wǎng)絡(luò)平臺設(shè)計與開發(fā)
        中文字幕一区二区三区精品在线| 老师露出两个奶球让我吃奶头| 亚洲精品夜夜夜妓女网| 曰批免费视频播放免费| 日韩精品久久久久久免费| 亚洲av永久无码精品三区在线| 无人高清电视剧在线观看| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 一区二区在线亚洲av蜜桃| 国产日韩精品视频一区二区三区 | 国产自国产自愉自愉免费24区| 国产极品视觉盛宴| 九一九色国产| 日韩AV有码无码一区二区三区| 成人午夜视频在线观看高清| 亚洲视频在线观看青青草| 亚洲精品国产综合久久| 国产精品成人av一区二区三区| 亚洲色偷偷偷综合网| 日韩欧群交p片内射中文| 久久久久久人妻一区二区三区| 98国产精品永久在线观看| 久久精品亚洲乱码伦伦中文| 国内揄拍国内精品人妻久久| 国产精品一区二区性色| 国产做无码视频在线观看| 99精品国产99久久久久久97 | 久久久久人妻精品一区5555| 国产美女自拍国语对白| 亚洲av一二三四又爽又色又色| 国语对白自拍视频在线播放| av熟妇一区二区三区| 精品三级av无码一区| 亚洲熟妇色xxxxx欧美老妇| 日本岛国一区二区三区| 麻豆成人久久精品二区三区免费| 99精品久久99久久久久| 精品国产午夜理论片不卡| 亚洲AV无码久久精品国产老人| 四虎在线中文字幕一区| 自拍成人免费在线视频|