亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合上下文感知計(jì)算的協(xié)同過濾算法

        2018-12-29 02:16:56楊媛媛張桂蕓
        關(guān)鍵詞:準(zhǔn)確率矩陣融合

        楊媛媛,張桂蕓,劉 洋

        (天津師范大學(xué)計(jì)算機(jī)與信息工程學(xué)院,天津300387)

        近年來,利用上下文感知進(jìn)行推薦成為推薦算法研究最為活躍的領(lǐng)域之一,但如何利用上下文信息以及有效融合上下文信息依然是一個(gè)開放性的話題.截至目前上下文還沒有一個(gè)統(tǒng)一的定義,很多時(shí)候需要根據(jù)具體應(yīng)用系統(tǒng)或者用戶需求引入合適的上下文類型及其具體屬性[1].在基于上下文的推薦系統(tǒng)研究中,上下文信息有很多分類,根據(jù)上下文在推薦生成過程中所起的作用,可以將其分為3類,分別是上下文預(yù)過濾、上下文后過濾以及上下文建模[2-3].目前大多數(shù)研究都停留在上下文過濾層面,并沒有有效融合上下文信息.文獻(xiàn)[4]通過移動(dòng)端傳感器,利用上下文信息的預(yù)過濾,篩選用戶行為上下文與音樂之間的關(guān)系,并基于此對用戶進(jìn)行推薦,這種方式對移動(dòng)端的推薦具有借鑒意義,但泛化能力弱,難以應(yīng)用到其他推薦場景中.文獻(xiàn)[5]利用上下文后過濾進(jìn)行推薦結(jié)果優(yōu)化,并融合多種排序算法生成最終推薦結(jié)果,進(jìn)而改善音樂的推薦效果,為融合上下文信息提供了一個(gè)很好的方向,但是該算法只停留在利用上下文信息進(jìn)行過濾階段,對上下文信息利用不充分.文獻(xiàn)[6]在推薦過程中首先結(jié)合上下文信息進(jìn)行過濾,然后對用戶興趣建模分析,提高電視平臺(tái)的推薦準(zhǔn)確率,但對上下文信息的利用只存在于數(shù)據(jù)篩選和過濾層面,沒有在算法推薦過程中充分融合上下文信息.本文深入挖掘上下文信息并進(jìn)行建模,針對當(dāng)下應(yīng)用最廣泛的協(xié)同過濾算法,詳細(xì)分析算法的各個(gè)環(huán)節(jié),在傳統(tǒng)算法的基礎(chǔ)上進(jìn)行優(yōu)化,提出一種上下文感知計(jì)算的協(xié)同過濾推薦算法,算法將上下文信息與項(xiàng)目相似度進(jìn)行融合建模,深度利用上下文信息進(jìn)行推薦,在保留傳統(tǒng)算法優(yōu)勢的同時(shí),盡可能最大化融合上下文信息.本文假設(shè)相似的項(xiàng)目具有相似的上下文信息,因此選擇在相似度計(jì)算過程中融合上下文信息,從而改善推薦精度,該算法可以在很大程度上滿足用戶的偏好和選擇,更符合用戶應(yīng)時(shí)應(yīng)景的需求,算法適用于非文本信息的推薦場景.以個(gè)性化音樂推薦為例,對用戶及音樂的上下文信息進(jìn)行分析,為用戶進(jìn)行個(gè)性化推薦,并在公開的音樂數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn).

        1 相關(guān)理論基礎(chǔ)

        1.1 傳統(tǒng)的基于項(xiàng)目協(xié)同過濾算法

        基于項(xiàng)目的協(xié)同過濾算法主要分為2步:先計(jì)算項(xiàng)目之間的相似度,然后根據(jù)項(xiàng)目的相似度和用戶的歷史行為為用戶生成推薦列表[7-8].項(xiàng)目相似度的度量方法主要包括3種:余弦相似性、Pearson相關(guān)系數(shù)和修正的余弦相似性[9].本文采用最經(jīng)典的余弦相似度.對于項(xiàng)目 i和項(xiàng)目 j,N(i)、N(j)分別表示喜歡項(xiàng)目 i、j的用戶集合,項(xiàng)目 i、j之間的相似度用 sim(N(i),N(j))表示,其計(jì)算公式為

        其中:|N(i)|、|N(j)|分別為喜歡項(xiàng)目 i、 j的用戶數(shù)(也就是對項(xiàng)目有過標(biāo)記,打分等行為的用戶數(shù)量),而分子|N(i)∩N(j)|為同時(shí)喜歡項(xiàng)目 i和項(xiàng)目 j的用戶數(shù).根據(jù)項(xiàng)目相似度,為用戶生成最喜歡的K個(gè)項(xiàng)目,即生成推薦列表,步驟如下:

        (1)建立用戶-項(xiàng)目倒排表,為每個(gè)用戶生成用戶喜歡的項(xiàng)目列表.

        (2)遍歷用戶-項(xiàng)目倒排表,建立項(xiàng)目的同現(xiàn)矩陣Mp×p=(mij),mij=|N(i)∩N(j)|.

        (3)通過式(1)計(jì)算項(xiàng)目相似度,得到相似度矩陣 Cp×p.

        (4)針對指定用戶u,生成該用戶可能最喜歡的K個(gè)項(xiàng)目的推薦列表,用戶u對未知項(xiàng)目j的興趣度puj為

        其中:N(u)為 u喜歡的項(xiàng)目的集合,S(j,K)為和項(xiàng)目j最相似的K個(gè)項(xiàng)目的集合,rui為指定用戶u對項(xiàng)目i的興趣度.

        1.2 上下文及上下文感知計(jì)算

        上下文是一個(gè)非常寬泛的概念,在不同的研究領(lǐng)域有不同的定義.本文使用Dey的定義[10].上下文感知信息分為4種,包括時(shí)間、地點(diǎn)、天氣和溫度的物理上下文;用戶的身份角色、社交對象等社會(huì)上下文;用戶的心情、行為目標(biāo)、經(jīng)驗(yàn)、認(rèn)知能力等的狀態(tài)上下文;推薦信息類型(文本、圖片、視頻等)的交互媒體上下文[11-12].音樂數(shù)據(jù)中包含如情緒、風(fēng)格、主題、年代、樂器等上下文信息.若某個(gè)數(shù)據(jù)有k個(gè)有效的上下文屬性,則此數(shù)據(jù)的上下文集合可定義為

        上下文Ci的離散屬性取值集合為{ci1,ci2,…,cij,…}.若定義音樂數(shù)據(jù)的上下文Context={C1,C2},C1表示“主題”,C2表示“流派”,則C1的取值集合可定義為{情歌,紅歌,兒歌},C2的取值集合可定義為{古典,嘻哈、搖滾}.

        本文運(yùn)用上下文建模方式,將項(xiàng)目的上下文相似度與項(xiàng)目相似度加權(quán)融合,雖然這種方式計(jì)算較為復(fù)雜,但對于提高項(xiàng)目相似度的計(jì)算精度有很大幫助,進(jìn)而提高推薦算法的精度.

        2 融合上下文感知計(jì)算的協(xié)同過濾算法

        2.1 融合上下文相似度的項(xiàng)目相似度計(jì)算

        本文假設(shè)項(xiàng)目的上下文相似度越高,則項(xiàng)目的相似度就越高.在音樂推薦里,設(shè)歌曲a、b、c的用戶評分一樣,即 sim(a,b)=sim(b,c)=sim(a,c).但若歌曲 a、c的屬性“主題”為“情歌”,b的屬性“主題”為“紅歌”,則應(yīng)該 sim(a,c)≠sim(a,b)=sim(b,c).因此本文依據(jù)項(xiàng)目i、j共同擁有的上下文屬性值數(shù)目,計(jì)算項(xiàng)目的上下文相似度.假設(shè) C(i)、C(j)分別為項(xiàng)目i、j擁有的上下文屬性值集合,則項(xiàng)目i和j的上下文相似度計(jì)算公式為

        其中: |C(i)|、|C(j)|分別為項(xiàng)目 i、 j擁有的上下文屬性值數(shù)目,分子|C(i)∩C(j)|為項(xiàng)目 i和項(xiàng)目 j共同擁有的上下文屬性值數(shù)目.

        引入權(quán)重因子α(0<α<1),計(jì)算融合上下文相似度的項(xiàng)目相似度,項(xiàng)目i、j的相似度計(jì)算公式為

        2.2 融合上下文感知計(jì)算的協(xié)同過濾算法設(shè)計(jì)思想

        本文設(shè)計(jì)的融合上下文感知計(jì)算的協(xié)同過濾算法的基本步驟如下:

        (1)首先建立用戶-項(xiàng)目倒排表.遍歷倒排表,填充項(xiàng)目的同現(xiàn)矩陣,同現(xiàn)矩陣建立之后通過式(1)計(jì)算項(xiàng)目的余弦相似度,同現(xiàn)矩陣歸一化處理后記為An×n.

        (2)建立上下文感知信息-項(xiàng)目倒排表,統(tǒng)計(jì)不同項(xiàng)目擁有的共同上下文感知信息,建立項(xiàng)目的上下文信息同現(xiàn)矩陣.利用式(4)計(jì)算項(xiàng)目上下文相似度,歸一化之后的同現(xiàn)矩陣記為Bn×n,bij為項(xiàng)目i、j的上下文相似度.

        (3)將得到的2個(gè)相似度矩陣帶入式(5)計(jì)算得wij=(αaij+(1- α)bij)/2,進(jìn)而得到融合上下文相似度的項(xiàng)目相似度矩陣,記為Wn×n.

        (4)建立所有用戶對項(xiàng)目的興趣矩陣,記為Rn×m,矩陣值riu為用戶u對項(xiàng)目i的興趣度(評分),用戶沒有評分的項(xiàng)目興趣度記為0.矩陣的列是全部用戶的集合,行是所有項(xiàng)目的集合.

        (5)遍歷用戶興趣度矩陣,計(jì)算出所有用戶對未知項(xiàng)目j的興趣度值,通過下式計(jì)算用戶u對未知項(xiàng)目j的興趣度 puj:

        (6)將步驟(3)和(4)的項(xiàng)目相似度矩陣 Wn×n和用戶興趣矩陣Rn×m相乘得到用戶對未評分的項(xiàng)目的興趣度,根據(jù)興趣度值排序,得到最后的推薦結(jié)果.

        3 實(shí)驗(yàn)及結(jié)果分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)集

        實(shí)驗(yàn)采用的數(shù)據(jù)來自Last.fm在線音樂系統(tǒng)的用戶行為記錄,包括用戶的社交信息、音樂標(biāo)簽、用戶的聆聽信息等.Last.fm數(shù)據(jù)集包含2 000位用戶(user)對18 000多首歌曲(item)形成的超過105條的用戶聆聽紀(jì)錄,以及超過1.8×105條用戶對音樂的標(biāo)注信息.利用這些信息生成項(xiàng)目相似度矩陣,矩陣維度為35 612×35 612,行和列分別是item ID,矩陣元素值為不同item之間的相似度.本文將以上用戶對音樂的行為數(shù)據(jù)按照3∶1的比例分為訓(xùn)練集和測試集進(jìn)行實(shí)驗(yàn).

        以下舉例說明實(shí)驗(yàn)過程.首先建立用戶-項(xiàng)目倒排表,將用戶喜歡的所有項(xiàng)目及用戶對項(xiàng)目的興趣度值生成列表,示意數(shù)據(jù)見表1.

        表1 用戶-項(xiàng)目表(部分示意數(shù)據(jù))Tab.1 User-item table(partial schematic)

        遍歷倒排表,建立項(xiàng)目的同現(xiàn)矩陣,如用戶2對項(xiàng)目(51,52,53,54,55)有評分,則記同現(xiàn)矩陣中(51,51),(51,52),(51,53),(51,54),…的值為 1,以此類推.利用式(1)進(jìn)一步處理得到相似度矩陣A.接著建立上下文感知信息-項(xiàng)目倒排表,示意數(shù)據(jù)見表2.

        表2 上下文感知信息-項(xiàng)目表(部分示意數(shù)據(jù))Tab.2 Context perception information-music item table(partial schematic data)

        如項(xiàng)目(1324,11103,7343,5704)包含相同的上下文感知信息,則記上下文信息同現(xiàn)矩陣中(1 324,11103),(1324,7343),(1324,5704),(11103,7343)等的值為1,以此類推,直到遍歷完倒排表中所有信息,利用式(4)處理得到上下文相似度矩陣B.然后利用式(5)進(jìn)一步計(jì)算得到融合上下文相似度的項(xiàng)目相似度矩陣W.最后按用戶分組,如根據(jù)用戶2對51,52,53,…的評分記錄,建立興趣矩陣R[(51,13 883),(52,11 690),(53,11 351),(54,10 300),(55,8 983),…],通過式(6)計(jì)算用戶對未知項(xiàng)目的興趣度,選出興趣度最大的K個(gè)項(xiàng)目作為推薦結(jié)果.

        表3為音樂數(shù)據(jù)上下文感知信息的部分示意數(shù)據(jù),其中context-aware表示item所含有的上下文感知信息,為音樂流派信息,包括音樂風(fēng)格、音樂情緒等.

        表3 音樂數(shù)據(jù)上下文感知信息(部分示意數(shù)據(jù))Tab.3 Music data context perception information(partial schematic data)

        3.2 評測指標(biāo)

        本文通過準(zhǔn)確率評測算法的精度[10].實(shí)驗(yàn)結(jié)果中將改進(jìn)的協(xié)同過濾算法為用戶u推薦的K個(gè)項(xiàng)目記為R(u),用戶u在測試集上喜歡的項(xiàng)目集合為T(u),準(zhǔn)確率計(jì)算公式如下

        3.3 實(shí)驗(yàn)結(jié)果分析

        算法中有2個(gè)參數(shù)需要根據(jù)實(shí)際情況進(jìn)行參數(shù)調(diào)優(yōu).一個(gè)參數(shù)是用戶可能感興趣的項(xiàng)目數(shù)K,它是通過算法計(jì)算的用戶對項(xiàng)目的興趣度值進(jìn)行排序得到的,由高到低取K個(gè)項(xiàng)目.根據(jù)經(jīng)驗(yàn),K最多不會(huì)超過150,因?yàn)橥扑]數(shù)過多會(huì)造成推薦無意義.K一般根據(jù)經(jīng)驗(yàn)取初始值,之后在實(shí)驗(yàn)過程中逐步調(diào)整,使推薦算法的準(zhǔn)確率達(dá)到最高.另外一個(gè)參數(shù)是式(5)中的α(0<α<1).在實(shí)驗(yàn)中通過調(diào)整參數(shù)K和α,使得推薦效果達(dá)到最優(yōu).當(dāng)α=0時(shí),算法即為改進(jìn)之前的傳統(tǒng)算法.

        首先,實(shí)驗(yàn)中隨機(jī)挑選3個(gè)用戶,分析不同用戶在推薦效果上產(chǎn)生的差異及準(zhǔn)確率變化.之后計(jì)算整體訓(xùn)練集和測試集上所有用戶的推薦準(zhǔn)確率,一方面將單個(gè)用戶和整體用戶的推薦效果進(jìn)行對比,另一方面將傳統(tǒng)的協(xié)同過濾推薦算法和改進(jìn)后的算法的推薦效果進(jìn)行對比分析.

        隨機(jī)選取userID442、userID946和userID263,得到3個(gè)用戶在不同α和K下的推薦準(zhǔn)確率及準(zhǔn)確率趨勢圖,結(jié)果分別見表4~表6和圖1~圖3.

        表4 userID442在不同α和K下的推薦準(zhǔn)確率Tab.4 Recommendation accuracies of userID442 underdifferent α and K %

        圖1 userID442在不同α和K下的推薦準(zhǔn)確率趨勢圖Fig.1 Trend of recommendation accuracies of userID442 under different α and K

        由表4可見,α在0.5~0.7、K在60~70之間時(shí),user442的推薦結(jié)果準(zhǔn)確率達(dá)到最高值.由圖1知,隨著α的增長,推薦結(jié)果的準(zhǔn)確率逐漸提高,因此融合上下文感知信息會(huì)提高推薦精度,但是α=0.5和α=0.7這2條準(zhǔn)確率曲線有一部分重合,這說明只考慮項(xiàng)目的上下文關(guān)系或只考慮項(xiàng)目的用戶相似性都不能取得理想的結(jié)果.

        表5 userID946在不同α和K下的推薦準(zhǔn)確率Tab.5 Recommendation accuracies of userID946 under different α and K%

        圖2 userID946在不同α和K下的推薦準(zhǔn)確率趨勢圖Fig.2 Trend of recommendation accuracies of userID946 under different α and K

        由表5可見,α在0.5~0.7、K在20~50之間時(shí),user946的推薦結(jié)果準(zhǔn)確率達(dá)到最高值.由圖2知,α的提高,使推薦結(jié)果的準(zhǔn)確率得到明顯增長.α在0.5~0.7之間時(shí),準(zhǔn)確率的曲線有部分交叉,曲線有重疊的現(xiàn)象,表明推薦結(jié)果的區(qū)分度不大,這個(gè)結(jié)果說明在上下文感知信息和項(xiàng)目相似度進(jìn)行融合的時(shí)候,過分依賴上下文感知信息也不能得到很好的結(jié)果.

        表6 userID263在不同α和K下的推薦準(zhǔn)確率Tab.6 Recommendation accuracies of userID263 under different α and K %

        圖3 userID263在不同α和K下的推薦準(zhǔn)確率趨勢圖Fig.3 Trend of recommendation accuracies of userID263 under different α and K

        由表6可見,α在0.5~0.7、K在80~100之間時(shí),user263的推薦結(jié)果準(zhǔn)確率達(dá)到最高值.由圖3知,隨著α的提高,推薦結(jié)果的準(zhǔn)確率小幅增長.在不同的α值下,準(zhǔn)確率的曲線有明顯的交叉,數(shù)據(jù)重疊痕跡明顯,這是因?yàn)閡ser263的歷史記錄比較豐富.但隨著α值的升高,依賴上下文感知信息比例的增加使準(zhǔn)確率出現(xiàn)小幅增長.

        在整體的訓(xùn)練集和測試集上根據(jù)式(7)進(jìn)行準(zhǔn)確率計(jì)算.結(jié)果見表7和圖4.

        表7 所有用戶在不同α和K下的推薦準(zhǔn)確率Tab.7 Recommendation accuracies for all users under different α and K %

        圖4 所有用戶在不同α和K下的推薦準(zhǔn)確率趨勢圖Fig.4 Trend of recommendation accuracies for all users under different α and K

        由表7可知,針對所有用戶,K在40~80之間時(shí)準(zhǔn)確率達(dá)到峰值.由圖4可見,隨著α值的提升,算法的推薦準(zhǔn)確率明顯增長.但是相比α=0的情況,隨著K值的變化,推薦準(zhǔn)確率有較強(qiáng)的波動(dòng).α值在0.5~0.7之間時(shí),準(zhǔn)確率的增長不明顯.從數(shù)據(jù)集整體的推薦結(jié)果來看,融合上下文感知信息確實(shí)可以提高推薦算法的精度.但是,由表7和圖4也可發(fā)現(xiàn),數(shù)據(jù)集上所有用戶的平均準(zhǔn)確率低于實(shí)驗(yàn)選出的3個(gè)用戶,這是因?yàn)橛脩?項(xiàng)目數(shù)據(jù)的稀疏,有些用戶的歷史行為記錄較少導(dǎo)致推薦準(zhǔn)確率不高,進(jìn)而拉低整體的推薦準(zhǔn)確率,另外整體計(jì)算時(shí),基數(shù)過大,也會(huì)造成推薦準(zhǔn)確率降低.

        通過對整體數(shù)據(jù)集以及不同用戶的推薦結(jié)果進(jìn)行分析發(fā)現(xiàn),參數(shù)α在0.5~0.7,K在50~80之間時(shí)取得較好的推薦結(jié)果,而受實(shí)際數(shù)據(jù)的影響,推薦準(zhǔn)確率隨K取值的變化波動(dòng)比較大,但是K的值會(huì)隨著α的變化獲得一個(gè)穩(wěn)定的區(qū)間.綜上,實(shí)驗(yàn)結(jié)果驗(yàn)證了本文提出的融合項(xiàng)目上下文感知信息的協(xié)同過濾算法提高了推薦準(zhǔn)確率,并確定了參數(shù)的最優(yōu)取值范圍.

        4 結(jié)語

        在傳統(tǒng)的基于項(xiàng)目的協(xié)同過濾推薦算法基礎(chǔ)上,結(jié)合項(xiàng)目的上下文感知信息,對算法進(jìn)行優(yōu)化,并在公開的音樂數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果顯示本文算法提升了推薦精度,說明算法是有效的.該算法中上下文感知信息的選取非常重要,本文重點(diǎn)考慮音樂數(shù)據(jù)的流派特性,之后還可以考慮融合地點(diǎn)及用戶心情等上下文感知信息,以進(jìn)一步提高推薦精度.

        猜你喜歡
        準(zhǔn)確率矩陣融合
        村企黨建聯(lián)建融合共贏
        融合菜
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
        從創(chuàng)新出發(fā),與高考數(shù)列相遇、融合
        《融合》
        高速公路車牌識別標(biāo)識站準(zhǔn)確率驗(yàn)證法
        初等行變換與初等列變換并用求逆矩陣
        矩陣
        南都周刊(2015年4期)2015-09-10 07:22:44
        娇小女人被黑人插免费视频| 久久久久久久国产精品电影| 日韩精品不卡一区二区三区| 白白色发布免费手机在线视频观看| 午夜免费福利小电影| 正在播放国产对白孕妇作爱| 激情中文丁香激情综合| 日本国产一区在线观看| 丁香婷婷激情综合俺也去| 久久久久久国产精品美女| 色综合久久久久久久久久| 欧美午夜精品久久久久免费视| 手机在线中文字幕国产| 青青草原综合久久大伊人精品 | 国产美女高潮流白浆免费观看| 日韩在线精品视频一区| 国产精品久久久久9999赢消| 毛片免费在线观看网址| 日本国主产一区二区三区在线观看| 亚洲一区二区三区中文字幕网| 亚洲人精品亚洲人成在线| 国产精品一久久香蕉国产线看观看| 中文字幕精品亚洲一区二区三区| 青青草大香蕉视频在线观看| 毛片亚洲av无码精品国产午夜| 欧美人与禽交zozo| 人妻露脸国语对白字幕| 国产午夜免费高清久久影院| 成人无码一区二区三区网站| 国产精品乱子伦一区二区三区| 日韩av天堂一区二区三区在线| 亚洲欧美乱日韩乱国产| 首页动漫亚洲欧美日韩| 亚洲日本一区二区在线观看| 熟女人妻中文字幕av| 无码人妻精一区二区三区| 天堂在线观看av一区二区三区| 国产福利不卡视频在线| 国产精品毛片一区二区三区| 99国产精品99久久久久久| 人妻尤物娇呻雪白丰挺|