亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于云模型的融合相似度推薦方法

        2016-10-25 07:55:01馬建勇周宇紅
        廣東通信技術(shù) 2016年9期
        關(guān)鍵詞:相似性協(xié)同矩陣

        [馬建勇 周宇紅]

        一種基于云模型的融合相似度推薦方法

        [馬建勇 周宇紅]

        云模型 協(xié)同過濾 推薦系統(tǒng) 相似度

        馬建勇

        重慶郵電大學(xué)通信與信息工程學(xué)院,宇龍計(jì)算機(jī)通信科技(深圳)有限公司。

        周宇紅

        重慶郵電大學(xué)通信與信息工程學(xué)院。

        1 引言

        最近鄰協(xié)同過濾技術(shù)是當(dāng)前最成功的推薦技術(shù)[1]之一,它基于評(píng)分相似的最近鄰居的評(píng)分?jǐn)?shù)據(jù)向目標(biāo)用戶推薦信息。隨著電子商務(wù)系統(tǒng)規(guī)模的進(jìn)一步擴(kuò)大,用戶數(shù)目和項(xiàng)目數(shù)據(jù)急劇增加,導(dǎo)致協(xié)同過濾技術(shù)的稀疏性問題越來(lái)越嚴(yán)峻,影響了推薦系統(tǒng)的推薦質(zhì)量。

        為解決數(shù)據(jù)稀疏性問題,一些學(xué)者采用對(duì)稀疏的用戶-項(xiàng)矩陣進(jìn)行填充的技術(shù)來(lái)提高相似度度量效果。處理過程如下:(1)采用預(yù)測(cè)評(píng)分的方式先估算出未評(píng)分項(xiàng)目的評(píng)分,將用戶-項(xiàng)矩陣填充完整;(2)在得到的稠密矩陣上計(jì)算用戶間的相似度,以最近鄰算法進(jìn)行推薦[2],由于該算法在計(jì)算項(xiàng)目相似性時(shí)仍然沿用傳統(tǒng)的相似性計(jì)算方法,而且沒有考慮項(xiàng)目的分類信息,從而影響了推薦質(zhì)量。文獻(xiàn)[14]引入了項(xiàng)目分類信息,采用修正的條件概率計(jì)算項(xiàng)目之間的相似性,并用于對(duì)用戶沒有評(píng)價(jià)過的項(xiàng)目進(jìn)行評(píng)分估計(jì),填充用戶-項(xiàng)矩陣,進(jìn)而根據(jù)填充了的用戶-項(xiàng)矩陣計(jì)算用戶相似性,取得了不錯(cuò)的效果。然而,該算法依然把用戶對(duì)所有項(xiàng)目的評(píng)分作為單個(gè)向量進(jìn)行用戶相似度的計(jì)算和指導(dǎo)最近鄰居的選擇,在一定程度上影響了算法的效能。文獻(xiàn)[3-4]提出基于云模型的相似性度量方法。文獻(xiàn)[3]給出一種基于云模型的用戶相似度比較方法(LICM)。文獻(xiàn)[4]提出一種在知識(shí)層面比較用戶相似度的方法,改善了傳統(tǒng)相似度比較方法必須嚴(yán)格匹配對(duì)象屬性的不足,且在一定程度上克服用戶評(píng)分?jǐn)?shù)據(jù)極端稀疏的負(fù)面影響。

        本文采用云模型來(lái)計(jì)算相似度,并提出一種融合相似度推薦算法。從用戶-項(xiàng)評(píng)分矩陣中挖掘出更多有用信息,在用戶-項(xiàng)評(píng)分矩陣中的個(gè)體評(píng)分看作是對(duì)未評(píng)分項(xiàng)目的獨(dú)立預(yù)測(cè),個(gè)體與目標(biāo)用戶的相似度及與未評(píng)分項(xiàng)目的相似度作為個(gè)體預(yù)測(cè)的信任度。同時(shí)將用戶相似度和項(xiàng)目相似度引入到用戶-項(xiàng)評(píng)分矩陣中來(lái),并將相似用戶對(duì)相似項(xiàng)目的評(píng)分融合到算法中來(lái),能夠有效的解決數(shù)據(jù)稀疏性問題。

        2 基于云模型的相似性度量方法

        2.1 云模型

        在傳統(tǒng)的模糊數(shù)學(xué)和概率統(tǒng)計(jì)的基礎(chǔ)上,李德毅院士提出表述定性定量互換的云模型[4]。云模型主要反映事物的模糊性和隨機(jī)性。通過將這兩種不確定性結(jié)合起來(lái),使得可以用定量的數(shù)值表示出某個(gè)定性概念的含義,或者用定性的語(yǔ)言描述出定量的數(shù)值。U是一個(gè)定量的論域,C是一個(gè)定性值。隸屬度CT(x),(CT(x)∈[0,1])是一個(gè)具有穩(wěn)定傾向的隨機(jī)數(shù)。它描述U中的元素x和T之間的定性關(guān)系。隸屬度在論域上的分布稱為隸屬云,簡(jiǎn)稱云。因此,云是從論域U到區(qū)間[0,1]的一個(gè)映射,即x∈U,x→CT(x)序?qū)Γ▁,CT(x))稱為云滴。一個(gè)云滴是定性概念在數(shù)量上的一次實(shí)現(xiàn),大量云滴組成云。盡管在不同的時(shí)刻產(chǎn)生的云滴不同,但是云的數(shù)字特征決定云的整體形態(tài)基本不變。云的數(shù)字特征由期望Ex,熵En,超熵He三個(gè)數(shù)值來(lái)表示,他們反映了定性概念上的定量特征。

        2.2 基于云模型的用戶特征表示

        假定評(píng)分標(biāo)準(zhǔn)為5個(gè)級(jí)別:{很不滿意,不滿意,一般,滿意,很滿意},相應(yīng)的分值分別為{1,2,3,4,5}。統(tǒng)計(jì)用戶的評(píng)價(jià)情況,記為U(u1,u2,u3,u4,u5),其中u1~u5為評(píng)價(jià)的次數(shù),稱為用戶評(píng)分頻度向量,通過逆向云算法可以計(jì)算出用戶評(píng)分特征向量,記為P =(Ex,En,He)。其中,期望Ex反映了用戶對(duì)所有項(xiàng)目的平均滿意程度,為偏好水平;熵En反映了用戶投票的集中程度,為投票偏好的離散度;He為熵的穩(wěn)定度。

        2.3 基于云模型的相似性度量

        為了對(duì)云模型表示的定性知識(shí)進(jìn)行相似性比較,文獻(xiàn)[2]給出了云的相似度定義:

        定義:給定兩個(gè)云i和j的數(shù)字特征組成的向量,Vi和Vj,它們之間的余弦夾角稱為云i和j之間的相似度。

        這種基于云模型的概念相似性比較方法記為L(zhǎng)ICM(Likeness Method based on Cloud Model)方法。

        3 背景

        3.1 基于用戶的協(xié)同過濾

        基于用戶的協(xié)同過濾算法,通過相似用戶對(duì)項(xiàng)目的評(píng)分來(lái)預(yù)測(cè)目標(biāo)用戶對(duì)未評(píng)分項(xiàng)目的評(píng)分[5],本文通過云的相似度計(jì)算用戶之間的相似性。具體如下:

        (2)計(jì)算用戶相似度矩陣

        用戶相似度矩陣可以表示為:

        其中,sim(i,j)表示用戶i和j的相似度,由式(1)可以計(jì)算得出。根據(jù)用戶-項(xiàng)矩陣,用戶相似度矩陣sim,對(duì)于目標(biāo)用戶Uk在整個(gè)用戶空間中查找目標(biāo)用戶的N個(gè)最近鄰居且該用戶對(duì)目標(biāo)項(xiàng)目有評(píng)價(jià)記錄,得到最近鄰居集BUk= {U1,U2,...,Un},其中,,且U1與用戶的相似性sim(Uk,U1)最高,U2與用戶Uk的相似性次之,依次類推。因此,目標(biāo)用戶Uk對(duì)于未評(píng)分項(xiàng)Im的預(yù)測(cè)評(píng)分可以表示如下:

        3.2 基于項(xiàng)目的協(xié)同過濾

        基于項(xiàng)目的協(xié)同過濾算法,通過相似項(xiàng)目的評(píng)分來(lái)預(yù)測(cè)未評(píng)分項(xiàng)目的評(píng)分[6],我們依然采用云模型來(lái)計(jì)算項(xiàng)目間的相似度。

        (2)根據(jù)云的相似度計(jì)算公式(式(1))來(lái)計(jì)算未評(píng)分項(xiàng)目與其他項(xiàng)目的相似性。

        將相似性最高的N個(gè)項(xiàng)作為對(duì)于未評(píng)分項(xiàng)Im鄰居集BIm={I1,I2,...In},其中,且I1與未評(píng)分項(xiàng)Im的相似度最高,I2與未知項(xiàng)Im的相似度其次,依次類推[8-9]。因此,目標(biāo)用戶Uk對(duì)于未評(píng)分項(xiàng)Im的預(yù)測(cè)評(píng)分可以表示如下:

        其中rk,b表示用戶k對(duì)項(xiàng)目b的評(píng)分,因此我們定義“相似項(xiàng)目評(píng)分集合”如下:

        4 相似度融合

        將上面三種預(yù)測(cè)評(píng)分組合到協(xié)同過濾算法里面,用戶-項(xiàng)評(píng)分矩陣中每個(gè)元素看作是獨(dú)立的預(yù)測(cè),其與目標(biāo)項(xiàng)的評(píng)分相似度稱為信任度。元素的預(yù)測(cè)評(píng)分與信任度的加權(quán)平均作為元素對(duì)目標(biāo)項(xiàng)的預(yù)測(cè)評(píng)分。

        4.1 預(yù)測(cè)評(píng)分

        用戶對(duì)項(xiàng)目的評(píng)分具有差異性,一些用戶傾向于打很高的分?jǐn)?shù),因此有些物品因?yàn)橐恍O度活躍用戶而獲得評(píng)分遠(yuǎn)超過了它們的“真實(shí)評(píng)分”,為了消除評(píng)分的差異性,在預(yù)測(cè)之前對(duì)用戶-項(xiàng)評(píng)分矩陣中的評(píng)分做歸一化處理。減去用戶和項(xiàng)的平均評(píng)分作為個(gè)體預(yù)測(cè)評(píng)分,如

        pk,m(ra,b)表示用戶k對(duì)目標(biāo)項(xiàng)m的預(yù)測(cè)評(píng)分,其中,表示用戶a和用戶k的平均評(píng)分,,表示項(xiàng)目b和項(xiàng)目m所獲得的平均評(píng)分。

        4.2 概率融合

        最后,下面等式給出了對(duì)未知評(píng)分的預(yù)測(cè)評(píng)分

        最后給出的模型,融合了最近鄰評(píng)分預(yù)測(cè)三個(gè)不同的數(shù)據(jù)源,通過μ和λ控制評(píng)分的來(lái)源。

        4.3 概率估計(jì)

        其中,sim(a,b)計(jì)算如式(1)。

        條件概率表示如下:

        5 實(shí)驗(yàn)結(jié)果

        5.1實(shí)驗(yàn)設(shè)計(jì)

        本文使用MovieLens站點(diǎn)提供的測(cè)試數(shù)據(jù)集,該站點(diǎn)是一個(gè)基于Web的研究型推薦系統(tǒng),用于接收用戶對(duì)電影的評(píng)分并提供相應(yīng)的電影推薦列表。從該站點(diǎn)下載1997年9月19日-1998年5月22日的數(shù)據(jù)集,包括943個(gè)用戶對(duì)1 682個(gè)項(xiàng)目(影片)的10萬(wàn)條投票記錄,把記錄按照80%和20%的比例劃分為訓(xùn)練集和測(cè)試集。

        推薦質(zhì)量的評(píng)價(jià)標(biāo)準(zhǔn)主要有兩類:統(tǒng)計(jì)精度度量方法和決策支持精度度量方法[7-8]。本文通過平均絕對(duì)誤差來(lái)度量預(yù)測(cè)的準(zhǔn)確性,MAE越小,推薦質(zhì)量越高。MAE可由下式計(jì)算

        其中,L表示測(cè)試評(píng)分的數(shù)目。

        5.2 參數(shù)影響

        參數(shù)λ決定SUk,m和SIk,m的預(yù)測(cè)評(píng)分,參數(shù)μ平衡插入SUIk,m的預(yù)測(cè)評(píng)分。

        首先,將參數(shù)μ設(shè)置為0,測(cè)試參數(shù)λ的敏感程度,稱為SF1組合,融合了基于用戶和物品的方法沒有引入其他的背景信息。圖1展示了MAE隨著參數(shù)λ(從0到1)的變化情況,圖表根據(jù)用戶稀疏程度5和20,以及物品稀疏程度小于5和無(wú)約束四種情況劃分成了4條曲線,明參數(shù)λ的值說明插入基于用戶和物品的SF1推薦方法能夠提升推薦系統(tǒng)的性能,當(dāng)λ取值在0.6-0.9之間的時(shí)候,效果最佳,實(shí)驗(yàn)結(jié)果表明SIk,m的預(yù)測(cè)評(píng)分相比于SUk,m更可靠。圖2展示了當(dāng)參數(shù)λ取值為0.7,參數(shù)μ的敏感程度。與圖1類似根據(jù)四種情況將圖表劃分成了四條曲線,參數(shù)μ從0到1變化。當(dāng)參數(shù)μ非零時(shí),SF1的結(jié)果經(jīng)過SUIk,m平滑處理,我們稱為SF2組合。通過觀測(cè)圖表我們可以發(fā)現(xiàn),當(dāng)最近鄰評(píng)分?jǐn)?shù)據(jù)稀疏時(shí),μ取值0.8效果最佳。然而,當(dāng)物品稀疏不被約束的時(shí)候在很大的一個(gè)取值范圍內(nèi)都是最優(yōu)值,而且對(duì)MAE的提升并不明顯。最近鄰居的個(gè)數(shù)N也會(huì)影響到組合推薦方法的性能。圖3顯示了SF2推薦指標(biāo)MAE隨著鄰居評(píng)分的數(shù)目變化情況,鄰居個(gè)數(shù)在50到100之間,效果最佳。

        圖1參數(shù)λ對(duì)MAE的影響

        圖2 參數(shù)μ對(duì)MAE的影響

        5.3 與其他方法比較

        我們繼續(xù)與其他推薦方法的結(jié)果進(jìn)行比較。對(duì)于SF1,將λ設(shè)置為0.7,μ設(shè)置為0;對(duì)于SF2,λ=0.7,μ=0.7。分別與基于用戶的方法,基于物品的方法比較。圖4表明了SF1和SF2方法優(yōu)于其他方法。

        圖4 不同推薦方法MAE隨最近鄰居數(shù)變化

        6 結(jié)束語(yǔ)

        本文提出了一個(gè)基于云模型的組合相似度推薦方法,通過融合基于用戶和基于物品的協(xié)同過濾方法來(lái)克服數(shù)據(jù)稀疏性的限制,通過插入相似用戶對(duì)相似物品的評(píng)分來(lái)平滑評(píng)分預(yù)測(cè)。實(shí)驗(yàn)表明,基于云模型的組合相似度推薦方法能夠有效的提高推薦的準(zhǔn)確性并且能夠克服數(shù)據(jù)稀疏性問題。后期我們會(huì)深入分析挖掘更多的信息融入到相似度計(jì)算中來(lái),比如社交關(guān)系等,以提高推薦的準(zhǔn)確性。

        1J Breese,D Heeh man,CKadie.Empirical analysis of predictive algorithms for collaborative filtering.In:Proc of the 14th Conf on Uncertainty in Artificial Intelligence(UAI98)San Francisco,CA:Morgan Kaufman,1998,43-52

        2張光衛(wèi),康建初,李鶴松等.面向場(chǎng)景的協(xié)同過濾推薦算法[J].系統(tǒng)仿真學(xué)報(bào),2006,18(2):595-601

        3鄧愛林,朱揚(yáng)勇,施伯樂.基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過濾算法.軟件學(xué)報(bào),2003,14(9):1621-1628

        4李德毅,杜鹢.不確定性人工智能[M].北京:國(guó)防工業(yè)出版社,2005

        5J.L.Herlocker,J.A.Konstan,A.Borchers,and J.Riedl.An algorithmic framework for performing collaborative filtering.In Proc.of SIGIR,1999

        6J.Kittler,M.Hatef,R.P.W.Duin,and J.Matas.On combining classifiers.IEEE Trans.Pattern Anal.Mach.Intell.,1998,20(3):226-239

        7Zhang BQ.A collaborative filtering recommendation algorithm based on domain knowledge.Computer Engineering,(in Chinese with English abstract),2005,31(21):7-9

        8Sarwar B,Karypis G,Konstan J,Riedl J.Item-based collaborative filtering recommendation algorithms.In:Proc.of the 10th Int'l World Wide Web Conf.Hong Kong:ACM Press,2001. 285-295

        9Y Koren,R Bell.Advances in collaborative filtering.Recommender systems handbook.Springer US,2011:145-186

        10C Desrosiers,G Karypis.A comprehensive survey of neighborhoodbased recommendation methods.Recommender systems handbook.Springer US,2011:107-144

        10.3969/j.issn.1006-6403.2016.09.006

        2016-07-29)

        傳統(tǒng)協(xié)同過濾算法依據(jù)用戶的共同評(píng)分來(lái)計(jì)算用戶相似度,進(jìn)而產(chǎn)生推薦。隨著系統(tǒng)用戶數(shù)目和商品數(shù)目的不斷增加,用戶共同評(píng)分的項(xiàng)目越來(lái)越少,甚至沒有,因此傳統(tǒng)的協(xié)同過濾算法對(duì)用戶之間相似度的衡量將會(huì)越來(lái)越不準(zhǔn)確,導(dǎo)致整個(gè)推薦系統(tǒng)的準(zhǔn)確度降低。針對(duì)這一問題,本文提出一種基于云模型的融合相似度推薦方法,并使用云模型來(lái)計(jì)算相似度。實(shí)驗(yàn)結(jié)果表明,該算法能有效解決用戶評(píng)分?jǐn)?shù)據(jù)的稀疏問題,還能提高推薦系統(tǒng)的推薦質(zhì)量。

        猜你喜歡
        相似性協(xié)同矩陣
        一類上三角算子矩陣的相似性與酉相似性
        蜀道難:車與路的協(xié)同進(jìn)化
        淺析當(dāng)代中西方繪畫的相似性
        “四化”協(xié)同才有出路
        汽車觀察(2019年2期)2019-03-15 06:00:50
        三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
        初等行變換與初等列變換并用求逆矩陣
        低滲透黏土中氯離子彌散作用離心模擬相似性
        矩陣
        南都周刊(2015年4期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年3期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年1期)2015-09-10 07:22:44
        亚洲色欲色欲综合网站| 久久狠色噜噜狠狠狠狠97| 人与嘼av免费| 免费在线日韩| 亚洲黄色大片在线观看| 国产日产一区二区三区四区五区| 午夜成人理论福利片| 亚洲性啪啪无码av天堂| 亚洲AV成人无码国产一区二区| 手机免费日韩中文字幕| 国产成人精品久久二区二区91 | 男女啪啪免费视频网址| 青青草视频在线观看网| 亚洲av色香蕉一区二区三区老师| 热久久美女精品天天吊色| 黑人巨大白妞出浆| 国产成人www免费人成看片| 亚洲欧洲国产日产国码无码 | 国产成人亚洲精品2020| 青青草手机在线免费视频| 国产丝袜美腿精品91在线看| 97精品国产一区二区三区| 东北女人毛多水多牲交视频| 亚洲av无码成人精品区天堂| 玩弄放荡人妻一区二区三区| 国产一区二区三区最新地址 | 国模91九色精品二三四| 国产福利永久在线视频无毒不卡| 4399理论片午午伦夜理片| 亚洲精品无码久久久久av麻豆| 国产精品女视频一区二区| av蜜桃视频在线观看| 久草视频这里只有精品| 无码精品国产一区二区三区免费| 亚洲av成人片色在线观看高潮| 亚洲精品国产av成拍色拍| 中文字幕有码在线视频| 日本av不卡一区二区三区| 久久无码字幕中文久久无码| 看国产黄大片在线观看| 欧美成人免费看片一区|