[摘要]隨著電子商務的飛速發(fā)展,如何準確高效地提供給用戶需要的信息變得越來越重要。在分析傳統(tǒng)推薦機制的基礎上,該文提出了一種混合推薦機制。該機制在向用戶進行個性化產(chǎn)品推薦時,綜合考慮了用戶自身和其鄰居用戶對推薦的影響。在MovieLens上的實驗證明,該文提出的這種算法在預測精度上較傳統(tǒng)的推薦算法有很大的提高。
[關鍵詞] 矩陣分塊 信息項 用戶群
一、引言
面對電子商務新的商務模式,如何有效的縮短用戶花費在瀏覽網(wǎng)頁以發(fā)現(xiàn)他們需要的信息上的時間成為電子商務成敗的一個關鍵問題。信息推薦機制是通過學習用戶的興趣和訪問模式,逐漸了解用戶的興趣愛好,進而向用戶推薦系統(tǒng)認為用戶可能感興趣的信息。推薦算法主要分為基于內(nèi)容的推薦和協(xié)同推薦。
基于內(nèi)容的推薦是根據(jù)用戶以前的興趣來推測用戶以后的興趣。協(xié)作推薦實現(xiàn)的思想是采用某種技術找到目標用戶的最近鄰居,然后根據(jù)最近鄰居對目標項目的評分,產(chǎn)生推薦,用戶評分數(shù)據(jù)可以用一個m*n階矩陣A(m*n)來表示。
二、基于混合模式的推薦機制
該文提出的推薦算法綜合考慮了用戶自身興趣對推薦的影響和其鄰居用戶對推薦的影響,前者是從基于內(nèi)容的推薦中借鑒過來的思想,計算時,采用基于信息項的方法。后者是基于協(xié)作的推薦思想,根據(jù)鄰居用戶對目標項目的評分產(chǎn)生推薦。
1.基于內(nèi)容的推薦
在用戶-項目矩陣中,用戶已評分的項目可以看作是用戶自身的興趣,這相當于基于內(nèi)容推薦中用戶的興趣模型。在推薦時,系統(tǒng)首先計算項目之間的相似性,然后根據(jù)項目之間的相似性,來預測用戶對未評分項目的評分。
2.基于合作的推薦
系統(tǒng)首先采用某種方法查找目標用戶的最近鄰居,然后根據(jù)鄰居用戶對目標項目的評價產(chǎn)生對目標用戶的推薦。
(1)計算最近鄰
假設目標用戶為I,計算完I和其他用戶的相似度后,計算公式如式1所示。按大小排序,選擇前N個作為I的最近鄰,這里涉及到N的取值問題。
式1
Ii,j:用戶i和j共同評分過的項目集,Ri,c:用戶i對項目c的評分,
:用戶i對資源的平均評分。
(2)產(chǎn)生推薦
采用式2計算U對I的評分:
式2
:用戶u對資源的平均評分,:用戶m對項目i的評分,
:用戶m對資源的平均評分,:用戶u和m的相似度。
3.混合信息推薦機制
假設要度量用戶I對項目j的興趣程度,采用基于信息項的方法計算得到的評價值,記為Vi1,采用基于用戶群的方法從行的角度計算得到的評價值記作Vi2,用戶I的推薦計算公式如式3所示:
α、β為權重因子 式3
三、實驗及結(jié)果分析
實驗采用的數(shù)據(jù)集是MovieLens。利用平均絕對誤差(MAE)來衡量算法的預測精度,MAE越小說明系統(tǒng)的預測精度越高,實驗結(jié)果如圖所示。
參考文獻:
[1]Voorhees E .Harrman D .,Overview of the SeventhText Retrieval Conference[A],In Proceedings seventh Text Retrieval Conference[C ],1999,1~24,NIS'P Pres
[2]曾青刑春曉周立柱:個性化服務技術綜述[J].軟件學報,2002,13(10):1952~1961
[3]Breese J, Heckerman D, Kadie C. Empirical analysis of predictive algorithms for collaborative filtering. In: Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence, San Francisco, CA, July 1998:43~52