摘 要:通常,為了構(gòu)建一個推薦系統(tǒng),一般都會考慮使用兩種最常見的推薦算法:基于內(nèi)容過濾算法和協(xié)同過濾算法[1,2]。然而,這兩種推薦算法都有各自的技術(shù)缺點。解決特征提取是內(nèi)容過濾的困難之處,同時預(yù)測用戶的興趣趨勢也難以很好處理。協(xié)同過濾算法則需要面臨冷啟動問題和矩陣稀疏性問題。本文結(jié)合內(nèi)容推薦,協(xié)同推薦,采用本體這一新工具,構(gòu)建出一種全新的混合推薦算法。新的推薦算法可以解決傳統(tǒng)的推薦算法面臨的冷啟動、數(shù)據(jù)稀疏性、興趣趨向預(yù)測等一些問題。
關(guān)鍵詞:內(nèi)容過濾;協(xié)同過濾;混合推薦;本體;推薦系統(tǒng)
中圖分類號:TP391.3
內(nèi)容過濾主要取決于表征項目的內(nèi)容(或特征)之間的相似度,其優(yōu)點是它不需要額外的其他用戶的數(shù)據(jù),它只需要用戶的使用歷史記錄以及相關(guān)項目的信息。然而,這種推薦算法的缺點卻是:隨著系統(tǒng)當(dāng)中項目數(shù)量的增多,計算項目(或特征)間的相似度將變成棘手的問題。協(xié)同過濾算法是基于用戶之間相似性的,它不需要項目的其他信息。然而,協(xié)同過濾卻面臨冷啟動問題[1],此外矩陣稀疏性問題也是傳統(tǒng)協(xié)同過濾推薦算法的另一個嚴(yán)重的問題[3]。同時,傳統(tǒng)的這兩種推薦算法不能很好的挖掘和預(yù)測用戶的興趣,并且它們對于用戶興趣的變化做出的反應(yīng)非常慢。
1 主要的推薦算法
1.1 協(xié)同過濾(簡稱CF)。是目前使用和研究最多的推薦算法[4],協(xié)同過濾通過鄰居用戶的信息來計算得到目標(biāo)用戶的推薦。其認(rèn)為:一個用戶會與和他有相同興趣的用戶喜歡相同的項目。任意給定兩個用戶u和v,用N(u)表示用戶u的特征集合,N(v)表示用戶v的特征集合,則u和v的相似度可以使用如下公式進(jìn)行描述:
接下來的步驟是以上算法都可以繼續(xù)的步驟,它是以上算法的推薦步驟。
對剛剛評分的項目按評分排序,將評分最高的前N個項目推薦給用戶。
因此,在實際系統(tǒng)當(dāng)中我們的算法即可以各自單獨的運行,也可以兩種組合起來運行。
4 結(jié)束語
在基于本體的協(xié)同過濾和內(nèi)容過濾算法中,本文將傳統(tǒng)的基于向量模型的相似度計算公式改為了基于本體模型的語義相似度計算公式,因此在計算鄰居和項目匹配時,我們的算法都考慮了關(guān)鍵詞在語義層面的關(guān)系[3,6]。傳統(tǒng)的協(xié)同過濾算法中尋找用戶鄰居時都是使用評分向量算相似性的,相似性低,本文則采用用戶興趣來計算用戶相似性,使得協(xié)同過濾中找到的鄰居可以更可靠,也可以簡單協(xié)同過濾的矩陣稀疏性和冷啟動問題。本體的應(yīng)用可以使得項目的特征提取更具規(guī)范,同時用戶興趣的自動更新也可以較好的解決用戶興趣的預(yù)測問題。當(dāng)然,由于算法的改良在實際應(yīng)該過程中算法的時間復(fù)雜度將大大增加。
參考文獻(xiàn):
[1]Y Deng, Z Wu, C Tang, et al.A Hybrid Movie Recommender Based on Ontology and Neural Networks.GREENCOM-CPSCOM '10 Proceedings of the 2010 IEEE/ACM Int'l Conference on Green Computing and Communications Int'l Conference on Cyber,Physical and Social Computing,2010:846-851.
[2]G Adomavicius,A Tuzhilin. Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Possible Extensions.Knowledge and Data Engineering,2005:734-749.
[3]H Kapusuzoglu,SGO?guducu. A Relational Recommender System Based on Domain Ontology.Emerging Intelligent Data and Web Technologies (EIDWT),2011:36-41.
[4]F Wu, L He, W Xia, L Ren. A Collaborative Filtering Algorithm Based on Users’Partial Similarity. Control, Automation, Robotics and Vision,2008:1072-1077.
[5]N. F.Noy, D.L.McGuiness,“Ontology Development 101:A Guide to Creating Your First Ontology”,Stanford Knowledge Systems Laboratory Technical Report KSL-01-05,March,2001.
[6]Y Naudet,A Aghasaryan,Y Toms.An Ontology-based Profiling and Recommending System for Mobile TV.Semantic Media Adaptation and Personalization,2008:94-99.
[7]林森.基于Tag技術(shù)的知識個性化及系統(tǒng)[D].華中科技大學(xué),2006.
[8]許海玲,吳瀟,李曉東.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報,2009(02).
[9]劉建國,周濤,汪秉宏.個性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009(01).
作者簡介:鄭元平(1988.05-),男,湖南新田縣人,碩士研究生,研究方向:計算機(jī)軟件與理論。
作者單位:浙江師范大學(xué) 數(shù)理與信息工程學(xué)院,浙江金華 321004