魏天琦
摘要:在互聯(lián)網(wǎng)高度發(fā)達的時代,信息過載的存在問題加速了個性化推薦系統(tǒng)的發(fā)展和應(yīng)用。本文首先分析了個性化推薦系統(tǒng)的產(chǎn)生背景和發(fā)展歷史,詳細闡述了其進行推薦的原理,并介紹了推薦系統(tǒng)在電子商務(wù)、社交網(wǎng)絡(luò)及信息內(nèi)容等領(lǐng)域的應(yīng)用情況,最后討論分析了個性化推薦系統(tǒng)面臨的隱私保護、數(shù)據(jù)稀疏性等問題。
關(guān)鍵詞:推薦系統(tǒng) 個性化 電子商務(wù) 隱私保護
引言
隨著信息技術(shù)特別是互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,人們獲取信息的方式越來越多,同時信息總量也在呈幾何倍數(shù)的增長,人們獲取信息的方式正在從主動查找變成被動接受。如何快速、準確找到自己感興趣或需要的信息困擾著我們每個人,另
方面,人的需求有時是模糊的、時變的,對商家等服務(wù)提供平臺而言,準確判斷并推送用戶可能感興趣的內(nèi)容,為用戶提供個性化的服務(wù)可以提高平臺的吸引力,增加用戶的忠誠度。為解決這些問題,因而產(chǎn)生了個性化推薦系統(tǒng)。
個性化推薦的概念是由美國人工智能協(xié)會在1995年首次提出,隨后Yahoo、IBM、NEC研究院等眾多公司、研究機構(gòu)紛紛加入這領(lǐng)域。近年來,人工智能以及大數(shù)據(jù)技術(shù)的發(fā)展進一步推動了個性化推薦系統(tǒng)在商品、音樂、視頻、新聞等領(lǐng)域的應(yīng)用。國內(nèi)最早的推薦系統(tǒng)服務(wù)公司是北京百分點信息科技有限公司,該公司專注于推薦技術(shù)研發(fā),為客戶提供不同類型的推薦系統(tǒng)解決方案;百度公司總裁李彥宏在百度世界大會2011上將推薦引擎與作為公司未來的重要發(fā)展方向,希望能夠為用戶智能地推薦其可能感興趣的新聞、網(wǎng)站、APP等信息。
一、個性化推薦系統(tǒng)的構(gòu)成及原理
般的推薦系統(tǒng)結(jié)構(gòu)如圖1所示。獲取用戶的偏好是建立推薦系統(tǒng)的第一步,這些信息需要從用戶的歷史記錄或注冊信息中采集,之后利用這些信息建立用戶模型,與此同時,根據(jù)商品、服務(wù)等對象的屬性特征建立推薦對象模型,最后應(yīng)用特定的推薦算法評價用戶對推薦對象的興趣度,據(jù)此對推薦對象進行篩選,將用戶可能感興趣或需要的內(nèi)容呈現(xiàn)出來??梢钥吹?,用戶、推薦對象模型以及相應(yīng)的推薦算法是推薦系統(tǒng)的核心要素。
(一)用戶模型
用戶模型是根據(jù)用戶的領(lǐng)域、職位、年齡、性別、所在地等基本信息以及購買、瀏覽等歷史信息表示和貯存用戶偏好的數(shù)據(jù)庫系統(tǒng),該系統(tǒng)可以實現(xiàn)用戶的分類管理、智能標記、定期或非定期更新等功能。用戶模型是推薦系統(tǒng)的基礎(chǔ),精準的用戶模型助于提高對推薦系統(tǒng)的準確性。
(二)推薦對象模型
推薦對象包括很多內(nèi)容,例如書籍、電子產(chǎn)品、新聞、音樂、影視等信息對象。不同的對象具有不同的特征,如何準確描述這些特征并將其標準化是推薦對象模型需要解決的問題,與用戶模型類似,推薦對象模型的質(zhì)量對推薦結(jié)果也有重要影響。
(三)推薦算法
推薦算法是連接用戶模型和推薦對象模型的橋梁,在推薦系統(tǒng)中起著至關(guān)重要的作用。根據(jù)推薦算法的實現(xiàn)原理,可以將推薦算法分為很多類型,如基于內(nèi)容的推薦、基于關(guān)聯(lián)規(guī)則的推薦、基于人口統(tǒng)計學(xué)的推薦、協(xié)同過濾推薦、混合推薦。在建立推薦系統(tǒng)時,應(yīng)根據(jù)具體的使用場景進行選擇,其中混合推薦算法融合了其它兩種或多種算法,使用較為廣泛。
二、個性化推薦系統(tǒng)的應(yīng)用
目前,推薦系統(tǒng)現(xiàn)已廣泛應(yīng)用在電子商務(wù)、社交網(wǎng)絡(luò)、信息內(nèi)容等領(lǐng)域,在為用戶帶來便利的同時也提高了商家、平臺的服務(wù)水平,是一個雙贏的局面。
(一)電子商務(wù)推薦
類似淘寶、京東等電子商務(wù)平臺都在其購物網(wǎng)站或APP中加入了推薦功能。平臺根據(jù)用戶的購買歷史、個人信息及瀏覽記錄學(xué)習(xí)用戶偏好,應(yīng)用推薦算法向用戶提供購買建議,模擬銷售人員幫助客戶完成購買過程。智能商品推薦,能夠節(jié)省用戶從大量商品中挑選的時間,是電商平臺的核心競爭力之一,能夠在吸引客戶的同時,通過增加用戶的購買欲,提高商品銷量。將人工智能技術(shù)應(yīng)用于電子商務(wù)推薦系統(tǒng),提高推薦系統(tǒng)的自動化、智能化程度以及開發(fā)針對銷售方的推薦系統(tǒng)等問題是目前電子商務(wù)推薦研究的熱點。
(二)社交推薦
微博、知乎、QQ空間、博客等社交媒體的激增使用戶可以隨時隨地創(chuàng)作內(nèi)容、發(fā)布動態(tài)、與好友分享照片、評論、點贊,參與各種形式的網(wǎng)上社交活動。對用戶來說,每天需要花費大量時間與精力找到自己感興趣的人或是事;另一方面,社交媒體也面臨如何將用戶希望看到的內(nèi)容或關(guān)注的人推薦給用戶的難題。為此,人們將個性化推薦技術(shù)與社交網(wǎng)絡(luò)進行結(jié)合,產(chǎn)生了社交推薦系統(tǒng)。由于人是社交的關(guān)鍵因素,因此,社交推薦系統(tǒng)的范疇不僅包括內(nèi)容推薦即幫助用戶選擇其感興趣的信息,人的推薦也是社交推薦的重點,如向用戶推薦好友、陌生人等。
(三)信息內(nèi)容推薦
閱讀是人們獲取信息的主要方式,與社交網(wǎng)絡(luò)中的內(nèi)容推薦類似,人們也會面臨選擇難題,由此發(fā)展出了個性化閱讀技術(shù)一將互聯(lián)網(wǎng)中的大量信息根據(jù)用戶的喜好進行定制、呈現(xiàn)。近年來,個性化閱讀的互聯(lián)網(wǎng)產(chǎn)品發(fā)展很快,許多新聞客戶端、新聞網(wǎng)站或者商業(yè)網(wǎng)站,甚至瀏覽器、搜索引擎都引入了個性化閱讀功能。
音樂、和視頻是現(xiàn)代生活中不可或缺的娛樂內(nèi)容,在線音頻、視頻服務(wù)商也開始利用推薦系統(tǒng)為用戶進行歌曲、視頻內(nèi)容的定制。根據(jù)用戶在平臺上選擇的“看(聽)過”、“想看(聽)”、“喜歡的明星”、風(fēng)格等信息,為用戶推送個性化的音樂和視頻內(nèi)容。
三、個性化推薦系統(tǒng)面臨的問題
目前,雖然個性化推薦系統(tǒng)在眾多領(lǐng)域得到了廣泛應(yīng)用,但也面臨許多急需解決的問題。
(一)隱私保護問題
建立個性化推薦系統(tǒng)需要收集用戶的個人基本信息和歷史活動信息,要達到較好的推薦效果,收集的信息化就會越多、越全面,這些信息大多涉及用戶的個人隱私,一旦泄露,后果不堪設(shè)想。另方面,對隱私泄露的擔(dān)憂會使用戶不愿甚至拒絕提供個人信息,缺乏足夠的信息又會導(dǎo)致推薦系統(tǒng)準確性的下降,使用戶和平臺陷入兩難的境地。近幾年,移動互聯(lián)網(wǎng)的快速發(fā)展和普及,使得個性化系統(tǒng)中隱私保護問題越來越迫切。
(二)數(shù)據(jù)稀疏問題
對于電子商務(wù)平臺來說,其產(chǎn)品和用戶基數(shù)屬于甚至超過千萬等級,而其中被用戶打分的產(chǎn)品比例很低,一般不足1%,這就導(dǎo)致了數(shù)據(jù)稀疏性問題,特別是對采用了基于協(xié)同過濾算法的推薦系統(tǒng),數(shù)據(jù)稀疏問題最為突出。一般來說,數(shù)據(jù)規(guī)模越大,數(shù)據(jù)就越稀疏,針對這個問題學(xué)者們提出了許多解決方案,如擴散算法、添加缺省打分等,但從本質(zhì)上說,稀疏問題很難克服,因而人們更傾向于使用能夠處理數(shù)據(jù)稀疏問題的推薦算法。
(三)多樣性與精確性的矛盾
推薦系統(tǒng)的多樣性是指推薦系統(tǒng)需要滿足用戶不同的興趣。對商家而言,希望提高系統(tǒng)的多樣性來覆蓋更多的商品品類,激發(fā)用戶的購買欲。為保證推薦的多樣性,系統(tǒng)往往通過為用戶制定更大的推薦列表,但結(jié)果包含的內(nèi)容越多,用戶會認為推薦的個性化程度不夠,進而導(dǎo)致推薦的準確性下降。一般來說,推薦系統(tǒng)的多樣性和準確性不能同時得到優(yōu)化,提高某一方面就會導(dǎo)致另一方面的下降,二者相互制約。
此外,推薦系統(tǒng)還面臨冷啟動、大數(shù)據(jù)計算以及在移動終端服務(wù)的時效性等問題,這些問題有的是伴隨推薦系統(tǒng)產(chǎn)生就有的,有的是推薦系統(tǒng)發(fā)展到一定階段才有的,但都不可避免地制約著推薦系統(tǒng)的發(fā)展與應(yīng)用。
四、結(jié)語
本文詳細論述了推薦系統(tǒng)的原理及其在電子商務(wù)、社交網(wǎng)絡(luò)以及信息內(nèi)容方面的應(yīng)用現(xiàn)狀,分析了推薦系統(tǒng)需要解決的隱私保護、數(shù)據(jù)稀疏等問題。作為一個新興領(lǐng)域,推薦系統(tǒng)幫助用戶快速、準確的找到自己需要的信息,架起了用戶和信息提供者之間的橋梁,相信在未來,推薦系統(tǒng)的進一步發(fā)展將會給人們的生活帶來更大的便利。