亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電子商務(wù)推薦系統(tǒng)主要推薦技術(shù)研究

        2014-04-29 00:00:00顧立志

        摘要:推薦系統(tǒng)作為解決信息超載問題的有效工具,受到國內(nèi)外研究者的廣泛關(guān)注。本文簡要描述了推薦系統(tǒng)的定義以及作用,重點(diǎn)介紹了基于規(guī)則的推薦、基于內(nèi)容的推薦和協(xié)同過濾推薦這三種算法,分析了每種算法的優(yōu)缺點(diǎn),并描述了混合推薦技術(shù)的基本思路。文中列出了幾種評(píng)價(jià)推薦系統(tǒng)性能的重要指標(biāo)。

        關(guān)鍵詞:電子商務(wù);推薦算法;評(píng)價(jià)指標(biāo)

        中圖分類號(hào):TP311

        目前網(wǎng)絡(luò)交易已逐漸得到人們的認(rèn)可,成為人們?nèi)粘I钪械闹匾糠?。眾多企業(yè)開始創(chuàng)建電子商務(wù)網(wǎng)站,希望通過網(wǎng)絡(luò)交易的低廉成本獲得更大的商業(yè)利潤。目前,電子商務(wù)網(wǎng)站數(shù)量不斷增多,網(wǎng)站的用戶對(duì)其提供的服務(wù)質(zhì)量要求也越來越高。因此更好地了解用戶的需求,提供更優(yōu)質(zhì)、個(gè)性化的服務(wù)成為各大電子商務(wù)網(wǎng)站競爭的有利條件。推薦系統(tǒng)就是在這樣的環(huán)境中產(chǎn)生的。

        1 電子商務(wù)推薦系統(tǒng)的作用

        著名的電子商務(wù)網(wǎng)站亞馬遜積極地應(yīng)用和推廣了個(gè)性化推薦系統(tǒng),至于推薦系統(tǒng)究竟給亞馬遜帶來了多少經(jīng)濟(jì)利潤,目前亞馬遜官方還沒有明確公開過,但亞馬遜的前科學(xué)家Gerg Linden在他博客里曾說過,在他離開亞馬遜的時(shí)候,亞馬遜至少有20%(之后的一篇博文則變更為35%)的銷售額來自推薦算法。研究表明,電子商務(wù)的銷售行業(yè),尤其在書籍、電影或者日用百貨等商品價(jià)格相對(duì)較低而且種類繁多的行業(yè),推薦系統(tǒng)能有效提高企業(yè)的銷售額。推薦系統(tǒng)之所以能給商家?guī)砭薮蟮慕?jīng)濟(jì)效益,其優(yōu)勢在于它能分析用戶的行為數(shù)據(jù),概括出用戶的愛好特征,從而可以根據(jù)用戶自身的需求提供推薦列表項(xiàng)目。如果網(wǎng)站中的商品或者用戶興趣傾向發(fā)生改變, 推薦系統(tǒng)也可以進(jìn)行實(shí)時(shí)更新,自動(dòng)改變推薦列表。

        推薦系統(tǒng)的作用主要有幾下幾點(diǎn)[1]:

        (1)挖掘潛在用戶。用戶購買意向不強(qiáng)時(shí)可能只是隨意地瀏覽商品,如果此時(shí)推薦系統(tǒng)的推薦結(jié)果能夠引起用戶的興趣,瀏覽者就很有可能變成購買者。

        (2)提高網(wǎng)站連鎖銷售的幾率。用戶在網(wǎng)購過程中,如果推薦系統(tǒng)能向用戶提供一些他極有可能會(huì)購買的商品,這樣就能夠促進(jìn)商品的連鎖銷售。比如那些用戶需要但一時(shí)還沒想起購買的商品。

        (3)增加忠實(shí)用戶的數(shù)量。如果推薦系統(tǒng)能夠?yàn)橛脩籼峁﹥?yōu)質(zhì)的服務(wù),就會(huì)增加用戶對(duì)網(wǎng)站的訪問次數(shù),最終發(fā)展成為忠實(shí)顧客。

        2 主要的推薦算法

        2.1 基于規(guī)則的推薦

        基于規(guī)則的推薦就是通過挖掘關(guān)聯(lián)規(guī)則尋找可以用于推薦的項(xiàng)目。所謂關(guān)聯(lián)規(guī)則挖掘是一種在大規(guī)模交易中識(shí)別類似規(guī)則關(guān)系模式的通用技術(shù)。這種技術(shù)的典型應(yīng)用就是從超市里經(jīng)常購買的商品中發(fā)掘成對(duì)或成組的商品。假如用集合表示所有商品,集合T表示已經(jīng)購買的商品,其中,集合T是集合P的子集。關(guān)聯(lián)規(guī)則經(jīng)常寫成X=>Y的形式,X和Y都是P的子集,并且X和Y交集為空。關(guān)聯(lián)規(guī)則X=>Y表示只要交易T中包含X集合中的元素,那么Y集合中的元素就非常有可能也在相同的交易T中。關(guān)聯(lián)規(guī)則的衡量標(biāo)準(zhǔn)是支持度和可信度。關(guān)聯(lián)規(guī)則X=>Y的支持度是X和Y同時(shí)出現(xiàn)在一次交易中的概率,可信度是對(duì)應(yīng)給定條件X時(shí)Y的條件概率。用公式可表示為:

        ;

        。

        簡單的關(guān)聯(lián)規(guī)則推薦算法過程如下:

        (1)使用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法,確定與目標(biāo)用戶相關(guān)的關(guān)聯(lián)規(guī)則X=>Y的集合,即目標(biāo)用戶買過或者喜歡的集合X中的所有元素;

        (2)計(jì)算出這些規(guī)則的Y集合中用戶沒有購買過的商品集S;

        (3)按照規(guī)則的可信度從高到低的順序?qū)蟂中的商品進(jìn)行排序。如果多條規(guī)則都推薦一個(gè)商品,則選取可信度最高的那條規(guī)則;

        (4)輸出排序列表中最前面的N個(gè)元素作為推薦結(jié)果。

        2.2 基于內(nèi)容的推薦算法

        基于內(nèi)容的推薦:根據(jù)用戶歷史行為信息(如評(píng)價(jià)、分享、收藏過的文檔)構(gòu)造該用戶的愛好傾向模型,計(jì)算其他推薦項(xiàng)目與愛好傾向模型中文檔的相似度,將比較相似的幾個(gè)項(xiàng)目推薦給用戶?;趦?nèi)容的推薦系統(tǒng)的典型應(yīng)用就是文檔推薦,通過比較待選文章的主要關(guān)鍵詞和用戶過去高度評(píng)價(jià)過的其他文章中出現(xiàn)的關(guān)鍵詞來推薦新文章。這些關(guān)鍵詞能夠明確表現(xiàn)出文檔的特征。

        基于內(nèi)容的推薦算法依賴項(xiàng)目和用戶興趣偏好的額外信息,但是該算法不需要大量的用戶評(píng)分記錄,即使只有一個(gè)用戶也可以產(chǎn)生推薦列表,因此不會(huì)受到稀疏性問題的影響。另外該推薦算法根據(jù)的是項(xiàng)目或用戶偏好的描述信息,因此推薦結(jié)果能夠解釋為什么系統(tǒng)會(huì)選擇這些項(xiàng)目推薦給用戶,讓用戶能更直觀的感受推薦系統(tǒng)帶來的便利。但是基于內(nèi)容的推薦算法仍然具有一定的局限性:

        (1)對(duì)內(nèi)容分析的不夠深入。在推薦網(wǎng)頁時(shí),僅僅看文本內(nèi)容可能無法確定網(wǎng)頁的質(zhì)量和偏好,比如美觀、可用性、時(shí)效性或者超鏈接的正確性都能夠決定網(wǎng)頁的質(zhì)量。另外目前的超文本文檔中越來越多地包含多媒體元素的信息,比如圖片、音頻和視頻序列,純粹的基于內(nèi)容的推薦算法卻無法收集這些類型(圖形、圖像、音頻、視頻)的內(nèi)容信息。

        (2)推薦結(jié)果缺乏新穎性?;趦?nèi)容的推薦系統(tǒng)是給用戶推薦那些與他評(píng)價(jià)較高的項(xiàng)目相似的項(xiàng)目,因此推薦結(jié)果往往與用戶熟知的項(xiàng)目太相似,缺乏新穎性。

        (3)獲取評(píng)分存在一定的困難。盡管基于內(nèi)容推薦技術(shù)不需要大量的用戶雀替,但至少需要來自用戶的初始評(píng)分集合,一般來說是顯式的“喜歡”和“不喜歡”標(biāo)注集合。在所有的過濾技術(shù)中,推薦精確度會(huì)隨著評(píng)分?jǐn)?shù)量增加而提高,但在很多領(lǐng)域,用戶可能不愿意在使用系統(tǒng)之前就給過多的項(xiàng)目評(píng)分。

        2.3 協(xié)同過濾推薦算法

        協(xié)同過濾以其特有的優(yōu)勢成為眾多專家和學(xué)者關(guān)注的焦點(diǎn),目前在各大電子商務(wù)網(wǎng)站得到廣泛應(yīng)用。該算法的思想是:根據(jù)已有的評(píng)分記錄計(jì)算用戶或者項(xiàng)目的相似度;根據(jù)相似性結(jié)果找出當(dāng)前用戶(或項(xiàng)目)的最近鄰;根據(jù)最近鄰中用戶(或項(xiàng)目)的評(píng)分預(yù)測當(dāng)前用戶評(píng)分情況,最終根據(jù)評(píng)分值大小確定是否將該項(xiàng)目推薦給用戶。

        協(xié)同過濾推薦算法可以分基于用戶的協(xié)同過濾(UCF)與基于項(xiàng)目的協(xié)同過濾(ICF)兩種。這兩個(gè)算法的共同點(diǎn)在于二者都基于用戶-項(xiàng)目評(píng)分矩陣來建立推薦系統(tǒng)模型,進(jìn)而為用戶提供推薦服務(wù)的。區(qū)別在于UCF是根據(jù)用戶之間的相似性找到目標(biāo)用戶的最近鄰集,也就是在評(píng)分矩陣的行之間進(jìn)行計(jì)算的,然后根據(jù)該集合中用戶的評(píng)分情況確定將哪些項(xiàng)目推薦給用戶。而ICF則是通過分析項(xiàng)目之間的相似性,也就是在評(píng)分矩陣的列與列之間進(jìn)行計(jì)算,最終確定將哪些項(xiàng)目推薦給用戶。

        和基于內(nèi)容的過濾方法相比,協(xié)同過濾方法具有如下優(yōu)點(diǎn):

        (1)對(duì)信息內(nèi)容沒有特殊要求。協(xié)同過濾不考慮的具體內(nèi)容類型,因此可以很好地分析圖形、圖像、視頻、音樂等類型的信息。

        (2)推薦結(jié)果具有一定的新穎性。協(xié)同過濾不考慮內(nèi)容屬性的差異,因此推薦結(jié)果可能是用戶事先預(yù)料不到的。

        目前,協(xié)同過濾技術(shù)已經(jīng)得到了廣泛應(yīng)用。但是網(wǎng)站商品信息量和用戶人數(shù)在不斷攀升,網(wǎng)站的結(jié)構(gòu)也越來越復(fù)雜,因此基于協(xié)同過濾的推薦系統(tǒng)面臨著一系列問題,其中比較受關(guān)注的有稀疏性、冷啟動(dòng)和可擴(kuò)展性3個(gè)問題[2]。

        (1)數(shù)據(jù)稀疏性問題。在一些大型網(wǎng)站如亞馬遜,用戶評(píng)價(jià)過的項(xiàng)目質(zhì)量相對(duì)網(wǎng)站中總項(xiàng)目數(shù)量可謂是冰山一角,這就導(dǎo)致了用戶-項(xiàng)目評(píng)分矩陣中數(shù)據(jù)的極度稀疏,當(dāng)數(shù)據(jù)量較少時(shí)計(jì)算用戶間的相似度,其結(jié)果準(zhǔn)確度不高,得到的最近鄰集合不可靠。

        (2)冷啟動(dòng)。冷啟動(dòng)包括系統(tǒng)冷啟動(dòng)、用戶冷啟動(dòng)和項(xiàng)目冷啟動(dòng)。系統(tǒng)冷啟動(dòng)問題主要解決如何在一個(gè)新開發(fā)的網(wǎng)站上設(shè)計(jì)個(gè)性化推薦系統(tǒng),從而在網(wǎng)站剛發(fā)布的時(shí)候就能讓用戶體驗(yàn)到個(gè)性化推薦服務(wù)。用戶冷啟動(dòng)主要解決的是在沒有新用戶的行為數(shù)據(jù)時(shí)如果為其提供個(gè)性化推薦服務(wù)。項(xiàng)目冷啟動(dòng)主要解決將新上架的項(xiàng)目推薦給可能對(duì)它感興趣的用戶。

        (3)擴(kuò)展性問題。電子商務(wù)網(wǎng)站、商品、用戶的數(shù)量都在不斷增加,推薦系統(tǒng)將面臨嚴(yán)重的可擴(kuò)展性問題。

        2.4 混合推薦技術(shù)

        上述的三種推薦算法各有優(yōu)缺點(diǎn),為了更好地提高推薦質(zhì)量,可以將幾種推薦技術(shù)組合在一起,盡管在理論上有多種結(jié)合方式,但在實(shí)際應(yīng)用中并不是每一種結(jié)合方式都有效,因此要根據(jù)實(shí)際情況選擇適當(dāng)結(jié)合方式。

        在結(jié)合方式上,Robin提出了七種思路[3]:

        (1)加權(quán)。為多種推薦技術(shù)產(chǎn)生的結(jié)果設(shè)置合理的權(quán)重,將各項(xiàng)累加計(jì)算出最終結(jié)果。

        (2)變換。每次推薦要根據(jù)實(shí)際情況選取一種最優(yōu)的推薦策略。

        (3)混合。將采用每種推薦技術(shù)產(chǎn)生的結(jié)果都提供給用戶,用戶可以從中選擇自己最滿意的項(xiàng)目。

        (4)特征組合。組合來自不同推薦數(shù)據(jù)源的特征,將其應(yīng)用到一種推薦算法中。

        (5)層疊。將采用一種推薦技術(shù)得到的結(jié)果作為使用第二種推薦技術(shù)的基礎(chǔ)。

        (6)特征擴(kuò)充。將利用一種技術(shù)產(chǎn)生附加的特征信息作為另一種推薦技術(shù)的特征輸入數(shù)據(jù)。

        (7)元級(jí)別。用一種推薦方法產(chǎn)生的模型作為另一種推薦方法的輸入。

        3 推薦系統(tǒng)的評(píng)價(jià)指標(biāo)

        評(píng)估推薦系統(tǒng)性能的指標(biāo)有很多,這些指標(biāo)包括用戶滿意度、預(yù)測精確度、覆蓋率、多樣性、新穎性、實(shí)時(shí)性和健壯性等。用戶滿意度無法離線計(jì)算,只能通過用戶調(diào)查或者是在線實(shí)驗(yàn)獲得。多樣性能夠滿足用戶的廣泛興趣需求,是衡量推薦系統(tǒng)性能的重要指標(biāo)。新穎的推薦是指給用戶推薦那些他們以前沒有聽說過的項(xiàng)目。很多網(wǎng)站中的內(nèi)容比如新聞、微博等具有很強(qiáng)的實(shí)時(shí)性,所以需要在項(xiàng)目還具有時(shí)效性時(shí)就將它們推薦給用戶。推薦系統(tǒng)的實(shí)時(shí)性包括兩個(gè)方面,一個(gè)方面是推薦系統(tǒng)需要實(shí)時(shí)地更新推薦列表來滿足用戶新的行為變化;另一方面是推薦系統(tǒng)需要能夠?qū)⑿录尤胂到y(tǒng)的項(xiàng)目推薦給用戶。健壯性指標(biāo)是用來衡量推薦系統(tǒng)抗擊作弊的能力。下面重點(diǎn)講述覆蓋率和預(yù)測精確度這兩個(gè)指標(biāo)。

        覆蓋率可以表示推薦項(xiàng)目所覆蓋的領(lǐng)域范圍。覆蓋率最簡單的定義是推薦系統(tǒng)推薦的項(xiàng)目占總項(xiàng)目集合的比例,但是該種定義過于粗略,在信息論和經(jīng)濟(jì)學(xué)中有兩個(gè)著名的指標(biāo)可以用來定義覆蓋率。

        推薦結(jié)果的準(zhǔn)確率定義為第一個(gè)是信息熵:

        其中,p(i)是項(xiàng)目 的流行度除以所有項(xiàng)目流行度之和。第二個(gè)指標(biāo)是基尼系數(shù):

        其中,ij是按照項(xiàng)目流行度p()從小到大排序的項(xiàng)目列表中第j個(gè)物品。

        預(yù)測精確度可以表示一個(gè)推薦系統(tǒng)或者推薦算法預(yù)測用戶行為的能力。很多提供推薦服務(wù)的網(wǎng)站都有一個(gè)讓用戶給項(xiàng)目評(píng)分的功能,推薦系統(tǒng)可以利用這些評(píng)分記錄推測出用戶的興趣模型,為用戶提供推薦項(xiàng)目。預(yù)測用戶對(duì)項(xiàng)目的評(píng)分行為稱為評(píng)分預(yù)測。評(píng)分預(yù)測的預(yù)測準(zhǔn)確度一般通過均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)計(jì)算。對(duì)于測試集T中的一個(gè)用戶U和項(xiàng)目i,令rui表示用戶U對(duì)項(xiàng)目i的實(shí)際評(píng)分值, 是推薦算法計(jì)算出的預(yù)測評(píng)分,那么RMSE的定義為:

        MAE采用絕對(duì)值計(jì)算預(yù)測誤差,它的定義為:

        網(wǎng)站在提供推薦服務(wù)時(shí),一般是給用戶一個(gè)個(gè)性化的推薦列表,這種推薦成為TOPN推薦。TOPN推薦的預(yù)測準(zhǔn)確率一般通過準(zhǔn)確率(Precision)/召回率(Recall)度量。根據(jù)用戶在訓(xùn)練集上的行為給用戶作出的推薦列表用R(u)表示,用戶在測試集上的行為列表用T(u)表示。那么推薦結(jié)果的召回率定義為:

        推薦結(jié)果的準(zhǔn)確率定義為:

        4 結(jié)束語

        電子商務(wù)推薦系統(tǒng)已經(jīng)取得了很好的研究成果,在亞馬遜、淘寶、當(dāng)當(dāng)?shù)却笮途W(wǎng)站都得到了廣泛應(yīng)用,但是電子商務(wù)推薦系統(tǒng)仍然存在一些問題,現(xiàn)有的推薦算法仍需要改進(jìn)和完善。

        參考文獻(xiàn):

        [1]劉曉波.基于關(guān)聯(lián)規(guī)則的電子商務(wù)商品推薦系統(tǒng)研究[J].中國市場,2008(52):78-79.

        [2]王桂芬.電子商務(wù)個(gè)愷化推薦系統(tǒng)中協(xié)同過濾算法的研究與應(yīng)用[D].南昌大學(xué),2012.

        [3]ROBIN B.Hybrid recommender systems:survey and experiments[R].Department of Information Systems and Decision Sciences,California State University,F(xiàn)ullerton.

        作者簡介:顧立志(1980-),男,河北人,交付中心經(jīng)理,工程師,研究生,研究方向:信息管理與信息系統(tǒng)。

        作者單位:CSC信息科技(天津)有限公司,天津 300308

        久热在线播放中文字幕| 午夜福利一区在线观看中文字幕| 国产女人精品一区二区三区 | 淫欲一区二区中文字幕| 久久男人av资源网站无码 | 国产九九在线观看播放| 吃下面吃胸在线看无码| 亚洲日韩AV无码美腿丝袜| 亚洲无码激情视频在线观看| 中文字幕人成乱码中文乱码| 蜜桃网站入口可看18禁| 亚洲天堂av一区二区| 国产偷国产偷亚洲综合av| 日本免费大片一区二区| 亚洲国产精品成人久久久 | 日本女优在线一区二区三区| 亚洲av日韩综合一区二区三区| 国产精品久久久久aaaa| 亚洲伊人色欲综合网| 三级在线看中文字幕完整版| 欧美国产日本高清不卡| 国产剧情福利AV一区二区| 一区二区三区不卡在线| av无码特黄一级| 亚洲国产高清一区av| 国内免费自拍9偷1拍| av免费在线播放视频| аⅴ天堂中文在线网| 成人在线免费电影| 国产农村乱辈无码| 人妻无码aⅴ不卡中文字幕| 狠狠躁夜夜躁人人爽天天不卡软件| 国产欧美久久久另类精品| 精品少妇后入一区二区三区| 日韩精品视频中文字幕播放| 亚洲一区二区三区在线视频| 45岁妇女草逼视频播放| 国产美女高潮流白浆免费视频| 久久精品无码一区二区日韩av| 国产亚洲2021成人乱码| 免费人成无码大片在线观看|