[摘要] 協(xié)同過(guò)濾推薦是電子商務(wù)推薦系統(tǒng)中應(yīng)用最成功的技術(shù),很大程度上決定了推薦系統(tǒng)的推薦質(zhì)量。文章主要介紹了目前應(yīng)用較廣的幾種協(xié)同過(guò)濾推薦技術(shù),并對(duì)這幾種推薦技術(shù)的存在的問(wèn)題進(jìn)行了分析。
[關(guān)鍵詞] 電子商務(wù) 推薦系統(tǒng) 協(xié)同過(guò)濾
一、引言
隨著互聯(lián)網(wǎng)的廣泛普及,電子商務(wù)對(duì)傳統(tǒng)的商務(wù)交易產(chǎn)生了革命性的變化,產(chǎn)生從以商品為中心到以用戶為中心的商業(yè)模式的轉(zhuǎn)變。新的商業(yè)環(huán)境在為企業(yè)提供新的商機(jī)的同時(shí),也對(duì)企業(yè)提出了新的挑戰(zhàn)。圍繞用戶進(jìn)行服務(wù),為用戶提供所需要的商品,所以對(duì)每個(gè)用戶提供個(gè)性化的服務(wù)成為必要。電子商務(wù)推薦系統(tǒng)成為解決問(wèn)題的重要途徑。而協(xié)同過(guò)濾推薦是目前研究最多、應(yīng)用最廣的電子商務(wù)推薦技術(shù)。
二、電子商務(wù)推薦系統(tǒng)
電子商務(wù)推薦系統(tǒng)定義為:利用電子商務(wù)網(wǎng)站向用戶提供商品信息和建議,幫助用戶決定應(yīng)該購(gòu)買什么產(chǎn)品,模擬銷售人員幫助客戶完成購(gòu)買過(guò)程。它是一個(gè)基于用戶網(wǎng)上購(gòu)物的以商品為推薦對(duì)象的個(gè)性化推薦系統(tǒng),為用戶推薦符合興趣愛(ài)好的商品。分析用戶的消費(fèi)偏向,向每個(gè)用戶具有針對(duì)性地推薦的產(chǎn)品,幫助用戶從龐大的商品目錄中挑選真正適合自己需要的商品。電子商務(wù)推薦系統(tǒng)在幫助了用戶的同時(shí)也提高了用戶對(duì)商務(wù)活動(dòng)的滿意度,換來(lái)對(duì)電子商務(wù)站點(diǎn)的進(jìn)一步支持。
三、協(xié)同過(guò)濾推薦技術(shù)
1.基于用戶的協(xié)同過(guò)濾,基于用戶的協(xié)同過(guò)濾推薦技術(shù)是推薦系統(tǒng)中應(yīng)用最為廣泛的方法之一,它是基于鄰居用戶的興趣愛(ài)好預(yù)測(cè)目標(biāo)用戶的興趣偏好。算法先使用統(tǒng)計(jì)技術(shù)尋找與目標(biāo)用戶有相同喜好的鄰居,然后根據(jù)目標(biāo)用戶的鄰居的偏好產(chǎn)生向目標(biāo)用戶的推薦。它能夠通過(guò)用戶間的相互協(xié)助、根據(jù)用戶對(duì)項(xiàng)目的評(píng)價(jià)的相似性對(duì)用戶進(jìn)行分類,其次,在基于用戶的系統(tǒng)過(guò)濾系統(tǒng)中,所有用戶都能從鄰居用戶的反饋評(píng)價(jià)中得益,當(dāng)然,基于用戶的協(xié)同過(guò)濾系統(tǒng)容易挖掘出目標(biāo)用戶潛在的新興趣。
2.基于項(xiàng)目的協(xié)同過(guò)濾,基于項(xiàng)目的協(xié)同過(guò)濾通過(guò)先計(jì)算已評(píng)價(jià)項(xiàng)目和待預(yù)測(cè)項(xiàng)目的相似度,以相似度作為權(quán)重,加權(quán)各已評(píng)價(jià)項(xiàng)目的評(píng)價(jià)分,得到預(yù)測(cè)項(xiàng)目的預(yù)測(cè)值,基于項(xiàng)目的協(xié)同過(guò)濾推薦根據(jù)用戶對(duì)相似項(xiàng)目的評(píng)分預(yù)測(cè)該用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分,它基于這樣一個(gè)假設(shè):如果大部分用戶對(duì)一些項(xiàng)目的評(píng)分比較相似,則當(dāng)前用戶對(duì)這些項(xiàng)目的評(píng)分也比較相似。
3.基于混合推薦的協(xié)同過(guò)濾,綜合考慮了用戶和項(xiàng)目這兩個(gè)屬性。一種是先根據(jù)項(xiàng)目來(lái)預(yù)測(cè),然后用基于用戶的協(xié)同過(guò)慮產(chǎn)生推薦;另外一種是先根據(jù)用戶來(lái)預(yù)測(cè),然后用基于項(xiàng)目的協(xié)同過(guò)慮產(chǎn)生推薦;還是一種就是分別根據(jù)基于用戶和基于項(xiàng)目的協(xié)同過(guò)慮來(lái)加權(quán)平均產(chǎn)生推薦。
4.基于聚類的協(xié)同過(guò)濾,聚類技術(shù)是根據(jù)用戶的興趣類似性來(lái)進(jìn)行聚類,聚類產(chǎn)生之后,根據(jù)聚類中其他用戶對(duì)項(xiàng)目的評(píng)價(jià)預(yù)測(cè)目標(biāo)用戶對(duì)該項(xiàng)目的評(píng)價(jià)。有學(xué)者提出通過(guò)對(duì)服務(wù)器日志進(jìn)行事務(wù)聚類和關(guān)聯(lián)規(guī)則超圖分割聚類獲取用戶的共同瀏覽特征,然后掃描所有的數(shù)據(jù)集合產(chǎn)生個(gè)性化的推薦。也有學(xué)者提出對(duì)項(xiàng)目進(jìn)行聚類,然后在對(duì)應(yīng)的聚類中搜索目標(biāo)用戶的最近鄰居,由于每個(gè)聚類中的用戶數(shù)量并不是隨著項(xiàng)目數(shù)量的減少而線性減少,所以這種方法在用戶對(duì)多個(gè)聚類中的商品均有評(píng)分的情況下效果并不理想。
5.基于關(guān)聯(lián)規(guī)則的協(xié)同過(guò)濾,關(guān)聯(lián)規(guī)則技術(shù)在零售業(yè)得到了很大的發(fā)展。關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過(guò)程中的相關(guān)性。系統(tǒng)根據(jù)生成的關(guān)聯(lián)規(guī)則模型和用戶當(dāng)前的購(gòu)買行為向用戶產(chǎn)生推薦。關(guān)聯(lián)規(guī)則模型的生成可以離線進(jìn)行,因此可以保證系統(tǒng)的實(shí)時(shí)性要求。
四、待解決的問(wèn)題
1矩陣稀疏性。電子商務(wù)網(wǎng)站通常擁有大量商品,而每個(gè)用戶購(gòu)買或作評(píng)價(jià)的只是其中很小的一部分通常不到1%,例如亞馬遜網(wǎng)站系統(tǒng),數(shù)據(jù)的稀疏會(huì)導(dǎo)致算法準(zhǔn)確率降低。在一般的協(xié)同過(guò)濾系統(tǒng)中,如果兩個(gè)用戶沒(méi)有對(duì)相同的商品進(jìn)行打分,即使這兩個(gè)用戶的興趣愛(ài)好都相同,系統(tǒng)也無(wú)法得出他們之間的相似度,算法甚至找不到任何商品可作推薦。
2.冷啟動(dòng)問(wèn)題。冷啟動(dòng)問(wèn)題有新商品問(wèn)題和新用戶問(wèn)題兩類。新商品問(wèn)題是指一個(gè)新商品剛加入的時(shí)候,沒(méi)有人或很少人評(píng)價(jià),則這個(gè)商品很難被推薦出去,這就需要推薦系統(tǒng)引入一些新機(jī)制來(lái)激勵(lì)用戶多作評(píng)價(jià)。新用戶問(wèn)題是指推薦系統(tǒng)中對(duì)用戶的分類是依據(jù)目標(biāo)用戶與其他用戶的比較,這種比較主要基于不斷累積的用戶評(píng)價(jià)。如果一個(gè)新用戶從未對(duì)系統(tǒng)中的項(xiàng)目進(jìn)行評(píng)價(jià),則系統(tǒng)無(wú)法獲知他的興趣點(diǎn),也就無(wú)法對(duì)他進(jìn)行推薦。
3.可擴(kuò)展性。隨著用戶和項(xiàng)目數(shù)量急劇增加,在整個(gè)用戶空間上搜索目標(biāo)用戶的最近鄰居比較耗時(shí),難以滿足推薦系統(tǒng)的實(shí)時(shí)性要求。主要由于基于用戶或項(xiàng)目的協(xié)同過(guò)濾算法需要掃描整個(gè)數(shù)據(jù)庫(kù)來(lái)計(jì)算相似度,因此隨著數(shù)據(jù)庫(kù)中記錄的增加,其計(jì)算復(fù)雜度呈指數(shù)級(jí)別增長(zhǎng),導(dǎo)致推薦系統(tǒng)性能急劇下降。一種可能的方法就是用聚類分兩階段來(lái)解決問(wèn)題。離線階段對(duì)用戶或項(xiàng)目進(jìn)行分類,在線階段就可以直接到規(guī)模小很多的聚類中心找到最近鄰居并產(chǎn)生推薦。
4.隱私保持問(wèn)題。協(xié)同過(guò)濾中隱私保持問(wèn)題近年來(lái)也引起了越來(lái)越多學(xué)者的研究興趣。數(shù)據(jù)挖掘中隱私保持是近年來(lái)學(xué)術(shù)界的一個(gè)研究熱點(diǎn),已在很多協(xié)同過(guò)濾中取得了成果。有基于加密的技術(shù)和隨機(jī)擾亂技術(shù)解決方案。也有用對(duì)等網(wǎng)絡(luò)結(jié)構(gòu)的協(xié)同過(guò)濾推薦隱私保持問(wèn)題的技術(shù)方案。
五、總結(jié)
電子商務(wù)推薦系統(tǒng),一方面有助于電子商務(wù)網(wǎng)站內(nèi)容和結(jié)構(gòu)自適應(yīng)性的實(shí)現(xiàn),另一方面在幫助用戶快速定位感興趣的商品的同時(shí)也為企業(yè)實(shí)現(xiàn)了增值。而協(xié)同過(guò)濾與其他推薦方法比較有許多不可替代的優(yōu)化,本文對(duì)協(xié)同過(guò)濾推薦技術(shù)進(jìn)行了介紹,并對(duì)存在的問(wèn)題進(jìn)行了概述。目前,國(guó)內(nèi)的電子商務(wù)網(wǎng)站在這方面的實(shí)踐處在快速發(fā)展的階段,因此還需要繼續(xù)研究出更智能、更優(yōu)化的協(xié)同過(guò)濾推薦技術(shù)。
參考文獻(xiàn):
[1]姜有輝高琳琦:電子商場(chǎng)中的個(gè)性化推薦研究與應(yīng)用[J].商場(chǎng)現(xiàn)化,2006,33
[2]余力劉魯:電子商務(wù)個(gè)性化推薦研究[J].計(jì)算機(jī)集成制造系統(tǒng),2004,10