亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶興趣模型的個(gè)性推薦算法

        2018-05-23 11:46:20郁鋼陸海良單宇翔高揚(yáng)華

        郁鋼 陸海良 單宇翔 高揚(yáng)華

        摘 要: 協(xié)同過(guò)濾推薦技術(shù)和基于商品屬性的推薦技術(shù)是比較流行的個(gè)性化推薦方法,但是前者存在數(shù)據(jù)稀少和新對(duì)象問(wèn)題,后者也存在無(wú)法挖掘用戶潛在興趣的問(wèn)題。本文采用基于區(qū)域用戶的相鄰用戶進(jìn)行數(shù)據(jù)評(píng)分的矩陣填充,并采用商品之間的關(guān)聯(lián)規(guī)則應(yīng)用和解釋來(lái)向用戶推薦產(chǎn)品。測(cè)試表明,本方法解決了新商品的問(wèn)題,并且在推薦的準(zhǔn)確度、新穎性和覆蓋度上有了較好的效果。

        關(guān)鍵詞: 用戶興趣模型;個(gè)性推薦;數(shù)據(jù)稀疏問(wèn)題

        Abstract:Collaborative filtering recommendation and recommendation based on product attributes are popular personalized recommendation methods. But the former can't handle the issues about sparse data and new objects the latter is not capable of mining the potential interests of users. This paper uses the matrix of data grading based on the adjacent users of the regional users and recommends the products to the users by applying and explaining the association rules between the commodities. Testing shows that this method solves the problem of new products and has good results in terms of accuracy novelty and coverage.

        Key words: user interest model;personalized recommendation; sparse data

        1 協(xié)同過(guò)濾算法

        協(xié)同過(guò)濾(collaborative filtering CF)推薦算法是當(dāng)前使用最為頻繁也最有效果的個(gè)性化定制銷售策略,可以利用消費(fèi)者之間的共性向目標(biāo)用戶推薦已知用戶的興趣偏好[1]。CF算法一般利用用戶對(duì)商品的評(píng)價(jià)信息和用戶信息來(lái)構(gòu)造用戶-商品矩陣,根據(jù)用戶之間的相似性產(chǎn)生鄰居用戶集,進(jìn)而產(chǎn)生推薦數(shù)據(jù)集[2]。針對(duì)目標(biāo)用戶的推薦過(guò)程就是使用矩陣數(shù)據(jù)進(jìn)行預(yù)測(cè),評(píng)估用戶對(duì)未接觸過(guò)產(chǎn)品的評(píng)分情況、即感興趣度,由此在大量數(shù)據(jù)集中計(jì)算出推薦列表。

        CF的推薦算法的主要實(shí)現(xiàn)過(guò)程則如圖1所示。對(duì)其內(nèi)容可描述為:

        (1)生成用戶-商品矩陣;

        (2)采集相近用戶數(shù)據(jù)集;

        (3)推薦結(jié)果集合。

        用戶對(duì)商品的評(píng)價(jià)可分為顯式評(píng)價(jià)和隱式評(píng)價(jià)。其中,顯式評(píng)價(jià)是指用戶對(duì)自己感興趣的商品進(jìn)行有意識(shí)的評(píng)分。隱式評(píng)價(jià)[3]是用戶在網(wǎng)頁(yè)中的駐留時(shí)間,對(duì)某一商品的消費(fèi)記錄等方式?,F(xiàn)階段針對(duì)企業(yè)的營(yíng)銷,多是采用顯式和隱式相結(jié)合的方式來(lái)獲取信息。

        2 數(shù)據(jù)稀疏問(wèn)題

        CF算法中的評(píng)分分布存在分散性問(wèn)題,即數(shù)據(jù)稀疏問(wèn)題,因數(shù)據(jù)量太少會(huì)引起尋找鄰居用戶時(shí)的困難,進(jìn)而將無(wú)從保證個(gè)性化的推薦效果。在用戶-商品矩陣中,空缺的評(píng)分可設(shè)置為一個(gè)固定值,該值可采用評(píng)分均值或者總分的中間值,當(dāng)下已有研究能夠證明這種方式可以改善個(gè)性化推薦的結(jié)果。但是這種方式并不能很好地解釋用戶為什么被賦予評(píng)分均值或者中間值。

        在上述的CF推薦算法中,若消費(fèi)者A和消費(fèi)者B之間不存在對(duì)同一商品進(jìn)行評(píng)分的行為,即使2位消費(fèi)者之間對(duì)商品屬性的偏愛(ài)存在很多的相同點(diǎn),推薦系統(tǒng)也無(wú)法判定2位客戶之間的關(guān)聯(lián)關(guān)系。基于商品屬性相似度的個(gè)性化推薦可以解決這個(gè)問(wèn)題,但若針對(duì)2個(gè)商品,同一用戶還未對(duì)其給予評(píng)價(jià),這2個(gè)商品之間的相同點(diǎn)也將難于計(jì)算出來(lái)。

        針對(duì)評(píng)分矩陣的稀疏性問(wèn)題,許多研究從用戶關(guān)聯(lián)、技術(shù)創(chuàng)新等不同角度提出解決方案。從用戶角度,如張忠平[4]等提出將用戶對(duì)商品的評(píng)分作為一個(gè)集合,來(lái)計(jì)算消費(fèi)者之間的共同點(diǎn),篩選增加用戶對(duì)商品評(píng)價(jià)共同的評(píng)分項(xiàng),從而可以提升預(yù)測(cè)的準(zhǔn)確度。秦凱[5]等人從社會(huì)網(wǎng)絡(luò)信任特征出發(fā)來(lái)尋找相似用戶。HUANG[6]等人考慮商品屬性信息和用戶注冊(cè)信息的關(guān)聯(lián)匹配。從技術(shù)角度,張光衛(wèi)[7]等人通過(guò)聚類技術(shù)對(duì)大量數(shù)據(jù)的評(píng)分結(jié)果內(nèi)容實(shí)現(xiàn)降維處理,進(jìn)而減小被推薦者近鄰的整體范圍空間,提高評(píng)測(cè)的準(zhǔn)確度。王兆國(guó)[8]等人利用用戶或物品的評(píng)分頻次信息,建立了線性回歸模型,以此預(yù)測(cè)用戶對(duì)未置評(píng)物品的評(píng)分。王明佳[9]提出基于項(xiàng)目情景的推薦方法綜合項(xiàng)目分類對(duì)用戶提供個(gè)性化推薦模式。

        上述研究在一定程度上提高了個(gè)性化推薦的準(zhǔn)確度,部分解決了數(shù)據(jù)稀疏性問(wèn)題。但是,在測(cè)定兩者之間的相同點(diǎn)時(shí),前提條件是用戶與用戶之間并不存在關(guān)聯(lián)關(guān)系,也就是說(shuō)用戶被相鄰消費(fèi)影響程度是相同的。在實(shí)際應(yīng)用中,不同的消費(fèi)者受其興趣度相鄰用戶的影響程度并非完全相同,這種情況會(huì)直接影響商品最終評(píng)分的精準(zhǔn)性,進(jìn)而影響到用戶的實(shí)際需求[10]。雖然引入、也研究了一些情景因素,但卻僅僅考慮了用戶自身的屬性和商品的分類,而并未關(guān)注重視用戶周圍因素對(duì)個(gè)性化所造成的作用效果。

        綜上,在評(píng)分?jǐn)?shù)據(jù)極端稀疏的情況下,前述研究沒(méi)有同時(shí)考慮到用戶評(píng)分行為和用戶環(huán)境兩種重要因素,依然無(wú)法準(zhǔn)確地度量用戶間相似性,造成評(píng)分預(yù)測(cè)準(zhǔn)確度較低,導(dǎo)致推薦質(zhì)量也隨即呈現(xiàn)下降態(tài)勢(shì)。在企業(yè)的個(gè)性化推薦營(yíng)銷的過(guò)程中,多數(shù)推薦策略都是依據(jù)用戶對(duì)商品評(píng)分的高低來(lái)預(yù)測(cè)消費(fèi)者對(duì)商品的偏愛(ài)程度,不同消費(fèi)者之間利用評(píng)價(jià)相同產(chǎn)品的個(gè)數(shù)來(lái)測(cè)定用戶之間的相似性。這種情況是在數(shù)據(jù)混合的條件下展開(kāi)的,而沒(méi)有對(duì)用戶劃定分類。如果能夠提前進(jìn)行用戶分類,分類的原則主要基于用戶所在區(qū)域、所處時(shí)間段等情景,如此可將相似用戶相對(duì)準(zhǔn)確地合并歸類,而在此基礎(chǔ)上實(shí)施推薦算法,才能有效改進(jìn)評(píng)分預(yù)測(cè)準(zhǔn)確度,從而提高協(xié)同過(guò)濾的推薦質(zhì)量。

        3 混合協(xié)同過(guò)濾算法

        提出新客戶受周圍因素的影響來(lái)解決數(shù)據(jù)稀少問(wèn)題,即對(duì)于新客戶而言,其所在的地域和周圍生活環(huán)境會(huì)在很大程度上影響到用戶的決定。因而,可以將新客戶的空白評(píng)分依據(jù)好友用戶的評(píng)分進(jìn)行填充,不僅可以增加用戶的個(gè)人數(shù)據(jù)集,還可以豐富商品屬性的特征數(shù)據(jù)集,有利于發(fā)現(xiàn)客戶隱含的興趣偏好。在以下研究中,設(shè)計(jì)提出了根據(jù)好友關(guān)系和商品屬性的特性功能來(lái)緩解推薦算法帶來(lái)的數(shù)據(jù)稀少的缺陷。該算法主要是通過(guò)老用戶與新用戶是好友的關(guān)系來(lái)計(jì)算用戶對(duì)商品屬性的偏愛(ài)程度,間接獲取新的消費(fèi)者對(duì)商品的選擇方向和預(yù)計(jì)評(píng)分,從而增加銷售量,擴(kuò)大企業(yè)的知名度。

        本文采用的是Adamic-Adar指數(shù)和資源分配指數(shù)計(jì)算客戶與客戶間的相同點(diǎn)。原理來(lái)自計(jì)算機(jī)網(wǎng)絡(luò)結(jié)構(gòu)圖,即任意的2個(gè)未連接的節(jié)點(diǎn)之間在未來(lái)有可能會(huì)發(fā)生鏈接的概率大小。此后,則拓展到了電子商務(wù)中用于推演得到用戶與商品之間的偏愛(ài)程度和社交關(guān)系網(wǎng)中計(jì)算好友之間的信任程度。在企業(yè)中,可根據(jù)相同地域條件來(lái)劃分新用戶,將新用戶劃分到具有類似愛(ài)好的老用戶群體中。

        Adamic-Adar指數(shù)是指通過(guò)增加好友數(shù)量較小的相似權(quán)重來(lái)提升共同好友的權(quán)重計(jì)算(排除好友為零的情況),數(shù)學(xué)定義如下:

        資源分配指數(shù)表征著在復(fù)雜網(wǎng)絡(luò)上進(jìn)行動(dòng)態(tài)資源分配的應(yīng)用指數(shù)。假設(shè)有2個(gè)節(jié)點(diǎn)u、v沒(méi)有直接相連。節(jié)點(diǎn)u可以把資源發(fā)送給v,兩者之間的共同鄰近節(jié)點(diǎn)起著傳送的作用。

        假設(shè)每個(gè)傳送者有一個(gè)單位資源,并且傳送給每個(gè)鄰近節(jié)點(diǎn)的概率是一樣的。資源分配指數(shù)的定義如下:

        即sim(u,v)=sim(v,u),雖然彼此間的目的不同,但是兩者有著相似的結(jié)構(gòu),也就是說(shuō)降低了共同鄰近節(jié)點(diǎn)。

        通過(guò)新用戶與好友之間的關(guān)系分析得到兩者之間的相關(guān)性。對(duì)于商品i和用戶u來(lái)說(shuō),基于朋友關(guān)系的預(yù)測(cè)值具體可如式(3)所示:

        其中,Ni是對(duì)商品i的評(píng)分預(yù)測(cè)客戶數(shù)據(jù)集合;ICv是客戶V評(píng)價(jià)商品的個(gè)數(shù);sim(u,v)是用戶U和用戶V之間的相關(guān)性。

        基于商品的已有屬性信息挖掘出用戶對(duì)項(xiàng)目的偏愛(ài)程度,因此基于商品屬性信息的預(yù)測(cè)評(píng)分值的計(jì)算公式可表述如下:

        其中,NTi是項(xiàng)目i的所有標(biāo)簽;ITCt表示標(biāo)簽t的商品個(gè)數(shù);rel(u,t)表示用戶u對(duì)標(biāo)簽t的偏愛(ài)程度。

        依據(jù)新用戶與老用戶之間關(guān)聯(lián)關(guān)系,得到預(yù)估評(píng)分值與根據(jù)商品屬性信息的預(yù)評(píng)分后,研究通過(guò)設(shè)定權(quán)重α對(duì)2種預(yù)測(cè)評(píng)分構(gòu)成的優(yōu)化組合而運(yùn)算推出預(yù)測(cè)評(píng)分值公式如下:

        4 實(shí)驗(yàn)分析

        在研究中,對(duì)α進(jìn)行了實(shí)驗(yàn)設(shè)定,分別將α取值為0,0.2,0.4,…,1。在此基礎(chǔ)上,為了消除推薦商品數(shù)量過(guò)多對(duì)α值的影響,研究又同步設(shè)置了推薦商品數(shù)量,也就是從5、10、15、20、25共設(shè)計(jì)展開(kāi)了5組仿真實(shí)驗(yàn)。實(shí)驗(yàn)運(yùn)行結(jié)果如圖2所示。

        由圖2可以看出,隨著α值的變化,其波動(dòng)趨勢(shì)基本一致:隨著α值增加,開(kāi)始處于上升狀態(tài),達(dá)到最大值以后,緩慢下降。在本實(shí)驗(yàn)中,當(dāng)α=0.2時(shí),準(zhǔn)確率為最高,這也進(jìn)一步證明了好友關(guān)系的模式和商品屬性的混合協(xié)同過(guò)濾算法要優(yōu)勝于單獨(dú)的基于商品屬性信息的算法性能。本文算法的設(shè)計(jì)流程內(nèi)容表述可見(jiàn)如下:

        步驟一 選定要推薦的地區(qū)和商品規(guī)格,依據(jù)傳統(tǒng)的推薦算法計(jì)算目標(biāo)用戶的興趣相似的用戶和非相鄰用戶數(shù)據(jù)集。對(duì)于非鄰居的用戶的數(shù)據(jù)集取值概率性較大的作為用戶評(píng)分的參考值,結(jié)合鄰居用戶的評(píng)分?jǐn)?shù)據(jù)集進(jìn)行匯總,給出評(píng)分?jǐn)?shù)據(jù)。

        步驟二 篩選用戶信息,根據(jù)用戶自身屬性進(jìn)行劃分聚類,基于用戶年齡、收入、生活區(qū)域等因素研究劃分用戶的類別。

        本文選擇某類商品在湖南省的銷售數(shù)據(jù)作為推薦數(shù)據(jù)來(lái)源,針對(duì)客戶背景、客戶情景下和非相鄰數(shù)據(jù)集進(jìn)行推薦評(píng)估。湖南數(shù)據(jù)庫(kù)中包含了對(duì)產(chǎn)品的真實(shí)評(píng)分?jǐn)?shù)據(jù)。系統(tǒng)新用戶在使用前需要先填寫個(gè)人信息,并且對(duì)已購(gòu)買產(chǎn)品做出評(píng)價(jià),總分?jǐn)?shù)為10分,評(píng)分越高,意指對(duì)該商品就越滿意。此外,還需要填寫個(gè)人的年齡、性別、職業(yè)等信息。在這個(gè)數(shù)據(jù)庫(kù)中包含了大量的用戶數(shù)據(jù),本次研究集中選擇長(zhǎng)沙地區(qū)用戶的數(shù)據(jù)實(shí)現(xiàn)地域性的個(gè)性分析。數(shù)據(jù)庫(kù)中存在很多表結(jié)構(gòu),基礎(chǔ)性的就包含了用戶評(píng)價(jià)表、用戶個(gè)人信息表、產(chǎn)品規(guī)格表等在內(nèi)。

        表中的商品分類有很多,比如依據(jù)純度、包裝、香型、年份、產(chǎn)地等特點(diǎn)生成得到的商品分類。整個(gè)實(shí)驗(yàn)數(shù)據(jù)集可分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集占總數(shù)據(jù)集的80%,而測(cè)試集則占據(jù)了20%。整個(gè)數(shù)據(jù)集提取了來(lái)自湖南地區(qū)的5 000條數(shù)據(jù),涵蓋了400位用戶對(duì)100個(gè)不同規(guī)格商品的評(píng)價(jià)。這里,將用戶的編號(hào)設(shè)置為1~400,商品編號(hào)設(shè)為1~100。研究中,存在一個(gè)用戶Uk未對(duì)數(shù)據(jù)庫(kù)中的商品進(jìn)行評(píng)價(jià),因而需要預(yù)測(cè)用戶Uk對(duì)商品i的評(píng)分。現(xiàn)取n=28,基于傳統(tǒng)的預(yù)測(cè)方式計(jì)算出商品n的最近鄰近值,采用皮爾森相關(guān)系數(shù)算法計(jì)算得出商品n的10個(gè)最近鄰居。同商品n最近似的其它商品編號(hào)可見(jiàn)表1。

        由表1可以看出,與商品n相似的產(chǎn)品有10個(gè)。為了獲得用戶對(duì)商品的預(yù)測(cè)評(píng)分,在實(shí)驗(yàn)中選取上述產(chǎn)品的均值。也就是說(shuō),基于好友關(guān)系的用戶對(duì)商品的評(píng)分預(yù)測(cè)值可設(shè)定為其鄰居用戶針對(duì)多個(gè)相似商品的均值。這種方式在很大程度上解決了矩陣存在評(píng)分?jǐn)?shù)據(jù)稀疏的問(wèn)題。

        5 結(jié)束語(yǔ)

        協(xié)同過(guò)濾推薦技術(shù)和基于商品屬性的推薦技術(shù)是在個(gè)性化推薦研究中頗為流行的項(xiàng)目領(lǐng)域重點(diǎn)課題。只是分析可知,前者存在數(shù)據(jù)稀少和新對(duì)象問(wèn)題,后者也存在無(wú)法挖掘用戶潛在興趣等問(wèn)題。本文針對(duì)這一數(shù)據(jù)稀疏性問(wèn)題,采用了基于區(qū)域用戶的相鄰用戶進(jìn)行數(shù)據(jù)評(píng)分的矩陣填充。對(duì)于無(wú)法挖掘用戶潛在興趣的問(wèn)題,采用商品之間的關(guān)聯(lián)規(guī)則應(yīng)用和解釋來(lái)向用戶推薦產(chǎn)品。通過(guò)充分利用地域性、用戶好友信息、商品特性等在相當(dāng)程度上解決了推薦技術(shù)中的現(xiàn)實(shí)問(wèn)題,對(duì)于企業(yè)中個(gè)性化銷售創(chuàng)造了有利條件,從而增加了整個(gè)企業(yè)的銷售量。

        參考文獻(xiàn)

        [1] 冷亞軍,陸青,梁昌勇. 協(xié)同過(guò)濾推薦技術(shù)綜述[J]. 模式識(shí)別與人工智能 2014 27(8):720-734.

        [2] 劉青文. 基于協(xié)同過(guò)濾的推薦算法研究[D]. 合肥:中國(guó)科學(xué)技術(shù)大學(xué),2013.

        [3] STROBBE M VAN LAERE O DHOEDT B et al. Hybrid reasoning technique for improving contextaware applications[J]. Knowledge and Information Systems 2012,31(3):581-616.

        [4] 張忠平,郭獻(xiàn)麗. 一種優(yōu)化的基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過(guò)濾推薦算法[J]. 計(jì)算機(jī)應(yīng)用研究 2008 25(9):2658-2660,2683.

        [5] 秦凱,吳家麗,宋益多,等. 基于社會(huì)信任的協(xié)同過(guò)濾算法研究綜述[J]. 智能計(jì)算機(jī)與應(yīng)用 2015 5(4) 55-59.

        [6] HUANG Z CHUNG W CHEN H. A graph model for ecommerce recommender systems[J]. Journal of the American Society for Information Science and Technology 2004 55(3):259-274.

        [7] 張光衛(wèi),李德毅,李鵬,等. 基于云模型的協(xié)同過(guò)濾推薦算法[J]. 軟件學(xué)報(bào) 2007 18(10):2403-2411.

        [8] 王兆國(guó),謝峰,關(guān)毅. 一種基于線性回歸的新型推薦方法[J]. 智能計(jì)算機(jī)與應(yīng)用,2017 7(4):1-5.

        [9] 王明佳,韓景倜,韓松喬. 基于模糊聚類的協(xié)同過(guò)濾算法[J]. 計(jì)算機(jī)工程 2012 38(24):50-52.

        [10]許鵬遠(yuǎn). 多因素綜合框架的協(xié)同過(guò)濾推薦算法[D]. 大連:大連理工大學(xué) 2017.

        性生交大全免费看| 日本免费久久高清视频| 粉嫩的18在线观看极品精品| 国产亚洲成人精品久久久| 麻豆av一区二区三区| 黄瓜视频在线观看| 国产高清无码91| A阿V天堂免费无码专区| 午夜视频在线观看国产| 美女扒开腿露内裤免费看| 波多野42部无码喷潮在线| 亚洲一线二线三线写真| 久久亚洲伊人| 美女被躁到高潮嗷嗷免费观看| 老熟妇乱子交视频一区| 伊伊人成亚洲综合人网香| 国产在线不卡免费播放| 福利一区二区三区视频在线 | 日韩人妻无码一区二区三区久久| 又黄又爽又高潮免费毛片| 美女熟妇67194免费入口| 国产一区二区三区青青草 | 亚洲乱码中文字幕三四区| 少妇一级淫片中文字幕| 精品无码日韩一区二区三区不卡| 久久91综合国产91久久精品| 91综合久久婷婷久久| 99久久婷婷国产精品网| 肉色丝袜足j视频国产| 天天躁日日躁狠狠躁| 欧美巨大精品欧美一区二区| 91狼友在线观看免费完整版| 日本女优中文字幕在线播放 | 福利体验试看120秒| 日韩中文字幕久久久经典网| 男女做那个视频网站国产| 免费人成视频x8x8入口| 91老司机精品视频| 白浆高潮国产免费一区二区三区 | 国产丝袜精品不卡| 美女被内射很爽的视频网站|