亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融入用戶風(fēng)險(xiǎn)偏好的三支協(xié)同過濾推薦模型

        2023-10-29 00:45:34黃樹添胡詩琳卜祥智李華雄劉久兵
        關(guān)鍵詞:成本用戶

        黃樹添 ,胡詩琳 ,卜祥智 ,李華雄 ,劉久兵*

        (1.汕頭大學(xué)商學(xué)院,汕頭,515063;2.南京大學(xué)工程管理學(xué)院,南京,210023)

        互聯(lián)網(wǎng)時(shí)代數(shù)據(jù)爆炸,信息過載,龐大的信息體量在給用戶帶來巨大內(nèi)容沖擊的同時(shí)也消弭了用戶的注意力與判斷力,因此,過濾無用信息并篩選出用戶感興趣的內(nèi)容成為一個(gè)重要的研究課題.推薦系統(tǒng)因其有效的過濾機(jī)制為該類問題提供了新的解決范式,它通過挖掘用戶的行為與偏好來捕捉用戶感興趣但未曾留意的商品信息.在推薦系統(tǒng)研究領(lǐng)域,協(xié)同過濾是應(yīng)用最廣泛的算法之一[1-2],它利用用戶對項(xiàng)目的歷史評分?jǐn)?shù)據(jù)來預(yù)測用戶對未評分項(xiàng)目的喜好程度,并根據(jù)預(yù)測評分對用戶進(jìn)行推薦.

        傳統(tǒng)的推薦系統(tǒng)通常選擇推薦或不推薦,但若信息不充分或獲取信息代價(jià)較高,直接推薦或不推薦可能會(huì)帶來較大的推薦成本.因此,Zhang et al[3-4]首次將三支決策引入推薦系統(tǒng),在傳統(tǒng)的推薦或不推薦的基礎(chǔ)上,引入第三種策略——延遲推薦,提出三支推薦的概念.

        作為三支推薦的理論基礎(chǔ),三支決策(Three-Way Decision)是一種符合人類認(rèn)知習(xí)慣的決策理論,自提出以來便獲得學(xué)者的廣泛關(guān)注[5-11],已在多個(gè)領(lǐng)域得到應(yīng)用,如醫(yī)療診斷[12]、投資管理[13]、人臉識別[14]和機(jī)器學(xué)習(xí)[15]等.在推薦系統(tǒng)領(lǐng)域,葉曉慶等[16]在三支推薦的基礎(chǔ)上,利用粒計(jì)算來彌補(bǔ)傳統(tǒng)協(xié)同過濾算法評分信息單一的缺陷.Ma et al[17]提出一種結(jié)合全局和局部信息的三支推薦方法,在預(yù)測評分時(shí)考慮了全局和局部的信息.Liu and Ye[18]將三支決策與矩陣分解相結(jié)合,提出多粒度信息下的動(dòng)態(tài)三支推薦算法,根據(jù)不同粒度來動(dòng)態(tài)地調(diào)整推薦列表.秦琴和張恒汝[19]提出一種基于信任傳遞機(jī)制的三支推薦模型,將信任約束引入矩陣分解,可以更好地預(yù)測評分.Ye and Liu[20]提出一種基于協(xié)同主題回歸的可解釋性序貫三支推薦策略,實(shí)現(xiàn)可解釋的多層次推薦.Zhang et al[21]提出三支樸素貝葉斯協(xié)同過濾推薦模型,結(jié)合樸素貝葉斯與協(xié)同過濾算法來處理用戶評分信息的稀疏性.Ye and Liu[22]提出一種基于成本敏感、時(shí)空特征和多粒度決策的三支推薦方法.Ye et al[23]基于協(xié)同深度學(xué)習(xí),提出一種多粒度序貫三支推薦方法.

        通常,在三支推薦過程中,需要考慮推薦規(guī)則的劃分閾值與用戶對項(xiàng)目的偏好概率,二者均會(huì)對推薦結(jié)果產(chǎn)生影響,而現(xiàn)有文獻(xiàn)較少對后者進(jìn)行深入研究.在計(jì)算偏好概率時(shí),一般的做法是在本質(zhì)上將用戶的風(fēng)險(xiǎn)態(tài)度考慮為風(fēng)險(xiǎn)中立型,然而,不同用戶的風(fēng)險(xiǎn)態(tài)度可能是多樣的[24],將所有用戶的風(fēng)險(xiǎn)態(tài)度都劃分為同一種會(huì)導(dǎo)致偏好概率測度失真,降低推薦質(zhì)量.

        因此,本文在已有研究的基礎(chǔ)上,提出一種融入用戶風(fēng)險(xiǎn)偏好的三支協(xié)同過濾推薦模型.首先,基于用戶已有的評分信息,利用協(xié)同過濾算法預(yù)測用戶對未評分項(xiàng)目的評分.其次,考慮用戶的不同風(fēng)險(xiǎn)態(tài)度,結(jié)合效用理論,定義用戶對項(xiàng)目的偏好概率測度,構(gòu)建用戶-項(xiàng)目偏好概率模型,并通過理論證明了該模型是現(xiàn)有模型的推廣.隨后,利用偏好概率模型與決策粗糙集,導(dǎo)出三支推薦模型的閾值表達(dá),進(jìn)而設(shè)計(jì)基于粒子群優(yōu)化算法的用戶偏好概率模型參數(shù)確定方法.最后,利用MovieLens 數(shù)據(jù)集中用戶對電影的評分?jǐn)?shù)據(jù)對模型進(jìn)行驗(yàn)證.本文從用戶的風(fēng)險(xiǎn)態(tài)度的視角出發(fā),提供了一個(gè)新的具有可拓展性的測度用戶偏好概率的方法,使三支推薦的決策規(guī)則劃分更加準(zhǔn)確,進(jìn)一步提高了推薦質(zhì)量.

        1 預(yù)備知識

        1.1 經(jīng)典協(xié)同過濾算法協(xié)同過濾算法是目前應(yīng)用最廣泛的推薦算法之一,主要包括基于用戶的協(xié)同過濾[25]和基于項(xiàng)目的協(xié)同過濾[26],后者的性能和推薦質(zhì)量在很多情形下優(yōu)于前者[26].因此,本文主要討論基于項(xiàng)目的協(xié)同過濾.對于目標(biāo)用戶u和候選項(xiàng)目i,首先計(jì)算用戶u已評分的項(xiàng)目與項(xiàng)目i之間的相似度,選出與項(xiàng)目i最相似的k個(gè)近鄰項(xiàng)目,利用近鄰項(xiàng)目的信息預(yù)測用戶u對項(xiàng)目i的可能評分.主要步驟如下.

        步驟1.計(jì)算項(xiàng)目之間的相似性.

        表1 為用戶-項(xiàng)目評分矩陣,其中U={u1,u2,…,um}表示用戶集合,I={i1,i2,…,in}表示項(xiàng)目集合,R=U×I表示用戶u對項(xiàng)目i的評分Rui構(gòu)成的集合.根據(jù)該評分矩陣可以計(jì)算項(xiàng)目之間的Pearson 相關(guān)系數(shù),其取值范圍為[-1,1].該系數(shù)越接近1 說明兩個(gè)項(xiàng)目越相似,越接近0 說明兩個(gè)項(xiàng)目之間的差異性越大.具體計(jì)算如下:

        表1 用戶-項(xiàng)目評分矩陣Table 1 User-Item rating matrix

        其中,sim(i,j)表示項(xiàng)目i與j之間的Pearson 系數(shù),用來測度i和j之間的相似程度;K表示同時(shí)評價(jià)項(xiàng)目i和j的用戶集合;Rui表示用戶u對項(xiàng)目i的評分;表示項(xiàng)目i已有評分的平均數(shù).

        步驟2.預(yù)測用戶對目標(biāo)項(xiàng)目的評分.

        選擇用戶u已評分項(xiàng)目中與目標(biāo)項(xiàng)目i最相似的k個(gè)項(xiàng)目,根據(jù)這k個(gè)近鄰項(xiàng)目與項(xiàng)目i之間的Pearson 系數(shù)以及相關(guān)評分?jǐn)?shù)據(jù),預(yù)測用戶u對未知評分項(xiàng)目i的評分.具體計(jì)算如下:

        其中,sim(i,j)表示目標(biāo)項(xiàng)目i與近鄰項(xiàng)目j之間的相似度,Ruj表示用戶u對項(xiàng)目j的真實(shí)評分,Rˉi和Rˉj分別表示項(xiàng)目i和j已知評分的平均數(shù).

        1.2 三支決策傳統(tǒng)協(xié)同過濾推薦是一種二支推薦,只有推薦與不推薦兩種狀態(tài).然而,當(dāng)信息不充分或獲取信息代價(jià)較高時(shí),很難即時(shí)作出推薦或不推薦的判定,若此時(shí)強(qiáng)行將項(xiàng)目推薦給用戶,可能會(huì)產(chǎn)生較大的誤推薦成本.基于此,本文參考三支決策的延遲策略,將傳統(tǒng)的二支決策推薦拓展為三支決策推薦,減少在信息不充分的時(shí)候因錯(cuò)誤決策造成的嚴(yán)重?fù)p失.

        三支決策來源于決策粗糙集理論[27-28],它為決策粗糙集正域、負(fù)域、邊界域給出了一種合理的語義解釋.不同的域?qū)?yīng)不同的決策規(guī)則,正域?qū)?yīng)接受規(guī)則,負(fù)域?qū)?yīng)拒絕規(guī)則,邊界域?qū)?yīng)不承諾或延遲決策規(guī)則.若在信息不充分的情況下仍然只考慮接受或拒絕兩種選擇,類似接受或拒絕一個(gè)假設(shè),就可能會(huì)作出棄真或擇假的錯(cuò)誤決策.換言之,此時(shí)貿(mào)然作出接受或拒絕的判定,將產(chǎn)生錯(cuò)誤接受或錯(cuò)誤拒絕的成本,這兩種決策成本可能高于不作任何判定的成本.在這種情形下,邊界域提供的延遲決策選項(xiàng)能更好地體現(xiàn)定量決策的容錯(cuò)性.

        根據(jù)三支決策理論[10,29],Ω={T,?T}表示對象屬于T和不屬于T的狀態(tài)集合,Λ={aP,aB,aN}表示對于以上兩種狀態(tài),分別采取接受決策、延遲決策或拒絕決策三種行動(dòng).在不同狀態(tài)下采取三種行動(dòng)的損失各不相同,表2 給出了其決策代價(jià)損失.當(dāng)對象處于狀態(tài)T時(shí),采取行動(dòng)aP,aB和aN分別產(chǎn)生代價(jià)損失λPP,λBP和λNP;當(dāng)對象處于狀態(tài)?T時(shí),采取行動(dòng)aP,aB和aN分別產(chǎn)生代價(jià)損失λPN,λBN和λNN[10].

        表2 代價(jià)損失矩陣Table 2 Cost loss matrix

        對于對象[x],采取aP,aB,aN三種行動(dòng)產(chǎn)生的期望損失分別為:

        從(P1)-(N1)可知,比較條件概率與閾值α,β的大小可以確定每個(gè)對象[x]的決策行動(dòng).

        2 融入用戶風(fēng)險(xiǎn)偏好的三支協(xié)同過濾推薦

        三支協(xié)同過濾推薦在傳統(tǒng)協(xié)同過濾僅有推薦和不推薦兩種策略的基礎(chǔ)上,增加了第三種策略——延遲推薦,這有利于降低推薦成本.在三支協(xié)同過濾推薦中需要確定用戶關(guān)于項(xiàng)目的偏好概率,該概率可以利用用戶對項(xiàng)目的預(yù)測評分來進(jìn)行測度[16-23],但不同用戶的評分標(biāo)準(zhǔn)各不相同.例如,有的用戶傾向給項(xiàng)目打更高的分?jǐn)?shù),整體評分偏高;有的則傾向較低的分?jǐn)?shù),整體評分偏低.如果僅僅考慮預(yù)測評分,則用戶評分標(biāo)準(zhǔn)的不同帶來的評分偏差可能會(huì)降低偏好概率的準(zhǔn)確度.文獻(xiàn)[16,18,21]采用最小最大值歸一化方法來測度偏好概率,消除評分偏差,但值得注意的是,該方法假定所有用戶的風(fēng)險(xiǎn)偏好均為風(fēng)險(xiǎn)中立型.事實(shí)上,用戶對風(fēng)險(xiǎn)的態(tài)度可分為風(fēng)險(xiǎn)中立型、厭惡型和偏好型[32],不同風(fēng)險(xiǎn)偏好的用戶評分的偏差不盡相同,僅把用戶當(dāng)作中立型不足以消除評分偏差.因此,在構(gòu)建三支協(xié)同過濾推薦模型時(shí),需要考慮不同用戶的風(fēng)險(xiǎn)偏好.為此,本文提出一種新模型,給定用戶u與候選推薦項(xiàng)目i,構(gòu)建用戶-項(xiàng)目對(u,i),利用協(xié)同過濾算法預(yù)測用戶對項(xiàng)目的評分.根據(jù)預(yù)測評分,基于用戶-項(xiàng)目偏好概率模型得到用戶u對項(xiàng)目i的偏好概率Probui;根據(jù)決策成本矩陣得出推薦規(guī)則的閾值對α和β;最后,利用用戶偏好概率與閾值生成三支推薦規(guī)則,如表3 所示.首先,構(gòu)建用戶-項(xiàng)目偏好概率模型,繼而根據(jù)決策粗糙集與偏好概率導(dǎo)出三支推薦閾值對α和β的數(shù)學(xué)表達(dá),最后提出確定用戶偏好概率模型具體參數(shù)的方法.

        表3 三支推薦規(guī)則Table 3 Rules of three-way recommendation

        2.1 用戶-項(xiàng)目偏好概率模型構(gòu)建在微觀經(jīng)濟(jì)學(xué)中,效用是指消費(fèi)者從消費(fèi)某種物品中得到的滿足程度;在決策領(lǐng)域,效用是決策者對于決策后果或決策損益值的一種感受、反應(yīng)或傾向,是決策者的價(jià)值觀和偏好在決策活動(dòng)中的綜合反映[28].用戶在決定是否購買某種商品或服務(wù)時(shí),既是消費(fèi)者,也是決策者.作為決策者,用戶的風(fēng)險(xiǎn)偏好會(huì)影響其對效用的估計(jì),進(jìn)而影響消費(fèi)行為.風(fēng)險(xiǎn)中立型、厭惡型或偏好型[24,33]的用戶對應(yīng)不同的效用函數(shù),同一類型的用戶由于具體偏好的差異,效用函數(shù)也不盡相同.

        根據(jù)上述分析,用戶對項(xiàng)目評分的高低反映項(xiàng)目對用戶的效用大小及用戶對項(xiàng)目的喜好程度.一般地,評分越高說明項(xiàng)目對于用戶的效用越高,用戶喜歡該項(xiàng)目的概率越大,但是,用戶對項(xiàng)目的喜好程度不是影響用戶對項(xiàng)目評分的唯一因素,用戶自身的風(fēng)險(xiǎn)偏好同樣會(huì)影響其對項(xiàng)目的評分.例如,同一效用水平下,和風(fēng)險(xiǎn)偏好型用戶相比,風(fēng)險(xiǎn)厭惡型用戶的評分會(huì)偏低,而風(fēng)險(xiǎn)中立型用戶的評分介于二者之間,如圖1 所示.因此,考慮用戶的不同風(fēng)險(xiǎn)偏好,基于表1,本文采用L-A 擬合法[24,34]來刻畫不同風(fēng)險(xiǎn)偏好下用戶關(guān)于項(xiàng)目的效用函數(shù).具體地,假設(shè):

        圖1 L-A 擬合法下的用戶-項(xiàng)目效用函數(shù)Fig.1 L-A simulation method for User-Item utility function

        其中,Rui表示用戶u對項(xiàng)目i的評分,q為尺度參數(shù),d為位置參數(shù),ρ為用戶u的風(fēng)險(xiǎn)偏好系數(shù),Utilityu(Rui)∈[0,1].

        預(yù)測評分是判斷用戶對候選推薦項(xiàng)目偏好程度的依據(jù),通常預(yù)測評分越高,說明該項(xiàng)目對用戶的效用越大,用戶偏好該項(xiàng)目的概率越高.受文獻(xiàn)[35]的啟發(fā),下面給出用戶-項(xiàng)目效用偏好概率模型的定義.

        定義設(shè)在表1 所示的評分系統(tǒng)中,用戶對項(xiàng)目的評分范圍為為用戶u關(guān)于項(xiàng)目i的預(yù)測評分,則用戶u關(guān)于項(xiàng)目i的偏好概率Probui定義為:

        其中,和為用戶u的效用閾值,q為尺度參數(shù),d為位置參數(shù),ρ為用戶u的風(fēng)險(xiǎn)偏好系數(shù).

        圖2 為式(4)對應(yīng)的圖像.當(dāng)0 <ρ<1 時(shí),用戶u為風(fēng)險(xiǎn)厭惡型,對于被推薦到不喜歡的項(xiàng)目的容忍度較低,偏好概率相同時(shí)其評分較低;當(dāng)ρ>1 時(shí),用戶u為風(fēng)險(xiǎn)偏好型,對于被推薦到不喜歡的項(xiàng)目的容忍度較高,相同的偏好概率下其評分較高;當(dāng)ρ=1 時(shí),用戶u為風(fēng)險(xiǎn)中立型,在偏好概率相同時(shí),其評分介于上述兩者之間.

        圖2 用戶-項(xiàng)目效用偏好概率模型Fig.1 User-Item utility preference probability model

        下面用具體的例子來說明前面的定義.

        例在某電影網(wǎng)站中,用戶對電影的評分系統(tǒng)為五分制,最低分為1,最高分為5,評分步長為0.5.假設(shè)用戶u1的三個(gè)效用點(diǎn)分別為(1.5,0),(2,0.5)和(5,1),用戶u2的三個(gè)效用點(diǎn)分別為(1,0),(3,0.5)和(5,1),用戶u3的三個(gè)效用點(diǎn)分別為(1,0),(3.5,0.5)和(4.5,1).基于式(4)和式(5),可以分別得到用戶u1,u2和u3的偏好概率Probu1i,Probu2i和Probu3i.具體如下:

        用戶u1的風(fēng)險(xiǎn)系數(shù)ρ1=0.356 <1,風(fēng)險(xiǎn)厭惡型;用戶u2的風(fēng)險(xiǎn)系數(shù)ρ2=1,風(fēng)險(xiǎn)中立型;用戶u3的風(fēng)險(xiǎn)系數(shù)ρ3=2.06 >1,風(fēng)險(xiǎn)偏好型.

        根據(jù)定義,可得如下命題.

        將ρ,d和q代入式(4),即可得式(6).因此,命題成立.

        從命題可知,式(6)是最小最大值歸一化模型,換句話說,該模型是本文提出的用戶-項(xiàng)目偏好概率模型的一種特例.因此,本文提出的模型是文獻(xiàn)[16,18,21]中最小最大值歸一化模型的拓展,更具有一般性.

        2.2 融入用戶風(fēng)險(xiǎn)偏好的三支推薦閾值推導(dǎo)如表3 所示,三支推薦中給定用戶u和項(xiàng)目i,最優(yōu)推薦結(jié)果取決于用戶對項(xiàng)目的偏好概率以及閾值對α和β.利用構(gòu)建的用戶-項(xiàng)目偏好概率模型,可計(jì)算出用戶關(guān)于項(xiàng)目的偏好概率.下面根據(jù)決策粗糙集推導(dǎo)出閾值對,獲得三支推薦規(guī)則.

        表4 給出喜歡和不喜歡兩種狀態(tài)下采取三種推薦策略的成本,其中λRP,λBP和λNP分別表示當(dāng)用戶喜歡(P)某項(xiàng)目時(shí),將該項(xiàng)目推薦(R)、延遲推薦(B)及不推薦(N)給用戶時(shí)產(chǎn)生的成本;λRN,λBN和λNN分別表示用戶不喜歡(N)時(shí),將該項(xiàng)目推薦(R)、延遲推薦(B)及不推薦(N)給用戶時(shí)產(chǎn)生的成本.其中,λRP和λNN表示正確推薦的成本;λBP和λBN表示延遲推薦產(chǎn)生的學(xué)習(xí)成本,即推薦系統(tǒng)暫時(shí)無法確定用戶偏好,需要進(jìn)一步學(xué)習(xí)相關(guān)信息時(shí)產(chǎn)生的成本;λNP和λRN表示錯(cuò)誤推薦的成本,其中,λNP表示系統(tǒng)拒絕給用戶推薦其喜歡的項(xiàng)目時(shí)產(chǎn)生的成本,λRN表示系統(tǒng)將用戶不喜歡的項(xiàng)目推薦給該用戶時(shí)產(chǎn)生的成本.通常,延遲推薦的成本遠(yuǎn)小于錯(cuò)誤推薦的成本,正確推薦的成本小于延遲推薦的成本,即表4 的成本滿足:

        表4 三支推薦成本的矩陣Table 4 The matrix of three-way recommendation cost

        基于用戶對項(xiàng)目的偏好概率Probui,決策規(guī)則(詳見表3)和成本矩陣(詳見表4),三種推薦策略的成本為:

        其中,CR,CB和CN分別表示采取推薦、延遲推薦和不推薦策略時(shí)產(chǎn)生的決策成本.

        根據(jù)貝葉斯決策理論[10],可得如下規(guī)則:

        基于式(7),三支推薦規(guī)則(R)-(N)可進(jìn)一步簡化為規(guī)則(R1)-(N1):

        其中,

        則三支推薦規(guī)則(R1)-(N1)可簡化為規(guī)則:

        特別地,當(dāng)

        時(shí),三支協(xié)同過濾推薦算法退化為二支協(xié)同過濾推薦算法,此時(shí)三支推薦規(guī)則(R1)-(N1)簡化為:

        下面,以2.1 和2.2 的工作為基礎(chǔ),提出確定用戶-項(xiàng)目偏好概率模型參數(shù)的方法.

        2.3 基于粒子群優(yōu)化的偏好概率模型參數(shù)確定基于表1,可利用式(4)構(gòu)建用戶的偏好概率模型,但特定評分下用戶的偏好概率是未知的,難以使用擬合方法確定用戶的偏好概率模型參數(shù).對于用戶-項(xiàng)目偏好概率模型,其測度越精確,三支推薦的準(zhǔn)確性會(huì)越高,推薦成本也越低;反之,當(dāng)推薦準(zhǔn)確性越高、推薦成本越低時(shí),偏好概率模型的測度越精確.因此,可以將這兩個(gè)指標(biāo)作為目標(biāo),從優(yōu)化的角度出發(fā),使用粒子群優(yōu)化算法來確定用戶偏好概率模型的參數(shù),以最大化推薦準(zhǔn)確性和最小化推薦成本,使用戶-項(xiàng)目偏好概率模型的測度盡可能準(zhǔn)確.

        由定義可知,用戶的偏好概率模型由三個(gè)參數(shù)q,d和ρ決定.由式(5),令,m=0.5,則三個(gè)參數(shù)的表達(dá)式為:

        基于表4 和表5,用戶u的推薦成本(TCu)可表達(dá)為:

        表5 三支推薦數(shù)量矩陣Table 5 The matrix of three-way recommendation number

        在三支推薦中,推薦準(zhǔn)確性越高,推薦成本通常越低.然而,在計(jì)算推薦準(zhǔn)確性時(shí)(見式(9))沒有考慮劃分到延遲推薦域的項(xiàng)目,可能導(dǎo)致大量項(xiàng)目被劃分到延遲推薦域,使延遲推薦的成本顯著增加,產(chǎn)生準(zhǔn)確性很高但推薦成本很大的問題,這是不符合優(yōu)化目標(biāo)的.因此,在進(jìn)行粒子群優(yōu)化時(shí),需要綜合考慮準(zhǔn)確性和推薦成本兩個(gè)目標(biāo),即準(zhǔn)確性越大越好,推薦成本越小越好.本文使用線性加權(quán)法將二者合成一個(gè)單一的目標(biāo)函數(shù)Goalu,優(yōu)化目標(biāo)為Goalu最小,具體如下:

        粒子群優(yōu)化算法[37](Particle Swarm Optimization,PSO)是一種基于群體智能的優(yōu)化算法,它模擬了鳥群、魚群等生物集體行為的過程,通過迭代搜索找到最優(yōu)解,具有較強(qiáng)的全局搜索能力和較好的收斂性.在粒子群算法中,假設(shè)有N個(gè)粒子和D維空間,每個(gè)粒子i(i=1,2,…,N)擁有一個(gè)位置向量Xi=(xi1,xi2,…,xiD)和速度向量Vi=(vi1,vi2,…,viD).在每次迭代中,粒子i的個(gè)體最優(yōu)位置為Pbi=(Pbi1,Pbi2,…,PbiD),整個(gè)粒子群的全局最優(yōu)位置為Gb=(Gb1,Gb2,…,GbD).利用個(gè)體最優(yōu)位置和全局最優(yōu)位置,可以分別采用式(12)和式(13)更新粒子i的速度和位置:

        其中,t表示第t次迭代;c1和c2表示學(xué)習(xí)因子,通常設(shè)置為2;r1和r2表示兩個(gè)在[0,1]中隨機(jī)產(chǎn)生的數(shù);η(t)為線性遞減慣性權(quán)重,滿足[38]:

        其中,Tmax表示最大迭代次數(shù).

        基于上述算法得到用戶最優(yōu)評分組合,利用式(8)可得到參數(shù)q,d和ρ,進(jìn)而得到用戶的偏好概率模型.

        3 實(shí)驗(yàn)分析

        3.1 數(shù)據(jù)集使用MovieLens-100k 電影評分?jǐn)?shù)據(jù)集(https:∥grouplens.org/datasets/movielens/latest)[39]進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集的評分在0.5~5,評分步長為0.5.將60%的數(shù)據(jù)隨機(jī)劃分為預(yù)測評分訓(xùn)練集,將20%的數(shù)據(jù)劃分為用戶偏好概率模型訓(xùn)練集,剩下20%的數(shù)據(jù)為測試集.同時(shí),參考文獻(xiàn)[40],清洗評分量過少且不具有意義的數(shù)據(jù),所得數(shù)據(jù)集的基本信息如表6 所示.

        表6 MovieLens-100k 數(shù)據(jù)集的描述Table 6 The description of MovieLens-100k dataset

        3.2 實(shí)驗(yàn)設(shè)置對于提出的融入用戶風(fēng)險(xiǎn)偏好的三支協(xié)同過濾推薦(P_CF),首先,基于協(xié)同過濾算法,利用預(yù)測評分訓(xùn)練集預(yù)測剩余40%的用戶-項(xiàng)目集的評分.然后,基于前文算法與式(8),利用用戶偏好概率模型訓(xùn)練集得出每個(gè)用戶的偏好概率模型,其中,經(jīng)調(diào)參后目標(biāo)函數(shù)式(11)中的權(quán)重取ω1=0.1,ω2=0.9,三支推薦成本矩陣取λRP=λNN=0,λBP=λBN=0.25 和λRN=λNP=0.8.最后,對測試集進(jìn)行三支推薦,將P_CF 的推薦結(jié)果與基于最大最小值歸一化模型[16,18,21]的三支協(xié)同過濾推薦算法,即僅將用戶視為風(fēng)險(xiǎn)中立型的算法(M_CF)的結(jié)果進(jìn)行對比.

        為了衡量推薦結(jié)果,需要判斷用戶對項(xiàng)目的真實(shí)偏好.對于五分制評分系統(tǒng),遵循推薦系統(tǒng)研究的通常做法[40-41],將用戶的喜好閾值設(shè)置為3.5 分.

        選取推薦成本(TC)、準(zhǔn)確性(Accuracy)、覆蓋率(Generality)、精準(zhǔn)度(Precision)、召回率(Recall)和得分(F)作為衡量指標(biāo)[18,41-42].精準(zhǔn)度、召回率和得分是傳統(tǒng)二支推薦的常用指標(biāo),也適用于三支推薦;準(zhǔn)確性和覆蓋率更適合用來衡量三支推薦的質(zhì)量,準(zhǔn)確性指三支推薦將項(xiàng)目劃分到推薦和不推薦域時(shí)正確劃分的比例,覆蓋率指劃分到推薦和不推薦域的項(xiàng)目占所有待推薦項(xiàng)目的比例,覆蓋率越高表示越多用戶得到系統(tǒng)的推薦.通常,準(zhǔn)確性和覆蓋率之間存在權(quán)衡,即為了給更多的用戶推薦項(xiàng)目,需要犧牲一部分準(zhǔn)確性;反之,為了更準(zhǔn)確地向用戶推薦項(xiàng)目,需要犧牲一部分覆蓋率[36].上述指標(biāo)的定義如下:

        其中,

        結(jié)合表5,nRP,nBP,nNP,nRN,nBN和nNN的表達(dá)式分別為:

        其中,U表示所有用戶的集合.

        本文主要考慮錯(cuò)誤推薦或錯(cuò)誤不推薦產(chǎn)生的誤分類成本和延遲推薦產(chǎn)生的學(xué)習(xí)成本.假設(shè)系統(tǒng)正確推薦時(shí)不產(chǎn)生推薦成本,即λRP=λNN=0,則式(15)可化簡為:

        3.3 實(shí)驗(yàn)結(jié)果分析表7 列出了λNP=0.8 時(shí),P_CF 與M_CF 在不同的λRN,λBP和λBN成本條件下的推薦成本;表8 列出了對應(yīng)成本條件下兩個(gè)算法的推薦覆蓋率;表9 和表10 分別列出了λRN=0.8 時(shí),兩個(gè)算法在不同的λNP,λBP和λBN成本條件下的推薦成本和覆蓋率.表中黑體字表示結(jié)果更優(yōu).綜合對比四個(gè)表格,分析如下:

        表8 固定λNP 時(shí)推薦覆蓋率的比較Table 8 Recommendation generality with fixed λNP

        表9 固定λRN 時(shí)推薦成本的比較Table 9 Recommendation cost with fixed λRN

        表10 固定λRN 時(shí)推薦覆蓋率的比較Table 10 Recommendation generality with fixed λRN

        (1)由表7 和表9 可知,學(xué)習(xí)成本或誤分類成本越低,兩個(gè)算法的推薦成本均越低;由表8 和表10 可知,學(xué)習(xí)成本越低或誤分類成本越高,兩個(gè)算法的覆蓋率水平越低,即能獲得推薦的用戶越少.

        (2)當(dāng)學(xué)習(xí)成本較高或誤分類成本較低時(shí),P_CF 的推薦成本低于M_CF,即使P_CF 的覆蓋率更高時(shí)也是如此.

        (3)當(dāng)學(xué)習(xí)成本較低且誤分類成本較高時(shí),M_CF 的推薦成本總體占優(yōu),但優(yōu)勢不明顯.結(jié)合表7~10 可以看出,當(dāng)M_CF 的推薦成本占優(yōu)時(shí),其對應(yīng)的覆蓋率均明顯低于P_CF.以成本為λBR=λBN=0.15,λRN=1 且λNP=0.8 時(shí)為例,M_CF 的推薦成本比P_CF 低2.7%,但其覆蓋率比P_CF 低12.5%.所以,M_CF 的優(yōu)勢可能是因?yàn)樗鼘⒋罅康捻?xiàng)目劃分到延遲推薦域,延遲推薦的成本較低時(shí)其推薦成本也較低,延遲推薦成本較高時(shí),這個(gè)優(yōu)勢就不明顯,甚至消失.例如,當(dāng)成本為λBR=λBN=0.25,λRN=1.2 且λNP=0.8時(shí),P_CF 的覆蓋率比M_CF 高12.9%,而其對應(yīng)成本也低于M_CF.

        因此,本文提出的融入用戶風(fēng)險(xiǎn)偏好的算法在學(xué)習(xí)成本較高或誤分類成本較低時(shí),在保證覆蓋率的前提下能使系統(tǒng)的推薦成本更低,在學(xué)習(xí)成本較低且誤分類成本較高時(shí),能大幅提高覆蓋率,但會(huì)小幅犧牲成本.

        進(jìn)一步,選取一組有代表性的成本條件來對比兩個(gè)算法的推薦質(zhì)量.設(shè)置λNP=0.8 和λBP=λBN=0.25,圖3~8 給出了兩個(gè)算法在不同的錯(cuò)誤推薦成本(λRN)下各指標(biāo)的對比.分析如下:

        圖3 λNP=0.8 和λBP=λBN=0.5 時(shí)推薦成本的比較Fig.3 Recomendation cost with λNP=0.8 and λBP=λBN=0.5

        圖4 λNP=0.8 和λBP=λBN=0.5 時(shí)推薦準(zhǔn)確性的比較Fig.4 Recommendation accuracy with λNP=0.8 and λBP=λBN=0.5

        圖5 λNP=0.8 和λBP=λBN=0.5 時(shí)推薦覆蓋率的比較Fig.5 Recommendation generality with λNP=0.8 and λBP=λBN=0.5

        圖6 λNP=0.8 和λBP=λBN=0.5 時(shí)推薦精確度的比較Fig.6 Recommendation precision with λNP=0.8 and λBP=λBN=0.5

        圖7 λNP=0.8 和λBP=λBN=0.5 時(shí)推薦召回率的比較Fig.7 Recommendation recall with λNP=0.8 and λBP=λBN=0.5

        圖8 λNP=0.8 和λBP=λBN=0.5 時(shí)推薦得分的比較Fig.8 Recommendation F-measure with λNP=0.8 and λBP=λBN=0.5

        (1)隨著錯(cuò)誤推薦成本的增加,兩個(gè)算法的推薦成本、準(zhǔn)確性、精準(zhǔn)度和得分均變大,推薦覆蓋率和召回率變小,其中,召回率的變化幅度較小,始終保持在較高的水平.

        (2)當(dāng)λRN不大于0.8 時(shí),M_CF 的推薦覆蓋率大于P_CF,但除召回率之外,M_CF 的其他指標(biāo)均遜色于P_CF.當(dāng)M_CF 的覆蓋率占優(yōu)時(shí),一般意味著它的推薦成本、準(zhǔn)確性和精準(zhǔn)度處于更大的劣勢.例如,λRN=0.6 時(shí),M_CF 的覆蓋率比P_CF 高4.5%,但其成本、準(zhǔn)確性和精準(zhǔn)度分別比P_CF 低8.7%,6.0%和4.7%.

        (3)當(dāng)λRN不小于0.8 時(shí),M_CF 的推薦覆蓋率小于P_CF,且二者的差距隨著λRN的增大而越來越大.與M_CF 的覆蓋率占優(yōu)時(shí)不同,λRN<1時(shí),P_CF 的準(zhǔn)確性仍然高于M_CF;λRN>1 時(shí),P_CF 的覆蓋率比M_CF 高10%左右,其準(zhǔn)確性只比M_CF 低不到2%,精準(zhǔn)度低不到4%.

        因此,與僅將用戶考慮為風(fēng)險(xiǎn)中立型的算法相比,當(dāng)錯(cuò)誤推薦的成本較低時(shí),融入用戶風(fēng)險(xiǎn)偏好的算法能在犧牲小部分覆蓋率的同時(shí),較大幅度地提高推薦準(zhǔn)確性與精準(zhǔn)度;當(dāng)錯(cuò)誤推薦的成本較高時(shí),本文提出的算法能在犧牲小部分甚至不犧牲準(zhǔn)確性與精準(zhǔn)度的同時(shí),較大幅度地提高推薦覆蓋率.

        綜上,本文提出的融入用戶風(fēng)險(xiǎn)偏好的三支協(xié)同過濾推薦模型更適用于對推薦成本、推薦覆蓋率、推薦準(zhǔn)確性和推薦精準(zhǔn)度綜合考慮的場景.

        4 結(jié)論

        為了優(yōu)化三支推薦規(guī)則的準(zhǔn)確性,本文提出融入用戶風(fēng)險(xiǎn)偏好的三支協(xié)同過濾推薦模型,構(gòu)建了一個(gè)能夠預(yù)測用戶對項(xiàng)目的偏好概率的模型,并基于粒子群算法給出了確定用戶偏好概率模型的算法.實(shí)驗(yàn)結(jié)果表明,本文提出的方法在不同的初始條件下能夠保持推薦成本、推薦覆蓋率、準(zhǔn)確性與精準(zhǔn)度的相對優(yōu)勢.未來會(huì)將本文提出的用戶-項(xiàng)目偏好概率模型與更多的三支推薦算法相結(jié)合,進(jìn)一步驗(yàn)證該模型的可拓展性.

        猜你喜歡
        成本用戶
        2021年最新酒駕成本清單
        河南電力(2021年5期)2021-05-29 02:10:00
        溫子仁,你還是適合拍小成本
        電影(2018年12期)2018-12-23 02:18:48
        鄉(xiāng)愁的成本
        特別健康(2018年2期)2018-06-29 06:13:42
        “二孩補(bǔ)貼”難抵養(yǎng)娃成本
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        Camera360:拍出5億用戶
        100萬用戶
        如何獲取一億海外用戶
        亚洲国产欧美另类va在线观看| 国产成人综合在线视频| 欧美性猛交99久久久久99按摩| 伊人久久大香线蕉午夜av| 亚洲色大成网站www永久网站| 国内精品自在自线视频| av网站免费线看| 国产免费久久精品99re丫y| 亚洲无码激情视频在线观看| 97激情在线视频五月天视频| 91精品久久久中文字幕| 亚洲图片自拍偷图区| 成熟丰满熟妇高潮xxxxx视频| 中文字幕亚洲无线码在一区| 欧美综合图区亚洲综合图区| 日本精品熟妇一区二区三区| 深夜一区二区三区视频在线观看| 夫妻免费无码v看片| 老熟妇乱子伦av| 国产一区a| 国产高清女人对白av在在线| 风间由美中文字幕在线| 精品一区中文字幕在线观看| 无码人妻精品一区二区三区9厂| 国产影片中文字幕| 国产精品国产三级国产av创| 国产av一区二区内射| 亚洲综合自拍偷拍一区| 午夜精品久久久久久久无码| 天堂а√在线中文在线新版| 国产中文制服丝袜另类| 亚洲国产精品成人av| aaa日本高清在线播放免费观看| 久久久精品国产sm调教网站| 亚洲男人天堂2019| 中文字幕有码高清| 蜜桃在线视频一区二区| 日韩精品人成在线播放| 国产精品成年片在线观看| 97福利视频| 亚洲精品中文字幕一二|