許曉明,梅紅巖,于 恒,李曉會
(遼寧工業(yè)大學 電子與信息工程學院,遼寧 錦州 121001)
推薦系統(tǒng)滿足了用戶從海量數(shù)據(jù)中獲取有效信息的需求,隨著大數(shù)據(jù)時代的到來,推薦系統(tǒng)的應用領域也越來越廣,處理的數(shù)據(jù)量也逐漸呈指數(shù)級增長[1].傳統(tǒng)的個性化推薦的提出是為了滿足個體用戶的需求,實際上很多活動都是以群體進行,例如旅游、聚餐、團購等.上世紀70年代開始,逐漸有學者開始研究針對群體成員的推薦,即群組推薦.群組推薦既滿足用戶個性需求,也符合群居生活的特殊要求以滿足群組的共性需求.隨著群體的不斷豐富,群組推薦成為解決推薦問題的一種重要手段引起了許多專家學者的廣泛關注,如何對群組用戶進行推薦也成為了推薦領域的一個熱點問題.同時,群組推薦的應用領域越來越廣,例如音視頻推薦、旅游線路規(guī)劃、聚餐、Web瀏覽、購物、學習等領域[2-7].
由于群組推薦與個性化推薦針對的推薦對象存在明顯差異,由個體用戶變?yōu)槿后w用戶,需要考慮群體內所有成員對于預推薦項目的喜好程度.只有預推薦項目滿足群組內成員的偏好要求,并對群組成員之間的偏好沖突進行緩解,才能使得預推薦項目符合群組的所有成員的滿意度要求.同時,群組推薦中群組成員與項目之間的交互數(shù)據(jù)非常稀疏,很多情況下不能直接利用群組的歷史交互進行建模,因此要通過聚合群組中成員的偏好對群組偏好進行建模.故而群體偏好融合成為群組推薦的關鍵步驟[8].
偏好融合[1]是指利用一組成員的每個成員偏好進行建模,選擇并融合成為群組偏好的過程,可以在群組推薦的不同階段進行.對偏好融合策略和方法的不同選擇,可以形成不同的群組推薦系統(tǒng),得到不同的推薦效果.為了滿足群組成員的總體滿意度和推薦公平性,在具體實驗中,如何選擇最合適的融合策略和融合方法,仍是群組推薦領域研究的熱點問題之一[9].
目前國內外對于群組推薦偏好融合中的相關問題等進行了較為深入的研究.國外主要包括引入情境和會話信息的偏好融合改進[10],對成員的影響力挖掘[11],考慮偏好的動態(tài)交互性[12-14]等;國內主要從成員交互角度出發(fā)對偏好融合的策略進行改進[15],或對引入注意力機制進行創(chuàng)新[16],當前存在的諸多研究中多考慮到成員之間的特性和個性化問題,重點放在滿意度要求上,而在融合偏好過程中對時空因素考慮相對較少.本文基于當前國內外偏好融合的群組推薦方法的研究現(xiàn)狀,首先對群組推薦的基本定義及步驟進行了簡要介紹.重點介紹了偏好融合的基本策略和方法,及基于偏好融合的群組推薦方法的研究現(xiàn)狀.總結了群組推薦方法的常用評價指標,和現(xiàn)有群組推薦方法使用的相關數(shù)據(jù)集,并通過實驗重點分析比較了不同偏好融合對推薦結果的影響及偏好融合、推薦特征、推薦預測方法之間的關系.最后對基于偏好融合的群組推薦方法未來的研究方向進行歸納.
群組推薦[1]是指通過將用戶的個人推薦聚合為整個群組的推薦,或者根據(jù)用戶的個人偏好模型建模群組偏好來生成推薦列表的一種基于群體用戶的推薦方法.至今群組推薦還未形成統(tǒng)一的定義,一般多采用文獻[17,18]利用共識分數(shù)給出群組推薦的形式化定義,如式(1)所示:
F(G,i)=w1×groupprerating(G,i)+w2×(1-dis(G,i))
(1)
式(1)中,groupprerating(G,i)為群組對項目i的群組預測評分,表明該群組整體對預推薦項目整體上的喜好程度;dis(G,i)為群組成員之間對項目i評分的分歧度,表明成員之間的偏好沖突程度;且w1+w2=1.群組推薦的最終目的使共識函數(shù)最大化,當群組的預測評分足夠高時,群組的分歧度足夠小,表明推薦的項目也就更符合群組成員的偏好要求.但該形式化定義無法適用于所有的群組推薦方法,因此,群組推薦的定義依舊是一個開放性問題[1,8,9].
群組推薦主要由群組發(fā)現(xiàn)、偏好融合、預測推薦3部分組成,步驟如圖1所示.國內外學者對于群組推薦方法的改進和創(chuàng)新通常圍繞著群組推薦的3個步驟進行,如何在生成相似度更高的群組,如何更好地解決群組成員間的偏好沖突,如何提高推薦結果的準確率和多樣性,成為群組推薦研究領域的重點問題[1,8,9].
圖1 群組推薦步驟圖
Fig.1 Group recommendation steps
2.2.1 群組發(fā)現(xiàn)
群組發(fā)現(xiàn)[19]是指將用戶分為具有相似偏好的用戶小組,是群組推薦的關鍵前提步驟,其群組劃分結果將直接影響后續(xù)偏好融合和預測推薦步驟的效用[1,8,9].群組推薦的精確度由群組成員的內在相似度直接決定,當群組成員的內在相似度高于一定值時,群組推薦結果的精度能夠與個性化推薦結果的精度持平甚至超出[1,19].目前群組發(fā)現(xiàn)需要考慮的因素越來越多,從傳統(tǒng)的組大小、組內凝聚力、關聯(lián)強度等逐漸向數(shù)據(jù)集屬性和相應應用場景上偏移,主要方式有隨機分組、相似度計算、聚類3種[8].
2.2.2 偏好融合
偏好融合[20]是指利用偏好融合策略在推薦前建模群組成員的共同興趣偏好,或在推薦后建模群組成員的共同推薦偏好.它可以簡單分為獨立的兩個方面:1)偏好融合策略.有時也被稱為“融合策略”[20],需要同時考慮成員的總體滿意度以及公平性問題等等;2)偏好融合方法.可以將偏好融合方法根據(jù)其發(fā)生的階段以及融合的內容,分成兩類,分別是模型融合方法[20]和推薦融合方法[21].
2.2.3 預測推薦
預測推薦[1,8]是指對項目預測評分并進行推薦.群組推薦的經(jīng)典預測推薦方法是由傳統(tǒng)的個人推薦方法演變而來,隨著技術的進步與發(fā)展,越來越多的新興技術被用于群組推薦過程中,目前比較有代表性的幾種推薦技術的偏好融合特點及存在問題如表1所示.
表1 群組推薦技術對比Table 1 Comparison of group recommendation technology
在使用預測推薦技術時,要根據(jù)所使用的技術,對偏好融合部分使用的策略和方法進行選擇和調整.例如,通常情況下,基于深度學習的群組推薦由于其技術的特殊性多使用推薦融合方法;而基于信任及可信度的群組推薦由于在群組發(fā)現(xiàn)時已經(jīng)考慮到成員偏好多使用模型融合方法和經(jīng)典的偏好融合策略.
群組偏好的概念,是由Dyer等人[20]在上個世紀70年代研究群組的決策性問題時最初提出.群組偏好是由所有群組用戶的個人偏好融合出來并能夠代表群組決策意見的群組整體偏好[1].在群組推薦中,偏好融合是指將群組內群組成員的個人偏好整合為群組偏好的過程,它由兩部分組成,分別是偏好融合策略和偏好融合方法.偏好融合策略是指在對群組成員偏好進行提取過程中所使用的規(guī)則,偏好融合方法是指在群組推薦過程中進行偏好融合的建模方法,偏好融合方法劃分為模型融合[20]和推薦融合[21].在基于偏好融合的群組推薦過程中,偏好融合策略可以在不同的偏好融合方法上使用,兩者相對獨立.兩者的不同組合可以形成不同的推薦系統(tǒng)[1,8],達到不同的推薦效果.
文獻[8,9,21,22]分析了各種融合策略的優(yōu)劣,本文根據(jù)文獻[8]給出的偏好融合策略的分類,將基于改進偏好融合策略的群組推薦方法分為以下3類:
·基于單一融合策略的群組推薦方法
單一融合策略是指最基本的相對單一的偏好提取規(guī)則.常見的單一融合策略包括加法策略[21]、均值策略[23]、最開心策略[21]、最受尊敬者策略[21]、平均避免痛苦[31]、最小痛苦[24]等.
在使用單一融合策略的群組推薦方法中,通常根據(jù)數(shù)據(jù)集和融合要求,選用不同的單一融合策略.文獻[25]采取均值策略融合群組偏好向量,并與服務特征向量共同生成群組對服務的評分.然而,單一融合策略對整體偏好的把握性較差,較少考慮負面偏好的影響,例如均值策略產(chǎn)生的推薦結果可能會使個別成員不滿,即出現(xiàn)所謂的“痛苦”問題[20].
·基于混合融合策略的群組推薦方法
混合融合策略也被稱作組合策略,是指在群組推薦中,組合兩種或兩種以上單一融合策略形成新的提取規(guī)則來進行群組偏好的提取.群組推薦通過組合多種融合策略來解決單一融合策略存在的問題[8,21,22].
TDF[26]的偏好融合過程利用中值策略能夠對惡意評分和篡改信息有效規(guī)避這一優(yōu)點,結合均值策略,進行偏好融合.文獻[27]在利用多層感知器獲得用戶和項目之間潛在特征向量的非線性相互作用后,基于個人推薦分數(shù)提出了基于納什均衡的混合融合策略,以確保群體用戶的平均滿意度.文獻[28]通過外部社會信任網(wǎng)絡調整最終的小組偏好等并選取合適的單一融合策略.文獻[29]提出混合比例和無嫉妒的公平匯總策略來生成最公平的群體推薦列表.文獻[30]提出了一種混合策略,通過融合群組中所有成員的推薦評分形成對該群組的整體評分.
·基于加權融合策略的群組推薦方法
加權融合策略又稱作加權模型[20],是指通過對成員影響力的計算為群組成員的決策性分配權值后,再進行偏好的聚合提取,可以根據(jù)是否存在交互行為將加權融合策略分為靜態(tài)模型和交互模型.加權融合模型考慮群組成員對群組偏好的影響因素有很多,例特征、角色、信任層次等,也可以根據(jù)特定的數(shù)據(jù)要求進行計算,故而其靈活性較高.加權模型為每個群組成員分配不同的權重[31,32],在計算群體偏好時更加準確.
3.2.1 靜態(tài)模型
靜態(tài)模型中的群組成員權重通常是通過計算后預先定義的權重值.文獻[31]從利他行為與容忍度兩個角度切入,為子組分配權重,以減少群組偏好屬性特征.文獻[32]通過綜合計分項目比例因子(CIPF)使用改進的相似度公式,以獲得個人預測評分;通過引入項目類型比例因子來計算組類型偏好和用戶類型偏好之間的類型相似度,來改進偏好融合策略.文獻[33]項目特征屬性均值相似性權重和特征屬性頻度權重兩個方面來得到群體偏好模型.
3.2.2 交互模型
交互模型根據(jù)用戶與項目的交互行為來分配權重.文獻[34]通過用戶-項目交互的建模,從數(shù)據(jù)中學習聚合策略來解決偏好聚合問題.文獻[35]通過對組項交互數(shù)據(jù)和用戶項交互數(shù)據(jù)進行交互學習,并基于社會影響的群體表征學習,來根據(jù)成員偏好學習群組偏好.文獻[36]將預測的評分分為自我預測和偏好交互兩部分,通過歷史組活動信息和推薦后評分反饋機制生成個性化交互參數(shù).文獻[37]采用神經(jīng)注意力機制來描述每個組及其成員之間的偏好交互,結合組和項目特征以準確地學習項目上的組偏好權重.文獻[38]考慮朋友關系及用戶相似性,提取出用戶的社交權重和活動權重,形成新的群組用戶偏好模型.文獻[39]建立用戶之間交互的全局信任估計模型,以計算用戶對于最終群組決策的影響力.除此之外考慮成員交互的加權偏好融合策略[40,41]也成為交互模型的研究熱點.
文獻[1,8,21]對融合方法進行了總結,將目前常用的偏好融合方法可分為以下3類:對個人用戶推薦結果按分組進行合并,對個人用戶的預測評分按分組進行融合以及在預測推薦前建立群組偏好模型.其中,由于推薦結果融合和評分融合都是在完成每個用戶的預測推薦之后進行融合,所以在文獻[1,8,9]中推薦結果融合和評分融合被統(tǒng)稱為推薦融合;模型融合[20]則是先把群組成員的偏好模型融合生成群組偏好模型,再根據(jù)群組偏好進行預測推薦.模型融合與推薦融合的過程對比如圖2所示.
圖2 模型融合與推薦融合過程對比圖Fig.2 Comparison of model fusion and recommendation fusion process
3.3.1 模型融合
模型融合在預測推薦之前進行,它對輸入的每個成員偏好進行匯總,得到最終的群組偏好模型并進行輸出.在建模時,可以綜合考慮多個維度,例如個人屬性、關系屬性等,對數(shù)據(jù)集提供的用戶顯式反饋信息、項目特征等信息進行挖掘,全面考察小組內的偏好關系[8].文獻[42]放棄傳統(tǒng)的定量權重,選取偏好主觀融合的方式,對模型融合進行改進.文獻[43]結合了兩種融合方法的優(yōu)點并根據(jù)實驗得出了“群組偏好與個人偏好具有相似性”的結論.文獻[44]研究面對未知情況用戶偏好的不確定性,研究個人或集體偏好的定性及不確定性表達.文獻[45]研究具有區(qū)間值模糊偏好關系的推薦方法,利用集體優(yōu)先級計算偏好融合出現(xiàn)的時機.
3.3.2 推薦融合
推薦融合方法的偏好融合過程發(fā)生在對于個體用戶的預測推薦之后,它的結果通常為群組預測評分或群組推薦列表[8,20].根據(jù)融合的內容差異,推薦融合方法可分為評分融合[21]和排序融合[22].
評分融合方法首先利用傳統(tǒng)個性化推薦方法對群組內每個成員對于候選項目的預測評分進行計算,后根據(jù)群組生成的結果將得到的預測評分分成不同小組并分別進行融合,從而得到各個群組整體的對候選項目的預測評分.文獻[46]融合均值策略和最小辛苦策略,提出了修正滿意平衡策略進行評分融合.文獻[47]結合評論、類別和地理位置,為不同的組別進行推薦.
排序融合方法首先利用傳統(tǒng)的個性化推薦算法為群組內每個成員進行推薦,將生成的推薦結果列表進行融合,得到群組的整體推薦結果列表[12].文獻[48]結合時間因子對數(shù)據(jù)進行聚類,融合成員推薦列表得到最終的群組推薦結果.
效用評價對于檢驗群組推薦的性能和發(fā)現(xiàn)其存在的問題來說十分重要,是群組中無法忽視的環(huán)節(jié)[1,8].群組推薦的評價指標有以下幾類:
·準確度
準確度,又稱“精度”,在推薦系統(tǒng)中,指推薦結果與所有預推薦項目之間的比率,多用來衡量用戶對于其推薦項目列表的興趣程度,是推薦結果的最重要的評價方面.群組推薦的準確度評價用到的評價指標有許多,主要用到的指標有RMSE,MAP,F1,Recall,Precision,AUC,nDCG[8,49]等.根據(jù)文獻[50]對推薦系統(tǒng)準確度的分類,將以上準確度指標分為評分準確度、分類準確度、排序準確度3種,各準確度評價指標的類別和作用見表2.
在群組推薦的準確度評估上,可以根據(jù)群組推薦對結果的不同要求,使用不用的準確度指標.通常在傳統(tǒng)推薦系統(tǒng)中,只考慮準確度要求,多使用Precision來計算推薦結果的準確度,同時結合召回率,利用兩者之間的負相關性評價群組推薦的準確性;而對于推薦排序要求嚴格的群組推薦而言,推薦結果的排序更能影響推薦系統(tǒng)的性能,故而多使用nDCG作為準確度評價指標.
Precision描述用戶對系統(tǒng)推薦商品感興趣的概率,其計算公式見式(2):
(2)
其中R(u)是在訓練集上根據(jù)用戶行為對用戶推薦的推薦列表,T(u)是在測試集上的行為列表,Precision定義為預測得到的相關項目數(shù)與用戶喜愛的項目總數(shù)的比率,用于描述推薦列表中有多少項目是準確的.
表2 各種準確度評價指標的類別和作用Table 2 Types and functions of various accuracy evaluation indexes
nDCG評價在Top-k推薦列表的排序準確率,其計算公式如式(3)和式(4)所示:
(3)
(4)
式(3)中,i表示項目編號,p1表示第l個項目的評分列表,u表示用戶,利用k值來調整推薦結果的數(shù)量.由于搜索結果隨著檢索詞的不同,返回的數(shù)量是存在差異的,DCG作為一個累加值,對兩個不同的搜索結果比較時存在局限性,因此需要利用式(4)對DCG進行歸一化處理,IDCG為理想情況下DCG的最大值.
nDCG的值域為[0,1],但通常不會計算得到0和1的值,當nDCG處于0-1之間時,值越大代表準確率越高.
·多樣性
群組推薦的多樣性是指群組推薦結果列表中項目與項目之間的相似程度,推薦項目之間的相似度越低,推薦結果的多樣性就越好.雖然群組推薦的準確性十分重要,但是如果用戶看見推薦的項目都十分相似,用戶便會產(chǎn)生一定的厭煩情緒,從而影響群組對群組推薦的滿意程度.因此,評估群組推薦的多樣性也是極為必要的.推薦系統(tǒng)通常使用Jaccard相似度系數(shù)[6]來計算兩個項目之間的類型相似度,群組推薦多通過計算整個推薦列表的類型相似度來評價推薦結果的多樣性.
Jaccard相似性系數(shù)利用集合的交集與集合的并集之比來對兩個集合的相似度進行計算.給定集合A和集合B,Jaccard系數(shù)定義為A與B交集的大小與A與B并集的大小的比值,定義如下:
當集合A,B都為空時,J(A,B)定義為1.
Jaccard 距離用于描述集合之間的相異程度.Jaccard 距離越小,證明樣本之間的差異程度越小,樣本相似度越高,公式如式(5)所示.
(5)
由于Jaccard相似系數(shù)的定義,列表內的平均相似度分布在0到1之間,平均相似度越接近1,列表內項目間的相異程度越高,即推薦列表多樣性越好.
·覆蓋率
覆蓋率是指群組推薦能夠進行推薦的項目范圍[8].群組推薦評價覆蓋范圍的通常方式是計算每個群組的推薦結果列表的目錄覆蓋率.由于群組推薦結果的覆蓋率往往會影響群組推薦結果的準確率.因此,在評估群組推薦結果的覆蓋率時必須考慮和結果準確率之間的影響關系[6].
目錄覆蓋率是通過將總體中每個用戶的前n個建議的總和來衡量的.如果將用戶劃分為多個組,并且計算組建議而不是單個建議,那么我們將根據(jù)每個組的前n個建議的組合來度量目錄覆蓋率.隨后,將此集合的基數(shù)(即此聯(lián)合中的項數(shù))除以系統(tǒng)目錄中的項數(shù),以獲得目錄覆蓋率.
·其他指標
除了準確率、多樣性、覆蓋率外,常用的群組推薦評價指標還有用戶滿意度和驚喜度.用戶滿意度是指用戶對于推薦結果列表的滿意程度,是群組效用評價的重要指標之一[8].文獻[51]通過用戶調查問卷方式進行評價,與個性化推薦相比,群組推薦涉及到的調查人員更多,耗費的精力也更多.驚喜度是指用戶對于推薦列表中項目的驚喜程度,是一種新興的評價指標,目前還沒有明確的公認的計算方法[1,8].
由于群組推薦需要的數(shù)據(jù)集中必須包含分組信息,但很少有自帶分組信息的數(shù)據(jù)集,所以相比較于傳統(tǒng)的個性化推薦方法,獲取群組推薦相關的數(shù)據(jù)集更加困難.目前國內外普遍采用的方法是使用傳統(tǒng)個性化推薦方法的數(shù)據(jù)集,根據(jù)算法要求或數(shù)據(jù)集屬性,從數(shù)據(jù)集中發(fā)現(xiàn)群組[21].
傳統(tǒng)推薦方法中常用的數(shù)據(jù)集有MovieLens、BookCrossing、Jester Joke、Netflix等.
1)MovieLens
MovieLens[19]是經(jīng)典的電影評分數(shù)據(jù)集,該數(shù)據(jù)集存放了用戶對自己觀看過的電影的評分,為5分制評價表.根據(jù)算法的適用規(guī)模,可以選用兩個不同大小的數(shù)據(jù)集.小規(guī)模的數(shù)據(jù)集存在1萬個評分數(shù)據(jù),包括1682部電影的評分,由近1000個獨立用戶給出.大規(guī)模的數(shù)據(jù)集存在約100萬個評分數(shù)據(jù),包括3900部電影的評分,評分用戶高達6000個.
2)BookCrossing
BookCrossing數(shù)據(jù)集是基于Book-Crossing圖書社區(qū)的對于書籍評分的數(shù)據(jù)集,他的用戶以匿名形式進行評分,評分數(shù)據(jù)分為顯式和隱式兩種,約有超27萬個匿名用戶對近30萬本圖書進行評分.
3)Jester Joke
Jester Joke數(shù)據(jù)集由加州大學伯克利分校的Ken Goldberg公布,該數(shù)據(jù)集包含410萬個評分,評分項目固定為100個笑話,用戶數(shù)超7萬個,評分區(qū)間在(-10,10)內任意連續(xù)實數(shù).
4)Netflix
Netflix數(shù)據(jù)集同樣也是常用的公開的電影評分數(shù)據(jù)集,它包含約10億個評分,集合了約48萬個匿名用戶對超1萬電影的匿名評價,來自于電影租賃網(wǎng)站Netflix.
實驗選取3種不同的偏好融合策略在兩種不同的推薦方法上進行實驗,并且設定不同的群組規(guī)模,探究偏好融合策略、推薦方法、群組規(guī)模對結果的影響,以及3者之間的關系.實驗從準確率、多樣性、覆蓋率方面對基于偏好融合策略的群組推薦方法進行對比分析.實驗表明,群組推薦結果的優(yōu)劣與群組規(guī)模、偏好融合策略、推薦預測方法的選取密切相關;在偏好融合過程中選擇偏好融合策略和方法時需要考慮群組規(guī)模的大小和推薦方法的特性.
本文實驗使用MovieLens(100k)數(shù)據(jù)集離線評估不同的推薦策略.該數(shù)據(jù)集包含了1682部受歡迎的、長片長度的、專業(yè)制作的電影的信息,包括在943名用戶的5分制評分表上的10萬個評價.
針對偏好融合策略目前的發(fā)展趨勢,分別選取均值策略、文獻[31]提出的加權偏好融合策略、文獻[26]提出的混合策略,進行對比試驗.分別使用協(xié)同過濾和混合推薦作為預測推薦方法,相似度計算作為群組發(fā)現(xiàn)方法,實驗對比偏好融合策略與推薦方法、群組規(guī)模的關系,及他們對推薦結果的影響.
在混合推薦、協(xié)同過濾下3種偏好融合策略精度對比結果如圖3和圖4所示.
圖3 不同偏好融合策略混合推薦的準確性Fig.3 Accuracy of hybrid recommendation based on different preference fusion strategies
在混合推薦、協(xié)同過濾下3種偏好融合策略推薦結果覆蓋率對比結果如圖5和圖6所示.
3種策略不同推薦方法下結果多樣性的對比結果如表3所示.
圖4 不同偏好融合策略協(xié)同過濾推薦的準確性Fig.4 Accuracy of collaborative filtering recommendation based on different preference fusion strategies
圖5 不同組規(guī)?;旌贤扑]結果覆蓋率Fig.5 Coverage of mixed recommendation results in different groups
圖6 不同組規(guī)模協(xié)同過濾推薦結果覆蓋率Fig.6 Coverage of collaborative filtering recommendation results with different group sizes
對比圖3和圖4可以看出,在群組規(guī)模較小的情況下3種方法準確率差異在0.02以內.隨著組規(guī)模的增加,推薦結果的準確性在逐步下降.混合策略及加權策略相對于單一策略具有更好的準確率,且在群組規(guī)模增大時也具有良好的穩(wěn)定性.這是由于選取的3種策略在進行偏好融合時,均值策略會引起痛苦問題,混合策略在此基礎上將兩端部分的值進行了一定省略,而加權策略雖然減少群組偏好屬性特征,但在群組一定群組規(guī)模下,對屬性值的數(shù)量把握存在偏差.
由表3可以看出同種偏好融合策略在不同推薦方法上對結果多樣性的影響較小,不同偏好策略在同種推薦方法上對結果多樣性的影響較大.這證明推薦結果的多樣性受偏好融合策略的影響相對于受推薦方法的影響要小一些.造成該結果的原因主要是由于推薦方法的計算方式和著重點的不同,對于不同類型項目的預測評分和排名也有所差異,導致推薦列表中項目的多樣性差異大.
表3 各種策略不同推薦方法結果多樣性的影響對比Table 3 Comparison of the effects of different strategies and different recommendation methods on the diversity of results
對比分析圖5和圖6,可以看到3種策略推薦結果的覆蓋率總體上隨著組規(guī)模的增加逐步降低,當群組規(guī)模增大時,與均值策略對比,混合策略和加權策略的下降趨勢逐漸平穩(wěn).說明推薦結果的覆蓋率既受到偏好融合策略的影響,也受到群組規(guī)模的影響.在實際應用中,需要對群組規(guī)模進行把控,即群組發(fā)現(xiàn)過程需要更加準確,對組內相似度要求要更加嚴格.
實驗表明,不存在全局最優(yōu)的偏好融合策略,只存在相對于推薦方法和群組規(guī)模的最優(yōu)的偏好融合策略[1,8,9].
就目前的對比試驗可以發(fā)現(xiàn):
1)單一偏好融合策略并不能夠滿足現(xiàn)階段推薦結果對準確率、多樣性、覆蓋率的要求,而混合策略和加權策略在特定數(shù)據(jù)集和推薦方法上給出的推薦結果要更優(yōu)秀.均值策略將所有成員的評分值作為群組評分,但均值策略的推薦結果容易出現(xiàn)“痛苦問題”.故而在實驗過程中,均值策略相比較使用的混合策略和加權策略,各評價指標表現(xiàn)欠佳.所使用的混合策略混合了中值策略和均值策略,依舊沒有解決痛苦問題.
2)混合策略和加權策略往往對數(shù)據(jù)集的屬性和推薦方法的計算方式有特定要求.所使用的混合策略能夠緩解由惡意評分和篡改信息所帶來的對結果的不良影響,但對數(shù)據(jù)集評分的稀疏程度有所要求;加權模型減少群組偏好屬性特征,對原數(shù)據(jù)集的用戶偏好屬性的數(shù)量有所要求的.當用戶評分數(shù)據(jù)或交互數(shù)據(jù)較稀疏時,這兩種策略都無法很好地融合群組偏好.
3)在偏好融合策略的選擇上要考慮數(shù)據(jù)集本身的屬性以及群組規(guī)模和推薦方法的選擇.偏好融合策略是能夠準確得到群組偏好從而準確地進行群組推薦的關鍵因素,也是群組推薦系統(tǒng)主要研究的方向之一.如何對現(xiàn)有融合策略進行針對性優(yōu)化和根據(jù)不同群組的用戶特征及應用背景選擇融合策略,成為了群組推薦系統(tǒng)中的關鍵問題.
4)進行模型融合時,群組規(guī)模的大小需要進行著重討論.實驗證明,不管是準確度、多樣性還是覆蓋率,大多隨著群組規(guī)模的不斷增大而降低,證明群組推薦的推薦效果會隨著群組規(guī)模的增大而變差.在選擇群組規(guī)模時,既需要根據(jù)數(shù)據(jù)集屬性和要求,還需要考慮最后的推薦效果.
偏好融合策略是能夠準確得到群組偏好從而準確地進行群組推薦的關鍵因素,也是群組推薦系統(tǒng)主要研究的方向之一.如何對現(xiàn)有融合策略進行針對性優(yōu)化和根據(jù)不同群組的用戶特征及應用背景選擇融合策略,成為了群組推薦系統(tǒng)中的關鍵問題.
隨著新技術的成熟和科技的發(fā)展,偏好融合策略也應從單一策略向混合策略發(fā)展.基于偏好融合的群組推薦未來研究方向有:
·提高組內成員相似度,對融合策略進行混合或加權
首先利用群組發(fā)現(xiàn)的相關方法對組內成員相似度進行提高,降低數(shù)據(jù)對偏好融合的要求,同時對多種單一策略進行混合或加權,結合不同偏好融合方法,對偏好融合進行改進,例如文獻[52]利用動態(tài)泊松分解得到量化用戶動態(tài)傾向,采用高階奇異值分解預測用戶在不同時間節(jié)點下對不同項目的傾向性,計算用戶傾向構建高相似度用戶集合,對用戶集合采用改進后的基于密度峰值的聚類算法進行劃分,實現(xiàn)群組發(fā)現(xiàn),來解決用戶傾向具有時間遷移性和群組可重疊性問題,以提高群組用戶相似度,優(yōu)化群組推薦結果.
·結合多領域方法和新的技術
結合深度學習相關方法,引入其他影響因子,針對特定數(shù)據(jù)集的屬性進行研究和改進.
例如文獻[34]首次將注意力機制與二部圖嵌入技術相結合,利用并整合用戶的全局/局部社交網(wǎng)絡結構信息,提出了一種新的深度社交影響學習框架來克服在預估用戶社交影響時的數(shù)據(jù)稀疏性、避免過擬合,改善群組推薦效果.文獻[53]在科研咨詢領域,對檢測快報實現(xiàn)精準推薦自動精確推薦.文獻[19]基于多視圖學習對用戶相似度矩陣分配權重提出群組發(fā)現(xiàn)算法;文獻[54]采用張量分解方法獲取記錄的隱形特征矩陣,利用馬爾可夫聚類算法實現(xiàn)對記錄的分類,根據(jù)分類結果發(fā)現(xiàn)用戶群組,解決廣播用戶興趣復合性問題,減小組內用戶與群組整體在觀看興趣方面的平均絕對誤差,提高組內成員的觀看興趣相似度.
·優(yōu)化偏好融合策略和方法選擇方案
在選擇偏好融合策略和方法時,首先要考慮群組規(guī)模的大小,不同數(shù)據(jù)集和群組發(fā)現(xiàn)方法輸出群組規(guī)模的結果不同,但對推薦結果覆蓋率的趨勢基本相同;其次需要考慮不同推薦方法上偏好融合策略對推薦結果精度的影響,最佳偏好融合策略和方法的選擇與推薦算法直接相關;最后需要考慮推薦結果對多樣化的要求,減少偏好融合對結果多樣化的劣性影響.
以考慮群組規(guī)模和組內相似度為例,通常在要求群組規(guī)模較大且群組群組本身相似度較高時,可以選擇最大滿意度策略,其表現(xiàn)優(yōu)于均值策略和最小痛苦策略[8];在要求群組規(guī)模較小且群組內在相似度較高時,均值策略和最大滿意度策略的表現(xiàn)均優(yōu)于最小痛苦策略;而對不要求較高相似度的群組,均值策略表現(xiàn)最佳.
·針對推薦結果多樣性要求進行偏好融合策略或方法優(yōu)化
在推薦結果的多樣性要求上可以改進或優(yōu)化推薦方法以達到目的.例如文獻[55]融入情境信息挖掘群組行為特征,構建群組行為偏好特征向量,將每個群組看成一個個體,在推薦時,每個群組和其他群組對項目的歷史評分進行協(xié)同,以提高推薦效果.文獻[56]將群組推薦建模成多目標問題,將目標函數(shù)定義為群組用戶的滿意度和物品的流行度,并利用數(shù)據(jù)特征和計算特性設計適合多目標推薦問題的免疫算子,在預測推薦上引入免疫多目標算法,優(yōu)化推薦方法;文獻[57]對用戶的搜索點擊日志和瀏覽器的瀏覽日志進行統(tǒng)計,從文本相似度、語言模型相關度、潛在的語義關聯(lián)關系三個方面充分分析用戶興趣方向之間的關聯(lián)關系.
隨著數(shù)據(jù)量的指數(shù)級增加,群體推薦被廣泛應用于各個領域,并逐步成為推薦領域熱門研究方向.與個性化推薦不同,群組推薦的推薦對象是分成不同小組的群組成員,符合當前人們群體性活動逐步增多的現(xiàn)狀.隨著對群組推薦的深入研究,對群組成員的偏好提取以及群組決策的公平性問題不斷產(chǎn)生新的思考.如何更好地解決群組成員之間的偏好沖突,形成更準確更多樣性的群組偏好,成為群組推薦的主要任務.本文主要根據(jù)近期各專家學者的研究成果對基于偏好融合的群組推薦展開研究與分析,并結合近期研究工作對群組推薦的評價指標和相關數(shù)據(jù)集進行總結歸納,分析比較了不同偏好融合對推薦結果的影響及偏好融合、推薦特征、推薦方法之間的關系,同時對基于偏好融合的群組推薦方法的發(fā)展進行展望.未來研究應該發(fā)現(xiàn)或改進偏好融合策略,結合多方法在不同群組甚至不同項目上動態(tài)分配權值,實現(xiàn)群組的動態(tài)推薦.