汪 濤
(湖北民族學(xué)院理學(xué)院 湖北 恩施 445000)
?
社交網(wǎng)絡(luò)中上下文感知協(xié)同過濾算法
汪 濤
(湖北民族學(xué)院理學(xué)院 湖北 恩施 445000)
圍繞上下文感知推薦技術(shù)和社會(huì)化網(wǎng)絡(luò)推薦技術(shù)的局限性展開研究,提出一種基于社會(huì)化網(wǎng)絡(luò)環(huán)境下的名為HCCF的上下文感知協(xié)同過濾方法。在充分考慮上下文感知推薦系統(tǒng)實(shí)際問題的基礎(chǔ)上,首先量化了不同維度的上下文對(duì)推薦系統(tǒng)所產(chǎn)生的影響,并在此基礎(chǔ)上定義了上下文影響系數(shù)。在此基礎(chǔ)上引入了社會(huì)化網(wǎng)絡(luò)環(huán)境中不同用戶之間的相互影響,并采用社會(huì)化網(wǎng)絡(luò)用戶信任度進(jìn)行衡量,最后對(duì)上下文因素和社會(huì)化網(wǎng)絡(luò)用戶信任度進(jìn)行綜合考慮,提出一種新的相似度計(jì)算方法。理論分析和在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,相對(duì)于單純基于上下文的系統(tǒng)過濾算法以及社會(huì)化網(wǎng)絡(luò)推薦方法而言,該算法的準(zhǔn)確性和推薦效率均得到一定程度的提升。
上下文感知推薦系統(tǒng) 社交網(wǎng)絡(luò) 推薦系統(tǒng) 上下文感知
隨著信息化技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,尤其是網(wǎng)絡(luò)技術(shù)的發(fā)展,世界正經(jīng)歷著異常深刻的“網(wǎng)絡(luò)化革命”,近年來云計(jì)算、大數(shù)據(jù)等新興計(jì)算技術(shù)的快速發(fā)展,促使了以博客、微博、微信等為代表的社交媒體風(fēng)起云涌,人們逐漸從信息匱乏的時(shí)代走入信息過載的時(shí)代[1-2],人們淹沒在信息的海洋卻無法迅速找到有用的信息。雖然人們可以通過搜索引擎進(jìn)行信息檢索,但是搜索引擎卻無法主動(dòng)向用戶提供個(gè)性化查詢。因此,信息過載在一定程度上降低了信息利用率,并且在當(dāng)今大數(shù)據(jù)時(shí)代表現(xiàn)越來越嚴(yán)重[3-4]。推薦系統(tǒng)作為一種信息超載解決方案,通過分析用戶與項(xiàng)目之間的相關(guān)關(guān)系和用戶行為獲取用戶特征,針對(duì)用戶的特性需求進(jìn)行項(xiàng)目推薦,實(shí)現(xiàn)個(gè)性化服務(wù)。作為一種新的智能信息服務(wù)方式,推薦系統(tǒng)在電子商務(wù)、社會(huì)網(wǎng)絡(luò)、移動(dòng)應(yīng)用和互聯(lián)網(wǎng)廣告等各個(gè)領(lǐng)域得到廣泛應(yīng)用,其中以在電子商務(wù)領(lǐng)域的應(yīng)用最為成功。
“用戶-項(xiàng)目”之間的關(guān)聯(lián)關(guān)系在傳統(tǒng)推薦系統(tǒng)中占據(jù)著重要的位置,以往對(duì)于推薦系統(tǒng)的研究也主要集中于對(duì)“用戶-項(xiàng)目”關(guān)系的研究,而很少考慮到用戶所處的上下文環(huán)境(如時(shí)間、位置、活動(dòng)狀態(tài)、網(wǎng)絡(luò)環(huán)境等)。但是,隨著移動(dòng)應(yīng)用的發(fā)展和基于位置服務(wù)的興起,用戶對(duì)推薦的需求越來越和周圍環(huán)境相關(guān),僅僅依靠“用戶-項(xiàng)目”的二元關(guān)系所產(chǎn)生的推薦并不能很好地滿足用戶的需求,例如在用戶“心情愉悅”時(shí)應(yīng)該向用戶推薦一些歡悅而非壓抑的音樂,如果用戶在進(jìn)餐時(shí)間通過移動(dòng)終端或其他方式購買餐券的概率要比深夜及其他時(shí)間要高。并且在選擇過程中就近選擇就餐地點(diǎn)的概率高于遠(yuǎn)距離飯店。這里的地理位置、時(shí)間就可以看成是上下文內(nèi)容,在推薦系統(tǒng)中結(jié)合上下文信息可以進(jìn)一步提高推薦的精準(zhǔn)度和用戶滿意度,在保持“個(gè)性化”的同時(shí)也體現(xiàn)了一定的“普適計(jì)算”的優(yōu)勢(shì),對(duì)于改進(jìn)推薦系統(tǒng)的性能具有重要的研究意義和適用價(jià)值,引起了眾多研究者的極大興趣。
當(dāng)前對(duì)基于上下文感知計(jì)算的推薦系統(tǒng)的研究主要集中于現(xiàn)實(shí)環(huán)境上下文對(duì)用戶偏好的影響,很少涉及社會(huì)化網(wǎng)絡(luò)上下文的影響。當(dāng)今社會(huì)化網(wǎng)絡(luò)正如日中天,社會(huì)化網(wǎng)絡(luò)所涉及的上下文包含的信息已經(jīng)遠(yuǎn)遠(yuǎn)超過現(xiàn)實(shí)環(huán)境上下文,通過對(duì)用戶網(wǎng)絡(luò)上下文的挖掘,可以獲取大量體現(xiàn)用戶與外部世界交互的信息,對(duì)提高推薦系統(tǒng)的準(zhǔn)確性有極大的意義。然而,當(dāng)前對(duì)于上下文感知推薦系統(tǒng)的研究忽略了社會(huì)化網(wǎng)絡(luò)條件上下文,在一定程度上影響了推薦系統(tǒng)的準(zhǔn)確度和多樣性。因此,將社交網(wǎng)絡(luò)融入到上下文感知推薦系統(tǒng),通過社交網(wǎng)絡(luò)環(huán)境分析用戶需求與社會(huì)環(huán)境之間的關(guān)聯(lián)關(guān)系,并對(duì)用戶產(chǎn)生推薦對(duì)于提高推薦系統(tǒng)的準(zhǔn)確性具有重要意義。
因此,本文面向社會(huì)化網(wǎng)絡(luò)服務(wù)研究領(lǐng)域,提出一種啟發(fā)式的上下文感知協(xié)同過濾方法HCCF(Heuristic Context-aware Collaborative Filtering),利用已知的用戶偏好和社會(huì)化網(wǎng)絡(luò)關(guān)系,發(fā)現(xiàn)用戶的最近鄰居,預(yù)測(cè)用戶潛在偏好并生成推薦。
自推薦系統(tǒng)概念提出以來,眾多的研究者對(duì)推薦系統(tǒng)進(jìn)行了大量研究,但是已有的研究工作主要集中于協(xié)同過濾、基于內(nèi)容和物品的推薦以及基于模型的推薦方法。在用戶和物品的二元關(guān)系上,根據(jù)已有信息計(jì)算用戶和物品的相似性進(jìn)而挖掘用戶潛在的感興趣的物品,但是沒有考慮到時(shí)間、地點(diǎn)、社會(huì)環(huán)境、網(wǎng)絡(luò)環(huán)境等上下文信息。由于上下文信息的引入,推薦系統(tǒng)的數(shù)據(jù)源從二維評(píng)分空間擴(kuò)展到多維評(píng)分空間,Adomavicius等人基于這一想法于2005年提出“上下文感知推薦系統(tǒng)CARS(context-aware recommender systems[5~7])”,首次使得上下文信息成為推薦系統(tǒng)的一個(gè)重要因素。近年來眾多研究者針對(duì)上下文感知推薦系統(tǒng)展開了一系列的應(yīng)用研究,使得上下文感知推薦系統(tǒng)已經(jīng)在電子旅游、移動(dòng)網(wǎng)絡(luò)服務(wù)等方面展開了廣泛應(yīng)用。社會(huì)化推薦系統(tǒng)由于融合了社會(huì)化網(wǎng)絡(luò)信息和個(gè)性化用戶偏好信息,在推薦精確度、冷啟動(dòng)、稀疏性、新穎性和覆蓋率等方面相對(duì)于傳統(tǒng)二維推薦系統(tǒng)有較大的提升和優(yōu)化。如圖1所示。
圖1 基于社交網(wǎng)絡(luò)的上下文感知推薦系統(tǒng)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,信息增長(zhǎng)的速度已經(jīng)遠(yuǎn)遠(yuǎn)超過了計(jì)算技術(shù)發(fā)展的速度,信息過載的問題越來越突出[8]。針對(duì)這一問題,推薦系統(tǒng)領(lǐng)域的研究人員展開了大量的研究,提出了許多有效的算法的模型[9~12]對(duì)于解決信息過載的問題具有一定的作用,尤其是在利用上下文感知計(jì)算和社會(huì)化網(wǎng)絡(luò)分析技術(shù)進(jìn)行信息推薦方面取得了較好的成果。鄭志高等[13]在綜合考慮了基于用戶和基于物品的協(xié)同過濾算法的同時(shí)引入了時(shí)間的上下文因素,提出了一種時(shí)間加權(quán)不確定近鄰協(xié)同過濾算法,從時(shí)間維度改善了相似性的計(jì)算方式。Adomavicius等[12]針對(duì)個(gè)性化移動(dòng)服務(wù)網(wǎng)絡(luò)提出了一種上下文移動(dòng)用戶偏好自適應(yīng)學(xué)習(xí)算法,解決了移動(dòng)服務(wù)中上下文信息實(shí)時(shí)更新的問題。Hong等分析了上下文信息和日志記錄,并提出一個(gè)基于代理的框架,實(shí)現(xiàn)了移動(dòng)環(huán)境下的個(gè)性化推薦服務(wù)[14]。Gaurav等[15]采用關(guān)聯(lián)挖掘的方法對(duì)上下文信息進(jìn)行深度挖掘,并利用挖掘結(jié)果進(jìn)行相關(guān)項(xiàng)目的推薦,在一定程度上提高了推薦系統(tǒng)的準(zhǔn)確性。Knijnenburg等[16]研究了上下文推薦系統(tǒng)決策方法,同時(shí)提出了一種上下文推薦系統(tǒng)中隱私保護(hù)的推薦機(jī)制,在進(jìn)行信息推薦的同時(shí)保護(hù)用戶隱私。Braunhofer[17]則研究了上下文感知推薦系統(tǒng)中的冷啟動(dòng)問題,提出了一種混合交換的推薦機(jī)制,既考慮了已有信息的計(jì)算方法同時(shí)也考慮了新進(jìn)資源的推薦方法。
當(dāng)前對(duì)于上下文感知推薦系統(tǒng)的研究主要集中于多元混合資源的關(guān)聯(lián)推薦方面,同時(shí)還有眾多的研究者根據(jù)地理信息等資源進(jìn)行基于位置的推薦。但是當(dāng)前無論是上下文感知推薦方面還是基于社會(huì)化網(wǎng)絡(luò)資源推薦方面的研究都相對(duì)孤立,很少有人將二者結(jié)合起來。當(dāng)今移動(dòng)互聯(lián)網(wǎng)技術(shù)和社交網(wǎng)絡(luò)技術(shù)快速發(fā)展,上下文環(huán)境已經(jīng)不僅僅是指網(wǎng)絡(luò)上下文環(huán)境或者現(xiàn)實(shí)環(huán)境的上下文,二者往往交互在一起。因此,在社會(huì)化網(wǎng)絡(luò)環(huán)境下研究上下文感知推薦方法不僅僅是提高推薦系統(tǒng)推薦準(zhǔn)確率的需求,也是移動(dòng)互聯(lián)網(wǎng)技術(shù)發(fā)展的需求。
上下文感知推薦系統(tǒng)關(guān)注上下文信息對(duì)用戶偏好的影響,而社會(huì)化網(wǎng)絡(luò)環(huán)境下的推薦系統(tǒng)則關(guān)注社會(huì)化網(wǎng)絡(luò)環(huán)境下用戶或項(xiàng)目的相似性計(jì)算方法。本文主要研究融合上下文和社交網(wǎng)絡(luò)的協(xié)同過濾推薦方法,在內(nèi)容上和計(jì)算理論上是對(duì)上下文感知推薦系統(tǒng)和社會(huì)化網(wǎng)絡(luò)環(huán)境下的推薦系統(tǒng)的進(jìn)一步融合與深化。本文分別采用U、I、C表示所有用戶、物品和上下文的集合,同時(shí)定義θ:U×I×C∈R和φ:U×U∈P兩個(gè)效用函數(shù)分別對(duì)用戶在上下文條件下對(duì)項(xiàng)目的偏好程度和用戶之間的社會(huì)化網(wǎng)絡(luò)關(guān)系進(jìn)行表示,那么基于社會(huì)化網(wǎng)絡(luò)的上下文感知推薦系統(tǒng)的核心問題就是在社會(huì)化網(wǎng)絡(luò)環(huán)境中考慮上下文條件約束的前提下為用戶推薦那些預(yù)測(cè)偏好度R最大的項(xiàng)目s*,這一過程可以形式化地表述為式(1)。
?(u,c1,…,ct)∈U×C1×…×Ct,
(1)
多維評(píng)分向量模型θ()表示社會(huì)化網(wǎng)絡(luò)關(guān)系類型的不同屬性或特征,二維矩陣空間模型φ()表示用戶在不用上下文環(huán)境中的偏好。根據(jù)上述定義,效用函數(shù)θ()表示用戶之間的社會(huì)化網(wǎng)絡(luò)關(guān)系,因此θ()中的所有元素為空時(shí),社會(huì)化網(wǎng)絡(luò)環(huán)境對(duì)推薦系統(tǒng)的影響可以完全忽略,模型就退化成常規(guī)的上下文感知推薦系統(tǒng);當(dāng)C為0時(shí),模型即為常規(guī)社會(huì)化推薦系統(tǒng);當(dāng)φ()的所有元素為空且上下文類型C為0時(shí),模型即為傳統(tǒng)的推薦系統(tǒng)。
在考慮社會(huì)化網(wǎng)絡(luò)分析方法和上下文信息融合的基礎(chǔ)上,本文創(chuàng)造性地提出一種啟發(fā)式的基于社會(huì)化網(wǎng)絡(luò)的上下文感知協(xié)同過濾方法HCCF(Heuristic Context-aware Collaborative Filtering Algorithm),HCCF充分考慮了上下文信息對(duì)用戶偏好的影響,保證推薦系統(tǒng)的準(zhǔn)確性;同時(shí)利用社會(huì)化網(wǎng)絡(luò)計(jì)算方法,在一定程度上提高了推薦系統(tǒng)的效率。
2.1 上下文環(huán)境對(duì)用戶偏好的影響模型
本文用一個(gè)多維度向量空間模型C=C1×C2×…×Cm表示用戶所處的上下文環(huán)境,其中m表示上下文類型的數(shù)量,那么用戶在不同上下文類型下對(duì)項(xiàng)目的偏好Pre可以用多維度向量空間模型的量化偏好值表示為:Pre:U×I×C→Preference,其中U表示用戶集合,I表示項(xiàng)目集合,C表示上下文集合。為了表示不同上下文環(huán)境對(duì)用戶偏好的影響,本文采用相對(duì)標(biāo)準(zhǔn)方差RSD來衡量不同維度的上下文環(huán)境對(duì)用戶偏好的影響的波動(dòng)系數(shù)volt,如果用戶u在上下文環(huán)境ct中對(duì)于i的偏好程度為Preuict,那么volt可以表示為式(2)。
(2)
(3)
2.2 融合上下文信息和社交網(wǎng)絡(luò)的用戶相似度計(jì)算方法
本文在考慮上下文環(huán)境對(duì)用戶偏好影響的基礎(chǔ)上考慮社交網(wǎng)絡(luò)中用戶之間的間接信任關(guān)系對(duì)用戶相似度的影響,最終實(shí)現(xiàn)對(duì)用戶評(píng)分的預(yù)測(cè)。
(4)
社會(huì)化網(wǎng)絡(luò)承載著人與人之間的相關(guān)信息,社會(huì)化網(wǎng)絡(luò)分析研究主要關(guān)注用戶之間的關(guān)聯(lián)關(guān)系以及網(wǎng)絡(luò)信息對(duì)用戶的影響,尤其是用戶之間的信任關(guān)系已經(jīng)對(duì)用戶偏好產(chǎn)生一定的影響?;谶@一社會(huì)特點(diǎn),本文將用戶之間的信任關(guān)系進(jìn)行量化,并結(jié)合用戶偏好數(shù)據(jù)對(duì)用戶感興趣的物品進(jìn)行推薦。由于用戶之間的直接信任關(guān)系矩陣往往是稀疏矩陣[19],因此,本文首先需要構(gòu)建用戶之間的間接信任模型。本文引入信任度的概念并采用tac和tcb對(duì)用戶ua和uc以及用戶uc和ub之間的信任關(guān)系盡量量化,量化模型可以表示為式(5),其中tab即表示用戶ua和ub之間的信任度。
(5)
其中Ta={tac|tac≠null,tac≥θ},參數(shù)θ表示用戶ua對(duì)好友信任度閾值,由于用戶之間的信任關(guān)系具備傳遞性,因此可以通過閾值的設(shè)置對(duì)用戶信任度的傳遞范圍進(jìn)行設(shè)置可以快速發(fā)現(xiàn)最近鄰好友。
根據(jù)以上各參數(shù)的引入,本文在上下文評(píng)分相似度sim(ua,ub)con的基礎(chǔ)上對(duì)社會(huì)網(wǎng)絡(luò)的信任關(guān)系進(jìn)行量化并引入社會(huì)關(guān)系網(wǎng)絡(luò)模型tab,因此,本文可以根據(jù)式(6)對(duì)融合上下文信息和社會(huì)化網(wǎng)絡(luò)的用戶相似度sim(ua,ub)進(jìn)行計(jì)算。
sim(ua,ub)=α×sim(ua,ub)con+(1-α)tab
(6)
其中,參數(shù)α∈[0,1]表示上下文因素和社會(huì)化網(wǎng)絡(luò)環(huán)境對(duì)推薦結(jié)果準(zhǔn)確率的影響,并且上下文因素對(duì)推薦結(jié)果的影響與α成正相關(guān),也就是說α越大,上下文因素對(duì)推薦系統(tǒng)結(jié)果的影響越大,反之,說明社會(huì)化網(wǎng)絡(luò)因素對(duì)相似度的計(jì)算影響越大。當(dāng)α=0時(shí)sim(ua,ub)=tab,即忽略上下文因素對(duì)推薦系統(tǒng)的影響,α=1時(shí)則有sim(ua,ub)=sim(ua,ub)con。
2.3 啟發(fā)式上下文感知協(xié)同過濾算法
(7)
算法HCCF是根據(jù)不確定的上下文環(huán)境,首先計(jì)算上下文環(huán)境的波動(dòng)系數(shù)和影響系數(shù),量化不同的上下文環(huán)境對(duì)用戶偏好的影響,在此基礎(chǔ)上引入社交網(wǎng)絡(luò)中用戶信任系數(shù),充分考慮用戶群體之間的相互影響,進(jìn)而將上下文因素和社會(huì)化網(wǎng)絡(luò)環(huán)境對(duì)推薦結(jié)果的影響進(jìn)行綜合平衡,最后產(chǎn)生最符合當(dāng)下環(huán)境需求的推薦結(jié)果集。
據(jù)此,HCCF算法可以分類兩個(gè)步驟,第一步主要是對(duì)上下文因素和社會(huì)化網(wǎng)絡(luò)環(huán)境進(jìn)行量化,評(píng)估上下文環(huán)境和其他相關(guān)用戶對(duì)推薦結(jié)果的影響,第二個(gè)步驟才是根據(jù)上下文環(huán)境以及社會(huì)化網(wǎng)絡(luò)用戶之間的信任關(guān)系產(chǎn)生推薦。因此,算法的描述如算法1所示。
算法1 Heuristic_Context_Collaborative_Filtering
輸入:目標(biāo)用戶Ua,上下文環(huán)境C,待評(píng)分項(xiàng)目Ij,調(diào)和參數(shù)α
輸出:用戶Ua對(duì)目標(biāo)項(xiàng)目Ij的評(píng)分Ra,j
第1步:根據(jù)上下文環(huán)境C計(jì)算上下文環(huán)境對(duì)用戶偏好的影響系數(shù)λn;
第2步:基于上下文環(huán)境計(jì)算用戶ua∈U和ub∈U的評(píng)分的相似性sim(ua,ub)con;
第3步:初始化用戶間的社交間接信任度tab;
第4步:融合上下文環(huán)境和用戶間間接信任度計(jì)算用戶相似性sim(ua,ub);
第5步:預(yù)測(cè)用戶評(píng)分Ra,j。
本節(jié)在考慮算法特性的基礎(chǔ)上設(shè)計(jì)了一系列的對(duì)比實(shí)驗(yàn),對(duì)本文所提出算法的效率和準(zhǔn)確性進(jìn)行驗(yàn)證。同時(shí)分析調(diào)和參數(shù)α在上下文和社會(huì)化網(wǎng)絡(luò)信任方面的平衡方面的影響。
3.1 實(shí)驗(yàn)數(shù)據(jù)集與基準(zhǔn)對(duì)比方法
本文實(shí)驗(yàn)中使用天貓商城提供的Rec-Tmall數(shù)據(jù)集。數(shù)據(jù)集中包含來自977萬個(gè)用戶對(duì)813萬個(gè)項(xiàng)目的13億條真實(shí)行為日志,以及735萬個(gè)用戶對(duì)507萬個(gè)項(xiàng)目的1 100萬條評(píng)論,可以據(jù)評(píng)論文字預(yù)測(cè)用戶對(duì)該項(xiàng)目的喜好程度。
首先根據(jù)用戶之間的好友關(guān)系和用戶間的溝通記錄構(gòu)建社會(huì)化網(wǎng)絡(luò),并計(jì)算用戶之間的直接信任度[20-21],在確定用戶的近鄰時(shí),本文選取k=6[22]。然后根據(jù)用戶的訪問記錄對(duì)用戶可能感興趣和不感興趣的項(xiàng)目進(jìn)行評(píng)分標(biāo)注,每個(gè)上下文實(shí)例下的評(píng)分均為1~5,其中1表示不喜歡,5表示喜歡。最終選取300萬個(gè)用戶對(duì)400萬個(gè)項(xiàng)目的6億條不包含上下文信息的用戶評(píng)分記錄和6.8億條上下文相關(guān)的用戶評(píng)分作為實(shí)驗(yàn)數(shù)據(jù)集,其中80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測(cè)試集。
為了對(duì)比本文所提出的算法的性能,實(shí)驗(yàn)中選取與上下文無關(guān)的基于用戶的協(xié)同過濾算法(UBCF)[23]和基于SVD的推薦方法[24]作為基準(zhǔn)與本文所提出的算法進(jìn)行對(duì)比,在控制社會(huì)話網(wǎng)絡(luò)因素的前提下驗(yàn)證上下文信息對(duì)推薦結(jié)果的影響。同時(shí)本文還選取了上下文過濾方法[25]來驗(yàn)證社會(huì)化網(wǎng)絡(luò)因素對(duì)推薦系統(tǒng)準(zhǔn)確率的影響。最后本文還對(duì)調(diào)和參數(shù)α對(duì)算法的影響進(jìn)行了分析。
3.2 實(shí)驗(yàn)結(jié)果分析
本文首先在相同的實(shí)驗(yàn)條件下驗(yàn)證本文所提出的HCCF算法與UBCF、上下文預(yù)過濾方法以及基于SVD的推薦方法在準(zhǔn)確性上的不同表現(xiàn)。由于本文實(shí)驗(yàn)中涉及的項(xiàng)目數(shù)量巨大,上下文信息豐富,因此本文選取P@N(Precision at N),即前N個(gè)推薦結(jié)果中相關(guān)查詢所占的比例,和平均準(zhǔn)確率MAP(Mean Average Precision)作為評(píng)價(jià)標(biāo)準(zhǔn)。同時(shí),在P@N中考慮到測(cè)試數(shù)據(jù)中每個(gè)用戶評(píng)價(jià)的物品數(shù)量較多,但實(shí)際需要推薦物品的數(shù)量較少,因此本文選取N=10,也就意味著當(dāng)用戶對(duì)項(xiàng)目的評(píng)分大于4時(shí),本文將服務(wù)看作是“喜歡的”項(xiàng)目。本文綜合考慮了上下文信息和社會(huì)化網(wǎng)絡(luò)因素對(duì)推薦結(jié)果的影響,在實(shí)驗(yàn)過程中本文首先設(shè)計(jì)實(shí)驗(yàn)對(duì)調(diào)和參數(shù)α的取值進(jìn)行評(píng)估,確保調(diào)和參數(shù)α的取值合理有效,同時(shí)也從側(cè)面平衡了上下文信息和社會(huì)化網(wǎng)絡(luò)因素的影響。
為了驗(yàn)證上下文環(huán)境和社會(huì)化網(wǎng)絡(luò)用戶信任度分別對(duì)HCCF算法的影響,本組實(shí)驗(yàn)中α的取值從0遞增到1,參數(shù)α對(duì)HCCF的影響如圖2所示。
參數(shù)α反映了HCCF算法中上下文因素和社會(huì)化信任距離對(duì)于算法相似度計(jì)算的影響。當(dāng)α=0時(shí)表示基于社會(huì)化網(wǎng)絡(luò)信任度的推薦方法,當(dāng)α=1時(shí)表示基于上下文評(píng)分相似度的推薦方法,從圖3中可知,當(dāng)α得取值為0.1~0.9時(shí)HCCF的性能相對(duì)于基于上下文信息的推薦方法以及基于社會(huì)化網(wǎng)絡(luò)因素的推薦方法要好,由此說明上下文信息和社會(huì)化網(wǎng)絡(luò)因素對(duì)推薦系統(tǒng)準(zhǔn)確率都有積極影響。從圖3可以看出,當(dāng)調(diào)和參數(shù)取值為0.5時(shí)(α=0.5)HCCF算法在P@10和MAP指標(biāo)上的性能達(dá)到最優(yōu)。這說明,本文提出的啟發(fā)式的上下文感知協(xié)同過濾算法同時(shí)引入社會(huì)化網(wǎng)絡(luò)信息和上下文信息,對(duì)于提高上下文感知協(xié)同過濾算法的性能具有明顯意義,并且同時(shí)考慮上下文因素和社會(huì)化網(wǎng)絡(luò)因素能夠最大程度上提高推薦系統(tǒng)的準(zhǔn)確性。圖3顯示,當(dāng)α=0時(shí)推薦系統(tǒng)在P@10和MAP兩個(gè)指標(biāo)下的表現(xiàn)均稍優(yōu)于α=1,這也從側(cè)面反映出基于上下文信息的推薦方法略優(yōu)于基于社會(huì)化網(wǎng)絡(luò)的推薦方法。
在后續(xù)實(shí)驗(yàn)中本文選取α=0.5,驗(yàn)證本文提出的算法和其他算法的性能。圖3展示了相同實(shí)驗(yàn)條件下四種算法P@10和MAP方面的表現(xiàn)。
從圖3中可以看出,當(dāng)α=0.5時(shí)本文所提出的HCCF算法在P@10和MAP兩個(gè)指標(biāo)上的表現(xiàn)均優(yōu)于其他三種對(duì)比算法。UBCF主要是從“用戶-物品”的角度進(jìn)行相似度計(jì)算并產(chǎn)生推薦,并沒有考慮上下文環(huán)境和社會(huì)化網(wǎng)絡(luò)環(huán)境中用戶之間的相互影響,因而在P@10和MAP兩個(gè)指標(biāo)上的表現(xiàn)均較差。此外,上下文預(yù)過濾方法充分考慮了上下文對(duì)用戶偏好的影響,基于SVD的推薦方法是一種基于模型的方法,在一定程度上照顧了用戶之間的相互影響。但是兩種算法在實(shí)驗(yàn)中的表現(xiàn)均不如本文提出的HCCF算法,說明上下文環(huán)境和社會(huì)化網(wǎng)絡(luò)用戶之間的信任關(guān)系均對(duì)推薦系統(tǒng)的準(zhǔn)確性有一定的影響。
對(duì)比分析上述兩組實(shí)驗(yàn),橫向?qū)Ρ让恳粋€(gè)實(shí)驗(yàn)可以發(fā)現(xiàn),在相同情況下本文提出的HCCF的推薦性能要優(yōu)于傳統(tǒng)的基于物品的推薦方法、基于SVD的方法以及普通的基于上下文的推薦方法。在綜合考慮上下文因素和社會(huì)化網(wǎng)絡(luò)因素方面,實(shí)驗(yàn)表明,綜合考慮兩種因素的推薦性能要優(yōu)于只考慮其中一種因素的性能,并且兩種因素的占比同等重要(α=0.5)。
目前,對(duì)于上下文感知推薦系統(tǒng)的研究主要集中于基于模型的推薦方法上,很少有研究人員同時(shí)考慮上下文信息和社會(huì)化網(wǎng)絡(luò)信息[24]。本文在總結(jié)已有研究的基礎(chǔ)上,提出了一種社會(huì)化網(wǎng)絡(luò)環(huán)境下上下文感知協(xié)同過濾方法HCCF,在考慮上下文信息的同時(shí)融合了社會(huì)化網(wǎng)絡(luò)分析方法。并在真實(shí)的數(shù)據(jù)集上展開實(shí)驗(yàn),驗(yàn)證了本文所提出的算法的性能。
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,社交網(wǎng)絡(luò)已經(jīng)深度融合到人們的生活中,基于社會(huì)化網(wǎng)絡(luò)的推薦方法已經(jīng)得到一些研究者的關(guān)注,本文僅僅考慮上下文信息和社會(huì)化網(wǎng)絡(luò)用戶信任度方面的融合,隨著云計(jì)算、大數(shù)據(jù)等計(jì)算技術(shù)的發(fā)展,未來還可以考慮從更高維度上的融合推薦方法。并且社會(huì)化網(wǎng)絡(luò)數(shù)據(jù)稀疏性也是影響推薦系統(tǒng)準(zhǔn)確性的一個(gè)重要因素,如何在考慮數(shù)據(jù)稀疏性的前提下,提高上下文感知推薦系統(tǒng)的準(zhǔn)確性也是未來的研究重點(diǎn)之一。
[1] Gleick J. Information overload[J]. New Scientist, 2011, 210(2806): 30-31.
[2] 王娜, 陳會(huì)敏.泛在網(wǎng)絡(luò)中信息過載危害及原因的調(diào)查分析[J]. 情報(bào)理論與實(shí)踐, 2014, 37(11), 20-25.
[3] 劉建國, 周濤, 汪秉宏.個(gè)性化推薦系統(tǒng)研究進(jìn)展[J]. 自然科學(xué)進(jìn)展, 2009, 19(1):1-15.
[4] Mason W, Vaughan J W, Wallach H. Computational social science and social computing [J]. Machine Learning, 2014, 95(3): 257-260.
[5] Golbeck J. Computing and applying trust in web-based social networks [D]. PhD thesis, University of Maryland College Park, 2005.
[6] Massa P, Avesani P. Trust-aware recommender systems[C]// ACM Conference on Recommender Systems. ACM, 2007:17-24.
[7] Guy I, Zwerdling N, Carmel D, et al. Personalized recommendation of social software items based on social relations[C]// ACM Conference on Recommender Systems, Recsys 2009, New York, Ny, Usa, October. DBLP, 2009:53-60.
[8] 孫圣力, 鄭志高, 王平, 等. RTDP系統(tǒng)網(wǎng)絡(luò)體系結(jié)構(gòu)及其關(guān)鍵技術(shù)[J].北京郵電大學(xué)學(xué)報(bào), 2014, 37(s1): 1-7.
[9] Ramaswamy L, Deepak P, Polavarapu R, et al. CAESAR: A Context-Aware, Social Recommender System for Low-End Mobile Devices[C]// MDM 2009, Tenth International Conference on Mobile Data Management, Taipei, Taiwan, 18-20 May. DBLP, 2009:338-347.
[10] 王立才, 孟祥武, 張玉潔. 移動(dòng)網(wǎng)絡(luò)服務(wù)中基于認(rèn)知心理學(xué)的用戶偏好提取方法[J].電子學(xué)報(bào), 2011, 39(11):2547-2553.
[11] Jung J J. Contextualized mobile recommendation service based on interactive social network discovered from mobile users[J]. Expert Systems with Applications, 2009, 36(9):11950-11956.
[12] Adomavicius G, Jannach D. Preface to the special issue on context-aware recommender systems[J]. User Modeling and User-Adapted Interaction, 2014, 24(1):1-5.
[13] 鄭志高, 劉京, 王平, 等. 時(shí)間加權(quán)不確定近鄰協(xié)同過濾算法[J].計(jì)算機(jī)科學(xué), 2014, 41(8):7-12.
[14] Hong J, Suh Eui-Ho, Kim J, et al. Context-aware system for proactive personalized service based on context history[J]. Expert Systems with Applications, 2009, 36(4): 7448-7457.
[15] Gaurav Arora, Ashish Kumar, Gitanjali Sanjay Devre, et al. Movie recommendation system based on users’ similarity[J]. International Journal of Computer Science and Mobile Computing, 2014, 3(4):765-770.
[16] Knijnenburg B P, Kobsa A. Making Decisions about Privacy: Information Disclosure in Context-Aware Recommender Systems[J]. Transactions on Interactive Intelligent Systems, 2013, 3(3):20.
[17] Braunhofer M, Codina V, Ricci F. Switching hybrid for cold-starting context-aware recommender systems[C]// The, ACM Conference. ACM, 2014:349-352.
[18] Gavalas D, Konstantopoulos C, Mastakas K, et al. Mobile recommender systems in tourism[J]. Journal of Network & Computer Applications, 2014, 39(1):319-333.
[19] Jamali M, Ester M. A matrix factorization technique with trust propagation for recommendation in social networks[C]// ACM Conference on Recommender Systems, Recsys 2010, Barcelona, Spain, September. DBLP, 2010:135-142.
[20] Eagle N, Pentland A, Lazer D. Infewing friendship network structure by using mobile phone data [J]. PNAS, 2009, 106(36): 15274-15278.
[21] Verbert K, Manouselis N, Ochoa X, et al. Context-Aware Recommender Systems for Learning: A Survey and Future Challenges[J]. IEEE Transactions on Learning Technologies, 2012, 5(4):318-335.
[22] Mullette S. Six degrees of separation [J]. Australian Insolvency Journal, 2013, 25(2): 10-15.
[23] Bell R M, Koren Y. Improved neighborhood-based collaborative filtering[C]// KDD cup and workshop at the 13th ACM SIGKDD international conference on knowledge discovery and data mining. 2007: 7-14.
[24] Polat H, Du W. SVD-based collaborative filtering with privacy [C]// Proceedings of the 2005 ACM symposium on Applied computing. ACM, 2005: 791-795.
[25] Adomavicius G, Sankaianarayanan R, Sen S, et al. Incorporating contextual information in recommender systems using a multidimensional approach [J]. ACM Transactions on Information Systems (TOIS), 2005, 23(1): 103-145.
[26] Adomavicius G, Kwon Y O. Optimization-Based Approaches for Maximizing Aggregate Recommendation Diversity[J]. Informs Journal on Computing, 2014, 26(2):351-369.
A CONTEXT-AWARE COLLABORATIVE FILTERING ALGORITHM IN SOCIAL NETWORKS
Wang Tao
(SchoolofScience,HubeiUniversityforNationalities,Enshi445000,Hubei,China)
A context-aware collaborative filtering method named HCCF based on social network environment is proposed, which focuses on the limitations of context-aware recommendation technology and social network recommendation technology. On the basis of fully considering the practical problems of the context-aware recommendation system, the influence of different dimensions of the context on the recommendation system is quantified, and the context influence coefficient is defined on this basis. And then introduces the interaction between different users in the social network environment, and uses the social network user trust degree to measure. Finally, a new similarity calculation method is proposed considering the context factor and the social network user trust. Theoretical analysis and experimental results on the real data set show that the proposed algorithm improves the accuracy and recommendation efficiency compared with the simple context-based system filtering algorithm and the social network recommendation method.
Context-aware recommendation system Social networks Recommendation system Context-aware
2016-05-10。“十二五”國家科技支撐計(jì)劃課題(2015BAK07B03);全國統(tǒng)計(jì)科學(xué)研究項(xiàng)目(2015LY43)。汪濤,副教授:主研領(lǐng)域:數(shù)據(jù)挖掘,大數(shù)據(jù),云計(jì)算和推薦系統(tǒng)。
TP3
A
10.3969/j.issn.1000-386x.2017.07.043