李濤
摘 要: 針對相似度特征點推薦方法對用戶個性化需求匹配度不高的問題,提出基于個性化特征的協(xié)同過濾推薦算法。以社會網絡為結構模型構建用戶信息的評分模型和項目屬性模型,采用信任度條件概率分析方法構建可靠性推薦模型,進行個性化特征分析和提取,實現個性化特征需求與項目興趣點的合理匹配,實現協(xié)同過濾推薦,最后通過仿真實驗進行測試分析。結果表明,采用該方法進行社會網絡項目協(xié)同過濾推薦的用戶評分高,平均絕對誤差和均方根誤差小,提升了推薦質量。
關鍵詞: 個性化特征; 協(xié)同過濾推薦; 評分模型; 項目屬性
中圖分類號: TN911?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)05?0078?04
Abstract: Since the recommendation method of the similarity feature point has low matching degree for the user′s persona?lized demand, a collaborative filtering recommendation algorithm based on personalized feature is put forward. The scoring model and project attribute model of the user information were constructed by taking the social network as the structure model. The trust degree conditional probability analysis method is adopted to construct the reliability recommendation mode. And then the personalized features are analyzed and extracted to match the personalized feature demand and project interest point reasonably, so as to implement the collaborative filtering recommendation. The test analysis was conducted with simulation experiments. The test results show that the method has high user scoring to perform the collaborative filtering recommendation of the social network project, the mean absolute error and root mean square error are small, and the recommendation quality is improved.
Keywords: personalized feature; collaborative filtering recommendation; scoring model; project attribute
0 引 言
社會網絡為網絡用戶提供了個性化的定制需求,通過社會網絡的個性化推薦系統(tǒng),根據用戶的興趣偏好進行項目推薦,構建用戶?項目的個性化推薦模型,在提高用戶網絡瀏覽的效率和滿意度方面具有重要意義[1]。另一方面,通過制定個性化協(xié)同過濾推薦模型,將提高網絡信息的推送度,提高網絡項目的收益,研究社會網絡的用戶協(xié)同過濾推薦模型具有重要意義[2]。
網絡的協(xié)同過濾推薦是以網絡用戶信任關系為基礎的。通過對網絡用戶先驗信息的瀏覽和評估,制定個性化需求,綜合考慮社會網絡結構和用戶需求,制定個性化服務項目實現信息推送和網頁推薦,為更高效率的網絡體驗奠定基礎[3]。當前,典型的協(xié)同過濾推薦方法主要有基于Twitt系統(tǒng)的推薦模型、TF?IDF關鍵詞權重衡量的協(xié)同過濾推薦模型和基于概率模型的協(xié)同過濾推薦模型[4?5],上述方法通過獲得用戶對評價較好的項目先驗關鍵詞信息,結合語義特征提取和關鍵詞檢索方法進行過濾推薦。根據用戶發(fā)布的tweet、好友、粉絲等信息進行數據篩選和信息控制,建立信息表結構模型,使得用戶獲得較為滿意的推薦效果,但是隨著網絡信息規(guī)模的增大和用戶信息的多元化發(fā)展,推薦的準確度低,而相似度特征點推薦方法對用戶的個性化需求匹配度低[6?7]。
為了克服傳統(tǒng)方法的不足,提出基于個性化特征的協(xié)同過濾推薦算法,并通過仿真實驗進行性能測試。
1 網絡結構推薦規(guī)則
社會網絡是一個由網絡中所有用戶信任關系構成的網絡,通過用戶之間的關系行為抽象到網絡的信任傳播機制中,考慮網絡節(jié)點的信任模型和置信度進行項目的屬性分類和主體匹配。根據多主體協(xié)商機制進行可信節(jié)點定位和網絡用戶的信任度分析[8],由此得到基于社會網絡的協(xié)同過濾推薦總體結構模型,如圖1所示。
根據對協(xié)同過濾推薦模型的總體設計,在社會網絡中將融合用戶信任與用戶興趣,構建網絡結構模型,進行用戶信息的特征檢索,將社會網絡中用戶的信任度關系模型用如下無向圖模型的形式表示為:
[G=V,E,C]
其中,[V]表示社會網絡協(xié)同過濾的節(jié)點集合,每個節(jié)點代表網絡中的用戶個體;[E]代表邊的集合,表示社交網絡好友推薦的相關性關系,在兩個個體之間存在的關聯(lián)性特征;[C={cuv}]表示邊的權重值,權重越大,信任度越高,推薦的準確度就越好。
假設社會網絡圖中的邊是有向的,網絡圖為有向圖。在協(xié)同過濾推薦系統(tǒng)中,設[{u1,u2,…,uN}]代表包含的元素節(jié)點用戶集合;[{v1,v2,…,vM}]代表不可信節(jié)點集合;[R=[Ru,v]N×M]表示用戶對項目的評分矩陣,其中[Ru,v]表示關聯(lián)規(guī)則約束下用戶[u]對項目[v]的屬性興趣度評價。[Ru,v]可以為任意實數,在社交網絡中,數據稀疏性決定用戶的評分,合理反應推薦模型的質量。因此,采用評分機制進行推薦模型的質量評價,不失一般性。本文將目標用戶的評分區(qū)間設定為[0,1]。利用用戶?項評分方法,得到每一個用戶[u]對項目的語義特征表達為[Nu,]用[cuv]表示網絡分布單元[u]對節(jié)點[v]的關聯(lián)匹配度,其取值范圍在[0,1]之間,0表示完成不匹配,1表示完成匹配。
根據上述設定的社會網絡信任度模型和推薦規(guī)則,得到協(xié)同過濾推薦中用戶信任度評價的特征概率函數密度表達式為:
利用特征向量檢索技術在互信任的特征空間中進行用戶的先驗特征信息檢索[9],在檢索區(qū)域中用戶興趣愛好的關鍵信息檢索向量模型為:
構建語義概念樹,分析在社會網絡中目標用戶對象和項目屬性集合之間的二元關系[10]。構建二元特征樹[K=(O,A,R)]描述協(xié)同過濾推薦的信息分布列表,其中O是用戶對象的集合;A是社會網絡中待推薦項目屬性的集合;R是O和A之間的一個二元關系,將協(xié)同過濾推薦預測評分的空間維數設定為[m,]通過評價用戶興趣的個性化特征,得到用戶[u]行為與喜好的關聯(lián)度為:
通過對行為與喜好的關聯(lián)度分析,將用戶的評分映射到[0,1]區(qū)間,構建推薦模型的用戶評分預測模型。
2 可靠性推薦模型構建
采用信任度條件概率分析方法進行可靠性推薦模型構建。任意兩個項目[X,Y]推薦給社會網絡用戶的信任度條件概率公式如下:
式中:[P(X),][P(Y)]分別是項目[X,Y]受到網絡推薦的綜合權重;[P(X?Y)]是聯(lián)合條件概率密度函數,表示項目[X,Y]所得到的準確評分在[0,1]區(qū)間的分布權重。
修正每個向量[vi,]所有項目預測評分過程用[vi]表示,即[vi=w1,t1,w2,t2,…,wm,tm;]計算社會網絡中每一個用戶個性化特征分布的中心向量[C(Y),]則[X,Y]的信任度計算公式為:
忽略網頁的鏈接結構信息,根據用戶先驗關鍵詞語義信息的差異化特征[w1,w2]進行信息檢索,檢索的有效值為[dis(w1,w2),]表示用戶[u]對用戶[v]的了解與信任程度。
建立的所有鄰居節(jié)點[v∈Nu,]可靠性推薦模型修正后的權值為:
[Rik=j∈NuC*i,jRjk] (8)
式中:[Rik]表示用戶[ui]對項目[vj]的直接信任度;[Rjk]表示用戶[uj]對項目[vk]的整體結構信息的興趣特征提取值;[C*i,j]是修正加權向量。則在社會網絡中用戶[u]對語義信息檢索的預測評分可表示為:
根據協(xié)同過濾系統(tǒng)的實際情況,結合用戶的行為特征和興趣分布構建推薦模型。
3 協(xié)同過濾算法的具體實現
3.1 個性化特征分析
基于個性化特征的協(xié)同過濾推薦算法的工作思想為:采用信任度條件概率分析方法進行可靠性推薦模型構建,以及個性化特征分析和提取,然后基于可信度的推薦約束模型,根據修正后的權值[C*kv]構建協(xié)同過濾推薦模糊分布矩陣[T,]因此對于推薦項目,信任度矩陣滿足:
由此實現個性化特征需求與項目興趣點的合理匹配,實現協(xié)同過濾推薦。
4 實驗結果分析
仿真實驗環(huán)境為Myeclipse 8.0,采用Java平臺進行算法設計,實驗數據來自Slashdot大型社會網絡網站,采用網絡爬蟲抓取方法進行數據抓取,抓取了社會網絡中包括了83 244個用戶與512 267條的用戶評論信息,作為網絡推薦的先驗規(guī)則信息集合,其他相關參數為:[Q=40,][c1=120,][c2=350,][cr=26,][μ1=μ2=0.131,ρ1=][ρ2=0.41,][δ=0.8]。
采用平均絕對誤差(MAE)和均方根誤差(RMSE)分析協(xié)同過濾推薦的質量好壞,兩個質量的定義描述為:
[MAE=i,jri,j-ri,jN] (19)
式中:[ri,j]表示目標用戶[i]對感興趣的項目[j]的實際評分;[ri,j]表示采用協(xié)同過濾推薦模型進行個性化特征分析后,項目的預測得分;[N]為網絡爬蟲的抓取次數。
RMSE表示協(xié)同過濾推薦的實際用戶評分觀測值與真值偏差的平方和:
[RMSE=i,jri,j-ri,j2N] (20)
根據上述仿真環(huán)境設定和質量評價指標的提出,進行推薦性能分析,其中評分的用戶數共分為6組,分別設定為:1~10人,11~20人,21~40人,41~80人,81~160人,大于160人,得到的評價結果如圖2和圖3所示。分析圖2得知,本文方法的MAE在各個評分用戶組中的值最小,說明個性化特征需求與項目興趣點匹配度最高。
圖3描述了不同方法進行協(xié)同過濾推薦的均方根誤差RMSE值對比結果,同樣可以得出,采用本文方法的RMSE值最低,說明用戶在本文方法下對推薦結果的評分最高,滿意度最好。
5 結 語
為了滿足用戶的個性化需求,提高網絡服務質量,本文提出基于個性化特征的協(xié)同過濾推薦算法。仿真實驗的結果表明,該方法的社會網絡項目協(xié)同過濾推薦的用戶評分高,平均絕對誤差和均方根誤差小,提升了推薦的質量,具有較好的應用前景。
參考文獻
[1] 張清豐,王晟,廖丹.基于納什議價的對等網絡資源分配[J].計算機應用,2015,35(9): 2424?2429.
[2] 胡欣如.基于數據挖掘技術的客戶關系管理系統(tǒng)設計與實現[J].微計算機信息,2009,25(12):58?62.
[3] 馮勇,李軍平,徐紅艷,等.基于社會網絡分析的協(xié)同推薦方法改進[J].計算機應用,2013,33(3):841?844.
[4] 李春,朱珍敏,高曉芳.基于鄰居決策的協(xié)同過濾推薦算法[J].計算機工程,2010,36(13):34?36.
[5] 羅辛,歐陽元新,熊璋.通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[J].計算機學報,2010,33(8):1437?1445.
[6] 陸興華,陳平華.基于定量遞歸聯(lián)合熵特征重構的緩沖區(qū)流量預測算法[J].計算機科學,2015,42(4):68?71.
[7] 李全忠,黃濟宇,等.基于MMSE準則的MIMO多中繼系統(tǒng)線性收發(fā)機設計[J].電子學報,2012,40(55):1323?1327.
[8] 熊忠陽,劉芹,張玉芳.結合項目分類和云模型的協(xié)同過濾推薦算法[J].計算機應用研究,2012,29(10):3660?3664.
[9] LIANG J J, QU B Y, MAO X B, et al. Differential evolution based on fitness Euclidean?distance ratio for multimodal optimization [J]. Neurocomputing, 2014, 137(8): 252?260.
[10] 周煜,張萬冰,杜發(fā)榮,等.散亂點云數據的曲率精簡算法[J].北京理工大學學報,2010,30(7):785?790.