唐瑞春, 類興振, 吳長昊, 許曉偉, 丁香乾
(中國海洋大學(xué)信息科學(xué)與工程學(xué)院,山東 青島 266100)
一種基于QoS歷史記錄的Web服務(wù)推薦算法?
唐瑞春, 類興振, 吳長昊, 許曉偉, 丁香乾
(中國海洋大學(xué)信息科學(xué)與工程學(xué)院,山東 青島 266100)
針對(duì)Web服務(wù)推薦時(shí)間和結(jié)果精確度方面存在的不足,本文提出一種基于QoS(Quality of Service)歷史記錄的Web服務(wù)推薦算法(Web Service Recommendation Algorithm based on Historical QoS,WSRAHQ)。首先,建立基于歐氏距離的Web網(wǎng)絡(luò)用戶興趣度相似簇,提高Web服務(wù)推薦的精確度;然后,根據(jù)用戶的QoS歷史記錄,利用多元線性回歸,得到新用戶的Web服務(wù)推薦結(jié)果,完成Web服務(wù)推薦。仿真結(jié)果表明了該方法有效性。
QoS歷史記錄;用戶興趣度;歐氏距離;多元線性回歸;Web服務(wù)推薦
云計(jì)算的發(fā)展和成熟,為Web服務(wù)提供了強(qiáng)大的計(jì)算能力,使得Web服務(wù)在電子商務(wù)、數(shù)字家庭等方面的應(yīng)用越來越廣泛。然而,越來越多的Web服務(wù)提供的功能相同或相似,這導(dǎo)致了用戶很難從海量數(shù)據(jù)中快速地選擇自己所需要的服務(wù)。因此,如何提高服務(wù)推薦質(zhì)量已成為相關(guān)領(lǐng)域的關(guān)鍵問題。
近年來,針對(duì)Web服務(wù)推薦過程中推薦精度不高以及時(shí)間復(fù)雜度過高的問題所開展的研究方興未艾。具有較高預(yù)測(cè)精度的服務(wù)推薦系統(tǒng),可以提升以體驗(yàn)為導(dǎo)向的產(chǎn)品應(yīng)用質(zhì)量,成為幫助消費(fèi)者進(jìn)行網(wǎng)上決策的有效途徑[1]。Wei C等[2]為給移動(dòng)設(shè)備尋找并推薦質(zhì)量高的服務(wù),提出了一個(gè)挖掘用戶信息的在線角色挖掘算法,并提出了移動(dòng)環(huán)境下的以問題為驅(qū)動(dòng)的上下文感知服務(wù)推薦框架。研究信息過載問題,Sui H F等[3]提出了基于用戶上下文本體驅(qū)動(dòng)的推薦策略,使用本體來描述和整合資源,將用戶的直接需求及其可能的偏好關(guān)聯(lián)起來作為推薦系統(tǒng)中上下文的目標(biāo)。文獻(xiàn)[4]將基于內(nèi)容推薦技術(shù)應(yīng)用在數(shù)字家庭環(huán)境中,提出了一種基于流行度預(yù)測(cè)的媒體推薦算法可向用戶推送新興趣點(diǎn)。盡管上述文獻(xiàn)為推薦系統(tǒng)提供了更加精確的預(yù)測(cè),然而沒有考慮到Web服務(wù)的分布和動(dòng)態(tài)變化等特性。I Bartolini等[5]和D Bianchini等[6]引入服務(wù)質(zhì)量QoS,進(jìn)一步提高服務(wù)推薦的精確度。
基于QoS的Web服務(wù)推薦可分為兩類:一類是把多QoS約束的服務(wù)選擇建模為有向無環(huán)圖最優(yōu)路徑問題,給出基于此模型的服務(wù)選擇算法[7];另一類通過建立QoS本體,利用本體的描述及推演能力提高服務(wù)匹配的精度[8]。上述方法的前提是假設(shè)服務(wù)的QoS靜態(tài)可知,然而大多數(shù)服務(wù)QoS的值是變化的,與服務(wù)運(yùn)行時(shí)的狀態(tài)密切聯(lián)系,推薦效果不是很理想。用戶通過使用一個(gè)Web服務(wù),能夠在真實(shí)的運(yùn)行環(huán)境中獲得其準(zhǔn)確的QoS歷史數(shù)據(jù),因此將用戶對(duì)服務(wù)的QoS歷史記錄引入到Web服務(wù)推薦中,能夠提高服務(wù)推薦的精確度[9-10]。
綜上所述,本文提出了可有效提高服務(wù)推薦精確度的服務(wù)推薦算法WSRAHQ。首先,將與網(wǎng)絡(luò)新用戶興趣度相似的用戶劃分為一個(gè)簇;然后,利用同一簇中用戶的QoS歷史記錄,確定對(duì)同一服務(wù)的各個(gè)QoS屬性值,將其作為自變量,對(duì)應(yīng)的服務(wù)質(zhì)量QoS值作為因變量,利用多元線性回歸求解出每個(gè)服務(wù)QoS屬性的權(quán)重預(yù)測(cè)值,進(jìn)而得到其QoS預(yù)測(cè)函數(shù),據(jù)此為新用戶推薦服務(wù)。
1.1 基于QoS的web服務(wù)推薦方法中的主要問題
服務(wù)質(zhì)量QoS描述了服務(wù)的非功能屬性,其中包括響應(yīng)時(shí)間、可用性、成功率、吞吐量等,反映了一個(gè)服務(wù)滿足用戶需求的能力,是Web服務(wù)性能評(píng)價(jià)的重要指標(biāo)。以往的QoS值是由服務(wù)提供商提供的一個(gè)假設(shè)常數(shù),沒有考慮到服務(wù)實(shí)際的執(zhí)行情況,參考性不高,為了得到真實(shí)的QoS值,服務(wù)的運(yùn)行情況應(yīng)進(jìn)行監(jiān)測(cè)、管理和查詢。由于存在大量的候選Web服務(wù),讓消費(fèi)者體驗(yàn)所有服務(wù)然后做出決定是不可行的,可以通過使用其他用戶的QoS歷史記錄來進(jìn)行服務(wù)推薦,而現(xiàn)有的服務(wù)推薦方法大多采用所有用戶的QoS歷史記錄來進(jìn)行Web服務(wù)推薦[11],這在現(xiàn)實(shí)中可行性不高。因?yàn)椋?/p>
(1)大量的QoS數(shù)據(jù)會(huì)導(dǎo)致服務(wù)推薦的時(shí)間復(fù)雜度過高,實(shí)時(shí)性不強(qiáng)。
(2)不同的用戶擁有不同的興趣,興趣的不同可能導(dǎo)致用戶不會(huì)去訪問一些服務(wù),但是這些服務(wù)可能恰好滿足用戶對(duì)QoS性能的要求,從而導(dǎo)致推薦的精確度下降。
針對(duì)上述問題,本文提出的WSRAHQ算法在利用QoS歷史記錄進(jìn)行Web服務(wù)推薦之前,根據(jù)興趣度對(duì)用戶進(jìn)行分簇,過濾掉與新用戶興趣度相差較大的用戶QoS歷史記錄,在提高Web服務(wù)推薦精確度的同時(shí),降低了推薦運(yùn)行時(shí)間。
圖1 基于QoS歷史記錄的Web服務(wù)推薦過程
1.2 研究環(huán)境
如圖1所示,在Web服務(wù)環(huán)境中,首先根據(jù)用戶興趣度,將興趣度相似的用戶分成一個(gè)簇。然后,將用戶的服務(wù)請(qǐng)求提交給Web服務(wù)分配中心的服務(wù)搜索模塊,由服務(wù)搜索模塊得到相應(yīng)的候選服務(wù)列表并提交給服務(wù)的QoS預(yù)測(cè)模塊,基于候選服務(wù)的QoS歷史信息建立QoS多元線性回歸預(yù)測(cè)模型,計(jì)算候選服務(wù)QoS預(yù)測(cè)值。最后基于QoS預(yù)測(cè)值進(jìn)行排序,根據(jù)QoS預(yù)測(cè)值由大到小的順序,將服務(wù)交由服務(wù)分配模塊完成服務(wù)的推薦。
2.1 用戶興趣度
Web服務(wù)中,不同網(wǎng)頁的內(nèi)容存在差異,用戶對(duì)不同網(wǎng)頁的內(nèi)容感興趣的程度也不一樣,通過對(duì)網(wǎng)頁內(nèi)容進(jìn)行提取I=(I(i1),I(i2),…,I(in)),與用戶提供的興趣I′=(I′(i1),I′(i2),…,I′(in))相比較可以定義用戶的興趣度。
定義1 用戶興趣度。 在Web服務(wù)中,用戶興趣度定義為用戶對(duì)多個(gè)網(wǎng)頁內(nèi)容感興趣的程度,用Ij(ik)表示,Ij(ik)∈[0,1],其中ik表示用戶j的第k個(gè)感興趣網(wǎng)頁內(nèi)容。興趣度是用來計(jì)算用戶相似性的重要指標(biāo),也是用戶分簇的重要依據(jù)。
2.2 用戶的QoS歷史記錄
用戶通過使用某一個(gè)Web服務(wù),能夠切實(shí)體驗(yàn)到其真實(shí)的QoS值,用戶的QoS歷史記錄是通過使用不同的Web服務(wù)獲得的,該值從用戶的角度給出了Web服務(wù)性能的評(píng)價(jià)結(jié)果。用S={S1,S2,...,Sn}表示一組Web服務(wù),選取k個(gè)QoS屬性來衡量每個(gè)Web服務(wù)的QoS性能;服務(wù)Si的QoS屬性集為Qi={qi1,qi2,...,qik},其中Si∈S,qik,表示服務(wù)Si的第k個(gè)QoS屬性(如:響應(yīng)時(shí)間,可用性和吞吐量等)。
2.3 QoS預(yù)測(cè)函數(shù)
越來越多的Web服務(wù)提供的功能相同或相似,導(dǎo)致了很難從海量數(shù)據(jù)中快速地選擇用戶所需要的服務(wù)。QoS作為Web服務(wù)性能的評(píng)價(jià)標(biāo)準(zhǔn),QoS的預(yù)測(cè)值在用戶選擇Web服務(wù)時(shí)可以提供有價(jià)值的信息。
本文采用多元線性回歸方法對(duì)QoS進(jìn)行預(yù)測(cè)有兩個(gè)原因,一是由于候選服務(wù)的QoS值在服務(wù)前是不可能獲得的,所以希望對(duì)候選服務(wù)的QoS進(jìn)行預(yù)測(cè),利用多元線性回歸可以達(dá)到這一目的;其二,多元線性回歸模型中的參數(shù)可以通過求解線性方程獲得,所以這類算法具有較低的時(shí)間復(fù)雜度和較強(qiáng)的可執(zhí)行性。
定義3 QoS預(yù)測(cè)函數(shù)。 對(duì)服務(wù)Si用同一簇內(nèi)其他用戶的QoS歷史記錄作為訓(xùn)練樣本,通過建立多元線性回歸模型得到其QoS性能預(yù)測(cè)函數(shù)。服務(wù)Si的QoS預(yù)測(cè)函數(shù)可表示為:
Qi=α0+θ1qi1+…+θkqik+ε,
ε~N(0,σ2),
(1)
其中:α0為常數(shù)項(xiàng),表示當(dāng)qi1,qi2,…,qik為0時(shí)服務(wù)Si的QoS總體平均值;θk是QoS屬性qik對(duì)應(yīng)的權(quán)重值,表示其他QoS屬性的值保持不變時(shí),qik變化一個(gè)單位,QoS加權(quán)變化的單位數(shù);ε是QoS真實(shí)值與按多元回歸方程預(yù)測(cè)值的差值,服從分布ε~N(0,σ2)。
3.1 用戶興趣度的求解
在Web訪問領(lǐng)域,獲得用戶興趣度的方法主要有兩種,一是用戶在訪問Web服務(wù)時(shí)主動(dòng)提供,二是通過用戶的操作信息來分析得到用戶興趣度。對(duì)于初次訪問Web服務(wù)的新用戶通過前者來得到用戶興趣度,而對(duì)于已有的用戶,通過公式化的度量方法將用戶的訪問行為轉(zhuǎn)化為用戶的興趣度。
設(shè)新用戶在訪問Web服務(wù)時(shí)提供的興趣度為I′=(I′(i1),I′(i2),…,I′(in));
設(shè)BW=[ω1,ω2,ω3,ω4,ω5]T表示用戶訪問Web服務(wù)的權(quán)重矩陣,其中ω1,ω2,ω3,ω4,ω5分別表示訪問時(shí)間、閱讀次數(shù)、回滾次數(shù)、閱讀時(shí)長、保存或復(fù)制操作權(quán)重。在用戶訪問頁面時(shí),用戶對(duì)頁面做的操作越多,文檔權(quán)重越高,意味著對(duì)該頁面越感興趣。
ωid表示已有用戶對(duì)所訪問頁面的偏好值,如公式(2)所示:
(2)
其中:V={v1,v2,v3,v4,v5}為訪問事務(wù)集合,v1,v2,v3,v4,v5分別為閱讀次數(shù)、閱讀時(shí)長、回滾次數(shù)、閱讀頻次、是否執(zhí)行復(fù)制或保存操作;P={p1,p2,p3,p4,p5}為頁面信息,p1,p2,p3,p4,p5分別為參考閱讀次數(shù)、參考閱讀時(shí)長、參考回滾次數(shù)、參考閱讀頻次,頁面操作參考信息,p5=1表示對(duì)頁面執(zhí)行了復(fù)制或保存操作。
公式(2)可推出:
(3)
用戶對(duì)頁面的偏好會(huì)隨時(shí)間產(chǎn)生遺忘,為了使用戶偏好更準(zhǔn)確,我們需要對(duì)用戶偏好進(jìn)行調(diào)整與更新。德國心理學(xué)家艾賓浩斯(Ebbinghaus)首先對(duì)遺忘現(xiàn)象作了系統(tǒng)的研究,得到的遺忘規(guī)律表明遺忘過程是先快后慢,是非線性的。研究表明漸進(jìn)遺忘法能較好地?cái)M合遺忘曲線[12]。為了更好地對(duì)用戶偏好進(jìn)行建模提高用戶偏好的準(zhǔn)確性。本文引入的漸進(jìn)遺忘函數(shù)[13]h(t)如公式(4)所示:
(4)
公式(4)中,tmin,tmax分別為遺忘的最小間隔時(shí)間和最大間隔時(shí)間;γ表示遺忘系數(shù),即遺忘的快慢,γ∈[0,1],當(dāng)γ=0時(shí),沒有發(fā)生遺忘,當(dāng)γ=1時(shí),完全非線性遺忘。
interest(j,p)為經(jīng)過漸進(jìn)遺忘法更正后的用戶j對(duì)頁面p的興趣值,計(jì)算方法如公式(5)所示:
(5)
把內(nèi)容相似的頁面歸結(jié)為用戶的同一興趣,用戶對(duì)某一興趣的興趣度如公式(6)所示,本文用T(ik)表示同一興趣內(nèi)容ik的頁面的集合,|T(ik)|為用戶感興趣的內(nèi)容ik的頁面數(shù)量。
(6)
Ij(ik)即為用戶j對(duì)ik的興趣度,通過公式(6)計(jì)算產(chǎn)生的第j個(gè)用戶興趣度矩陣為[Ij(i1)Ij(i2)…Ij(ik)]T。
3.2 基于用戶興趣度的Web服務(wù)用戶分簇
在求解出用戶興趣度的基礎(chǔ)上,對(duì)用戶進(jìn)行分簇。由于分到同一簇內(nèi)的用戶興趣度相近,其要訪問的Web服務(wù)也會(huì)相似,因而可以通過同一簇內(nèi)的用戶QoS歷史記錄對(duì)新用戶進(jìn)行Web服務(wù)推薦。而用戶分簇的精確度會(huì)影響后續(xù)服務(wù)推薦的精確度,因此采用較好的分簇算法非常重要。本文首先利用了Matlab軟件對(duì)比分析了機(jī)器學(xué)習(xí)中幾個(gè)計(jì)算用戶相似性的方法,有歐氏距離(Euclidean)、曼哈頓距離(Manhattan)和切比雪夫距離(Chebyshev),仿真采用用戶的興趣度作為輸入,其仿真比較結(jié)果如圖2所示。
圖2 用戶分簇算法比較
圖2說明了歐氏距離在對(duì)用戶分簇時(shí)相對(duì)其他兩種方法,用戶相似性精確度更高。
利用歐氏距離公式分別計(jì)算新用戶與用戶Uj之間的距離dj,公式如下所示:
(7)
利用公式(7)得到m維向量D=(d1,d2,…,dm),其中,dj(j∈[1,m])表示新用戶與已有用戶之間的歐氏距離。
通過給定的分類閾值T,將興趣度相似的用戶劃分為一個(gè)簇類,即對(duì)?dj≤T,都有Uj∈R,R表示與新用戶興趣度相似的用戶組成的簇類。其中分類閾值T定義為歐氏距離的平均值,保證了簇類中的用戶興趣度與新用戶更相似:
3.3 基于用戶QoS歷史記錄的Web服務(wù)推薦
本文利用QoS預(yù)測(cè)函數(shù)為新用戶推薦QoS值高的服務(wù),而預(yù)測(cè)函數(shù)性能的好壞取決于QoS屬性權(quán)重θ。由于QoS預(yù)測(cè)函數(shù)中θ是未知的,所以推薦的關(guān)鍵就是利用同一簇內(nèi)其它用戶的QoS歷史記錄得到最佳的θ,使得QoS預(yù)測(cè)函數(shù)的預(yù)測(cè)輸出值和真實(shí)值之間的差異最小化。
對(duì)服務(wù)Si,其QoS值的歷史記錄為yi,yi受到k個(gè)QoS屬性值qi1,qi2,...,qik和隨機(jī)因素ε的影響。Web服務(wù)推薦的多元線性回歸數(shù)學(xué)模型為:
yi=θ1qi1+…+θk-1qik-1+θkqik+ε,
ε~N(0,σ2)。
(8)
(9)
公式(9)可表示為:
Yi=θq+εε~N(0,σ2)。
(1)初始化θ的值(例如,令θ=0)。
(2)重復(fù)執(zhí)行如下公式更新θ的值。
(10)
其中:α表示學(xué)習(xí)速率,用于調(diào)節(jié)θ的收斂速度。由于
因此,公式(10)可表示為:
(11)
又由于和新用戶在同一簇內(nèi),且對(duì)服務(wù)Si有QoS歷史記錄的用戶有x個(gè),因此公式(11)可表示為:
(12)
把通過BGD算法求出的θ帶入到公式(1)QoS預(yù)測(cè)函數(shù)中,這時(shí)每個(gè)服務(wù)Si的QoS預(yù)測(cè)函數(shù)其QoS性能預(yù)測(cè)值和真實(shí)值之間的差異是最小的。然后把新用戶對(duì)服務(wù)的QoS屬性要求帶入到各個(gè)服務(wù)的QoS預(yù)測(cè)函數(shù)中,即可得到各個(gè)服務(wù)的QoS性能預(yù)測(cè)值,然后按QoS性能預(yù)測(cè)值由高到低的順序?qū)⒎?wù)推薦給新用戶。
3.4 基于QoS歷史記錄的Web服務(wù)推薦算法
WSRAHQ算法如下:輸入:用戶Uj對(duì)某一Web服務(wù)Si的QoS歷史記錄Qji,新用戶對(duì)該Web服務(wù)的QoS屬性要求值,已有用戶的興趣度集Ij(ik),新用戶興趣度集合I′。輸出:針對(duì)新用戶的QoS性能預(yù)測(cè)值從高到低的Web服務(wù)集合S。初始化:m個(gè)用戶,每個(gè)用戶有n個(gè)興趣內(nèi)容;分類閾值T=0,學(xué)習(xí)速率α=0.5,權(quán)重θ=0。S1:for(j=1;j≤m;j++) //對(duì)m個(gè)已有用戶執(zhí)行循環(huán){ 根據(jù)公式(6)計(jì)算用戶Uj的興趣度; 根據(jù)公式(7)計(jì)算新用戶與用戶Uj之間的歐氏距離dj;}T=1m∑mj=1dj; //分簇閾值為歐氏距離的平均值S2:for(i=1;i≤n;i++){ for(j=1;j≤m;j++) //對(duì)每個(gè)服務(wù)Si計(jì)算其QoS屬性權(quán)重θ{ if(dj≤T){ 將用戶Uj對(duì)服務(wù)Si的QoS歷史記錄Qji代入到公式(9)中,作為訓(xùn)練樣本;}else;}根據(jù)公式(12)來不斷更新權(quán)重θ,直到收斂;將求出的θ代入公式(1),并結(jié)合新用戶對(duì)服務(wù)QoS屬性的要求,得到服務(wù)Si的QoS預(yù)測(cè)值;}S3:將S2得到的QoS預(yù)測(cè)值從大到小排序,得到推薦給新用戶的服務(wù)集S。
本文采用VS 2010作為仿真環(huán)境,利用模擬網(wǎng)絡(luò)中用戶興趣度和用戶的QoS歷史記錄作為輸入,評(píng)估WSRAHQ算法在提高Web服務(wù)推薦精確度和降低時(shí)間復(fù)雜度方面的性能。
4.1 仿真參數(shù)設(shè)置
仿真中的用戶數(shù)量m由20增至100,每次增加10個(gè)用戶來更新網(wǎng)絡(luò)。其中,設(shè)置用戶興趣類型數(shù)量為5,其興趣度由系統(tǒng)在0-1范圍內(nèi)隨機(jī)生成;QoS屬性數(shù)量設(shè)置為5,分別是響應(yīng)時(shí)間、可用性、吞吐量、成功率和成功調(diào)用次數(shù),用戶的QoS歷史記錄來自Eyhab AI-Masri的QWS數(shù)據(jù)集[13-14],Eyhab AI-Masri的QWS數(shù)據(jù)集是一個(gè)公開的Quality of Web Service(QWS)數(shù)據(jù)集。提供了365個(gè)網(wǎng)絡(luò)上真實(shí)的web服務(wù),每一個(gè)web服務(wù)對(duì)應(yīng)著9個(gè)QWS屬性,這些web服務(wù)質(zhì)量屬性已經(jīng)經(jīng)過了測(cè)試。在仿真實(shí)驗(yàn)中,選取了其中的10個(gè)服務(wù),并且假設(shè)服務(wù)S5,S6,S7,S8,S9提供用戶感興趣的相似的功能,通過改變用戶數(shù)量對(duì)比分析不同算法的性能。
4.2 WSRAHQ算法性能分析
從兩個(gè)方面來評(píng)價(jià)WSRAHQ算法性能,首先是Web服務(wù)推薦的精確度對(duì)比分析,然后是Web服務(wù)推薦的運(yùn)行時(shí)間對(duì)比分析。
4.2.1 服務(wù)推薦精確度對(duì)比分析 將WSRAHQ算法與ANQP算法[10]、QPA算法[16]進(jìn)行了對(duì)比,由于服務(wù)S5,S6,S7,S8,S9提供的是用戶感興趣的服務(wù),所以對(duì)于不同算法在相同用戶數(shù)量情況下,S5,S6,S7,S8,S9推薦順序更靠前的算法精確度更高。從服務(wù)推薦順序表1、表2、表3可以發(fā)現(xiàn)利用本文提出的WSRAHQ算法進(jìn)行Web服務(wù)推薦時(shí),用戶感興趣的服務(wù)S5,S6,S7,S8,S9其推薦順序更靠前。在用戶數(shù)量為60的時(shí)候,WSRAHQ算法和ANQP算法精確度相近,要比QPA算法好,而其他情況下,WSRAHQ算法的精確度明顯高于另外兩種算法。
產(chǎn)生這種結(jié)果的原因是WSRAHQ算法首先將用戶根據(jù)其興趣度進(jìn)行分簇,然后利用同一簇內(nèi)的用戶為Web網(wǎng)絡(luò)新用戶推薦Web服務(wù),由于其感興趣的服務(wù)相似,因此推薦的結(jié)果中Web網(wǎng)絡(luò)新用戶想要訪問的服務(wù)順序更靠前。而ANQP算法是用全部用戶的QoS歷史記錄進(jìn)行服務(wù)推薦,其推薦的服務(wù)順序靠前的不一定是新用戶感興趣的服務(wù);QPA算法雖然也對(duì)用戶進(jìn)行了分簇,但是根據(jù)用戶的位置來劃分的,分簇的效果準(zhǔn)確性不高導(dǎo)致了其服務(wù)推薦結(jié)果有失準(zhǔn)確性。
表2 ANQP算法Web服務(wù)推薦結(jié)果
4.2.2 服務(wù)推薦運(yùn)行時(shí)間對(duì)比分析 能夠在較短的時(shí)間內(nèi)給用戶推薦QoS性能更好的Web服務(wù)是一個(gè)很重要的問題。我們對(duì)比分析了WSRAHQ算法、ANQP算法以及QPA算法的服務(wù)推薦運(yùn)行時(shí)間。運(yùn)行時(shí)間對(duì)比分析如圖3所示:
表3 QPA算法Web服務(wù)推薦結(jié)果
圖3說明隨著用戶數(shù)量的不斷增加,ANQP算法的運(yùn)行時(shí)間增長的比較快;用戶數(shù)量小于60時(shí),QPA算法與WSRAHQ算法的運(yùn)行時(shí)間相差無幾,但在用戶數(shù)量超過60以后QPA算法運(yùn)行時(shí)間相對(duì)WSRAHQ算法有了明顯的增長,而本文提出的WSRAHQ算法隨用戶數(shù)量的增多,其運(yùn)行時(shí)間增長平緩。
圖3 Web服務(wù)推薦運(yùn)行時(shí)間對(duì)比圖
以上仿真結(jié)果表明,本文提出的WSRAHQ算法在提高Web服務(wù)推薦精確度的同時(shí)降低了推薦運(yùn)行時(shí)間。
本文研究在Web網(wǎng)絡(luò)環(huán)境中進(jìn)行Web服務(wù)推薦時(shí)如何提高服務(wù)推薦的精確度和降低服務(wù)推薦運(yùn)行時(shí)間的問題,提出一種基于QoS歷史記錄的Web服務(wù)推薦算法。利用基于用戶興趣度的歐氏距離將用戶進(jìn)行分簇,然后利用同一簇類內(nèi)已有用戶對(duì)服務(wù)的QoS歷史記錄,通過多元線性回歸為新加入簇類的用戶推薦Web服務(wù),實(shí)驗(yàn)結(jié)果表明該方法的有效性。
[1] ZHANG Y S, ZHANG B, SUN R N. Service execution environment oriented service selection approach[J]. Journal of Chinese Computer Systems, 2014, 35(1): 1-5.
[2] WEI C, KHOURY R, FONG S. Web 2. 0 recommendation service by multi-collaborative filtering trust network algorithm[J]. Information Systems Frontiers, 2013, 15(4): 533-551.
[3] SUN H F, ZHENG Z B, CHEN J L, et al. Personalized web service recommendation via normal recovery collaborative filtering[J]. IEEE Transactions on Services Computing, 2013, 6(4): 573-579.
[4] Feng Y Q, Tang R C, Zhai Y L, et al. Personalized media recommendation algorithm based on smart home[C].//Kuala Lumpur, Malaysia: The Second International Conference on e-Technologies and Networks for Development, 2013: 63-67.
[5] BARTOLINI I, CIACCIA P, PATELLA M. Efficient sort-based skyline evaluation[J]. ACM Transactions on Database Systems. 2008, 33(4): 1-49.
[6] BIANCHINI D, ANTONELLIS·V D, MELCHIORI M. Flexible semantic-based service matchmaking and discovery[J]. World Wide Web, 2008, 11(2): 227-251.
[7] ZENG L Z, BENATALLAH B, NGU A, et al. QoS-aware middleware for web services composition[J]. IEEE Transactions on Software Engineering, 2004, 30(5): 311-327.
[8] PAPAIOANNOU I V, TSESMETZIS D T, ROUSSAKI I G, et al. A QoS ontology language for web-services[C].//Vienna, Austria: 20th International Conference on Advanced Information Networking and Applications(AINA), 2006: 1-6.
[9] Lin W M, Dou W C, Luo X F, et al. A history record-based service optimization method for QoS-aware service composition[C].//Washington, USA: 2011 IEEE International Conference on Web Services (ICWS), 2011: 666-673.
[10] SHI Y L, ZHANG K, LIU B, et al. A novel QoS predication approach based on regression algorithm[C].//Huhehot, China: Web Information Systems and Applications Conference (WISA), 2010: 208-211.
[11] Jula A, Sundararajan E, Othman Z. Cloud computing service composition: A systematic literature review[J]. Expert Systems with Applications, 2014, 41(8): 3809-3824.
[12] HU S G, LIU Y, CHEN T P, et al. Emulating the ebbinghaus forgetting curve of the human brain with a NiO-based memristor[J]. Applied Physics Letters, 2013, 103(13): 1-4.
[13] 鄭先榮, 湯澤瀅, 曹先彬. 適應(yīng)用戶興趣變化的非線性逐步遺忘協(xié)同過濾算法[J]. 計(jì)算機(jī)輔助工程, 2007, 16(2): 69-73. ZHENG Xianrong, TANG Zeying, CAO Xianbin. Non—lineal gradual forgetting collaborative filtering algorithm capable of adapting to users’ drifting interest[J]. Computer Aided Engineering, 2007, 16(2): 69-73.
[14] Al-MASRI E, MAHMOUD Q H. Discovering the best web Service[C].//Alberta, Canada: Proceedings of the 16th International Conference on World Wide Web, 2007: 1257-1258.
[15] Al-MASRI E, MAHMOUD QH. Qos-based discovery and ranking of web services[C].//Hawaii, USA:16th International Conference on Computer Communications and Networks, 2007: 529-534.
[16] SHI Y L, ZHANG K, LIU B. A new QoS prediction approach based on user clustering and regression algorithms[C].//Washington, USA: IEEE International Conference on Web Services, 2011: 726-727.
Abstract: Aiming at the accuracy problem of Web service recommend time and result, a Web Service Recommendation Algorithm based on the Historical QoS record(WSRAHQ)is proposed in this paper. First, based on the Euclidean distance, the similar cluster of Web network users' interest degree is built to improve the accuracy of Web service recommendation. Then, the new user's Web service recommend result is given to finish the Web service recommendation based on the users' QoS Historical record and multiple linear regression. The simulation results show its efficiency.
Key words: QoS historical record;users’ interest degree;Euclidean distance;multiple linear regression;Web service recommendation.
責(zé)任編輯 陳呈超
The Recommendation Algorithm of Web Services Based on QoS Historical Record
TANG Rui-Chun, LEI Xing-Zhen, WU Chang-Hao, XU Xiao-Wei, DING Xiang-Qian
(College of Information Science and Engineering, Ocean University of China, Qingdao 266100,China)
國家科技支撐計(jì)劃項(xiàng)目(2015BAF28B01)資助 Supported by National Science and Technology Support Program Project (2015BAF28B01)
2015-06-16;
2016-04-17
唐瑞春(1968-),女,教授。E-mail:tangruichun@ouc.edu.cn
TP37
A
1672-5174(2017)09-134-07
10.16441/j.cnki.hdxb.20150217
唐瑞春, 類興振, 吳長昊, 等. 一種基于QoS歷史記錄的Web服務(wù)推薦算法[J]. 中國海洋大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017, 47(9): 134-140.
TANG Rui-Chun, LEI Xing-Zhen, WU Chang-Hao, et al. The recommendation algorithm of Web services based on QoS historical record[J]. Periodical of Ocean University of China, 2017, 47(9): 134-140.