王棒鈞
關(guān)鍵詞:知識圖譜;Web服務(wù)推薦技術(shù);物品協(xié)同推薦;GN計算方法
知識圖譜下的Web服務(wù)推薦技術(shù)實質(zhì)上是為了能夠快速、有效地解決網(wǎng)頁問題而出現(xiàn),其核心思想是通過特殊技術(shù),將用戶與物品之間建立的聯(lián)系進行深入挖掘,從而獲取有效信息,以實現(xiàn)用戶畫像的準(zhǔn)確描述,并將其感興趣的信息和數(shù)據(jù)有效推送,以此滿足用戶的使用需求[1]。
1概述
1.1知識圖譜
知識圖譜基礎(chǔ)概論是由互聯(lián)網(wǎng)公司提出來的,其主要的目的和功能是優(yōu)化搜索引擎,以關(guān)系數(shù)據(jù)知識庫為基礎(chǔ),對數(shù)據(jù)進行標(biāo)準(zhǔn)化、確定性的關(guān)聯(lián)與檢索,從而提升搜索服務(wù)質(zhì)量,提高平臺探索結(jié)果關(guān)聯(lián)性、可解釋性。為了豐富知識圖譜關(guān)聯(lián)探索結(jié)構(gòu),技術(shù)人員要進行全面分析,合理利用知識圖譜,結(jié)合知識圖譜實體之間的關(guān)聯(lián),將搜索內(nèi)容作為真實實體結(jié)構(gòu),構(gòu)建一個完整、真實的知識系統(tǒng)性組織。
在知識圖譜中,“反映現(xiàn)實世界的概念或者是具體事物的形式”一般是通過節(jié)點數(shù)據(jù)形式,即將知識、信息建立成一個實體結(jié)構(gòu)。在知識庫的基礎(chǔ)上,將不同種類的知識系統(tǒng)進行完善,從而形成知識圖譜。并且,為了反映實體間的關(guān)聯(lián),需要進行結(jié)構(gòu)標(biāo)識,將實體結(jié)構(gòu)、關(guān)系等組合形成知識圖譜中的基礎(chǔ)單位,確保實體與實體之間相關(guān)屬性,豐富了知識圖譜節(jié)點內(nèi)容。比如,當(dāng)用戶在平臺結(jié)構(gòu)上關(guān)注了B平臺,就可以利用組合平臺組合標(biāo)識-A關(guān)注為B。由于此知識圖譜通過組合形式針對現(xiàn)實世界實體以及內(nèi)部關(guān)系進行結(jié)構(gòu)標(biāo)識,所以就本質(zhì)上而言,知識圖譜是結(jié)構(gòu)化語義知識庫。
1.2Web服務(wù)推薦
Web服務(wù)推薦在實施過程中,其目的是有效解決用戶服務(wù)的現(xiàn)實問題,使其成為服務(wù)計算機領(lǐng)域研究的重點內(nèi)容,而現(xiàn)代Web服務(wù)推薦發(fā)展中,知識圖譜的引進與應(yīng)用就有著重要意義。同時,在Web服務(wù)推薦的過程中,借助服務(wù)注冊治理平臺可以獲取服務(wù)詳細信息、用戶詳細信息以及用戶調(diào)查等相關(guān)數(shù)據(jù),從而結(jié)合數(shù)據(jù)特點以及模型自身重點建立有關(guān)推薦模型,進而有效提升用戶服務(wù)質(zhì)量。當(dāng)前,在Web服務(wù)推薦技術(shù)產(chǎn)業(yè)發(fā)展中,其系統(tǒng)需要使用專業(yè)技術(shù)在用戶協(xié)同推薦、物品協(xié)同推薦的基礎(chǔ)上為用戶提供準(zhǔn)確服務(wù)。
1.2.1用戶協(xié)同推薦
用戶協(xié)同推薦就是在用戶協(xié)同推薦規(guī)律和原則下,首先找到相近偏好的鄰居,利用目標(biāo)用戶鄰居對物品的評價進行全面預(yù)測,隨后根據(jù)預(yù)測評分的實際順序進行推送,并建立用于協(xié)同過濾推薦用戶行為表,為后續(xù)的用戶服務(wù)提供數(shù)據(jù)參考。
1.2.2物品協(xié)同推薦
物品協(xié)同推薦是以物品協(xié)同過濾為重點,對物品的相似性進行詳細分析,物品協(xié)同過濾計算方式同樣需要依靠用戶行為表格,通過用戶基礎(chǔ)行為表格,詳細計算出物品之間的相似度,隨后根據(jù)服務(wù)評分開展信息預(yù)測,以此為用戶提供針對性的推薦服務(wù)。
2基于知識圖譜視域的Web服務(wù)推薦技術(shù)的算法架構(gòu)
2.1圖聚類算法
圖聚類算法是一種將數(shù)據(jù)與信息以分組形式進行的計算方式。其計算原理是將一個初始數(shù)據(jù)結(jié)合之后進行連續(xù)分類,最后得到不同子集,確保相同子集中不同元素之間具有較高相似度,在對知識圖譜結(jié)構(gòu)進行區(qū)域劃分后的實際計算中,需要采用的計算方法包含GN計算法、標(biāo)簽傳播計算法以及Fastunfolding計算法[2]。因此,圖聚類算法從本質(zhì)上來看是系統(tǒng)結(jié)構(gòu)具有緊密節(jié)點的聚合類計算方法。
2.1.1CN計算法
CN計算法作為典型的分裂結(jié)構(gòu)計算模式,在實施環(huán)節(jié)上需要根據(jù)社區(qū)內(nèi)部高聚合以及不同社區(qū)之間的低聚合特點進行綜合分析,由于該計算方法能夠有效去除連接不同社區(qū)的邊緣線,使不同社區(qū)之間更加聚合,所以該計算方法針對邊緣判斷主要通過邊緣所產(chǎn)生介質(zhì)數(shù)量完成。
利用CN計算法開展信息計算時,邊緣介質(zhì)數(shù)是一個固定參數(shù),主要為節(jié)點兩邊最短距離所需要經(jīng)過頻率次數(shù),所以如果兩個社區(qū)需要通過某一條邊緣結(jié)構(gòu)進行相互連接,則兩個社區(qū)之間的節(jié)點最短路線通過邊緣次數(shù)和頻率會不斷增加。因此,在實際開展信息和參數(shù)計算時,應(yīng)根據(jù)邊緣介數(shù)的核心定義,確保經(jīng)過此邊緣參數(shù)更大,CN計算法就是以這種計算原理,對刪除邊緣參數(shù)不斷重復(fù)操作,直至社區(qū)滿足劃分需求。
2.1.2標(biāo)簽傳播計算法
標(biāo)簽傳播計算法從本質(zhì)上來看是一種典型從下至上的社區(qū)分類計算方法,標(biāo)簽傳播計算方法的分類核心思想則是節(jié)點標(biāo)簽標(biāo)注,直接取決于相鄰節(jié)點的數(shù)據(jù)標(biāo)簽,所以利用此計算法時,需針對每個節(jié)點統(tǒng)計當(dāng)下節(jié)點所有連接屬性標(biāo)簽,將具備節(jié)點數(shù)量最多的標(biāo)簽賦予當(dāng)下節(jié)點,利用標(biāo)簽傳播計算法,首先需要為每一個節(jié)點建立初始化的標(biāo)簽;其次,實現(xiàn)傳播。并且,在每一次的更新迭代中傳播思想,并不斷發(fā)展,最終使得在標(biāo)簽不斷傳播過程中,將一些具備共同社區(qū)的標(biāo)簽階段劃分在相同社區(qū)環(huán)境中。
2.1.3Fast unfolding計算法
關(guān)于使用圖聚類算法,無論是分裂型CN計算法,還是凝聚性標(biāo)簽傳播計算法,都沒有一個量化的指標(biāo)針對社區(qū)劃分質(zhì)量開展優(yōu)化與衡量。換言之,社區(qū)無論是運算到什么程度都會被認定為最佳結(jié)果。比如,以CN計算法作為實際案例,通過從上至下的社會分裂開展劃分,其分裂終止條件無法開展最優(yōu)化的項目設(shè)定,所以社區(qū)劃分質(zhì)量需要根據(jù)基礎(chǔ)條件設(shè)定出不同類型的較大波動。
使用標(biāo)簽傳播計算法時,更新迭代次數(shù)與頻率同樣無法被有效設(shè)定,由于圖譜存在異常節(jié)點數(shù)據(jù)時會出現(xiàn)標(biāo)簽震動等情況,無法得到高質(zhì)量、高水平的社區(qū)劃分,所以模塊化概念被廣泛使用。
Fast unfolding計算法主要通過模塊進行社區(qū)劃分,判斷出社區(qū)發(fā)現(xiàn)計算方法,一般來說,將模塊化最大程度社區(qū)劃分作為最優(yōu)的區(qū)域。Fast unfolding計算法在實施過程中,首先將社區(qū)內(nèi)每個節(jié)點初始化不同社區(qū)管理區(qū)域中,對每個節(jié)點開展詳細劃分,將計算階段與相鄰節(jié)點劃分至相同社區(qū)環(huán)境中,以此作為基礎(chǔ)條件。計算劃分之后的模塊與沒劃分的模塊數(shù)據(jù),如果兩者之間差值為正值,則表示模塊增加,如果差值為負值,則視為錯誤參數(shù)需要放棄。Fastunfolding計算法如圖1所示。
2.2基于知識圖譜的算法框架
從本質(zhì)上來看,知識圖譜計算方式框架制定是對專業(yè)知識的抽象管理,所以框架主要使用本體知識模型建立方式,將本體概念建立在數(shù)據(jù)結(jié)構(gòu)層上,其中知識圖譜的本體結(jié)構(gòu)是知識庫的概念模板,通過本體數(shù)據(jù)所形成的知識庫,不僅自身結(jié)構(gòu)層次劃分清晰,并且所產(chǎn)生的數(shù)據(jù)與信息冗余度較小。計算方式框架向量圖如圖2所示。
綜上可知,本體所描述的語言作為知識圖譜的算法框架基礎(chǔ)語言模式,是框架語言的一種寬泛表示,讓用戶為框架編寫清晰、表面化的概念描述。針對此現(xiàn)狀,本體語言通常具有語言清晰、含義清晰以及便利性優(yōu)勢和特點,能夠按照標(biāo)記語法進行種類劃分。
3Web服務(wù)知識圖譜的構(gòu)建分析
3.1數(shù)據(jù)采集
在Web服務(wù)知識圖譜構(gòu)建過程中,若要保證圖譜構(gòu)建合理性,首先須對知識圖譜結(jié)構(gòu)所產(chǎn)生的數(shù)據(jù)和信息全面收集[3],如利用程序軟件針對Web服務(wù)網(wǎng)站中相關(guān)數(shù)據(jù)進行全面收集和分析時,會借助Programmable Web。由于Programmable Web網(wǎng)站是全球范圍內(nèi)網(wǎng)站的主要服務(wù)平臺,由此,不少互聯(lián)網(wǎng)企業(yè)都需要通過該網(wǎng)站發(fā)布相應(yīng)的服務(wù),這樣才能夠?qū)崿F(xiàn)用戶使用的便利性。
Programmable Web網(wǎng)站在實際建設(shè)環(huán)節(jié)上還發(fā)布了大量網(wǎng)頁API以及APP等,并且數(shù)據(jù)收集方面還包含世界地圖、城市旅游以及自然天氣等大量實時信息。由于該網(wǎng)站的服務(wù)數(shù)據(jù)與信息主要通過網(wǎng)頁管理模式所呈現(xiàn),并且大多數(shù)屬于半結(jié)構(gòu)數(shù)據(jù),所以對其進行使用時需要利用專業(yè)技術(shù)針對網(wǎng)頁中的半結(jié)構(gòu)化數(shù)據(jù)和信息予以全面抽取,獲得大量與服務(wù)相關(guān)的網(wǎng)頁數(shù)據(jù),并將相關(guān)數(shù)據(jù)初步存儲在關(guān)系型數(shù)據(jù)庫中。
3.2Web服務(wù)知識圖譜的可視化
在知識圖譜下的Web服務(wù)推薦技術(shù)實施過程中,圖譜中的知識通過大量信息聯(lián)系在一起,因此當(dāng)平臺數(shù)據(jù)被頻繁查詢和更新時,關(guān)系數(shù)據(jù)庫處理會產(chǎn)生許多信息連接查詢,造成平臺性能問題。為此,使用圖庫能夠?qū)?shù)據(jù)儲存與提取方式合理規(guī)劃,使圖譜數(shù)據(jù)庫在使用環(huán)境下較關(guān)系型數(shù)據(jù)庫來說具有更高性能,同時在圖譜數(shù)據(jù)庫中以更加直觀的圖形展現(xiàn)。由此可見,圖譜數(shù)據(jù)庫在建設(shè)過程中能夠針對平臺進行圖譜可視化操作。
本次研究主要使用譜圖數(shù)據(jù)庫進行Web服務(wù),以確保圖譜數(shù)據(jù)儲存和可視化操作。NE04J是一種基于圖譜的非關(guān)系數(shù)據(jù)庫,現(xiàn)階段該數(shù)據(jù)庫應(yīng)用范圍比較廣,尤其在數(shù)據(jù)搜索或者推薦等領(lǐng)域中被廣泛使用,如電商平臺以及沃爾瑪?shù)却笮统芯褂迷撈脚_。除此之外,NE04J平臺上的節(jié)點可以與其他任何節(jié)點構(gòu)建出連接關(guān)系,并且以每個節(jié)點作為基礎(chǔ)條件設(shè)置多個屬性,其中每一個關(guān)系必須具有開始節(jié)點或者結(jié)束節(jié)點,以有效構(gòu)成一個系統(tǒng)小組?,F(xiàn)階段,譜圖數(shù)據(jù)庫種類較為復(fù)雜,除了NE04J平臺以外,同樣有其他類型的平臺結(jié)構(gòu),但是NE04J平臺在實施過程中,無論是信息儲存還是查詢都需要使用圖形結(jié)構(gòu)開展參數(shù)計算,該平臺在數(shù)據(jù)庫儲存時,即使沒有使用譜圖結(jié)構(gòu),各個階層同樣利用關(guān)系型數(shù)據(jù)庫進行數(shù)據(jù)和信息儲存。由此可見,NE04J平臺管理效率更高。
知識圖譜的實際情況與關(guān)系在平臺上主要以節(jié)點與邊緣呈現(xiàn),確保實體的信息與數(shù)據(jù)能夠直接儲存在節(jié)點中,在信息查詢時能十分直觀清晰地觀察到各個數(shù)據(jù)節(jié)點的使用屬性。在Web服務(wù)推薦技術(shù)應(yīng)用中,知識圖譜中單個節(jié)點質(zhì)保函的實體基礎(chǔ)屬性信息與數(shù)據(jù)并不能包含之間的關(guān)系,如Mashup FollowFly關(guān)聯(lián)了三個服務(wù)——YouTube,F(xiàn)acebook和Twitter。顯然,借助知識圖譜可以較好地表示這種聯(lián)系,從而實現(xiàn)信息與數(shù)據(jù)之間關(guān)聯(lián)性確定。
4總結(jié)
互聯(lián)網(wǎng)的高速發(fā)展讓網(wǎng)絡(luò)服務(wù)的類型逐漸增多,功能也更加復(fù)雜,為了解決傳統(tǒng)開發(fā)模式中面臨的問題,面向服務(wù)架構(gòu)應(yīng)運而生。隨著面向服務(wù)架構(gòu)的逐漸成熟,互聯(lián)網(wǎng)中大量的Web服務(wù)涌現(xiàn)出來,需要不斷加強對知識圖譜下的Web服務(wù)推薦技術(shù)的研究,以推動互聯(lián)網(wǎng)技術(shù)的持續(xù)發(fā)展。