摘 要:為了很好的解決P2P2網(wǎng)絡(luò)檢索算法的低效率問題,提出了信息量聲譽激勵的P2P和節(jié)點興趣域聚類的一種網(wǎng)絡(luò)檢索機制。在這個機制當中,首先對于網(wǎng)絡(luò)節(jié)點的信息量進行了分類,然后根據(jù)節(jié)點數(shù)據(jù)的聲譽激勵法對相鄰節(jié)點進行以興趣為基礎(chǔ)的構(gòu)造模式,與此同時用戶輸入關(guān)鍵字進行個性化輔助選擇。通過試驗仿真設(shè)計證明,這個網(wǎng)絡(luò)檢索算法構(gòu)建的動態(tài)結(jié)構(gòu),可以很好的避免結(jié)構(gòu)化P2P網(wǎng)絡(luò)對中心節(jié)點的依賴性。
關(guān)鍵詞:P2P網(wǎng)絡(luò)檢索算法;設(shè)計仿真
中圖分類號:TP393.02
P2P網(wǎng)絡(luò)是對網(wǎng)絡(luò)邊緣資源的利用,它的能力被廣泛應用到現(xiàn)代化的信息檢索機構(gòu)當中,其中對于網(wǎng)頁緩存資源的利用,提出了以節(jié)點所擁有的信息通過廣播和共享模式傳輸?shù)木褪锹酚赡J?。接下來本位以信息量聲譽激勵方法和節(jié)點興趣域聚類方法為進行,對P2P網(wǎng)絡(luò)中的興趣域和非結(jié)構(gòu)化進行研究分析,然后構(gòu)造相對應的動態(tài)結(jié)構(gòu)模式。在分析的時候我們結(jié)合輔助信息量,對網(wǎng)絡(luò)系統(tǒng)的節(jié)點數(shù)據(jù)進行綜合評價和分析,最終通過仿真實驗證明了P2P網(wǎng)絡(luò)檢索方法的有效性和科學性。
1 P2P網(wǎng)絡(luò)檢索算法
定義:P2P網(wǎng)絡(luò)檢索算法主要由以下幾個基本點構(gòu)成,首先是信息量,通過節(jié)點信息量讓系統(tǒng)在最短時間內(nèi)進行興趣度的計算;信息量的相似程度,通過公式反映就是 ,公式中的( )決定了網(wǎng)絡(luò)信息量的好壞程度,同時Sim(Ni,Nj)所得值越小,相近程度也高;還有節(jié)點興趣和節(jié)點興趣的相近程度,利用興趣相近度的方法,可以把節(jié)點信息量以興趣為基準進行分類。其中還有興趣域的定義、語義分析和用戶個性化設(shè)置等。通過這些信息和數(shù)據(jù)都可以將搜索得到的數(shù)據(jù)進行非常細致、準確的劃分和組合,最終目的就是為用戶提供一條非常準確的消息值。
P2P網(wǎng)絡(luò)檢索算法由以下幾部分構(gòu)成,第一部分:人機互換。用戶在登陸之后,輸入相對應的關(guān)鍵字詞,系統(tǒng)就會根據(jù)用戶提供的關(guān)鍵詞語進行相關(guān)信息的搜集,然后用戶可以根據(jù)的需要選擇保留或者推出P2P網(wǎng)絡(luò)。第二部分:語言的分析。對于用戶輸入關(guān)鍵字進行相近詞的分析,而且在分析的時候會產(chǎn)生一定的詞語聯(lián)想技術(shù)分析詞語的意思,然后產(chǎn)生相對應的輔助詞語供用戶選擇。第三部分:網(wǎng)絡(luò)拓撲結(jié)構(gòu)。P2P網(wǎng)絡(luò)檢索模式是依賴興趣節(jié)點對于所含信息量的有效程度,然后把相同興趣的節(jié)點信息分門別類,在此基礎(chǔ)上計算相鄰節(jié)點的信息,構(gòu)成系統(tǒng)需要的聲譽激勵法興趣樹,最后就會形成P2P網(wǎng)絡(luò)拓撲結(jié)構(gòu)。第四部分:信息的檢索。第一步要在P2P網(wǎng)絡(luò)檢索系統(tǒng)中發(fā)布檢索關(guān)鍵詞內(nèi)容的指令,目的是確定為P2P網(wǎng)絡(luò)檢索系統(tǒng)提供可以使用的信息節(jié)點,然后在搜尋到滿足用戶檢索要求的時候,對信息節(jié)點內(nèi)的全部資源進行搜索。第五部分:綜合信息的處理。P2P網(wǎng)絡(luò)檢索系統(tǒng)對于檢索出來的沒有鏈接效應和空白鏈接會及時的刪掉,然后P2P網(wǎng)絡(luò)檢索系統(tǒng)依據(jù)興趣相近的程度和用戶關(guān)鍵詞的要求,對已經(jīng)搜索到的結(jié)果進行排列組合,最終呈現(xiàn)給用戶一個較為滿意的數(shù)據(jù)信息。
P2P網(wǎng)絡(luò)檢索模式主要是通過“進入節(jié)點”和“退出節(jié)點”興趣樹的形式對其進行數(shù)據(jù)更新,主要是通過興趣樹更新可以確保相同節(jié)點信息從始至終都在一個固定有效的范圍內(nèi),在用戶檢索的時候提升了工作效率。針對用戶輸入關(guān)鍵詞語方面,P2P網(wǎng)絡(luò)檢索系統(tǒng)會進行語義分析,分析采用的是輔助語義和語義分析相互結(jié)合的方式。按照檢索信息判斷出在線的服務(wù)節(jié)點,然后在網(wǎng)絡(luò)緩存數(shù)據(jù)中進行地毯式的搜索,目的在于滿足用戶個性化設(shè)置的要求。
2 P2P算法的分析
P2P網(wǎng)絡(luò)檢索算法是對節(jié)點信息和和個性化服務(wù)為基礎(chǔ)形成的興趣樹結(jié)構(gòu)和網(wǎng)絡(luò)拓撲結(jié)構(gòu),然后根據(jù)信息量的相近程度對興趣相鄰節(jié)點的數(shù)據(jù)進行匹配和選擇,其中數(shù)據(jù)資源就是網(wǎng)絡(luò)緩存下來的資源和每個節(jié)點存在的數(shù)據(jù)資源。
2.1 興趣樹的構(gòu)成。部分步驟如下
第一步:Start //所有變量進行初始化操作。第二步:scanf Z //調(diào)入資源庫Z。第三步:for(F{each Ei=Si}) //判斷條件;{ If( 0 < k0 < t0) / /如果信息E 與S0節(jié)點信息量興趣相似度在額定值t0內(nèi);那么t0∈ S0; / /然后在信息E 節(jié)點信息量中添加進S0節(jié)點集合,最后更新S0;第四步:(0-i,m)→S// 生成興趣的集合,然后構(gòu)建P2P網(wǎng)絡(luò)拓撲結(jié)構(gòu)。第五步:for ( j = 0; j < = d; j + + ){ if ( 0 < ki < tj) / / 若興趣相似度滿足興趣樹第j層閾值; Else ki∈ Ynew / /生成新的興趣樹;End if } End for。第六步:S=S;Y=Y;//輸出網(wǎng)絡(luò)拓撲圖,得到興趣樹Y,及時對其更新。
2.2 P2P網(wǎng)絡(luò)檢索機制。部分步驟如下
第一步:Start //所有變量進行初始化操作。第二步:同義詞分析、近義詞分析和語義分析//進行語義的分析,生成輔助語義。第三步:同義詞分析→(M∪ N)→E //確定檢索的詞語。第四步:if Sean(S∩e)=e;go to第五步//如果檢索信息的節(jié)點在線,那么就繼續(xù)執(zhí)行第五步。如果說Else Scan = = 1; return not answer//那么就是說掃描的結(jié)果是0,返回上一步。第五步:For ( search E ∈ S){ if ( 0 < k < t0) / / 如果信息E 和S0中信息量的興趣相似度在額定值t0內(nèi);輸出 Y0 / / 掃描Y0;If Y0j ∩ E = E , / / 掃描Y0的第c 層節(jié)點序列;Y0 = Y0;S0 = S0 / / 興趣樹Y0和節(jié)點集合S0更新;End for。第六步:判斷集合N屬于集合L// 資源列表L進行更新。
3 試驗仿真
實驗環(huán)境配置:同一種網(wǎng)絡(luò)環(huán)境下的PC機,配置的系統(tǒng)是Windosw 2000 Professional,處理器是Intel Pentium 1.73GHz,緩存數(shù)據(jù)是128M,P2P網(wǎng)絡(luò)協(xié)議是BestPeer,編寫程序的環(huán)境是VC++2005。實驗使用的參考數(shù)據(jù)是在TREC中隨機抽取5000份資源。實驗在開始的時候,要對抽取的文檔資源進行網(wǎng)絡(luò)拓撲結(jié)構(gòu)的生成和興趣樹的構(gòu)成,然后才可以進行信息檢索的評測。其中全部檢索率是V,檢索準確率是B和G: ; ; 。上述公式中的I就是根據(jù)檢索條件得出興趣樹的數(shù)量,R:興趣集合的數(shù)量,W:供用戶選擇的信息量,G:綜合分析指標。下圖是我們在試驗的時候,分別對四種不同興趣度的數(shù)據(jù)信息進行檢索操作,
從上述表格中的數(shù)據(jù)看得出來P2P網(wǎng)絡(luò)檢索方法具有非常好的檢索效率,然后通過Q綜合評價的計算值得出,P2P網(wǎng)絡(luò)檢索方式的非常準確和有效的,從基本方面來說已經(jīng)實現(xiàn)了實時搜索的功能。
每個算法的執(zhí)行時間都會隨著規(guī)模的增大在增加,而且P2P網(wǎng)絡(luò)檢索計算方法相比較其他方法耗時是最少的。在計算初期的時候,因為經(jīng)常使用公共數(shù)據(jù)中緩存的文件,所以在小規(guī)模的隨機抽樣中路由方式存在一定的優(yōu)勢,但是根據(jù)本文需要探討的內(nèi)容,以語義分析和興趣樹為基準進行計算的時候,耗時還是非常長的,并且搜索的效率很低。但是當節(jié)點規(guī)模慢慢變大的時候,本文所提到的P2P網(wǎng)絡(luò)檢索方式的優(yōu)勢遠遠超過路由模式。因為本文提到的P2P網(wǎng)路檢索方法對興趣域向鄰近的節(jié)點進行值域劃分和定義的劃分,因此在計算的時候,如果說節(jié)點規(guī)模非常大的時候,會呈現(xiàn)一種非常高的執(zhí)行效率。
4 總結(jié)
通過上述材料的具體分析,我們具體分析了P2P網(wǎng)絡(luò)檢索算法、P2P算法的分析和試驗仿真三個方面的相關(guān)問題,以興趣域聚類為構(gòu)建數(shù)據(jù)進行動態(tài)數(shù)據(jù)的構(gòu)建,然后把信息資源相關(guān)的節(jié)點數(shù)據(jù)按照興趣類別進行規(guī)整,然后就形成了我們需要的非結(jié)構(gòu)化的P2P網(wǎng)絡(luò),根據(jù)用戶輸入關(guān)鍵語義開始搜尋節(jié)點信息數(shù)據(jù),然后對最優(yōu)聲譽節(jié)點數(shù)據(jù)進行更新。通過仿真實驗證明了P2P網(wǎng)絡(luò)檢索算法的執(zhí)行效率和有效性能。
參考文獻:
[1]項興彬,曾國蓀,夏冬梅.P2P環(huán)境下文件共享的信任建立博弈模型及穩(wěn)態(tài)分析[J].計算機應用研究,2010(19):100-103.
[2]劉鳳鳴,丁永生.基于進化博弈的P2P網(wǎng)絡(luò)中信任計算的動力學分析[J].計算機應用研究,2010(18):120-123.
[3]劉鳳鳴,丁永生.基于生態(tài)網(wǎng)絡(luò)的P2P環(huán)境信任博弈進化模型[J].計算機工程與應用,2011(23):200-205.
作者簡介:吳謀碩(1978.08-),男,湖南湘鄉(xiāng)人,副教授,碩士研究生,研究方向:網(wǎng)絡(luò)信息檢索。
作者單位:中南民族大學,武漢 430074