亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于網(wǎng)站影響力的網(wǎng)頁排序算法分析

        2012-12-31 00:00:00宋學(xué)蓮

        摘要:傳統(tǒng)的網(wǎng)頁排序算法有多種,比如PageRank算法、HITS算法等,這些算法雖然在評(píng)價(jià)網(wǎng)頁權(quán)威性方面體現(xiàn)出一定的優(yōu)勢(shì),但也存在不足,要么對(duì)網(wǎng)頁更新率的利用不夠充分,要么對(duì)用戶對(duì)網(wǎng)頁的回復(fù)、轉(zhuǎn)載等客觀因素有所忽略。因此本文就提出一種以網(wǎng)站影響力與用戶滿意度為基礎(chǔ)的網(wǎng)而排序算法。

        關(guān)鍵詞:網(wǎng)站影響力;網(wǎng)頁排序算法

        中圖分類號(hào):TP393.092 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 23-0000-02

        1 網(wǎng)頁排序要素分析

        具體而言,影響網(wǎng)頁排序的要素包括以下幾個(gè):首先,網(wǎng)頁與源網(wǎng)站互相影響的關(guān)系。其次,網(wǎng)頁在源網(wǎng)站的重要程度;通常網(wǎng)站開發(fā)人員在安排網(wǎng)頁與首層的距離層次以及站內(nèi)鏈接數(shù)量時(shí),會(huì)充分考慮網(wǎng)頁的重要程度,首頁中比較醒目的位置通常鏈接的都是重要的網(wǎng)頁,對(duì)于一個(gè)網(wǎng)頁而言,指向的鏈接越多,證明其重要程度就越高。第三,用戶對(duì)網(wǎng)頁的反應(yīng)程度,通常用戶認(rèn)可某個(gè)網(wǎng)頁,會(huì)在瀏覽后轉(zhuǎn)載、回復(fù)或者收藏,這些行為所反應(yīng)的是一個(gè)網(wǎng)頁的影響力。第四,網(wǎng)站的權(quán)威性,網(wǎng)站內(nèi)相關(guān)網(wǎng)頁的影響、其它網(wǎng)站的鏈接數(shù)量等均可以反映出一個(gè)網(wǎng)站的權(quán)威性。第五,網(wǎng)頁的更新率,通常網(wǎng)頁的更新時(shí)間與用戶對(duì)網(wǎng)頁反應(yīng)有著直接的關(guān)系。第六,查詢條件與網(wǎng)頁的相關(guān)性,因?yàn)橛脩粼谒阉骶W(wǎng)頁時(shí)就是希望找到與自己需求相關(guān)程度更大、更具權(quán)威性的網(wǎng)頁,所以在網(wǎng)頁排序算法中不能忽略查詢條件以及網(wǎng)頁的相關(guān)度等要素。通過上述分析,提出網(wǎng)頁排序算法——WFPR,其表達(dá)式如下:

        2 網(wǎng)頁排序算法流程

        根據(jù)上式1所示,WFPR的算法流程如下:

        首先人為認(rèn)定n個(gè)權(quán)威網(wǎng)站為根集S;然后把集合S中的每一個(gè)網(wǎng)站U指向的網(wǎng)站或網(wǎng)頁所在的網(wǎng)站加入集合,形成一個(gè)更大的集合T;在計(jì)算排序得分時(shí)要充分考慮到網(wǎng)頁的更新率的影響;接下來計(jì)算查詢條件與網(wǎng)頁的相關(guān)程度,可以利用查詢條件出現(xiàn)在標(biāo)題與摘要中的具體意義來計(jì)算;如果網(wǎng)頁的相關(guān)度值相等或者差別不大,則要進(jìn)一步判斷其相似度,如果得出轉(zhuǎn)載的結(jié)果,則要計(jì)算原創(chuàng)度,參照發(fā)布時(shí)間與更新率即可,最終確定出源網(wǎng)站及轉(zhuǎn)載次數(shù);下一步對(duì)網(wǎng)頁的認(rèn)可度進(jìn)行計(jì)算,具體參照回復(fù)總數(shù)以及站外其它網(wǎng)頁的引用總數(shù)等值;然后對(duì)網(wǎng)頁的推薦度進(jìn)行計(jì)算,具體參照網(wǎng)頁對(duì)其源網(wǎng)站的貢獻(xiàn)大小及網(wǎng)站對(duì)網(wǎng)頁的重視程度等值;最后在計(jì)算出上述各步驟的信息后,即可將網(wǎng)頁的排名得分綜合計(jì)算出來,根據(jù)用戶對(duì)網(wǎng)站的反映,對(duì)集合T進(jìn)行信息反饋。

        3 網(wǎng)頁排序算法分析

        3.1 更新率。對(duì)于一個(gè)網(wǎng)頁而言,發(fā)布時(shí)間越長,其被用戶轉(zhuǎn)載、回復(fù)、被其它網(wǎng)站引用的幾率就越大,這對(duì)一個(gè)新開發(fā)的網(wǎng)頁而言,存在不公平性;而且基于用戶的角度而言,如果網(wǎng)頁的相關(guān)度差別不大,則更新速度快、權(quán)威性高的網(wǎng)頁更具吸引力。為了防止由于舊網(wǎng)頁得分過高對(duì)網(wǎng)頁的排名產(chǎn)生影響,所以要把網(wǎng)頁的更新率作為網(wǎng)頁得分的影響因素之一。如果網(wǎng)頁u的發(fā)布時(shí)間為t0,t1、t2,…tm為最近m次的更新時(shí)間,t為當(dāng)前時(shí)間,則計(jì)算出網(wǎng)頁的更新間隔時(shí)間與平均更新間隔時(shí)間,即可求出網(wǎng)頁u下一次的預(yù)更新時(shí)間,即為平均更新時(shí)間間隔與最近m次的更新時(shí)間之和;如果網(wǎng)頁自發(fā)布時(shí)日起從未更新,則網(wǎng)頁u下次預(yù)更新時(shí)間為網(wǎng)頁u的發(fā)布時(shí)間;如果下次預(yù)更新時(shí)間為當(dāng)前時(shí)間的若干天這后,則tn>t,反之tn≤t;由此可知,網(wǎng)頁u的更新率可表達(dá)如下:

        (2)

        上式中:λ為時(shí)間衰退因子,由網(wǎng)頁u所屬類別的衰退時(shí)間來決定,其中衰退時(shí)間是指網(wǎng)頁從發(fā)布到無人關(guān)注,整個(gè)過程所經(jīng)歷的時(shí)間。

        3.2 相關(guān)度。基于用戶的角度而言,標(biāo)題與摘要對(duì)查詢文檔的貢獻(xiàn)程度存在差異,通常用戶會(huì)先搜索標(biāo)題中是否包含查詢條件q,如果包含則會(huì)進(jìn)一步瀏覽網(wǎng)頁,如果沒有則會(huì)進(jìn)一步查看摘要,如果二者均沒有出現(xiàn)用戶所需的查詢條件,則證明網(wǎng)頁與其相關(guān)度不大,所以要將位置權(quán)重因素Pos(i)引入其中,具體如下: (3)

        式中i=1表示標(biāo)題中包含查詢條件;i=2表示摘要出現(xiàn)查詢條件。假設(shè)查詢條件q包含n個(gè)關(guān)鍵詞keyn,如果在i位置的關(guān)鍵詞keyn中包含t個(gè)關(guān)鍵詞相鄰組成一個(gè)新的關(guān)鍵詞keyj’,是keyj’=keyjkeyj+1…keym,則其權(quán)重因子Wij=t/n。由此可見,如果查詢條件完全匹配,則權(quán)重因素為1,如果在i處位置有x個(gè)新詞keyx’,詞頻依次為tfix,則詞keyj’在i處的詞頻率表達(dá)如下:

        (4)

        為防止個(gè)別關(guān)鍵詞頻率過高對(duì)查詢條件與文檔的相關(guān)度產(chǎn)生影響,則要設(shè)置i位置處關(guān)鍵詞的權(quán)值:

        (5)

        3.3 用戶認(rèn)可度。(1)轉(zhuǎn)載次數(shù)。如果網(wǎng)頁被轉(zhuǎn)載,則直接計(jì)算其轉(zhuǎn)載次數(shù)即可。而要判斷網(wǎng)頁是否源網(wǎng)頁,則可以根據(jù)網(wǎng)頁的發(fā)布時(shí)間來確定,判定網(wǎng)頁是否源網(wǎng)頁的條件就包括網(wǎng)頁的發(fā)布時(shí)間與更新時(shí)間,具體原創(chuàng)度定義如下式: (6)

        式中t為當(dāng)前時(shí)間, 為網(wǎng)頁發(fā)布時(shí)間, 為網(wǎng)頁u更新率; 、 為系數(shù),二者之和等于1,通過上式進(jìn)行計(jì)算,結(jié)果值最大的即為源網(wǎng)頁。

        (2)其它權(quán)威網(wǎng)站的引用。如果某個(gè)網(wǎng)頁被權(quán)威的網(wǎng)站引用,則證明該網(wǎng)頁的重要程度較高,相應(yīng)的可以用網(wǎng)頁u被引用的總數(shù)來判斷其它網(wǎng)站對(duì)其的認(rèn)可程度。相應(yīng)的即可得出用戶對(duì)某網(wǎng)頁u的認(rèn)可度,表達(dá)如下:

        上式中,H(u)表示對(duì)網(wǎng)頁u的認(rèn)可度;α、β、γ表示系數(shù),且三者之和等于1,本文取α為0.4,β為0.2,γ為0.4,Trans(u)表示網(wǎng)頁轉(zhuǎn)載次數(shù);Ans(u)表示網(wǎng)頁回復(fù)次數(shù);Rel(u)表示網(wǎng)頁引用次數(shù),如果網(wǎng)頁存在被轉(zhuǎn)載、回復(fù)、引用的情況,則將具體次數(shù)相加即可得出對(duì)應(yīng)值。

        3.4 網(wǎng)站權(quán)威值。網(wǎng)站的權(quán)威性包括其它權(quán)威網(wǎng)站的評(píng)價(jià)與站內(nèi)網(wǎng)頁的貢獻(xiàn)兩個(gè)部分,網(wǎng)頁被權(quán)威網(wǎng)站引用的次數(shù)越多,證明其認(rèn)可度越高,反之如果該網(wǎng)站引用的權(quán)威網(wǎng)頁越多,證明其權(quán)威性越高,因此可以將權(quán)威值做如下定義:

        (8)

        式中: 為所有引用網(wǎng)站U的網(wǎng)站集合,|F(U)|為所有引用網(wǎng)站的總數(shù)。網(wǎng)頁的認(rèn)可度越高,證明網(wǎng)站的質(zhì)量越高,網(wǎng)頁對(duì)源網(wǎng)站的貢獻(xiàn)率就越高,網(wǎng)站與網(wǎng)頁的關(guān)系是相輔相成的,因此網(wǎng)頁對(duì)網(wǎng)站的貢獻(xiàn)率可做如下定義:

        (9)

        由此可得網(wǎng)站U的權(quán)威排名計(jì)算如下式:

        3.5 網(wǎng)頁權(quán)威值。通常網(wǎng)站主頁中所鏈接的網(wǎng)頁都是比較重要的、吸引用戶瀏覽的內(nèi)容,所以在對(duì)網(wǎng)頁進(jìn)行權(quán)威性評(píng)價(jià)時(shí),可以考慮其鏈接是否出現(xiàn)在首頁上、與首頁的距離以及站內(nèi)指向該網(wǎng)頁的鏈接數(shù)量等。那么設(shè)網(wǎng)頁u與網(wǎng)站首面的距離為c,源網(wǎng)站U內(nèi)指向網(wǎng)頁u的鏈接數(shù)量為I(u),則網(wǎng)站U對(duì)網(wǎng)頁u的評(píng)價(jià)Eva(u)可表達(dá)如下: (11)

        用戶對(duì)某個(gè)網(wǎng)頁的認(rèn)可度H(u)值越高,其對(duì)源網(wǎng)站的貢獻(xiàn)就越大,所以貢獻(xiàn)值可做如下定義: (12)

        所以網(wǎng)站U對(duì)站內(nèi)網(wǎng)頁u的推薦度可表達(dá)如下式:

        (13)

        式中a、b為和等于1的系數(shù)。

        經(jīng)過相關(guān)實(shí)驗(yàn)可知,該算法比目前的代表性算法在性能上有較大提高,在專業(yè)搜索方面效果更好。

        參考文獻(xiàn):

        [1]搜狐IT.絕大多數(shù)搜索引擎用戶其實(shí)只看第一頁搜索結(jié)果[EB/OL].[2011-10-20].http://www.techw-eb.com.cn/news/2006-05-19/57577.shtml.

        [2]網(wǎng)頁偉杰,戴汝為,崔霞.一種基于信息檢索技術(shù)的網(wǎng)絡(luò)新聞?dòng)绊懥Ψ治龇椒╗J].軟件學(xué)報(bào),2009,20(9).

        区二区欧美性插b在线视频网站 | 中文AV怡红院| 久草视频在线视频手机在线观看| 国产一区,二区,三区免费视频| 久久久亚洲av成人乱码| 久久久久亚洲av无码专区首| 欧美野外疯狂做受xxxx高潮| 国产成人免费一区二区三区| 久久精品国产亚洲av网在| 亚洲国产精品成人天堂| 婷婷五月六月综合缴情| 精品人妻中文av一区二区三区| 国产午夜精品av一区二区三| 亚洲大尺度无码无码专区| 人人爽人人爱| 亚洲AV无码专区国产H小说| 中文片内射在线视频播放| 一区二区和激情视频| 成年无码aⅴ片在线观看| 国产亚洲欧美在线播放网站| 亚洲中文中文字幕乱码| 99久久婷婷国产综合亚洲| 丁香五月缴情综合网| 无码中文字幕久久久久久| 国产精品亚洲一区二区麻豆| 欧洲vat一区二区三区| 久久综合色鬼| 日韩一区二区中文字幕| 国产精品久久久久久av| av片在线观看免费| 无码熟妇人妻av在线c0930| 少妇爽到高潮免费视频| 国产真实乱对白精彩| 欧美婷婷六月丁香综合色| Jizz国产一区二区| 日本一区二区视频在线| 亚洲av无码国产精品色软件下戴| 国产成人精品亚洲午夜| 亚洲一二三四五中文字幕| 精品国产一区二区三区三级| 最近中文字幕视频完整版在线看|