亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于層次分析法的網(wǎng)頁排序技術(shù)

        2015-07-27 05:23:40呂嘉慧中南財經(jīng)政法大學(xué)廣東佛山430073
        山東工業(yè)技術(shù) 2015年13期
        關(guān)鍵詞:搜索引擎層次分析法

        呂嘉慧(中南財經(jīng)政法大學(xué),廣東 佛山 430073)

        基于層次分析法的網(wǎng)頁排序技術(shù)

        呂嘉慧
        (中南財經(jīng)政法大學(xué),廣東 佛山 430073)

        摘 要:在大數(shù)據(jù)時代,網(wǎng)頁搜索的效率和質(zhì)量要求越來越高,本文在研究分析層次分析法原理的基礎(chǔ)上,提出了基于此的網(wǎng)頁搜索排序技術(shù)和處理方法,通過仿真實證了該方法的可行性和有效性。

        關(guān)鍵詞:搜索引擎;層次分析法;網(wǎng)頁排序

        1 概要

        經(jīng)過多年的探索發(fā)展,向量空間模型、語言模型、布爾模型、鏈接分析算法、相關(guān)性排序模型等都曾或正被應(yīng)用到搜索引擎中。目前用得比較多的排序算法是在鏈接分析算法的基礎(chǔ)上加入更多的排序因素:關(guān)鍵詞在網(wǎng)頁中出現(xiàn)的位置、點擊次數(shù)和網(wǎng)頁被引用次數(shù)等。這些方法最大的不足是不同用戶搜索得到的網(wǎng)頁結(jié)果排序是一樣。

        2 層次分析法

        2.1 層次分析法原理

        層次分析法(AHP),其主要思想是通過對復(fù)雜系統(tǒng)的有關(guān)要素及其相互關(guān)系進(jìn)行分析,將其簡化為有序的遞階層次結(jié)構(gòu),使這些要素歸類到不同的層次,形成一個多層次的分析結(jié)構(gòu)模型,最終把系統(tǒng)分析轉(zhuǎn)化為確定最低層(決策方案)相對于最高層(總目標(biāo))的相對重要性權(quán)值的問題。

        AHP使用時先將問題中的因素劃分到不同層次中,利用一致矩陣法確定各層次因素間的權(quán)重,經(jīng)過歸一化得出由同層次因素對于上一層次某因素的相對重要性的權(quán)值所組成的矩陣。然后計算某層次所有因素對最高層相對重要性的權(quán)值。兩次相對重要性權(quán)值計算都需進(jìn)行一致性檢驗。

        AHP實現(xiàn)網(wǎng)頁排序的原理是以網(wǎng)頁和搜索關(guān)鍵詞之間的相關(guān)度為最高層,點擊次數(shù)、詞頻、詞位置、引用次數(shù)、瀏覽時間和用戶個人信息作為中間層,搜索的結(jié)果網(wǎng)頁為最底層。通過結(jié)合搜索和層次分析法排序完成搜索任務(wù)。

        2.2 基于層次分析的網(wǎng)頁排序

        首先對用戶提交的關(guān)鍵詞進(jìn)行同義詞查詢,基于關(guān)鍵詞及其同義詞進(jìn)行擴(kuò)展查詢,查詢返回關(guān)鍵詞在頁面中的位置、瀏覽平均時間、點擊率、被引用次數(shù)等信息,然后對返回的結(jié)果頁面結(jié)合AHP分析得出相關(guān)性排序網(wǎng)頁,最終向用戶反饋排序結(jié)果。

        假設(shè)用戶提交關(guān)鍵詞后得到5個頁面,為得到的頁面創(chuàng)建SearchedPage實例。該實例有以下字段:id(頁面在DB中的編號),relevance(關(guān)鍵詞與頁面的相關(guān)程度),hitWeight(頁面被點擊次數(shù)權(quán)重,/100),refWeight(頁面被引用次數(shù)權(quán)重),posWeight(關(guān)鍵詞位置權(quán)重,根據(jù)關(guān)鍵詞第一次出現(xiàn)的位置判斷,標(biāo)題部分取20,正文按每10%減1,正文前10%取10),freWeight(關(guān)鍵詞頻率權(quán)重,*100),readTWeight(頁面平均瀏覽時間權(quán)重,*100),cusWeight(用戶個性化相關(guān)權(quán)重,頁面類別與用戶愛好匹配取3,否則取1),synWeight(詞義距離權(quán)值,取值0-5,直接匹配取0)。假設(shè)這5個頁面:(hitWeight,refWeight,posWeight,freWeight,readTWeight,cus Weight,synWeight)

        5個頁面取值分別為:P1(9.6,24,20,0.93,2.7,1,1),P2(3.1,7,9 ,0.2,1.76,1,1),P3(8.2,13,10,0.98,0.84,3,1),P4(9.7,8,10,1.15,0.79,1,0) ,P5(5.4,36,20,0.81,0.8,3,2)。利用AHP求解relevance。

        根據(jù)中間層因素對relevance取值的影響程度,建立比較矩陣T,其中t12= 1/3表示作者認(rèn)為關(guān)鍵詞在頁面中的位置比其出現(xiàn)頻率更重要。

        通過計算,得比較矩陣T的最大特征根λ=7.3,相應(yīng)特征變量為W=(0.11,0.34,0.05,0.24,0.10,0.08,0.09)T,一致性檢驗指標(biāo)CI = (λ- n)/ (n - 1) = 0.05,n = 7。查表知隨機(jī)一致性指標(biāo)為RI=1.32,一致性比率CR=CI/RI=0.038<0.1,通過一致性檢驗。

        根據(jù)SearchedPage屬性值,構(gòu)建P1到P5實例對freWeight等指標(biāo)的判斷矩陣,如下。

        因為篇幅有限,本文不列出K2—K10,只給出K2—K10比較矩陣的最大 特征值λi(i=1,2,3,……,7)與對應(yīng)的特 征向量Wi(i=1,2,3,……,7)。

        λ1=10.04 W1=(0.14,0.05,0.16,0.14,0.12)

        λ2=10.86 W2=(0.13,0.02,0.08,0.10,0.17)

        λ3=10.09 W3=(0.17,0.03,0.14,0.17,0.11)

        λ4=10.11 W4=(0.19,0.07,0.07,0.05,0.04)

        λ5=10.12 W5=(0.12,0.03,0.08,0.04,0.25)

        λ6=10.01 W6=(0.03,0.04,0.19,0.03,0.18)

        λ7=10.29 W7=(0.11,0.03,0.12,0.13,0.07)

        算出K1—K10最大特征值、特征向量對應(yīng)的CI、CR知通過一致性檢驗,層次總排序一致性比率:CR=(t1CI1+t2CI2+L+a7CI7)/(a1RI1+a2RI2+L+a7RI7),其中:(t1,t2,t3,t4,t5,t6,t7)T=(0.11,0.34,0.05,0.24,0.1 0,0.08,0.09)T,算得CR=0.032,CR<0.1通過檢驗。

        因此,通過同義詞和個性化搜索后得到SearchedPage的5個實例P1、P2、P3、P4、P5排序為P1、P5、P3、P4、P2。

        3 結(jié)語

        基于層次分析的搜索排序技術(shù)可以較好的解決傳統(tǒng)的同義詞擴(kuò)展方式又會帶來更多的查詢結(jié)果難以合理排序的問題,并有利于提高搜索的精確率和覆蓋率。

        參考文獻(xiàn):

        [1]常璐,夏祖奇.搜索引擎的幾種常用排序算法[D].圖書情報工作,2003(06).

        [2]金祖旭,李敏波.基于用戶反饋的搜索引擎排名算法[Z].計算機(jī)系統(tǒng)應(yīng)用,2010(12).

        作者簡介:呂嘉慧(1993-),女,廣東佛山人,本科,研究方向:搜索引擎。

        猜你喜歡
        搜索引擎層次分析法
        微電子科學(xué)與工程專業(yè)評價指標(biāo)體系研究
        基于AHP—GRA的工程施工項目進(jìn)度風(fēng)險管理研究
        價值工程(2016年29期)2016-11-14 01:02:43
        關(guān)于三江源生態(tài)移民創(chuàng)業(yè)能力評價指標(biāo)體系構(gòu)建的研究
        基層社會管理關(guān)鍵績效指標(biāo)體系構(gòu)建研究
        中國市場(2016年35期)2016-10-19 02:03:21
        基于層次分析法的乳制品品牌顧客滿意度實證研究
        中國市場(2016年35期)2016-10-19 01:52:09
        基于模糊綜合評價模型對道路擁堵的研究
        商(2016年27期)2016-10-17 07:03:47
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        国产视频免费一区二区| 成人欧美一区二区三区黑人| 亚洲无线码一区二区三区| 国产精品人妻一码二码| 美丽人妻被按摩中出中文字幕| 久久99亚洲综合精品首页| 一区二区日本免费观看| 欧洲美熟女乱又伦av影片| 亚洲精品aa片在线观看国产| 无码熟妇人妻AV影音先锋| 久久少妇呻吟视频久久久| 免费一级淫片日本高清| 精品人妻av区乱码| 亚洲国产成人va在线观看天堂| 亚洲精品国产二区三区在线| 国产精品久久av色婷婷网站| 国产一精品一av一免费爽爽| 毛片在线播放a| 国产成人一区二区三区影院免费| av男人操美女一区二区三区| 亚洲国产精品av在线| 人妻无码一区二区视频| 欧美日韩亚洲国产千人斩| 国产噜噜亚洲av一二三区| 天天干天天日夜夜操| 国产av无码专区亚洲av蜜芽| 在线视频一区色| 成人精品国产亚洲av久久| 亚洲高清一区二区精品| 成人中文乱幕日产无线码| 激情偷乱人成视频在线观看| 国产午夜精品福利久久| 亚洲国产综合精品一区| 精品久久久久久无码中文野结衣| 成人免费视频在线观看| 国产美女自拍国语对白| 中文字幕乱码在线人妻| 真人作爱免费视频| 男人阁久久| 国产成人高清视频在线观看免费 | 亚洲av免费高清不卡|