亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺析網(wǎng)絡(luò)搜索引擎

        2013-12-31 00:00:00張淑娟
        數(shù)字化用戶 2013年22期

        【摘 要】由于人們?cè)谑褂靡酝乃阉饕嫠阉鲿r(shí),得到的搜索結(jié)果往往并不是用戶希望的結(jié)果,使得傳統(tǒng)的搜索引擎并不能滿足用戶的要求。所以,要滿足用戶的搜索要求,就必需采用新的技術(shù)和手段改善搜索引擎的性能。本文就目前比較常用的改善搜索引擎的手段和技術(shù)做出了淺顯的探討。

        【關(guān)鍵詞】搜索引擎 優(yōu)化策略 自動(dòng)分類 概念檢索

        伴隨著互聯(lián)網(wǎng)的高速發(fā)展,互聯(lián)網(wǎng)已經(jīng)滲透到人們生活的各個(gè)角落,人們的生活已經(jīng)離不開互聯(lián)網(wǎng),當(dāng)人們遇到問題時(shí)不再是查閱書本,越來越多的人傾向于去互聯(lián)網(wǎng)尋找答案。有關(guān)數(shù)據(jù)表明,截止到目前,美國(guó)Google公司的搜索引擎的索引量已超過41億。一般來說由于互聯(lián)網(wǎng)傳遞的信息數(shù)量之大,種類之多,更新速度之快的特點(diǎn)。用戶要想從龐雜的信息中找到自己想要的信息實(shí)屬不易,因此,對(duì)搜索引擎進(jìn)行優(yōu)化,對(duì)信息分類顯得很有必要?;谝陨蠁栴},有如下措施可以改善,把不同的資源分類,擬定搜索關(guān)鍵詞,進(jìn)而實(shí)現(xiàn)智能化搜索,接下來將對(duì)以上所提到的改善策略詳細(xì)說明。

        一、網(wǎng)絡(luò)搜索引擎的性能優(yōu)化策略和相關(guān)技術(shù)

        就早期的搜索引擎而言,其搜索系統(tǒng)主要由爬行器、索引器、和檢索器三部分構(gòu)成,用戶在使用搜索引擎搜索時(shí),搜索結(jié)果的準(zhǔn)確性往往由以上三部分決定。因此,要想提高搜索引擎的準(zhǔn)確性,必須改善爬行器、索引器、和檢索器三部分。下文將就如何改善以上三部分做出具體的說明。

        (一)權(quán)威性

        資源的權(quán)威性是對(duì)資源分類的一個(gè)重要參考指標(biāo),資源之所以具有權(quán)威性是因?yàn)槠鋬?nèi)容和質(zhì)量長(zhǎng)時(shí)間內(nèi)得到了用戶的認(rèn)可,具有相當(dāng)高的可信度。因此,用戶在對(duì)資源檢索時(shí),必須讓這些權(quán)威性的資源出現(xiàn)在檢索結(jié)果前面,讓用戶一眼就能看見。

        同時(shí),判斷資源是否具有權(quán)威性靠人來判定是不現(xiàn)實(shí)的,一方面互聯(lián)網(wǎng)上資源數(shù)量之大,靠人力來評(píng)判資源的權(quán)威性顯然行不通,其次,在評(píng)判資源的權(quán)威性時(shí),人或多或少的會(huì)帶有主觀性。因此,在評(píng)定網(wǎng)絡(luò)資源的權(quán)威性時(shí),建立合理科學(xué)的評(píng)判標(biāo)準(zhǔn),讓系統(tǒng)自動(dòng)的評(píng)判資源的權(quán)威性顯得很有必要。由于網(wǎng)絡(luò)資源的特殊性,實(shí)際操作時(shí)可以根據(jù)資源的來源鏈接進(jìn)行分析判斷。

        (二)關(guān)鍵詞

        用戶在使用搜索引擎搜索答案之前就已經(jīng)有明確的目標(biāo),自己要搜索什么,想得到什么樣的搜索結(jié)果,所以必須把用戶搜索的關(guān)鍵詞和有關(guān)資源聯(lián)系起來,并進(jìn)行判斷排序,進(jìn)而顯示在搜索結(jié)果里。需要強(qiáng)調(diào)的是,這個(gè)匹配過程,需要系統(tǒng)在用戶搜索過程中迅速收集各種文檔,根據(jù)有關(guān)技術(shù)對(duì)資源和用戶搜索的關(guān)鍵詞進(jìn)行匹配,進(jìn)而把最優(yōu)的,符合用戶需求的資源排在搜索結(jié)果前面。

        在對(duì)資源和關(guān)鍵詞匹配時(shí),比較關(guān)鍵的技術(shù)就是自動(dòng)分類技術(shù)。自動(dòng)分類技術(shù)對(duì)網(wǎng)絡(luò)資源分析處理時(shí),主要根據(jù)資源的相似性對(duì)資源分類,檢索式的結(jié)果因檢索的關(guān)鍵詞不同而不同,自動(dòng)分類技術(shù)的好處是用戶在輸入搜索內(nèi)容后,得到檢索結(jié)果之前,搜索引擎就可以快速對(duì)用戶搜索的關(guān)鍵詞和資源進(jìn)行匹配,重要的是,自動(dòng)分類技術(shù)只對(duì)搜索得到的結(jié)果進(jìn)行分類,這樣的好處是不僅降低了開發(fā)搜索引擎的成本,而且還極大的縮短了搜索時(shí)間,提高了搜索的準(zhǔn)確率。目前常用的自動(dòng)分類技術(shù)方法有單遍聚類法、逆中心距聚類法。這兩種方法有著很大的差別,體現(xiàn)在前者是對(duì)資源預(yù)先分類,實(shí)際操作起來比較復(fù)雜,后者操作起來雖然較簡(jiǎn)單,但由于對(duì)資源分類不明確,對(duì)資源的關(guān)鍵詞匹配沒有前者準(zhǔn)確。在實(shí)際應(yīng)用時(shí),可根據(jù)具體情況來選擇不同的分類方法。

        (三)個(gè)性化

        一千個(gè)讀者有一千個(gè)哈姆雷特,同樣的問題,由于用戶文化水平的參差不齊,對(duì)不同的問題有不同的表述方式,因此,在實(shí)際檢索中即使輸入的關(guān)鍵詞相同,但不同的用戶想得到的搜索結(jié)果可能有很大的差別。所以,用戶在輸入關(guān)鍵詞檢索時(shí),搜索引擎應(yīng)該根據(jù)用戶的不同情況,進(jìn)而對(duì)關(guān)鍵詞做出深入的分析,進(jìn)而匹配用戶需要的資源,所以在實(shí)際應(yīng)用中搜索引擎應(yīng)該具有個(gè)性化。

        1.用戶興趣模型

        要想實(shí)現(xiàn)檢索的個(gè)性化,建立一個(gè)適當(dāng)?shù)哪P途秃苡斜匾?。其中建立模型的關(guān)鍵在于收集用戶的檢索習(xí)慣,對(duì)于用戶的檢索習(xí)慣可通過如下兩種方法進(jìn)行收集,首先是給用戶選擇的權(quán)利,讓用戶選擇讓他感興趣的內(nèi)容。此種方法理論上是非常有效的,但實(shí)際操作起來難度特別大。因?yàn)閷?shí)際情況是極少數(shù)用戶愿意去選擇自己感興趣的內(nèi)容。其次是根據(jù)用戶以前的瀏覽歷史和搜索記錄來分析用戶的喜好,這種搜索方法不需要用戶的參與,由系統(tǒng)自動(dòng)完成,但是對(duì)系統(tǒng)的要求比較高,且前提是有一定的用戶基數(shù)。用戶興趣模型建立之后,當(dāng)用戶搜索時(shí),搜索引擎便通過用戶興趣模型快速對(duì)資源匹配,讓用戶需要的資源顯示在搜索結(jié)果前面。

        2.用戶信息反饋

        由于用戶在檢索問題是,對(duì)一個(gè)問題的描述往往并不準(zhǔn)確,但用戶發(fā)現(xiàn)自己的搜索結(jié)果不是自己預(yù)期的結(jié)果時(shí),往往會(huì)對(duì)問題重新描述,這個(gè)過程通常稱為反饋,此時(shí)搜索引擎要及時(shí)改變資源匹配方法,適應(yīng)用戶的搜索習(xí)慣,進(jìn)而讓顯示的搜索結(jié)果滿足用戶的需求。當(dāng)搜索引擎得到用戶對(duì)搜索結(jié)果的反饋后,要迅速重新顯示搜索結(jié)果,然后再根據(jù)用戶的反饋,直到得出用戶想要的結(jié)果。顯然用戶的反饋是十分重要的,一般而言搜索引擎對(duì)用戶反饋信息有以下利用方式,首先讓用戶接下來的搜索結(jié)果依賴于用戶上一次的反饋信息,顯然這是個(gè)性化的一種方式,其次讓搜索引擎通過用戶的反饋信息來改善整個(gè)索引結(jié)果,進(jìn)而得到用戶想要的搜索結(jié)果,這是搜索引擎系統(tǒng)的智能分析方法,同時(shí)還對(duì)搜索引擎的性能有一定的改善。

        (四)專業(yè)化

        除了以上所述的方法來優(yōu)化搜索引擎之外,既文檔的權(quán)威性、用戶查詢的相關(guān)性、個(gè)性化。提高搜索引擎的專業(yè)化同樣可以改善搜索引擎的性能。這里所說的搜索引擎專業(yè)化指,當(dāng)用戶檢索信息時(shí),搜索引擎只對(duì)其中的關(guān)鍵詞進(jìn)行資源匹配,進(jìn)而建立區(qū)別于一般的索引庫,即專業(yè)索引庫。搜索引擎可以根據(jù)用戶的需求直接在專業(yè)索引庫里進(jìn)行索引,這樣不僅縮短了檢索時(shí)間,還提高了檢索結(jié)果的準(zhǔn)確率。值得強(qiáng)調(diào)的是,對(duì)于專業(yè)索引庫的建立通常有以下幾種方法,首先搜索引擎系統(tǒng)根據(jù)用戶的搜索習(xí)慣建立特定的關(guān)鍵詞詞典,當(dāng)然這個(gè)專業(yè)詞詞典也可以由人工創(chuàng)造。其次是對(duì)網(wǎng)絡(luò)上的專業(yè)資源進(jìn)行分析,進(jìn)而自動(dòng)生成專業(yè)詞典。然而不論用哪種方法生成專業(yè)詞典,都必須保證其準(zhǔn)確性。

        二、優(yōu)化搜索引擎的其他方法

        當(dāng)然,提高搜索引擎的檢索性能遠(yuǎn)不止上述幾種方法,還有別的很多方法,通常有集成方法,這種方法可以綜合不同的搜索引擎的搜索結(jié)果,本地化方法,這種方法只檢索特定領(lǐng)域的信息,與專業(yè)化分析方法有幾分相似之處,多媒體方法,這種方法讓用戶可以搜索各種多媒體信息。另外,絕大多數(shù)用戶在一個(gè)特定的時(shí)間段內(nèi)的檢索內(nèi)容不會(huì)有太大的改變,基本都集中在一個(gè)領(lǐng)域,此時(shí),搜索引擎可以通過瀏覽器的緩存快速的顯示用戶的常用搜索結(jié)果,提高搜索引擎的準(zhǔn)確性。

        值得注意的是,在強(qiáng)調(diào)搜索引擎的準(zhǔn)確性時(shí),還必須注意搜索的速度及用戶的體驗(yàn),實(shí)際應(yīng)用時(shí)可以從軟硬件兩方面著手,首先從硬件方面來說,為了提高信息的處理速度,降低服務(wù)器的成本,可以采用集群系統(tǒng)。從軟件的方面來說,優(yōu)化編程代碼,進(jìn)而提高搜索系統(tǒng)的執(zhí)行效率。

        三、結(jié)束語

        綜上所述,目前網(wǎng)絡(luò)搜索引擎的發(fā)展重點(diǎn)是如何改善搜索引擎的性能,提高檢索的準(zhǔn)確率,提高用戶的使用體驗(yàn)。同時(shí)本文也提出了幾種優(yōu)化策略,并對(duì)相關(guān)的實(shí)現(xiàn)技術(shù)進(jìn)行了探討。從搜索引擎的長(zhǎng)遠(yuǎn)發(fā)展來看,搜索引擎系統(tǒng)是以硬件為基礎(chǔ)的,在實(shí)際應(yīng)用時(shí),不僅要從軟件方面改善搜索引擎的性能,還要不斷提高硬件配置??傊胱尵W(wǎng)絡(luò)搜索引擎更好地為人們服務(wù),仍需要大家的不斷努力。

        參考文獻(xiàn):

        [1]李曉明 王繼民,搜索引擎,科學(xué)出版社,2004年

        [2]劉奕群 馬少平 洪濤,搜索引擎技術(shù)基礎(chǔ),清華大學(xué)出版社,2010年

        婷婷四房播播| 日韩亚洲精品国产第二页| 亚洲av成人片无码网站| 蜜臀久久99精品久久久久久小说| 久久久国产精品va麻豆| 日韩精品一区二区三区免费视频 | 青青青国产免A在线观看| 日本在线一区二区免费| www国产亚洲精品久久麻豆| 午夜精品久久久久成人| 亚洲精品成人av一区二区| 亚洲福利一区二区不卡| 日本大片一区二区三区| 奇米影视色777四色在线首页| 国产成人无码一区二区在线观看| 神马不卡一区二区三级| 日本高清一区二区不卡| 无码国产精品久久一区免费| 国产主播一区二区三区在线观看| 国产精品亚洲A∨天堂| 久久综合久中文字幕青草| 日韩午夜理论免费tv影院| 午夜精品久久久久成人| 日本熟妇hd8ex视频| 极品夫妻一区二区三区| 久久伊人精品一区二区三区| 婷婷综合久久中文字幕蜜桃三电影| 久青青草视频手机在线免费观看 | 国产精品人人做人人爽人人添| 少妇人妻真实偷人精品视频| 欧洲亚洲色一区二区色99| 精品国产污黄网站在线观看| 99在线视频这里只有精品伊人| 免费国产在线精品一区| 无码国产精品一区二区vr老人| 国产美女69视频免费观看| 中文字幕亚洲高清精品一区在线| 日本精品少妇一区二区三区| 成年女人永久免费看片| 精品蜜桃视频在线观看| 国产亚洲精品熟女国产成人|