尹振鶴
摘 要:搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序搜集互聯(lián)網(wǎng)上的信息,在對信息進行組織和處理后,為用戶提供檢索服務的系統(tǒng)。它主要是用于檢索網(wǎng)站、網(wǎng)址、文獻信息等內(nèi)容。本文將從搜索引擎的工作方法和使用技巧等方面進行闡述。
關(guān)鍵詞:搜索引擎;元搜索引擎;關(guān)鍵詞
1 搜索引擎的工作方法
1.1 目錄式搜索引擎
這是一種網(wǎng)站級搜索引擎。目錄式搜索引擎由分類專家將網(wǎng)絡信息按照主題分成若干個大類,每個大類再分為若干個小類,依次細分,一般的搜索引擎分類體系有五六層,有的甚至十幾層。先由程序自動搜集信息,然后由編輯員查看信息,人工形成信息摘要,提供目錄瀏覽服務和直接檢索服務。由于目錄式搜索引擎的信息分類和信息搜集有人的參與,因此其搜索的準確度是相當高的,缺點是需要人工介入、維護量大、信息量少、信息更新不夠及時。Yahoo就是這類搜索引擎的代表。
1.2 全文搜索引擎
根據(jù)搜索結(jié)果來源的不同,全文搜索引擎可分為兩類,一類擁有自己的檢索程序(Indexer),俗稱“蜘蛛”(Spider)程序或“機器人”(Robot)程序,能自建網(wǎng)頁數(shù)據(jù)庫,搜索結(jié)果直接從自身的數(shù)據(jù)庫中調(diào)用,上面提到的Google和百度就屬于此類;另一類則是租用其他搜索引擎的數(shù)據(jù)庫,并按自定的格式排列搜索結(jié)果,如Lycos搜索引擎。
1.3 元搜索引擎
這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請求同時向多個預先選定的獨立搜索引擎遞交,將返回的結(jié)果進行重復排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。優(yōu)點是返回結(jié)果的信息量更大、更全,缺點是用戶需要做更多的篩選。第一個元搜索引擎,是美國華盛頓大學碩士生Eric Selberg和 Oren Etzioni開發(fā)的Metacrawler。元搜索引擎的搜索效果始終不理想,所以沒有哪個元搜索引擎有過強勢地位。
2 搜索引擎的使用方法與技巧
2.1 科學選擇關(guān)鍵詞
搜索引擎不具備智能識別能力,往往不能很好地把握用戶到底想要什么,它只能在現(xiàn)存的數(shù)據(jù)庫中查找匹配的關(guān)鍵詞,這種匹配相對比較盲目。因此,選擇合適的關(guān)鍵詞是成功檢索的第一步。關(guān)鍵詞的選擇雖然沒有什么定式,不過也有一些規(guī)律可循,在提取關(guān)鍵詞時力求做到規(guī)范,避免口語化,便能達到事半功倍的效果。
2.2 使用雙引號進行精確查詢
如果查找的是一個詞組或多個漢字,最好的辦法就是將它們用雙引號括起來,這樣得到的結(jié)果最少、最精確。例如,欲搜索某些學校的電子信箱,一般策略是在搜索框內(nèi)輸入“xxx學?!?,也可以嘗試如下兩種方法提高搜索效率:(1)同時輸入兩個關(guān)鍵詞,縮小檢索范圍,即“xxx學校email”或“xxx學校電子信箱”;(2)關(guān)鍵詞中加入電子信箱關(guān)鍵信息,即“xxx學校@”。因為任何電子信箱中均有“@”,“@”成了查找電子信箱的關(guān)鍵符號。通過這兩種方法,很容易就能將學校的電子信箱搜到。
2.3 使用加號(+)、減號(-)限定查找
很多搜索引擎都支持在搜索詞前冠以加號(+)限定搜索結(jié)果中必須包含的詞匯,用減號(-)限定搜索結(jié)果不能包含的詞匯。
2.4 靈活運用使用通配符
很多搜索引擎支持通配符號,如“*”代表1連串字符,“?”代表單個字符。
2.5 使用邏輯詞輔助查找
比較大的搜索引擎都支持使用邏輯詞進行更復雜的搜索界定,常用的有:AND(和)、OR(或)、NOT(否)及NEAR(兩個單詞的靠近程度),恰當應用它們可以使搜索結(jié)果非常精確。
2.6 按文件類型查找
如需要查找簡歷模版時可以構(gòu)建如下檢索式:“簡歷模版filetype:doc”,此時能搜到word格式的簡歷模版。此處的filetype:doc是限定檢索文件的類型,該字段必須在英文狀態(tài)下錄入,而“簡歷模版”是檢索的關(guān)鍵詞。兩個字段之間必須用空格隔開。同理,如果需要檢索市場營銷的教案也可以構(gòu)造“市場營銷教案filetype:ppt”的檢索式,檢索結(jié)果為ppt格式的市場營銷教案。該檢索式支持txt,ppt,xls,pdf,mp3,swf等常見文件類型。
2.7 巧用快照
有時會搜到訪問不了的“死鏈網(wǎng)頁”和過期文件,而看其內(nèi)容摘要很符合需要。此時可利用搜索引擎提供的網(wǎng)頁快照功能查閱此類文獻。
2.8 使用不同的搜索引擎
不同的搜索引擎,其信息覆蓋范圍有差異,我們平時搜索信息時僅集中于某一家搜索引擎是不明智的,因為再好的搜索引擎也有局限性,而使用優(yōu)秀的搜索引擎可以達到事半功倍的效果。
2.9 留意搜索引擎返回的結(jié)果
由于競價排名業(yè)務的推廣,搜索引擎返回的Web站點順序會影響人們的訪問。所以,為了增加Web站點的點擊率,一些Web站點會付費給搜索引擎,以在相關(guān)Web站點列表中顯示在靠前的位置。好的搜索引擎會鑒別Web站點的內(nèi)容,并據(jù)此安排它們的順序,但許多搜索引擎無法鑒別。
[參考文獻]
[1]王慕東.搜索引擎的發(fā)展狀況及使用技巧.信息系統(tǒng),2001(4).
[2]陳春陽.如何利用網(wǎng)絡搜索引擎檢索網(wǎng)絡信息資源.蘭州工業(yè)高等??茖W校學報,2003.
[3]張曼玲.現(xiàn)代信息檢索[M].哈爾濱工程大學出版社,2000.