亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        搜索引擎Google檢索語法研究

        2005-04-29 12:58:07曹正民
        中國信息技術(shù)教育 2005年3期
        關(guān)鍵詞:關(guān)鍵字域名網(wǎng)頁

        蘇 云 曹正民

        Google是斯坦福大學(xué)博士生Larry Page和Sergey Brin共同創(chuàng)立的。它支持132種語言,資料庫內(nèi)包含24億個網(wǎng)頁、7億個新聞檔案和3.3億個圖形文件,如果用人工檢索,每分鐘1頁,24小時不間斷工作,需要5707年才能完成一遍搜索,而用Google檢索不超過1秒種。Google現(xiàn)有15000多臺服務(wù)器,200多條T3級寬帶同時服務(wù),這使得它在搜索網(wǎng)站界的地位進(jìn)一步得以鞏固。

        Google的基本搜索語法

        Boolean邏輯檢索語法

        Boolean是指喬治·布爾提出的代數(shù)運算法則,常見的三種運算符是“與”、“或”和“非”,即AND、OR和NOT。在Google分別用“ ”(空格)、“-”和“|”表示,其中AND運算符表示對所有的關(guān)鍵字同時進(jìn)行搜索,OR運算符表示從幾個關(guān)鍵字中指定任意一個,NOT運算符表示在搜索結(jié)果中不包括某個關(guān)鍵字。如果有兩個或多個關(guān)鍵字,可以用括號連接,用運算符檢索時,至少要求包含兩個以上的關(guān)鍵字,最好用括號構(gòu)成邏輯運算式進(jìn)行檢索。

        強制搜索檢索語法

        在網(wǎng)頁中經(jīng)常包含有許多出現(xiàn)頻率極高,但無實際意義的高頻詞,例如英文單詞“a”、“the”和“i”等,中文的“的”和“啊”等,這些詞匯被Google保存在一個無用詞匯表中,但在檢索中它們是不可缺少的。例如,要搜索一些關(guān)于www起源的歷史資料,Google會把“www”和“的”都省略了,只搜索出關(guān)于“歷史”方面的資料,顯然不符合要求。因為Google把這個短語分成了“www”、“的”和“歷史”3個詞匯,而“www”和“的”被認(rèn)為是無實際意義的詞而忽略。如果要對忽略的關(guān)鍵字進(jìn)行強制搜索,需要在該關(guān)鍵字前加上“+”號,或者將上述的短語用英文雙引號括起來,Google就會進(jìn)行強制搜索。特別注意用“短語”和“句子”檢索是一種提高檢準(zhǔn)率非常有效的方法,但必須用英文引號將其括起來,最好配合“+”號同時使用。

        通配符和外文字符大小寫檢索問題

        Google支持通配符號,例如用“*”代表一連串字符,用“?”代表單個字符等,但對通配符支持有限,而且包含“*”必須用英文引號括起來。例如檢索“以*治國”,搜索結(jié)果可以是“以法治國”、“以德治國”等。

        Google對外文字符大小寫不敏感,搜索Three、three和THREE會得到相同的檢索結(jié)果。

        Google的特殊檢索語法

        通常用基本搜索語法可以解決絕大部分檢索問題,但要更準(zhǔn)確的檢索就需要了解特殊搜索語法,主要有限定標(biāo)題的intitle、allintitle,限定查找網(wǎng)址鏈接的inurl、allinurl和link,限定查找特定網(wǎng)站的site等語法,這些語法可以直接在Google的查找框內(nèi)輸入,相當(dāng)于命令行語法。

        搜索的關(guān)鍵字包含在URL鏈接中

        inurl語法返回的網(wǎng)頁鏈接中包含檢索的第一個關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中,因為很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,例如“MP3”、“GALLARY”和“Help”之類的目錄中,可以用inurl語法找到這些相關(guān)資源的鏈接,用第二個關(guān)鍵詞確定是否有某項具體資料。例如,查找MIDI曲《二泉映月》,檢索語法是inurl:midi "二泉映月"。注意在“inurl:”后面不能有空格,也不允許URL中含有“/”等符號。

        allinurl語法返回的網(wǎng)頁鏈接中包含所有作用關(guān)鍵字,這個查詢的關(guān)鍵字只集中于網(wǎng)頁的鏈接字符串。例如查找可能具有PHF安全漏洞的公司網(wǎng)站,通常這些網(wǎng)站的CGI-BIN目錄中含有PHF腳本程序,表現(xiàn)在鏈接中就是“域名/cgi-bin/phf”,搜索語法為:allinurl:"cgi-bin" phf +com。

        搜索的關(guān)鍵字包含在網(wǎng)頁標(biāo)題和網(wǎng)頁中

        intitle和allintitle的用法類似于inurl和allinurl,其中intitle限制搜索的網(wǎng)頁標(biāo)題,allintitle搜索所有關(guān)鍵字構(gòu)成標(biāo)題的網(wǎng)頁。例如查找著名作家巴金的照片集,檢索語法為:intitle: 巴金 "照片集"。

        intext只搜索網(wǎng)頁和/之間包含的關(guān)鍵詞的部分,它忽略了標(biāo)題、URL中含有的關(guān)鍵詞,例如intext:"yahoo.com";allintext檢索包含在中的所有關(guān)鍵詞。

        對搜索網(wǎng)站進(jìn)行限制

        site語法可以限制搜索范圍的域名,將搜索結(jié)果局限于某個具體網(wǎng)站或者網(wǎng)站頻道內(nèi),例如限定在新浪網(wǎng)站的教育頻道“edu.sina.com.cn”,或者是某個域名內(nèi),例如“com.cn”、“org”等,如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁面,只需用“-網(wǎng)站/域名”。例如,搜索中文教育科研網(wǎng)站(edu.cn)上關(guān)于中學(xué)數(shù)學(xué)課件的頁面,檢索語法為:中學(xué)數(shù)學(xué) 課件 site:edu.cn。此外,網(wǎng)站域名不能有“http://”的前綴,也不能含有任何“/”的目錄后綴,網(wǎng)站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。

        搜索所有鏈接到某個URL的網(wǎng)頁

        如果想知道有多少網(wǎng)站對一個學(xué)校主頁或教師個人主頁作了鏈接,link語法就能迅速達(dá)到這個目的。例如,搜索所有含指向清華大學(xué)鏈接的網(wǎng)頁,檢索語法為:link:www.tsinghua.edu.cn,即link語法得到的是一個所有包含了某個指定網(wǎng)址的頁面列表,但是link語法不能與其他語法混合使用。link語法還有一個妙用,一般做友情鏈接的網(wǎng)站都有許多相似的方面,這樣就可以通過這些友情鏈接,檢索出一批具有相似內(nèi)容的網(wǎng)站。例如,一個中國詩詞愛好者發(fā)現(xiàn)某網(wǎng)站非常不錯,就可以用link語法查一下與之做鏈接的網(wǎng)站,也許可以找到更多符合詩詞方面有趣的內(nèi)容。

        Google高級搜索語法

        在某一類文件中查找信息

        Google不僅能搜索文字網(wǎng)頁,還能對某些二進(jìn)制文檔進(jìn)行檢索,filetype就是一個非常強大實用的搜索語法,它已經(jīng)能檢索微軟的Office文檔(如xls、ppt、doc和rtf)、WordPerfect文檔、Lotus1-2-3文檔、Adobe的PDF文檔和ShockWave的SWF文檔(Flash動畫)等。filetype也可以搜索各種不同的頁面腳本語言,例如ASP、PHP和CGI等,filetype是搜索文件的后綴或者擴(kuò)展名。其中最實用的文檔搜索是PDF搜索,PDF是Adobe公司開發(fā)的電子文檔格式,是一種圖文并茂的綜合性文檔,現(xiàn)已經(jīng)成為互聯(lián)網(wǎng)電子出版的標(biāo)準(zhǔn)。目前Google檢索的PDF文檔大約有3000萬左右,大約占所有索引的二進(jìn)制文檔數(shù)量的80%。

        顯示與某鏈接相關(guān)的一系列搜索

        info語法提供一個和普通網(wǎng)址更多信息的頁面列表,包括網(wǎng)址緩存的鏈接、網(wǎng)址的鏈接、網(wǎng)址相關(guān)的鏈接和包含網(wǎng)址的頁面,即提供了cache、link、related和完全包含該鏈接的網(wǎng)頁的功能。例如,查找101遠(yuǎn)程教育網(wǎng)首頁相關(guān)的一些信息,檢索語法為:info:www.chinaedu.com,這里搜索的結(jié)果取決于Google是否對該URL進(jìn)行了索引,如果沒有,搜索結(jié)果會很少。

        對網(wǎng)頁更新日期作出限定

        daterange語法限制搜索特定時間段里的檢索內(nèi)容,這里特定時間是加入Google檢索的時間,而不是頁面創(chuàng)建的時間,它評價搜索引擎的好壞和更新頻率的指標(biāo),它支持的日期格式為凱撒日格式(julian),Google提供通用日期數(shù)值切換成凱撒日格式的自動轉(zhuǎn)換功能。檢索語法為:"George Bush" daterange:2452389-2452389。

        搜索的關(guān)鍵字包含在網(wǎng)頁的“錨”鏈點內(nèi)

        “錨”(anchor)就是在同一個網(wǎng)頁中快速切換鏈接點,inanchor語法搜索鏈接中包含錨點標(biāo)記,錨點標(biāo)記是指鏈接的標(biāo)記, 例如

        以上介紹的檢索語法最好組合使用,例如,用Google檢索Flash動畫,檢索語法為:“filetype:swf inurl:swf”,就會得到幾萬個Flash動畫。

        Google圖片搜索

        檢索圖像時,只需進(jìn)入Google圖像搜索界面,在關(guān)鍵字欄內(nèi)輸入描述圖像內(nèi)容的關(guān)鍵詞,就會搜到大量圖片。Google圖片的排列標(biāo)準(zhǔn)是按圖片文件名完全符合關(guān)鍵詞的結(jié)果排列靠前,然后按照普通頁面搜索時的標(biāo)準(zhǔn)排列。圖像搜索結(jié)果頁面由許多直觀縮略圖(THUMBNAIL)、對該縮略圖的簡單描述(圖像文件名稱、大?。┑冉M成。點擊縮略圖后,頁面分成兩幀,上幀是圖像縮略圖和相應(yīng)頁面的鏈接,下幀是該圖像所處的頁面,屏幕右上角有“Remove Frame”按鈕,可將框架頁面切換到單幀結(jié)果頁面。

        Google圖像搜索支持布爾搜索語法和一些高級檢索語法,例如site、filetype等。其中filetype語法的擴(kuò)展名只能是幾種限定的圖片類型,如JPG,GIF等。例如,要查找新浪網(wǎng)上數(shù)學(xué)家華羅庚的圖片,檢索語法為:華羅庚 site:sina.com.cn。這種方法對檢索分散的、隨機分布的各種新聞報道中的圖片非常有效,尤其適合報紙雜志的編輯,是一個雪中送炭式的工具。

        一般提供圖片的網(wǎng)站通常把圖片放在某個專門目錄下,如gallary、album、photo和image等,即要搜索的圖片處于某個專門的圖片集合中,就可以使用inurl語法找到這類目錄。例如要找毛澤東的照片集,檢索語法為:毛澤東OR毛主席inurl:photo;也可以用intitle語法找到這類網(wǎng)頁,因為提供圖片集合的網(wǎng)頁在標(biāo)題欄內(nèi)通常會有注明圖片集合的說明文字,檢索語法為:intitle:" 毛澤東" picture;有時追星族會申請免費個人主頁存放他們偶像的靚照,用site語法指定某免費主頁提供站點,也是迅速找到圖片的好辦法,檢索語法為:"毛澤東" site: www.cnsphoto.com。

        Google的輔助功能

        單詞英文用法檢索

        寫英文文章時,如果對某個英文單詞的用法不確定,Google的單詞英文檢索能使這個問題迎刃而解。當(dāng)查找某個單詞的解釋和用法時,只需進(jìn)入英文的Google界面,輸入要查的單詞,Google在線詞典就會給出正確答案。如果英文單詞拼寫錯誤,Google還有糾錯功能。

        網(wǎng)頁翻譯

        機器翻譯是一個前沿的人工智能課題,目前要求計算機在線翻譯結(jié)果與人工翻譯結(jié)果相同是不現(xiàn)實的,但Google翻譯的網(wǎng)頁使用戶基本上能夠看懂。如果搜索結(jié)果頁面語言是拉丁語、法語、西班牙語、德語和葡萄牙語,只需點擊Google結(jié)果頁面上的“Translate this page”按鈕即可,雖然目前支持的語言有限,但不得不承認(rèn)這是個杰出功能。

        查詢縮寫字

        縮寫字可以方便人們記憶和使用,但常使人不知道其實質(zhì)含義,Google的縮寫字的查詢功能非常強大,例如輸入:Define: IMF,就會搜索到許多說明IMF含義的網(wǎng)頁。

        同義詞匹配查詢

        Google提供了同義詞匹配查詢,同時支持英文和中文。例如輸入:編程 help,會搜索到編程 help、編程 FAQ和編程 tutorial等網(wǎng)頁。

        搜索結(jié)果過濾

        互聯(lián)網(wǎng)上不健康的內(nèi)容非常多,很多站點具有欺騙或者其他不良企圖,用戶瀏覽時很容易掉入其中的陷阱,Google設(shè)立了成人內(nèi)容過濾功能,即Safe Search Filtering選項,但中文狀態(tài)下的Google尚沒有啟用該功能。

        實用的計算器

        在Google的搜索框中輸入任何一個數(shù)學(xué)表達(dá)式,便可得到運算結(jié)果,它支持多算子的數(shù)學(xué)運算、支持單算子運算和函數(shù)數(shù)學(xué)運算;還支持物理、化學(xué)等學(xué)科常規(guī)單位的轉(zhuǎn)換運算,對習(xí)慣使用計算機進(jìn)行計算的用戶提供了便利。

        Google現(xiàn)在處于發(fā)展和試驗階段的新功能還有:分類廣告搜索、術(shù)語查詢、語音查詢和鍵盤查詢等。

        猜你喜歡
        關(guān)鍵字域名網(wǎng)頁
        履職盡責(zé)求實效 真抓實干勇作為——十個關(guān)鍵字,盤點江蘇統(tǒng)戰(zhàn)的2021
        華人時刊(2022年1期)2022-04-26 13:39:28
        成功避開“關(guān)鍵字”
        基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計
        電子制作(2018年10期)2018-08-04 03:24:38
        如何購買WordPress網(wǎng)站域名及綁定域名
        基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
        電子制作(2017年2期)2017-05-17 03:54:56
        網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
        電子測試(2015年18期)2016-01-14 01:22:58
        騰訊八百萬美元收購域名
        10個必知的網(wǎng)頁設(shè)計術(shù)語
        基于用戶反饋的關(guān)系數(shù)據(jù)庫關(guān)鍵字查詢系統(tǒng)
        頂級域名爭奪戰(zhàn):ICANN放出1930個通用頂級域名,申請者有上千家
        一区二区三区岛国av毛片| 中文字幕手机在线精品| 亚洲女同恋av中文一区二区| 国产综合色在线精品| 大肉大捧一进一出好爽视频mba| 成人动漫久久| 国产人妖一区二区av| 日本人妻伦理在线播放| 手机看片久久国产免费| 欧美成人免费高清视频| 成年人视频在线播放视频| 国产一区二区三区视频地址| √新版天堂资源在线资源| 亚洲性啪啪无码av天堂| 国产精品视频久久久久| 少妇又紧又色又爽又刺| 亚洲乱码中文在线观看| 久久综合狠狠综合久久| 精品中文字幕久久久久久| 91热久久免费频精品99| 波多野结衣av一区二区全免费观看| 国产精品久久久久久久免费看| 成人在线免费视频亚洲| 亚洲精品中文字幕一二| 国产va免费精品观看精品| 无尽动漫性视频╳╳╳3d| 西西人体大胆视频无码| 日韩国产精品一区二区三区 | 亚洲国产精品无码aaa片| 国产卡一卡二卡三| 亚洲精品国产品国语在线app| 看中文字幕一区二区三区| 天天躁夜夜躁av天天爽| 日本三级欧美三级人妇视频| 日韩AV无码乱伦丝袜一区| 亚洲国产精品成人av在线不卡| 曰本无码人妻丰满熟妇啪啪| 免费一本色道久久一区| 日本女同视频一区二区三区| 欧美大片aaaaa免费观看| 久久AⅤ无码精品为人妻系列|