摘 要 現(xiàn)代科技的飛速發(fā)展使互聯(lián)網(wǎng)計(jì)術(shù)得到更好的運(yùn)用,搜索引擎幾乎作為人們?nèi)粘K璧谋貍淦?。但由于社?huì)的進(jìn)步,人們需求的增多,計(jì)算機(jī)搜索引擎技術(shù)已經(jīng)不能夠滿足人們所需,所以計(jì)算機(jī)搜索引擎加入智能化技術(shù)能夠準(zhǔn)確、迅速并且更加智能的達(dá)到用戶目的。本文重點(diǎn)分析了計(jì)算機(jī)搜索引擎計(jì)術(shù)及智能化技術(shù)的特點(diǎn)研究。
關(guān)鍵詞 計(jì)算機(jī) 搜索引擎 智能化 技術(shù)
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A
0前言
搜索引擎也可被稱作一種程序,通過(guò)對(duì)用戶提供的關(guān)鍵詞進(jìn)行計(jì)算、分類、搜索、返回,達(dá)到向用戶推送需要信息的操作。但搜索引擎會(huì)因?yàn)閿?shù)據(jù)庫(kù)信息龐大、語(yǔ)言信息復(fù)雜、SEO作弊優(yōu)化等情況降低搜索效率及準(zhǔn)確性,所以搜索引擎加入智能化技術(shù)勢(shì)在必行。
1計(jì)算機(jī)搜索引擎計(jì)術(shù)
1.1搜索引擎原理
計(jì)算機(jī)搜索引擎的來(lái)源是根據(jù)數(shù)據(jù)庫(kù)內(nèi)相關(guān)內(nèi)容的搜索操作發(fā)展而成,目前的搜索引擎已經(jīng)不再局限于數(shù)據(jù)庫(kù)內(nèi)相關(guān)內(nèi)容的搜索,發(fā)展到針對(duì)互聯(lián)網(wǎng)搜索的操作。
搜索引擎技術(shù)種類繁多,我們常用的有綜合門戶類(百度、谷歌類)和鏈接評(píng)價(jià)類。無(wú)論哪種技術(shù)都是用戶通過(guò)對(duì)關(guān)鍵詞的設(shè)定在搜索互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)中進(jìn)行搜索,并能搜索到準(zhǔn)確或備用信息返回給用戶。
這種搜索是利用SPIDER蜘蛛在互聯(lián)網(wǎng)內(nèi)各種開放性信息之間進(jìn)行搜索,我們稱之為SPIDER蜘蛛機(jī)器人。蜘蛛爬行搜索是根據(jù)提供的關(guān)鍵詞,起始一個(gè)URL列表,利用鏈接形式進(jìn)行整個(gè)互聯(lián)網(wǎng)的搜索,有的網(wǎng)站在ROBOTS文件中設(shè)置禁止蜘蛛爬行,這不屬于公開信息類,所以蜘蛛在搜索過(guò)程中將此類網(wǎng)站排除。直至URL列表為空或數(shù)據(jù)庫(kù)磁盤已滿,搜索終止。
1.2搜索引擎的障礙
搜索引擎目前具有一定的局限性,由于信息分類不夠準(zhǔn)確、信息排序能力不強(qiáng)或信息更新速度慢、信息評(píng)價(jià)無(wú)作用等情況阻礙了搜索引擎的發(fā)展。
信息分類不夠準(zhǔn)確,因?yàn)樵趯?duì)信息建立時(shí)便不能準(zhǔn)確處理,信息內(nèi)容復(fù)雜,類別自然多樣化。當(dāng)關(guān)鍵詞出現(xiàn)的概率和信息類別、信息內(nèi)容處理不平衡時(shí),導(dǎo)致信息分類不準(zhǔn)確。
人們現(xiàn)在所使用的搜索引擎,實(shí)際上為準(zhǔn)確排序做了優(yōu)化工作。但由于SEO優(yōu)化過(guò)程中很容易投機(jī)取巧、進(jìn)入極端優(yōu)化,導(dǎo)致搜索引擎在排序方面出現(xiàn)錯(cuò)誤。某些網(wǎng)站在做SEO優(yōu)化時(shí)采用作弊行為優(yōu)化排名,這種行為在搜索引擎中很難被發(fā)現(xiàn),所以會(huì)出現(xiàn)作弊網(wǎng)站的排名至前。眾所周之,互聯(lián)網(wǎng)的信息量巨大,為我們提供很好的生活幫助,但也是由于信息量過(guò)大,導(dǎo)致一些信息更新不及時(shí),經(jīng)常會(huì)發(fā)生一些信息不能跟進(jìn)實(shí)時(shí)搜索或者信息搜索位置不變等情況。
搜索引擎的障礙還體現(xiàn)于搜索引擎中收錄的信息評(píng)價(jià)能力弱,舉例說(shuō)明,網(wǎng)站上設(shè)置多個(gè)關(guān)鍵詞,基本類似,這樣可以增加搜索引擎的收錄和排名,但這種收錄情況對(duì)用戶基本沒有用處。目前計(jì)算機(jī)搜索引擎還未能對(duì)信息進(jìn)行客觀評(píng)價(jià),從而篩選出關(guān)鍵詞和信息內(nèi)容相匹配的信息。
2搜索引擎智能化技術(shù)分析
當(dāng)計(jì)算機(jī)搜索引擎發(fā)現(xiàn)諸多障礙時(shí),人們必須及時(shí)解決這些障礙。計(jì)算機(jī)搜索引擎融入智能化技術(shù)后,從原有的基礎(chǔ)算法更新到智能知識(shí)層面的算法,實(shí)現(xiàn)與用戶之間自然語(yǔ)言的智能搜索。
2.1智能搜索引擎的特點(diǎn)
2.1.1智能屬性
融入智能搜索引擎后蜘蛛爬行過(guò)程中將對(duì)信息進(jìn)行自動(dòng)索引并分析,對(duì)搜索結(jié)果更清楚準(zhǔn)確,將更有價(jià)值的搜索內(nèi)容存入到數(shù)據(jù)庫(kù)中。
2.1.2主動(dòng)屬性
智能搜索引擎通過(guò)對(duì)用戶的搜索,主動(dòng)對(duì)用戶進(jìn)行分析,及時(shí)調(diào)整用戶所用信息。
2.1.3交互屬性
智能搜索引擎會(huì)通過(guò)語(yǔ)音識(shí)別技術(shù)將用戶的語(yǔ)境進(jìn)行分析,準(zhǔn)確的把握用戶和需求。
2.1.4個(gè)性化屬性
智能搜索引擎能夠讓用戶隨意定制不同的起始頁(yè),或?qū)⒊S镁W(wǎng)站或內(nèi)容放至網(wǎng)站首頁(yè)等。
2.2智能搜索引擎技術(shù)分析
通過(guò)上文描述,智能搜索引擎技術(shù)中包含兩種技術(shù),機(jī)器翻譯與語(yǔ)義理解技術(shù)。機(jī)器翻譯是將文字語(yǔ)言和計(jì)算機(jī)語(yǔ)言進(jìn)行轉(zhuǎn)換,功能特別適用于使用方言或外語(yǔ)進(jìn)行搜索時(shí),計(jì)算機(jī)會(huì)通過(guò)語(yǔ)言形式進(jìn)行計(jì)算機(jī)語(yǔ)言的搜索,然后將搜索到的信息從計(jì)算機(jī)語(yǔ)言翻譯到輸入語(yǔ)言形式呈現(xiàn)給用戶。語(yǔ)義理解是利用語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)對(duì)語(yǔ)音的詞語(yǔ)、聲音、語(yǔ)調(diào)進(jìn)行分析并準(zhǔn)確理解。
計(jì)算機(jī)搜索引擎對(duì)語(yǔ)言識(shí)別能力已經(jīng)非常準(zhǔn)確,但加入智能化技術(shù)的搜索引擎會(huì)更加準(zhǔn)確的把握關(guān)鍵詞、短語(yǔ)和語(yǔ)境的理解技術(shù)。漢語(yǔ)分詞技術(shù)、短語(yǔ)識(shí)別技術(shù)、同義詞之間轉(zhuǎn)換等都加強(qiáng)了計(jì)算機(jī)搜索的功能性。
3結(jié)論
目前很多搜索引擎已經(jīng)融入了智能化技術(shù),搜索引擎算法一直更新,使用云搜索處理技術(shù)為人們提供了更多樣化的服務(wù)。智能化搜索引擎能夠更準(zhǔn)確、迅速的為用戶提供信息,同時(shí)也可以排除網(wǎng)站在SEO優(yōu)化方面的作弊情況,讓網(wǎng)絡(luò)信息更加優(yōu)質(zhì)。
參考文獻(xiàn)
[1] 王偉.搜索引擎智能化技術(shù)中若干關(guān)鍵問(wèn)題的研究與實(shí)現(xiàn)[D].河北:河北科技大學(xué),2011.
[2] 許武權(quán).基于Web文本信息的智能檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:電子科技大學(xué),2011.
[3] 鄭文良.基于簡(jiǎn)單本體的農(nóng)業(yè)P2P搜索引擎關(guān)鍵技術(shù)研究[D].沈陽(yáng):沈陽(yáng)農(nóng)業(yè)大學(xué),2013.
[4] 馮元勇.智能搜索器的概念庫(kù)設(shè)計(jì)及其文檔評(píng)價(jià)策略[D].福建:中南大學(xué),2002.
[5] 鄧俊濤.基于多Agent協(xié)作的智能搜索引擎的研究[D].武漢:武漢理工大學(xué),2007.