段毅
摘 要 搜索引擎網站是現代民眾在參與開展日常化生產生活實踐活動過程中,在收集和獲取類型多樣的網絡性數據信息要素過程中需要運用的工具性網站。近年來,大數據技術在搜索引擎網站設計和建設工作實踐過程中的引入運用,在支持和助力現代搜索引擎網站實際應用功能不斷改善優(yōu)化方面做出了積極貢獻。本文圍繞基于大數據的搜索引擎設計與實現論題,擇取三個具體方面展開了簡要闡釋。
關鍵詞 大數據 搜索引擎 設計 實現 探討分析
中圖分類號:TP311文獻標識碼:A
伴隨著現代科學技術的快速穩(wěn)定有序發(fā)展,搜索引擎網站正在逐步成為現階段世界各國民眾在獲取和處理類型多樣的數據信息資源要素過程中,需要依賴和運用的不可獲取的工具和渠道。從歷史性發(fā)展演化過程角度展開闡釋,搜索引擎網站從早期1993年的Excite網站,經歷中期的Yahoo網站、Altsvista網站、Inktomi網站,以及Google網站,逐步發(fā)展到了現在的智能化搜索技術應用階段,為我國民眾在參與開展日常生產生活活動過程中,收集獲取類型多樣的數據信息資源要素,構筑和提供了有效且充分的便利性支持條件。最近幾年以來,大數據技術的日漸發(fā)展成熟和廣泛引入運用,實現了對現實網絡技術環(huán)境之中數量龐大且類型多樣的數據信息資源要素的全面充分的調動、整合,以及具體運用,在深刻影響搜索引擎類工具網站的建設思路和運行技術特征條件下,為我國現代網絡技術體系綜合性建設發(fā)展效能的持續(xù)提升做出了積極貢獻。有鑒于上述研究背景,本文將會圍繞基于大數據的搜索引擎設計與實現論題,展開簡要闡釋。
1搜索引擎網站的歷史發(fā)展過程
從歷史性角度展開闡釋分析,搜索引擎工具網站在其發(fā)展過程中,依次經歷了三次備受矚目的技術變革進程:
第一代搜索引擎工具網站的建設過程,是以傳統(tǒng)的人工目錄分類導航技術作為其基礎支持條件的,這一階段的代表性網站是Yahoo搜索網站,其最為顯著的技術應用弊端,在于其實際獲取的檢索結果在相關性層面較為欠缺,實際的排列呈現順序嚴重缺乏合理性,且僅能針對全部互聯網數據信息要素中的16.00%展開搜索分析,且用戶通常需要在排列狀態(tài)雜亂無章的數據信息要素之中找尋自身想要獲取的目標信息要素。
第二代搜索引擎工具網站的建設過程實現了對文本處理技術形態(tài)的有效運用,且在檢索結果呈現方式層面引入了科學化的排序方法,但在搜索技術實現方式層面依然需要依賴關鍵詞技術和特殊算法技術的基礎支持條件,其代表性網站為Google網站,其主要技術應用優(yōu)勢,在與第一代搜索引擎工具網站相對比條件下,有效改善提升了其檢準率指標、檢全率指標和檢索速度指標,實現了較好的技術發(fā)展應用收益。
第三代搜索引擎工具網站指的是智能化的搜索引擎,其本身具備技術智能化特點、功能人性化特點、搜索專業(yè)化特點等多樣化的技術特點和優(yōu)勢,其建設發(fā)展過程中綜合性地調動和運用了人工智能技術、數據挖掘技術、模糊匹配技術、神經網絡技術,以及數理分析技術等為代表的多樣化技術手段,其代表性網站包含百度網站、搜狗網站、WolframAlpha網站、Ask jeeves網站、以及Google網站等。
2大數據技術背景下智能搜索引擎的基本特點
第一,在大數據技術應用背景下,智能搜索引擎網站在建設過程中應用的技術形態(tài)具備先進性和復雜性,實現了對類型多樣的現代化網絡應用技術形態(tài)的綜合性引入運用,在搜索引擎網站的整體性使用功能層面,展示出了多樣性和先進性特征。
第二,在大數據技術應用背景下,智能搜索引擎網站在檢索結果的總體數量和排列方式層面能夠更加更充分地滿足目標用戶的實際使用需求,獲取到良好的綜合效益。
3大數據技術背景下搜索引擎網站的設計與實現思路
第一,基于大數據技術應用背景之下開展搜索引擎網站的設計建造工作,應當綜合性引入運用人工智能技術、數據挖掘技術、模糊匹配技術、神經網絡技術,以及數理分析技術等現代技術形態(tài),在持續(xù)豐富網站的技術功能體系條件下,提升其運行穩(wěn)定性。
第二,基于大數據技術應用背景之下開展搜索引擎網站的設計建造工作,應當針對網站搜索界面的結果排列方式進行優(yōu)化選取,確保實際呈現的搜索結果,能夠充分滿足目標用戶的使用需要。
4結束語
圍繞基于大數據的搜索引擎設計與實現論題,本文擇取搜索引擎網站的歷史發(fā)展過程、大數據技術背景下智能搜索引擎的基本特點,以及大數據技術背景下搜索引擎網站的設計與實現思路,三個具體方面展開了簡要的闡釋分析,旨在為相關領域的研究人員,以及一線技術工作人員,構筑和提供有效且充分的經驗參考支持條件。將大數據技術引入運用到搜索引擎網站的設計和建造領域,對于優(yōu)化提升現代搜索引擎網站建設與運用工作的綜合效能具備重要意義。
參考文獻
[1] 韓家寶.圖數據搜索引擎Trinity中正則表達式匹配子系統(tǒng)的設計與實現[D].哈爾濱:哈爾濱工業(yè)大學,2015.
[2] 陳臣.大數據時代基于個性化服務的數字圖書館數據搜索引擎設計[J].圖書館理論與實踐,2015(04):91-94.
[3] 周智清,劉百林,劉勛.基于OAI-PMH的元數據搜索引擎的設計與實現[J].蘭州大學學報(自然科學版),2009,45(S1):147-152.
[4] 李勇文.OAI元數據搜索引擎的設計與實現[J].現代圖書情報技術,2005(02):37-39+32.