【摘要】 互聯(lián)網(wǎng)時(shí)代下搜索引擎已經(jīng)成為了重要的工具,即便是對(duì)于普通用戶而言也發(fā)揮了重要的作用,在用戶瀏覽網(wǎng)頁(yè),尋找資料時(shí)搜索引擎極大程度上為用戶帶來了便捷促使用戶可以更快速地獲取信息。從搜索引擎發(fā)展來看,傳統(tǒng)引擎構(gòu)架及服務(wù)方式已經(jīng)變得十分成熟,但隨著用戶基數(shù)的增加以及用戶要求水平越來越高,使得搜索引擎正從傳統(tǒng)模式向智能模式所轉(zhuǎn)變,其中JAVA技術(shù)則發(fā)揮了重要的作用。本文對(duì)基于JAVA技術(shù)的搜索引擎進(jìn)行了綜合性分析,提出了相關(guān)觀點(diǎn),供以參考。
【關(guān)鍵詞】 JAVA 搜索引擎 技術(shù)體系
搜索引擎本質(zhì)上屬于一類數(shù)據(jù)庫(kù),它主要由搜索器 、索引器 、檢索器以及用戶接口所構(gòu)成。其工作模式包括兩種即自動(dòng)信息搜集與定期搜索。以最常見的谷歌引擎為例,在一定周期時(shí)間內(nèi)會(huì)利用蜘蛛程序進(jìn)行主動(dòng)搜索,當(dāng)發(fā)掘出新的網(wǎng)站時(shí)便可以從網(wǎng)站中提取相關(guān)信息并將這些信息置于數(shù)據(jù)庫(kù)當(dāng)中[1]。
也就是說每隔一個(gè)周期搜索引擎數(shù)據(jù)庫(kù)的數(shù)據(jù)都會(huì)持續(xù)性地更新,一方面擴(kuò)大了搜索引擎的應(yīng)用范圍,另一方面為用戶也提供了極大的便捷。在搜索引擎使用過程中用戶通過搜尋關(guān)鍵詞便可在數(shù)據(jù)庫(kù)中進(jìn)行相關(guān)搜索,其中會(huì)涉及到各類特殊算法,經(jīng)過處理后將關(guān)聯(lián)程度以由高至低的順序向用戶反饋。JAVA技術(shù)的革新給搜索引擎的發(fā)展帶來了新的動(dòng)力,使其朝著更高的層次邁進(jìn)。
一、JAVA技術(shù)特征概述
相對(duì)于其他匯編語(yǔ)言,JAVA語(yǔ)言具有良好的兼容性,另外在通用性、安全性方面較其他語(yǔ)言更具優(yōu)勢(shì),另外JAVA語(yǔ)言涵蓋了以下特點(diǎn):首先JAVA語(yǔ)言具有良好的安全性,這種安全性對(duì)于網(wǎng)絡(luò)環(huán)境而言有著十分重要的意義,其安全機(jī)制能夠遏制相關(guān)代碼攻擊[2]。其次JAVA語(yǔ)言具有強(qiáng)制性特征,在其面向?qū)ο蟮倪^程中,通常情況僅僅支持類之間的單向繼承,在多個(gè)接口情況下則能夠進(jìn)行多處承接。再者JAVA語(yǔ)言呈現(xiàn)了良好的動(dòng)態(tài)性特點(diǎn),它可以滿足動(dòng)態(tài)性環(huán)境變化進(jìn)行匹配,這使得基于JAVA語(yǔ)言匯編的系統(tǒng)、軟件等均得到了良好的兼容性,特別是使對(duì)于應(yīng)用而言易于升級(jí)。另外JAVA語(yǔ)言具備多線程特征,這種特征使得相關(guān)應(yīng)用及系統(tǒng)的性能得到了保證,為開發(fā)者與使用者帶來了更高質(zhì)量的服務(wù)。
二、JAVA技術(shù)在搜索引擎中的應(yīng)用分析
利用JAVA技術(shù)可對(duì)搜索引擎進(jìn)行有效優(yōu)化,其中java 2 PSE、Lucne以及Tomcat等均是常見的開發(fā)工具。通過使用這些工具可以使JAVA應(yīng)用開發(fā)環(huán)境得到優(yōu)化,并且能夠讓搜索java類庫(kù)以及索引java類庫(kù)得以實(shí)現(xiàn)。本研究中網(wǎng)站搜索引擎構(gòu)建對(duì)JAVA技術(shù)的應(yīng)用進(jìn)行了分析[3]。以JAVA為基礎(chǔ)首先可以對(duì)網(wǎng)站內(nèi)部鏈接進(jìn)行優(yōu)化。從形式上來看網(wǎng)站內(nèi)部結(jié)構(gòu)復(fù)雜,但卻表現(xiàn)了顯著的層次性。因此為了讓網(wǎng)站能夠保持正常的工作狀態(tài)就需要構(gòu)建出一個(gè)通常的信息渠道,保持其暢通性,這樣才能促使網(wǎng)站良性運(yùn)作,并且使得網(wǎng)站內(nèi)部環(huán)境與外部環(huán)境關(guān)聯(lián)起來。以網(wǎng)站搜索為例,在網(wǎng)站中置入搜索框,那么該搜索框便可為用戶提供快速的信息獲取途徑。
同時(shí)可將其整合成一個(gè)針對(duì)性的平臺(tái)界面,歸類對(duì)象。這種形式可以讓用戶更好地在平臺(tái)上進(jìn)行交互從而讓業(yè)務(wù)面得以擴(kuò)充。對(duì)于搜索引擎而言網(wǎng)頁(yè)標(biāo)題也是關(guān)鍵的部分,因此需對(duì)其進(jìn)行優(yōu)化。標(biāo)題直接關(guān)系到了搜索引擎使用過程中的成效性,會(huì)影響搜索引擎的預(yù)判。另外從心理層面來看網(wǎng)頁(yè)標(biāo)題會(huì)對(duì)用戶產(chǎn)生一定程度的心理引導(dǎo)效應(yīng),若標(biāo)題具有吸引力則能夠吸引用戶點(diǎn)擊并查閱。因此利用JAVA技術(shù)結(jié)合網(wǎng)站布局在不同頁(yè)面構(gòu)建出不同的標(biāo)題,從而體現(xiàn)標(biāo)題的差異性。當(dāng)然標(biāo)題相互之間具有明顯的差異性,但是又體現(xiàn)了統(tǒng)一性,也就是說標(biāo)題整體內(nèi)容應(yīng)該圍繞網(wǎng)頁(yè)內(nèi)容組織構(gòu)建,不僅僅能夠?qū)W(wǎng)頁(yè)內(nèi)容進(jìn)行明確反映并促使兩者可相互匹配。JAVA匯編提升了網(wǎng)站系統(tǒng)的識(shí)別能力,讓網(wǎng)站的功能性得以增強(qiáng)。
在應(yīng)用JAVA技術(shù)的過程中Internet連接技術(shù)發(fā)揮了十分重要的作用,由于搜索引擎需要對(duì)網(wǎng)站中不同頁(yè)面的信息進(jìn)行調(diào)用,而JAVA則帶來了豐富的功能選擇。事實(shí)上在網(wǎng)絡(luò)中應(yīng)用計(jì)算機(jī)的過程中都離不開套接字類的作用,而端口則承擔(dān)了這種角色。
實(shí)際應(yīng)用時(shí)在一個(gè)特定的時(shí)刻存在唯一的服務(wù)器程序?qū)ο嗤亩丝谶M(jìn)行偵聽,而ServerSocket與Socket是JAVA定義的兩個(gè)重要類別,通過上述兩類可對(duì)關(guān)鍵字進(jìn)行聲明,從而構(gòu)建出一對(duì)一的連接。也就是說利用JAVA保證了套接字可對(duì)相關(guān)信息數(shù)據(jù)進(jìn)行直接讀取或?qū)懭?。另外需要注意的是JAVA可能對(duì)中文字體可能會(huì)產(chǎn)生亂碼,因此需要進(jìn)行針對(duì)性處理,另外可充分利用JAVA的多線程機(jī)制使得后臺(tái)運(yùn)行保持穩(wěn)定的狀態(tài)。
三、結(jié)語(yǔ)
JAVA為搜索引擎提供了重要的技術(shù)支持,特別是在搜索引擎智能化發(fā)展的情況下JAVA技術(shù)將得到更大的應(yīng)用空間讓搜索引擎的功能性得以完善。
參 考 文 獻(xiàn)
[1] 郭彥秋. 淺析百度與谷歌兩搜索引擎的比較與分析[J]. 才智. 2012(06)
[2] 勞志佳. 基于Lucene3.5搜索技術(shù)的研究與實(shí)現(xiàn)[J]. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2012(06)
[3] 吳文忠,易平. MapReduce在分布式搜索引擎中的應(yīng)用[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2012(02)