李芷瓊 長沙市第一中學(xué)
隨著國內(nèi)各主要經(jīng)濟(jì)城市之中社會成員生活和工作節(jié)奏的不斷加快,人們對各種信息內(nèi)容搜索和共享的需求量,也提出了全新速率的水準(zhǔn)需求。為在短時(shí)間內(nèi)更好的實(shí)現(xiàn)社會各個生產(chǎn)領(lǐng)域現(xiàn)代化電子信息傳遞方式多元化的發(fā)展目標(biāo),有關(guān)電子信息垂直搜索引擎的研究與實(shí)現(xiàn),就成為了倍受社會各界高度關(guān)注的重點(diǎn)探討話題。
在現(xiàn)代化電子信息技術(shù)研究領(lǐng)域的研發(fā)結(jié)論之中,有部分專業(yè)技術(shù)人員通過結(jié)合電子信息垂直搜索引擎的應(yīng)用步驟,也習(xí)慣將這一新型的信息檢索技術(shù)親切的稱之為,是主題搜索引擎的技術(shù)應(yīng)用方式。面對傳統(tǒng)信息檢索系統(tǒng)在實(shí)踐性應(yīng)用的過程之中,普遍存在的信息檢索速率較低、主題針對性較差,以及信息檢索結(jié)果的精準(zhǔn)度有待提升等弊端問題,新型電子信息垂直搜索引擎對其做出了不同程度的完善和加工。通過結(jié)合應(yīng)用新型信息查詢的電子服務(wù)工具,垂直搜索引擎實(shí)現(xiàn)了網(wǎng)絡(luò)信息資源的實(shí)時(shí)傳遞與抽取。通過將網(wǎng)絡(luò)資源共享平臺之中的信息內(nèi)容進(jìn)行高度的整合統(tǒng)計(jì),實(shí)現(xiàn)了對頁面信息檢索內(nèi)容的結(jié)構(gòu)化數(shù)據(jù)統(tǒng)計(jì)。新型信息檢索統(tǒng)計(jì)技術(shù)的設(shè)計(jì)與應(yīng)用,極大的提升了系統(tǒng)信息檢索搜尋的針對性,更好的提升了社會成員對于電子信息內(nèi)容搜尋和獲取的實(shí)踐效率。
工作人員通過在電子搜索引擎的核心技術(shù)芯片當(dāng)中構(gòu)建特定的檢索種子,幫助和引導(dǎo)垂直搜索引擎構(gòu)建更加高效率的網(wǎng)絡(luò)抓取模式。通常情況下,技術(shù)人員可以通過結(jié)合應(yīng)用NUTCH的模塊系統(tǒng)處理模式,構(gòu)建指定電子信息搜索引擎當(dāng)中的抓取版圖。為更好的保障指定垂直電子信息搜索引擎在實(shí)踐應(yīng)用時(shí)的信息檢索效率,工作人員可以通過結(jié)合引擎即將應(yīng)用的信息檢索環(huán)境,為其設(shè)定層次化的信息傳遞框架。在高層管理的檢索運(yùn)行框架之中,電子信息內(nèi)容的下載,是需要受到技術(shù)工作人員重點(diǎn)關(guān)注和修繕的功能檢索版塊。在此技術(shù)之上,工作人員還需要結(jié)合信息資源存儲、電子信息轉(zhuǎn)碼處理以及引擎構(gòu)建和信息查詢版塊,更好的保障信息內(nèi)容下載與傳遞的安全性和時(shí)效性。
數(shù)據(jù)倉庫的構(gòu)建是能夠保障信息搜索引擎秩序化運(yùn)轉(zhuǎn)的前提條件之一,這一倉庫存儲版塊的構(gòu)建,需要技術(shù)人員結(jié)合應(yīng)用NUTCH和LUCENE,兩個比較具有代表性的信息處理系統(tǒng)。兩個現(xiàn)代化信息處理系統(tǒng)之中的前者,在實(shí)際應(yīng)用的過程之中,主要可以用于處理主頁信息檢索界面的信息抓取工作。而兩種代表性信息處理系統(tǒng)之中的后者,則主要可以被工作人員靈活應(yīng)用于文件電子信息內(nèi)容的反方向檢索。在必要時(shí),工作人員還可以在倉儲數(shù)據(jù)庫當(dāng)中融入安裝電子數(shù)據(jù)分析裝置,以便能夠在統(tǒng)一的信息檢索模式下,更好的提升檢索系統(tǒng)對于描述信息感應(yīng)和識別的工作效率。
構(gòu)建電子信息檢索版塊,是新型垂直檢索引擎構(gòu)建與應(yīng)用的核心技術(shù)環(huán)節(jié)。技術(shù)人員可以通過應(yīng)用電子編程語言,實(shí)現(xiàn)對檢索引文文件的信息轉(zhuǎn)碼。為更好的提升檢索系統(tǒng)對于中文文字詞匯識別和傳遞的精準(zhǔn)度,技術(shù)人員可以結(jié)合應(yīng)用新華電子辭典當(dāng)中存儲的中文詞匯,幫助提升系統(tǒng)檢索版塊在分詞檢索識別方面的識別能力。但需要工作人員重點(diǎn)關(guān)注的是,中文電子辭典當(dāng)中的詞匯信息在檢索版塊當(dāng)中的應(yīng)用,需要結(jié)合一個系統(tǒng)而完整的哈希表。工作人員可以將檢索信息識別的認(rèn)知范圍,從傳統(tǒng)短句識別的方式,進(jìn)一步優(yōu)化成如今單字詞匯檢索識別的搜尋強(qiáng)度之內(nèi)。檢索詞匯字?jǐn)?shù)的降低,能夠在一定程度上提升信息檢索所得結(jié)果的精準(zhǔn)度。在此基礎(chǔ)之上,系統(tǒng)對于檢索軌跡以及檢索結(jié)果的儲備,應(yīng)當(dāng)定期做出軌跡清除以及結(jié)果儲備的信息處理工作。只有整個信息檢索的客觀環(huán)境能夠保持在優(yōu)良秩序化的發(fā)展模式之下,新型垂直信息檢索引擎的研究與應(yīng)用,才能夠更好的彰顯系統(tǒng)在實(shí)際應(yīng)用過程之中的運(yùn)行價(jià)值。
總而言之,電子信息垂直搜索引擎的應(yīng)用與研究,是在傳統(tǒng)信息檢索方式的基礎(chǔ)之上,結(jié)合應(yīng)用計(jì)算機(jī)信息處理技術(shù)產(chǎn)生并發(fā)展起來的一種,全新的技術(shù)檢索手段。這一信息檢索方式的應(yīng)用,有效提升了電子信息系統(tǒng)運(yùn)轉(zhuǎn)和檢索的工作運(yùn)行效率,為人類社會的生產(chǎn)和生活帶來了巨大的便利,是國際社會電子信息資源共享研發(fā)領(lǐng)域之中的一大創(chuàng)新型研發(fā)成果。
[1]閆東棟.新視角下互聯(lián)網(wǎng)金融的發(fā)展現(xiàn)狀以及傳統(tǒng)銀行的對策建議[J]. 內(nèi)蒙古統(tǒng)計(jì),2016,02:8-9.