韓嬌紅
(安陽(yáng)師范學(xué)院計(jì)算機(jī)與信息工程學(xué)院,河南 安陽(yáng) 455002)
社會(huì)進(jìn)入信息時(shí)代,不僅信息的數(shù)量急劇增長(zhǎng),而且信息檢索的對(duì)象和信息需求的主體也發(fā)生了極大變化。信息檢索的對(duì)象從相對(duì)封閉、集中管理的信息內(nèi)容擴(kuò)展到開(kāi)放、動(dòng)態(tài)、更新快、分布廣泛、管理松散的Web內(nèi)容;信息用戶由原來(lái)的情報(bào)專(zhuān)業(yè)人員擴(kuò)展到包括商務(wù)人員、管理人員、教師學(xué)生、各專(zhuān)業(yè)人士等在內(nèi)的普通大眾,他們對(duì)信息檢索從結(jié)果到方式提出了更高、更多樣化的要求。目前,信息檢索已經(jīng)發(fā)展到網(wǎng)絡(luò)化和智能化階段,適應(yīng)網(wǎng)絡(luò)化、智能化以及個(gè)性化的需要是目前信息檢索技術(shù)發(fā)展的新趨勢(shì)。其中智能化信息檢索成為研究的熱點(diǎn)。
2.1.1 發(fā)展初期及形式(1985~1987)
網(wǎng)絡(luò)化的逐步形成日益改變了人們的工作和生活方式,尤其被稱為人類(lèi)三大尖端技術(shù)之一的人工智能技術(shù)的出現(xiàn)和發(fā)展,給人類(lèi)社會(huì)帶來(lái)了強(qiáng)烈的活力,傳統(tǒng)的信息檢索在理論和實(shí)踐方面因此受到了巨大的沖擊,表現(xiàn)出許多自身難以克服的弊端,國(guó)外智能信息檢索就是在這種背景下提出的。在我國(guó),信息工作者也不甘落后,從20世紀(jì)80年代中期開(kāi)始了對(duì)智能信息檢索的研究。
2.1.2 發(fā)展高峰期(1988~1991)
人工智能經(jīng)過(guò)多年的發(fā)展已日趨完善。國(guó)外在20世紀(jì)90年代初已達(dá)到了高峰,這也為我國(guó)智能信息檢索提供了基礎(chǔ)。從國(guó)內(nèi)來(lái)看,這也是我國(guó)情報(bào)學(xué)發(fā)展的黃金時(shí)期,大量情報(bào)學(xué)文獻(xiàn)在此期間問(wèn)世,其中還包括大量智能情報(bào)檢索研究的文獻(xiàn)。
2.1.3 逐步回落時(shí)期(1992~)
人工智能信息檢索是一項(xiàng)難度很大的課題,首先要解決電腦思維與人腦思維有機(jī)結(jié)合的問(wèn)題,在人工智能沒(méi)有突破性進(jìn)展的情況下,其應(yīng)用領(lǐng)域也不會(huì)有大的進(jìn)步。計(jì)算機(jī)表現(xiàn)出的局限性使信息檢索智能化發(fā)展不可避免地受到影響。我國(guó)對(duì)智能信息檢索的研究開(kāi)始原地踏步,甚至回落,從高潮走進(jìn)了低谷。
目前,我國(guó)的智能信息檢索基本處在理論認(rèn)識(shí)與實(shí)驗(yàn)階段。通過(guò)傳統(tǒng)信息檢索系統(tǒng)與智能信息檢索系統(tǒng)的比較分析,人們對(duì)智能信息檢索系統(tǒng)已經(jīng)有了理性的認(rèn)識(shí),對(duì)智能信息檢索系統(tǒng)的基本結(jié)構(gòu)有了較清晰的認(rèn)識(shí),對(duì)智能信息檢索系統(tǒng)實(shí)現(xiàn)方法和關(guān)鍵技術(shù)逐步了解,看到了智能信息檢索系統(tǒng)實(shí)現(xiàn)的可能性,同時(shí)也面臨著許多困難和問(wèn)題。
人才是國(guó)家發(fā)展的重要資源,而教育是培養(yǎng)人才的主要渠道,小學(xué)教育作為基礎(chǔ)階段,應(yīng)當(dāng)受到國(guó)家和教育部門(mén)的高度重視,尤其是在信息化時(shí)代的大背景下,做好小學(xué)教育的信息化發(fā)展意義重大。
信息檢索(Information Retrieval),通常指文本信息檢索,包括信息的存儲(chǔ)、組織、表現(xiàn)、查詢、存取等各個(gè)方面,其核心為文本信息的索引和檢索。智能檢索則是把現(xiàn)代人工智能的技術(shù)與方法引入到信息檢索系統(tǒng),使后者具有一定程度的智能特征,在更高的層次上實(shí)現(xiàn)其功能。智能化信息檢索的目的是使信息檢索系統(tǒng)“理解”文件包含的信息內(nèi)容和用戶的信息需要。它在對(duì)內(nèi)容的分析理解、內(nèi)容表達(dá)、知識(shí)學(xué)習(xí)、推理機(jī)制、決策等基礎(chǔ)上實(shí)現(xiàn)檢索的智能化。
智能信息檢索系統(tǒng)應(yīng)具備以下3種能力:①智能信息檢索系統(tǒng)是建立在大規(guī)模的知識(shí)庫(kù)基礎(chǔ)之上的,它有一個(gè)強(qiáng)大的推理系統(tǒng)支持,能用自然語(yǔ)言而不是規(guī)范的主題詞與檢索者交流的計(jì)算機(jī)系統(tǒng)。此系統(tǒng)能在已知信息的基礎(chǔ)上,推理分析出系統(tǒng)沒(méi)有明顯表示出來(lái)的信息。此外,系統(tǒng)自身還具有學(xué)習(xí)和自適應(yīng)能力。②智能信息檢索系統(tǒng)在具備知識(shí)庫(kù)和推理機(jī)制的同時(shí),強(qiáng)調(diào)智能信息檢索結(jié)果應(yīng)是用戶能夠直接加以利用的信息,與傳統(tǒng)信息檢索為用戶提供的文獻(xiàn)線索相區(qū)別。前者可以免去用戶再去查找文獻(xiàn)的重復(fù)活動(dòng)。③智能信息檢索系統(tǒng)的智能因素不應(yīng)僅僅定義在檢索的執(zhí)行過(guò)程中,還應(yīng)體現(xiàn)在提問(wèn)模型的形成過(guò)程中,即根據(jù)用戶對(duì)問(wèn)題的描述,借助與知識(shí)庫(kù)相關(guān)的知識(shí),推斷其真正需求,形成提問(wèn)模型。
一般來(lái)說(shuō),智能信息檢索系統(tǒng)由知識(shí)庫(kù)、文本處理和智能接口3部分組成。①知識(shí)庫(kù)部分:知識(shí)庫(kù)是智能檢索的核心。它又由知識(shí)庫(kù)系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)和檢索推理系統(tǒng)3個(gè)子系統(tǒng)構(gòu)成。②文本處理部分:文本處理系統(tǒng)就是利用計(jì)算機(jī)自動(dòng)處理自然語(yǔ)言形式的文本輸入。它利用知識(shí)庫(kù)中的語(yǔ)言學(xué)知識(shí)、科學(xué)知識(shí)和其他知識(shí),對(duì)文本進(jìn)行語(yǔ)法、語(yǔ)義分析界定,從內(nèi)容上理解文獻(xiàn)所論述的主題,并把它們表示成知識(shí)庫(kù)中的知識(shí)單元和數(shù)據(jù)庫(kù)中的數(shù)據(jù)元素,不斷地豐富知識(shí)庫(kù)和數(shù)據(jù)庫(kù)。③智能接口部分:智能接口是用戶與系統(tǒng)之間的通道。它的主要功能是對(duì)自然語(yǔ)言進(jìn)行查詢和處理,并作為智能終端建立用戶興趣檔案,加工提取結(jié)果。
人工智能技術(shù)中的機(jī)器感知(知識(shí)獲取)、機(jī)器思維(知識(shí)處理)、機(jī)器行為(知識(shí)利用),其核心是知識(shí)。實(shí)現(xiàn)知識(shí)的形式化描述,從知識(shí)的獲取、表示、存儲(chǔ)、組織、管理、推理直到智能化研究一直是人工智能研究的主要方向。
信息檢索現(xiàn)在雖然還沒(méi)有達(dá)到知識(shí)層次上的加工處理,但它至少已通過(guò)間接的途徑實(shí)現(xiàn)了對(duì)知識(shí)的處理,如智能化信息檢索系統(tǒng)把信息源作為知識(shí)的集合,而把信息源通過(guò)適當(dāng)?shù)姆绞郊右詷?biāo)引,其目的也在于通過(guò)這些標(biāo)引詞來(lái)表達(dá)信息源中的知識(shí)點(diǎn),并為用戶的信息需求提供相應(yīng)的知識(shí)輔助。智能化信息檢索系統(tǒng)的目標(biāo)就是真正達(dá)到在知識(shí)語(yǔ)義層次上進(jìn)行信息服務(wù)。由此看出,知識(shí)是IR與IT共同的研究對(duì)象,而對(duì)知識(shí)的獲取、加工、處理、提供利用則是兩者共同的目標(biāo)。目前的智能技術(shù)主要包括人工智能技術(shù)和人工神經(jīng)網(wǎng)絡(luò)技術(shù),其中人工智能技術(shù)(AI,Artificial Intelligence)主要研究如何利用計(jì)算機(jī)軟、硬件模仿、延伸、擴(kuò)展人類(lèi)智能理論方法和技術(shù)。而人工神經(jīng)網(wǎng)絡(luò)技術(shù)(ANN,Artificial Neural Network)則更注重對(duì)人腦結(jié)構(gòu)的模擬。實(shí)際應(yīng)用中往往可以通過(guò)結(jié)合AI與ANN共同完成智能任務(wù)。AI長(zhǎng)于知識(shí)的邏輯推理,它以一套完整的推理系統(tǒng)為核心,對(duì)知識(shí)進(jìn)行組織、再生和利用;ANN的長(zhǎng)處則在于對(duì)復(fù)雜知識(shí)的結(jié)構(gòu)化組織,通過(guò)分布式計(jì)算、并行推理以及例子學(xué)習(xí)來(lái)實(shí)現(xiàn)智能化處理。ANN是模擬神經(jīng)元結(jié)構(gòu),決定了它具有高度容錯(cuò)能力。ANN的研究重點(diǎn)在于模擬和實(shí)現(xiàn)人的認(rèn)知過(guò)程中的感知過(guò)程、經(jīng)驗(yàn)形象思維、分布式記憶和自組織學(xué)習(xí)過(guò)程,而AI是符號(hào)處理系統(tǒng),側(cè)重于人的邏輯思維。這兩者的結(jié)合為基于知識(shí)的智能化的信息檢索提供了可能。
另外,隨著計(jì)算機(jī)軟、硬件設(shè)備性能的提高和智能通訊、網(wǎng)絡(luò)技術(shù)的深入研究,人工智能在自然語(yǔ)言理解、知識(shí)獲取、表示和推理等方面的研究進(jìn)展,以及信息檢索領(lǐng)域?qū)χ悄芑呐Γ瑸閮烧叩慕Y(jié)合提供了強(qiáng)大的技術(shù)支持和廣闊的應(yīng)用空間。
用戶知識(shí)的自動(dòng)獲取技術(shù)。用戶知識(shí)通常包括用戶信息需求和用戶背景知識(shí)等。通過(guò)在用戶終端上運(yùn)行一個(gè)監(jiān)視用戶的接口Agent,由它來(lái)監(jiān)視用戶信息搜索與瀏覽過(guò)程,將用戶在WEB瀏覽時(shí)的相關(guān)信息不斷傳給遠(yuǎn)端服務(wù)器,服務(wù)器再將信息進(jìn)行整理、組織并從中分析出用戶的信息偏好,服務(wù)器根據(jù)用戶信息偏好進(jìn)行新的信息推薦。
機(jī)器學(xué)習(xí)技術(shù)。包括基于解釋經(jīng)驗(yàn)的學(xué)習(xí)、基于事例的學(xué)習(xí)、基于概念的學(xué)習(xí)、基于類(lèi)比的學(xué)習(xí)、基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)等。其具體的執(zhí)行是先讓一個(gè)智能Agent帶有最小的背景知識(shí),然后通過(guò)幾種方法學(xué)習(xí)用戶的行為:一是觀察用戶,找出規(guī)律;二是用戶反饋(直接或間接);三是用戶訓(xùn)練,直接給出例子;四是詢問(wèn)其他Agent。這樣即使Agent不熟悉某個(gè)用戶的習(xí)慣,但經(jīng)過(guò)一段時(shí)間的學(xué)習(xí),它會(huì)逐漸了解用戶的工作習(xí)慣,并逐步接替用戶的工作。
推送技術(shù)。推送技術(shù)最基本的形式是通知,針對(duì)這種服務(wù),用戶可以控制其通知形式與時(shí)間間隔。另一個(gè)是提要技術(shù),用戶以關(guān)鍵詞、日期、數(shù)值、比較規(guī)則以及其他查詢條件查找信息。提要可以實(shí)現(xiàn)查看WEB頁(yè)或其他信息源,尋找需要匹配的信息,并向用戶傳遞信息。第三種是自動(dòng)拉出,提供一種可供用戶常查看的WEB頁(yè)。自動(dòng)推送需要用戶終端有特殊客戶機(jī)軟件,定期發(fā)出更新請(qǐng)求。
5.1.1 智能技術(shù)本身的不成熟
人工智能技術(shù)本身還有許多不完善的地方。主要體現(xiàn)在兩個(gè)方面:①知識(shí)的獲取與表示。其中較難解決的問(wèn)題就是如何把復(fù)雜多樣的專(zhuān)業(yè)知識(shí)系統(tǒng)化。此外,如果把人工智能技術(shù)應(yīng)用到一個(gè)多學(xué)科綜合的檢索系統(tǒng)中,如何辨別某個(gè)多義詞當(dāng)前的具體含義,如何辨析用戶特定的需求,這些都有待于繼續(xù)研究。②受自然語(yǔ)言處理技術(shù)方面的局限。要想使計(jì)算機(jī)準(zhǔn)確地分析、表達(dá)并傳輸知識(shí),就必須使計(jì)算機(jī)具備理解自然語(yǔ)言的能力。目前對(duì)自然語(yǔ)言的處理,雖然已從語(yǔ)法階段上升到語(yǔ)義階段,但對(duì)自然語(yǔ)言的理解能力還限制在一些規(guī)范的語(yǔ)句和語(yǔ)法范圍內(nèi),這就決定了智能信息檢索系統(tǒng)所能具有的智能化表達(dá)程度。
5.1.2 信息檢索系統(tǒng)本身的障礙
信息檢索系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng),檢索過(guò)程本身存在著以下難題:①信息檢索系統(tǒng)所面對(duì)的用戶來(lái)自不同專(zhuān)業(yè)領(lǐng)域,知識(shí)層次也各不相同,要使計(jì)算機(jī)對(duì)其進(jìn)行合理定位是一個(gè)難題。②信息檢索系統(tǒng)涉及的專(zhuān)業(yè)知識(shí)豐富,將諸多知識(shí)形式化較為困難。③信息檢索專(zhuān)家系統(tǒng)不易建立。不僅這些專(zhuān)家的經(jīng)驗(yàn)和技術(shù)很難準(zhǔn)確地表達(dá)出來(lái),而且不同的檢索專(zhuān)家很可能對(duì)同一問(wèn)題持不同的觀點(diǎn),這對(duì)專(zhuān)家系統(tǒng)的建立提出了難題。
5.2.1 解決知識(shí)表達(dá)問(wèn)題的思路
知識(shí)的獲取和表示問(wèn)題是智能化信息檢索的一個(gè)難題,但是知識(shí)庫(kù)是智能檢索的核心,如何建設(shè)知識(shí)庫(kù),關(guān)鍵是如何把復(fù)雜多樣的專(zhuān)業(yè)知識(shí)表達(dá)描述出來(lái)。在我國(guó),不同的學(xué)者從不同的角度去探討這個(gè)問(wèn)題,有人認(rèn)為語(yǔ)料庫(kù)作為處理自然語(yǔ)言的方法較好,可用來(lái)構(gòu)建語(yǔ)義網(wǎng)或采用本體論建設(shè)知識(shí)庫(kù)。目前,隨著網(wǎng)絡(luò)信息的多樣化、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的異構(gòu)化,本體論越來(lái)越受到了計(jì)算機(jī)界的重視。在協(xié)助智能體對(duì)因特網(wǎng)上的各種信息進(jìn)行領(lǐng)域分類(lèi),在智能化的規(guī)范用戶信息檢索和信息整合方面,本體論的知識(shí)發(fā)揮著重要作用。由于本體能刻畫(huà)事物之間的內(nèi)在聯(lián)系,借助于本體,可以使檢索的信息更能滿足用戶的需求。所以本體論成為知識(shí)獲取和表示、規(guī)劃、進(jìn)程管理、數(shù)據(jù)庫(kù)框架集成、自然語(yǔ)言處理和企業(yè)模擬等研究領(lǐng)域的核心。一旦建成基于本體論的知識(shí)庫(kù),本體論將提供一個(gè)內(nèi)容豐富和現(xiàn)代的框架以實(shí)現(xiàn)術(shù)語(yǔ)的規(guī)范、服務(wù)和管理。如果與基于網(wǎng)站的搜索工具相結(jié)合,將會(huì)十分有益于資源的檢索,不僅可以為特定用戶提供其所查詢的特定文件,還可提供與興趣主題可能有關(guān)的其他資源。這種額外的功能不僅會(huì)顯著提高基于網(wǎng)站的搜索引擎的范圍,而且還能改進(jìn)用戶對(duì)網(wǎng)頁(yè)上信息資源感興趣的方式。
5.2.2 自然語(yǔ)言處理的思路
語(yǔ)言學(xué)方法。根據(jù)可計(jì)算性理論,任何一個(gè)自動(dòng)機(jī)的運(yùn)算都是按一定程序、分步驟和相繼作用在離散對(duì)象之上所完成的,而這些對(duì)象又是以線形序列相鄰接的排列組合所構(gòu)成的,而自然語(yǔ)言的3個(gè)特征——離散性、序列性、鄰接性使其具備了“可計(jì)算性”,為自然語(yǔ)言的處理奠定了物質(zhì)基礎(chǔ)。對(duì)自然語(yǔ)言處理的方法有語(yǔ)言學(xué)方法、人工神經(jīng)網(wǎng)絡(luò)法等。與建立語(yǔ)料庫(kù)的思路相似,采用語(yǔ)言學(xué)方法,在相當(dāng)長(zhǎng)時(shí)間里,語(yǔ)言學(xué)的任務(wù)是建立一個(gè)高度集合的語(yǔ)法系統(tǒng),來(lái)解釋句子的生成與理解。當(dāng)這一語(yǔ)言學(xué)理論與計(jì)算理論相結(jié)合時(shí),產(chǎn)生了形式之法。形式之法由一套有窮的規(guī)則結(jié)合所組成,其作用是生成并接受所有符合這些規(guī)則的語(yǔ)句。
語(yǔ)料庫(kù)方法。語(yǔ)料,又被稱為素材,是自然發(fā)生的語(yǔ)言材料的集合。而語(yǔ)料(Corpus)是一個(gè)由大量在真實(shí)文本經(jīng)過(guò)詞法、句法、語(yǔ)義等多層次加工形成的語(yǔ)言材料庫(kù)。這些加工的方式包括在語(yǔ)料中標(biāo)注各種記號(hào),標(biāo)注的內(nèi)容包括每個(gè)詞的詞性、語(yǔ)義項(xiàng)、短語(yǔ)結(jié)構(gòu)、句型和句間關(guān)系等。隨著標(biāo)注程度的加深,語(yǔ)料庫(kù)逐漸熟化,成為一個(gè)分布的、統(tǒng)計(jì)意義上的知識(shí)源。語(yǔ)料庫(kù)本身不能直接應(yīng)用于自然語(yǔ)言處理中的句法或語(yǔ)義分析,但因?yàn)檎Z(yǔ)料庫(kù)包含了語(yǔ)言或者語(yǔ)言變體的詞匯、語(yǔ)法結(jié)構(gòu)、語(yǔ)義和語(yǔ)用信息,為語(yǔ)言學(xué)的研究提供了無(wú)窮無(wú)盡的資料來(lái)源,是計(jì)算機(jī)對(duì)文本進(jìn)行各種分類(lèi)、統(tǒng)計(jì)、檢索、綜合、比較等研究的基礎(chǔ),可以幫助語(yǔ)言學(xué)家揭示語(yǔ)言的詞匯、語(yǔ)法、語(yǔ)義和語(yǔ)用規(guī)律,由這些語(yǔ)言學(xué)的規(guī)律匯集成詞法、語(yǔ)法、語(yǔ)義詞典或知識(shí)庫(kù)等文本分析工具,然后利用這些工具進(jìn)一步對(duì)其他大量新文本逐詞標(biāo)注詞性,劃分句子成分,進(jìn)行語(yǔ)義標(biāo)注等。
互聯(lián)網(wǎng)上利用搜索引擎為檢索手段,使用網(wǎng)絡(luò)信息資源自動(dòng)采集機(jī)器人(robot)程序(也稱網(wǎng)絡(luò)蜘蛛、爬蟲(chóng)軟件),動(dòng)態(tài)訪問(wèn)各站點(diǎn),收集信息,建立索引,并自動(dòng)生成有關(guān)資源的簡(jiǎn)單描述,存入數(shù)據(jù)庫(kù)中供檢索。但這種機(jī)器人程序的查準(zhǔn)率有待提高。于是元搜索引擎(又稱多元搜索引擎或集成搜索引擎)成為網(wǎng)絡(luò)檢索的后起之秀,是多個(gè)單一搜索引擎的集合。它沒(méi)有獨(dú)立的數(shù)據(jù)庫(kù),主要依靠系統(tǒng)提供的統(tǒng)一界面,構(gòu)成一個(gè)一對(duì)多的分布式且具有獨(dú)立功能的虛擬邏輯機(jī)制。以上兩者都不能提供用戶直接利用的信息資源,且查準(zhǔn)率有待提高。網(wǎng)絡(luò)智能檢索成為目前研究的熱點(diǎn),其包括智能搜索引擎(Intelligent Search Engine)、智能瀏覽器(Intelligent Browser)、智能體(Agent)等。智能搜索引擎可以預(yù)期用戶的需求,并可有效地抑制關(guān)鍵詞的多義性。比較成功的智能搜索引擎有FSA、Eloise和FAQFinder。智能瀏覽器是基于機(jī)器學(xué)習(xí)理論設(shè)計(jì)的智能系統(tǒng),經(jīng)過(guò)訓(xùn)練后,可成為某個(gè)領(lǐng)域中熟練的搜索專(zhuān)家。兩個(gè)比較成功的實(shí)驗(yàn)原型是WebWatcher和Letizia。智能體是一個(gè)具有控制問(wèn)題求解機(jī)理的計(jì)算單元,網(wǎng)絡(luò)中的智能體通常是一個(gè)專(zhuān)家系統(tǒng)、一個(gè)模塊等。它在經(jīng)用戶指導(dǎo)后,可在不用用戶干預(yù)的情況下,找到所需信息。有些智能體使用神經(jīng)網(wǎng)絡(luò)與模糊邏輯而不是關(guān)鍵詞來(lái)識(shí)別信息的模式。例如:BrowerBuddy是一個(gè)基于規(guī)則的智能體。
當(dāng)前基于Agent的智能信息檢索是信息檢索技術(shù)研究的熱點(diǎn)。智能代理(Intelligent Agent,簡(jiǎn)稱IA)技術(shù)始于20世紀(jì)80年代,是人工智能技術(shù)的一個(gè)重要研究領(lǐng)域。進(jìn)入上世紀(jì)90年代后,隨著因特網(wǎng)的廣泛使用及其相關(guān)技術(shù)的飛速發(fā)展,圍繞因特網(wǎng)展開(kāi)的智能代理技術(shù)研究取得了很大的進(jìn)展,它不僅成為人工智能研究的熱點(diǎn)之一,也是信息技術(shù)最前沿的代表。智能代理最先由美國(guó)麻省理工學(xué)院研制開(kāi)發(fā)。目前,國(guó)外從事智能代理技術(shù)研究的不僅有大學(xué)、研究機(jī)構(gòu),還有Apple、IBM、微軟等諸多信息技術(shù)公司,并且有些智能代理產(chǎn)品或嵌入智能代理技術(shù)的產(chǎn)品已經(jīng)投入使用。這些情況表明發(fā)展智能代理技術(shù)是一個(gè)趨勢(shì),它將是克服現(xiàn)有網(wǎng)絡(luò)信息檢索問(wèn)題的有效手段。
目前信息檢索技術(shù)正朝著多功能和智能化方向發(fā)展,隨著自然語(yǔ)言處理、自動(dòng)分詞、自動(dòng)標(biāo)引、自動(dòng)文摘、自動(dòng)分類(lèi)、自動(dòng)翻譯等技術(shù)的進(jìn)一步發(fā)展,信息檢索技術(shù)必將日益走向成熟與完善。
人工智能技術(shù)的發(fā)展是時(shí)代對(duì)社會(huì)智能化需求的體現(xiàn),而人工智能與信息檢索的結(jié)合則是人們對(duì)信息獲取智能化的有益嘗試。在信息檢索系統(tǒng)中納入人工智能技術(shù)將使傳統(tǒng)的信息檢索系統(tǒng)具有更好的用戶界面、更高的檢索效率和更豐富的檢索手段。人工智能技術(shù)的引入正在使傳統(tǒng)的信息檢索系統(tǒng)發(fā)生巨大的變化。以兩者作為結(jié)合點(diǎn)的智能信息檢索系統(tǒng)也將隨著這兩方面研究的不斷發(fā)展而更加完善強(qiáng)大。
[1] 師東生.基于自然語(yǔ)言理解的智能化多媒體信息檢索系統(tǒng)研究[J].微型機(jī)與應(yīng)用,2011(6):6-10.
[2] 宋喆,初廣麗.基于Multi-Agent的個(gè)性化信息檢索模型結(jié)構(gòu)體系[J].圖書(shū)館學(xué)研究,2011(2):62-66.
[3] Liu Ying,Tang Yonglin,Zeng Yuan.A study on improving information retrieval effectiveness for scientific and technicalnovelty retrieval[C].Proceedings of International Forum onTechnological Innovation and Competitive Technical Intelligence’2008,2008:338-347.
[4] JAIN P.Intelligent information retrieval[C].SETIT 2005 3rd-International Conference:Sciences of Electronic,Technologiesof Information and Telecommunications,2005(3):27-31.
[5] KANNAN R.Topic map:an ontology framework for information Retrieval[C].Proc.of National Conferenceon Advances in Knowledge Management,2010:195-198.
[6] 肖艷華,邵世煌.一種基于本體論的Internet信息個(gè)性化檢索系統(tǒng)的Agent實(shí)現(xiàn)模型[J].微計(jì)算機(jī)信息,2003(6):77-78.
[7] 何儒云,湯艷麗.智能化信息檢索研究[J].圖書(shū)館,2003(3):34-37.