由維麗
信息檢索通常指文本信息檢索,包括信息的存儲(chǔ)、表現(xiàn)、組織、查詢、取詞等各方面,其核心的內(nèi)容為文本信息的檢索與索引。信息檢索起源于19世紀(jì)下半葉圖書館的參考咨詢和文摘系列工作,發(fā)展到20世紀(jì)40年代,檢索與索引已成為圖書館的一項(xiàng)獨(dú)立服務(wù)項(xiàng)目。下面我們就來具體的分析一下信息檢索大至經(jīng)歷的幾個(gè)階段。
一、手工檢索
手工檢索是傳統(tǒng)圖書館的主要檢索方式,如手工目錄查詢,手工分類等,所有的操作都是由館員們親手完成的,方法簡單,靈活度差,而且費(fèi)時(shí)費(fèi)力。隨著時(shí)間的推移,科技的進(jìn)步,手工檢索系統(tǒng)也應(yīng)運(yùn)而生了,手工檢索系統(tǒng)是通過手工利用各種檢索工具進(jìn)行信息的檢索。根據(jù)檢索工具的形式,手工檢索系統(tǒng)可以分為書本式檢索和卡片式檢索系統(tǒng)書本式檢索系統(tǒng)是以印刷出版物形式出現(xiàn)的,為人們查找各種信息所使用的檢索工具,如各種文摘、題目或圖書目錄、索引期刊、參考工具等。書本式檢索系統(tǒng)是最早形成的信息檢索系統(tǒng),也為計(jì)算機(jī)信息檢索的產(chǎn)生奠定了堅(jiān)實(shí)的基礎(chǔ)??ㄆ綑z索系統(tǒng)是以卡片組成的存儲(chǔ)和信息檢索的檢索系統(tǒng),如圖書館的各種卡片式目錄及書上特有的編碼排序等。與書本式系統(tǒng)相比而言,它更便于積累和更新,適合各單位、個(gè)人建立使用,成本較低。隨著計(jì)算機(jī)技術(shù)在圖書管理中的應(yīng)用,卡片式檢索系統(tǒng)也將逐步被計(jì)算機(jī)目錄系統(tǒng)所取代。
二、計(jì)算機(jī)檢索
計(jì)算機(jī)檢索是指以計(jì)算機(jī)技術(shù)為手段,通過光盤和聯(lián)機(jī)等現(xiàn)代檢索方式進(jìn)行信息檢索地方法。也就是計(jì)算機(jī)檢索人員利用計(jì)算機(jī)信息技術(shù),全面運(yùn)用自己所了解和掌握的計(jì)算機(jī)信息數(shù)據(jù)庫提供的各種操作,進(jìn)行人、機(jī)的積極配合,從而快速,有效地查找獲取信息的過程。這種檢索方式也正是目前我國高科技圖書館所大面積采用的手段。計(jì)算機(jī)檢索要經(jīng)歷大致六步。
1.接受課題。這里的接受是指被動(dòng)接受,是用戶主動(dòng)提出問題,等待我們?nèi)ソ鉀Q。
2.分析課題。分析課題是制定檢索策略的主要依據(jù),也是正確使用數(shù)據(jù)庫、編寫檢索,運(yùn)用各種運(yùn)算符的先決條件。它包括對課題內(nèi)容的定位;自由語言與數(shù)據(jù)庫標(biāo)引語言的對等;檢索要領(lǐng)的選擇等。對課題的分析,直接影響檢索策略的質(zhì)量和檢索的最終結(jié)果。
3.選擇數(shù)據(jù)庫。檢索人員接受某一課題后,要對課題進(jìn)行仔細(xì)的分析研究,以便準(zhǔn)確選擇適宜該課題的數(shù)據(jù)庫類型。包括所選數(shù)據(jù)庫是按何種方式組檔;所選用的檢索項(xiàng);以及檢索項(xiàng)目采用的是哪種檢索方式等。
4.確定檢索策略。檢索策略是檢索人員對檢索信息要達(dá)到的目標(biāo)的預(yù)想。其目的是為查全率和差準(zhǔn)率。查全率是指系統(tǒng)檢索時(shí)能檢出相關(guān)文獻(xiàn)的能力,查準(zhǔn)率是指系統(tǒng)檢索時(shí)拒絕不相關(guān)文獻(xiàn)的能力。
5.編制檢索式。是指檢索人員針對本課題的要求,選擇檢索詞的邏輯算符、裁詞算符、位置算符等各種組配形式,以達(dá)到最合理最科學(xué)的選擇方式。它同樣關(guān)系到提高文獻(xiàn)查全率和查準(zhǔn)率的問題。
6.整理檢索結(jié)果。這是計(jì)算機(jī)檢索中的一個(gè)極為關(guān)鍵的環(huán)節(jié)。它涉及到用戶滿意度的問題。如果檢索結(jié)果正確,用戶的滿意度就高,反之,用戶滿意度就會(huì)大大降低。從用戶滿意度中可以對工作人員的工作質(zhì)量進(jìn)行評估,以便從中總結(jié)經(jīng)驗(yàn),吸取教訓(xùn),取長補(bǔ)短,從而提高服務(wù)質(zhì)量。另外,還可以對一些問題進(jìn)行總結(jié),整理歸檔,以便再遇到同類問題時(shí),不走重復(fù)路,提高服務(wù)效率。
近些年,計(jì)算機(jī)檢索手段逾漸完善,計(jì)算機(jī)檢索系統(tǒng)也逐步發(fā)展了起來。計(jì)算機(jī)信息檢索系統(tǒng)主要由計(jì)算機(jī)硬件及軟件系統(tǒng)、數(shù)據(jù)庫、數(shù)據(jù)通訊等設(shè)施構(gòu)成。根據(jù)其內(nèi)容特點(diǎn)可分為:計(jì)算機(jī)單機(jī)檢索系統(tǒng);計(jì)算機(jī)光盤檢索系統(tǒng);計(jì)算機(jī)聯(lián)機(jī)檢索系統(tǒng);計(jì)算機(jī)網(wǎng)絡(luò)檢索系統(tǒng)。其中計(jì)算機(jī)單機(jī)檢索系統(tǒng)是計(jì)算機(jī)信息檢索系統(tǒng)的早期形式,是將信息檢索數(shù)據(jù)庫系統(tǒng)建立在獨(dú)立的計(jì)算機(jī)硬盤上,直接在一臺(tái)計(jì)算機(jī)上進(jìn)行存儲(chǔ)和檢索信息,計(jì)算機(jī)光盤檢索系統(tǒng)是以光盤存儲(chǔ)為數(shù)據(jù)庫的存儲(chǔ)介質(zhì),利用計(jì)算機(jī)和光盤驅(qū)動(dòng)器進(jìn)行讀取和檢索光盤上的數(shù)據(jù)信息;計(jì)算機(jī)聯(lián)機(jī)檢索系統(tǒng)是由大型計(jì)算機(jī)系統(tǒng)數(shù)據(jù)庫,檢索終端及通訊設(shè)備組成的信息檢索系統(tǒng);計(jì)算機(jī)網(wǎng)絡(luò)檢索系統(tǒng)包括局域網(wǎng)絡(luò)檢索系統(tǒng)和廣域網(wǎng)絡(luò)信息檢索系統(tǒng),這種系統(tǒng)也將我國的檢索事業(yè)帶入了一個(gè)嶄新的階段。
三、網(wǎng)絡(luò)信息檢索
網(wǎng)絡(luò)信息檢索是一個(gè)復(fù)雜的過程,它涉及到信息需求的形成與表達(dá),檢索策略的制定,檢索工具的選擇,檢索點(diǎn)的確定等多個(gè)過程和環(huán)節(jié)。目前網(wǎng)絡(luò)檢索的方法有這樣三種。
1.漫游法。也被人稱為“偶然發(fā)現(xiàn)”,這是在Internet中發(fā)現(xiàn)信息的最原始方法,當(dāng)你還在Internet上盡情“遨游”和“沖浪”時(shí),你也許會(huì)意外的發(fā)現(xiàn)一些很有價(jià)值的信息,當(dāng)然,有時(shí)也可能會(huì)一無所獲。所以這種方法是很盲目的,沒有可靠性。
2.網(wǎng)絡(luò)地址法,也被稱為“地址瀏覽”法。就是在尋找信息時(shí),首先進(jìn)入地址欄瀏覽,就像走進(jìn)圖書館的書庫,然后在書架上直接翻閱,查找所需書籍一樣。www提供的超文本方式可以看做是瀏覽的一種特殊形式。
3.搜索法。這種搜索就像是通過索引或分類卡片來幫助查找一樣,在Internet中有許多不同的搜索引擎,比如百度、yahoo、Google等等。他們都有不同的搜索優(yōu)勢。
有人會(huì)認(rèn)為這種檢索方式太復(fù)雜像海底撈針一樣,想找到點(diǎn)有用的信息太困難了,其實(shí)不然,在實(shí)踐中,我們發(fā)現(xiàn)這種網(wǎng)絡(luò)信息檢索是存在一定技巧的。比如我們可以先分析檢索課題,明確檢索要求,弄清楚課題學(xué)科的屬性、專業(yè)范圍和相關(guān)內(nèi)容后,選擇適當(dāng)?shù)脑~語,確定檢索項(xiàng)。再將檢索項(xiàng)之間進(jìn)行邏輯組配,編制檢索表達(dá)式。不管是數(shù)據(jù)庫還是網(wǎng)上的搜索引擎,基本都具有邏輯組配檢索功能。由于已確定的檢索項(xiàng)表達(dá)的主題概念間存在邏輯關(guān)系,可通過布爾運(yùn)算符和位置運(yùn)算符對檢索項(xiàng)進(jìn)行組配。這樣檢索出的內(nèi)容便會(huì)大大提高可利用率。
雖然網(wǎng)絡(luò)檢索方法具有很多明顯的優(yōu)勢,但同時(shí)也存在著很多漏洞。因?yàn)樗麑z索人員的專業(yè)性要求很高,檢索人員要在檢索時(shí)盡可能將全部表達(dá)主題概念的檢索詞組配完全,也就是要把所有同義詞和異環(huán)詞都運(yùn)用進(jìn)去,否則就會(huì)出現(xiàn)漏檢的情況。漢語本身就是一種比較復(fù)雜的語言,在檢索時(shí),如果只為了提高查全率而忽略了查準(zhǔn)率;就會(huì)造成誤檢現(xiàn)象。檢查結(jié)果不是太多就是太少,很難控制和把握。
所以,我認(rèn)為,今后我國圖書館信息檢索方式發(fā)展的大方向既是智能化檢索。
智能化檢索就是把現(xiàn)代人工智能的技術(shù)與方法引入到信息檢索系統(tǒng),使后者具有一定程度的職能特征,在更高的層次上完成它的功能。智能化信息檢索的最終目的便是使信息檢索系統(tǒng)“理解”文件包含的信息內(nèi)容和用戶對信息的需要程度,然后有針對性的對此要求做出靈活的準(zhǔn)確的反應(yīng),從而實(shí)現(xiàn)檢索的智能化?!?編輯/永安)