鄢百其
(武漢科技大學(xué)圖書(shū)館,湖北武漢430081)
信息檢索策略優(yōu)化分析
鄢百其
(武漢科技大學(xué)圖書(shū)館,湖北武漢430081)
目前國(guó)內(nèi)高校信息檢索課教學(xué)效果較好的方式是以檢索策略為主要內(nèi)容的案例教學(xué)法,但其中還有一些待改進(jìn)和完善之處。為此,筆者挑選了有代表性的教學(xué)案例和檢索示例進(jìn)行剖析,探討檢索策略的優(yōu)化方法,如檢索概念的取舍、擴(kuò)檢與縮檢的技巧、相關(guān)數(shù)據(jù)庫(kù)的優(yōu)選、檢索效果的分析等,以期為信息檢索課的教學(xué)提供參考,促進(jìn)教學(xué)質(zhì)量的提高,培養(yǎng)大學(xué)生的信息素養(yǎng)。
信息檢索課;案例教學(xué);檢索策略;案例分析
信息檢索與利用課程(以下簡(jiǎn)稱“信息檢索課”)是高校人才培養(yǎng)、素質(zhì)教育的重要內(nèi)容,目的是培養(yǎng)學(xué)生的信息獲取與利用能力及創(chuàng)新意識(shí)。這是一門綜合性和實(shí)踐性很強(qiáng)的課程,也是信息管理領(lǐng)域最具活力的分支學(xué)科。由于該課程具有較強(qiáng)的理論性和復(fù)雜的實(shí)踐性,其講授難度較大,要獲得好的教學(xué)效果實(shí)屬不易。隨著高校教學(xué)體系的改革,許多教師利用各種現(xiàn)代化教學(xué)手段,采用多種教學(xué)模式進(jìn)行信息檢索課的教學(xué)改革探索,但實(shí)際效果并不理想,該課程在一些院校甚至呈現(xiàn)出萎縮之勢(shì)[1-3]。為了探討突圍之道,筆者以重慶維普中文科技期刊全文數(shù)據(jù)庫(kù)(以下簡(jiǎn)稱“維普期刊庫(kù)”)為文獻(xiàn)源,系統(tǒng)收集了近年來(lái)國(guó)內(nèi)期刊發(fā)表的有關(guān)信息檢索課的文章,以分析高校信息檢索教學(xué)中的不足,尋求改進(jìn)、提高之策。
選用維普期刊庫(kù)(2010年6月20日),檢索年限為2007~2010年,用表達(dá)式“檢索*(課+教學(xué))”對(duì)題名字段檢索,共命中文獻(xiàn)587篇,結(jié)果中的課程名稱分別為:信息檢索、信息檢索與利用、文獻(xiàn)檢索、文獻(xiàn)檢索與利用、文獻(xiàn)信息檢索、文獻(xiàn)信息檢索與利用、網(wǎng)絡(luò)信息檢索等。利用該數(shù)據(jù)庫(kù)系統(tǒng)基于單漢字索引的模糊檢索功能,便能用簡(jiǎn)潔的檢索式達(dá)到高網(wǎng)羅度,從而獲得了較為全面的研究資料。
通過(guò)逐一瀏覽、篩選、閱讀大量的相關(guān)文獻(xiàn)得知,近些年高校有上百萬(wàn)大學(xué)生學(xué)習(xí)信息檢索課程,其教學(xué)內(nèi)容大多以計(jì)算機(jī)檢索為主,教學(xué)方式多種多樣,如:多媒體在線教學(xué)、學(xué)導(dǎo)式教學(xué)法、互動(dòng)教學(xué)模式、5E(參與、探究、解釋、精制、評(píng)價(jià))教學(xué)模式、PBL(以問(wèn)題為基礎(chǔ)的學(xué)習(xí))教學(xué)法、科研導(dǎo)入教學(xué)法、案例教學(xué)法,等等,在提高學(xué)生學(xué)習(xí)興趣和教學(xué)效率方面有一定的效果,但整體而言,在培養(yǎng)學(xué)生獲取與利用信息的能力方面并無(wú)明顯提高[1-4]。分析其中原因,卻是因?yàn)樵S多教師實(shí)踐經(jīng)驗(yàn)不足,信息檢索水平不高,不能科學(xué)、合理地構(gòu)建檢索策略,不能全面、系統(tǒng)地傳授相關(guān)技能,因此影響了教學(xué)效果。縱觀國(guó)內(nèi)信息檢索課教材,信息檢索策略部分也是最薄弱的環(huán)節(jié)。由于高校大學(xué)生檢索技能的欠缺,直接影響了信息利用的效果和自身信息素質(zhì)的提高。
信息檢索課的重點(diǎn)內(nèi)容是檢索策略的傳授,這關(guān)系到學(xué)習(xí)者的實(shí)際動(dòng)手能力。國(guó)外對(duì)檢索策略的研究較多,一些國(guó)家甚至從中小學(xué)就開(kāi)始講授信息檢索方法,其高校也不時(shí)地舉辦以構(gòu)建最佳檢索策略為目標(biāo)的計(jì)算機(jī)信息檢索競(jìng)賽[5]。在國(guó)內(nèi)高校多年的教學(xué)探索實(shí)踐中,大家比較認(rèn)可的是以檢索策略為主要內(nèi)容的案例教學(xué)法,但其中許多還有待改進(jìn)和完善,必須不斷地深入探討和研究。
信息檢索課的案例教學(xué)是以精選的檢索案例為基本素材,使學(xué)生進(jìn)入特定的信息獲取、利用的情境中,運(yùn)用檢索原理,通過(guò)主題分析,提出各種檢索方案,不斷優(yōu)化檢索策略,逐步掌握獲取、利用信息的技能。目前,在國(guó)內(nèi)高校信息檢索案例教學(xué)中,檢索案例的選擇有很大的隨意性,檢索策略的調(diào)整、優(yōu)化也存在許多問(wèn)題。由于案例的選擇、設(shè)計(jì)直接影響到案例教學(xué)的質(zhì)量,因此,所用檢索案例應(yīng)該有一定的難度、深度和代表性,能夠起到開(kāi)闊眼界、啟發(fā)思路的效果。在案例教學(xué)中,重點(diǎn)是科學(xué)、合理地制定檢索策略,這通常不是追求一種正確答案(也難有唯一答案),而是注重引導(dǎo)學(xué)生積極思考、大膽質(zhì)疑、勇于創(chuàng)新;在檢索策略的調(diào)整、優(yōu)化中,應(yīng)遵循“沒(méi)有最好,只有更好”的理念,精益求精、力求完善;要以生動(dòng)的案例分析、演示,激發(fā)學(xué)生的興趣,促進(jìn)其理解消化、獲取經(jīng)驗(yàn)、掌握技巧。學(xué)生檢索技能和信息意識(shí)的明顯提高,才是良好教學(xué)效果的明證。
在上述檢索文獻(xiàn)中,通過(guò)對(duì)一些教學(xué)案例的分析、比較,挑選一個(gè)思路較清晰、效果較好的教學(xué)示范案例——“近視眼手術(shù)治療方面的研究成果”[6],在此展開(kāi)討論。該文作者有一定的檢索經(jīng)驗(yàn),采用了引文珠形增長(zhǎng)策略,先使用課題中最專指的概念組面檢索,從多篇命中文獻(xiàn)記錄中選出相關(guān)詞,然后補(bǔ)充到提問(wèn)式中再次檢索,多次重復(fù)上述過(guò)程,不斷挑選各種檢索詞、修改檢索式,最終查到了較多的相關(guān)文獻(xiàn)。本案例中使用的是清華同方的中國(guó)期刊全文數(shù)據(jù)庫(kù)(其檢索算符“邏輯與”稱“并且”,“邏輯或”為“或者”),最初采用的檢索提問(wèn)式為“(題名=近視眼)并且(題名=手術(shù))并且(題名=治療)”,命中27篇文獻(xiàn)。經(jīng)過(guò)多次試檢、瀏覽、選詞,通過(guò)減少概念組面、簡(jiǎn)化檢索詞、選用高專指度的縮寫(xiě)詞(LASIK、LASEK、PRK)等方式,反復(fù)調(diào)整、優(yōu)化檢索策略,最后的檢索提問(wèn)式為“(題名=近視)并且(題名=術(shù))或者(題名 =LASIK+LASEK+PRK)”,檢索到文獻(xiàn)1 296篇。
這是一個(gè)頗具教學(xué)價(jià)值的典型案例,作者深入細(xì)致的主題分析、對(duì)引文珠形增長(zhǎng)策略的熟練運(yùn)用、檢索概念的取舍技巧等,給了學(xué)習(xí)者較大的啟發(fā),其清晰、生動(dòng)的示范,便于激發(fā)學(xué)生的學(xué)習(xí)興趣,較快地理解和掌握基本檢索方法,從而取得較好的教學(xué)效果。
基于教學(xué)研討、切磋交流的目的,筆者將上述教學(xué)案例所演示的檢索策略作進(jìn)一步分析,以探討檢索策略優(yōu)化技巧及教學(xué)中常見(jiàn)問(wèn)題的處理。
(1)在檢索式中去掉“治療”一詞是“為了提高查全率和查準(zhǔn)率”的說(shuō)法不妥(這也是國(guó)內(nèi)信息檢索教學(xué)中最常見(jiàn)的口誤)。由于查全率和查準(zhǔn)率之間存在著一種“互逆”關(guān)系,高查全率和高查準(zhǔn)率難以同時(shí)獲得。因此,在教學(xué)中的準(zhǔn)確表述應(yīng)為:在擬定檢索策略時(shí),應(yīng)根據(jù)實(shí)際需要,對(duì)信息檢索的查全率或查準(zhǔn)率有所側(cè)重;就本課題而言,為了提高查全率,應(yīng)該去掉“治療”這一概念組面。
(2)作者通過(guò)概念分析,將“手術(shù)”簡(jiǎn)化為“術(shù)”,以便搜索各種關(guān)于“近視”的治療術(shù)(如準(zhǔn)分子激光術(shù)、角膜磨鑲術(shù)、角膜切削術(shù)、角膜塑型術(shù)等)。然而,清華中國(guó)期刊庫(kù)沒(méi)有模糊檢索功能(檢索字段采用單漢字索引),它的主要字段是以詞索引為主,其所謂的模糊匹配,只不過(guò)是自動(dòng)切分詞語(yǔ)檢索,并不具備真正意義上的模糊檢索功能;這時(shí),“術(shù)”和“近視”的邏輯與組配檢索會(huì)產(chǎn)生大量的漏檢[7]。另外,有關(guān)“近視”的治療術(shù)也有不含“術(shù)”字樣的表述,如:飛秒激光、準(zhǔn)分子激光、準(zhǔn)分子激光不同切削、準(zhǔn)分子激光表層切削、人工晶體植入、人工晶狀體植入,等等。因此,可以抽取“激光”、“植入”加入檢索式和“近視”進(jìn)行邏輯與組配,然后另選用具備模糊檢索功能的相關(guān)數(shù)據(jù)庫(kù)(如維普期刊庫(kù)等)檢索,便可大幅提高查全率。
(3)上述教學(xué)案例選用的數(shù)據(jù)庫(kù)不太合適,其檢索策略的優(yōu)化必須借助于具備模糊檢索功能的數(shù)據(jù)庫(kù)才能達(dá)到理想的效果。因此,在教學(xué)中,要注重講解如何測(cè)試數(shù)據(jù)庫(kù)系統(tǒng)的檢索功能、判定數(shù)據(jù)庫(kù)的質(zhì)量和索引方式,以便制定相應(yīng)的檢索策略,保證好的效果。目前國(guó)內(nèi)相關(guān)教學(xué)、咨詢?nèi)藛T中,極少有人掌握這些方法和技巧。
筆者以維普期刊庫(kù)為文獻(xiàn)源(2010年6月20日),全面搜索1995~2010年國(guó)內(nèi)期刊發(fā)表的有關(guān)信息檢索策略(相關(guān)詞為檢索技巧)的文章,用表達(dá)式“檢索策略 +檢索技巧”對(duì)題名字段檢索,共命中文獻(xiàn)328篇。通過(guò)閱讀、分析收集的相關(guān)文獻(xiàn)了解到,國(guó)內(nèi)有關(guān)信息檢索策略研究比較薄弱,并存在兩個(gè)偏向:一是名不副實(shí),一些所謂討論檢索策略的文章,卻只是對(duì)數(shù)據(jù)庫(kù)系統(tǒng)檢索功能的一般性介紹,并不論述檢索策略構(gòu)建的相關(guān)內(nèi)容;二是紙上談兵,檢索原理、規(guī)則面面俱到,卻不涉及實(shí)際的檢索方法、技巧和案例,可操作性不強(qiáng)。能夠深入探討計(jì)算機(jī)檢索策略、傳授各種真正實(shí)用的檢索技巧的論文很少。
這里選擇其中水平較高的研究案例進(jìn)行分析和討論。舉一個(gè)有代表性的檢索實(shí)例:“有關(guān)‘中國(guó)特大城市空氣污染’的課題,它的正確檢索式應(yīng)為:(中國(guó)特大城市+北京+上海+廣州+重慶+武漢+天津+……)*(空氣污染+大氣污染+空氣質(zhì)量+工業(yè)廢氣+一氧化硫+二氧化硫+一氧化碳+二氧化碳+灰霾+……)”[7]??梢钥闯?檢索者有相當(dāng)?shù)慕?jīng)驗(yàn),采用了“盡可能地簡(jiǎn)化邏輯關(guān)系,減少概念組面數(shù)”的方式,努力選全表達(dá)同一概念組面的各檢索詞,盡力提高網(wǎng)羅度,以保障檢索效果;上式覆蓋面較廣,命中文獻(xiàn)較多,效果不錯(cuò)。但是,若要進(jìn)一步優(yōu)化檢索策略,還可以這樣分析和處理(選用維普期刊庫(kù)):
(1)上式僅用2個(gè)概念組面進(jìn)行組配,較簡(jiǎn)潔明了,但也有檢索詞因缺少范圍限制而產(chǎn)生誤檢,如有關(guān)二氧化硫?qū)κ澄?、土壤、河流污染的文獻(xiàn)也被誤檢命中。另外,檢索者為了減少概念組面數(shù)(可提高查全率),又使用了一些限制過(guò)嚴(yán)的詞語(yǔ)(中國(guó)特大城市、空氣污染、大氣污染、空氣質(zhì)量、工業(yè)廢氣等),這也會(huì)影響檢索效果。例如,對(duì)“中國(guó)特大城市”一詞,應(yīng)在概念分析、分解的基礎(chǔ)上再邏輯組配,網(wǎng)羅度更大;若用“中國(guó)特大城市”和“(中國(guó)+我國(guó)+全國(guó)+國(guó)內(nèi))*大城市”,同時(shí)對(duì)題名字段檢索對(duì)比,后者的命中量比前者高幾十倍;命中文獻(xiàn)中的“大城市”(該詞可檢索到:大城市、特大城市、超大城市等),基本上都是國(guó)內(nèi)的特大城市。
(2)對(duì)本課題來(lái)說(shuō),為了提高相關(guān)詞選擇的效率,可試用高網(wǎng)羅度的單漢字進(jìn)行邏輯組配:“市*?dú)猓獕m”(相互制約可限定主題范圍,保障查準(zhǔn)率),再指定在題名字段進(jìn)行模糊檢索,由此方便快捷地得知:“市”可查到城市、大城市、特大城市、超大城市、北京市、上海市、蘭州市、成都市……;“氣”可命中大氣、空氣、尾氣、煙氣、廢氣 ……;“塵”可檢索沙塵、浮塵、粉塵、煙塵、飄塵、揚(yáng)塵、降塵……;試檢命中文獻(xiàn)大都比較切題。由此還發(fā)現(xiàn)了其他一些相關(guān)詞(其中“二氧化”可命中:二氧化硫、二氧化碳、二氧化氮……);另外,還可以省略組配后命中率太低的關(guān)鍵詞(一氧化硫、一氧化碳、灰霾……)。
(3)顯然,上式列出的16個(gè)關(guān)鍵詞是檢索者精選的,為了方便比較、說(shuō)明問(wèn)題,筆者也只選16個(gè)檢索詞來(lái)擬定檢索式,其結(jié)果如下:
(市+北京+上海+廣州+重慶+武漢+天津)*(大氣+空氣+尾氣)*(塵+污染+質(zhì)量+顆粒+二氧化+氣溶膠)
式中,用盡可能簡(jiǎn)短的概念詞“市、大氣、空氣、塵、污染、質(zhì)量、顆?!眮?lái)達(dá)到高網(wǎng)羅度,以取代各種相關(guān)檢索詞繁瑣的羅列,其包容、涵蓋更為全面,效果更佳。將此式和原檢索式同時(shí)對(duì)“題名或關(guān)鍵詞”字段檢索對(duì)比,優(yōu)化后的檢索策略效果更好(命中量增加3倍多),其查全率大幅提升,查準(zhǔn)率也有所提高;所獲文獻(xiàn)中涉及的城市絕大部分是人口超過(guò)100萬(wàn)的特大城市。
以上,從眾多相關(guān)文獻(xiàn)中挑選了2個(gè)頗具示范意義的教學(xué)案例和檢索示例,以解剖麻雀的方式,細(xì)致地討論了檢索策略的優(yōu)化方法,期望能達(dá)到舉一反三、觸類旁通的效果,能為信息檢索案例教學(xué)提供一定的參考借鑒。
[1]張英敏.高校文獻(xiàn)檢索課存在問(wèn)題分析與對(duì)策研究[J].圖書(shū)館學(xué)刊 ,2008(4):101-102.
[2]張萍.吉林省高校文獻(xiàn)檢索課現(xiàn)狀分析及發(fā)展對(duì)策研究[J].現(xiàn)代情報(bào),2009(4):142-146.
[3]文毅.對(duì)西部新院校文獻(xiàn)檢索課改革的幾點(diǎn)思考[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2008(5):100-102.
[4]張丹.高校信息檢索課教學(xué)改革與創(chuàng)新[J].牡丹江大學(xué)學(xué)報(bào),2009(3):160-161,167.
[5]鄢百其,林凌,金曉祥.網(wǎng)絡(luò)信息檢索技巧及析疑[J].武漢科技大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2008(2):103-108.
[6]王丹,李光輝.《信息存儲(chǔ)與檢索》課程案例教學(xué)探索[J].安徽中醫(yī)學(xué)院學(xué)報(bào),2008(4):54-55.
[7]龔國(guó)偉.分析檢索課題的方法與技巧研究[J].圖書(shū)館工作與研究,2006(4):49-50.
Optimization of information retrieval strategies
Yan Baiqi
(The Library,Wuhan University of Science and Technology,Wuhan 430081,China)
A comparatively good approach to teaching the course of information retrieval is case teaching that focuses on information retrieval strategies.However,this approach has its shortcomings and calls for further improvement.In light of this,the author selected and analyzed representative teaching cases and retrieval examples for the discussion of optimization of information retrieval strategies,including selection of retrieval concepts,techniques of retrieval scope,choice of databases and analysis of retrieval effects.The discussion should be of referential value for the teaching of information retrieval course,and promote the information literacy of college students.
information retrieval class;case teaching;retrieval strategy;case analysis
G252.7;G642
:A
:1009-3699(2011)02-0237-03
[責(zé)任編輯 勇 慧]
2010-10-14
湖北省教育科學(xué)“十一五”規(guī)劃課題(編號(hào):2009B315).
鄢百其(1955-),男,湖南武岡人,武漢科技大學(xué)圖書(shū)館研究員,主要從事科技信息咨詢研究.