范曉磊
南京醫(yī)科大學(xué),江蘇南京 210029
醫(yī)學(xué)主題詞檢索法是醫(yī)藥文獻(xiàn)作息檢索的重要手段,即使信息技術(shù)不斷發(fā)展,在醫(yī)藥文獻(xiàn)信息檢索領(lǐng)域,主題詞檢索法都仍在繼續(xù)使用,并且與時(shí)俱進(jìn),持續(xù)發(fā)展。醫(yī)學(xué)主題詞表是情報(bào)檢索語言(通常是主題詞語言)的具體體現(xiàn)形式,規(guī)范的醫(yī)學(xué)主題詞表是二次文獻(xiàn)標(biāo)引的重要依據(jù),根據(jù)信息檢索原理,標(biāo)引與檢索是信息存儲(chǔ)與獲取的兩個(gè)方面,標(biāo)引從一定程度上決定了信息檢索。因此,醫(yī)學(xué)主題詞表是用戶與標(biāo)引人員間的“指南”。在醫(yī)學(xué)文獻(xiàn)信息檢索課程中,醫(yī)學(xué)主題詞檢索法是醫(yī)學(xué)文獻(xiàn)信息的重要方法。PubMed與Embase是醫(yī)藥領(lǐng)域最常用的二次文獻(xiàn)檢索系統(tǒng),都包含MEDLINE資源,且都具有醫(yī)學(xué)主題詞表,本文以這兩個(gè)檢索系統(tǒng)為例,對醫(yī)學(xué)主題詞檢索法進(jìn)行研究。
根據(jù)2012年最新數(shù)據(jù)表明,PubMed中經(jīng)過MeSH標(biāo)引的MEDLINE期刊有5627種,Embase包括MEDLINE在內(nèi)的期刊有7961種,這些期刊全部經(jīng)過Emtree標(biāo)引。PubMed是世界上使用最廣泛的免費(fèi)檢索MEDLINE文獻(xiàn)的檢索系統(tǒng),它的學(xué)科范圍包括生物醫(yī)學(xué)和生命科學(xué),覆蓋護(hù)理學(xué)、藥學(xué)、牙科學(xué)、生化學(xué)、細(xì)胞生物學(xué)、衛(wèi)生保健和獸醫(yī)學(xué)等學(xué)科。Embase是全球最大最具權(quán)威性的生物醫(yī)學(xué)與藥理學(xué)文獻(xiàn)數(shù)據(jù)庫,包括各種藥物和疾病信息,除基礎(chǔ)醫(yī)學(xué)和臨床醫(yī)學(xué)外,還覆蓋如藥物研究、藥理學(xué)、配藥學(xué)、藥劑學(xué)、藥物副作用、毒物學(xué)人體醫(yī)學(xué)(臨床與實(shí)驗(yàn))基礎(chǔ)生物醫(yī)學(xué)、生物工藝學(xué)、生物醫(yī)學(xué)工程與儀器、保健策略與管理、藥物經(jīng)濟(jì)學(xué)、醫(yī)療公共政策管理、公共職業(yè)與環(huán)境衛(wèi)生、藥物依賴性及濫用、精神科學(xué)、替代與補(bǔ)充醫(yī)學(xué)、法醫(yī)學(xué)和生物醫(yī)學(xué)工程等學(xué)科。
醫(yī)學(xué)詞表編制的質(zhì)量決定了對檢索系統(tǒng)的檢索效率。PubMed系統(tǒng)所用詞表為MeSH,Embase系統(tǒng)所用詞表為EMTREE,因Embase工作人員參照MeSH于1988年編制了Emtree,這兩個(gè)著名的醫(yī)學(xué)詞表有共同之處,但區(qū)別非常明顯。對醫(yī)學(xué)詞表的比較研究,有益于深入了解檢索系統(tǒng),而且可以加深對情報(bào)檢索語言的理論研究。
MeSH與Emtree這兩個(gè)詞表最大的不同是專指度的差異。專指度是指主題詞與文獻(xiàn)主題概念的切合程度,揭示主題詞在表達(dá)文獻(xiàn)主題的深度和精度方面的能力。詞表的專指度直接影響檢索系統(tǒng)的查準(zhǔn)率,較高專指度的詞表能夠幫助用戶獲得更高查準(zhǔn)率的檢索結(jié)果。而專指度的高低與詞表的主題詞數(shù)量直接相關(guān),主題詞越多說明詞表的專指度越高。如表1所示的收詞量上來看,Emtree收錄的主題詞是MeSH的2.4倍,同義詞也多出了七萬多條,從這一角度能夠反應(yīng)出利用Emtree檢索比利用MeSH檢索會(huì)獲得更高的查準(zhǔn)率。
表1 MeSH與Emtree詞表詞匯統(tǒng)計(jì)
同一個(gè)生物學(xué)或醫(yī)學(xué)概念、術(shù)語,在兩個(gè)詞表中的地位有較大區(qū)別。通常,Emtree使用更多的詞語做主題詞,而有可能這些詞語被MeSH當(dāng)作入口詞來使用,這樣MeSH的概念體系可能更加清晰,同時(shí)可以防止相關(guān)文獻(xiàn)在彼此同義或近義的各個(gè)詞下的分散。但從總詞匯量方面來講,Emtree的詞匯數(shù)量遠(yuǎn)遠(yuǎn)多于MeSH詞匯數(shù)量,對于用戶來講,更多的詞匯意味著易用性更好。而且Emtree針對藥物主題詞專門設(shè)置了17 個(gè)核心的藥物副主題詞和47 種給藥途徑,如藥物副作用反應(yīng)、臨床試驗(yàn)或藥物分析等,增強(qiáng)索引的深度。針對疾病主題詞專門設(shè)置了14個(gè)疾病副主題詞,包括恢復(fù)、副作用、外科手術(shù)、治療等,幫助用戶精確地檢索疾病的某一類或幾類分支的相關(guān)文獻(xiàn), 提高相關(guān)性。這些在Embase數(shù)據(jù)庫中的文獻(xiàn)記錄可以清晰地體現(xiàn),文獻(xiàn)被標(biāo)引時(shí)使用的主題詞被分成了藥物、疾病和其他三種類型。
本文通過對兩個(gè)檢索系統(tǒng)中主題詞擴(kuò)展檢索(即包括被檢索詞及其所有下位詞的檢索)進(jìn)行測試,比較分析其檢出量之間的差異,進(jìn)而評價(jià)其檢索效率,為教學(xué)過程中學(xué)員理解和掌握主題詞檢索法示范,最終為用戶選取最佳檢索平臺提供理論依據(jù)和參考。
因PubMed與Embase的基本檢索都具有檢索詞自動(dòng)轉(zhuǎn)換或匹配主題詞功能,故檢索結(jié)果也同時(shí)對比給出基本檢索命中文獻(xiàn)數(shù)。
表2 PubMed與Embase檢索結(jié)果命中文獻(xiàn)數(shù)統(tǒng)計(jì)(檢索時(shí)間:2012-11-07)
從表2中我們可以看到,常見疾病如心臟病和糖尿病的檢索文獻(xiàn)命中率Embase都好于PubMed;常見藥物使用商品名芬必得,Embase能夠通過商品名匹配到主題詞布洛芬,命中文獻(xiàn),PubMed幾乎不能識別芬必得,只有使用布洛芬才能命中約為Embase五分之一的文獻(xiàn)。生物學(xué)領(lǐng)域的轉(zhuǎn)基因動(dòng)物研究,Embase的命中文獻(xiàn)數(shù)遠(yuǎn)遠(yuǎn)少于PubMed,可以推見PubMed的生物學(xué)領(lǐng)域的文獻(xiàn)較多。而2012年諾貝爾醫(yī)學(xué)獎(jiǎng)的研究領(lǐng)域“誘導(dǎo)多功能干細(xì)胞”,在Embase中收錄的文獻(xiàn)數(shù)量可觀,而PubMed主題詞檢索的命中文獻(xiàn)僅為它的七分之一多。
例:查找相關(guān)病毒性胃腸炎(viral gastroenteritis)的藥物經(jīng)濟(jì)學(xué)(pharmacoeconomics)方面的文獻(xiàn)。為查找到較為準(zhǔn)確全面的文獻(xiàn),我們盡量使用主題詞檢索法和關(guān)鍵詞詞組相結(jié)合的方式。經(jīng)分析與實(shí)際操作。PubMed中“病毒性胃腸炎”沒有主題詞,但上位詞“胃腸炎”有主題詞,且它有一個(gè)“病毒學(xué)virology”的副主題詞,故檢索式為("Gastroenteritis/virology"[Mesh] OR “viral gastroenteritis”)AND pharmacoeconomics,命中文獻(xiàn)數(shù)為3。為了擴(kuò)大檢索結(jié)果范圍,使用“病毒性胃腸炎”的上位詞“胃腸炎”,檢索式為gastroenteritis AND pharmacoeconomics,命中文獻(xiàn)數(shù)為62。Embase中“病毒性胃腸炎”這一概念有對應(yīng)的主題詞,故檢索式非常簡單:pharmacoeconomics AND 'viral gastroenteritis',檢索效率也高,命中文獻(xiàn)數(shù)為77條。
在醫(yī)藥文獻(xiàn)信息檢索課程中通過對MeSH與Emtree 兩個(gè)著名醫(yī)學(xué)主題詞表的對比分析與研究,并結(jié)合PubMed與Embase中的主題詞檢索途徑的實(shí)例檢索,幫助學(xué)員理解醫(yī)學(xué)主題詞掌握主題詞檢索法,并能夠通過結(jié)合主題詞表來判斷檢索系統(tǒng)優(yōu)劣,最終達(dá)到選擇合適的檢索系統(tǒng)與檢索方法的目的。
[1]周曉政.EMBASE.com的檢索特色[J].圖書情報(bào)工作,2005,49(5):136-139.
[2]于雙成.逢大欣與李占兵, MEDLARS與EMBASE所用詞表的比較研究[J].情報(bào)理論與實(shí)踐, 1996,19(5):38-40.
[3]顧萍.PubMed與EMBASE.com檢索功能對比分析[J].醫(yī)學(xué)信息,2006,19(11):1975-1977.
[4]楊淑華.EMBASE.com與PubMed檢索MEDLINE數(shù)據(jù)庫的比較研究[J].科學(xué)時(shí)代,2009(1):71,45.