PubMed和Embase是生物醫(yī)學(xué)領(lǐng)域的兩大文獻(xiàn)檢索平臺,幾乎涵蓋了生物醫(yī)學(xué)及藥理學(xué)各領(lǐng)域的相關(guān)重要文獻(xiàn),是醫(yī)學(xué)專業(yè)人員進(jìn)行全面、無偏差文獻(xiàn)檢索使用頻率較高的數(shù)據(jù)庫。國內(nèi)有學(xué)者通過調(diào)查我國干預(yù)類系統(tǒng)評價(jià)/Meta分析文獻(xiàn)檢索現(xiàn)狀,得出檢索頻率較高的英文數(shù)據(jù)庫依次為PubMed,Embase,Cochrane Library和Ovid[1];國外學(xué)者Golder[2]用不良反應(yīng)系統(tǒng)評價(jià)文獻(xiàn)檢索進(jìn)行調(diào)查,也得到了同樣的結(jié)論。
本文從檢索途徑、檢索操作過程、數(shù)據(jù)結(jié)構(gòu)以及檢索效果4方面,對比分析PubMed和Embase有關(guān)循證醫(yī)學(xué)證據(jù)的查詢功能,為廣大臨床醫(yī)生和臨床試驗(yàn)者提供參考。
對PubMed和Embase的比較研究,我國學(xué)者早有涉及。如通過主題詞檢索和基本檢索兩種檢索途徑,對比分析兩種數(shù)據(jù)庫的檢索效果,得出PubMed查準(zhǔn)率更高、Embase查全率更高[3];用主題詞擴(kuò)展檢索功能對兩個(gè)平臺進(jìn)行選詞測試,比較分析檢索效率,從而為用戶檢索MEDLINE選取最佳檢索平臺提供依據(jù)和參考[4];對PubMed和Embase的主題標(biāo)引進(jìn)行對比研究,發(fā)現(xiàn)Emtree標(biāo)引粒度更細(xì),MeSH標(biāo)引更規(guī)范[5];針對循證醫(yī)學(xué)證據(jù)的檢索,對PubMed和Embase進(jìn)行分析,得出PubMed和Embase是相輔相成的,同時(shí)檢索兩個(gè)數(shù)據(jù)庫可以全面有效地獲得臨床醫(yī)學(xué)研究成果和數(shù)據(jù),避免系統(tǒng)評價(jià)中的選擇偏倚[6-7]。
國外學(xué)者對PubMed和Embase的比較研究,除了極少數(shù)對書目數(shù)據(jù)庫MEDLINE/PubMed和Embase的收錄范圍和檢索途徑進(jìn)行分析外[8-9],多數(shù)學(xué)者更加注重分析具體的醫(yī)學(xué)臨床問題。PubMed和Embase在醫(yī)學(xué)領(lǐng)域中的具體應(yīng)用研究主要集中在兩個(gè)方面:一是在循證醫(yī)學(xué)方面的應(yīng)用。如Qi X等通過對PubMed、Embase和Cochrane Library進(jìn)行檢索,指出在循證醫(yī)學(xué)系統(tǒng)評價(jià)中應(yīng)采用自動和手動相結(jié)合的檢索方法來查找重復(fù)項(xiàng)[10]。二是通過設(shè)置搜索過濾器,分析數(shù)據(jù)庫能否識別出相關(guān)醫(yī)學(xué)領(lǐng)域的文獻(xiàn)。如Hildebrand AM等[11]在PubMed、Ovid MEDLINE和Embase中設(shè)置“慢性腎病”搜索過濾器,并對其進(jìn)行了驗(yàn)證和分析。
綜上所述,國內(nèi)學(xué)者對PubMed和Embase的研究主要集中在數(shù)據(jù)庫的收錄范圍、數(shù)據(jù)標(biāo)引、專指度等方面,對檢索功能和檢索效果的對比分析也僅停留在主題檢索和基本檢索的方法上,對具體循證醫(yī)學(xué)證據(jù)的檢索功能和檢索效果的對比分析較少,且這些研究時(shí)間較早,對數(shù)據(jù)庫升級后新增加的檢索途徑及功能方面少有提及。國外學(xué)者雖偏重于具體醫(yī)學(xué)領(lǐng)域的試驗(yàn)性研究,但是對比分析通過PubMed和Embase檢索循證醫(yī)學(xué)證據(jù)的途徑和效果較少,對數(shù)據(jù)庫所使用的醫(yī)學(xué)主題詞表的分析也比較少。
PubMed(http://www.ncbi.nlm.nih.gov/PubMed/)是美國國立醫(yī)學(xué)圖書館(National Library of Medline,NLM)建立和維護(hù)的基于Web平臺的生物醫(yī)學(xué)文獻(xiàn)檢索系統(tǒng),使用《醫(yī)學(xué)主題詞表》(Medical Subject Headings,MeSH)作為主題標(biāo)引工具。在檢索功能區(qū),其提供的基本檢索、高級檢索以及主題檢索均可以檢索到臨床問題的相關(guān)文獻(xiàn),但檢索入口不直觀,且檢索策略要不斷調(diào)整方能做到檢索結(jié)果精準(zhǔn)而較少遺漏,操作相對復(fù)雜。隨著循證醫(yī)學(xué)的發(fā)展,PubMed也做了相應(yīng)調(diào)整,如將“Randomized Controlled Trails”和“Evidence-Based Medicine”提升為主題詞,而不再歸于“Clinical Medicine”,從而能夠全面準(zhǔn)確地反映臨床醫(yī)學(xué)研究成果和數(shù)據(jù)。在PubMed的輔助功能區(qū),還提供了針對專門主題進(jìn)行檢索的選項(xiàng),如“Clinical Queries”,專門為臨床醫(yī)生和臨床試驗(yàn)工作者設(shè)計(jì)的檢索服務(wù),能夠有效地提高檢索的目的性和準(zhǔn)確性,主要包括臨床研究分類(Clinical Study Category)、系統(tǒng)評價(jià)(Find Systematic Reviews)和醫(yī)學(xué)遺傳學(xué)(Medical Genetics)。其中Clinical Study Category可通過內(nèi)置的“過濾器”查詢疾病的病因(etiology)、診斷(diagnosis)、治療(therapy)、預(yù)后(prognosis)以及臨床預(yù)測指南(clinical prediction guides)等5個(gè)方面的文獻(xiàn),F(xiàn)ind Systematic Reviews用于檢索系統(tǒng)評價(jià)(systematic reviews)、Meta分析(meta-analyses)、臨床試驗(yàn)評論(reviews of clinical trials)以及循證醫(yī)學(xué)(evidence-based medicine)方面的文獻(xiàn),Medical Genetics提供檢索醫(yī)學(xué)遺傳學(xué)方面的文獻(xiàn)[12]。PubMed還提供了Clinical Trials數(shù)據(jù)庫作為輔助工具配合PubMed查詢使用。
Embase是Elsevier推出的生物醫(yī)學(xué)和藥理學(xué)文摘數(shù)據(jù)庫,使用Emtree醫(yī)學(xué)主題詞表進(jìn)行標(biāo)引。Embase的生物醫(yī)學(xué)記錄與MEDLINE特有的記錄相結(jié)合,覆蓋了95個(gè)國家和地區(qū)的8 500多種期刊論文的文摘信息,尤其收錄了大量歐洲和亞洲的生物醫(yī)學(xué)和藥理學(xué)期刊。其中藥物檢索(Drug Search)、疾病檢索(Disease Search)以及設(shè)備檢索(Device Search)是Embase的特色檢索功能,直觀的檢索途徑有助于用戶更有針對性地進(jìn)行醫(yī)學(xué)文獻(xiàn)檢索。2017年Embase對檢索途徑及功能方面做了調(diào)整和升級,新增加了循證醫(yī)學(xué)(PICO)和藥物安全警示導(dǎo)引(PV Wizard)兩種檢索途徑,其模塊化的檢索步驟不僅操作簡單,更為用戶檢索相關(guān)臨床文獻(xiàn)提供了檢索思路以及檢索策略。
雖然PubMed和Embase均支持循證醫(yī)學(xué)證據(jù)的查詢,但在功能設(shè)計(jì)、檢索途徑設(shè)置等方面還是體現(xiàn)出了不同思路。PubMed的檢索框架是固定的、傻瓜式的,其實(shí)質(zhì)是在固定主題類目文獻(xiàn)檢索的基礎(chǔ)上通過文獻(xiàn)類型等過濾器而得到檢索結(jié)果;而Embase的設(shè)計(jì)思路與之不同,將臨床問題中的疾病、藥物和設(shè)備檢索單獨(dú)列出處理,還新增了針對性更強(qiáng)的循證醫(yī)學(xué)(PICO)和藥物安全警示導(dǎo)引(PV Wizard)等檢索途徑,為用戶提供了更多的選擇性,其模塊化、可視化的檢索步驟更易操作。
筆者以“成年女性如何通過HPV的檢查來預(yù)測宮頸癌”為例在PubMed和Embase數(shù)據(jù)庫中分別進(jìn)行檢索,檢索日期為2019年1月20日。由于自由詞的主觀性強(qiáng),且數(shù)據(jù)庫標(biāo)引方式及標(biāo)引時(shí)間各有不同,因此筆者通過主題詞對以上循證醫(yī)學(xué)實(shí)例進(jìn)行主題檢索操作。根據(jù)PICO原則將檢索實(shí)例分解為:宮頸癌患者(指“研究人群P”,Population)、人乳頭狀瘤病毒(指“干預(yù)措施I”,Intervention)、活組織檢查(指“對照干預(yù)措施”C,Comparison)以及診斷試驗(yàn)準(zhǔn)確性(指“干預(yù)后患者的情況O”,Outcome)。在PubMed數(shù)據(jù)中選擇MeSH詞庫,將所選詞輸入即可查詢相關(guān)主題詞,本例中宮頸癌患者的主題詞為“Uterine Cervical Neoplasms”。PubMed主題檢索還為用戶提供了款目詞,如“Cervical Neoplasm,Uterine”“Cervical Neoplasms,Uterine”“Neoplasm,Uterine Cervical”等,幫助用戶更全面地檢索相關(guān)文獻(xiàn)。在主題檢索界面,系統(tǒng)還顯示與該主題詞相關(guān)的詳細(xì)信息,包括詞義注釋、可組配副主題詞以及樹形結(jié)構(gòu)等,用戶可通過樹形結(jié)構(gòu)圖直觀看到該主題詞的上位詞和下位詞關(guān)系。為提高檢準(zhǔn)率,還可通過主題詞與副主題詞進(jìn)行組配,進(jìn)一步限定檢索文獻(xiàn)的指向。復(fù)述以上檢索步驟,分別將PICO選定的檢索詞輸入進(jìn)行主題檢索,最后將檢索結(jié)果用邏輯“與”進(jìn)行合并即完成檢索。
而改版后的Embase數(shù)據(jù)庫直接為用戶提供PICO檢索模塊,幫助用戶通過最直觀的檢索途徑進(jìn)行全面的文獻(xiàn)檢索。打開PICO檢索界面,在Population檢索框中輸入檢索詞,本例中主題詞為“uterine cervix cancer”,與PubMed中的主題詞不一致。Embase會自動為該主題詞添加同義詞,如該主題詞有18個(gè)同義詞,包括“cancer”“uterine cervix”“cervical cancer”“cervix cancer”以及“cervix cancer”“recurrent”等,這些同義詞可以根據(jù)具體的檢索需要進(jìn)行手動添加和刪除。而后依次在Intervention、Comparison和Outcome的檢索框中輸入相應(yīng)的主題詞,同時(shí)選擇添加和刪除系統(tǒng)自動匹配的同義詞,一鍵式進(jìn)行檢索。
就循證醫(yī)學(xué)證據(jù)的檢索過程而言,Embase具有明顯優(yōu)勢。其提供的PICO、PV等檢索途徑在循證醫(yī)學(xué)檢索過程中能更好地匹配用戶的需求,模塊化的檢索步驟方便用戶更直觀地開展文獻(xiàn)檢索,自動匹配與該主題詞相關(guān)的同義詞有助于提高文獻(xiàn)的查全率,檢索操作流程方面更為合理。PICO檢索途徑的潛在功能是為用戶提供恰當(dāng)?shù)臋z索式,當(dāng)用戶不能準(zhǔn)確地按照PICO原則分析臨床課題時(shí),則模塊化檢索后在檢索結(jié)果界面的檢索歷史(History)中篩選并調(diào)整檢索式。而用戶在PubMed中進(jìn)行循證醫(yī)學(xué)證據(jù)主題檢索時(shí),操作簡單快捷,但靈活調(diào)整以適應(yīng)不同需求的操作空間很小。
PubMed所用的MeSH詞表最早可追溯至1940年《醫(yī)學(xué)索引》的季度累積主題索引,1960年隨著《醫(yī)學(xué)索引》新專輯的出版,《醫(yī)學(xué)主題詞表》首版正式發(fā)行,當(dāng)時(shí)共收錄4 400個(gè)主題詞[13]。Embase使用詞表為Emtree,創(chuàng)建于1988年,其前身為MALIMET(Master List of Medical Indexing Terms),在規(guī)范控制方面借鑒了MeSH的樹狀層級結(jié)構(gòu)[14]。所以二者有共同之處,但區(qū)別也很明顯,其最大的不同是專指度有差異。專指度是指主題詞與文獻(xiàn)主題概念的切合程度,揭示主題詞在表達(dá)文獻(xiàn)主題的深度和精度方面的能力[15]。醫(yī)學(xué)主題詞表的專指度對查準(zhǔn)率有直接影響,詞表的主題詞數(shù)量則直接決定專指度,主題詞越多表明詞表的專指度越高。MeSH收錄的主題詞數(shù)量大約為29 000個(gè),而Emtree收錄的主題詞數(shù)量超過82 000個(gè),約是MeSH的2.8倍,且Emtree覆蓋所有MeSH詞匯[16],還有部分詞匯作為同義詞處理,所以Emtree的專指度更高,在檢索過程中能獲得更高的查準(zhǔn)率。
副主題詞作為進(jìn)一步限定主題某方面的詞匯,其數(shù)量遠(yuǎn)沒有主題詞的數(shù)量多,如PubMed中有80個(gè)副主題詞,Embase中有82個(gè)副主題詞,二者在副主題詞的數(shù)量上大致相當(dāng)。但不同的是,在PubMed中,各類主題詞均有可與之匹配的若干副主題詞;而在Embase中僅有藥物、疾病和設(shè)備類主題詞才搭配副主題詞,如在82個(gè)副主題詞中疾病類副主題詞有14個(gè),藥物類副主題詞有64個(gè),設(shè)備類副主題詞僅有4個(gè)。值得一提的是,藥物類副主題詞包括了17個(gè)核心藥物關(guān)聯(lián)詞和47個(gè)給藥途徑關(guān)聯(lián)詞,其中22個(gè)給藥途徑關(guān)聯(lián)詞是Emtree詞表獨(dú)有的,加強(qiáng)了檢索的深度[17]。
MeSH詞表由主題詞(即敘詞,Descriptors)、副主題詞(即限定詞,Qualifiers)以及增補(bǔ)概念(Supplementary Concept Records,簡稱SCRs)3類記錄構(gòu)成。Emtree在詞表構(gòu)成上與MeSH相似,包括主題詞(即優(yōu)先詞,Preferred Terms)、副主題詞(Subheadings)以及候選詞(Candidate)3類術(shù)語。當(dāng)標(biāo)引人員不能找到合適的主題詞標(biāo)引文獻(xiàn)時(shí),如罕見疾病等,則將其作為增補(bǔ)概念/候選詞添加到MeSH/Emtree詞表中作為補(bǔ)充。此外,二者在副主題詞標(biāo)引方面具有明顯差異,PubMed采用先組式標(biāo)引方法,而Embase采用浮動或是自由浮動副主題詞的標(biāo)引方法。由于副主題詞的獨(dú)立標(biāo)注,使得Embase的數(shù)據(jù)結(jié)構(gòu)更有利于循證醫(yī)學(xué)證據(jù)的檢索實(shí)現(xiàn),但須注意Embase的后組式主題標(biāo)引方法會產(chǎn)生不同程度的檢索噪音。
在PubMed和Embase數(shù)據(jù)庫中分別對實(shí)例“成年女性如何通過HPV的檢查來預(yù)測宮頸癌”進(jìn)行檢索,發(fā)現(xiàn)同一檢索詞在兩個(gè)數(shù)據(jù)庫中對應(yīng)的主題詞不完全一致,系統(tǒng)自動給出的與主題詞相關(guān)的同義詞數(shù)量也有較明顯差距,檢索結(jié)果數(shù)量以及更多字段信息都存在差異(表1)。
表1 PubMed和Embase檢索結(jié)果及字段信息顯示
從表1可以看出,從Embase數(shù)據(jù)庫檢索得到該實(shí)際臨床問題的文獻(xiàn)260篇,而從PubMed中檢出的文獻(xiàn)數(shù)量則相對較少。究其原因,首先是收錄范圍不同。兩個(gè)數(shù)據(jù)庫雖然都側(cè)重生物醫(yī)學(xué)領(lǐng)域,但Embase對疾病和藥物信息的覆蓋率更全面,且收錄了大量歐洲和亞洲的生物醫(yī)學(xué)及藥學(xué)期刊。其次是標(biāo)引方式不同。二者的核心檢索途徑都是主題詞檢索,PubMed采用先組式標(biāo)引方式,主題詞與副主題詞之間具有較緊密的邏輯關(guān)系,而Embase采用自由浮動副主題詞的方式進(jìn)行主題標(biāo)引。最后是同一臨床醫(yī)學(xué)領(lǐng)域的專業(yè)術(shù)語在兩個(gè)數(shù)據(jù)庫中的地位有所差異。由于Emtree覆蓋了所有的MeSH詞匯,因此在PubMed數(shù)據(jù)庫使用的主題詞,在Embase數(shù)據(jù)庫中有可能被當(dāng)做入口詞使用。
對于檢索結(jié)果的顯示,兩個(gè)數(shù)據(jù)庫各有側(cè)重。PubMed檢索結(jié)果缺省顯示方式為Summary格式,包括文獻(xiàn)標(biāo)題、作者、出處以及PMID號。此外,還提供了MeSH database,Journal database,Single citation matcher,Clinical queries,Topic-specific queries等滿足用戶特殊需求的檢索服務(wù)鏈接。Embase數(shù)據(jù)庫中,對于一條特定的檢索結(jié)果,系統(tǒng)會給出該條記錄的文摘信息、藥物、疾病和其他類主題詞以及通信作者地址信息等。兩個(gè)數(shù)據(jù)庫均對主題詞進(jìn)行了標(biāo)引,但Embase特別強(qiáng)調(diào)了主要主題詞(Major Focus)、檢索詞以及主要副主題詞。其中主要主題詞以加粗加黑的字體顯示,主要副主題詞可以繼續(xù)查看與其相關(guān)的術(shù)語列表或其他副主題詞列表。對這些詞語的標(biāo)引,不但能夠幫助用戶快速準(zhǔn)確地了解文獻(xiàn)所涉及的主要內(nèi)容,更可以作為入口詞更精確地檢索該臨床問題的某一方面或是幾個(gè)方面的相關(guān)文獻(xiàn),提高相關(guān)性。
PubMed和Embase對循證醫(yī)學(xué)證據(jù)相關(guān)文獻(xiàn)的查詢各有特點(diǎn)。從檢索途徑上看,Embase提供更多可視化和模塊化的檢索,PubMed雖有專門針對臨床問題的檢索途徑,但界面不直觀,易用性不高;從檢索過程看,Embase數(shù)據(jù)庫中關(guān)于藥物、疾病、設(shè)備以及循證醫(yī)學(xué)的檢索途徑都是一鍵式檢索,可隨時(shí)調(diào)整檢索策略,可以說,在循證醫(yī)學(xué)的原始研究證據(jù)的檢索支持方面,Embase做得更好;從其數(shù)據(jù)結(jié)構(gòu)上分析,二者所用詞表均是層級結(jié)構(gòu),但Emtree體量更大,PubMed標(biāo)引更規(guī)范;從檢索結(jié)果看,Embase的標(biāo)引粒度更細(xì),專指度更高,提供的入口詞更多。因此,PubMed和Embase檢索各有優(yōu)勢,建議廣大臨床醫(yī)生和臨床試驗(yàn)者在進(jìn)行循證醫(yī)學(xué)證據(jù)檢索時(shí),同時(shí)檢索這兩個(gè)數(shù)據(jù)庫,以保證信息的完整性。
中華醫(yī)學(xué)圖書情報(bào)雜志2019年2期