金新建
(安徽醫(yī)科大學(xué) 圖書館,安徽 合肥 230032)
生物醫(yī)學(xué)科技查新是指查新員通過分析查新委托人提供的查新點和科學(xué)技術(shù)要點,提煉檢索詞,構(gòu)建檢索策略(檢索式),通過檢索生物醫(yī)學(xué)相關(guān)專業(yè)數(shù)據(jù)庫,獲取與課題相關(guān)的生物醫(yī)學(xué)文獻,閱讀文獻的摘要或全文,篩選出部分文獻進行對比分析,并對課題的創(chuàng)新點進行國內(nèi)外有無相關(guān)文獻報道的判斷。為生物醫(yī)學(xué)相關(guān)課題立項、醫(yī)學(xué)科技成果的鑒定、評估、驗收、轉(zhuǎn)化、獎勵等提供客觀依據(jù)[1],防止重復(fù)研究開發(fā)而造成國家人力、財力和物力的巨大浪費,且為生物醫(yī)學(xué)科技人員進行研究開發(fā)提供可靠而豐富的生物醫(yī)學(xué)相關(guān)信息。
PubMed和ProQuest Dialog(簡稱PQD)是生物醫(yī)學(xué)科技查新中非常重要的兩個數(shù)據(jù)庫,但在各查新站實際操作中,有些查新站認為生物醫(yī)學(xué)查新僅需要檢索PubMed,更多的查新站在進行生物醫(yī)學(xué)查新時,為了節(jié)省時間,只在PQD中進行檢索,認為PQD中已經(jīng)包含有Medline,不需要再單獨進行PubMed檢索。作為醫(yī)學(xué)查新站專業(yè)查新員,筆者認為有必要對PubMed和PQD數(shù)據(jù)庫及其在醫(yī)學(xué)查新中的應(yīng)用進行研究。
PubMed和PQD數(shù)據(jù)庫相同點是都是文摘型數(shù)據(jù)庫,都包含生物醫(yī)學(xué)專業(yè)非常重要的《美國生物醫(yī)學(xué)文摘》(Medline)數(shù)據(jù)庫。不同點是PubMed收錄的是生物醫(yī)學(xué)和生命科學(xué)的文獻,而PQD是個包含生物醫(yī)學(xué)、化學(xué)、農(nóng)業(yè)等學(xué)科數(shù)據(jù)庫的綜合性檢索平臺,還包含有大量的專利數(shù)據(jù)。
PubMed是美國國家生物技術(shù)信息中心(NCBI)開發(fā)的基于WEB的生物醫(yī)學(xué)信息檢索系統(tǒng),PubMed是一項免費資源,支持檢索生物醫(yī)學(xué)和生命科學(xué)文獻,以改善全球和個人健康。數(shù)據(jù)主要來自生物醫(yī)學(xué)和健康領(lǐng)域,以及如生命科學(xué)、行為科學(xué)、化學(xué)科學(xué)和生物工程等相關(guān)學(xué)科。PubMed醫(yī)學(xué)文獻檢索服務(wù)系統(tǒng)數(shù)據(jù)來源主要有Medline、Pre-1966 citations、 In-process citations、“Ahead of Print” citations、Record Supplied by Publisher、PubMed Central(PMC)等等,可見PubMed數(shù)據(jù)庫的收錄范圍要遠大于Medline。PubMed數(shù)據(jù)庫包含3 000萬份生物醫(yī)學(xué)文獻的引文和摘要,不包括全文期刊文章,但部分文獻可以從其他來源(如文獻發(fā)表期刊網(wǎng)站或PubMed Central)獲取到全文的鏈接。PubMed數(shù)據(jù)除了來自Medline數(shù)據(jù)庫,還包含一些最新的在線出版(Online)文獻和早于1966年的文獻,也包括由出版商提供的非Medline收錄范圍的生物醫(yī)學(xué)方面的文獻和雖然是Medline收錄范圍內(nèi)的文獻但還沒來得及進行主題詞標引,Medline暫時未收錄的文獻。由此可見,不能簡單地認為PubMed收錄的文獻一定是Medline收錄的文獻。
ProQuest Dialog是ProQuest公司旗下的國際聯(lián)機檢索系統(tǒng)。包含97個科技數(shù)據(jù)庫和40個專利數(shù)據(jù)庫,涉及電信與計算、工程與技術(shù)、航空航天與國防、化學(xué)、金融服務(wù)、能源與環(huán)境[2]、汽車、食品與農(nóng)業(yè)、衛(wèi)生保健、診斷與醫(yī)療器械、制藥與生物醫(yī)學(xué)等行業(yè)[3],其中生物醫(yī)學(xué)相關(guān)的數(shù)據(jù)庫有BIOSIS Previews、Embase、MEDLINE、New England Journal of Medicine、Global Health、 Nucleic Acids Abstracts等;藥學(xué)方面的有BIOSIS、IMS系列、Adis系列等數(shù)據(jù)庫,幾乎包含了全球主要的生物醫(yī)學(xué)與藥學(xué)方面的數(shù)據(jù)庫。ProQuest Dialog還包含SciSearch、Social SciSearch、Current Contents Search等全球重要的綜合性數(shù)據(jù)庫,以及31個國家的專利全文數(shù)據(jù)庫和世界著名的Denwent World Patents Index、INPADOC等專利數(shù)據(jù)庫。
PubMed檢索語法包括邏輯算符(AND、OR、NOT)、截詞符(用*表示)、短語檢索(用雙引號“”表示)等。PubMed具有自動轉(zhuǎn)換匹配功能,對于輸入檢索框中的檢索詞,PubMed將按照MeSH轉(zhuǎn)換表(MeSh Translation Table)、期刊刊名轉(zhuǎn)換表(Journal Translation Table)、短語表(Phrase List)、作者索引(Author Index)等順序進行對照、匹配和轉(zhuǎn)換,然后再進行檢索。要檢索某個單詞開頭的所有術(shù)語,可以在單詞后加截詞符“*”。如果檢索包含截詞符的短語,需要使用以下3種格式:①將短語用雙引號引起來,如“breast feed*”;②使用字段限定檢索,如breast feed*[tiab];③使用連字符,如breast-feed*。短語檢索和截詞功能會關(guān)閉PubMed的自動轉(zhuǎn)換匹配功能,也不再進行MeSH詞的擴檢。
ProQuest Dialog 檢索語法包括邏輯算符(AND、OR、NOT)、通配符和截詞符(用?和*表示)、位置算符 P/n(PRE/n)和N/n(NEAR/n)、精確檢索(用引號“”表示)。PQD對輸入檢索框中的單詞自動進行單復(fù)數(shù)、英美拼寫變體等形式的匹配。利用“”進行精確短語檢索,如輸入 “electric vehicle”,只能檢索出 electric vehicle。在PQD中,常用的通配符為“?”,一個問號代表一個字符,如檢索nurses或nursed ,檢索詞可用nurse?表示。截詞字符“*”用來檢索檢索詞的變體,比如復(fù)數(shù)形式、比較級、最高級、英美變體等形式,可用在檢索詞開頭、結(jié)尾或中間,可代替0-10個字符,如檢索*old 可找到:old、bold、 household等檢索結(jié)果(這些詞具有共同的詞根old)。限定截詞[*n]或$n,可替換多達指定字符數(shù)的字符,如檢索old、bold或hold,可用$1old或[*1]old,表示old前面可出現(xiàn)0-1個字符數(shù)。PQD位置算符有N/n(near/n) 和P/n (pre/n)兩種,n表示字符個數(shù)。其中P/n (pre/n)查找相鄰位置的兩個檢索詞(兩檢索詞位置不可換)的文檔,如:nursing P/0 education 兩個單詞中間一個空格或字符,nursing P/4 education 兩個單詞中間0-4個字符,兩檢索詞前后位置不能互換;N/n(near/n)查找相鄰位置的兩個檢索詞(位置可互換)的文檔,如nursing NEAR/0 education 兩個單詞中間一個空格或字符,兩檢索詞前后位置可互換。
PubMed和PQD檢索語法中都包含邏輯算符(AND、OR、NOT)、通用截詞符(用*表示)、精確檢索(用雙引號“”表示)等常用檢索語法。PubMed強大的檢索詞自動轉(zhuǎn)換匹配功能,有利于查新時的查全;PQD的限定截詞和位置算符等特定檢索語法,有利于查新時的查準。
PubMed提供多種檢索途徑,包括:基本檢索、主題詞檢索、高級檢索、限定檢索、引文匹配檢索等,支持邏輯運算檢索和檢索詞自動轉(zhuǎn)換匹配功能?;緳z索:在檢索框中輸入任何具有實質(zhì)意義的詞,包含自由詞、主題詞、人名和期刊名等,系統(tǒng)會自動進行匹配檢索,輸入多個檢索詞時,系統(tǒng)會自動識別成詞組進行檢索,系統(tǒng)也會默認成單個單詞,每個單詞之間的空格默認為AND組配。如可以將Protein Disulfide Isomerase識別成一個詞組,也會將其識別成Protein AND Disulfide AND Isomerase,如果出現(xiàn)數(shù)字等符號時,不易識別成詞組,對PubMed不能識別的詞組,需使用引號(半角狀態(tài)下)標記詞組,如"t-PA"。PubMed使用美國醫(yī)學(xué)圖書館編制的醫(yī)學(xué)專題詞表(MeSH)對收錄的文獻進行主題標引,主題詞檢索是PubMed特有的檢索途徑,可選擇規(guī)范化主題詞、副主題詞、查看詞義注釋、瀏覽樹狀結(jié)構(gòu)表等。PubMed能自動地為輸入的檢索詞尋找相應(yīng)的MeSH詞,查新員可以根據(jù)課題挑選合適的副主題詞,選擇全部副主題詞和主題詞擴檢來擴大查新范圍等。這種強大的檢索功能非常有利于科技查新中文獻的查全。PubMed檢索界面很友好,檢索途徑和檢索方式簡單,非常容易掌握,醫(yī)學(xué)院校文獻檢索課中都會講授PubMed數(shù)據(jù)庫,所以大多數(shù)的醫(yī)學(xué)科技工作者都會熟練運用PubMed。醫(yī)學(xué)查新站的查新員大多具有醫(yī)學(xué)專業(yè)背景,且有些查新員本身就是醫(yī)學(xué)文獻檢索課教師,能非常熟練的應(yīng)用PubMed數(shù)據(jù)庫進行科技查新。
PQD提供基本檢索、高級檢索和命令行檢索(指令檢索)。其中指令檢索最為全面:可一次輸入多個檢索式同時檢索;檢索式可換行分步檢索;檢索集可以與檢索集運算;檢索集可以與檢索詞運算;檢索集可以與檢索式運算。這種指令檢索非常方便地用于檢索策略的調(diào)試和完善。PQD提供的檢索途徑和檢索語法較為全面,非常適合科技查新工作要求的在查全的基礎(chǔ)上查準,但由于PQD包含97個科技數(shù)據(jù)庫和40個專利數(shù)據(jù)庫,這么多的數(shù)據(jù)庫要在一個統(tǒng)一平臺進行檢索,且PQD收費較高,所以對查新員的檢索能力也有相當高的要求,特別是選擇檢索詞和構(gòu)建檢索策略的能力方面,查新員要經(jīng)過培訓(xùn)和長期查新實踐后才能熟練掌握PQD。
PubMed和PQD都提供多種檢索途徑,PubMed的主題詞檢索優(yōu)勢在于其通過主題詞字順表和樹形結(jié)構(gòu)表對語法信息和語用信息的深度揭示,達到了人機對話中對語義信息的準確把握,獲得了高效率的醫(yī)學(xué)文獻檢索結(jié)果[8];適合專業(yè)檢索人員的PQD指令檢索雖然看起來煩瑣和不易掌握,但作為查新員,一旦掌握,能很好地提高查新效率。
PubMed免費提供題錄和文摘,其中PubMed Center(PMC)部分能免費獲取全文,且不受時間和IP地址的限制,只要有互聯(lián)網(wǎng)就可以進行免費檢索,查看、下載題錄和摘要。
PQD一般是由查新機構(gòu)購買的聯(lián)機檢索系統(tǒng),有并發(fā)用戶限制,由于PQD收費較高,一般查新機構(gòu)采用的大多是包庫,每年繳納固定費用,用于免費檢索、查看檢索結(jié)果列表、預(yù)覽題錄和部分摘要內(nèi)容。檢索結(jié)果列表僅包含題名、出版年份和來源數(shù)據(jù)庫等,如果不想產(chǎn)生額外費用,查新員可以通過題名或來源數(shù)據(jù)庫信息再去相關(guān)數(shù)據(jù)庫檢索,獲取摘要或全文信息,但如從其他數(shù)據(jù)庫無法獲取相關(guān)信息,通過PQD查看或下載引文、摘要、全文都是要額外收費的,PQD會根據(jù)數(shù)據(jù)庫和查看下載的格式不同,提供不同的收費標準,且每次收費之前都會彈出價格預(yù)覽,查新員可以根據(jù)需要進行取舍[3]。
檢索實例1 :ZSWIM3的*研究
檢索時間:2020年9月27日
檢索詞:ZSWIM/Zinc finger SWIM/Zinc-finger SWIM
檢索字段:在題名和摘要字段中檢索
PubMed檢索式:Zinc finger SWIM[Title/Abstract]OR Zinc-finger
SWIM[Title/Abstract] OR ZSWIM[Title/Abstract]
PQD檢索式:ti,ab(Zinc p/1 finger p/0 SWIM OR ZSWIM)
檢索結(jié)果:PubMed共檢出11篇文獻;PQD共檢出19篇文獻
對比兩個數(shù)據(jù)庫的檢索結(jié)果,同樣的檢索詞和檢索式,都是限定在題名和摘要字段中進行檢索,PubMed只檢出11篇文獻,PQD則檢出19篇文獻,對比兩個數(shù)據(jù)庫的檢索結(jié)果發(fā)現(xiàn),有10篇是重復(fù)的,PubMed中檢出的11篇文獻中,只有1篇2020年最新發(fā)表,出版狀態(tài)為Epub的這篇文獻在PQD中未檢索到,ProQuest Dialog中有的,PubMed中未檢出的,大多是另一重要的醫(yī)學(xué)數(shù)據(jù)庫《荷蘭醫(yī)學(xué)文摘》(Embase)收錄的文獻。經(jīng)過閱讀摘要或全文發(fā)現(xiàn),PubMed中檢出的那篇Online文獻,與該查新課題非常相關(guān),可見如果查新時僅僅檢索PQD,就會漏檢部分最新文獻。
檢索實例2:通過全外顯子測序技術(shù)篩選特發(fā)性非梗阻性無精子癥的致病基因
檢索時間:2020年11月19日
檢索詞:Nonobstructive azoospermia/non-obstructive azoospermia/NOA/idiopathic azoospermia;idiopathic;gene;Whole exome sequencing/WES
PubMed檢索式:(Nonobstructive azoospermia[Title/Abstract] OR non-obstructive azoospermia[Title/Abstract] OR NOA[Title/Abstract] OR idiopathic azoospermia)[Title/Abstract] AND idiopathic[Title/Abstract] AND gene[Title/Abstract] AND (whole exome sequencing[Title/Abstract] OR WES)[Title/Abstract]
PQD檢索式:ti,ab((Nonobstructive p/0 azoospermia OR non p/1 obstructive p/0 azoospermia OR NOA OR idiopathic p/1 azoospermia) AND idiopathic AND gene$ AND (whole p/0 exome p/0 sequencing OR WES))
檢索結(jié)果:PubMed檢出文獻 4篇,其中3篇與PQD重了,只有最新的1篇出版狀態(tài)為“Online ahead of print”的在PQD中未檢索到;PQD中檢出11篇文獻分別來自Embase(11篇)、Medline(5篇)、SCI(2篇)、Current Contents(2篇)、Northern Light Life Sciences Conference Abstracts(1篇)等數(shù)據(jù)庫。由此可見,PQD在醫(yī)學(xué)科技查新中的重要性。
教育部科技查新工作站查新報告撰寫規(guī)范對查新工作的文獻檢索范圍有明確要求:中外文數(shù)據(jù)庫檢索必查數(shù)據(jù)庫均不少于10個,有些查新項目(如產(chǎn)品類查新)可進行互聯(lián)網(wǎng)等其他方式的補充檢索,網(wǎng)絡(luò)數(shù)據(jù)庫資源足夠豐富的查新機構(gòu),可以基于自有的網(wǎng)絡(luò)數(shù)據(jù)庫開展查新。如果必查綜合數(shù)據(jù)庫(通用基本數(shù)據(jù)庫)或?qū)I(yè)數(shù)據(jù)庫欠缺,須采用國際聯(lián)機進行補充檢索[2~7]。文獻檢索范圍越大,查全率越高,查準率必然下降,所以需要根據(jù)查新課題選擇合適的數(shù)據(jù)庫進行檢索。
PubMed檢索方法很容易掌握,檢索途徑多,可免費進行檢索,免費查看題錄和摘要等信息,部分還可免費獲取全文,但如果醫(yī)學(xué)查新時僅僅使用PubMed檢索,課題的檢索范圍會過于狹窄,無法保證查全率,如果醫(yī)學(xué)查新時沒有對如 Inspec、BIOSIS Previews、SCI、EMBASE等這些國際知名數(shù)據(jù)庫進行檢索,文獻檢索范圍得不到保證,不符合教育部科技查新工作站查新報告撰寫規(guī)范對查新工作的文獻檢索范圍提出的數(shù)據(jù)庫要求,無法保證查新質(zhì)量。而PQD聯(lián)機系統(tǒng)檢索費用較為昂貴,盡管各醫(yī)學(xué)查新站團購了PQD,但除檢索不收費外,其他查看和下載還是需要額外付費。盡管現(xiàn)在PQD檢索途徑和檢索式的編寫已經(jīng)得到很好的優(yōu)化,但高昂的查看和下載費用在一定程度上限制了它在科技查新中的應(yīng)用。另一方面,雖然在PQD和PubMed都收錄了Medline數(shù)據(jù)庫,但PQD除了Medline,還包括Embase、BP等相當多的醫(yī)學(xué)和其他相關(guān)專業(yè)數(shù)據(jù)庫;PubMed除了Medline還包括了相當部分最新文獻和非Medline收錄文獻,這部分恰恰是PQD所缺乏的文獻。
作為教育部科技查新工作站(醫(yī)學(xué)),筆者經(jīng)過長期實踐,并且在深入研究PQD和PubMed的基礎(chǔ)上,認為在醫(yī)學(xué)科技查新工作中這兩個數(shù)據(jù)庫應(yīng)同時進行檢索,缺一不可,必要時還需要查詢其他館藏資源和網(wǎng)絡(luò)數(shù)據(jù)庫進行補充。PubMed如果限定字段檢索,系統(tǒng)就會關(guān)閉自動轉(zhuǎn)換匹配功能,查新員可以根據(jù)檢出課題相關(guān)文獻的數(shù)量選擇是在全字段檢索還是在限定字段中檢索,筆者經(jīng)過長期實踐摸索,在進行PubMed檢索時通常采用在所有字段中進行檢索,在PQD中通常采用在題名和摘要中進行檢索,這樣互為補充的檢索,既可查全,又很好地兼顧了節(jié)省費用和查準。為了節(jié)省PQD的檢索費用,通常是先在PubMed中進行檢索,通過查看主題詞和摘要信息,選擇規(guī)范的檢索詞,構(gòu)建合適的檢索式,再按照PQD的檢索語法構(gòu)建檢索策略,檢索到相關(guān)文獻題名后再去館內(nèi)已有資源查看下載摘要等信息,根據(jù)課題的相關(guān)性選擇對比文獻,最終完成查新報告。