姚克宇,陳超,朱蘭,朱彥,楊坤杰,劉麗紅*
·信息技術(shù)與中醫(yī)藥·
數(shù)據(jù)庫(kù)技術(shù)輔助的文獻(xiàn)檢索與篩選方案研究
姚克宇1,陳超1,朱蘭2,朱彥1,楊坤杰1,劉麗紅1*
1.中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京 100700;2.國(guó)家藥品監(jiān)督管理局藥品評(píng)價(jià)中心,北京 100037
為解決目前文獻(xiàn)檢索與篩選中存在的問題,提出一種基于數(shù)據(jù)庫(kù)技術(shù)的文獻(xiàn)檢索與篩選方案。以“中藥引起的藥物性肝損傷”文獻(xiàn)檢索與篩選為例,利用Access數(shù)據(jù)庫(kù)結(jié)構(gòu)化查詢語言(SQL)的查詢視圖功能,通過關(guān)鍵詞查詢文獻(xiàn)標(biāo)題,按照不同層次、主題以及步驟,逐層遞進(jìn)篩選文獻(xiàn)。人工復(fù)核篩選結(jié)果,同時(shí)完成關(guān)鍵詞迭代,獲得最終篩選結(jié)果。與傳統(tǒng)基于關(guān)鍵詞的文獻(xiàn)檢索和篩選相比,基于數(shù)據(jù)庫(kù)技術(shù)的文獻(xiàn)檢索與篩選方案擴(kuò)大了檢索范圍,提高了文獻(xiàn)檢索的查全率,關(guān)鍵詞迭代完善了關(guān)鍵詞表,借助Access數(shù)據(jù)庫(kù)查詢視圖功能提高了文獻(xiàn)篩選的效率、靈活性和準(zhǔn)確度,減少了研究人員的工作量。應(yīng)用數(shù)據(jù)庫(kù)技術(shù)輔助的文獻(xiàn)檢索與篩選方案可以更加全面、準(zhǔn)確、靈活、高效、便捷地篩選文獻(xiàn)。
數(shù)據(jù)庫(kù)技術(shù);文獻(xiàn)檢索;文獻(xiàn)篩選
文獻(xiàn)檢索與篩選是科學(xué)研究過程中必不可少的一項(xiàng)基礎(chǔ)性工作,是研究結(jié)果可靠性的基本保障之一。以不良反應(yīng)領(lǐng)域研究為例,不良反應(yīng)檢測(cè)、分析、報(bào)告等是該領(lǐng)域主要研究?jī)?nèi)容之一[1],文獻(xiàn)檢索與篩選是研究不良反應(yīng)報(bào)告文獻(xiàn)質(zhì)量、要素、問題、規(guī)范等的基礎(chǔ)[2-5]。檢索獲得的“軼事報(bào)告(anecdotal reporting)可作為自發(fā)報(bào)告的補(bǔ)充”,同時(shí)還可以“提高不良反應(yīng)報(bào)告的規(guī)范等級(jí)”[6]。學(xué)術(shù)文獻(xiàn)作為高質(zhì)量的藥品不良反應(yīng)信息來源之一,也是持有人藥品不良反應(yīng)報(bào)告的重要來源[5]。2018年,國(guó)家藥品監(jiān)督管理局發(fā)布《個(gè)例藥品不良反應(yīng)收集和報(bào)告指導(dǎo)原則》,明確要求“持有人應(yīng)定期對(duì)文獻(xiàn)進(jìn)行檢索”,“首次上市或首次進(jìn)口五年內(nèi)的新藥,文獻(xiàn)檢索至少每?jī)芍苓M(jìn)行一次”[7],以保證獲得全面、準(zhǔn)確的個(gè)例不良反應(yīng)文獻(xiàn)。
傳統(tǒng)的基于關(guān)鍵詞的文獻(xiàn)檢索和篩選,盡管可以獲得準(zhǔn)確信息,但仍存在一些問題:第一,各主題因素的標(biāo)引或組配的結(jié)果所表達(dá)的概念,與文獻(xiàn)的實(shí)際內(nèi)容有一定的差異,從而在文獻(xiàn)檢索時(shí)造成誤檢或漏檢,形成標(biāo)引誤差[8],導(dǎo)致檢索詞往往無法全面涵蓋目標(biāo)文獻(xiàn);第二,文獻(xiàn)篩選占用大量的人力,效率不高。
數(shù)據(jù)庫(kù)作為信息系統(tǒng)的一個(gè)核心組成部分,能高效實(shí)現(xiàn)數(shù)據(jù)的獲取、組織、存儲(chǔ)和處理,已成為醫(yī)藥信息化不可或缺的基礎(chǔ)工具[9]。數(shù)據(jù)庫(kù)中的表用來存儲(chǔ)數(shù)據(jù),而視圖則是基于一個(gè)或幾個(gè)基本表(或視圖)使用結(jié)構(gòu)化查詢語言(Structured Query Language,SQL)定義的虛擬表,具有簡(jiǎn)化用戶理解和操作、保證數(shù)據(jù)安全等優(yōu)點(diǎn)。針對(duì)藥物不良反應(yīng)文獻(xiàn)篩選的實(shí)際需要,合理地使用視圖等功能,能實(shí)現(xiàn)對(duì)大量不良反應(yīng)文獻(xiàn)數(shù)據(jù)進(jìn)行快速、有效地篩選、組合查詢等功能。
基于此,本文提出一種結(jié)合Access數(shù)據(jù)庫(kù)的SQL視圖功能的文獻(xiàn)檢索與篩選方案,其優(yōu)勢(shì)在于:⑴提高了文獻(xiàn)的查全率。通過關(guān)鍵詞迭代,包容了標(biāo)引誤差;減少人為文獻(xiàn)篩選工作量,可以制定涵蓋更大檢索范圍的檢索策略。⑵提高了文獻(xiàn)篩選的效率。數(shù)據(jù)庫(kù)查詢代替了部分人工篩選,加快了篩選進(jìn)度;當(dāng)篩選過程出現(xiàn)錯(cuò)誤時(shí),可以隨時(shí)溯源并快速糾正篩選結(jié)果。研制本方案的目的是為研究人員提供高效、可擴(kuò)展的文獻(xiàn)檢索和篩選方法,使其更高效、快速地查找文獻(xiàn)信息。
基于SQL查詢視圖功能,設(shè)計(jì)中藥不良反應(yīng)個(gè)例報(bào)道文獻(xiàn)檢索篩選方案,可以代替部分重復(fù)的人工閱讀標(biāo)題、摘要、全文的過程性工作,并為擴(kuò)大檢索范圍、提高文獻(xiàn)檢出率提供了可能。根據(jù)現(xiàn)有研究,不良反應(yīng)報(bào)告類文獻(xiàn)多以散發(fā)的個(gè)案報(bào)道發(fā)表,一般病例數(shù)在10例以下,因此文獻(xiàn)檢索主要以病例數(shù)小于10例的臨床個(gè)案報(bào)道為主。該方案將不良反應(yīng)個(gè)案報(bào)道文獻(xiàn)檢索篩選的復(fù)雜過程按目的和主題抽象為若干步驟,并制定出相應(yīng)的關(guān)鍵詞表,再基于SQL語法建立查詢視圖,最后對(duì)篩選結(jié)果進(jìn)行人工復(fù)核審查。概括為四步:⑴確定篩選層次。根據(jù)研究目的,按照邏輯關(guān)系確定篩選層次。⑵制定關(guān)鍵詞表。確定每個(gè)篩選層次的關(guān)鍵詞,制定關(guān)鍵詞表。⑶SQL篩選。通過SQL查詢視圖功能,實(shí)現(xiàn)對(duì)文獻(xiàn)按步驟的篩選。⑷人工復(fù)核。人工復(fù)核篩選結(jié)果,同時(shí)修正關(guān)鍵詞,修正結(jié)果;確定納入文獻(xiàn)。人工復(fù)核過程也是關(guān)鍵詞迭代的過程,可以逐步地修正完善篩選結(jié)果。
基于Access數(shù)據(jù)庫(kù)技術(shù)檢索流程與常規(guī)檢索流程對(duì)比見圖1。
不良反應(yīng)個(gè)案報(bào)道文獻(xiàn)包含了不良反應(yīng)、個(gè)案報(bào)道2個(gè)要素,按照要素進(jìn)行篩選層次細(xì)化。不良反應(yīng)要素可以遵循因果邏輯,細(xì)化為由哪類或哪種藥品導(dǎo)致的什么不良反應(yīng),即藥品和不良反應(yīng)2個(gè)層次。例如,中藥引起的肝損傷案例中,不良反應(yīng)要素的篩選層次為中藥及肝損傷。個(gè)案報(bào)道要素可以細(xì)化為個(gè)案和報(bào)道2個(gè)層次,其中個(gè)案需要明確納入文獻(xiàn)中病例數(shù)的范圍。根據(jù)細(xì)化篩選層次,制定相應(yīng)的關(guān)鍵詞表。
根據(jù)篩選層次制定相應(yīng)的關(guān)鍵詞表。關(guān)鍵詞表是結(jié)果準(zhǔn)確的重要保障。一般情況下,關(guān)鍵詞主要有術(shù)語集或詞典等官方表述、檢索關(guān)鍵詞和檢索文獻(xiàn)3個(gè)主要來源,其中文獻(xiàn)也是關(guān)鍵詞迭代的源頭。
圖1 2種文獻(xiàn)篩選方式的流程對(duì)比
如圖1所示,制定好相應(yīng)的關(guān)鍵詞表后,對(duì)導(dǎo)入Access數(shù)據(jù)庫(kù)中的文獻(xiàn)標(biāo)題進(jìn)行SQL自動(dòng)篩查。通過篩選題目中是否包含相應(yīng)的關(guān)鍵詞,研究人員按照順序?qū)訉雍Y選文獻(xiàn)?;趯?duì)應(yīng)關(guān)鍵詞表的篩選,研究人員可以按照自己的邏輯分步驟完成,使篩選的過程更加明晰。通過具體、明確的篩選詞和邏輯關(guān)系,在出現(xiàn)錯(cuò)誤或遺漏時(shí)可以快速溯源,消除錯(cuò)誤,完善結(jié)果。其中,主題篩選可以依據(jù)具體情況進(jìn)行擴(kuò)展,仍以中藥引起的肝損傷文獻(xiàn)為例,需要進(jìn)行中藥和肝損傷2個(gè)主題的篩選。這意味著,該方案不僅可以應(yīng)對(duì)主題相對(duì)復(fù)雜的文獻(xiàn)篩選,還可以隨時(shí)修正結(jié)果。
復(fù)核主題篩選后擬納入的文獻(xiàn),對(duì)于不符合納入標(biāo)準(zhǔn)的文獻(xiàn)強(qiáng)制排除;復(fù)核主題篩選后排除的文獻(xiàn),有些目標(biāo)文獻(xiàn)因題目等未包含篩選關(guān)鍵詞而被遺漏,需要人工復(fù)核后強(qiáng)制納入。人工復(fù)核保證了篩選結(jié)果的準(zhǔn)確性。
關(guān)鍵詞表的更新是一個(gè)與人工復(fù)核互動(dòng)的過程,二者同時(shí)進(jìn)行。復(fù)核文獻(xiàn)過程中,當(dāng)發(fā)現(xiàn)強(qiáng)制納入或排除文獻(xiàn)時(shí),分析其是否包含了新的關(guān)鍵詞,以便對(duì)關(guān)鍵詞表進(jìn)行補(bǔ)充。一些有代表性的關(guān)鍵詞,可以一次篩選出較多的文獻(xiàn),從而減少人工復(fù)核文獻(xiàn)數(shù)量,使用者可以根據(jù)自身經(jīng)驗(yàn)判斷是否更新篩選結(jié)果,也可以每次發(fā)現(xiàn)新的關(guān)鍵詞后都進(jìn)行查詢。
雖然這一工作量仍然較大,但是由于這些關(guān)鍵詞表可以應(yīng)用到后續(xù)相似或相關(guān)主題的文獻(xiàn)篩選中,從長(zhǎng)遠(yuǎn)發(fā)展角度,能夠?yàn)榭蒲腥藛T或團(tuán)隊(duì)的文獻(xiàn)檢索和篩選帶來便利,減少工作量。
以“中藥引起的藥物性肝損傷”相關(guān)文獻(xiàn)的檢索與篩選為例,對(duì)本方案進(jìn)行詳細(xì)說明。
2.1.1 納排標(biāo)準(zhǔn) 中藥是指在中醫(yī)藥理論和臨床經(jīng)驗(yàn)指導(dǎo)下用于防治和醫(yī)療保健的藥物,包括中藥材、飲片、中藥配方顆粒和中成藥[10]。因此,本研究中的中藥包括中藥材、飲片、中藥配方顆粒、中成藥、民族藥等各種類型以及中藥提取物等。
納入標(biāo)準(zhǔn):由中藥單獨(dú)引起或與其他藥聯(lián)合應(yīng)用(懷疑用藥包括中藥)引起的肝損傷個(gè)案報(bào)道期刊文獻(xiàn)。
排除標(biāo)準(zhǔn):由西藥、保健品等非中藥引起的肝損傷個(gè)案報(bào)道,文獻(xiàn)綜述、文摘、科普文獻(xiàn)等。
2.1.2 文獻(xiàn)來源 檢索中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)(CBM)、中國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)(萬方數(shù)據(jù))、中國(guó)知識(shí)資源總庫(kù)(CNKI)發(fā)表的“中藥引起的藥物性肝損傷”期刊文獻(xiàn)。檢索時(shí)限均從建庫(kù)至2021年5月。
2.1.3 檢索策略 CBM數(shù)據(jù)庫(kù)作為專業(yè)的生物醫(yī)學(xué)數(shù)據(jù)庫(kù),與中文科技期刊數(shù)據(jù)庫(kù)(維普)、萬方數(shù)據(jù)和CNKI比較,其收錄醫(yī)學(xué)類期刊更全、標(biāo)引質(zhì)量更高[11-12],所以,在檢索CBM時(shí)未對(duì)學(xué)科進(jìn)行限制。
檢索CNKI時(shí),學(xué)科勾選中醫(yī)、中藥、中西醫(yī)結(jié)合;檢索萬方數(shù)據(jù)時(shí),學(xué)科勾選中國(guó)醫(yī)學(xué)。
以CBM為例,檢索表達(dá)式為:("藥物性肝損傷"[常用字段:智能]OR"藥源性肝損傷"[常用字段:智能]OR"藥物性肝損害"[常用字段:智能]OR"藥源性肝損害"[常用字段:智能]OR"DILI"[常用字段:智能]OR "肝損傷"[常用字段:智能]OR"肝損害"[常用字段:智能]OR"肝毒素"[常用字段:智能]OR"肝毒性"[常用字段:智能]OR"肝功能損害"[常用字段:智能]OR"藥物性肝病"[常用字段:智能]OR"藥物性肝炎"[常用字段:智能]OR"肝功能損傷"[常用字段:智能]OR"藥源性肝病"[常用字段:智能]OR(("致"[中文標(biāo)題]OR"引"[中文標(biāo)題])AND"肝"[中文標(biāo)題])AND(("例"[中文標(biāo)題]OR"報(bào)告"[中文標(biāo)題]OR"報(bào)道"[中文標(biāo)題]OR"不良反 應(yīng)"[中文標(biāo)題]OR"副作用"[中文標(biāo)題]OR"毒性"[中文標(biāo)題])NOT"鼠"[中文標(biāo)題])。
2.2.1 檢索結(jié)果 萬方數(shù)據(jù)檢索到7 336篇文獻(xiàn);CNKI TKA(題名關(guān)鍵詞摘要)檢索得到1 445篇,SU(主題)檢索得到1 172篇;CBM檢索到24 377篇。刪除重復(fù)文獻(xiàn)4 877篇,納入29 453篇。
2.2.2 文獻(xiàn)篩選流程 將文獻(xiàn)導(dǎo)入Access數(shù)據(jù)庫(kù),以藥典、術(shù)語集、詞表等為參考,分別制定肝損傷相關(guān)和中藥相關(guān)的關(guān)鍵詞,按照個(gè)案報(bào)道、肝損傷、中藥的順序,將篩查分為個(gè)案報(bào)告篩查、主題1肝損傷文獻(xiàn)篩查、主題2包含中藥關(guān)鍵詞的肝損傷文獻(xiàn)篩查。依次建立基于SQL語法的查詢視圖篩選,并對(duì)篩選結(jié)果進(jìn)行人工復(fù)核。具體篩選流程見圖2。
圖2 中藥引起的藥物性肝損傷文獻(xiàn)篩選流程
2.2.2.1 肝損傷文獻(xiàn)篩選 如圖2所示,將查重后的文獻(xiàn)數(shù)據(jù)以Excel 2016格式導(dǎo)入Access2017,對(duì)關(guān)鍵詞進(jìn)行提煉,分步驟依次完成肝損傷文獻(xiàn)的標(biāo)題篩選,以下關(guān)鍵詞及文獻(xiàn)數(shù)量為關(guān)鍵詞迭代后的最終結(jié)果。
Step1:對(duì)納入文獻(xiàn)29 453篇,以“例”“報(bào)告”“報(bào)道”“致”“引”“誘發(fā)”為檢索詞,排除題目中不含有上述檢索詞的文獻(xiàn),得到22598篇;
Step2:以“肝”“毒”“致”“引”“誘發(fā)”為檢索詞,對(duì)Step1篩選后的文獻(xiàn)進(jìn)行篩選,排除與肝無關(guān)的文獻(xiàn)2 741篇,得到19857篇;
Step3:以“治療”“肝*報(bào)告”“致*肝”“治愈”為檢索詞,排除Step2結(jié)果中以治療為主的文獻(xiàn)4 979篇,得到14878篇;
Step4:排除Step3結(jié)果中病例數(shù)≥10例的文獻(xiàn)3 366篇,得到11512篇;
Step5:以“肝*引”“引*肝”“引*反應(yīng)”“引*過敏”“引*黃疸”“引*中毒”“引*死”“肝*致”“致*肝*”“致*反應(yīng)”“致*過敏”“致*黃疸”“致*中毒”“致*死”為關(guān)鍵詞,排除Step4結(jié)果中由肝病引起其他問題的文獻(xiàn)2 360篇,得到9152篇文獻(xiàn);
Step6:排除不相關(guān)文獻(xiàn),以“紫癜致”“變性致”“病致”“征致”“飲酒致”“毒蕈致”“蕈中毒所致”“豬肉致”“菌致”“化療導(dǎo)致”“疫苗致”“照射致”“治療致”“感染致”“出血致”“環(huán)境致”“缺陷*致”“化療致”“基因*致”“獻(xiàn)血致”“變異致”“排卵致”“壞死致”“梅毒致”“呃逆致”“抽搐致”“缺失致”“HBV致”“IL-11致”“術(shù)后*致”“檢查致”“失敗致”“術(shù)致”“病毒所致”“氨氣中毒致”“創(chuàng)傷應(yīng)激導(dǎo)致”“外傷所致”“皰疹致”“型致”“傷致”“過速致”“復(fù)合物致”“結(jié)石致”“診斷致”“按摩致”“術(shù)后致”“牙刷致”“衰竭致”“輸血所致”“方案致”“紫癜引起”“變性引起”“病引起”“征引起”“飲酒引起”“毒蕈引起”“蕈中毒引起”“豬肉引起”“菌引起”“化療引起”“疫苗引起”“照射引起”“治療引起”“感染引起”“出血引起”“環(huán)境引起”“缺陷*引起”“化療引起”“基因*引”“獻(xiàn)血引”“寄生蟲引”“污染引”為關(guān)鍵詞,排除Step5結(jié)果中其他原因?qū)е碌母螕p傷文獻(xiàn)843篇,得到8309篇文獻(xiàn);
Step7:以“黃疸”“黃膽”“肝性昏迷”“轉(zhuǎn)氨酶”“膽紅素”“肝*損”“肝*功*異常”“肝*功*不良”“肝功能惡化”“肝炎”“肝病”“肝竇阻塞”“肝*衰”“肝小靜脈閉塞”“肝*酶”“肝*生化”“肝性腦病”“肝壞”“肝硬化”“脂肪肝”“肝脂肪變性”“肝內(nèi)淤膽”“肝內(nèi)膽汁”“肝纖維化”“肝昏迷”“肝毒性”“肝腎綜合征”“多臟器”“中毒”“不良反應(yīng)”“過敏反應(yīng)”“中毒”“布-加”為檢索詞,排除Step6結(jié)果中非肝損傷文獻(xiàn)2 315篇,得到肝損傷相關(guān)文獻(xiàn)共計(jì)5994篇。
2.2.2.2 中藥文獻(xiàn)篩選 按照制定的中藥關(guān)鍵詞表(包括中藥飲片、中成藥等),從肝損傷文獻(xiàn)中篩選出包含中藥的文獻(xiàn)1 252篇。
2.2.2.3 人工復(fù)核及關(guān)鍵詞表的迭代更新 對(duì)不包含中藥關(guān)鍵詞的肝損傷文獻(xiàn)4 742篇進(jìn)行人工復(fù)核,閱讀摘要、全文后,強(qiáng)制納入符合“由中藥引起的藥物性肝損傷”文獻(xiàn)104篇。對(duì)包含中藥關(guān)鍵詞的肝損傷文獻(xiàn)結(jié)果進(jìn)行人工復(fù)核,閱讀摘要、全文后,強(qiáng)制排除不符合“由中藥引起的藥物性肝損傷”文獻(xiàn)770篇,納入482篇。
進(jìn)行以上兩項(xiàng)人工篩選的同時(shí)完善關(guān)鍵詞表:將“強(qiáng)制納入文獻(xiàn)”中未包含在“中藥關(guān)鍵詞表”或“肝損傷關(guān)鍵詞表”中的中藥關(guān)鍵詞或肝損傷關(guān)鍵詞分別補(bǔ)充進(jìn)“中藥關(guān)鍵詞表”和“肝損傷關(guān)鍵詞表”中,即對(duì)關(guān)鍵詞表進(jìn)行迭代更新,并更新納入文獻(xiàn)。例如,原中藥關(guān)鍵詞表中不包含“腰痛寧”這類無法從名稱判斷是否為中成藥的藥品,查詢確認(rèn)其為中成藥后,添加進(jìn)中藥關(guān)鍵詞表,再次運(yùn)行,更新篩選結(jié)果,增加腰痛寧致肝損害文獻(xiàn)2篇。類似的還有可達(dá)靈(增加1篇)、淋必清(增加2篇)等。
2.2.3 篩選結(jié)果 人工復(fù)核篩選后,強(qiáng)制納入符合“中藥引起的藥物性肝損傷”文獻(xiàn)104篇;強(qiáng)制排除不符合“中藥引起的藥物性肝損傷”文獻(xiàn)770篇,納入482篇。最終篩選出符合納入標(biāo)準(zhǔn)的文獻(xiàn)586篇。
使用數(shù)據(jù)庫(kù)技術(shù)輔助檢索,保證了文獻(xiàn)的檢全率和檢準(zhǔn)率,篩選過程更加靈活,與常規(guī)文獻(xiàn)檢索策略相比,具體優(yōu)勢(shì)見表1。
表1 2種文獻(xiàn)檢索與篩選方案對(duì)比
使用數(shù)據(jù)庫(kù)技術(shù)輔助檢索主要依據(jù)關(guān)鍵詞篩選文獻(xiàn),關(guān)鍵詞表涵蓋的范圍直接影響納入文獻(xiàn)是否準(zhǔn)確、全面。肝損傷案例中關(guān)鍵詞表以最新版國(guó)家藥典、國(guó)家標(biāo)準(zhǔn)及中藥學(xué)教材等為依據(jù),囊括了絕大部分詞匯,但由于版本更新的時(shí)間差等原因,仍然會(huì)有遺漏。通過人工復(fù)核獲得來自文獻(xiàn)的關(guān)鍵詞,可以實(shí)現(xiàn)關(guān)鍵詞表的迭代。豐富的關(guān)鍵詞增加了目標(biāo)文獻(xiàn)的數(shù)量,新的文獻(xiàn)又為篩選出新的關(guān)鍵詞提供了可能。運(yùn)行數(shù)據(jù)庫(kù)的視圖查詢功能,即可按照迭代后的關(guān)鍵詞表更新篩選結(jié)果,減少工作量。
人工篩選與關(guān)鍵詞表不斷互動(dòng)、迭代,使文獻(xiàn)篩選具有一定程度的“自我完善”功能。
利用Access數(shù)據(jù)庫(kù)進(jìn)行文獻(xiàn)篩選時(shí),可以按照研究人員的邏輯,自由設(shè)定篩選層次、主題數(shù)量及篩選步驟。其優(yōu)勢(shì)在于,當(dāng)發(fā)現(xiàn)問題或錯(cuò)誤而需要回溯、檢驗(yàn)矯正結(jié)果時(shí),可以按照篩選的層次、步驟回推,精確定位錯(cuò)誤點(diǎn),更加準(zhǔn)確、方便地修正結(jié)果。
修訂或進(jìn)行類似主題的相關(guān)文獻(xiàn)篩選時(shí),只需要調(diào)整篩選詞,再次運(yùn)行即可,減少工作量。
本文討論了基于數(shù)據(jù)庫(kù)技術(shù)的不良反應(yīng)個(gè)案報(bào)道檢索與查詢方案的設(shè)計(jì)與實(shí)現(xiàn),擴(kuò)大檢索范圍提高了文獻(xiàn)檢索查全率,借助數(shù)據(jù)庫(kù)查詢視圖功能提高了文獻(xiàn)篩選的效率和準(zhǔn)確度,實(shí)現(xiàn)全面、準(zhǔn)確、靈活、高效、便捷地篩選文獻(xiàn)。篩選方案邏輯清晰、操作簡(jiǎn)便,減少了研究人員的工作量。該方案還可應(yīng)用于其他主題文獻(xiàn)檢索與篩選。例如,篩選“A藥物治療B疾病的療效及安全性”,可以確定篩選包括A藥物、B疾病、療效、安全性4個(gè)層次,后續(xù)可以根據(jù)不同的層次、主題進(jìn)行文獻(xiàn)篩選。
盡管使用數(shù)據(jù)庫(kù)技術(shù)減少了文獻(xiàn)篩選工作量,但在強(qiáng)制納入/排除時(shí),仍需要較多的人工參與。因此,本文方案得到的文獻(xiàn)檢索和篩查結(jié)果,可以作為后續(xù)深度學(xué)習(xí)的訓(xùn)練數(shù)據(jù),設(shè)計(jì)、開發(fā)基于文本分類技術(shù)的自動(dòng)檢測(cè)模塊,利用優(yōu)質(zhì)文本進(jìn)行分類算法的學(xué)習(xí),以便進(jìn)一步開展基于深度學(xué)習(xí)實(shí)現(xiàn)自動(dòng)分類的相關(guān)研究。
[1] 焦嬌,韓玲革,李崇經(jīng).我國(guó)藥物不良反應(yīng)研究文獻(xiàn)計(jì)量分析[J].醫(yī)學(xué)信息學(xué)雜志,2012,33(12):49-52.
[2] 卞兆祥,田皓瑤,高琳,等.提高中藥注射劑不良反應(yīng)/不良事件文獻(xiàn)報(bào)告質(zhì)量[J].中國(guó)循證醫(yī)學(xué)雜志,2010,10(2):176-181.
[3] 冉姍,方忠宏,黃海茵,等.中藥藥物性肝損傷報(bào)告中存在的問題及建議[J].中醫(yī)雜志,2021,62(7):581-584.
[4] 吳泰相,商洪才,卞兆祥,等.中藥不良反應(yīng)/不良事件報(bào)告規(guī)范建議[J].中國(guó)循證醫(yī)學(xué)雜志,2010,10(2):215-219.
[5] 朱蘭,朱彥,劉麗紅,等.文獻(xiàn)來源的上市后藥品不良反應(yīng)報(bào)告常見問題分析[J].中國(guó)藥物警戒,2021,18(12):1155-1158.
[6] 畢玉俠,吳春福.藥品不良反應(yīng)文獻(xiàn)檢索與藥品不良反應(yīng)報(bào)告評(píng)價(jià)[J].中國(guó)藥房,2011,22(2):166-168.
[7] 國(guó)家藥品監(jiān)督管理局.國(guó)家藥監(jiān)局關(guān)于發(fā)布個(gè)例藥品不良反應(yīng)收集和報(bào)告指導(dǎo)原則的通告(2018年第131號(hào))[EB/OL].(2018-12-21)[2021-12-22].https://www.nmpa.gov.cn/xxgk/ggtg/qtggtg/20181221172901438.html.
[8] 戴行德.文獻(xiàn)主題因素的常見標(biāo)引誤差分析[J].圖書館建設(shè),2004(1):38-39,47.
[9] 馮天亮.數(shù)據(jù)庫(kù)原理及其醫(yī)學(xué)應(yīng)用[M].北京:電子工業(yè)出版社,2014: 10.
[10] 中華人民共和國(guó)國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì).中藥編碼規(guī)則及編碼:GB/T31774-2015[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2015.
[11] 李艷超,朱康玲.中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)與三大中文期刊全文數(shù)據(jù)庫(kù)的對(duì)比分析[J].情報(bào)探索,2013(9):62-64.
[12] 周曉政.SinoMed與三大中文文獻(xiàn)網(wǎng)絡(luò)檢索平臺(tái)的對(duì)比分析[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2019,28(10):63-69.
Study on Literature Retrieval and Screening Scheme Assisted by Database Technology
YAO Ke-yu1, CHEN Chao1, ZHU Lan2,ZHU Yan1, YANG Kun-jie1, LIU Li-hong1*
(1. Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 2. Center for Drug Reevaluation, National Medical Products Administration, Beijing 100037, China)
To propose a literature retrieval and screening scheme based on database technology to solve the problems existing in the current literature retrieval and screening.Taking the literature retrieval and screening of “drug-induced liver injury caused by Chinese materia medica” as an example, the query view function of the structured query language (SQL) of the Access database was used. Literature titles were searched by keywords, and literature was screened progressively layer by layer according to different levels, topics and steps. Manual review was conducted for the screening results and the iteration of keywords/words was complete, and the final screening results were obtained.Compared with the traditional keyword-based literature retrieval and screening, the literature retrieval and screening scheme based on database technology expanded the scope of retrieval and improved the recall rate of literature retrieval. Keyword iteration improved the keyword table, promoted the efficiency, flexibility and accuracy of literature screening with the help of the Access database query view function, and reduced the workload of researchers.The literature retrieval and screening scheme assisted by database technology can screen literature more comprehensively, accurately, flexibly, efficiently and conveniently.
database technology; literature retrieval; literature screening
G252.7;R2
A
2095-5707(2022)03-0001-06
10.3969/j.issn.2095-5707.2022.03.001
姚克宇,陳超,朱蘭,等.數(shù)據(jù)庫(kù)技術(shù)輔助的文獻(xiàn)檢索與篩選方案研究[J].中國(guó)中醫(yī)藥圖書情報(bào)雜志,2022,46(3):1-6.
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2018YFC1707409);中國(guó)中醫(yī)科學(xué)院科技創(chuàng)新工程(CI2021A05409);中國(guó)中醫(yī)科學(xué)院基本科研業(yè)務(wù)費(fèi)優(yōu)秀青年科技人才(傳承類)培養(yǎng)專項(xiàng)(ZZ13-YQ-126);中國(guó)中醫(yī)科學(xué)院基本科研業(yè)務(wù)費(fèi)自主選題(ZZ150314、ZZ150316、ZZ150329JY)
姚克宇,E-mail: yao_keyu@163.com
通訊作者:劉麗紅,E-mail: 28499503@qq.com
(2022-01-29)
(2022-03-11;編輯:魏民)