王麗偉,于躍,王偉 (.吉林大學公共衛(wèi)生學院醫(yī)藥信息與衛(wèi)生管理學系,吉林 長春3002;2.美國梅奧醫(yī)學中心,明尼蘇達州,5590)
近年來發(fā)生的一系列藥品安全性事件嚴重威脅著人類的健康。據世界衛(wèi)生組織(World Health Organization,簡稱WHO)統(tǒng)計,因藥物不良事件住院的患者占住院人數的5%~10%,而住院患者中發(fā)生藥物不良事件的人數達10%~20%,致死率為0.24%~2.9%[1],每一次藥物不良事件都會延長2.2 d的住院時間[2],藥物不良事件的發(fā)生日益成為一個嚴重的公共衛(wèi)生問題。我國食品藥品監(jiān)督管理局對藥物不良反應與藥品不良事件進行了辨析:藥品不良事件和藥品不良反應含義不同。一般來說,藥品不良反應是指因果關系已確定的反應,而藥品不良事件是指因果關系尚未確定的反應。它在國外的藥品說明書中經常出現,此反應不能肯定是由該藥引起的,尚需要進一步評估[3]。根據《藥品不良反應報告和監(jiān)測管理辦法》(衛(wèi)生部令第81號),新的藥品不良反應是指藥品說明書中未載明的不良反應。說明書中已有描述,但不良反應發(fā)生的性質、程度、后果或者頻率與說明書描述不一致或者更嚴重的,按照新的藥品不良反應處理。
20世紀60年代“反應?!保╰halidomide)事件之后,許多國家引入了藥物警戒(phamacovigilance)系統(tǒng)對上市藥品進行監(jiān)測。例如美國食品藥品管理局(food and drug administration,FDA)的藥物不良事件報告系統(tǒng)(adverse event reporting system,AERS)數據庫主要用于發(fā)現那些在臨床試驗階段由于出現頻次低而沒有被識別出的罕見嚴重不良事件。如果在AERS中發(fā)現潛在的安全問題,FDA將進行藥物流行病學研究以進一步評價該不良事件,確定藥物與不良事件之間的因果關系。基于對藥物不良事件的安全評價,FDA可能采取一系列的法規(guī)調整以提高產品安全及保障公眾健康,如更新藥品說明信息,限制使用藥品,向公眾介紹新的安全相關信息,或在少數情況下,從市場上撤銷該藥品[4]。一項研究確定了自發(fā)報告數據庫數據挖掘在藥品安全性信號早期發(fā)現中的作用,研究結果發(fā)現,利用藥品批準上市2~3年后的AERS數據進行挖掘,之后2~3年FDA的多半活動都可以通過數據挖掘來預測,而且數據挖掘所檢測到的信號多半都可以與FDA所采取的措施相對應[5]。對自發(fā)病例報告的分析是發(fā)現上市藥物未知的安全性問題的最重要方法之一[6]。
由制藥商、監(jiān)管機構和公共衛(wèi)生監(jiān)測中心維護的很多數據庫都包含有藥物上市后的不良反應報告信息,這些數據庫都可用于藥物安全性的數據挖掘研究。同樣的研究也可應用于疫苗安全性數據庫。這些數據庫通過自愿或被動監(jiān)測的自發(fā)報告系統(tǒng)獲得不良反應信息。每個數據庫都有自己的數據錄入規(guī)范、結構和報告規(guī)范。所有的數據庫都有一些局限性,如不良事件報告不全,與藥物暴露數據沒有明確聯(lián)系,缺乏對照組,報告存在潛在的偏倚,數據的不完整或丟失,和因果關系不明。盡管存在這些復雜性,自發(fā)的不良反應數據庫已經成功地在上市藥品中發(fā)現眾多安全問題。2002年,我國國家中心與各省級藥物不良事件監(jiān)測中心聯(lián)網實現了省中心報告的電子化,但是數據庫并不能公開獲取且報告量較小,暫無法支持分析研究。
目前,最常應用于數據挖掘的國家數據庫之一是美國FDA所公開發(fā)行的AERS。盡管它仍受到自愿上報計劃和相關偏倚的限制,但它的優(yōu)點在于它的數據向公眾提供,并且包括大量藥品不良反應的數據;這個數據庫非常龐大(收集了從1968年以來的約4 300萬條數據),并且除了國內的自發(fā)報告,該數據庫還包括非美國來源的嚴重的不良反應報告和嚴重的藥物上市后臨床試驗報告。FDA還在定量信號監(jiān)測方面進行了開創(chuàng)性的工作,并且已經將這些方法應用于幾種上市藥品的決策支持。AERS系統(tǒng)的主要限制是時滯(通常有3~6個月的時滯)和在公開發(fā)行版本中病例敘述的缺失。公眾可以索取帶有敘述的病例報告,但是獲得報告卻需要幾個月的時間[7]。
2.1 單一藥物與不良事件的數據挖掘
2.1.1 挖掘方法 數據挖掘工具通常能夠幫助我們在龐大的帶有嘈雜數據的數據庫中找出有價值的優(yōu)先信息,并且這些工具已經被醫(yī)學研究所應用于藥物警戒領域?,F有的回顧性文獻闡述了他們在藥品安全性評估上的應用[8-10],但是目前還沒有將這些工具的有效性與面對面式的基于案例的傳統(tǒng)方法相比較的前瞻性研究。進行數據挖掘研究的挑戰(zhàn)是缺乏評估其挖掘有效性的金標準與如何判定可疑安全性問題的閾值。
1974年,Finney描述了“反應比值信號”(reaction proportion signaling)的概念。利用數據庫中的所有記錄,可以構建出四格表,然后即可以確定出比值失衡的藥品——不良事件組合,用來檢測信號[11],見表1。目前,在藥物不良事件監(jiān)測領域中常用的數據挖掘方法都屬于或者基于比值失衡測量法(disproportionality measures,DPA),主要是用于對藥品——不良事件之間關聯(lián)的“出乎意料”程度進行定性[12],通常要使用預先設定的比值失衡閾值來篩選潛在的不良事件,然后進行更深入的調查。
目前常用的數據挖掘方法包括美國FDA使用的多項伽瑪泊松分布縮減法(multi-item gamma poisson shrinker,MGPS);WHO Uppsala監(jiān)測中心使用的貝葉斯判別可信區(qū)間傳播神經網絡法(Bayesian confidence propagation neural network,BCPNN);英國藥品管理局使用的比例報告比值比(proportional ADR reporting ratio,PRR),以及其他國家自發(fā)報告中心和藥品安全研究機構使用的報告比值比(reporting odds ratio,ROR)及發(fā)病率比值(incidence rate ratios,IRRs)等。諸多數據挖掘方法應用于藥品不良反應信號的檢出和分析都是可行的,沒有哪種單一的方法能夠完全優(yōu)于或完全取代其他方法,可根據不同的研究目的選擇一種或多種適宜的算法[13]。
表1 比值失衡測量法所基于的四格表Tab 1 The 2×2 contingency table for DPA method
PRR,ROR和IRRs屬于頻次法(frequency methods),主要計算數據庫中某種藥物報告頻次相對于利用數據庫中全部藥物信息估算的預期報告頻次是否更高。例如PRR=[a/(a+c)]/[b/(b+d)]測量的就是包括某種藥物的報告中某些事件的發(fā)生率與不包括某種藥物的報告中該事件的發(fā)生率的比值。MGPS與BCPNN屬于貝葉斯方法,這種方法在頻次法的基礎上使用貝葉斯統(tǒng)計模型對結果進一步處理,可以有效減少由于年齡、性別等背景因素的差別,并作出更準確的估算[14]。
2.1.2 數據挖掘內容 對單一藥物不良事件信號的海量數據挖掘和藥品警戒已經成為醫(yī)學信息學領域當前的研究熱點。例如:Poluzzi等[15](2009)利用數據挖掘方法發(fā)現了抗菌劑利奈唑胺(linezolid)、卡泊芬凈(caspofungin)、泊沙康唑(posaconazole)、印地那韋(indinavir)與那非那韋(nelfinavir)導致尖端扭轉型室速的不良事件信號;Ali等[16]發(fā)現阿利吉侖(aliskiren)具有潛在的血管神經性水腫和腎功能不全不良事件[16];Chen等[17]發(fā)現了泰利霉素(telithromycin)相關的肝毒性;Kadoyama等[18-20]發(fā)現了紫杉醇及紫杉萜類抗癌藥品的過敏反應以及鉑類抗癌藥品的不良事件。
Davis等[21]撰文列舉了英國過去十年間將自發(fā)性報告作為充分理由進行藥物管理活動的例子。Wysowski等[22]列出了1980-2005年期間從美國市場上撤銷的22種藥品,其中20種藥品的撤出依賴于對自發(fā)不良事件報告的分析。曲格列酮(troglitazone)、特非那?。╰erfenadine)和替馬氟沙星 (temafloxacin)也是自發(fā)報告提供關鍵證據支持藥品撤銷的顯著例子[23-24]。
2.2 多種藥物相互作用與不良事件的數據挖掘 當一種藥物影響到另一種藥物的作用時即發(fā)生藥物相互作用。這種作用可能會導致藥動學或者藥效學上的改變,從而提高或者降低藥物的功效,可能導致不良事件報告數量的增加或減少。對藥物相互作用不良事件數據挖掘的思路基本上是從單一藥物不良事件挖掘的原則拓展得到的,即如果兩者藥物聯(lián)合使用時可疑的不良事件報告比單獨使用藥物時的可疑不良事件報告更頻繁,那么這兩種藥物的組合可能存在藥物之間的相互作用。但是對藥物相互作用不良事件數據挖掘的研究難度較大,現有的方法研究都屬于探索性研究。有研究通過邏輯回歸分析利用不良事件的報告比值比(reporting odds ratios,ROR)來檢測可能出現的藥物相互作用[25]。也有學者提出使用加性模型(additive model)與 (multiplicative model)檢測藥物相互作用產生的不良事件信號,結果發(fā)現加性模型在檢測信號方面更加敏感,而乘性模型在對由加性模型所檢測出的信號強度的定性方面會有所助益[26]。另有研究在多種藥物相互作用產生不良反應的數據挖掘中探索使用了相關規(guī)則挖掘方法,認為該方法在初步檢測藥物相互作用的不良事件方面是有效[27]。Tatonetti等[28]利用監(jiān)督機器學習的方法檢測出隱藏的藥物相互作用并利用電子病歷對研究結果進行了驗證。這種方法也可以用于發(fā)現新的藥物相互作用,提供了一種利用不良事件數據來研究體外藥物相互作用的重要方法。
目前對多種藥物相互作用情況下大規(guī)模數據挖掘的方法并不成熟,藥物相互作用的挖掘方法還處于改進和研發(fā)階段,也是未來的研究趨勢之一。
2.3 我國藥品不良事件數據挖掘研究現狀 國內也有少數學者對該領域進行了探索研究。葉小飛[1](2011)研究了基于自發(fā)呈報系統(tǒng)與循證醫(yī)學的藥物不良事件信號挖掘,對上海市藥物不良事件監(jiān)測中心2009年30 105條數據進行了分析;尚鵬輝等人[13](2009)分析介紹了各種數據挖掘技術;錢軼峰等[29](2010)介紹比較了聯(lián)合用藥不良事件信號的數據挖掘方法。國內相關研究主要利用我國國內的藥物不良事件數據庫進行信號挖掘,或者探討藥物不良事件數據挖掘的方法,或者對美國AERS數據挖掘及應用進行簡介,對藥品不良事件數據挖掘的研究尚屬初級階段,應用于挖掘的不良事件報告數量較小且研究較少。
本文選取Kadoyama等[18]的研究作為藥物不良事件數據挖掘研究的實例分析,該課題組對AERS數據庫中抗癌藥物過敏反應案例進行了數據挖掘,以探測紫杉醇等抗癌藥物的不良事件。其首先利用文本挖掘方法,將數據庫中不規(guī)范的藥物名稱進行了修正;然后利用美國國立癌癥研究所規(guī)定的不良事件術語規(guī)范詞表(the national cancer institute common terminology criteria for adverse events,NCI-CTCAE version 4.0)對數據庫中抗癌藥物相關的過敏不良事件名稱進行了規(guī)范;接下來對紫杉醇、多烯紫杉醇等抗癌藥物的過敏不良事件根據輕微、嚴重和致死3個層次進行了統(tǒng)計;然后分別利用PRR、ROR、信息成分(information component,IC)和經驗貝葉斯幾何平均數(empirical Bayes geometric mean,EBGM)4種算法對不良事件數據進行挖掘,對11種產生過敏不良反應的抗癌藥物進行了探測(致死過敏不良反應探測情況如表2所示);結論認為通過數據挖掘,探測出紫杉醇可能會產生輕微、嚴重以至于致死的不良事件,多烯紫杉醇探測出可能會產生致死的不良事件,而甲基芐肼、天冬氨酰酶、替尼泊苷、依托泊苷等藥物并沒有足夠的不良反應事件總數用以進行數據挖掘探測;最終認為使用數據挖掘方法對AERS數據庫進行數據挖掘來確認藥物的不良事件是可靠而有效的。
4.1 研究新的數據挖掘方法 患者用藥的狀況通常比較復雜,不良事件的發(fā)生很多情況下也有多種藥物相互作用的原因,然而目前多數研究所使用的數據挖掘算法主要用于確定某種藥品與某種不良事件之間的關系,針對預先選擇的某幾種藥品挖掘其不良事件信號,少數研究針對藥物-藥物相互作用,但是研究對象僅限于謹慎選擇的少數藥物[25-26],主要原因是缺乏對多種藥物相互作用情況下大規(guī)模數據挖掘的方法。對藥物相互作用的新算法的探索性研究還不能真正應用到相應的國家級藥物不良事件報告數據庫的常規(guī)性檢測,如何從海量數據庫中藥物相互作用的數據中進行知識發(fā)現,獲得成熟的挖掘方法,是一個亟待解決的問題。
4.2 建立標準化的藥品不良事件知識庫 AERS數據庫是目前免費獲取的主要數據庫,其中的報告來自患者、衛(wèi)生醫(yī)務人員、律師等人,自由的錄入方式導致藥名存在不同寫法甚至拼寫錯誤。如果直接利用數據庫中所錄入的非標準化名稱進行挖掘,會造成同種藥物不良反應信號被數據噪聲所影響,從而無法準確統(tǒng)計與分析,因此在數據挖掘之前,需要對藥品數據集中的藥名進行標準化,將不同形式的藥名統(tǒng)一到同一概念下。已有的研究對藥名進行的標準化都是在特定的挖掘目的下進行的,標準化后的數據主要用于具體研究的具體目的,沒有考慮到與其他衛(wèi)生領域的數據進行互操作,也無法進行二次利用。RxNorm是美國國立醫(yī)學圖書館開發(fā)并提供免費使用的臨床藥品標準術語[30]。在2004年創(chuàng)建之后,RxNorm已越來越多地被生物醫(yī)學信息學領域作為一種新興的臨床藥品信息交換標準。利用RxNorm對AERS數據庫中的藥名進行標準化,并為給學界提供一個免費、可以重復利用的藥品不良事件知識庫,將促進不良事件信號的挖掘研究。
4.3 利用其他電子健康數據驗證不良事件信號 臨床數據是驗證數據挖掘所建立假說的一個關鍵因素[31]。從數據挖掘分析中所得到的藥物不良事件信號被視為假說,并需要進行進一步的調查(通過個別病歷的回顧和其他的相關信息如文獻或前期臨床試驗)來確定這些報告是否提供了可信的安全性資料。目前多數的數據挖掘研究局限于產生假說,僅有少數的綜合性研究通過電子病歷中的數據對所檢測出的藥物不良事件進行驗證。隨著衛(wèi)生數據標準的不斷發(fā)展,對數據進行標準化并與電子病歷數據互聯(lián),可實現對假說的進一步驗證,是該領域研究的未來發(fā)展方向之一。
表2 抗癌藥物致死過敏不良事件的信號探測[18]Tab 2 Signal detection for anticancer agent-associated lethal hypersensitivity reactions[18]
從國際視角來看,藥物不良事件的數據挖掘是醫(yī)學信息學以及藥物警戒領域的一個比較活躍的研究領域,相對成熟的挖掘方法已經在國家級的藥物不良事件報告數據庫的挖掘中發(fā)揮重要作用,同時新的挖掘方法例如相關規(guī)則挖掘方法與機器學習等不斷被改進、引入到該領域,以期獲得更加可靠和準確的結果。從藥物不良事件數據庫的海量數據中挖掘藥物不良事件信號是藥品管理及決策的重要基礎,并將為醫(yī)學科研節(jié)省大量資源,為疾病的防治發(fā)現重要依據,對于提高醫(yī)療質量具有重要意義。
[1]葉小飛.基于自發(fā)呈報系統(tǒng)與循證醫(yī)學的藥品不良反應信號挖掘[D].第二軍醫(yī)大學,2011.
[2]Handler SM,Altman RL,Perera S,etal.A systematic review of the performance characteristics of clinical event monitor signals used to detect adverse drug events in the hospital setting[J].J Am Med Inform Assn,2007,14(4):451-458.
[3]國家食品藥品監(jiān)督管理總局.[DB/OL],[2013.2.15].http://www.sda.gov.cn/WS01/CL0747/63731.html.
[4]FDA adverse event reporting system (FAERS) (formerly AERS).[EB/OL].[2013-7-15].http://www.fda.gov/cder/aers/default.htm.
[5]Hochberg AM,Reisinger SJ,Pearson P,etal.Using data mining to predict safety actions from FDA adverse event reporting system data[J].Drug Inform J,2007,41(5):633-642.
[6]Rawlins M.Spontaneous reporting of adverse drug reactions.I:the data[J].Br J Clin Pharmaco,1988,26(1):1.
[7]Almenoff JS PE,Gibbs TG,DuMouchel W,etal.Novel statistical tools for monitoring the safety of marketed drugs[J].Clin Pharmacol Ther,2007,82(2):157-166.
[8]Szarfman A,Machado SG,ONeill RT.Use of screening algorithms and computer systems to efficiently signal higher-Than-Expected combinations of drugs and events in the US FDAs spontaneous reports database[J].Drug Safety,2002,25(6):381-392.
[9]Lindquist M,Stahl M,Bate A,etal.A retrospective evaluation of a data mining approach to aid finding new adverse drug reaction signals in the WHO international database[J].Drug Safety,2000,23(6):533-542.
[10]Almenoff J,Tonning JM,Gould AL,etal.Perspectives on the use of data mining in pharmacovigilance[J].Drug Safety,2005,28(11):981-1007.
[11]Finney DJ.Systemic signalling of adverse reactions to drugs[J].Methods Inf Med,1974,13(1):110.
[12]Bate A,Evans SJ.Quantitative signal detection using spontaneous ADR reporting[J].Pharmacoepidemiol Drug Saf,2009,18(6):427-436.
[13]尚鵬輝,詹思延.數據挖掘在藥物不良事件信號檢出和分析中的應用 [J].中國藥品應用與監(jiān)測,2009,6(3):187-190.
[14]Szarfman A,Tonning JM,Levine JG,etal.Atypical antipsychotics and pituitary tumors:apharmacovigilance study[J].J Human Pharmacol Drug Therapy,2006,26(6):748-758.
[15]Poluzzi E,Raschi E,Motola D,etal.Antimicrobials and the risk of torsades de pointes:the contribution from data mining of the US FDA Adverse Event Reporting System [J].Drug Safety,2010,33(4):303-314.
[16]Ali AK.Pharmacovigilance analysis of adverse event reports for aliskiren hemifumarate,a first-in-class direct renin inhibitor[J].Thera Clin Risk Manag,2011,7:337.
[17]Chen Y,Guo JJ,Healy DP,etal.Risk of hepatotoxicity associated with the use of telithromycin:a signal detection using data mining algorithms[J].Ann Pharmacotherapy,2008,42(12):1791-1796.
[18]Kadoyama K,Kuwahara A,Yamamori M.Hypersensitivity reactions to anticancer agents:Data mining of the public version of the FDA adverse event reporting system,AERS[J].J Exper Clin Cancer Res:CR,2011,30(1):93.
[19]Sakaeda T,Kadoyama K,Okuno Y.Adverse event profiles of platinum agents:Data mining of the public version of the FDA adverse event reporting system,AERS,and reproducibility of clinical observations[J].Int J Med Sci,2011,8(6):487.
[20]Sakaeda T,Kadoyama K,Yabuuchi H,etal.Platinum agentinduced hypersensitivity reactions:Data mining of the public version of the FDA adverse event reporting system,AERS[J].Int J Med Sci,2011,8(4):332.
[21]Davis S,King B,Raine JM.Spontaneous reporting UK [J].Pharmacovigilance,2002:199-215.
[22]Wysowski DK,Swartz L.Adverse drug event surveillance and drug withdrawals in the United States,1969-2002:the importance of reporting suspected reactions[J].Arch Inter Med,2005,165(12):1363.
[23]Moore TJ,Psaty BM,Furberg CD.Time to act on drug safety[J].JAMA,1998,279(19):1571-1573.
[24]Cruzan S.FDA Talk Paper:FDA proposes to Withdraw Seldane Approval[R].1997.
[25]Van Puijenbroek EP,Egberts ACG,Meyboom RHB,etal.Signalling possible drug drug interactions in a spontaneous reporting system:delay of withdrawal bleeding during concomitant use of oral contraceptives and itraconazole[J].Br J Clin Pharmacol,1999,47(6):689-693.
[26]Thakrar BT,Grundschober SB,Doessegger L.Detecting signals of drug drug interactions in a spontaneous reports database[J].Br J Clin Pharmacol,2007,64(4):489-495.
[27]Harpaz R,Chase H,Friedman C.Mining multi-item drug adverse effect associations in spontaneous reporting systems[J].BMC bioinformatics,2010,11(Suppl 9):S7.
[28]Tatonetti NP,Fernald GH,Altman RB.A novel signal detection algorithm for identifying hidden drug-drug interactions in adverse event reports[J].J Am Med Inform Assoc,2012,19(1):79-85.
[29]錢軼峰,羅寶章,葉小飛,等.檢測聯(lián)合用藥不良事件信號的數據挖掘方法 [J].中國衛(wèi)生統(tǒng)計2010,27(1):31-34.
[30]An Overview of RxNorm.[DB/OL],[2013.1.15].http://www.nlm.nih.gov/research/umls/rxnorm/overview.html.
[31]Ritchie MD,Denny JC,Crawford DC,etal.Robust replication of genotype-phenotype associations across multiple diseases in an electronic medical record[J].Am J Human Gen,2010,86(4):560-572.