翟靜波 鄭文科 雷 翔 曹紅波 王 輝 商洪才
零膨脹模型在藥品安全性計數資料分析中的應用※
翟靜波 鄭文科 雷 翔 曹紅波 王 輝 商洪才*
(天津中醫(yī)藥大學,天津300193)
零膨脹模型是一類用于處理存在零膨脹現象計數資料的統(tǒng)計模型,廣泛應用于保險費率厘定、車禍發(fā)生頻次等研究。藥品安全性分析中的計數資料可能存在零膨脹現象。poisson回歸模型或負二項回歸模型用于擬合存在零膨脹現象的計數數據可能存在擬合不良的問題。零膨脹模型可能是一類更優(yōu)的替代模型,且已有相關實例研究報道。將零膨脹模型用于不良事件/反應發(fā)生頻次的影響因素分析,可以有效處理數據中可能存在的零膨脹現象,對于提高參數估計精度、探索藥品(特別是中藥注射劑)安全性事件的發(fā)生規(guī)律、識別重要危險因素以及預測等均具有重要意義。
零膨脹模型;藥品安全性;計數資料
自從Singh S在1963年首次提出零膨脹模型以來,零膨脹模型得到不斷的改進和完善,同時在保險理賠、林火預測、交通安全預測等多個領域都得到廣泛應用,但是在藥品安全性評價領域的應用較少。本文將通過介紹零膨脹模型和藥品安全性計數數據的特點,探討零膨脹模型用于藥品安全性計數資料分析的可行性。
在科學研究的計數數據中常存在大量個體取值為零的現象,相同零值可能表示不同的含義,零值的比例超出了poisson回歸或負二項回歸等模型的擬合能力,稱為零膨脹現象[1]。零膨脹現象在公共健康領域較為常見[2]。
為了解決計數數據中零膨脹現象導致的模型擬合問題,Lambert(1992)[3]詳細論述了零膨脹模型。該模型的基本原理是將數據分解為全部由數字零構成的數據集和服從poisson分布或負二項分布數據集[4]。該模型將事件的發(fā)生看成兩種可能的情況:第一種是假定事件發(fā)生取值只能為0;第二種是假定對應事件發(fā)生數取值為0或正的事件數,且服從poisson或負二項分布[3-4]。研究者通過一些特征變量識別和排除全零數據集,然后對服從poisson分布或負二項分布的數據集進行建模分析[5]。若數據的均值與方差基本相等,認為屬于等離散,近似服從poisson分布,可以擬合零膨脹泊松回歸模型(zeroinflated poisson regression models,ZIP);若數據的方差明顯大于均值,認為屬于過離散,近似服從負二項分布,可以擬合零膨脹負二項回歸模型(zero-inflated negative binomial models,ZINB)[5]。
零膨脹模型是對poisson回歸或負二項回歸模型的改進,包括一系列模型,在處理存在零膨脹、個體聚集性等現象的大樣本、低發(fā)生率數據方面優(yōu)于poisson回歸或負二項回歸模型。
零膨脹模型廣泛應用于小概率事件發(fā)生頻次影響因素或預測研究,例如:Jiang X等[6]采用零膨脹模型評估車禍碰撞傷害的危險因素;Kilic D等[7]將零膨脹負二項回歸模型用于煙草消耗與性別之間的關系研究;項氏[2]用零膨脹poisson回歸模型擬合汽車保險索賠頻率數據并對變量選擇和參數估計進行比較;王氏[8]使用零膨脹模型進行避孕知情選擇對中國人工流產的影響研究,結果表明零膨脹模型的擬合曲線比poisson回歸和負二項回歸模型更逼近真實觀測值的分布。
研究者還將零膨脹模型用于療效評價,例如:Lu CY等[9]采用零膨脹模型評估治療時期對療效的影響;Haroon N等[10]使用零膨脹負二項回歸模型評價腫瘤壞死因子抑制劑對強直性脊柱炎患者進展性脊柱損害的療效;Ritter AV等[11]將零膨脹負二項回歸模型用于木糖醇防治齲齒的療效評價。
藥品臨床安全性評價中的計數資料主要指不良事件或不良反應的計數資料。分析內容常包括發(fā)生率、發(fā)生頻次、影響因素分析等。其中,不良事件或不良反應的發(fā)生頻次數據分析非常重要。有研究表明,在公共衛(wèi)生規(guī)劃和質量管理規(guī)劃評估領域中,不良反應發(fā)生頻次研究更為重要[12]。
當臨床研究進入Ⅲ、Ⅳ期之后,不良事件或不良反應發(fā)生頻次數據具有樣本量大、發(fā)生率低、多次重復發(fā)生且相互獨立、多種混雜因素干擾等特點。同時,不良事件或不良反應計數數據屬于公共健康領域的計數資料,該類計數資料的特點決定其可能存在零膨脹現象。
目前,研究者常假設不良事件或不良反應發(fā)生頻次數據服從poisson分布或負二項分布,通過擬合poisson回歸或負二項回歸模型進行影響因素分析。但是,許多研究表明,poisson回歸或負二項回歸模型并非不良事件或不良反應發(fā)生頻次影響因素分析的最優(yōu)模型。李嬋娟等[13]研究表明,poisson回歸模型過低估計不良事件頻次為“零”的發(fā)生,過高估計不良事件頻次為“1”、“2”的發(fā)生。在處理個體聚集性現象時,負二項回歸模型優(yōu)于泊松回歸模型,但是也存在事件分布偏離負二項分布的現象。Khokan C Sikdar等[14]研究表明,老年住院患者不良反應發(fā)生頻次影響因素的建模中,ZIP和ZINP模型的擬合效果要優(yōu)于poisson和負二項模型。
模型應用條件與數據特點的不匹配是模型擬合不良的一個重要原因。Poisson回歸模型和負二項回歸模型在擬合過程中未考慮數據中可能存在的零膨脹現象,可能是藥品不良事件或不良反應發(fā)生頻次影響因素的poisson回歸和負二項回歸模型擬合不良的重要原因。識別和控制不良事件或不良反應發(fā)生頻次數據中可能存在的零膨脹現象對于改善模型擬合效果具有重要意義。零膨脹模型可能是更優(yōu)的一類替代模型。
零膨脹模型的特點決定了其非常適合用于不良事件或不良反應發(fā)生頻次數據的分析。為了解零膨脹模型在藥品安全性評價領域中的應用現狀,本文以CNKI、CBM、Pubmed、SCI Expanded數據庫為檢索庫,adverse event(s)、adverse drug reaction(s)、zero-inflated為主題詞,時間設定為截止到2013年10月15日,經計算機檢索和人工核查,共檢索到3篇相關文獻[14-16],均被SCI收錄。最早1篇由C.E.Rose等[15]發(fā)表于2006年,內容為零膨脹模型和Hurdle模型用于疫苗不良事件計數資料建模的研究。SCI Expanded數據庫檢索結果表明,截止到2013年10月15日,該文已被引用44次。A.L.Baughman等[16]于2007年發(fā)表了1篇文章,對Rose在2006年發(fā)表的這篇文章進行了更深入的研究。Khokan C Sikdar等[14]在2012年發(fā)表的老年住院患者不良反應發(fā)生頻次影響因素研究采用了零膨脹模型。
盡管目前相關文獻數量有限,但是這些研究表明,零膨脹模型用于藥品不良事件或不良反應發(fā)生頻次影響因素分析具有一定的可行性且優(yōu)于poisson回歸模型和負二項回歸模型。
綜上所述,將零膨脹模型用于不良事件或不良反應發(fā)生頻次的影響因素建模,是處理數據中可能存在的零膨脹現象、個體聚集性等問題的重要統(tǒng)計分析方法,對于提高參數估計精度、探索藥品不良事件、不良反應及其他安全性事件的發(fā)生規(guī)律、識別重要危險因素以及預測等均具有重要意義。
中藥(特別是中藥注射劑)的臨床安全性是社會關注焦點。2012年5月,國家食品藥品監(jiān)督管理局(SFDA)發(fā)布的2011年國家藥品不良反應監(jiān)測年度報告[17]中指出,中藥注射劑依然是中藥制劑的主要風險。中藥上市后臨床安全性急需大樣本、多中心、高質量的臨床安全性再評價研究進行論證??紤]到poisson回歸模型和負二項回歸模型處理存在零膨脹現象計數數據的不足,將零膨脹模型用于中藥上市后臨床安全性計數資料的分析,可在豐富中藥上市后安全性再評價分析方法的同時,為提高中藥臨床安全性研究質量和證據強度提供依據。
[1]王婷,曾平.ZIP模型在臨床研究中的應用及SAS實現[J].中國衛(wèi)生統(tǒng)計,2011,28(6):670-673.
[2]項麗雅.ZIP回歸模型的變量選擇及其在保費厘定中的應用[D].復旦大學,2012:5-8.
[3]田嬌妮,劉桂芬,張軍鋒.多水平零膨脹計數模型在骨關節(jié)疼痛影響因素中的應用研究[J].中國衛(wèi)生統(tǒng)計,2012,29(1):44-46.
[4]徐濤.零頻數過多資料的統(tǒng)計學模型應用研究-亞健康狀態(tài)研究中的應用[D].北京:北京協(xié)和醫(yī)學院,2011:17-18.
[5]王存同.零膨脹模型在社會科學實證研究中的應用-以中國人工流產影響因素的分析為例[J].社會學研究,2010,(5):130-148.
[6]Jiang X,Huang B,Zaretzki RL,et al.Investigating the influence of curbs on single-vehicle crash injury severity utilizing zero-inflated ordered probit models[J].Accid Anal Prev,2013,57:55-66.
[7]Kilic D,Ozturk S.Gender differences in cigarette consumption in Turkey:Evidence from the Global Adult Tobacco Survey[J].Health Policy,2013.
[8]王存同.避孕知情選擇對中國人工流產的影響分析[J].人口與發(fā)展,2010,16(3):17-26.
[9]Lu CY,Srasuebkul P,Drew AK,et al.Trastuzumab therapy in Australia:Which patients with HER2+metastatic breast cancer are assessed for cardiac function[J].Breast,2013,22(4):482-487.
[10]Haroon N,Inman RD,Learch TJ,et al.The Impact of TNF-inhibitors on radiographic progression in Ankylosing Spondylitis[J].Arthritis Rheum,2013.
[11]Ritter AV,Bader JD,Leo MC,et al.Tooth-surface-specific effects of xylitol:randomized trial results[J].J Dent Res,2013,92(6):512-517.
[12]Donaldson MG,Sobolev B,Cook WL,et al.Analysis of recurrent events:a systematic review of randomised controlled trials of interventions to prevent falls[J].Age Ageing,2009;38:151-5.
[13]李嬋娟.新藥臨床研究中安全性評價的統(tǒng)計方法[D].西安:第四軍醫(yī)大學,2005:9-13.
[14]Khokan C Sikdar,Jdffrey Dowden,Reza Alaghehbandan,et al.Adverse Drug Reactions in Elderly Hospitalized Patients:A 12-Year Population-Based Retrospective Cohort Study[J].The Annals of Pharmacotherapy,2012,46(7):960-971.
[15]C.E.Rose,S.W.Martin,K.A.Wannemudhler,et al.On the Use of Zero-Inflated and Hurdle Models for Modeling Vaccine Adverse Event Count Data[J].ouranl of Biopharmaceutical Statistics,2006,16(4):463-481.
[16]A.L.Baughman.Mixture Model Framework Facilitates Understanding of Zero-Inflated and Hurdle Models for Count Data[J].Jouranl of Biopharmaceutical Statistics,2007,17(5):943-946.
[17]2011年國家藥品不良反應監(jiān)測年度報告.http://www.sda.gov.cn/WS01/CL0078/72193.html.
Application of Zero-inflated Models in Drug Safety Analysis of Count Data
Zhai Jingbo Zheng Wenke Lei Xiang Cao Hongbo Wang Hui Shang Hongcai?
(Tianjin University of TCM,Tianjin,300193,China)
Abastact:Zero-inflated model is a statistical model for handling zero-inflated count data.It's widely used in modeling insurance data,investigating the influence of curbs on single-vehicle crash injury severity and so on.Zero-inflated phenomenon may existed in drug safety analysis of count data.There is the problem of poor fit in modeling zero-inflated count data by poisson regression or negative binomial regression model.Zero-inflated model may be a better alternative and the related examples have been reported.The zero-inflated models could be used to model adverse events or adverse reactions count data.It consider the zero-inflated phenomenon and Improve accuracy of parameter estimation.There is great significance in exploring drugs(especially traditional Chinese medicine injections)security events occurrence,identifing important risk factors and so on.
Zero-inflated model;Drug safety;Count data
10.3969/j.issn.1672-2779.2013.21.116
1672-2779(2013)-21-0164-02
吳義紅
2013-07-08)
國家自然科學基金[No:81303093];“十二五”重大新藥創(chuàng)制項目[No:2011ZX09304]
*通訊作者