張燕華 孫 超 馬 會(huì) 湯連升
(山東省藥學(xué)科學(xué)院新藥評(píng)價(jià)中心,濟(jì)南 250101)
生殖毒理學(xué)主要研究對(duì)雌雄生命生殖系統(tǒng)產(chǎn)生損害作用的原因、機(jī)制和后果,它包括對(duì)動(dòng)物的精卵形成、交配、排卵、射精、合子形成、著床、妊娠、分娩和哺乳過程的毒理學(xué)作用,當(dāng)具有生殖毒性的外源性物質(zhì)在此期間與機(jī)體接觸,會(huì)影響動(dòng)物的生殖發(fā)育,造成損害作用。藥物非臨床生殖毒性實(shí)驗(yàn)則是研究藥物對(duì)動(dòng)物生殖系統(tǒng)及其功能活動(dòng)毒副現(xiàn)象和作用機(jī)制的具體方法和技術(shù),其評(píng)價(jià)方法主要包括生育力與早期胚胎發(fā)育毒性實(shí)驗(yàn)(生殖Ⅰ段毒性實(shí)驗(yàn))、胚胎-胎仔發(fā)育毒性實(shí)驗(yàn)(生殖Ⅱ段毒性實(shí)驗(yàn))和圍產(chǎn)期毒性實(shí)驗(yàn)(生殖Ⅲ段毒性實(shí)驗(yàn))[1-2]。
生殖毒性實(shí)驗(yàn)動(dòng)物數(shù)量多、過程繁瑣復(fù)雜、產(chǎn)生的數(shù)據(jù)量大、指標(biāo)眾多及生殖毒性實(shí)驗(yàn)產(chǎn)生的主要數(shù)據(jù)從傳統(tǒng)意義上可以劃分為計(jì)量資料和計(jì)數(shù)資料[3-4](表1),不同類型的數(shù)據(jù)具有不同的統(tǒng)計(jì)學(xué)方法。在做統(tǒng)計(jì)學(xué)分析時(shí),需要根據(jù)數(shù)據(jù)的特點(diǎn),選取合適的統(tǒng)計(jì)學(xué)方法,作出相應(yīng)的統(tǒng)計(jì)判斷。
表1 實(shí)驗(yàn)類別及數(shù)據(jù)類型分類
不同的數(shù)據(jù)分析應(yīng)選用不同的統(tǒng)計(jì)方法,應(yīng)根據(jù)數(shù)據(jù)類型以及數(shù)據(jù)是否服從正態(tài)分布、總體方差是否相等,進(jìn)而選用適當(dāng)?shù)臋z驗(yàn)方法[5],表2列出了毒理實(shí)驗(yàn)中常用的幾種統(tǒng)計(jì)方法[6-8]。通過以上對(duì)生殖毒性實(shí)驗(yàn)中產(chǎn)生的數(shù)據(jù)進(jìn)行歸納分析,得出生殖毒性產(chǎn)生的實(shí)驗(yàn)數(shù)據(jù)主要分為母體數(shù)據(jù)和胎仔數(shù)據(jù),根據(jù)不同數(shù)據(jù)的特點(diǎn)選擇合適的統(tǒng)計(jì)方法。
生殖毒性實(shí)驗(yàn)一般包括對(duì)照組和受試物的高、中、低劑量組等,所以產(chǎn)生的母體計(jì)量資料屬于完全隨機(jī)設(shè)計(jì)的多樣本數(shù)據(jù)間的均數(shù)比較,可以選用方差分析進(jìn)行多樣本數(shù)據(jù)間的比較。由于數(shù)據(jù)的分布特征會(huì)因不同的實(shí)驗(yàn)、不同的時(shí)間測(cè)定出現(xiàn)不同的結(jié)果,所以應(yīng)首先對(duì)這些數(shù)據(jù)進(jìn)行方差齊性檢驗(yàn),而生殖毒性實(shí)驗(yàn)中因每組動(dòng)物受孕數(shù)量的不同,使得每組樣本數(shù)不同,所以不適于采用Hartevl最大方差比檢驗(yàn)法,可以選用Bartlett檢驗(yàn)或Levene檢驗(yàn)(表2)。
表2 常用的統(tǒng)計(jì)方法及適用條件
若總體方差相等,則選用方差分析進(jìn)行總體均數(shù)間的比較,若總體均數(shù)存在顯著性差異時(shí),需進(jìn)行兩兩比較,生殖毒性實(shí)驗(yàn)只需比較各實(shí)驗(yàn)組與對(duì)照組是否有差異,但若用t檢驗(yàn)多重比較,可能把本無差別的兩個(gè)總體均數(shù)判為有差別,所以可選擇Dunnett-t檢驗(yàn)進(jìn)行多重比較。若總體方差不等,可用變量變換的方法或非參數(shù)統(tǒng)計(jì)方法進(jìn)行統(tǒng)計(jì)分析,但用變量變換的方法使得結(jié)果的解釋不如原始觀測(cè)尺度方便,所以方差不齊時(shí),一般選擇Kruskal-Wallis H檢驗(yàn)方法,當(dāng)檢驗(yàn)結(jié)果存在顯著性差異時(shí),應(yīng)選擇非參數(shù)Dunnett-t檢驗(yàn)法或Nemenyi法進(jìn)行兩兩多重比較[7]。
生殖毒性實(shí)驗(yàn)中產(chǎn)生的如生育率、受孕率、死亡率、早產(chǎn)率和流產(chǎn)率等屬于計(jì)數(shù)資料。這些數(shù)據(jù)因沒有等級(jí)要求且實(shí)驗(yàn)組只與對(duì)照組進(jìn)行比較,所以可根據(jù)總樣本數(shù)量或理論頻數(shù)選用χ2檢驗(yàn)或Fisher確切概率法進(jìn)行統(tǒng)計(jì)[6]。
2.3.1胎仔數(shù)據(jù)的特點(diǎn):為了探索胎仔數(shù)據(jù)的特點(diǎn),選擇生殖毒性Ⅱ段實(shí)驗(yàn)中對(duì)照組和實(shí)驗(yàn)組胎仔畸形的部分?jǐn)?shù)據(jù)(表3)。采用SPSS中的Fisher確切概率法,以胎仔為單位對(duì)對(duì)照組(畸形數(shù)/正常胎仔數(shù):2/67)和實(shí)驗(yàn)組(畸形數(shù)/正常胎仔數(shù):10/60)的畸形數(shù)進(jìn)行統(tǒng)計(jì)分析,得到P<0.05,表明與對(duì)照組相比,實(shí)驗(yàn)組的畸形發(fā)生率有統(tǒng)計(jì)學(xué)意義上的顯著性差異;但是以窩為單位,以SPSS中非參數(shù)秩和檢驗(yàn)方法統(tǒng)計(jì)對(duì)照組和實(shí)驗(yàn)組的畸形率得到P>0.05,表明實(shí)驗(yàn)組的畸形率與對(duì)照組相比,未見統(tǒng)計(jì)學(xué)意義上的顯著性差異。
表3 胎仔數(shù)據(jù)實(shí)例1
以窩為單位和以胎仔為單位得出不一樣的結(jié)論,原因?yàn)閷?shí)驗(yàn)組的的胎仔畸形數(shù)大部分集中于F09號(hào)孕鼠的胎仔中,導(dǎo)致實(shí)驗(yàn)組的畸形率僅F09較高,結(jié)果說明胎仔數(shù)據(jù)中存在窩效應(yīng),即實(shí)驗(yàn)數(shù)據(jù)中存在孕鼠-仔鼠關(guān)系,由于同窩仔鼠接受的外界環(huán)境均相同,所以來自同一窩的仔鼠其體質(zhì)量、身長和發(fā)育指標(biāo)較所有仔鼠中隨機(jī)抽取的個(gè)體更為相似,即同窩仔鼠具有相似性和聚集性,數(shù)據(jù)是非獨(dú)立的[9-10]。若以每個(gè)胎仔作為實(shí)驗(yàn)單位,這些非獨(dú)立的數(shù)據(jù)被誤認(rèn)為成獨(dú)立數(shù)據(jù),使得統(tǒng)計(jì)分析失去參數(shù)估計(jì)的有效性,增加犯假陽性的概率,并導(dǎo)致不合理的推斷結(jié)論[8,11],而且以胎仔為實(shí)驗(yàn)單位時(shí),畸形率比較小,數(shù)據(jù)的分布接近二項(xiàng)分布的極限泊松分布,所以只用計(jì)數(shù)資料的χ2檢驗(yàn)不足以得出正確的統(tǒng)計(jì)結(jié)果。
針對(duì)窩效應(yīng)的問題,胡麗娜[2]和管彤等[12]提出用窩平均法來統(tǒng)計(jì)胎仔數(shù)據(jù),即將每窩比率作平方根反正弦變換后作參數(shù)方差分析或用非參數(shù)秩和檢驗(yàn)的方法進(jìn)行統(tǒng)計(jì)分析。這種以母體作為分析單元來進(jìn)行組間分析的做法雖然考慮到了窩效應(yīng)的存在,但是沒有考慮到窩大小的不均一性,假設(shè)實(shí)驗(yàn)組窩內(nèi)胎仔總數(shù)和畸形數(shù)均明顯多于相應(yīng)對(duì)照組,而采用窩平均法則不能統(tǒng)計(jì)出這一差異性。如表4所示,實(shí)驗(yàn)組的畸形數(shù)量明顯多于對(duì)照組,采用Fisher確切概率法,以胎仔為單位統(tǒng)計(jì)分析對(duì)照組(畸形數(shù)/正常胎仔數(shù):3/96)和實(shí)驗(yàn)組(畸形數(shù)/正常胎仔數(shù):10/88)的畸形數(shù),顯示與對(duì)照組相比,實(shí)驗(yàn)組的畸形發(fā)生率有顯著性差異(P<0.05);但由于F10號(hào)和F14號(hào)孕鼠的胎仔總數(shù)較多,導(dǎo)致每窩畸形率差異不大,若以窩平均法采用非參數(shù)秩和檢驗(yàn)的方法進(jìn)行統(tǒng)計(jì)分析,與對(duì)照組相比,實(shí)驗(yàn)組的畸形率未見明顯統(tǒng)計(jì)學(xué)差異(P>0.05)。另一方面,由于母體的觀察數(shù)量較少,以母體作為分析單元,會(huì)損失大量的數(shù)據(jù)信息,不能分析胎仔個(gè)體水平的變異,增加犯假陰性的概率[13]。
表4 胎仔數(shù)據(jù)實(shí)例2
2.3.2可用于窩效應(yīng)的統(tǒng)計(jì)方法:目前,有研究[4,14]對(duì)處理這類多層次的聚集性數(shù)據(jù)提出了相應(yīng)的統(tǒng)計(jì)方法,如隨機(jī)效應(yīng)logistic回歸模型、廣義估計(jì)方程和多水平模型等。隨機(jī)效應(yīng)logistic回歸模型:logistic回歸是研究二分類觀察結(jié)果與一些影響因素之間關(guān)系的一種多變量分析方法,生殖毒性實(shí)驗(yàn)中的胎仔計(jì)數(shù)資料則為多變量數(shù)據(jù)。在對(duì)生殖毒性實(shí)驗(yàn)胎仔計(jì)數(shù)資料進(jìn)行分析時(shí),所建立的隨機(jī)效應(yīng)logistic回歸模型是針對(duì)窩效應(yīng)的發(fā)生率不同和變異分布不同這一特點(diǎn)對(duì)logistic回歸的擴(kuò)展,是帶有隨機(jī)效應(yīng)參數(shù)的logistic回歸模型,通過對(duì)兩種模型進(jìn)行擬合,假設(shè)隨機(jī)效應(yīng)參數(shù)的大小,進(jìn)而判斷檢驗(yàn)資料是否存在窩效應(yīng),然后通過參數(shù)估計(jì)和回歸系數(shù)判斷各組間的差別[15]。這種方法可以檢驗(yàn)資料是否存在窩效應(yīng),并在窩效應(yīng)的前提下比較各組間的差別,降低犯假陽性錯(cuò)誤的概率。
廣義估計(jì)方程(generalized estimation equations,GEE):是在廣義線性模型的基礎(chǔ)上發(fā)展起來的,可用于處理分析非獨(dú)立數(shù)據(jù),在生殖毒性實(shí)驗(yàn)的胎仔數(shù)據(jù)中,每窩胎仔之間存在組內(nèi)相關(guān)性,可以通過等相關(guān)矩陣建立GEE-logistic回歸模型[16]。多水平模型可以用來處理具有層次結(jié)構(gòu)的數(shù)據(jù),生殖毒性實(shí)驗(yàn)中胎仔數(shù)據(jù)有母體和胎仔兩個(gè)水平單位,對(duì)于這些非正態(tài)數(shù)據(jù),可以建立兩水平logistic回歸模型,通過預(yù)測(cè)性擬似然法和二階近似法對(duì)模型進(jìn)行估計(jì),再通過Wald檢驗(yàn)得出比較結(jié)果[16-17]。這兩種模型中兩水平logistic回歸模型可以方便的分解開兩水平上的殘差,便于考慮窩效應(yīng)的具體影響。
這幾種統(tǒng)計(jì)方法雖然可以準(zhǔn)確的統(tǒng)計(jì)存在窩效應(yīng)的數(shù)據(jù),但是這些方法過程復(fù)雜,需要借助像SAS、SPSS、SUDAAN等專業(yè)的統(tǒng)計(jì)軟件來處理[13-17]。為此,需要將百分率統(tǒng)計(jì)法和頻數(shù)計(jì)數(shù)統(tǒng)計(jì)相結(jié)合的方法來處理胎仔計(jì)數(shù)資料。首先計(jì)算每只母體的胎仔畸形率,將其合并到劑量組,因百分率數(shù)據(jù)的分布不服從正態(tài)分布,可采用非參數(shù)秩和檢驗(yàn)方法,如果只有兩個(gè)實(shí)驗(yàn)組,則直接用兩個(gè)獨(dú)立樣本比較的Mann-Whitney U檢驗(yàn)進(jìn)行統(tǒng)計(jì)分析;當(dāng)實(shí)驗(yàn)組數(shù)大于等于三個(gè)實(shí)驗(yàn)組的時(shí)候,采用Kruskal-Wallis H檢驗(yàn)。頻數(shù)計(jì)數(shù)統(tǒng)計(jì)法:即分別以窩為單位和以每個(gè)胎仔為單位匯總窩畸形頻數(shù)和胎仔畸形頻數(shù)后,將其處理為四格表資料,直接用Fisher確切概率法進(jìn)行差異性統(tǒng)計(jì)。本文以表4數(shù)據(jù)為例,簡要介紹了其在SPSS19.0中的操作過程(表5)。這種方法在對(duì)結(jié)果進(jìn)行分析時(shí),需要綜合考慮兩種方法的統(tǒng)計(jì)結(jié)果,對(duì)結(jié)果的解釋沒有以上幾種方法直觀,但是這種方法在統(tǒng)計(jì)軟件中操作方便,簡單易懂,在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)時(shí),可以根據(jù)自身情況選擇合適的方法。
表5 SPSS操作過程
胎仔數(shù)據(jù)中還有像體質(zhì)量、身長、胎盤質(zhì)量、胎仔骨化數(shù)等一樣的計(jì)量資料,對(duì)于這些數(shù)據(jù),可以選擇窩平均法對(duì)胎仔計(jì)量資料進(jìn)行統(tǒng)計(jì)分析,也可以選擇前文提到的廣義估計(jì)方程和多水平模型來處理這些非獨(dú)立數(shù)據(jù)。
藥物安全性評(píng)價(jià)的目的為通過統(tǒng)計(jì)分析安全性評(píng)價(jià)實(shí)驗(yàn)中產(chǎn)生的大量數(shù)據(jù),得出藥物的毒性相關(guān)信息。生殖毒性實(shí)驗(yàn)過程繁瑣復(fù)雜,實(shí)驗(yàn)數(shù)據(jù)多樣,尤其是窩效應(yīng)和窩大小的不均一性越來越受到研究者們的重視,所以對(duì)于實(shí)驗(yàn)中產(chǎn)生的數(shù)據(jù)需要根據(jù)數(shù)據(jù)的特點(diǎn)選用合適的統(tǒng)計(jì)分析方法。生殖毒性實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù)可以根據(jù)數(shù)據(jù)的特點(diǎn)將其分為母體數(shù)據(jù)和胎仔數(shù)據(jù),其母體數(shù)據(jù)可以按照常規(guī)的統(tǒng)計(jì)方法進(jìn)行統(tǒng)計(jì)分析。窩效應(yīng)的存在使得生殖毒性實(shí)驗(yàn)中胎仔數(shù)據(jù)成為非獨(dú)立數(shù)據(jù),可以選用本文提到的隨機(jī)效應(yīng)logistic回歸模型、廣義估計(jì)方程和多水平模型等或者百分率統(tǒng)計(jì)和頻數(shù)統(tǒng)計(jì)相結(jié)合的方法對(duì)胎仔數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,并根據(jù)胎仔畸形的類型以及背景數(shù)據(jù)做出合理的判斷。