翁鴻,江梅,仇成鳳,曾憲濤
· 循證理論與實(shí)踐 ·
遺傳關(guān)聯(lián)性研究Meta分析中的Hardy-Weinberg平衡
翁鴻1,2,江梅3,仇成鳳4,曾憲濤1,2
Hardy-Weinberg平衡(HWE)在科學(xué)領(lǐng)域是一個(gè)常用的假設(shè),其在遺傳關(guān)聯(lián)性研究中的重要性被日益重視。HWE與基因型分型質(zhì)量密切相關(guān),因此,制作遺傳關(guān)聯(lián)性研究Meta分析時(shí),需要檢驗(yàn)對(duì)照組人群基因型分布是否符合HWE。本文從HWE定律的產(chǎn)生背景出發(fā),介紹其檢驗(yàn)方法,以及在制作遺傳關(guān)聯(lián)性研究Meta分析時(shí)如何處理對(duì)照組不符合HWE的研究。
遺傳關(guān)聯(lián)性研究;基因多態(tài)性;Hardy-Weinberg平衡;Meta分析
在理想狀態(tài)下(如隨機(jī)交配,沒(méi)有選擇、突變或遷徙),人群若符合Hardy-Weinberg平衡(HWE),某一特征基因比例在遺傳中將保持不變。當(dāng)前HWE在科學(xué)研究領(lǐng)域是一個(gè)常用假設(shè),涵蓋植物學(xué)[1]、法醫(yī)學(xué)[2]及遺傳流行病學(xué)[3]。在遺傳關(guān)聯(lián)性研究中HWE的重要性也逐漸被研究者發(fā)現(xiàn)。Trikalinos等[4]對(duì)42篇遺傳關(guān)聯(lián)性研究Meta分析的591個(gè)研究再次進(jìn)行Meta分析,結(jié)果發(fā)現(xiàn),對(duì)照組中不符合HWE校正后,33篇Meta分析文獻(xiàn)總的比值比在10%以內(nèi)變化,另外9篇在10%~31%變化,其中3篇校正后統(tǒng)計(jì)學(xué)關(guān)聯(lián)性消失。因此,在制作遺傳關(guān)聯(lián)性研究Meta分析時(shí),進(jìn)行對(duì)照組HWE檢驗(yàn)是重要的步驟。本文全面闡述HWE的產(chǎn)生、檢驗(yàn)方法以及在遺傳關(guān)聯(lián)性研究Meta分析中如何處理。
1.1 進(jìn)化 達(dá)爾文進(jìn)化理論有三條原則:①變異原則;②遺傳原則;③選擇原則。變異原則是指在任何一個(gè)群體中,不同個(gè)體之間都存在一定程度的差異,包括形態(tài)、生理及行為;遺傳原則是指后代與其雜交親本的相似性多于與無(wú)關(guān)個(gè)體的相似性;選擇原則是指在特定的環(huán)境中,某些個(gè)體總比其他個(gè)體有更強(qiáng)的生存能力。群體遺傳學(xué)將上述三條原則轉(zhuǎn)變成精準(zhǔn)的遺傳學(xué)概念的科學(xué),從研究群體的遺傳結(jié)構(gòu)及其變化規(guī)律來(lái)探討進(jìn)化的機(jī)制。
1.2 孟德?tīng)柸后w 進(jìn)化的單位是群體,并不是個(gè)人,這是由于個(gè)體生命的長(zhǎng)短是有限的,且其遺傳結(jié)構(gòu)除發(fā)生突變之外,一生中均是固定的。而群體分布廣泛,世代相傳,具有時(shí)間上的連續(xù)性,在遺傳結(jié)構(gòu)上也能發(fā)生改變。群體遺傳學(xué)研究群體是一種特定的孟德?tīng)柸后w,是一群相互交配的個(gè)體集合,該群體中所有個(gè)體共有的全部基因即為基因庫(kù)。Dobzhansky[5]定義其為一群能夠相互繁殖的個(gè)體,并享有一個(gè)共同的基因庫(kù)。
1.3 群體的遺傳結(jié)構(gòu) 群體遺傳學(xué)主要是研究群體遺傳組成變化的機(jī)制。遺傳結(jié)構(gòu)是指群體中各基因的頻率及各基因型的數(shù)量分布。因此,群體遺傳學(xué)采用等位基因頻率和基因型頻率兩個(gè)概念來(lái)表達(dá)群體遺傳結(jié)構(gòu)。等位基因頻率是指某種基因在某個(gè)群體中出現(xiàn)的比例;基因型頻率是指某種特定基因型的個(gè)體占群體內(nèi)全部個(gè)體的比例。
2.1 HWE定律的概念 群體遺傳結(jié)構(gòu)的變化引起遺傳水平上的變化,即進(jìn)化。突變和重組是可遺傳變異的源泉,是進(jìn)化所需的原料。在有性繁殖過(guò)程中,通過(guò)遺傳漂變和自然選擇將變異體有區(qū)別地傳遞到后代中去。但遺傳本身并不改變基因頻率,即HWE定律的原理。該定律指出:當(dāng)一個(gè)大的孟德?tīng)柸后w中的個(gè)體間進(jìn)行隨機(jī)交配,并同時(shí)無(wú)選擇、無(wú)突變、無(wú)遷徙和遺傳漂變發(fā)生時(shí),下一代基因型的頻率和前一代一樣,這個(gè)群體被稱為處于隨機(jī)交配系統(tǒng)的平衡中[6-10]。該定律是在1908年由英國(guó)數(shù)學(xué)家Hardy和德國(guó)醫(yī)生Weinberg分別獨(dú)立發(fā)現(xiàn)的,故稱HWE定律,又稱基因型頻率的平衡定律,它是群體遺傳學(xué)的第一理論基石[6,9,11,12]。假設(shè)一對(duì)等位基因A和B的頻率分別為p和q,且p+q=1,在該群體中有三種基因型AA、AB和BB,其基因型頻率分別為p2、2pq和q2,根據(jù)HWE定律,則(p+q)2= p2+2pq+q2=1(表1)。因此HWE定律也被稱為二項(xiàng)式平方定律。
2.2 HWE定律的要點(diǎn) HWE定律的要點(diǎn)主要有三條[6]:①在以隨機(jī)交配為前提的孟德?tīng)柸后w中,如果沒(méi)有基因突變、選擇或遷移的干擾,則基因頻率在遺傳過(guò)程中不發(fā)生變化;②群體的基因型頻率的平衡建立在二項(xiàng)式定律之中[(p+q)2= p2+2pq+q2=1],孟德?tīng)柸后w的基因型頻率取決于其等位基因頻率;③隨機(jī)交配是保持平衡狀態(tài)的重要保障。
2.3 HWE定律的推廣 HWE定律不僅適用于二等位基因的情況,也適用于復(fù)等位基因和伴性基因。如有三個(gè)等位基因A、B、C,其頻率分別為p、q、r,且p+q+r=1,那么在孟德?tīng)柸后w中,這三個(gè)等位基因及其六種基因型滿足的平衡為:(p+q+r)2=p2+2pq+2pr+q2+2qr+r2(表2)。
表1 等位基因A和B的HWE
表2 復(fù)等位基因的HWE
表3 Pearson卡方檢驗(yàn)計(jì)算方法
3.1 基因分型錯(cuò)誤 這是引起HWE偏離的重要因素[13,14]。在很多基因分型平臺(tái)中,鑒定雜合子個(gè)體比純合子個(gè)體更具有挑戰(zhàn)性,難度更大,因此,該基因型的個(gè)體缺失引起數(shù)據(jù)偏離HWE;基因分型質(zhì)量差的另一個(gè)原因是可分型率低,即大量單核苷酸多態(tài)性(SNP)位點(diǎn)或個(gè)體無(wú)法進(jìn)行基因分型,這一問(wèn)題在全基因組關(guān)聯(lián)研究(GWAS)中更為顯著,在候選基因研究中也會(huì)產(chǎn)生,基因型的隨機(jī)缺失對(duì)試驗(yàn)結(jié)果的影響較小,但基因分型錯(cuò)誤率太高就意味著非隨機(jī)缺失,對(duì)結(jié)果會(huì)產(chǎn)生偏倚;此外,病例組和對(duì)照組中遺失率的不同也會(huì)對(duì)試驗(yàn)結(jié)果產(chǎn)生偏倚,如兩組DNA提取或儲(chǔ)存的差異所引起的丟失[15,16]。
3.2 選擇性配對(duì) 即非隨機(jī)配對(duì)。HWE檢驗(yàn)要求所分析的SNP是隨機(jī)配對(duì)的,但由于其他因素的干擾,如擇偶中女性對(duì)男性身高的選擇,以及在聾啞人群中也可能發(fā)生[16,17]。
3.3 選擇偏倚 由于死胎或早期死亡等因素導(dǎo)致某些基因型的流失,這些流失的基因型可能被忽略,因此可能會(huì)受到選擇偏倚的影響。
3.4 人群分層 在研究中混合了遺傳學(xué)隔離的人群,可能會(huì)引起基因型頻數(shù)偏離HWE。人群分層是遺傳關(guān)聯(lián)性研究中較為重要的一個(gè)因素。
3.5 偶然因素 有的研究分析了多個(gè)SNP,增加了I型錯(cuò)誤的發(fā)生,因此其HWE檢驗(yàn)的P值也需要進(jìn)行多重檢驗(yàn)校正,以得到校正后的P值。
3.6 其他因素 小群體中可能由于遺傳漂變、始祖效應(yīng)、空間限制及雜合子優(yōu)勢(shì)而導(dǎo)致偏離HWE[17,18],如囊性纖維化病,雜合子個(gè)體比正常的純合子個(gè)體有生殖優(yōu)勢(shì)。
4.1 Pearson卡方檢驗(yàn) 檢驗(yàn)?zāi)硞€(gè)群體是否符合HWE最常用的方法是Pearson卡方檢驗(yàn)(表3)。假設(shè)有100個(gè)人,AA、AB、BB的基因型頻數(shù)(O)分別為:O(AA)=70、O(AB)=20、O(BB)=10,計(jì)算出A、B等位基因的頻率分別為:f(A)=(70×2+20)/(2×100)=0.8、f(B)=(10×2+20)/(2×100)=0.2,然后分別計(jì)算出各基因型頻率的期望值(E):E(AA)=100×0.82=64,E(AB)=2×100×0.8×0.2=32,E(BB)=100×0.22=4。Pearson卡方擬合優(yōu)度檢驗(yàn)是通過(guò)求和(O-E)2/E來(lái)給定卡方值,該例的卡方值為:χ2=(70-64)2/64+(20-32)2/32+(10-4)2/4=14.06。此外,值得注意的是,此處卡方分布的自由度為3-1-1=1,不是3-1=2,因?yàn)榈任换蝾l率p已經(jīng)在觀測(cè)值中進(jìn)行了估算,因此卡方分布的自由度又減少一個(gè)。因此,該卡方值對(duì)應(yīng)的P值為0.0002,提示該基因型頻數(shù)偏離HWE,可能會(huì)存在雜合子數(shù)目的部分丟失。最后一步也可以在EXCEL中輸入“=CHIDIST(卡方值,自由度)”然后得出相應(yīng)的P值。此外,也有多種軟件可以實(shí)現(xiàn)HWE檢驗(yàn),如Stata軟件中的genhwi命令(命令格式genhwi AA AB BB)、網(wǎng)頁(yè)版檢驗(yàn)HWE(http://www.oege.org./software/hwe-mr-calc.shtml)及研究者自行在EXCEL中編輯計(jì)算公式。
4.2 其他檢驗(yàn)方法 Pearson卡方檢驗(yàn)是最常用的檢驗(yàn)HWE的方法,但當(dāng)突變基因頻率較為罕見(jiàn)時(shí),Pearson卡方檢驗(yàn)的統(tǒng)計(jì)效能難以滿足,此時(shí)應(yīng)使用確切檢驗(yàn)[7,8,10]。Li等[19]提出了一種似然比檢驗(yàn)(LRT),并指出LRT比常用的Pearson卡方檢驗(yàn)具有更強(qiáng)的統(tǒng)計(jì)效能。但Zang等[20]指出當(dāng)標(biāo)志物不依賴疾病時(shí),LRT的檢驗(yàn)效能也不足,需要數(shù)據(jù)最優(yōu)化來(lái)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,因此他們提出了一種收縮檢驗(yàn),比LRT更具有統(tǒng)計(jì)效能,也易于用在全基因組關(guān)聯(lián)研究的數(shù)據(jù)中。此外,Ward等[21]還提出了一種簡(jiǎn)單均方根統(tǒng)計(jì)量來(lái)檢驗(yàn)HWE,以及X連鎖的單核苷酸多態(tài)性的HWE檢驗(yàn)[22]、近親系數(shù)檢驗(yàn)[23]、不完全列舉法[24]及繪圖法[25]。總之,檢驗(yàn)基因型頻數(shù)是否偏離HWE的方法有多種,讀者可根據(jù)情況選擇合適的方法,比如Stata軟件的genhwi命令同時(shí)提供了Pearson卡方檢驗(yàn)、LRT檢驗(yàn)以及確切檢驗(yàn)的結(jié)果。
5.1 檢測(cè)對(duì)照組基因型是否符合HWE 研究者普遍認(rèn)為遺傳關(guān)聯(lián)性研究的可靠性和有效性在較大程度上依賴對(duì)照組的正確選擇[26]。病例組中的群體可能由于受到疾病壓力(選擇壓力的一種)的作用,使得其基因型分布偏離HWE;而未患病的對(duì)照組基因型分布應(yīng)該符合HWE,因此,在進(jìn)行遺傳關(guān)聯(lián)性研究的Meta分析時(shí),應(yīng)該檢測(cè)病例-對(duì)照研究的對(duì)照組基因型分布是否符合HWE。但由于檢驗(yàn)HWE的效能較低,特別是對(duì)于中等效應(yīng)值的檢測(cè),因此,HuGENet推薦評(píng)估的主要目的是評(píng)價(jià)偏離HWE程度的大小,而不是檢驗(yàn)是否具有統(tǒng)計(jì)學(xué)意義[27]。因此,推薦研究者在制作遺傳關(guān)聯(lián)性研究Meta分析中,報(bào)告納入研究對(duì)照組基因型的HWE情況時(shí)應(yīng)報(bào)告檢驗(yàn)結(jié)果的P值,而不是僅報(bào)告該研究的對(duì)照組是否符合HWE。
5.2 對(duì)照組基因型分布偏離HWE研究的處理 制作遺傳關(guān)聯(lián)性研究Meta分析時(shí),有研究者提出將對(duì)照組基因型分布偏離HWE的研究進(jìn)行排除,也有研究者認(rèn)為應(yīng)該將其納入,然后進(jìn)行敏感性分析或Meta回歸分析,來(lái)比較結(jié)果的穩(wěn)定性或檢驗(yàn)組間是否有差異[17,28-31]。目前普遍較為推薦的為后者,先將所有研究納入進(jìn)行合并分析,然后進(jìn)行敏感性分析,排除對(duì)照組偏離HWE的研究,將敏感性分析的結(jié)果與總的合并結(jié)果進(jìn)行比較,驗(yàn)證匯總結(jié)果的穩(wěn)健性。
本文概述了HWE定律產(chǎn)生的背景及歷史,并闡明了其在遺傳學(xué)中的地位,因此,HWE定律在遺傳關(guān)聯(lián)性研究中也不可忽視,在進(jìn)行遺傳關(guān)聯(lián)性研究Meta分析時(shí)要進(jìn)行HWE的檢驗(yàn)。詳述了群體偏離HWE的原因,主要是基因分型質(zhì)量的原因以及檢驗(yàn)HWE的目的。并展示了檢驗(yàn)HWE的方法,其中Pearson卡方檢驗(yàn)最為常用,軟件操作也較為簡(jiǎn)單。最后,闡述了遺傳關(guān)聯(lián)性研究Meta分析中如何處理對(duì)照組不符合HWE的研究,即先進(jìn)行匯總分析后,再進(jìn)行敏感性分析,對(duì)比研究結(jié)果,考察匯總結(jié)果的穩(wěn)健性。此外,提倡研究者在制作遺傳關(guān)聯(lián)性研究Meta分析時(shí),應(yīng)報(bào)告對(duì)照組基因型分布偏離HWE的程度(即P值),而不僅僅是報(bào)告是否符合HWE。
[1] Anastassopoulos E. DNA Fingerprinting in Plants: Principles, Methods and Applications[J]. Economic Botany,2009,14(14):129-31.
[2] Council BN. The evaluation of forensic DNA evidence[M]. Washington DC: National Academy Press,2010.
[3] Sham P. Statistics in Human Genetics[M]. London: Arnold Publishers,2001.
[4] Trikalinos TA,Salanti G,Khoury MJ,et al. Impact of violations and deviations in Hardy-Weinberg equilibrium on postulated genedisease associations[J]. Am J Epidemiol,2006,163(4):300-9.
[5] DOBZHANSKY T. Mendelian populations as genetic systems[J]. Cold Spring Harb Symp Quant Biol,1957,22(7):385-93.
[6] 王亞馥,戴灼華. 遺傳學(xué)[M]. 第二版,北京:高等教育出版社,2008.
[7] Wigginton JE,Cutler DJ,Abecasis GR. A note on exact tests of Hardy-Weinberg equilibrium[J]. Am J Hum Genet,2005,76(5):887-93.
[8] Schaid DJ,Batzler AJ,Jenkins GD,et al. Exact tests of Hardy-Weinberg equilibrium and homogeneity of disequilibrium across strata[J]. Am J Hum Genet,2006,79(6):1071-80.
[9] Mayo O. A century of Hardy-Weinberg equilibrium[J]. Twin Res Hum Genet,2008,11(3):249-56.
[10] Shan G. A note on exact conditional and unconditional tests for Hardy-Weinberg equilibrium[J]. Hum Hered,2013,76(1):10-7.
[11] James V Neel. Hardy-Weinberg Equilibrium and Primitive Populations[J]. Am J Hum Genet,1965,17(1):91-2.
[12] Hardy GH. MENDELIAN PROPORTIONS IN A MIXED POPULATION[J]. Science,1908,28(706):49-50.
[13] Gomes I,Collins A,Lonjou C,et al. Hardy-Weinberg quality control[J]. Ann Hum Genet,1999,63(Pt 6):535-8.
[14] Hosking L,Lumsden S,Lewis K,et al. Detection of genotyping errors by Hardy-Weinberg equilibrium testing[J]. Eur J Hum Genet,2004,12(5):395-9.
[15] Clayton DG,Walker NM,Smyth DJ,et al. Population structure, differential bias and genomic control in a large-scale, case-control association study[J]. Nat Genet,2005,37(11):1243-6.
[16] Al-Chalabi A,Almasy L. Genetics of Complex Human Diseases: A Laboratory Manual[M]. New York: Cold Spring Harbor Laboratory Press,2009.
[17] Salanti G,Sanderson S,Higgins JP. Obstacles and opportunities in meta-analysis of genetic association studies[J]. Genet Med,2005,7(1):13-20.
[18] Chen YS,Su YC,Pan W. Effect of spatial constraints on Hardy-Weinberg equilibrium[J]. Sci Rep,2016,6:19297.
[19] Li M,Li C. Assessing departure from Hardy-Weinberg equilibrium in the presence of disease association[J]. Genet Epidemiol,2008,32(7): 589-99.
[20] Zang Y,Yuan Y. A shrinkage method for testing the Hardy-Weinberg equilibrium in case-control studies[J]. Genet Epidemiol,2013,37(7): 743-50.
[21] Ward R,Carroll RJ. Testing Hardy-Weinberg equilibrium with a simple root-mean-square statistic[J]. Biostatistics,2014,15(1):74-86.
[22] Zheng G,Joo J,Zhang C,et al. Testing association for markers on the X chromosome[J]. Genet Epidemiol,2007,31(8):834-43.
[23] Salanti G,Amountza G,Ntzani EE,et al. Hardy-Weinberg equilibrium in genetic association studies: an empirical evaluation of reporting, deviations, and power[J]. Eur J Hum Genet,2005,13(7):840-8.
[24] Maurer HP,Melchinger AE,Frisch M. An incomplete enumeration algorithm for an exact test of Hardy-Weinberg proportions with multiple alleles[J]. Theor Appl Genet,2007, 115(3):393-8.
[25] Graffelman J,Camarena JM. Graphical tests for Hardy-Weinberg equilibrium based on the ternary plot[J]. Hum Hered,2008,65(2):77-84.
[26] 劉紅,胡永華. 遺傳流行病學(xué)研究中的H-W平衡檢驗(yàn)[J]. 中南大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2010,35(1):90-3.
[27] Little J,Higgins JPT (editors). The HuGENet? HuGE Review Handbook, version 1.0. http://www.hugenet.ca (accessed 28 February 2006).
[28] Nakaoka H,Inoue I. Meta-analysis of genetic association studies: methodologies, between-study heterogeneity and winner's curse[J]. J Hum Genet,2009,54(11):615-23.
[29] Sagoo GS,Little J,Higgins JP. Systematic reviews of genetic association studies. Human Genome Epidemiology Network[J]. PLoS Med,2009,6(3):e28.
[30] Minelli C,Thompson JR,Abrams KR,et al. How should we use information about HWE in the meta-analyses of genetic association studies?[J]. Int J Epidemiol,2008,37(1):136-46.
[31] Salanti G,Higgins JP,Trikalinos TA,et al. Bayesian meta-analysis and meta-regression for gene-disease associations and deviations from Hardy-Weinberg equilibrium[J]. Stat Med,2007,26(3):553-67.
本文編輯:姚雪莉
Hardy-Weinberg equilibrium in Meta-analysis of genetic association study
WENG Hong*, JIANG Mei, QIU Cheng-feng, ZENG Xian-tao.*Center for Evidence-Based and Translational Medicine, Zhongnan Hospital, Wuhan University, Wuhan 430071, China.
To Hardy-Weinberg equilibrium (HWE) is a common hypothesis in field of science and its importance is more and more predominant in genetic association study. HWE is closely correlated with quality of genotyping. Therefore, the coincidence between genotype distribution in controls and HWE should be tested when a Meta-analysis of genetic association study was conducted. The test method, and how to deal with the studies that were not coincided with HWE during performing Meta-analysis of genetic association study were introduced in the paper based on the emerging background of HWE.
Genetic association study; Gene polymorphism; Hardy-Weinberg equilibrium; Meta-analysis
R4
A
1674-4055(2016)11-1281-03
國(guó)家重點(diǎn)研發(fā)計(jì)劃專項(xiàng)基金(2016YFC0106300)
1430071 武漢,武漢大學(xué)中南醫(yī)院循證與轉(zhuǎn)化醫(yī)學(xué)中心;2430071 武漢,武漢大學(xué)循證與轉(zhuǎn)化醫(yī)學(xué)中心;3510120 廣州,廣州醫(yī)科大學(xué)附屬第一醫(yī)院·呼吸疾病國(guó)家重點(diǎn)實(shí)驗(yàn)室·呼吸疾病國(guó)家臨床研究中心·廣州呼吸疾病研究所;4418000 懷化,懷化市第一民醫(yī)院臨床藥學(xué)研究室·循證醫(yī)學(xué)中心
曾憲濤,E-mail:zengxiantao1128@163.com
10.3969/j.issn.1674-4055.2016.11.01
中國(guó)循證心血管醫(yī)學(xué)雜志2016年11期