梅步俊+王志華
摘 要:數(shù)量遺傳學(xué)是遺傳學(xué)領(lǐng)域難度較大的課程,掌握數(shù)量遺傳學(xué)基本知識,并能將其應(yīng)用到科研工作中,從事相關(guān)研究,需要學(xué)生擁有較為扎實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)。但是,目前國內(nèi)的統(tǒng)計(jì)學(xué)和數(shù)量遺傳學(xué)教學(xué)尚缺乏聯(lián)系。該文以數(shù)量遺傳學(xué)基本概念為主要內(nèi)容,較為詳細(xì)的推導(dǎo)了數(shù)量遺傳學(xué)的基本原理和公式,為學(xué)生進(jìn)一步理解該學(xué)科的的基本原理提供幫助,也為該學(xué)科的進(jìn)一步研究提供基礎(chǔ)。
關(guān)鍵詞:教學(xué)改革;統(tǒng)計(jì)計(jì)算;數(shù)量遺傳學(xué);復(fù)雜性狀
中圖分類號 G642.0 文獻(xiàn)標(biāo)識碼 A 文章編號 1007-7731(2017)20-0018-04
數(shù)量遺傳學(xué)是遺傳學(xué)的一個(gè)特殊分支,該學(xué)科的研究對象是個(gè)體之間性狀“程度”的差異,而非“類型”的差異。這些個(gè)體間的差異被稱為數(shù)量差異或數(shù)量性狀[1],數(shù)量性狀被定義為在一個(gè)群體內(nèi)的各個(gè)體間表現(xiàn)為連續(xù)變異的性狀[2]。數(shù)量性狀的表型受到基因和環(huán)境變異的共同影響,單個(gè)基因解釋的表型方差的比例通常是很小。然而,無數(shù)微效基因的聯(lián)合貢獻(xiàn)對表型的變異有重要意義??刂茢?shù)量性狀變異的基因稱為數(shù)量性狀基因座(QTL)。在數(shù)量遺傳學(xué)文獻(xiàn)中,QTL代表單數(shù)形式,QTLs代表復(fù)數(shù)形式。但無論一個(gè)QTL有多小,它都像單個(gè)孟德爾位點(diǎn)一樣分離[3]。目前,常規(guī)的研究手段仍然捕捉不到小效應(yīng)的QTL的分離現(xiàn)象,依然需要借助統(tǒng)計(jì)學(xué)方法來推斷基因間的分離現(xiàn)象。大多數(shù)應(yīng)用于數(shù)量遺傳學(xué)的統(tǒng)計(jì)方法需要定義特殊的遺傳模型。
1 基因頻率和基因型頻率
動物育種領(lǐng)域只考慮二倍體生物。二倍體生物攜帶同源基因組的2個(gè)拷貝,一個(gè)來自父本親本,另一個(gè)來自母本的親本?;蚪M的每個(gè)拷貝稱為單倍體。因此,基因組的每個(gè)基因座都含有兩個(gè)等位基因,每個(gè)基因座均來自每個(gè)親本[4]。雖然每個(gè)個(gè)體最多攜帶2個(gè)不同的等位基因,但是整個(gè)群體可能有許多不同的等位基因,稱為復(fù)等位基因群體[5]。為了簡單起見,我們只考慮一個(gè)包含2個(gè)不同等位基因的種群,稱為二倍體群體。設(shè)特定群體[A]位點(diǎn)有2個(gè)等位基因[A1]和[A2]。在二倍體群體中,只可能有3種基因型,分別為[A1A1]、[A1A2]和[A2A2]。不同群體的結(jié)構(gòu)和交配制度決定了其3種基因型比例的的不同,[P11=PrA1A1],[P12=PrA1A2]和[P22=PrA2A2]分別為3種基因型的頻率?;蛐蚚A1A1]、[A1A2]分別包含1個(gè)或2個(gè)等位基因[A1]。因此,整個(gè)群體[A1]的頻率為:
[p1=PrA1=P11+12P12]
[p2=PrA2=P22+12P12]
以上2個(gè)公式不考慮群體歷史和結(jié)構(gòu)。但是,基因型頻率和基因頻率之間的函數(shù)關(guān)系需要一些假設(shè)。在大的隨機(jī)交配群體中,存在基因頻率和基因型頻率之間的獨(dú)特關(guān)系,可以表示為[P11=p21],[P12=2p1p2]和[P22=p22]。這可以解釋為2個(gè)獨(dú)立等位基因聯(lián)合在一起形成基因型[6]。因?yàn)榘?個(gè)相同的基因型,所以雜合子的頻率為[2p1p2],即[A1A2]和[A2A1]代表2種不同來源的配子。這個(gè)特殊的關(guān)系可由以下2項(xiàng)式擴(kuò)展表示:
[p1+p22=p21+2p1p2+p22] (1)
對應(yīng)于如下基因(型)分離組合事件:
[A1+A22=A1A1+2A1A2+A2A2] (2)
如果一個(gè)群體沒有選擇、突變和遷移,基因頻率和基因型頻率將在代際傳遞中一直保持不變,這樣的群體處于哈代-溫伯格平衡狀態(tài)[7]。如果一個(gè)大群體不處于哈代-溫伯格平衡,只要經(jīng)過一代的隨機(jī)交配就足以使群體達(dá)到哈代-溫伯格平衡。
對于一個(gè)等位基因頻率[kk>2]群體的哈代-溫伯格平衡可表示為[Pij=2pipj],[i≠j];[Pii=p2i],[i=j],此處[Pij=PrAiAj]和[pi=PrAi],[i, j=1, …, k]。
基因頻率和基因型頻率是群體的基本特征。研究的基因通常與適合度有關(guān),從而確定群體對環(huán)境變化的適應(yīng)性和群體的進(jìn)化。這些內(nèi)容是群體遺傳學(xué)的研究內(nèi)容。在數(shù)量遺傳學(xué)中,我們的研究對象是的決定數(shù)量性狀表型的基因,所以首先要為基因型和等位基因指派賦值,這些值被稱為遺傳效應(yīng)。
2 遺傳效應(yīng)和遺傳差異
群體中每個(gè)個(gè)體的數(shù)量性狀都有表型值。 假設(shè)我們可以觀察到群體中所有個(gè)體的基因型?;蛐蚚A1A1]的遺傳效應(yīng)被定義為群體中攜帶基因型[A1A1]個(gè)體的表型平均值,該基因型值定義為[G11],[A1A2]和[A2A2]也可有類似定義。[G11]的效應(yīng)等于平均表型效應(yīng),其原因如下。設(shè)[Y11]為攜帶基因型[A1A1]個(gè)體的表型值,則其可以表達(dá)為:
[Y11=G11+E11] (3)
此處,[E11]為隨機(jī)環(huán)境偏差。即使群體中的每個(gè)個(gè)體都有相同的基因型值,其環(huán)境偏差也各不相同。當(dāng)對群體中所有個(gè)體求平均值時(shí),上式變?yōu)椋?/p>
[Y11=G11+E11] (4)
[G11]個(gè)體數(shù)量足夠多時(shí),因正負(fù)偏差相互抵消,則[E11≈0],[Y11=G11]。
可以定義3種參數(shù)為基因型值的函數(shù):
[μ=12G11+G22]
[a=G11-12G11+G22]
[=G11-μ] (5)
[d=G12-12G11+G22]
[=G12-μ]
此處,[μ]稱為中值,[a]為加性效應(yīng),[d]為顯性效應(yīng)。因此,3種基因型值可以表示為:
[G11=μ+a]
[G12=μ+d] (6)
[G22=μ-a]
我們也可以將基因型值表示為中值的偏差:
[φ11=G11-μ=a]
[φ12=G12-μ=d] (7)endprint
[φ22=G22-μ=-a]
在溫代-哈伯格平衡下,基因型值的群體平均值可以表示為中值的偏差:
[μG=Eφ=P11φ11+P12φ12+P22φ22]
[=p21a+2p1p2d+p22-a]
[=p1-p2a+2p1p2d] (8)
基因型方差為:
[σ2G=varφ=Eφ2-E2φ] (9)
此處
[Eφ2=P11φ211+P12φ212+P22φ222]
[=p21a2+2p1p2d2+p22-a2]
[=p21+p22a2+2p1p2d2] (10)
經(jīng)過一些代數(shù)運(yùn)算,可得
[σ2G=2p1p2a+p2-p1d2+2p1p2d2] (11)
3 平均等位基因替代效應(yīng)
個(gè)體的每個(gè)位點(diǎn)由2個(gè)等位基因組成,每個(gè)等位基因分別來自一個(gè)親本。2個(gè)等位基因在繁殖過程中將進(jìn)入不同的配子。親本的配子將在子代重新組合,形成下一代的基因型。因此,基因型不能一代一代的遺傳下去,而是它是等位基因(單倍型)從一個(gè)世代傳遞到下一個(gè)世代[8]。因此,需要定義等位基因效應(yīng)。本文用下面2×2表格定義等位基因效應(yīng)。
等位基因[A1]的效應(yīng)定義為:
[α1=φ11-μGp21+φ12-μGp2p1p1=p2a+dp2-p1] (12)
等位基因[A2]的效應(yīng)定義為:
[α2=φ12-μGp1p2+φ22-μGp22p2=-p1a+dp2-p1]
(13)
2個(gè)等位基因之間的差值稱為平均等位基因替代效應(yīng),表示為[α]:
[α=α1-α2=a+p2-p1d] (14)
不同基因型中2個(gè)等位基因的效應(yīng)和稱為“育種值”,其含義為個(gè)體攜帶這種基因型的后代的期望基因型值。因此,基因型[A1A1]的育種值為[A11=2α1=2p2α],另外2個(gè)基因型的育種值分別為[A12=α1+α2=p2-p1α]和[A22=2α2=-p1α]。真實(shí)基因型值和與育種值的差異稱為顯性偏差[9]。3種顯性偏差分別為:
[δ11=φ11-μG-A11=-2p22d]
[δ12=φ12-μG-A12=2p1p2d] (15)
[δ22=φ22-μG-A22=-2p21d]
3種基因型的基因型值(G)、育種值(A)和顯性偏差(D)列于表2。
4 遺傳方差組分
育種值和顯性偏差的期望為0,證明過程如下:
[EA=P11A11+P12A12+P22A22]
[=p212p2α+2p1p2p2-p1α+p22-2p1α=0] (16)
[ED=P11δ11+P12δ12+P22δ22]
[=p21-2p22d+2p1p22p1p2d+p22-2p21d=0] (17)
類似可以推導(dǎo)出:
[σ2A=EA2=p212p2α2+2p1p2p2-p1α2+p22-2p1α2=2p1p2α2]
(18)
[σ2D=ED2=p21-2p22d2+2p1p22p1p2d2+p22-2p1α2=2p1p2d2]
(19)
由遺傳性知識和公式(11)可得,第一部分(18)為[σ2A],第二部分(19)為[σ2D],因此:
[σ2G=σ2A+σ2D] (20)
即總遺傳方差可以被剖分為加性方差組分和顯性方差組分。
5 遺傳力
表型值[Y]可由如下線性模型表示:
[Y=G+E=A+D+E] (21)
上式中,[E]為環(huán)境誤差,其平均值為0,方差為[σ2E]。表型方差[σ2P=varY]為
[σ2P=σ2G+σ2E=σ2A+σ2D+σ2E] (22)
總遺傳方差和表型方差的比值稱為廣義遺傳力(broad-sense heritability)[10],表示為:
[H2=σ2A+σ2Dσ2A+σ2D+σ2E] (23)
廣義遺傳力經(jīng)常被用在進(jìn)化論研究中,而加性方差和表型方差的比值稱為狹義遺傳力(narrow-sense heritability)[11],表示為:
[h2=σ2Aσ2A+σ2D+σ2E] (24)
狹義遺傳力反映了性狀可以被遺傳下去的比例。因此,它在遺傳方案制定和遺傳改良工作中是非常重要的參數(shù)。
6 哈代-溫伯格平衡條件下的[F2]家系
此處,我們只考慮哈代-溫伯格平衡條件下,[A1A1]和[A2A2]純合系雜交形成的[F2]家系。等位基因頻率[p1=p2=12]時(shí),相應(yīng)基因型頻率[P11=p21=14],[P12=2p1p2=12],[P22=p22=14]。平均等位基因替代效應(yīng)為[α=a+p2-p1d=a],因此,
[σ2G=2p1p2α2+2p1p2d2=12a2+14d2] (25)
以上結(jié)論還可從不同的角度獲得。[F2]個(gè)體的基因型值可以表示為:
[G=μ+Za+Wd] (26)
此處
[Z=+1 A1A1, P11=140 A1A2, P12=12-1 A2A2, P22=14] (27)
[W=0 A1A1, P11=141 A1A2, P12=120 A2A2, P22=14] (28)
基因型方差可以被剖分為:
[σ2G=σ2Za2+σ2Wd2=12a2+14d2] (29)endprint
此處
[σ2Z=EZ2-E2Z]
[=14+12+1202+14-12-14+1+120+14-12]
[=12-0=12] (30)
[σ2W=EW2-E2W]
[=1402+1212+1402-140+121+1402]
[=12-14=14] (31)
此處,假設(shè)[Z]和[W]的協(xié)方差為0;否則,基因型方差計(jì)算時(shí)需要增加[2covZ, Wad]項(xiàng)[12]。
以上,我們通過對數(shù)量遺傳學(xué)6個(gè)方面的基本內(nèi)容(基因頻率和基因型頻率、遺傳效應(yīng)和遺傳差異、平均等位基因替代效應(yīng)、遺傳方差組分、遺傳力和哈代-溫伯格平衡條件下的[F2]家系)進(jìn)行較為詳細(xì)的公式推導(dǎo),力求為學(xué)生理解并彌合統(tǒng)計(jì)學(xué)和數(shù)量遺傳學(xué)理論的鴻溝奠定基礎(chǔ)。
致謝:本研究感謝美國愛荷華州立大學(xué)動物科學(xué)系Rohan L.Fernando教授、Hao Chen博士和Jian Zeng博士的幫助。
參考文獻(xiàn)
[1]Sherlock J.M.,B.P.Zietsch,J.M.Tybur,et al.The quantitative genetics of disgust sensitivity[J].Emotion,2016,16(1):43-51.
[2]Sherwood R.J.,D.L.Duren,E.W.Demerath,et al.Quantitative genetics of modern human cranial variation[J].Journal of human evolution,2008,54(6):909-914.
[3]Sorensen D..Developments in statistical analysis in quantitative genetics[J].Genetica,2009,136(2):319-332.
[4]Tachida H.C.C.Cockerham.A building block model for quantitative genetics[J].Genetics,1989,121(4):839-844.
[5]Tafti M.,D.Chollet,J.L.Valatx,et al.Quantitative trait loci approach to the genetics of sleep in recombinant inbred mice[J].Journal of sleep research,1999,8 Suppl 1:37-43.
[6]Visscher P.M.,Whole genome approaches to quantitative genetics.Genetica,2009,136(2):351-358.
[7]Walsh B..Quantitative genetics in the age of genomics[J].Theoretical population biology,2001,59(3):175-184.
[8]Walsh B..Quantitative genetics,version 3.0:where have we gone since 1987 and where are we headed? [J].Genetica,2009,136(2):213-223.
[9]Zhivotovskii L.A..Computer models of quantitative characteristics in genetics.Communication II.Dynamics of the frequency of alleles with different types of selection[J].Soviet genetics,1974,8(7):937-941.
[10]Schaffer H.E.L.E.Mettler.Teaching population fitness and adaptive surfaces in population and quantitative genetics[J].The Journal of heredity,1974,65(3):189-192.
[11]Kreitman N..Developments in quantitative genetics in psychiatry.Le Journal medical libanais[J].The Lebanese medical journal,1972,25(4):337-342.
[12]Comstock R.E..Theory of quantitative genetics:synthesis[J].Cold Spring Harbor symposia on quantitative biology,1955,20:93-102.
(責(zé)編:張宏民)endprint