史良玉,王立剛,張鵬飛,莫家遠(yuǎn),李 洋,王立賢,趙福平
(中國農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所,農(nóng)業(yè)部動(dòng)物遺傳育種與繁殖(家禽)重點(diǎn)實(shí)驗(yàn)室,北京 100193)
近交是將有親緣關(guān)系的個(gè)體進(jìn)行交配。在畜牧生產(chǎn)中,群體規(guī)模有限,近交難以避免。近交水平的增加會(huì)導(dǎo)致基因組中有害純合子的增加,產(chǎn)生近交衰退,導(dǎo)致后代生產(chǎn)性能降低[1]。目前眾多研究表明,在不同物種中,近交會(huì)影響動(dòng)物的生產(chǎn)性能[1-3],尤其是牛的繁殖性能[4-6],但近交對(duì)豬繁殖性能影響的研究相對(duì)較少[7]。傳統(tǒng)的近交系數(shù)計(jì)算方法是基于完整的系譜記錄信息。隨著基因組數(shù)據(jù)的不斷涌現(xiàn),從基因組層面能找到共同祖先傳遞下來的相同單倍型片段,即連續(xù)純合基因型片段(runs of homozygosity, ROH)。根據(jù)ROH片段提供的遺傳信息可以有效的估計(jì)出個(gè)體實(shí)現(xiàn)的近交系數(shù),這為計(jì)算個(gè)體近交系數(shù)提供了新的途徑[8]。另外,還可以利用ROH對(duì)每條染色體或某個(gè)染色體片段進(jìn)行特定基因組區(qū)段的近交系數(shù)估計(jì),并進(jìn)一步估計(jì)其對(duì)近交衰退的影響程度。
本研究分別使用系譜、全基因組SNP標(biāo)記和ROH計(jì)算個(gè)體的近交系數(shù),并利用混合線性模型檢測(cè)近交系數(shù)與加系和法系大白豬群體的總產(chǎn)仔數(shù)(total number of piglets born, TNB)的相互關(guān)系,從而評(píng)估近交衰退程度,并進(jìn)一步定位導(dǎo)致大白豬總產(chǎn)仔數(shù)近交衰退具體的染色體區(qū)域,為基因組選種和選配提供參考。
本研究選取上海某公司1 937頭大白豬,其中1 039頭 來自加系,898頭來自法系,且兩群體無親緣關(guān)系。加系和法系群體分別飼養(yǎng)在兩個(gè)不同的場(chǎng),且兩場(chǎng)營養(yǎng)管理水平基本相同。兩群體系譜共由3 086頭大白豬組成,系譜記錄時(shí)間為2012—2019年,大約8個(gè)世代。僅對(duì)有芯片且有系譜的1 937頭 大白豬個(gè)體進(jìn)行近交系數(shù)的計(jì)算及近交衰退分析。
對(duì)1 937頭大白豬使用GeneSeek GGP Porcine HD 芯片進(jìn)行分型。由于該芯片根據(jù)Susscrofa10.2版本設(shè)計(jì),將其更新為Susscrofa11.1版本進(jìn)行后續(xù)分析。使用PLINK v1.90軟件[9]進(jìn)行質(zhì)控,質(zhì)控條件如下:個(gè)體基因型檢出率>90%,標(biāo)記基因型檢出率>90%,最小等位基因頻率>0.05,僅保留常染色體SNP標(biāo)記。質(zhì)控后剩余37 310 個(gè)SNPs,1 937頭大白豬。
1.3.1 基于ROH的近交系數(shù)估計(jì) 使用PLINK v1.90軟件[9]進(jìn)行ROH檢測(cè)。ROH的鑒定標(biāo)準(zhǔn)為:1)ROH的最小長度為1 Mb;2)每個(gè)ROH至少由45個(gè)SNPs組成,該參數(shù)計(jì)算公式由Lencz等[10]提出:
基于ROH估計(jì)的近交系數(shù)(FROH)計(jì)算公式為:
其中,LROHi為個(gè)體i的ROH長度,Lauto為芯片中常染色體SNPs覆蓋長度。
1.3.2 基于SNPs的近交系數(shù)估計(jì) 基于SNPs估計(jì)的近交系數(shù)(FGRM)計(jì)算公式[11]為:
其中,xi為第i個(gè)SNP主等位基因的數(shù)量,m為SNPs數(shù)量,pi為主等位基因頻率。
1.3.3 基于系譜的近交系數(shù)估計(jì) 使用BLUPF90家族程序(http://nce.ads.uga.edu/wiki/doku.php?id=application_programs)對(duì)系譜進(jìn)行檢測(cè)校正。校正后的系譜可追溯世代數(shù)為1~8代,平均世代數(shù)為5.33代。使用R pedigreemm 包[12]利用校正后的系譜估計(jì)近交系數(shù)(FPED)[13]。
由于加系和法系大白豬擁有不同的遺傳背景,因此本研究使用DMU軟件分別對(duì)兩個(gè)品系大白豬的總產(chǎn)仔數(shù)進(jìn)行近交衰退評(píng)估,采用分析模型如下:
yijk=μ+YSi+Pj+βFk+ak+Pek+eijk
對(duì)于加系群體,共有4 710條產(chǎn)仔記錄,平均胎次為3.220;法系群體共有3 546條產(chǎn)仔記錄,平均胎次為3.049。兩品系總產(chǎn)仔數(shù)基本統(tǒng)計(jì)量見表1。
表1 兩品系總產(chǎn)仔數(shù)基本統(tǒng)計(jì)量
如表2所示,對(duì)于兩個(gè)品系,基于基因組信息估計(jì)的近交系數(shù)(FROH和FGRM)均值均高于基于系譜估計(jì)的近交系數(shù)(FPED)。加系群體FROH和FPED均值均高于法系群體,F(xiàn)GRM均值低于法系群體。在兩個(gè)品系中,不同方法估計(jì)的近交系數(shù)之間的皮爾遜相關(guān)均為正相關(guān)(表3)。對(duì)于加系群體,F(xiàn)ROH與FPED之間的相關(guān)最高,相關(guān)系數(shù)為0.358;對(duì)于法系群體,F(xiàn)ROH與FGRM之間的相關(guān)最高,相關(guān)系數(shù)為0.371。
表2 基于基因組信息和系譜估計(jì)的近交系數(shù)分布
表3 不同方法估計(jì)的近交系數(shù)的皮爾遜相關(guān)
兩品系近交系數(shù)隨個(gè)體出生年份變化如圖1所示。由于2014年僅1頭個(gè)體出生,故在趨勢(shì)分析中不考慮。2015—2019年間出生的個(gè)體,隨著年份的增加,兩品系FPED均呈現(xiàn)上升趨勢(shì),且加系群體FPED均高于法系群體。FROH波動(dòng)趨勢(shì)基本相同, 2018—2019年出生個(gè)體的FROH高于2015—2017年出生個(gè)體。對(duì)于加系群體,F(xiàn)GRM隨著個(gè)體出生年份增加呈現(xiàn)上升趨勢(shì);對(duì)于法系群體,F(xiàn)GRM隨著個(gè)體出生年份增加呈現(xiàn)先下降再上升趨勢(shì)。
圖1 兩品系2014—2019年出生個(gè)體不同方法估計(jì)的近交系數(shù)Fig.1 The inbreeding coefficients for pig born between 2014 and 2019 estimated by different methods
基于基因組近交系數(shù)(FROH及FGRM)和系譜近交系數(shù)(FPED),利用混合線性模型對(duì)大白豬總產(chǎn)仔數(shù)的近交衰退進(jìn)行評(píng)估,以近交系數(shù)這一協(xié)變量的回歸系數(shù)β作為近交衰退效應(yīng)大小,結(jié)果見表4。盡管不同方法估計(jì)近交系數(shù)所得近交衰退效應(yīng)大小不同,但隨著近交系數(shù)的增加,加系群體總產(chǎn)仔數(shù)均顯著減少。FPED每增加10%,加系群體總產(chǎn)仔數(shù)減少(0.823±0.276)頭。FROH每增加10%,加系群體和法系群體總產(chǎn)仔數(shù)分別減少(0.571±0.178)、(0.690±0.324)頭。
表4 兩品系近交系數(shù)每增加10%總產(chǎn)仔數(shù)近交衰退估計(jì)
使用FROH對(duì)每條常染色體進(jìn)行兩個(gè)品系總產(chǎn)仔數(shù)近交衰退估計(jì),結(jié)果顯示,加系群體第6、7、8和13號(hào)染色體效應(yīng)顯著,而法系群體未發(fā)現(xiàn)顯著產(chǎn)生近交衰退的常染色體(圖2)。為了檢測(cè)加系群體中導(dǎo)致近交衰退特定的基因組區(qū)域,將對(duì)隨著近交系數(shù)增加總產(chǎn)仔數(shù)顯著降低的染色體進(jìn)行分段分析。根據(jù)第6、7、8和13號(hào)染色體在芯片中覆蓋的長度分別平均分成2、4、6、8條片段,利用在相應(yīng)片段內(nèi)的FROH進(jìn)行近交衰退分析。不同染色體不同片段結(jié)果如表5、表6、表7、表8所示,當(dāng)染色體分割成2個(gè)片段時(shí),6號(hào)和8號(hào)染色體的第一段顯著,7號(hào)染色體第一段極顯著。當(dāng)將染色體分割為8條片段時(shí),對(duì)于6號(hào)染色體,僅第一條片段效應(yīng)顯著,該片段位于6號(hào)染色體0.052~21.347 Mb之間;對(duì)于7號(hào)染色體,第三條片段(30.445~45.667 Mb)效應(yīng)極顯著,第六條片段(76.112~91.335 Mb)效應(yīng)顯著;對(duì)于8號(hào) 染色體,第一條片段(0.075~17.360 Mb)效應(yīng)極顯著,第三條片段(34.719~52.079 Mb)效應(yīng)顯著,第五條片段(69.438~86.798 Mb)效應(yīng)顯著。無論將染色體分割為幾段,第13號(hào)染色體中的片段均不顯著。
表5 加系群體6號(hào)染色體不同區(qū)域總產(chǎn)仔數(shù)近交衰退估計(jì)
表6 加系群體7號(hào)染色體不同區(qū)域總產(chǎn)仔數(shù)近交衰退估計(jì)
表7 加系群體8號(hào)染色體不同區(qū)域總產(chǎn)仔數(shù)近交衰退估計(jì)
(轉(zhuǎn)下頁 Carried forward)
表8 加系群體13號(hào)染色體不同區(qū)域總產(chǎn)仔數(shù)近交衰退估計(jì)
圖2 加系群體和法系群體總產(chǎn)仔數(shù)每條染色體每增加10% FROH近交衰退估計(jì)值及95%置信區(qū)間Fig.2 Inbreeding depression estimation in total number of piglets born per 10% increase in FROH and 95% confidence interval across autosomes for Canadian line and French line
本研究采用了3種計(jì)算近交系數(shù)的方法對(duì)大白豬總產(chǎn)仔數(shù)的近交衰退進(jìn)行評(píng)估。FPED的計(jì)算完全依賴于系譜信息,而實(shí)際生產(chǎn)中系譜常會(huì)出現(xiàn)記錄錯(cuò)誤和缺失的現(xiàn)象[14-15],并且假定基礎(chǔ)群個(gè)體間無親緣關(guān)系,這些都可能會(huì)低估近交水平。利用SNP計(jì)算近交系數(shù)時(shí),很難辨別SNP是否是同源相同(identical by descent, IBD)還是同態(tài)相同(identical by state, IBS),常會(huì)高估近交水平[16]。另外,SNP對(duì)最小等位基因頻率更加敏感,可能會(huì)導(dǎo)致FGRM估計(jì)準(zhǔn)確性降低[17]。當(dāng)有基因型的個(gè)體較少時(shí)FGRM估計(jì)不夠準(zhǔn)確,這會(huì)降低近交衰退估計(jì)的統(tǒng)計(jì)能力[18]。ROH是父母將來自共同祖先同一段單倍型傳遞給后代所形成的,所以ROH一般都屬于IBD單倍型片段。因此,ROH近交系數(shù)既能避免系譜近交系數(shù)低估情況,又能避免SNP近交系高估的問題。而且FROH主要基于個(gè)體的基因組數(shù)據(jù),不再依賴于系譜記錄,能提供更準(zhǔn)確的近交系數(shù)[19]。另外ROH還能夠精細(xì)的定位因近交而造成衰退的特定基因組區(qū)段。所以,F(xiàn)ROH已被認(rèn)為是評(píng)估畜禽親緣關(guān)系和近交系數(shù)的一種有效且準(zhǔn)確的替代方法[20]。
本研究中法系群體FROH與FGRM與之間的相關(guān)高于其他對(duì)大白豬的研究報(bào)道[21],可能是由于本研究中大白豬群體產(chǎn)生了遺傳漂變。盡管相比系譜使用基因組數(shù)據(jù)能夠提高親緣關(guān)系估計(jì)的準(zhǔn)確性[22],但是FGRM有可能會(huì)得到負(fù)值。隨著個(gè)體出生年份的增加,兩品系FPED呈上升趨勢(shì)。系譜中個(gè)體最早出生于2012年,而且假設(shè)基礎(chǔ)群個(gè)體間無親緣關(guān)系,因此2015年出生個(gè)體近交程度相對(duì)較低。法系群體在2018年之前使用系譜進(jìn)行選擇,自2018年起使用基因組選擇,選擇更加準(zhǔn)確,可能會(huì)使基因型的同質(zhì)性增加。另外,法系群體相對(duì)較小,利用SNP進(jìn)行近交系數(shù)計(jì)算時(shí),由于該方法對(duì)最小等位基因頻率敏感,使近交系數(shù)有波動(dòng)的現(xiàn)象。本研究群體中并未再引種而導(dǎo)入外源血統(tǒng),F(xiàn)PED會(huì)隨著年份的增長而增加。FROH與FPED之間的相關(guān)在兩個(gè)品種中較低,分別為0.358、0.275,該結(jié)果與先前其他研究一致[23-24]。加系群體FROH與FPED與之間的相關(guān)高于法系群體,可能是加系群體具有更加完整的系譜記錄,可追溯的平均世代數(shù)為5.493。
目前關(guān)于豬繁殖性狀近交衰退的研究較少。周平等[25]根據(jù)近交系數(shù)在0~20%范圍內(nèi)將大白豬分為4組,結(jié)果表明,近交程度對(duì)相同胎次產(chǎn)仔數(shù)的影響不大,與胎次關(guān)系較為密切。但該研究僅采用簡單的方差分析,未能消除胎次等效應(yīng)因近交對(duì)產(chǎn)仔數(shù)的影響。Miglior等[26]使用系譜對(duì)奶牛泌乳期平均體細(xì)胞評(píng)分進(jìn)行近交衰退估計(jì),結(jié)果表明,近交系數(shù)每增加1%奶牛泌乳期平均體細(xì)胞評(píng)分增加0.012。已有研究利用SNP和ROH進(jìn)行近交系數(shù)估計(jì),從而評(píng)估近交衰退程度,其中僅少數(shù)幾個(gè)研究定位了近交衰退片段[27-30]。Saura等[16]利用ROH計(jì)算109頭母豬近交系數(shù)并鑒定到13號(hào)染色體一個(gè)近交衰退片段。本研究檢測(cè)出13號(hào)染色能引起加系大白豬群體的總產(chǎn)仔數(shù)產(chǎn)生近交衰退現(xiàn)象,但未能檢測(cè)到具體的染色體片段。分析原因有:1)在13號(hào)染色體86.188~160.936 Mb 每個(gè)個(gè)體均未檢測(cè)到ROH;2)本研究只是按照染色體的長度將其平均劃分為2~8段,這種分段方法也可能使原有近交衰退片段被打斷。
本研究使用BioMart工具(ensembl.org/bio-mart)進(jìn)一步對(duì)第6、7和8號(hào)染色體上存在近交衰退的ROH片段進(jìn)行基因注釋,共注釋到601個(gè)基因。其中與繁殖性狀相關(guān)的功能基因有5個(gè),分別位于7號(hào)染色體30.5~45.7 Mb的ROH區(qū)段中的CUL7、MAPK14、PPARD基因和位于8號(hào)染色體69.4~86.8 Mb處ROH片段上的AREG、EREG基因。研究發(fā)現(xiàn),CUL7[31-32]、MAPK14[33]和PPARD基因[34-35]與胎盤發(fā)育相關(guān),AREG和EREG基因與卵母細(xì)胞成熟相關(guān)[36-38]。由于近交導(dǎo)致以上基因中隱性有害純合子的增加,造成總產(chǎn)仔數(shù)的下降。
本研究針對(duì)兩個(gè)不同背景來源的大白豬在經(jīng)過約8個(gè)世代的選育后,利用基于系譜和基因型數(shù)據(jù)信息的3種方法估計(jì)近交系數(shù),并評(píng)估近交對(duì)總產(chǎn)仔數(shù)的負(fù)面影響。加系和法系大白豬FROH的平均值分別為0.124、0.123。隨著個(gè)體出生年份的增加,F(xiàn)PED也隨之呈現(xiàn)上升趨勢(shì)。對(duì)于加系群體,3種方法都檢測(cè)到隨著近交系數(shù)的增加,大白豬總產(chǎn)仔數(shù)呈現(xiàn)不同程度的降低,F(xiàn)ROH與FPED結(jié)果更為接近。而在法系群體中,僅FROH檢測(cè)到了近交衰退。利用FROH還檢測(cè)到4條染色和多個(gè)特定染色體區(qū)域存在近交衰退的現(xiàn)象。本研究不僅為系譜數(shù)據(jù)缺失的群體,開展近交衰退估計(jì)提供新的研究方法,也為避免近交實(shí)施豬基因組選種選配工作提供了參考依據(jù)。