葉 健,周 梅,王 靜 ,徐成良 ,王重龍*
(1.安徽省農(nóng)業(yè)科學(xué)院畜牧獸醫(yī)研究所,豬分子數(shù)量遺傳學(xué)安徽省農(nóng)業(yè)科學(xué)院重點(diǎn)實(shí)驗(yàn)室,畜禽產(chǎn)品安全工程安徽省重點(diǎn)實(shí)驗(yàn)室,安徽合肥 230031;2.農(nóng)業(yè)農(nóng)村部豬肉質(zhì)量安全控制重點(diǎn)實(shí)驗(yàn)室,安徽亳州 236700;3.溫氏食品集團(tuán)股份有限公司,廣東新興 527400)
跨群體遺傳評(píng)估指聯(lián)合處于不同地理位置或不同亞群的動(dòng)物,利用表型、系譜或基因型等信息對(duì)合并群體進(jìn)行聯(lián)合評(píng)估,提高選擇準(zhǔn)確性和選擇強(qiáng)度,最終達(dá)到提高遺傳進(jìn)展的目的。在豬育種中,由于受到資金、土地、環(huán)保、疫病、生產(chǎn)模式和生產(chǎn)管理水平等因素影響,單場(chǎng)飼養(yǎng)動(dòng)物群體規(guī)模受到限制。由于單場(chǎng)規(guī)模的限制,針對(duì)單一群體的育種工作,常會(huì)面臨選擇強(qiáng)度較低、群體變異較小等問(wèn)題,使得此類種豬群體遺傳進(jìn)展較慢,育種基礎(chǔ)逐漸變窄。因此,探索不同群體或亞群之間的聯(lián)合遺傳評(píng)估,促進(jìn)種豬育種單位之間的遺傳交流,有利于整體育種效率的提升。
當(dāng)前全球的種豬育種模式,一類是以跨國(guó)育種公司為主導(dǎo),該類公司將其育種核心群全球布局;另一類是中小企業(yè)或家庭農(nóng)場(chǎng)的聯(lián)合育種,這種模式一般是以國(guó)家或者行業(yè)協(xié)會(huì)為主導(dǎo)。在我國(guó),這兩種模式處于并行發(fā)展的階段[1],前者以溫氏種豬公司為例,無(wú)論是其育種技術(shù)的研發(fā)和應(yīng)用,還是其育種核心群體的布局和建設(shè),都處于行業(yè)領(lǐng)先水平;后者以中小企業(yè)為主,通過(guò)遴選國(guó)家級(jí)生豬核心育種場(chǎng)實(shí)現(xiàn)全國(guó)或區(qū)域聯(lián)合育種,擴(kuò)大了核心母豬群體,使得整體遺傳聯(lián)系和表型進(jìn)展得以快速提升[2]。
在種豬遺傳評(píng)估中,如何聯(lián)合不同群體或亞群進(jìn)行遺傳分析,是大公司以及中小企業(yè)在育種工作中共同面臨的問(wèn)題;加之非洲豬瘟影響,會(huì)促進(jìn)育種核心群的分點(diǎn)布局。因此,如何利用好跨群體遺傳評(píng)估,是一項(xiàng)重要的研究?jī)?nèi)容,而群體間遺傳聯(lián)系是跨群體聯(lián)合遺傳評(píng)估的基礎(chǔ)。本文綜述了當(dāng)前應(yīng)用較多的基于表型和系譜信息的評(píng)價(jià)群體遺傳聯(lián)系的方法,介紹了基于基因組信息來(lái)評(píng)價(jià)基因組遺傳聯(lián)系的方法,并闡述了不同評(píng)價(jià)方法在奶牛和豬育種中的應(yīng)用,以期為推動(dòng)聯(lián)合遺傳評(píng)估提供參考。
1.1 基于表型和系譜信息 不同種豬群體之間的關(guān)聯(lián)度的大小是評(píng)價(jià)能否聯(lián)合遺傳分析的基礎(chǔ),關(guān)聯(lián)度影響各場(chǎng)個(gè)體估計(jì)育種值比較的準(zhǔn)確性。用預(yù)測(cè)誤差方差(Prediction Error Variance of Difference,PEVD)評(píng)價(jià)不同場(chǎng)或群體組關(guān)聯(lián)性是理想的度量方法,不同場(chǎng)之間通過(guò)比較所有個(gè)體兩兩配對(duì)的平均預(yù)測(cè)誤差方差來(lái)表示,計(jì)算公式(1):
但是,在大規(guī)模的遺傳評(píng)估計(jì)劃中,可能是2 個(gè)場(chǎng)的大量個(gè)體進(jìn)行配對(duì),也可能有數(shù)個(gè)場(chǎng)之間的個(gè)體進(jìn)行兩兩比對(duì),這樣計(jì)算非常耗時(shí)。
目前常用關(guān)聯(lián)率(Connectedness Rating,CR)來(lái)度量,其利用混合線性模型,將場(chǎng)效應(yīng)設(shè)置為固定效應(yīng),計(jì)算場(chǎng)效應(yīng)估計(jì)值的方差和協(xié)方差,并利用公式(2)來(lái)計(jì)算:
其中,Var(hi),Var(hj)和cov(hij)分別是相應(yīng)場(chǎng)效應(yīng)的方差和協(xié)方差。
Kennedy 等[3]的模擬研究表明,CR 計(jì)算結(jié)果和PEVD 之間的相關(guān)程度達(dá)到0.995,原因可能是對(duì)于每個(gè)配對(duì)比較來(lái)說(shuō),個(gè)體EBV 差異的預(yù)測(cè)誤差方差(PEV)可以分為2 部分。一部分與個(gè)體本身及其親屬有關(guān),這部分取決于每個(gè)EBV 的PEV,2 個(gè)個(gè)體的相關(guān)程度和個(gè)體與場(chǎng)效應(yīng)之間的協(xié)方差;另一部分與場(chǎng)效應(yīng)本身有關(guān),包括場(chǎng)效應(yīng)估計(jì)值的方差和不同場(chǎng)效應(yīng)間的協(xié)方差。計(jì)算2 個(gè)場(chǎng)個(gè)體的PEVD 時(shí),第一部分個(gè)體本身及其親屬有關(guān)的部分,在所有配對(duì)進(jìn)行平均后會(huì)相互抵消;第二部分中與場(chǎng)效應(yīng)有關(guān)的部分是相同的,所以PEVD 近似等于2 個(gè)場(chǎng)效應(yīng)的估計(jì)值的PEV,即場(chǎng)間關(guān)聯(lián)率[4]。
有研究表明,隨著場(chǎng)間關(guān)聯(lián)率的提升,場(chǎng)間EBV比較的誤差方差逐漸降低,在關(guān)聯(lián)率達(dá)到3%時(shí),誤差方差達(dá)到0.5 左右[5]。不同群體間聯(lián)合遺傳評(píng)估需要的關(guān)聯(lián)水平取決于場(chǎng)或同期組的大小、顯著水平、需要檢測(cè)出的EBV 平均差異值以及殘差方差,樣本含量越大,相同的檢測(cè)差異比例、需要的關(guān)聯(lián)率水平越低;且隨著樣本含量的上升,CR 的大小越來(lái)越依賴于遺傳聯(lián)系[4]。
2.2 基于基因組信息 近年來(lái),以基因組選擇技術(shù)為代表的分子育種技術(shù)在豬育種中逐步應(yīng)用,該技術(shù)利用覆蓋全基因組的遺傳標(biāo)記,將標(biāo)記信息與表型信息建立關(guān)聯(lián),以此來(lái)實(shí)現(xiàn)對(duì)個(gè)體種用價(jià)值進(jìn)行更加準(zhǔn)確地評(píng)定。在聯(lián)合遺傳評(píng)估中,利用基因組信息,也將能夠更加準(zhǔn)確和及時(shí)地評(píng)估不同群體或不同亞群之間的遺傳聯(lián)系。
基于單核苷酸多態(tài)(SNP)標(biāo)記信息的基因組聯(lián)合育種,其準(zhǔn)確性依賴于與數(shù)量性狀基因座(QTL)或致因突變位點(diǎn)(QTN)處于連鎖不平衡(LD)的標(biāo)記位點(diǎn)在不同群體中連鎖模式存在相似性。參考群與驗(yàn)證群遺傳聯(lián)系越緊密,參考群遺傳標(biāo)記的估計(jì)效應(yīng)在驗(yàn)證群中使用,育種值估計(jì)的準(zhǔn)確性越高[6]。評(píng)估群體之間的遺傳相似性有多種方法:
不同群體之間相同標(biāo)記的LD 之間的相關(guān)性,可用來(lái)評(píng)估群體間的遺傳相似性,以此來(lái)從側(cè)面反映不同群體聯(lián)合遺傳評(píng)估EBV 準(zhǔn)確性的高低。也可根據(jù)標(biāo)記之間LD 衰減的特征,來(lái)評(píng)估群體之間聯(lián)合遺傳評(píng)估所需的最少標(biāo)記數(shù)[7]。處于同一染色體2 個(gè)標(biāo)記位點(diǎn)之間的LD 水平,常用r 來(lái)表示[8],計(jì)算公式(3):
其中,pA1B1是基因座A 上等位基因1 和基因座B 上等位基因1 同時(shí)出現(xiàn)的頻率,pA1是基因組A 上等位基因1 出現(xiàn)的頻率。
另外,在群體遺傳學(xué)中,評(píng)價(jià)不同群體之間的遺傳聯(lián)系,常用的表達(dá)方式還有主成分分析(PCA)、進(jìn)化分析(系統(tǒng)發(fā)生樹(shù))和admixture 分析(structure 圖)。此外,也可通過(guò)比較Fst指數(shù)來(lái)評(píng)價(jià)群體的分化程度,來(lái)間接反映群體之間的親緣關(guān)系。
PCA 的思想是將數(shù)據(jù)的n 維特征映射到k 維上(k<n),k 維是全新的正交特征,以此來(lái)達(dá)到減少特征數(shù)、減少冗余和減少過(guò)渡擬合的目的,一般用影響最大的因素PC1 和PC2 做二維圖形,直觀展示群體之間的遺傳聯(lián)系,如圖1 所示[9]。系統(tǒng)發(fā)生樹(shù)用以反映具有共同祖先的各物種相互間的演化關(guān)系,在樹(shù)形結(jié)構(gòu)中,其用枝長(zhǎng)的累計(jì)距離來(lái)反映樣本差異的大小,如圖2 所示[10]。Structure 圖(圖3)能夠反映不同群體之間遺傳物質(zhì)的交流情況[11],該方法將群體預(yù)分為若干個(gè)亞群,并假設(shè)各個(gè)亞群內(nèi)部應(yīng)該符合哈代-溫伯格平衡,且采用貝葉斯算法,對(duì)每個(gè)模擬的分組值產(chǎn)生一個(gè)最大似然值,該值越大,說(shuō)明對(duì)應(yīng)的分組值越接近真實(shí)群體的情況。當(dāng)分組值不斷增加,會(huì)出現(xiàn)一個(gè)飽和的最大似然值,該點(diǎn)對(duì)應(yīng)的分組值所生成的圖即為最合適的模擬圖。Fst指數(shù)利用種群期望雜合度和亞群預(yù)計(jì)雜合度,來(lái)計(jì)算反映群體的基因雜合性水平,以此來(lái)衡量種群分化程度。
在跨群體基因組選擇研究中,上述指標(biāo)常作為定性的指標(biāo)加以利用,用以反映和比較群體之間的混雜程度。如對(duì)墨西哥奶牛群體的研究表明,不同生產(chǎn)系統(tǒng)的奶牛有共同的祖先,但存在不同的遺傳特性[12];此外,在對(duì)不同來(lái)源奶牛群體的育種值進(jìn)行聯(lián)合遺傳評(píng)估中,通過(guò)比較不同聯(lián)合群體的LD 相關(guān)和主成分,解釋了不同群體構(gòu)成育種值估計(jì)準(zhǔn)確性差異的原因[13]。
為了更加清晰跨群體遺傳評(píng)估的應(yīng)用和研究現(xiàn)狀,下文以跨群體聯(lián)合遺傳評(píng)估較多的奶牛群體為例,闡述當(dāng)前奶牛聯(lián)合育種的進(jìn)展,并以此為參照,探討聯(lián)合育種在豬育種中的應(yīng)用前景,為下一步研究指明方向。
2.1 奶牛 在奶牛育種中,主導(dǎo)的奶牛品種是荷斯坦牛,又由于該奶牛的主選性狀均集中在產(chǎn)奶量和乳成分上,因此,在基于該品種及其相似性狀的選育上,主要的聯(lián)合育種策略是聯(lián)合組建大規(guī)模的參考群體,利用該群體能夠?qū)?biāo)記效應(yīng)進(jìn)行更加準(zhǔn)確的估計(jì),當(dāng)前較為成功的是美國(guó)-加拿大以及歐洲奶牛聯(lián)合育種[14]。在其他奶牛品種,如西門(mén)塔爾牛和瑞士褐牛的遺傳改良中,也在借鑒荷斯坦奶牛聯(lián)合育種的做法,通過(guò)聯(lián)合不同國(guó)家相同品種的參考群來(lái)提高基因組選擇的準(zhǔn)確性。該策略已然成為聯(lián)合遺傳評(píng)估的主流方法[15]。
在聯(lián)合不同群體構(gòu)建參考群的過(guò)程中,聯(lián)合基因組育種值評(píng)估準(zhǔn)確性差異的原因也是較多研究的對(duì)象。如前所述的LD 之間的相關(guān)、PCA 和admixture 分析等,是主要的研究方法。有研究分析了法國(guó)、美國(guó)和中國(guó)參考群體之間兩兩聯(lián)合遺傳分析,育種值評(píng)估準(zhǔn)確性差異的原因,結(jié)果顯示法國(guó)和美國(guó)群體聯(lián)合分析有較高的準(zhǔn)確性,而與中國(guó)群體聯(lián)合分析,準(zhǔn)確性偏低,原因是法國(guó)和美國(guó)群體相同位點(diǎn)LD 值相關(guān)性更大,PCA 聚類更加緊密[13];此外,針對(duì)墨西哥奶牛群體的遺傳分析表明,該奶牛群體遺傳背景與引進(jìn)的加拿大和美國(guó)奶牛群體存在遺傳交流[16]。
另外,針對(duì)不同品種的跨群體遺傳評(píng)估,也有相關(guān)報(bào)道。De Roos 等[7]研究分析了不同奶牛群體間的連鎖不平衡程度,以荷斯坦奶牛和娟珊牛為例,至少300K的標(biāo)記位點(diǎn)才能夠滿足聯(lián)合遺傳評(píng)估的需要;Pryce 等[16]評(píng)估了聯(lián)合3 個(gè)品種牛與單一品種牛育種值估計(jì)的差異,結(jié)果表明不同品種聯(lián)合構(gòu)建參考群,育種值估計(jì)的準(zhǔn)確性更高。無(wú)論是不同品種還是品系,基于單核苷酸多態(tài)(SNP)的跨群體聯(lián)合遺傳評(píng)估,單一群體與不同群體之間親緣關(guān)系的遠(yuǎn)近,其本質(zhì)在于QTL 的效應(yīng)在不同群體之間的相似性以及與其連鎖的SNP 的LD 水平,SNP 在不同群體的多態(tài)性也是影響聯(lián)合遺傳分析的因素之一[15]。因此,在跨群體聯(lián)合遺傳評(píng)估之前,需要更多關(guān)注群體結(jié)構(gòu)和目標(biāo)性狀的遺傳特性,這樣才能夠更有方向性,保證結(jié)果的可信度和可應(yīng)用性。
2.2 豬 由奶牛聯(lián)合遺傳評(píng)估的研究和應(yīng)用進(jìn)展可知,聯(lián)合構(gòu)建參考群是其跨群體遺傳評(píng)估的主要方式,并結(jié)合群體遺傳學(xué)手段(如LD、PCA 和進(jìn)化分析等)來(lái)輔助評(píng)估育種值估計(jì)的差異性,豬聯(lián)合育種也可以借鑒這種方式。然而在豬育種中,金字塔式的育種體系和多品種多品系多目標(biāo)性狀的特點(diǎn)給豬聯(lián)合育種帶來(lái)更大的復(fù)雜性。
我國(guó)當(dāng)前開(kāi)展的種豬聯(lián)合育種工作,場(chǎng)間聯(lián)系性的評(píng)價(jià)指標(biāo)為場(chǎng)間關(guān)聯(lián)率,通過(guò)全國(guó)以及區(qū)域水平核心種豬場(chǎng)育種水平的提升以及場(chǎng)與場(chǎng)之間的遺傳交流的開(kāi)展,聯(lián)合育種取得了一些成績(jī),部分場(chǎng)之間已經(jīng)達(dá)到聯(lián)合遺傳評(píng)估的要求[2,17]。然而,基于基因組信息的聯(lián)合育種工作才剛剛起步,2017 年,我國(guó)啟動(dòng)了基因組選擇聯(lián)合育種計(jì)劃,以期通過(guò)利用基因組水平的分子標(biāo)記信息,將能夠更加準(zhǔn)確和及時(shí)地評(píng)估不同群體或亞群之間的遺傳聯(lián)系,助推聯(lián)合遺傳評(píng)估工作的開(kāi)展,提升種豬水平。
在我國(guó)種豬跨群體基因組聯(lián)合遺傳評(píng)估中,目前主要研究對(duì)象是不同公司相似來(lái)源背景的種豬群體。有研究以北京周邊三家養(yǎng)豬公司的大白豬群體為研究對(duì)象,結(jié)果顯示在系譜間關(guān)聯(lián)較少的情況下,多場(chǎng)基因組聯(lián)合遺傳評(píng)估育種值估計(jì)的準(zhǔn)確性高于單場(chǎng),并克服了場(chǎng)間常規(guī)遺傳評(píng)估育種值無(wú)法比較等缺點(diǎn)[18]。可見(jiàn)在豬中,借鑒了許多奶牛聯(lián)合遺傳評(píng)估構(gòu)建混合參考群的做法。此外,結(jié)合豬育種特點(diǎn),采用雜交群體構(gòu)建基因組選擇參考群體,以此來(lái)對(duì)純種群體進(jìn)行選擇[19];或以純種群體構(gòu)建的參考群預(yù)測(cè)雜交群體[20]?;蛲ㄟ^(guò)分析不同地理位置和飼養(yǎng)管理環(huán)境下基因組與環(huán)境的互作,以此對(duì)參考群構(gòu)成進(jìn)行優(yōu)化,這些研究都有利于更好的開(kāi)展豬的跨群體聯(lián)合遺傳評(píng)估。
在豬育種中,存在許多跨群體聯(lián)合遺傳評(píng)估的問(wèn)題,如雜交群體信息的利用、降低核心群到商品群的遺傳滯后性和不同品系間進(jìn)行聯(lián)合遺傳評(píng)估等,利用基因組信息為解決這些問(wèn)題提供了更好的手段。