王 晨,馬 寧,郭春和,袁仁強,曾檢華,宋德清,張惠文,陳瑤生,劉小紅
(1.中山大學生命科學學院/有害生物控制與資源利用國家重點實驗室,廣東 廣州 510006;2.紫金東瑞農(nóng)牧發(fā)展有限公司,廣東 河源 517447;3.廣東壹號食品股份有限公司,廣東 廣州 510620)
藍塘豬(Sus scrofa)屬于典型的華南型品種,中心產(chǎn)區(qū)位于河源市紫金縣藍塘鎮(zhèn),個體毛色以軀體水平上下黑白各占一半為特征,具有體型較小、早熟易肥、性情溫順和耐高溫高濕等特點。由于地理環(huán)境和歷史條件等原因,采用“父老子繼、母死女代、代代相傳”的單傳法,使得藍塘豬長期處于閉鎖選育和高度近交繁殖狀態(tài),從而具有耐近交的特性,遺傳穩(wěn)定性非常高。藍塘豬幾乎不含有歐洲豬種的滲入,并且被認為是美洲豬種中亞洲血緣的主要貢獻品種[1]。藍塘豬還經(jīng)常被用作研究肌肉與脂肪發(fā)育的實驗動物,為基礎(chǔ)科學實驗提供了重要素材[2-4]。
20世紀大量西方瘦肉型豬種被引進我國,使得我國大部分地方豬群體數(shù)量下降,一些品種處于瀕危狀態(tài)甚至滅絕。我國地方豬種遺傳資源保護起步較晚,技術(shù)力量有限,缺乏系統(tǒng)的數(shù)據(jù)管理,出現(xiàn)遺傳多樣性降低和種質(zhì)退化等現(xiàn)象。從DNA水平分析地方豬的種質(zhì)特性和遺傳基礎(chǔ),將有利于種豬遺傳資源的保護和利用[5]。
SNP作為第三代分子標記,在基因組中具有分布廣、數(shù)量多和遺傳穩(wěn)定等特點,被廣泛應(yīng)用于分子鑒定和關(guān)聯(lián)分析等研究。隨著二代測序成本的不斷下降和商業(yè)化SNP芯片的普及,全基因組SNP逐漸被推廣和應(yīng)用到農(nóng)業(yè)動植物的育種實踐工作中。豬的商業(yè)化SNP芯片已經(jīng)有多種,其中應(yīng)用最為廣泛的是Illunima公司的PorcineSNP60芯片和GeneSeek公司的PorcineSNP80芯片。然而,這些芯片并不適合中國地方豬種。目前,豬的SNP芯片主要應(yīng)用在全基因組關(guān)聯(lián)分析和全基因組選擇領(lǐng)域,特別是應(yīng)用在肉質(zhì)[6]、繁殖[7]和生長[8]等性狀,而對地方豬品種的群體結(jié)構(gòu)和保護的研究還比較少。本研究利用Illumina CAUPorince 50K SNP芯片,以一個藍塘豬種豬群體作為研究對象,分析藍塘豬的群體結(jié)構(gòu)并構(gòu)建家系,為地方豬種的保種和利用實踐提供分子水平的參考。
供試的藍塘豬樣品均采自紫金東瑞農(nóng)牧發(fā)展有限公司,共139頭種豬,其中16頭公豬、123頭母豬。121頭種豬具有出生日期和部分系譜記錄,另外18頭種豬(13頭公豬)無任何記錄。采集的樣品均為耳組織,置于75%酒精中,-20℃低溫保存。
1.2.1 SNP芯片分型 DNA提取采用酚氯仿抽提,經(jīng)Nanodrop 2000儀器和0.8%瓊脂糖凝膠電泳檢測DNA質(zhì)量,DNA濃度調(diào)整至50 ng/μL。所有合格的DNA樣品采用 Illumina CAUPorince 50K SNP芯片進行基因型分型,然后按照以下標準進行質(zhì)控:先去除性染色體上的位點,再選擇SNP檢出率大于0.9和最小等位基因頻率大于0.01的位點。
1.2.2 種群親緣關(guān)系分析 利用Plink1.9b軟件[9]對質(zhì)控后的數(shù)據(jù)進行主成分分析(principal component analysis,PCA),采用R軟件繪制第一主成分與第二主成分的二維圖,分析品種內(nèi)的群體結(jié)構(gòu)。采用Gmatix(v2)軟件構(gòu)建群體G矩陣,并繪制熱圖展現(xiàn)種豬之間的遺傳親緣關(guān)系。
1.2.3 遺傳距離分析 在質(zhì)控后的基礎(chǔ)上,進一步去除強連鎖(r2>0.15)位點。使用Plink1.9b軟件計算個體間的遺傳距離(cluster-distance-matrix),構(gòu)建狀態(tài)同源(identity-bystate,IBS)矩陣。通過 MEGA7.0 軟件[10]構(gòu)建鄰接法進化發(fā)育樹(Neighbour-joining tree,NJ tree)。另外,還對16頭種公豬Y染色體上的SNP進行單倍型分型。
1.2.4 ROH分析 使用Plink1.9b軟件進行基因組上長純合片段(runs of homozygosity,ROH)分析,具體參數(shù)如下:20個SNP的滑動窗口沿染色體滑動,每個滑動窗口的雜合子個數(shù)不超過1個。其中涉及的4個重要ROH定義參數(shù):最小長度>10 kb,SNP個數(shù)/ROH>20,最小SNP密度>1 000 kb/SNP。
供試的Illumina CAUPorince 50K SNP芯片共含有43 832個SNP位點。139個個體的基因型檢出率在0.9488~0.9843、平均值為0.9824,表明該款芯片適合分析地方豬種。對139個樣本進行質(zhì)控后,樣本全部合格,剩下28 676個有效SNP進行后續(xù)分析。當除去強連鎖(r2>0.15)位點后,剩余1 962個位點。
為了研究藍塘豬個體間的親緣關(guān)系,將139個樣本的28 676個SNP進行主成分分析。從PCA結(jié)果(圖1)可以看出,整個藍塘豬個體間的親緣關(guān)系不太緊密,表明藍塘豬的遺傳多樣性較高。但在第一主成分中,左側(cè)的個體之間親緣關(guān)系比較緊密,其中公豬之間以及部分母豬與公豬聚集一起,表明這些藍塘豬的親緣關(guān)系較近,可能存在近交的情況。
圖1 藍塘豬種群的主成分分析結(jié)果
為了進一步地分析139頭藍塘豬的親緣關(guān)系,構(gòu)建了G矩陣。從G矩陣的熱圖(圖2,封二)來看,結(jié)果與PCA相似,大部分個體間的親緣關(guān)系呈中等程度,而部分種豬之間親緣關(guān)系較近,表明這些個體之間存在近交趨勢。
圖2 藍塘豬種群的G矩陣熱圖
本研究還比較了139頭藍塘豬之間的遺傳距離,IBS值在0.1566~0.4218之間,平均遺傳距離值為0.3326±0.0339,表明藍塘豬個體之間的遺傳距離較遠,且差異較大。16頭公豬之間的遺傳距離在0.2801~0.3933之間,平均遺傳距離為0.3392±0.0275,表明種公豬之間的遺傳距離均較遠。
由于公豬在建立家系和整個保種群體中均具有極高的重要性,因此本研究選擇16頭公豬的1 962個位點構(gòu)建NJ樹。結(jié)果(圖3)表明,公豬群體主要分成4支,同時結(jié)合G矩陣(>0.1)和遺傳距離(<0.33)結(jié)果,最終從上而下分別命名為家系A(chǔ)、家系B、家系C、家系D,分別有6、4、2、4頭公豬。
圖3 16個藍塘豬種公豬的NJ樹
將16頭公豬Y染色體上的6個SNP位點進行單倍型分析,共發(fā)現(xiàn)兩個單倍型,分別命名為單倍型A和單倍型B(表1)。這兩個單倍型之間存在3個SNP,均屬于A>G轉(zhuǎn)換突變。家系A(chǔ)和家系B的所有個體都屬于單倍型A,而家系C和家系D的所有個體則屬于單倍型B。
表1 藍塘豬種公豬Y染色體單倍型分布
根據(jù)139頭種豬的NJ樹結(jié)果、G矩陣以及遺傳距離,發(fā)現(xiàn)大部分母豬與4個家系的公豬聚集一起,形成4個家系(A、B、C和D)。但是,其中11頭母豬與這些家系個體親緣關(guān)系較遠,則合并構(gòu)建為家系E。
在139頭藍塘豬中共檢測到1 680個ROH片段,其中10~20 Mb長度的ROH數(shù)量最多、占44.52%(圖4)。最短的ROH長度為5.72 Mb,含有100個SNP,位于第8號染色體上;最長的ROH長度為181.42 Mb,含有2 209個SNP,位于13號染色體上。在豬的18條常染色體上,13號染色體上的ROH數(shù)量最多、為189個,18號染色體最少、僅18個。ROH的數(shù)量隨著染色體的長度增加而增多(圖5)。每個藍塘豬個體含有的ROH數(shù)量為2~28個,平均個數(shù)為12.09±5.90,其中含有7~8個ROH的個體數(shù)最多(圖6);每個個體的ROH總長度在19.98~902.89 Mb,平均長度為246.90(±170.93)Mb,個體ROH長度在400 Mb內(nèi)的個體數(shù)最多、占87.05%(圖7)。
圖4 藍塘豬種群的ROH長度分布
圖5 藍塘豬染色體上ROH數(shù)量分布
圖6 藍塘豬個體ROH數(shù)量的樣本數(shù)分布
圖7 藍塘豬個體ROH長度的樣本數(shù)分布
利用全基因組SNP標記可以對遺傳多樣性和群體結(jié)構(gòu)進行科學評估,從分子水平上客觀反映群體內(nèi)或群體間的遺傳差異。目前,市場上最常用的是豬60K SNP芯片,而這款芯片在染色體上分布的均勻性不高,大量位點在基因組上的位置不詳,并且對中國地方豬中的基因型分型效率較低。因此,盛中華等[11]采用簡化基因組方法分析上海白豬種群,發(fā)現(xiàn)上海白豬的遺傳多樣性比西方豬種和太湖豬種都要高,并且與西方豬種的遺傳距離較太湖豬種更接近,印證了上海白豬是一個獨立的品種。由于SNP芯片成本比簡化基因組低,因此本研究利用由中國農(nóng)業(yè)大學開發(fā)的Illumina CAUPorince 50K SNP芯片,此芯片在中外多個豬種多組學數(shù)據(jù)的基礎(chǔ)上,加入了我國地方豬種特有的SNP以及重要經(jīng)濟功能基因候選位點。本次藍塘豬樣本的基因型分型率較高,表明該款SNP芯片非常適合我國地方豬種,為我國地方豬種選育和新品種培育提供了有效途徑。
在畜禽的保種和育種過程中,關(guān)鍵在于生產(chǎn)記錄和系譜的管理。在實際生產(chǎn)操作中,由于配種、產(chǎn)仔、數(shù)據(jù)錄入以及人為因素等,通常會造成系譜錯誤,從而使得品種保護與利用效果降低。研究表明,世界范圍內(nèi)的奶牛系譜錯誤率約為 11%[12]。張哲等[13]利用 SNP芯片對一個杜洛克豬群體進行親子鑒定,發(fā)現(xiàn)其系譜的錯誤率高達6%。由于條件有限,我國很多地方豬品種的系譜通常記錄不完全甚至無系譜。在本研究的藍塘豬豬場內(nèi),公豬僅有3頭具有系譜來源;母豬的完整性相對較好,56%的個體具有其父母本和血統(tǒng)來源的記錄。地方豬的保種來源主要從不同農(nóng)戶搜集而來,難以得到準確的個體信息。利用SNP標記鑒定二代和三代以內(nèi)豬的血緣關(guān)系與系譜記錄可以達到完全一致[14]。本研究通過SNP芯片分析,139頭藍塘豬種群可以分為5個家系,其中4個家系均含有種公豬,共有2個父系起源。根據(jù)當前的群體結(jié)構(gòu)分析結(jié)果,不同家系的個體數(shù)量和近交程度不均衡。在一定的保種成本下,需要合理安排各個家系種豬的配種和數(shù)量。保種場內(nèi)的存欄公豬的正常使用率往往較低,可以通過SNP芯片進行基因型分型,鑒定親緣關(guān)系后,構(gòu)建種公豬的凍精庫,從而降低遺傳資源的保種費用。
動物保種和育種的主要目標在于維持種群遺傳多樣性的最大化,從而減少近交導致的有害基因積累的效應(yīng),保證群體生存適應(yīng)能力,同時具有足夠多的目標性狀變異可供選擇,為今后的育種提供遺傳素材。當藍塘豬的平均近交系數(shù)達到26.7%水平時,對品種特征、繁殖力、仔豬出生重以及成活率均無不良影響[15]。本研究中的藍塘豬群體,從PCA和G矩陣結(jié)果發(fā)現(xiàn),群體中一部分種豬個體之間親緣關(guān)系非常近,可能存在近交的可能。牛榮等[16]利用微衛(wèi)星標記,發(fā)現(xiàn)近交系版納小耳豬近交系的遺傳距離在0~0.2766之間,本研究藍塘豬群體的遺傳距離比該近交系高,表明藍塘豬的近交程度相對較低。但是,這兩個品種均有較小的遺傳距離,也存在較大的基因組成差異。李凱等[17]研究發(fā)現(xiàn)五指山豬近交系的基因純合度隨著近交世代數(shù)增加而遞增,達到18個世代時,仍有約43%的基因座呈現(xiàn)較高水平的多樣性,推測與這些基因座緊密連鎖的功能基因在高度近交水平下具有維持生存能力的關(guān)鍵作用。
ROH是個體基因組內(nèi)純合基因型的連續(xù)片段,其長度和頻率可以反映群體歷史,片段越長近交的可能性越高。Bosse等[18]對歐亞家豬和野豬基因組中的ROH進行比較分析,發(fā)現(xiàn)亞洲豬種比歐洲的ROH數(shù)量少且總長度短。另外,還發(fā)現(xiàn)用Illumina porcine 60K SNP芯片能夠檢測到大于5 Mb的ROH,并且認為分析5 Mb以上的ROH時,60K SNP芯片與全基因組重測序結(jié)果一樣準確。本試驗中,藍塘豬的ROH最短長度為5.72 Mb,表明本結(jié)果得到的ROH 具有較高的可靠性。藍塘豬中ROH的數(shù)量與染色體的長度呈正相關(guān),但是研究表明ROH的數(shù)量和大小與染色體的位置也有關(guān),端粒區(qū)域由于重組率較高而含有較少的ROH,在染色體中部卻更容易產(chǎn)生長片段的ROH[19-20]。全基因組重測序比較瀕危豬種Sus cebifrons和商業(yè)豬種皮特蘭,發(fā)現(xiàn)在較小群體中ROH片段的增加更容易引起有害等位基因表達的風險[21]。利用豬的60K SNP芯片對華南地方豬進行分析,發(fā)現(xiàn)藍塘豬處于較高的連鎖不平衡狀態(tài),相鄰SNP間的r2為0.285,有效群體大小從1 092世代前的1 476頭下降到2世代前的14頭,表明受到了較強的人工選擇[22]。本研究中的藍塘豬群體只有2個父系起源,每個家系種群個體數(shù)量較少,且小部分個體的ROH片段總長度達到了800~900 Mb以上。因此,在藍塘豬的保種過程中,需要對種群中一些個體進行合理選配,以保證藍塘豬遺傳資源的多樣性。