王宏浩,任小康,張 毅,高會江,車雷杰,王 曦*
(1.山西農(nóng)業(yè)大學動物科學學院,太原 030032; 2.中國農(nóng)業(yè)大學動物科技學院,北京 100193;3.國家肉牛遺傳評估中心,北京 100193; 4.運城市國家級晉南牛遺傳資源基因保護中心,運城 044000)
晉南牛是我國優(yōu)秀的地方黃牛品種,為我國黃牛五大地方品種之一[1]。晉南牛體型高大粗壯,肌肉發(fā)達,前軀和中軀發(fā)育良好,耐熱、耐苦、耐勞、耐粗飼,其飼料利用率和屠宰率均表現(xiàn)優(yōu)異,具有良好的肉用性能,是向?qū)iT化肉牛品種方向選育潛力較大的地方黃牛品種之一[2]。但隨著外來品種的不斷引進及與本地黃牛雜交,致使晉南牛群體數(shù)量急劇下降[3]。因此,對晉南牛開展科學的保種十分必要。
基因芯片技術的發(fā)展是典型的多學科互作和多種新技術應用的結(jié)果,目前已在多個領域內(nèi)被證實高效簡便,特別是在基因表達和基因診斷方面都已表現(xiàn)出很大的效用[4]。2009年,第一款用于牛基因組檢測的芯片Bovine 50K SNP誕生,推動芯片技術在基因組學方面的廣泛應用[5]。近年來,隨著基因分型技術的日益成熟,越來越多的基因芯片被開發(fā)并用于肉牛的育種中。為了提高基因芯片對育種值估計的準確性,研究人員結(jié)合相關性狀的表型數(shù)據(jù)進行位點分析[6]。Gao等[7]對海福特與安格斯牛的采食效率性狀候選基因進行了注釋,找出63個與該性狀相關的SNPs位點,這些位點可用于后期基因芯片的設計,提高育種值估計準確率。因此,基因芯片技術將改變傳統(tǒng)的育種工作模式,使得畜禽遺傳育種工作變得高效、簡單、快速、精確[8]。
本研究對種公牛全基因組進行基因芯片檢測,應用基因芯片數(shù)據(jù)對晉南牛群體與其它群體之間進行遺傳聚類分析,包括Structure分析、PCA分析以及NJ樹分析[9-10],同時對晉南牛后備公牛進行遺傳評估,以期進行分子水平輔助選育,加快晉南牛向肉用型品種方向發(fā)展,不斷提高晉南牛的生產(chǎn)性能。
分別采集荷斯坦牛、利木贊牛、西門塔爾牛、延邊牛、和順肉牛各10頭及25頭晉南牛血液2 mL,冰盒中運輸,保存于-20 ℃冰箱,用于DNA提??;自晉南牛保種場采集25頭晉南牛后備公牛體尺及生長性能數(shù)據(jù)。
用天根血液基因組DNA提取試劑盒提取基因組DNA,用AstraGeneAstraNet核酸分析儀測定DNA濃度和純度,根據(jù)DNA芯片雜交平臺的要求,合格的DNA濃度須大于50 ng·μL-1,OD260 nm/OD280 nm指標范圍為1.6~2.0,OD260 nm/OD230 nm指標范圍為1.8~2.1。為確保DNA的濃度,每一個提取的樣本DNA連續(xù)測定3次,取平均值,不合格的樣本需要濃縮或者重新提取DNA,直至樣本的濃度和純度都滿足后續(xù)分型試驗的要求。
待DNA樣品全部合格后,由上海紐勤生物科技有限公司用Illumina Ovine SNP 50K芯片進行分析獲得SNP分型數(shù)據(jù)。
采用Genome Studio軟件對數(shù)據(jù)進行篩選并對SNP等位基因頻率進行分析,剔除所有未定位的SNPs位點,用Plink軟件進行質(zhì)量控制。質(zhì)量控制的標準為:檢出率大于0.9,最小等位基因頻率大于0.01,哈迪溫伯格平衡P值大于0. 000 001。
在聚類分析之前,用Plink軟件中的indep-pairwise選項刪除連鎖緊密的SNPs位點(參數(shù)設置為:窗口值為25個SNPs,一個步長為5個SNPs,R2的閾值設置為0.05)?;贗llumina 50K SNP芯片數(shù)據(jù),采用聚類法和主成分分析法研究了晉南牛與部分其它中國牛品種的遺傳關系。PCA(principle component analysis)即主成分分析,將多因素經(jīng)轉(zhuǎn)換,變?yōu)樯贁?shù)幾個起主要作用的因素,這些因素也稱主成分,一般取前3個主成分,此時的前3個主成分所解釋的變異最多,使用R語言的snpstats包分析。運用STRUCTURE 2.3.4軟件構(gòu)建群體結(jié)構(gòu),有6個群體用于Structure分析,每兩條加粗黑線之間的個體來自同一群體。K=n(n=2、3)將6個 群體劃分為n類,同時n也代表了顏色的種類,不同顏色代表了所含血統(tǒng)比例。
基于個體全基因組標記,采用個體聚類的方法構(gòu)建鄰接樹(neighbor-joining tree, NJ樹)。NJ樹的構(gòu)建使用MEGA 7.0.21進行。
基于Illumina 50K全基因組標記檢測結(jié)果,估計25個樣本間的基因組親緣關系。采用Purcell提出的矩量法(the method of moments,MoM)估計等位基因同源相同概率(identity by descent,IBD),進而計算個體基因組親緣系數(shù)。如果是基因組完全相同的個體,親緣系數(shù)接近1,全同胞和親子關系接近0.5,半同胞及直系祖孫關系約為0.25。
依據(jù)測得的原始數(shù)據(jù)及參數(shù)文件,運用Genomestudio軟件對基因數(shù)據(jù)進行分型,得到驗證群體初級基因型文件Full Data Table。然后選擇胴體性狀作為目標性狀與西門塔爾牛資源群原始數(shù)據(jù)比對SNP位點,以這些共有位點進行分析,胴體重作為表型數(shù)據(jù),進行BLUP,得到參考群體的個體育種值,同時得到每個位點的效應值數(shù)據(jù),計算所用軟件為Plink和BayesB。然后,利用參考群體的位點效應值數(shù)據(jù)及驗證群體的基因型文件,對驗證群體(晉南牛、西門塔爾牛)分別進行育種值估計,輸出結(jié)果,計算所用軟件為Plink。
為研究荷斯坦牛、利木贊牛、西門塔爾牛、延邊牛、和順肉牛及晉南牛品種之間的遺傳結(jié)構(gòu),首先做PCA分析(圖1),不同顏色的點代表不同的群體,藍色代表荷斯坦牛,紅色代表延邊牛,紫色代表利木贊牛,灰色代表晉南牛,綠色代表西門塔爾牛,粉色代表和順肉牛。PC1軸可以將6個群體分為兩類,即荷斯坦牛為一類,其余5個群體為一類。PC2軸進一步將延邊牛、晉南牛分為一類,利木贊牛、西門塔爾牛、和順肉牛分為一類。
圖1 主成分(PC)1、2對試驗個體進行聚類的散點圖Fig.1 Scatter diagram of principal component (PC) 1 and 2 clustering test individuals
每兩條加粗黑線之間的個體來自同一群體,在本研究中共有6個群體用于Structure分析,經(jīng)過計算得出最佳的K值為3。
K=n(n=2、3)將6個群體劃分為n類,同時n也代表了顏色的種類,不同顏色代表了所含血統(tǒng)比例。當K=2時,6個群體可以劃分為兩個亞群,即荷斯坦牛為一亞群,其余5個群體為另一亞群。當K=3時,6個群體可以劃分3個亞群,即荷斯坦牛為一亞群,利木贊牛、西門塔爾牛和和順肉牛為同一亞群,晉南牛、延邊牛為同一亞群(圖2)。
圖2 6個牛品種K=2~3時的Structure結(jié)果Fig.2 Population Structure result of 6 cattle breeds with K=2-3
NJ圖中的同一種顏色代表同一個群體,每個群體應單獨成一簇,而西門塔爾牛和和順肉牛并沒有分開,而是在同一簇中,表明兩個群體之間的關系非常接近。
經(jīng)過聚類分析可知,荷斯坦牛與其他牛種間的血統(tǒng)關系相差較遠;晉南牛與延邊牛親緣關系較近,但仍舊可以區(qū)分為單獨種群;而利木贊牛、西門塔爾牛和和順肉牛中,利木贊牛在PCA分析中可以與其他牛種分出差距,但是西門塔爾牛和和順肉牛始終無法分離,證明它們之間關系較近(圖3)。
圖3 6個牛種的NJ樹Fig.3 Neighbor joining(NJ) tree for 6 cattle breeds
本研究共獲得33 200個SNPs標記,對比不同公牛間等位基因的差異,計算其親緣系數(shù)。不同公牛對應關系如圖4所示。
在熱圖(圖4)中,白色的方塊表示對應的兩個個體間根據(jù)計算具有親緣關系,方塊越亮說明親緣關系越接近,從檢測結(jié)果及圖示中可以看出,JN01、JN03、JN05號為同一個家系, JN02、JN06、JN07、JN08、JN09、JN14、JN17、JN18、JN20、JN24、JN25為同一個家系,JN04、JN23、JN15為同一個家系,JN16、JN19為同一個家系,JN21、JN22為同一個家系,其余個體之間近交系數(shù)小。
圖4 晉南牛個體間親緣關系熱圖Fig.4 Heat map of kinship among individuals of Jinnan cattle
因此在選擇公牛過程中,盡可能在同一個家系中僅選擇一頭公牛,這樣不僅可以避免近交,而且可以有效的保存晉南牛的全部基因組,有效的提高晉南牛保種的效率。
利用Genomestudio軟件對基因數(shù)據(jù)進行分型,得到50個個體的初級基因型文件Full Data Table,共54 610個 SNPs位點,該樣本群體作為驗證群體。對參考群體和驗證群體的SNP位點進行查找,找到36 012個共有位點,以這些共有位點為基礎進行分析,估計出育種值。
“倍數(shù)性狀標準差”的順序排名可以對公牛的胴體重進行評估排名,計算結(jié)果如表1所示。
從基因組的角度來看,JN23的胴體重倍數(shù)性狀標準差最大,從基因組水平可以選擇作為肉用種公牛。
倍數(shù)性狀標準差是一個可以推算育種值的沒有單位的數(shù)值,其大小可以反映胴體重育種值的大小,因此,其數(shù)值的大小可以反映牛的遺傳潛力,對公牛進行很好的遺傳評估,負值說明其胴體重性狀遺傳潛力底于平均水平。
根據(jù)芯片數(shù)據(jù),對牛瓜氨酸血癥(citrullinemia,CN)、尿苷酸酶缺乏癥(deficiency of uridine monophophate synthase,DUMPS)、紅細胞生成性卟啉癥(erythropoietic protoporphyria,EPP)、凝血因子缺乏癥(factor deficiency)、牛蜘蛛腿綜合征(arachnomelia syndrome, AS)、白細胞粘附缺陷病(BLAD)、脊椎畸形綜合征(complex vertebral malformation,CVM)、牛頭犬癥(bulldog,BD)、無毛癥(hairless,HL)、并蹄癥(mulefoot,MF)、粉齒癥(pink tooth,PT)、皮膚缺陷癥(imperfect skin,IS)、侏儒癥(dwarfism,DF)等疾病的隱性基因沒有檢出。
對公牛體尺及生長性能進行測量,并根據(jù)地方標準《晉南?!?DB14/T810)24月齡體重等級對群體進行評價,分為特級(24月齡體重≥490 kg)、一級(450 kg ≤24月齡體重<490 kg)、二級(410 kg≤24月齡體重<450 kg)、三級(24月齡體重<410 kg)。
根據(jù)近交系數(shù)、遺傳評估與24月齡重進行綜合評定(表2),最終選擇JN07、JN23、JN05、JN08、JN02、JN13、JN19、JN14為晉南牛種公牛。
表2 種公牛綜合評定
晉南牛作為我國五大良種黃牛之一,具有良好適應性、耐粗飼、抗病力強等特點。然而隨著外來牛種的引入,加速了晉南牛被國外專門化肉牛品種的雜交改良。同時,因農(nóng)業(yè)機械化水平的不斷提高,晉南牛不再用于使役,以個體農(nóng)戶養(yǎng)殖為主體的養(yǎng)殖模式也逐漸退出歷史,純種晉南牛數(shù)量越來越少。2013年山西省農(nóng)業(yè)廳對晉南牛品種進行了調(diào)研,結(jié)果表明,全省的晉南牛數(shù)量不足萬頭,品種保護已刻不容緩。2013牛7月3日,農(nóng)業(yè)部正式授予運城市黃牛場為國家級畜禽遺傳資源保種場,用于晉南?;虮4婕盎铙w保種。
本研究應用50K?;蚪M芯片檢測了運城市黃牛場25頭晉南牛后備公牛與荷斯坦牛、利木贊牛、和順肉牛、延邊牛、西門塔爾牛等各10頭,遺傳聚類分析發(fā)現(xiàn),晉南牛在遺傳聚類中可單獨聚為一類,在遺傳結(jié)構(gòu)上不同于國內(nèi)與國外的牛群,其種質(zhì)資源獨特,為晉南牛保種提供了理論支持與依據(jù)。王曦等[11]通過微衛(wèi)星標記法分析了晉南牛、郟縣紅牛、魯西黃牛和秦川牛的群體遺傳關系,發(fā)現(xiàn)晉南牛在選育過程中比較封閉,與其他牛種間的血緣沒有過多的交叉,具有典型的地域局限性,因此保留了群體遺傳特性上的獨立性。雷初朝等[12]通過mtDNA對我國8個黃牛品種進行了研究,發(fā)現(xiàn)在系統(tǒng)進化樹上晉南牛可獨自形成一支。這些研究均應用了現(xiàn)代化基因標記的聚類分析法,為畜禽資源的保種提供了理論支撐。Pham等[13]利用分子標記研究越南地方牛的遺傳多樣性,對6個類群從遺傳結(jié)構(gòu)上進行分類分群,應用于輔助保種,大大提高了效率的同時節(jié)約了成本。Utsunomiya等[14]利用AFLP遺傳標記研究了西亞與南亞的瘤牛、水牛及已經(jīng)滅絕的歐洲野牛牛群的遺傳結(jié)構(gòu),指導牛群的保種,實現(xiàn)了寶貴遺傳資源的延續(xù)。Acosta等[15]對古巴5個牛群的遺傳結(jié)構(gòu)進行了微衛(wèi)星標記分析,結(jié)果表明,5個 牛群可以分成兩個大群,使保種的目標更加明確有效,對于畜種的全基因組保存起到重要的科學指導作用。Armstrong等[16]利用分子標記對烏拉圭牛與美洲牛群進行了遺傳結(jié)構(gòu)比較,發(fā)現(xiàn)由于牛群的發(fā)展歷史、有效群體大小的改變,遺傳漂變等可能引起群體的遺傳變異,最終使得烏拉圭牛有別于美洲牛,因此證明了對烏拉圭牛進行保種的重要意義。Michailidou等[17]利用基因芯片研究了兩個本地西臘羊群體之間的遺傳差異性,從而為保種提供了理論依據(jù)。Mdladla等[18]利用基因芯片對南非本地羊進行了群體遺傳結(jié)構(gòu)與連鎖不平衡分析,挖掘群體間的遺傳差異,為南非羊的雜交改良與遺傳資源的有效利用提供了理論指導。Lwin等[19]利用50K芯片分析了緬甸5個本地牛群體及越南4個牛群體,證明了群體之間的遺傳差異性,為不同區(qū)域牛的雜交改良提供了有效的依據(jù)。
本研究應用基因芯片進行晉南牛后備公牛間近交系數(shù)的計算,確定不同的家系,最終在不同家系中選擇留種公牛,對晉南牛公牛進行選種及家系的建立起到了重要的輔助選擇的作用。劉家鑫等[20]基于Illumina Ovine SNP50K芯片對來自10個綿羊群體共440個個體進行全基因組長純合片段(runs of homozygosity,ROH)檢測,統(tǒng)計ROH在不同綿羊群體中的數(shù)目、長度及頻率,根據(jù)ROH計算基因組近交系數(shù),該研究結(jié)果不僅能夠反映不同綿羊群體的近交情況,還能鑒定一些與綿羊經(jīng)濟性狀相關的基因,為綿羊標記輔助選擇提供候選基因,同時也能為改進育種規(guī)劃和畜禽遺傳資源保種提供參考依據(jù)。Zhang等[21]利用50K芯片及測序數(shù)據(jù)研究荷斯坦奶牛,評估個體間的純合度及近交水平,從而指導人工授精與選種選配。吳林慧等[22]利用Porcine 80K SNP芯片,通過計算親緣系數(shù)、近交系數(shù)、連鎖不平衡程度與有效群體大小等群體遺傳學層面的參數(shù),評估恩施黑豬種群結(jié)構(gòu)關系,親緣系數(shù)的計算發(fā)現(xiàn),咸豐縣恩施黑豬個體間平均親緣系數(shù)為0.12,近交系數(shù)計算表明,16%的樣本近交系數(shù)大于0.125,存在明顯近交累積,為恩施黑豬保種與選育提供輔助。楊湛澄等[23]利用高密度SNP標記分析中國荷斯坦?;蚪M近交,結(jié)果共檢測到44 676個 ROH片段,其長度主要分布在1~10 Mb之間,不同長度的ROH散布于個體基因組內(nèi),短ROH較長ROH更為常見,ROH在染色體上并非均勻分布,ROH頻率最高的區(qū)域為10號染色體中部。兩種基因組近交系數(shù)之間相關性很高(91%以上),但基因組近交與系譜近交之間的相關性較低(低于50%)。Kim等[24]利用50K芯片對北美荷斯坦牛的研究發(fā)現(xiàn),ROH在不同群體中的分布也存在一定的差異,這反映了群體的基因組特征。師睿等[25]利用SNP芯片信息評估新疆近交?;蚪M純合度,結(jié)果顯示,新疆近交牛的遺傳背景與哈薩克?;疽恢拢慌;蚪M純合程度明顯高于其他群體,且基因純合率越高的近交牛體型越小,在一定程度上呈現(xiàn)了近交衰退對體型的影響,證明近交可引起品種衰退,應用分子輔助選擇可避免近交的發(fā)生[26]。
本研究應用中國肉牛遺傳評估中心肉牛數(shù)據(jù)庫,結(jié)合晉南牛50K芯片檢測結(jié)果,對晉南牛后備公牛進行胴體重育種值評估,輔助選出育種值高的種公牛,提高了選擇的準確性,同時大大節(jié)約了時間與成本,可以加快晉南牛的遺傳進展。鄭偉杰等[27]指出,在傳統(tǒng)的奶牛育種中優(yōu)秀種公牛需要經(jīng)過后裔測定進行選擇,其選擇準確性高,但周期長、育種成本高、效率較低。進入21世紀以來,基于基因組高密度標記信息的基因組選擇技術成為了動物育種領域的研究熱點。利用基因組選擇技術,不必通過后裔測定就可實現(xiàn)青年公牛早期準確選擇,從而大幅度縮短世代間隔,加快群體遺傳進展,并顯著降低育種成本。自2008年始,歐美主要發(fā)達國家就將基因組選擇技術全面應用于奶牛育種中,世界范圍內(nèi)奶牛育種工作進入了基因組選擇時代。Rolf等[28]利用Illumina BovineHD基因芯片對3 240頭多品種肉牛群體進行基因分型,并對6個肉質(zhì)性狀的基因組估計育種值進行預測,結(jié)果表明,預估準確性在0.40~0.78之間。Abo-Ismail等[29]對海福特牛與安格斯牛的采食效率性狀候選基因進行注釋,發(fā)現(xiàn)了63個與該性狀關聯(lián)的SNPs位點,結(jié)果表明,這些SNPs位點可解釋6個采食效率性狀0.05%~0.13%的遺傳率,這些位點可用于全基因組選擇低密度SNP芯片的設計。Ortega等[30]將篩選出的69個 與荷斯坦母牛繁殖性狀相關的位點添加到商業(yè)基因芯片中進行基因組預測,結(jié)果表明,在基因芯片中添加事先篩選的位點可提高繁殖性狀基因估計育種值可靠性的2.76%。我國自2012年開始在全國實施荷斯坦青年公牛基因組遺傳評估。張金鑫等[31]利用基因組選擇技術進行北京地區(qū)大白豬基因組聯(lián)合遺傳評估,并實施基因組選擇分子育種,預測了剛出生的小公豬基因組估計育種值,提高了選種準確性。劉冉冉等[32]研究表明,雞基因組SNP芯片在基因組選擇育種、種質(zhì)資源多樣性分析、親緣關系鑒定、基因組關聯(lián)研究、基因定位等方面可發(fā)揮重要作用。齊欣[33]針對6個肉質(zhì)性狀及3個胴體性狀,利用 Illumina BovineHD 對西門塔爾牛進行全基因組關聯(lián)分析,檢測了低密度芯片對脂肪酸含量性狀基因組預測的準確性,研究表明,篩選標記低密度芯片準確性明顯高于均勻分布低密度芯片,具有開發(fā)潛力。劉天飛等[34]利用Illumina雞60K SNP芯片針對2個生長性狀和3個屠體性狀,采用基因組最佳線性無偏預測模型(GBLUP)、貝葉斯LASSO模型和貝葉斯Mixture模型等3種基因組育種值估計模型與傳統(tǒng)育種值估計模型估計育種值。
在分子生物學發(fā)展的今天,動物育種依然離不開傳統(tǒng)的表型選擇。傳統(tǒng)選擇方法比較成熟,在畜禽遺傳進展的研究中發(fā)揮了很大的作用,在現(xiàn)階段,現(xiàn)代化的分子選育只是一種輔助手段。本研究中應用了傳統(tǒng)的體型評分,對公牛表型的傳統(tǒng)選擇使得對晉南牛的公牛選擇更加準確。采用分子輔助選育可以早期高效對一些限性性狀進行選擇,節(jié)約大量的成本。同時,由于人工授精技術的使用,使得公牛精液應用更快更廣,因此,提高種公牛選擇的準確性可以起到事半功倍的效果。
本研究通過基因芯片檢測,對晉南牛和其他牛種進行了遺傳聚類分析,證明了晉南牛在分子遺傳結(jié)構(gòu)上的獨特性,為晉南牛保種提供了理論依據(jù);對晉南牛后備公牛進行了遺傳評估、近交家系分析、傳統(tǒng)表型選擇及遺傳疾病檢測,最終選出的留種種公牛為JN07、JN23、JN05、JN08、JN02、JN13、JN19、JN14,通過多種選育方法結(jié)合,提高了公牛的選擇準確性,為晉南牛的群體選育提高奠定了基礎。