師睿,張毅,王雅春,黃濤,盧國昌,岳濤,盧振西,黃錫霞,衛(wèi)新璞,馮書堂,陳軍,烏蘭·卡格德爾,茹先古麗·阿不力孜,努爾胡馬爾·木合塔爾
研究報告
利用SNP芯片信息評估新疆近交?;蚪M純合度
師睿1,張毅1,王雅春1,黃濤2,盧國昌3,岳濤4,盧振西3,黃錫霞5,衛(wèi)新璞6,馮書堂7,陳軍8,烏蘭·卡格德爾8,茹先古麗·阿不力孜8,努爾胡馬爾·木合塔爾8
1. 中國農業(yè)大學動物科技學院,農業(yè)農村部動物遺傳育種與繁殖(家畜)重點實驗室,畜禽育種國家工程實驗室,北京 100193 2. 新疆石河子大學動物科學技術學院,石河子 832000 3. 新疆錦盛旺農業(yè)科技有限公司,塔城 834700 4. 新疆塔城地區(qū)畜牧科技研究推廣中心,塔城 834700 5. 新疆農業(yè)大學動物科學學院,烏魯木齊 830052 6. 新疆呼圖壁種牛場有限公司,昌吉 831100 7. 中國農業(yè)科學院北京畜牧獸醫(yī)研究所,北京 100193 8. 新疆維吾爾自治區(qū)畜牧總站,烏魯木齊 830009
新疆近交牛是經45年近親繁育形成的近交群體,但由于繁育記錄缺失,其原始親本品種未知。為了明確新疆近交牛的遺傳背景,并探索利用基因組信息評價牛群近交水平的可行性,本研究利用該群體及荷斯坦牛、新疆褐牛和哈薩克牛等16個國內外牛品種的SNP芯片數(shù)據(jù),應用主成分分析和Admixture方法對塔城地區(qū)新疆近交牛的群體結構進行分析;通過進一步計算新疆近交牛、荷斯坦牛、新疆褐牛和哈薩克牛的群體遺傳學參數(shù)以及基因組近交指標評估各群體近交程度;結合新疆近交牛的體型分類和基因組近交指標信息,探討了個體近交程度與體型表現(xiàn)的關系;最后,基于對新疆近交牛和哈薩克牛高頻長純合片段區(qū)域的篩選,鑒定了新疆近交?;蚪M特征區(qū)域。研究結果顯示,新疆近交牛的遺傳背景與哈薩克牛基本一致,近交牛基因組純合程度明顯高于其他群體,且基因純合率越高的近交牛其體型越小,在一定程度上呈現(xiàn)了近交衰退對體型的影響。本研究還鑒定到與新疆近交?;蚪M特征區(qū)域相關的6個基本生物學通路以及與重要經濟性狀相關的32個數(shù)量基因座(quantitative trait loci, QTL)。本研究結果為新疆近交牛這一特殊遺傳資源的育種規(guī)劃及未來該群體的開發(fā)利用提供了科學依據(jù)。
新疆近交牛;群體結構;基因組近交;長純合片段
近交群體的形成是由于群體內具有血緣關系的個體進行了交配,致使其后代基因純合性增加。但隨近交程度的增加,隱性致病基因的純合概率也會上升,因此近交往往伴隨著后代各種性狀表型衰退,即近交衰退[1]。當群體連續(xù)20代以上進行親子交配或全同胞交配后,近交系數(shù)可達99.8%以上,群體內基因達到高度純合并且穩(wěn)定時,該群體可稱為近交系。我國已成功育成小鼠()、雞()和豬()等近交系動物,但由于牛()的世代間隔長、繁殖效率低、育種成本高等原因,近交系牛罕有報道。
1974年,新疆塔城地區(qū)某家庭牧場以1頭母牛和其子開始了近交牛培育,隨后一直采用母子、父女及兄妹交配等高度近交的繁育模式,通過45年的封閉近親繁育,形成了現(xiàn)有100頭規(guī)模的近交群體。該牛群個體間在體型、生產性能等方面有很高的相似性,雖然與塔城地區(qū)哈薩克牛相比,生長較慢且體型較小,但是在惡劣的生存環(huán)境下能保持較正常的繁殖性能和生活力。馬力鵬等[2]使用微衛(wèi)星技術對該群體展開了鑒定研究,發(fā)現(xiàn)該群體具有較高純合度,為遺傳純度較高的近交群體;經過當?shù)乜萍季骤b定,2018年該群體被命名為新疆近交牛。但由于最初的繁育記錄缺失,無法追溯和確認該群體原始親本的品種。
近年來,高密度單核苷酸多態(tài)性(single nucleo-tide polymorphism, SNP)芯片被廣泛應用于群體遺傳學研究?;蚪MSNP能準確解析群體的遺傳構成,以確定未知群體的品種來源[3]。如Gao等[4]利用SNP信息解析了中國不同品種牛只的血統(tǒng)組成。利用標記間的連鎖不平衡(linkage disequilibrium, LD)程度,高密度SNP可以估計有效群體大小(effective po-pulation size,N)等群體遺傳學參數(shù)[5];利用標記純合度能夠準確地反映個體真實基因組純合度和分子近交水平,且較傳統(tǒng)的系譜估計更加準確[6,7]。另外,基因組的長純合片段(runs of homozygosity, ROH)也在多個物種的研究中[8~10]被用于定位功能基因和數(shù)量性狀基因座(quantitative trait loci, QTL)。Kim等[8]對北美荷斯坦牛的研究發(fā)現(xiàn),不同群體的ROH分布存在一定差異,能夠反映群體的基因組特征。
本研究以國內外有代表性的牛品種為參考,對新疆近交牛進行遺傳背景分析,并進一步使用多種群體遺傳學指標,比較新疆近交牛、哈薩克牛(塔城)、新疆褐牛和荷斯坦牛之間的近交程度;通過篩選群體高頻ROH位點,以尋找新疆近交牛基因組特征區(qū)域,旨在從多個角度對新疆近交牛進行遺傳學分析,并為其繁育及未來群體的保護和利用提供科學依據(jù)。
近交牛樣本來自新疆塔城市恰夏鎮(zhèn),散養(yǎng)且與其他牛群無遺傳交流。本研究選擇牛群中健康且大于12月齡的牛69頭,測量體高、體斜長、胸圍和管圍等表型指標,采集靜脈血。
為了便于群體間比較,本研究還采集了20頭哈薩克牛(塔城)及50頭新疆褐牛的樣本,來源分別為新疆塔城市恰夏鎮(zhèn)隨機農戶和新疆塔城種牛場。
采用GeneSeek Genomic Profiler (GGP) Bovine 50K芯片檢測該新疆近交牛及哈薩克牛(塔城)樣本。采用GeneSeek GGP Bovine 150K芯片測定新疆褐牛樣本,50頭隨機選取的荷斯坦牛150K芯片數(shù)據(jù)來自中國奶?;蚪M評估平臺數(shù)據(jù)庫(數(shù)據(jù)未發(fā)表)。
此外,本研究通過整合已發(fā)表的數(shù)據(jù),形成不同的群體組合共4個數(shù)據(jù)集用于新疆近交牛的基因組分析,具體信息見表1。
數(shù)據(jù)集1用于分析新疆近交牛的遺傳背景,包括本研究所檢測的3個群體、荷斯坦牛以及已發(fā)表的國內外代表性牛品種12個,共310頭牛。為了使各品種樣本數(shù)均衡,避免樣本量差異對結果的影響,本研究從新疆近交牛、荷斯坦牛和新疆褐牛群體中各隨機挑選20個樣本進行Admixture分析。使用PLINK v1.90[13]進行質量控制,標準如下:最小等位基因頻率≥0.05,個體基因型缺失率<10%,標記基因型缺失率<10%,哈迪–溫伯格檢驗顯著性> 10E-05,然后保留16個牛群共享的位點。質量控制后保留常染色體上共9476個SNP。
數(shù)據(jù)集2用于新疆近交牛的基因組近交程度分析,包括新疆近交牛、哈薩克牛(塔城)、新疆褐牛和荷斯坦牛共170頭。數(shù)據(jù)質量控制標準同上。另外,為保證各群體的SNP密度相同,本研究將荷斯坦牛和新疆褐牛的SNP位點進行了篩選,僅保留了與新疆近交牛和哈薩克牛(塔城)共享的位點,最終保留了常染色體上共33,590個SNP。
數(shù)據(jù)集3用于近交衰退分析,僅包含新疆近交牛,質量控制過程和保留的SNP數(shù)量與數(shù)據(jù)集2相同。分析中將該數(shù)據(jù)集劃分為兩個子集分別分析。
數(shù)據(jù)集4用于基因組特征區(qū)域分析,是在數(shù)據(jù)集2的基礎上保留了新疆近交牛和哈薩克牛(塔城),經過相同的質量控制過程后,保留了常染色體上40,723個位點。
1.3.1 新疆近交牛群體遺傳學分析
本研究使用主成分分析(principal component analysis, PCA)以及Admixture1.3軟件[3]分析遺傳背景結構。Admixture采用非監(jiān)督型算法,設定祖先血統(tǒng)數(shù)量=2~5。使用PLINK計算4個群體LD指標2[14]。依據(jù)各標記間的距離(0~10 Mb),計算不同標記距離下2的均值,以展示不同群體LD的衰減程度。使用SNeP軟件[15]中的Sved方法[16],基于LD的信息對4個群體的N進行估計。
表1 本研究使用的各樣本數(shù)據(jù)
*新疆近交牛群體總數(shù)為69頭(≥12月齡),其中≥24月齡的個體數(shù)量為40頭。
1.3.2 同態(tài)相同位點分析
使用PLINK軟件計算兩兩個體之間的同態(tài)相同位點(identical by state, IBS)比例,最終生成N′N大小的IBS矩陣。個體間IBS比例反映了個體之間遺傳關系遠近以及群體的近交歷史。
1.3.3 基因組近交分析
ROH指連續(xù)純合的染色體片段,它是由于親代的同源單倍型傳遞給后代所致,其長度和頻率能夠反映群體的交配歷史。另外,較長的ROH片段可以指示較近的親緣關系。因為較長ROH片段的存在說明其沒有被多個世代染色體的隨機重組分割成不同小段。相反,較短的ROH則可以反映較遠的親緣關系[17]?;赗OH的近交系數(shù)也被證明與系譜近交系數(shù)之間存在高度正相關(0.75)[18],因此可以用于衡量基因組的近交水平。近交可能導致ROH片段的最小長度增加[19]。
本研究利用PLINK軟件掃描基因組中的ROH,掃描參數(shù)為:掃描窗口為30個SNP,定義的ROH長度大于0.5 Mb,連續(xù)SNP之間的距離小于1 Mb,掃描的ROH中最多允許出現(xiàn)一個雜合子。根據(jù)50K芯片數(shù)據(jù)的研究[9],將所得ROH片段依據(jù)其長度進行分組:0.5~5 Mb,5~10 Mb和10 Mb以上,用于比較不同群體的ROH分布差異。
采用2種方法計算個體基因組近交系數(shù):(1) ROH覆蓋率(ROH%),即個體ROH總長占染色體總長的比例;(2)純合位點占比(HOM%),即個體的純合SNP位點數(shù)占總位點數(shù)的比例。
1.3.4 近交衰退分析
為了評估新疆近交牛的近交衰退效應,本研究將新疆近交牛按體型分為大、中、小3組,統(tǒng)計分析各組的基因組近交系數(shù)差異。分組方法采用K-means聚類算法[20],基于4個體型表型指標對個體進行聚類劃分??紤]到年齡對體型的影響,本研究將牛只按月齡分為:(1)≥12月齡的牛只共69頭;(2)進一步篩選≥24月齡的牛只共40頭。對兩個數(shù)據(jù)集分別進行近交衰退分析。
1.3.5 新疆近交牛的基因組特征區(qū)域分析
本研究分析了新疆近交牛和哈薩克牛(塔城)的ROH在各染色體上的分布特征,以定位近交群體內ROH出現(xiàn)頻率(ROH)較高的位點,ROH是統(tǒng)計群體水平下ROH覆蓋特定位點的頻率(N覆蓋/N)。最終篩選了兩群體全基因組水平ROH前1%的SNPs,用于確定新疆近交牛的基因組特征區(qū)域。
基于UCSC數(shù)據(jù)庫(http://hgdownload.soe.ucsc. edu/goldenPath/bosTau9/bigZips/genes/),在候選SNPs上下游100 kb內注釋相關基因,使用DAVID (https:// david.ncifcrf.gov/)進行GO(gene ontology)富集分析,并使用牛QTL數(shù)據(jù)庫(https://www.animalgenome. org/cgi-bin/QTLdb/)定位QTLs。
2.1.1 遺傳背景分析
本研究使用PLINK對16個牛群的基因組信息進行PCA分析,結果顯示,第一主成分(PC1)和第二主成分(PC2)分別占總變異40.49%和12.22%,新疆近交牛(XI)與哈薩克牛(塔城,TL)、哈薩克牛(伊犁,KA)和蒙古牛(MG)聚在一起(圖1A)。
本研究利用Admixture分析了16個牛群的系祖結構。分析顯示(圖1B),當K=2時,普通牛群體和瘤牛群體(溫嶺牛和吉爾牛)明顯分開,新疆近交牛、哈薩克牛(塔城)和中國北方牛品種(蒙古牛、延邊牛和哈薩克牛(伊犁))血統(tǒng)組成相似,普通牛血統(tǒng)占84%,瘤牛血統(tǒng)占16%;中原牛(秦川牛、晉南牛、南陽牛和魯西牛)含有較高比例瘤牛血統(tǒng)(40%~77%);當=5時,新疆近交牛與哈薩克牛(塔城)的血統(tǒng)構成已有些許不同;哈薩克牛(塔城)深藍色的系祖占比達到20%,與中國北方牛群的遺傳組成類似,尤其與哈薩克牛(伊犁)最接近。
2.1.2 連鎖不平衡分析
本研究利用PLINK檢測了新疆近交牛、哈薩克牛(塔城)、新疆褐牛和荷斯坦牛4個群體的LD特征,結果表明,4個群體均呈現(xiàn)LD逐漸衰減模式(圖2A),物理距離較近的SNP位點之間的2較高,當標記間距離增加時,2則迅速下降。但新疆近交牛的LD程度明顯高于其他3個牛群,當標記之間物理距離為8 Mb時,其他牛群標記之間的關聯(lián)系數(shù)<0.20,而近交牛則為0.25。相反,哈薩克牛(塔城)的LD衰減速度最快,在1 Mb之前標記之間2<0.2,反映出該群體近交程度最低。
2.1.3 有效群體大小
基于群體LD信息,本研究使用SNeP軟件估計了新疆近交牛、哈薩克牛(塔城)、新疆褐牛和荷斯坦牛的歷史N。結果顯示4個群體的歷史N都隨著世代數(shù)的增加而增加(圖2B)。哈薩克牛(塔城)的N在10~102世代前都明顯大于其他3個群體,從102世代前的749頭減小至10世代前的86頭。新疆褐牛和荷斯坦牛兩個群體的N低于哈薩克牛(塔城),新疆近交牛的N則在各世代中都是最小的,體現(xiàn)出該群體內SNP標記間存在較強LD。在10個世代以內,新疆近交牛和哈薩克牛(塔城)的N皆小于新疆褐牛和荷斯坦牛,當前世代下4個群體的N分別為13、16、29和33頭。
IBS可以直觀反映個體間的基因組相似性和親緣關系,本研究通過PLINK計算了新疆近交牛、哈薩克牛(塔城)、新疆褐牛和荷斯坦牛4個群體個體間的IBS矩陣。從熱圖可以看出,對角線上呈現(xiàn)3個亮度高且內部相似的模塊,反映群體內較群體間具有更高的基因組相似性(圖3A)。新疆近交牛個體之間基因組相似性最高(IBS=0.735±0.008),反映出該群體通過幾個世代的近交,個體間親緣關系非常近。新疆褐牛(IBS=0.694±0.007)內也具有較高的相似性,而荷斯坦牛(IBS=0.670±0.003)和哈薩克牛(塔城) (IBS=0.678±0.003)個體間相似性較低(圖3B)。
利用PLINK在新疆近交牛、哈薩克牛(塔城)、新疆褐牛和荷斯坦牛的常染色體上進行了ROH掃描。經統(tǒng)計后,4個群體各自的ROH數(shù)量和ROH長度之間呈正比關系(圖3C),新疆近交牛的斜率明顯小于新疆褐牛和荷斯坦牛,盡管ROH數(shù)量較少,但每個個體ROH的總長度較大。哈薩克牛(塔城) ROH長度的分布集中于0.5~20 Mb,且ROH數(shù)量多于新疆褐牛和荷斯坦牛,而新疆近交牛ROH分布較為分散,且長ROH的數(shù)量明顯要比其他牛群多(圖3D)。
圖1 新疆近交牛與其他品種的遺傳關系
A:主成分分析;B:Admixture分析結果(=2或5)。圖中每一列表示一個個體,不同顏色片段的長度表示該個體基因組中某個祖先所占的比例,表示本研究假定的祖先群體個數(shù)。HO:荷斯坦牛;BS:瑞士褐牛;SI:西門塔爾牛;JA:加爾梅克牛;YB:延邊牛;MG:蒙古牛;KA:哈薩克牛(伊犁);QC:秦川牛;JN:晉南牛;NY:南陽牛;LX:魯西牛;WL:溫嶺牛;GI:吉爾牛;XB:新疆褐牛;XI:新疆近交牛;TL:哈薩克牛(塔城)。
圖2 各群體的連鎖不平衡(LD)衰減以及歷史有效群體大小(Ne)
A:4個牛群的連鎖不平衡(LD)衰減;B:常染色體估計4個牛群不同世代的有效群體大小(N)。XI:新疆近交牛;TL:哈薩克牛(塔城);XB:新疆褐牛;HO:荷斯坦牛。
對ROH進行分組后,本研究統(tǒng)計了4個群體不同長度的ROH在常染色體上的分布。結果可見,新疆近交牛(圖4A) ROH數(shù)量雖然較少,但其長ROH片段在各染色體上的分布要比其他群體多,且ROH%也更高。對于新疆近交牛而言,1號染色體ROH數(shù)量最多,13號染色體數(shù)量最少;27號染色體的ROH%最高,7號染色體最低。但是,新疆近交牛28號染色體雖然ROH數(shù)量最少,但其覆蓋率則達到了第2,僅次于27號染色體。哈薩克牛(塔城)的ROH數(shù)量及ROH%都處于較低水平,且29號染色體上未檢測到ROH(圖4B)。新疆褐牛的6號染色體ROH數(shù)量最多(圖4C),而荷斯坦牛ROH數(shù)量隨染色體編號增加呈現(xiàn)遞減趨勢(圖4D)。除了哈薩克牛(塔城)外,其余3個群體ROH%都隨染色體編號增加呈上升趨勢。
圖3 各群體中同態(tài)相同(IBS)比例以及長純合片段(ROH)的分布情況
A:不同個體兩兩之間的同態(tài)相同(IBS)關系(淺色表示同態(tài)相同程度高,深色則表示程度低);B:不同牛群內個體與剩余群體的IBS平均值分布情況;C:各群體中長純合片段(ROH)數(shù)量與總長度之間的關系,Pop:品種名稱縮寫;D:各群體中ROH數(shù)量和長度的分布情況。XI:新疆近交牛;TL:哈薩克牛(塔城);XB:新疆褐牛;HO:荷斯坦牛。
基于ROH與SNP純合位點數(shù)量,本研究計算了4個群體HOM%和ROH%,從結果可以看出,新疆近交牛的兩個指標都顯著高于其余群體(表2)。各群體之間的HOM%皆有差異,新疆近交牛與哈薩克牛(塔城)之間差異達到0.104,荷斯坦牛的HOM%最小,為0.541。在ROH%指標中,新疆褐牛與荷斯坦牛之間不存在差異,且哈薩克牛(塔城)的ROH%最小,為0.021,與新疆近交牛相差0.115。
圖4 各群體長純合片段(ROH)在常染色體上的分布
A:新疆近交牛不同長度的長純合片段(ROH)在常染色體的分布情況;B:哈薩克牛(塔城)不同長度的長純合片段(ROH)在常染色體的分布情況;C:新疆褐牛不同長度的長純合片段(ROH)在常染色體的分布情況;D:荷斯坦牛不同長度的長純合片段(ROH)在常染色體的分布情況。紅線表示各染色體的ROH%。XI:新疆近交牛;TL:哈薩克牛(塔城);XB:新疆褐牛;HO:荷斯坦牛。
表2 各群體基因組近交指標
上標不同字母表示不同群體均值之間存在差異(<0.05)。
本研究利用新疆近交牛的4個體型參數(shù)進行-means聚類后,統(tǒng)計了不同月齡分組下體型與近交指標的關系(表3)。結果顯示,在≥12月齡分組情況下,HOM%和ROH%隨體型的減小皆呈現(xiàn)上升趨勢;≥24月齡分組的結果仍是相同趨勢(由于篩選≥24月齡個體,無小體型牛分組)。
新疆近交牛的ROH均值為0.131,最大值達到0.600,這意味著30個個體的ROH覆蓋到位于5號染色體的高頻位點(圖5A)。而哈薩克牛(塔城)的均值僅有0.005,最大為0.080,在整個基因組范圍內ROH皆小于閾值(圖5B)。
表3 新疆近交牛不同體型分組各參數(shù)平均值及標準差
圖5 兩個群體ROHf在基因組上的分布圖
A:新疆近交牛ROH在各染色體上的分布;B:哈薩克牛(塔城)ROH在各染色體上的分布。灰色橫線表示ROH>0.32作為位點選擇閾值,即前1%的SNP位點。XI:新疆近交牛;TL:哈薩克牛(塔城)。
本研究在新疆近交牛中檢測到8個高頻ROH區(qū)域,包含332個SNP位點并注釋到了130個相關基因。設定GO富集分析閾值為0.05,找到的4個生物學過程通路主要與神經和免疫系統(tǒng)功能相關,兩個分子生物功能通路與膜結構相關(表4)。
本研究在高頻ROH區(qū)域還定位到32個與牛重要經濟性狀相關的QTLs(附表1)。其中11個與產奶性狀相關,7個與體型性狀相關,5個與繁殖性狀相關,5個與肉質和胴體性狀相關以及4個與長壽性狀相關。所有QTLs均分布于5、12和22號染色體上,其中22號染色體上定位到了23個QTLs。這些QTLs分布的染色體與新疆近交牛ROH的峰值位點所在染色體相一致(圖5A)。
表4 GO富集分析結果
本研究PCA分析結果表明,新疆近交牛、哈薩克牛(塔城)、哈薩克牛(伊犁)和蒙古牛的遺傳背景相似,這與它們的地理位置分布相一致,都處于中國北部。綜合PCA與Admixture結果,本研究推測新疆近交牛與哈薩克牛遺傳關系最近,這與其培育人對牛群近交培育歷史的記述內容相一致。
不同群體間LD程度的差異是由有效群體數(shù)量以及群體的歷史所造成的[21,22],通常本地品種的LD程度較小,因為其相對于基因交流具有普遍性的品種(例如荷斯坦牛)而言N的數(shù)量較大[23]。本研究中各群體隨著標記距離增加,LD程度迅速下降,該趨勢與已有報道一致[24~26]。新疆近交牛LD程度較高,說明該群體染色體上相鄰位點間的關聯(lián)性強,這反映了其培育起始于少量系祖,呈現(xiàn)群體奠基者效應(founder effect)。而哈薩克牛(塔城) LD程度較低,可能與當?shù)嘏_x育程度低有關。另有研究顯示野豬與家豬相比,在所有常染色體上的LD程度最小,且衰減速度最快[23]。本研究中,選育程度較低的哈薩克牛(塔城) LD特征與之相似。
本研究估計的歷史N趨勢與荷斯坦牛和綿羊的結果相一致,隨著歷史世代數(shù)增加,N逐漸增大[27,28]?;蚪涣骶哂衅毡樾缘娜后w中N較低,可能是由于人工選擇使得群體中優(yōu)勢基因型比例上升,人為導致了高強度LD,因此N下降[27]。估計10世代以內N時,標記間的物理距離約為5.33 Mb,此距離之后新疆褐牛和荷斯坦牛LD程度低于新疆近交牛和塔城哈薩克牛,導致N估計值較大。本研究N的估計依賴于LD,由于估計近世代時標記間LD程度低(除新疆近交牛外r< 0.06),N估計的準確性可能會受到影響[27]。此外,樣本群體大小也會顯著影響N的估計值[29],本研究僅使用了50頭荷斯坦牛,與其他同品種研究相比偏小[30,31],導致結果偏低。盡管如此,各群體N的增加趨勢及大小也與圖2A各群體LD特征相一致,該結果可以用來進行不同群體之間的比較。
Di Gaetano等[32]對意大利人種的遺傳結構分析發(fā)現(xiàn),IBS群體均值的分布情況能夠分辨不同的亞群體遺傳背景。本研究通過比較群體間的IBS,從結果可以看出,荷斯坦牛與其他3個群體關系最遠,而新疆近交牛、哈薩克牛(塔城)與新疆褐牛都具有一定親緣關系,這也與各群體的歷史及當前塔城地區(qū)新疆褐牛為主推品種的現(xiàn)狀相一致。
本研究結果表明,群體ROH數(shù)量與ROH長度之間存在正比關系,這與多篇研究報道的結果相一致[9,33]。新疆近交牛的長ROH數(shù)量明顯多于其他群體,該結果也印證了圖3C中新疆近交牛的斜率較小。哈薩克牛(塔城)樣本數(shù)量較少(僅20頭)可能導致本研究未能在其29號染色體上檢測到ROH。長ROH片段預示著近期的近交[17],本研究結果也證明了這一點。也有研究表明ROH數(shù)量與染色體長度之間呈正比[34],本研究中新疆褐牛(圖4C)和荷斯坦牛(圖4D)的趨勢較為明顯,哈薩克牛(塔城)由于樣本數(shù)量較少而未呈現(xiàn)明顯趨勢。
HOM%和ROH%的結果說明了新疆近交牛的近交程度最高。楊湛澄等[9]利用Illumina 54K芯片檢測了中國荷斯坦牛的ROH%和HOM%,其中ROH%為0.064,略小于本研究中荷斯坦群體的結果。這可能是因為本研究ROH檢測的參數(shù)較為寬松,包含了長度<1 Mb的ROH,因此ROH%偏高。此外,Purfield等[18]研究表明,芯片密度也會影響ROH的檢測結果,因此本研究在各群體提取出相同密度的標記進行比較。楊湛澄等[9]研究表明,荷斯坦公牛HOM%的范圍為0.625~0.750,高于本研究母牛的結果(0.541)。究其原因可能是本研究荷斯坦牛所使用的標記是從150K芯片中提取的部分標記,導致一些純合位點被忽略,致使HOM%較低。
為避免月齡對體型大小評估的影響,本研究分別對≥12月齡和≥24月齡的個體進行分組。HOM%和ROH%在不同體型分組間的差異都未達到顯著性水平(>0.05),這可能與體型數(shù)據(jù)樣本量少有關。但本研究結果表明:個體位點純合率越高,其體型就越小。這說明近交對體型性狀有影響,在一定程度上造成了牛只生長方面的近交衰退。
研究表明,經過多個世代的近交,新疆近交牛的SNP位點純合率上升[1],也導致ROH檢出概率提高,致使ROH明顯高于哈薩克牛(塔城)。ROH在基因組中的分布差異較大,該分布特征與其他多個物種的研究相一致[8~10]。Kim等[8]利用50K芯片數(shù)據(jù)對北美荷斯坦牛的ROH進行了檢測,發(fā)現(xiàn)未經選擇的荷斯坦牛群體各SNP的ROH皆小于0.09,且未檢出高頻區(qū)域。人工選擇在一定程度上導致了近交,從而使位點純合率上升,而未經選擇的群體中,ROH在染色體上的覆蓋率較低。本研究也未能在哈薩克牛(塔城)中檢測出高頻ROH區(qū)域,這說明其近交程度較新疆近交牛低,新疆近交牛多個世代的近交繁育導致了高頻ROH區(qū)域的出現(xiàn)。
新疆近交?;蚪M特征區(qū)域鑒定的基因主要參與了基本的生物學過程和分子功能,且定位的QTLs與重要經濟性狀相關聯(lián),說明多個世代的近交可能對這些區(qū)域的遺傳特征產生了影響。本研究也發(fā)現(xiàn)新疆近交牛的體型大小與位點純合率存在一定趨勢,有可能純合位點區(qū)域覆蓋了與生長和體型性狀相關的基因或QTLs,積累了有害突變,致使性狀表型出現(xiàn)衰退。
本研究從多個方面證明了新疆近交牛在基因組上達到了很高的近交純度,該群體是我國難得的反芻動物近交資源。目前尚未對新疆近交牛的重要經濟性狀進行系統(tǒng)記錄,若能積累準確且充足的表型數(shù)據(jù),該群體在研究大型反芻動物近交衰退的表型表現(xiàn)及其遺傳調控機制方面將具有重大意義。
附表1詳見文章電子版www.chinagene.cn。
衷心感謝新疆石河子大學謝蘇和公紅斌同學,新疆農業(yè)大學胥磊、徐慶磊、楊明路和邱文卿同學,以及中國農業(yè)大學張海亮和胡麗蓉同學在本研究樣品采集過程中給予的大力幫助;感謝新疆近交牛的培育人盧國昌以及老先生的愛人李秀英、兒子盧振宇(郵箱: zhangll1000@163.com)、兒媳朱曉靜、孫子蘆金龍等一家人對近交牛培育的支持。
[1] Zhang Y. Animal Breeding. Beijing: China Agriculture Press, 2001.張沅. 家畜育種學. 北京: 中國農業(yè)出版社, 2001.
[2] Ma LP, Huang T, Lu GC, Li XY, Lu ZY, Zhai TJ, Cheng YC, Feng ST. Study on identification of Xinjiang Brown Cattle inbred group., 2015, 42 (12): 3274–3281.馬力鵬, 黃濤, 盧國昌, 李秀英, 盧振宇, 翟騰蛟, 程悅聰, 馮書堂. 新疆褐牛近交群體的鑒定研究. 中國畜牧獸醫(yī), 2015, 42(12): 3274–3281.
[3] Alexander DH, Novembre J, Lange K. Fast model-based estimation of ancestry in unrelated individuals., 2009, 19(9): 1655–1664.
[4] Gao YH, Gautier M, Ding XD, Zhang H, Wang YC, Wang X, Faruque MO, Li JY, Ye SH, Gou X, Han JL, Lenstra JA, Zhang Y. Species composition and environmental adaptation of indigenous Chinese cattle., 2017, 7(1): 16196.
[5] S?rensen AC, S?rensen MK, Berg P. Inbreeding in danish dairy cattle breeds., 2005, 88(5): 1865–1872.
[6] Wright S. Coefficients of inbreeding and relationship., 1922, 56(645): 330–338.
[7] Woods C, Valente EM, Bond J, Roberts E. A new method for autozygosity mapping using single nucleotide polymorphisms (SNPs) and EXCLUDEAR., 2004, 41(8): e101.
[8] Kim ES, Cole JB, Huson H, Wiggans GR, Van Tassell CP, Crooker BA, Liu G, Da Y, Sonstegard TS. Effect of artificial selection on runs of homozygosity in U.S. Holstein cattle., 2013, 8(11): e80813.
[9] Yang ZC, Huang HT, Yan QX, Wang YC, Ying Y, Chen SH, Sun DX, Zhang SL, Zhang Y. Estimation of genomic inbreeding coefficients based on high-density SNP markers in Chinese Holstein cattle., 2017, 39(1): 41–47.楊湛澄, 黃河天, 閆青霞, 王雅春, 俞英, 陳紹祜, 孫東曉, 張勝利, 張毅. 利用高密度SNP標記分析中國荷斯坦牛基因組近交. 遺傳, 2017, 39(1): 41–47.
[10] Liu JX, Wei X, Deng TY, Rui R, Han JL, Du LX, Zhao FP, Wang LX. Genome-wide scan for run of homozygosity and identification of corresponding candidate genes in sheep populations., 2019, 50(8): 1554–1566.劉家鑫, 魏霞, 鄧天宇, 謝銳, 韓建林, 杜立新, 趙福平, 王立賢. 綿羊全基因組ROH檢測及候選基因鑒定. 畜牧獸醫(yī)學報, 2019, 50(8): 1554–1566.
[11] Decker JE, Taylor JF, Kantanen J, Millbrooke A, Schnabel RD, Alexander LJ, Macneil MD. Origins of cattle on Chirikof Island, Alaska, elucidated from genome-wide SNP genotypes., 2016, 116(6): 502–505.
[12] Decker JE, McKay SD, Rolf MM, Kim J, Molina Alcalá A, Sonstegard TS, Hanotte O, G?therstr?m A, Seabury CM, Praharani L, Babar ME, Correia de Almeida Regitano L, Yildiz MA, Heaton MP, Liu WS, Lei CZ, Reecy JM, Saif-Ur-Rehman M, Schnabel RD, Taylor JF. Worldwide patterns of ancestry, divergence, and admixture in domesticated cattle., 2014, 10(3): e1004254.
[13] Chang CC, Chow CC, Tellier LC, Vattikuti S, Purcell SM, Lee JJ. Second-generation PLINK: rising to the challenge of larger and richer datasets., 2015, 4(1): 7.
[14] Hill WG. Estimation of linkage disequilibrium in randomly mating populations., 1974, 33(2): 229–239.
[15] Barbato M, Orozco-terWengel P, Tapio M, Bruford MW. SNeP: a tool to estimate trends in recent effective popu-lation size trajectories using genome-wide SNP data., 2015, 6: 109.
[16] Sved JA. Linkage disequilibrium and homozygosity of chromosome segments in finite populations., 1971, 2(2): 125–141.
[17] McQuillan R, Leutenegger AL, Abdel-Rahman R, Franklin CS, Pericic M, Barac-Lauc L, Smolej-Narancic N, Janicijevic B, Polasek O, Tenesa A, MacLeod AK, Farrington SM, Rudan P, Hayward C, Vitart V, Rudan I, Wild SH, Dunlop MG, Wright AF, Campbell H, Wilson JF. Runs of homozygosity in European populations., 2008, 83(3): 359–372.
[18] Purfield DC, Berry DP, McParland S, Bradley DG. Runs of homozygosity and population history in cattle., 2012, 13(1): 70.
[19] Kirin M, McQuillan R, Franklin CS, Campbell H, McKeigue PM, Wilson JF. Genomic runs of homozygosity record population history and consanguinity., 2010, 5(11): e13996.
[20] Hartigan JA, Wong MA. A K-means clustering algorithm: Algorithm AS 136., 1979, 28(1): 100–108.
[21] Tenesa A, Navarro P, Hayes BJ, Duffy DL, Clarke GM, Goddard ME, Visscher PM. Recent human effective population size estimated from linkage disequilibrium., 2007, 17(4): 520–526.
[22] Ardlie KG, Kruglyak L, Seielstad M. Patterns of linkage disequilibrium in the human genome., 2002, 3(4): 299–309.
[23] Mu?oz M, Bozzi R, García-Casco J, Nú?ez Y, Ribani A, Franci O, García F, ?krlep M, Schiavo G, Bovo S, Utzeri VJ, Charneca R, Martins JM, Quintanilla R, Tibau J, Margeta V, Djurkin-Ku?ec I, Mercat MJ, Riquet J, Estellé J, Zimmer C, Razmaite V, Araujo JP, Radovi? ?, Savi? R, Karolyi D, Gallo M, ?andek-Potokar M, Fernández AI, Fontanesi L, óvilo C. Genomic diversity, linkage dise-quilibrium and selection signatures in European local pig breeds assessed with a high density SNP chip., 2019, 9(1): 13546.
[24] Daly MJ, Rioux JD, Schaffner SF, Hudson TJ, Lander ES. High-resolution haplotype structure in the human genome., 2001, 29(2): 229–232.
[25] Farnir F, Coppieters W, Arranz JJ, Berzi P, Cambisano N, Grisart B, Karim L, Marcq F, Moreau L, Mni M, Nezer C, Simon P, Vanmanshoven P, Wagenaar D, Georges M. Extensive genome-wide linkage disequilibrium in cattle., 2000, 10(2): 220–227.
[26] Amaral AJ, Megens H-J, Crooijmans RPMA, Heuven HCM, Groenen MAM. Linkage disequilibrium decay and haplotype block structure in the pig., 2008, 179(1): 569–579.
[27] Ni GY, Zhang Z, Jiang L, Ma PP, Zhang Q, Ding XD. Chinese Holstein Cattle effective population size estimated from whole genome linkage disequilibrium., 2012, 34(1): 50–58.尼桂琰, 張哲, 姜力, 馬裴裴, 張勤, 丁向東. 利用全基因組連鎖不平衡估計中國荷斯坦牛有效群體大小. 遺傳, 2012, 34(1): 50–58.
[28] Zhao FP, Wang GK, Zeng T, Wei CH, Zhang L, Wang HH, Zhang SZ, Liu RZ, Liu Z, Du LX. Estimations of genomic linkage disequilibrium and effective population sizes in three sheep populations., 2014, 170: 22–29.
[29] Hill WG. Linkage disequilibrium among multiple neutral alleles produced by mutation in finite population., 1975, 8(2): 117–126.
[30] Kim ES, Kirkpatrick BW. Linkage disequilibrium in the North American Holstein population., 2009, 40(3): 279–288.
[31] Qanbari S, Pimentel ECG, Tetens J, Thaller G, Lichtner P, Sharifi AR, Simianer H. A genome-wide scan for signatures of recent selection in Holstein cattle., 2010, 41(4): 377–389.
[32] Di Gaetano C, Voglino F, Guarrera S, Fiorito G, Rosa F, Di Blasio AM, Manzini P, Dianzani I, Betti M, Cusi D, Frau F, Barlassina C, Mirabelli D, Magnani C, Glorioso N, Bonassi S, Piazza A, Matullo G. An overview of the genetic structure within the italian population from genome- wide data., 2012, 7(9): e43759.
[33] Mastrangelo S, Tolone M, Di Gerlando R, Fontanesi L, Sardina MT, Portolano B. Genomic inbreeding estimation in small populations: evaluation of runs of homozygosity in three local dairy cattle breeds., 2016, 10(5): 746–754.
[34] Martikainen K, Sironen A, Uimari P. Estimation of intrachromosomal inbreeding depression on female fertility using runs of homozygosity in Finnish Ayrshire cattle., 2018, 101(12): 11097–11107.
The evaluation of genomic homozygosity for Xinjiang inbred population by SNP panels
Rui Shi1, Yi Zhang1, Yachun Wang1, Tao Huang2, Guochang Lu3, Tao Yue4, Zhenxi Lu3, Xixia Huang5, Xinpu Wei6, Shutang Feng7, Jun Chen8, Wulan Kagedeer8, Ruxianguli Abulizi8, Nuerhumaer Muhetaer8
Xinjiang inbred cattle is a population which has been highly inbred for 45 years. However, the breed origin of this population cannot be traced back due to the lack of original records. To demonstrate the genetic background of Xinjiang inbred cattle, we analysed the worldwide genomic information of 16 cattle breeds using principal components analysis, and Admixture method. Furthermore, the shared SNP markers of Xinjiang inbred cattle, local Kazakh cattle, Holstein cattle, and Xinjiang Brown cattle were extracted to calculate population genetic parameters and genomic inbreeding indicators in order to evaluate the magnitude of inbreeding in each population. We also evaluated the relationship between inbreeding indicators and body size in the Xinjiang inbred population. Finally, the high frequency runs of homozygosity (ROH) regions for Xinjiang inbred cattle and local Kazakh population were selected for genes and QTL annotations. These results demonstrate that the ancestry proportions of inbreeding breed are similar to those of Kazakh cattle. The genomic homozygosity of Xinjiang inbred cattle is significantly higher than other populations; the inbreeding depression is observed in body size to a certain extent because body size decreased when corresponding homozygosity increased. Totally, six basic bio-pathways and 32 QTL regions that related to bovine economical traits were annotated. Our results provide the insights into breeding strategies, future protection, and utilization plan design for this special genetic material-Xinjiang inbred cattle.
Xinjiang inbred cattle; population structure; genomic inbreeding; runs of homozygosity
2020-03-15;
2020-04-09
現(xiàn)代農業(yè)(奶牛)產業(yè)技術體系建設專項資金(編號:CARS-36)和長江學者和創(chuàng)新團隊發(fā)展計劃項目(編號:IRT_15R62)資助[Supported by China Agriculture Research System (No. CARS-36), and the Program for Changjiang Scholar and Innovation Research Team in University (No. IRT_15R62)]
師睿,在讀碩士研究生,專業(yè)方向:動物遺傳育種與繁殖。E-mail: srandeffy@163.com
王雅春,博士,教授,研究方向:分子數(shù)量遺傳學。E-mail: wangyachun@cau.edu.cn黃濤,博士,副教授,研究方向:動物遺傳育種。E-mail: taohuagn100@sina.com盧國昌,新疆近交牛培育人。
10.16288/j.yczz.20-071
2020/5/11 12:14:54
URI: http://kns.cnki.net/kcms/detail/11.1913.R.20200509.1608.001.html
(責任編委: 趙要風)