李曉凱 王貴 喬賢 范一星 張磊 馬宇浩 聶瑞雪 王瑞軍,何利兵 蘇蕊,2,3,
(1. 內(nèi)蒙古農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院,呼和浩特 010018;2. 農(nóng)業(yè)部肉羊遺傳育種重點(diǎn)實(shí)驗(yàn)室,呼和浩特 010018;3. 內(nèi)蒙古自治區(qū)山羊遺傳育種工程技術(shù)研究中心,呼和浩特 010018;4. 河套學(xué)院農(nóng)學(xué)系 內(nèi)蒙古巴彥淖爾市臨河區(qū)大學(xué)路,巴彥淖爾 015000;5. 內(nèi)蒙古金萊牧業(yè)科技有限責(zé)任公司,呼和浩特 010018)
經(jīng)過(guò)長(zhǎng)期的自然選擇和人工定向選擇之后,馴化的家畜在表型特征、重要經(jīng)濟(jì)性狀和環(huán)境適應(yīng)性等方面逐漸形成了明顯的遺傳差異,極大地豐富了現(xiàn)有的生物遺傳資源多樣性[1-2]。隨著測(cè)序技術(shù)的發(fā)展、測(cè)序成本的降低以及組裝方法的不斷完善,越來(lái)越多物種的精細(xì)基因組序列圖譜得到公布,使得全基因組測(cè)序成為進(jìn)行不同物種個(gè)體或群體重要性狀相關(guān)遺傳基礎(chǔ)研究的重要方法。全基因組重測(cè)序,是對(duì)已知基因組序列的不同個(gè)體或群體進(jìn)行全基因組重測(cè)序和序列比對(duì)分析研究,一般是建立一個(gè)測(cè)序文庫(kù)進(jìn)行單個(gè)個(gè)體或不同個(gè)體混合池測(cè)序[3]。此外,為獲得更為全面的遺傳變異信息,對(duì)不同品種中具有代表性的個(gè)體也進(jìn)行大量的從頭組裝測(cè)序(de novo),并在不同物種中的遺傳變異信息挖掘和參考基因組空白序列(Gap)的修補(bǔ)方面起到了越來(lái)越大的作用。相對(duì)于傳統(tǒng)候選基因等研究方法的效率低、周期長(zhǎng)、準(zhǔn)確性差等而言,全基因組測(cè)序可以從全基因組水平全面、精準(zhǔn)、高效地對(duì)重要性狀的候選功能基因進(jìn)行定位和分析研究[4]。豬、馬、牛和羊在人們?nèi)粘I钪姓加兄匾慕巧?,為人們提供肉、奶、皮和絨毛等生活用品。通過(guò)對(duì)這些重要家畜及近緣物種的不同群體的比較基因組學(xué)研究有助于揭示其適應(yīng)性遺傳機(jī)理和表型性狀差異的遺傳基礎(chǔ),開(kāi)發(fā)相關(guān)的遺傳標(biāo)記,加快分子育種。基于全基因組的遺傳信息對(duì)物種起源馴化、遺傳多樣性和群體歷史動(dòng)態(tài)的研究也有助于物種的遺傳資源保護(hù)和今后進(jìn)化方向的預(yù)測(cè)。本文主要對(duì)近幾年全基因組測(cè)序在常見(jiàn)家畜(豬、馬、牛、羊等及其近緣物種)的取得的重要研究成果進(jìn)行綜述,并討論全基因組測(cè)序的優(yōu)勢(shì)、缺點(diǎn)及在生產(chǎn)中意義。此外,對(duì)全基因組重測(cè)序研究的未來(lái)發(fā)展進(jìn)行了歸納和展望,以期為今后動(dòng)物重要經(jīng)濟(jì)性狀的功能基因定位和物種起源、馴化等研究提供思路和參考。
目前,隨著高通量測(cè)序技術(shù)快速發(fā)展、測(cè)序成本的進(jìn)一步降低以及組裝方法的不斷完善,全基因組測(cè)序研究主要包括3個(gè)方面。第一種為不參考任何現(xiàn)有序列從頭組裝測(cè)序,是對(duì)未知基因組序列的物種進(jìn)行基因組測(cè)序,并綜合利用不同測(cè)序技術(shù)和生物信息學(xué)工具對(duì)研究物種進(jìn)行序列拼接和修正,進(jìn)而獲得該物種的基因組序列圖譜。第二種為常見(jiàn)的全基因組重測(cè)序,是對(duì)已知基因組序列的物種進(jìn)行個(gè)體或群體的測(cè)序研究,建立一個(gè)測(cè)序文庫(kù)進(jìn)行單個(gè)個(gè)體或不同個(gè)體混合池測(cè)序,發(fā)現(xiàn)遺傳變異標(biāo)記,進(jìn)行后續(xù)的研究[3]。第三種是在已有參考基因組序列圖譜的基礎(chǔ)上,對(duì)不同品種的具有代表性個(gè)體建立多個(gè)文庫(kù)進(jìn)行全基因組從頭組裝測(cè)序,此方法能夠進(jìn)一步的進(jìn)行參考基因組的修補(bǔ)和發(fā)現(xiàn)短序列比對(duì)難以發(fā)現(xiàn)的遺傳變異[5]。全基因組重測(cè)序因?yàn)榘骋晃锓N個(gè)體或群體的核DNA的全部遺傳信息,與參考基因組比對(duì)可以獲得非常全面的遺傳標(biāo)記信息,如SNP、Indel和CNV等分子標(biāo)記。核DNA所包含的父母雙親的遺傳信息可以突破線粒體DNA母系遺傳和Y染色體父系遺傳在物種進(jìn)化、群體歷史動(dòng)態(tài)研究中的限制。在全基因組水平上的高密度的SNP等分子遺傳標(biāo)記也能夠較全面的從整體角度對(duì)物種受到的自然選擇和人工選擇導(dǎo)致的遺傳變化進(jìn)行解析。此外,近來(lái)商業(yè)化育種的實(shí)施導(dǎo)致某一功能突變基因的正選擇或凈化選擇作用的遺傳基礎(chǔ)也能通過(guò)全基因組重測(cè)序方法進(jìn)行深入的分析研究。此外,全基因組重測(cè)序還可以突破目前基因分型芯片中品種的偏向性和標(biāo)記不足的問(wèn)題,獲得的新的遺傳變異信息也為進(jìn)一步制作高密度芯片提供研究材料。
自人類基因組計(jì)劃完成以來(lái),獲得高質(zhì)量的參考基因組序列圖譜成為了不同物種進(jìn)行功能基因研究的基礎(chǔ)[6-7]。隨之發(fā)展起來(lái)的Illumina/Solexa、Roche/454和ABI/SOLiD等幾種第二代高通量測(cè)序平臺(tái)更是對(duì)現(xiàn)代生物學(xué)研究的各個(gè)領(lǐng)域中起到了積極的推動(dòng)作用[4,8-9]。目前,測(cè)序技術(shù)已經(jīng)由最初的基于雙脫氧末端終止法的Sanger測(cè)序技術(shù)發(fā)展到以單分子實(shí)時(shí)測(cè)序(Pacific bio)、離子半導(dǎo)體(Ion torrent)、納米孔(Oxford nanopore)等為特點(diǎn)的第三代測(cè)序技術(shù),實(shí)現(xiàn)了從低讀長(zhǎng)到超高讀長(zhǎng)、從光學(xué)檢測(cè)到電子傳導(dǎo)檢測(cè)的雙重跨越測(cè)序技術(shù)[10]。而Illumina/Solexa系統(tǒng)的聚合酶合成法因?yàn)榫哂械统杀尽未螖?shù)據(jù)量大、時(shí)間短,后續(xù)數(shù)據(jù)分析工作成熟等優(yōu)勢(shì),作為第二代中具有代表性的測(cè)序技術(shù)廣泛應(yīng)用于動(dòng)植物的基因組、轉(zhuǎn)錄組等方面的測(cè)序研究[11]。此外,以Pacific Biosciences 公司的 SMRT 技術(shù)、Oxford Nanoprop的MinION測(cè)序系列和Helicos公司的Heliscope單分子測(cè)序儀為代表的第三代單測(cè)序技術(shù)在序列讀長(zhǎng)、測(cè)序速度、組裝效果方面較第二代測(cè)序技術(shù)有顯著的優(yōu)勢(shì),在參考基因組組裝中取得了極大的成功,但因較高的測(cè)序錯(cuò)誤率和測(cè)序成本等問(wèn)題,目前尚未在重測(cè)序領(lǐng)域廣泛應(yīng)用[10,12-13]。隨著三代測(cè)序數(shù)據(jù)分析算法的、測(cè)序準(zhǔn)確性的不斷提高優(yōu)化,三代測(cè)序技術(shù)目前在基因組從頭組裝和全長(zhǎng)轉(zhuǎn)錄組分析方面舉得了大量的研究成果[14-16]。在全基因組重測(cè)序的研究方面,尚未有相關(guān)報(bào)道,但不久的將來(lái),隨著測(cè)序費(fèi)用的降低及準(zhǔn)確率的提高,其在重測(cè)序一定會(huì)具有廣闊的發(fā)展前景。
目前,結(jié)合不同測(cè)序技術(shù)和組裝方法,已經(jīng)完成了豬、牛、山羊、綿羊、馬等物種的參考基因組的從頭組裝,尤其是近來(lái)結(jié)合不同組裝技術(shù)獲得的高質(zhì)量山羊參考基因組圖譜(ARS1)為其他物種高質(zhì)量參考基因組的獲取提供了參考。高質(zhì)量的參考基因組序列圖譜也為進(jìn)一步在不同物種中獲得更為全面的遺傳信息提供了基礎(chǔ),而比較不同物種的基因組特點(diǎn)也能夠加深對(duì)物種間差異和進(jìn)化的認(rèn)識(shí)。全基因組測(cè)序根據(jù)研究目的、測(cè)序群體大小、物種地理分布情況、測(cè)序深度等不同,在家畜的重要經(jīng)濟(jì)性狀相關(guān)的功能基因挖掘、起源馴化機(jī)制及遺傳資源多樣性等方面的研究側(cè)重點(diǎn)也有所不同。因此,對(duì)目前家畜基因組組裝方法、發(fā)展歷史和全基因組重測(cè)序研究方法的差異的理解也有助于今后快速有效的進(jìn)行預(yù)期目標(biāo)研究工作的開(kāi)展。
2012年,Groenen等[17]采用細(xì)菌人工染色體克隆測(cè)序和Illumina全基因組鳥(niǎo)槍法測(cè)序相結(jié)合的方法對(duì)一頭杜洛克母豬進(jìn)行測(cè)序組裝,并獲得了高質(zhì)量的參考基因組。結(jié)合48頭野豬和家畜的全基因組序列進(jìn)行系統(tǒng)發(fā)育分析發(fā)現(xiàn),歐、亞野豬估計(jì)在100萬(wàn)年前開(kāi)始分化,其中野豬首先出現(xiàn)在東南亞,然后分布到歐亞大陸。群體瓶頸進(jìn)化和遺傳多樣性分析,發(fā)現(xiàn)亞洲野豬的遺傳多樣性比歐洲野豬高,可能是兩萬(wàn)多年前的“末次冰盛期”事件對(duì)歐洲野豬的影響大于亞洲野豬,導(dǎo)致歐洲野豬的有效群體大小和遺傳多樣性迅速降低。在進(jìn)一步的選擇性清除分析中發(fā)現(xiàn),受選擇區(qū)域候選基因主要參與RNA剪切和RNA加工過(guò)程,可能與品種的快速分化有關(guān)?;蚪M的進(jìn)化分析中發(fā)現(xiàn)與免疫、嗅覺(jué)相關(guān)基因在馴化過(guò)程中發(fā)生了基因復(fù)制與基因家族擴(kuò)張事件。Li等[18]利用Illumina測(cè)序平臺(tái)對(duì)一頭母野藏豬進(jìn)行了從頭組裝測(cè)序,并對(duì)6個(gè)藏豬群體(西藏日喀則和林芝、四川阿壩和甘孜、甘肅甘南和云南迪慶)及4個(gè)四川盆地特有家豬品種(盆周山地豬、烏金豬、雅南豬和內(nèi)江豬)進(jìn)行全基因組重測(cè)序。通過(guò)比較同源基因構(gòu)建系統(tǒng)進(jìn)化樹(shù)發(fā)現(xiàn),藏豬與家豬的祖先可能分歧于690萬(wàn)年前。與家豬的基因組比較分析發(fā)現(xiàn),藏豬進(jìn)化出了3 000多個(gè)特有的基因,主要涉及心肺血液循環(huán)系統(tǒng)的發(fā)育、抗病性和高輻射適應(yīng)等方面,加深了我們對(duì)藏豬高原適應(yīng)性的遺傳機(jī)制的理解。Ai等[19]通過(guò)對(duì)中國(guó)15個(gè)不同地理環(huán)境下的具有代表性69頭豬進(jìn)行深度測(cè)序分析,在X性染色體上發(fā)現(xiàn)了一個(gè)可能與寒熱環(huán)境適應(yīng)性有關(guān)的14 Mb的低重組區(qū)域,為豬的適應(yīng)性機(jī)理研究提供了基因組水平的證據(jù)。而基因滲入的研究為進(jìn)行品種雜交提高適應(yīng)性等奠定了理論基礎(chǔ)。
在實(shí)際育種生產(chǎn)中,為提高供豬的生產(chǎn)性能,利用雜種優(yōu)勢(shì)大量地進(jìn)行了國(guó)際間的豬種雜交和商業(yè)化育種工作,這些過(guò)程在基因組中留下相應(yīng)的印記,受到了科學(xué)家的廣泛關(guān)注。Li等[20]對(duì)三頭巴克夏豬進(jìn)行全基因組測(cè)序,并結(jié)合其他已有品種的41個(gè)個(gè)體的全基因組序列數(shù)據(jù)進(jìn)行深入挖掘分析。從基因組水平發(fā)現(xiàn)巴克夏豬具有更高比例的中國(guó)豬的遺傳物質(zhì),證實(shí)了中國(guó)豬對(duì)巴克夏品種的形成具有的重要作用,為家畜的育種歷史追溯提供了基因組水平上的證據(jù)和方法。Ramírez等[21]利用古DNA的基因組測(cè)序研究揭示亞洲豬對(duì)伊比利亞豬和國(guó)際化豬種對(duì)地方豬種的基因滲入的現(xiàn)象,為基于基因組序列分析進(jìn)行不同品種間的基因滲入的研究提供了方法。利用全基因組重測(cè)序技術(shù)對(duì)豬的遺傳多樣性和重要經(jīng)濟(jì)性狀遺傳機(jī)理的研究將促進(jìn)對(duì)豬的遺傳資源的保護(hù)和利用。
為理解不同品種特有性狀的遺傳基礎(chǔ),Rubin等[22]利用SOLiD 和Illumina兩個(gè)不同測(cè)序平臺(tái)產(chǎn)生的全基因組序列數(shù)據(jù)進(jìn)行選擇性清除分析,發(fā)現(xiàn)NR6A1,PLAG1和LCORL等三個(gè)基因的功能變異可能與豬背最長(zhǎng)肌、脊椎數(shù)相關(guān);在結(jié)構(gòu)變異分析中發(fā)現(xiàn)在KIT位點(diǎn)的四個(gè)復(fù)制只表達(dá)在白色或白點(diǎn)豬上,可能與結(jié)構(gòu)變異導(dǎo)致表型快速進(jìn)化和定向選擇引起突變的累積效應(yīng)有關(guān)。Choi等[23]采用Illumina測(cè)序技術(shù)對(duì)韓國(guó)本地和歐洲5個(gè)品種55 頭豬進(jìn)行平均深度為11.7 x的重測(cè)序,與參考基因組比對(duì)后共發(fā)現(xiàn) 20 123 573 個(gè)SNPs,其中新發(fā)現(xiàn)的SNP占25.5%,極大補(bǔ)充了亞洲豬種的遺傳資源多樣性的研究;在進(jìn)一步的遺傳變異注釋分析中發(fā)現(xiàn)35 458個(gè)非同義突變發(fā)生在在9 904個(gè)基因上,為變異導(dǎo)致重要性狀差異的研究提供了分子標(biāo)記。選擇性清除發(fā)現(xiàn),CLDN1和TWIST1等兩個(gè)基因可能與豬的胚胎附著和肥胖等重要經(jīng)濟(jì)性狀有關(guān)。Wang等[24]利用公共數(shù)據(jù)庫(kù)豬的全基因組數(shù)據(jù),并結(jié)合混合池測(cè)序和個(gè)體測(cè)序的方法,在選擇性清除分析發(fā)現(xiàn)ESR1基因的同義替換(c.669T>C)與豬的窩產(chǎn)仔數(shù)相關(guān);PRM1,PRM2,TNP2,GPR149 和 JMJD1C等基因與中國(guó)豬的高繁性狀相關(guān);MITF、EDNRB等兩個(gè)基因與通城豬的兩頭烏性狀相關(guān)。
為全面研究由于長(zhǎng)期遺傳分化導(dǎo)致不同群體、種屬間的基因組水平上的遺傳差異,以及利用從頭測(cè)序提升參考基因組序列圖譜的完整性。Li等[5]通過(guò)對(duì)10頭不同品種的豬進(jìn)行個(gè)體基因組組裝,并將組裝序列與參考基因組進(jìn)行比對(duì),挖掘了大量的SNP、InDel、SV和CNV等遺傳變異,基因組序列分析揭示了歐亞豬中具有明顯的遺傳差異,且中國(guó)豬種的遺傳多樣性明顯高于歐洲豬種,再次證明了豬起源的東南亞的假說(shuō)。此外,研究中還檢測(cè)到了包含了1 737個(gè)蛋白編碼基因的137.02 Mb的新片段,為完善豬的參考基因組序列圖譜提供了大量的數(shù)據(jù)基礎(chǔ)。對(duì)品種個(gè)體基因組的選擇消除分析發(fā)現(xiàn)了分散在基因組不同區(qū)域的308個(gè)基因,發(fā)現(xiàn)豬的選育策略差異與社會(huì)需求顯著相關(guān)。
豬作為研究人類疾病的模型,通過(guò)對(duì)參考基因組的深入分析,發(fā)現(xiàn)了112個(gè)豬和人類相同的氨基酸。其中發(fā)現(xiàn)突變會(huì)導(dǎo)致與肥胖(ADRB3、SDC3)、糖尿?。≒PP1RA,SLC30A8,ZNF615)、帕金森氏綜合癥(LRRK2,SNCA)和阿爾茨海默氏癥(TUBD1,BLMH,CEP192,PLAU)等有關(guān)疾病的功能基因的遺傳突變,為豬作為非模式生物研究人類相關(guān)疾病研究提供了科學(xué)基礎(chǔ)[25]。中國(guó)科學(xué)家基于Illumina短序列獨(dú)立組裝的五指山迷你豬參考基因組解析工作的完成,為構(gòu)建各種人類疾病模型提供基因組信息[26]。這些工作的完成為今后人體異源器官移植工作提供了基因組水平的基礎(chǔ)。
2007年國(guó)際馬基因組計(jì)劃工作小組完成了一匹名為 “黎明” 的純血母馬血樣測(cè)序工作,并將馬基因組序列草圖數(shù)據(jù)全部存入公共數(shù)據(jù)庫(kù),供世界各地的科學(xué)人員免費(fèi)使用。不久,第二版的馬基因組組裝草圖也宣布完成,其基因組大小約為2.68 Gb,Contig N50 達(dá)到 112 kb,Scaffold N50 達(dá)到 46 Mb,包含21 375個(gè)基因。Wade等[27]對(duì)馬基因組序列進(jìn)行深入解析發(fā)現(xiàn)11號(hào)染色體中可能存在一個(gè)馬屬特有的正在進(jìn)化的新著絲粒,該著絲點(diǎn)具有功能而且穩(wěn)定,為著絲粒的功能研究提供了很好的模型。在馬疾病相關(guān)的研究中,還發(fā)現(xiàn)與人類有90多種相似的遺傳疾病,確定馬身上造成這些疾病的基因根源,將有助于加深對(duì)人類相關(guān)疾病的理解。
現(xiàn)代馬大約在5 500年前的西亞草原地區(qū)被人類馴服,隨后迅速擴(kuò)散到歐亞大陸,其中普氏野馬(Przewalski′s horse,66個(gè)染色體)是現(xiàn)存最古老的野馬,但與家馬(64個(gè)染色體)可以雜交產(chǎn)生可育的后代[28]。對(duì)馬的起源馴化研究中推測(cè)馬最初的時(shí)候是從一個(gè)母馬數(shù)量相對(duì)較大的但公馬非常少的馬群中被馴化[27]。2013年,通過(guò)第二代、三代測(cè)序平臺(tái)結(jié)合的方法,丹麥科學(xué)家Orlando等[29]對(duì)在加拿大育空谷永久凍土挖掘的馬骨骼化石碎片中獲得DNA進(jìn)行測(cè)序。結(jié)合“晚更新世”馬的基因組序列草圖以及五匹現(xiàn)代馴化馬、普氏野馬和驢的基因組序列草圖進(jìn)行了對(duì)比,揭示了所有現(xiàn)代馬、斑馬和驢子系統(tǒng)分化時(shí)間約于400萬(wàn)-450萬(wàn)年前,且基因組數(shù)據(jù)表明Przewalski馬是目前唯一幸存下來(lái)的野生馬種群。研究還揭示了馬群體大小在過(guò)去的兩百萬(wàn)年間發(fā)生了多次浮動(dòng),且估計(jì)普氏野馬與現(xiàn)代馬大約在3.8萬(wàn)-7.2萬(wàn)年前就已開(kāi)始分化;同時(shí)研究也揭示了現(xiàn)代馬的基因組變異的原因可能是因?yàn)榕c已經(jīng)滅絕的野馬物種后代進(jìn)行的雜種交配所致。研究也說(shuō)明了對(duì)古代馬基因組的研究有助于更好的研究現(xiàn)代馬的起源馴化過(guò)程。Huang等[30]分別對(duì)雄性蒙古馬和普氏野馬個(gè)體進(jìn)行全基因組重測(cè)序研究,在對(duì)蒙古馬5號(hào)染色體與普氏野馬23、24號(hào)染色體間的序列相似性分析中,發(fā)現(xiàn)了蒙古馬和普氏野馬間的一次染色體羅伯遜易位事件。并且發(fā)現(xiàn)羅伯遜易位并沒(méi)有導(dǎo)致染色體更多的局部重排,揭示羅伯遜易位和染色體局部重排可能是由不同的機(jī)制引起的;研究還發(fā)現(xiàn)兩種重復(fù)序列對(duì)基因組的不穩(wěn)定性有著強(qiáng)烈的影響。另外,該研究還分別拼接組裝成了2 Mb和3 Mb大小的Y染色體序列,獲得了最完整的馬的Y染色體的序列圖譜,對(duì)種公馬繁殖力和對(duì)現(xiàn)代馬業(yè)育種工作都具有重要的科研和實(shí)用價(jià)值。
Doan等[31]首次利用下一代測(cè)序平臺(tái)Illumina GA II對(duì)夸特馬進(jìn)行測(cè)序深度達(dá)24.7x的重測(cè)序研究,遺傳變異檢測(cè)分析中發(fā)現(xiàn)2 814 367個(gè)新的SNPs和193 271個(gè)插入缺失(Indels)和282個(gè)拷貝數(shù)變異(CNVs),極大的豐富了馬的遺傳資源多樣性研究?jī)?nèi)容。功能富集分析發(fā)現(xiàn)遺傳變異主要富集在感官知覺(jué)、信號(hào)轉(zhuǎn)導(dǎo)、免疫和防御等通路上,其中感官知覺(jué)通路上含有的遺傳突變最多(SNPs占27%,CNVs占60%),對(duì)夸特的表型差異或疾病相關(guān)遺傳變異的研究提供了重要的遺傳資源。Jun等[32]利用Illumina HiSeq 2 000測(cè)序平臺(tái)第一次對(duì)測(cè)序深度達(dá)30x亞洲品種馬瓦里馬的重測(cè)序結(jié)果進(jìn)行分析,發(fā)現(xiàn)了5 923 566個(gè)SNPs(其中1 577 725新發(fā)現(xiàn)的SNPs)、578 055個(gè)插入缺失(Indels)和2 579個(gè)拷貝數(shù)變異(CNVs)。對(duì)新發(fā)現(xiàn)的SNPs進(jìn)行注釋后發(fā)現(xiàn)主要富集在嗅覺(jué)功能方面;群體進(jìn)化與結(jié)構(gòu)分析發(fā)現(xiàn)馬瓦里馬與阿拉伯馬之間的遺傳關(guān)系最近,蒙古馬和阿拉伯馬對(duì)馬瓦里馬的血統(tǒng)構(gòu)成比例分別為65.8%和34.2%,為亞洲馬匹的研究打開(kāi)了科學(xué)之門(mén)。研究還發(fā)現(xiàn)TSHZ1基因可能與馬瓦里馬獨(dú)特的耳朵尖部向內(nèi)翻卷的表型性狀相關(guān),基因SCL26A2的g.27991841A>G突變與馬的隱性軟骨發(fā)育不全相關(guān)。在純血馬的研究中發(fā)現(xiàn),與純血馬賽馬耐力(COX4I1,ACN9),馬體型大?。℉MGA2,LASP1)和運(yùn)動(dòng)模式(DMRT3)等相關(guān)的基因受到人工選擇作用,進(jìn)一步加深了對(duì)馬的不同差異性狀遺傳機(jī)理的理解。
為研究矮種馬的特殊表型和適應(yīng)性遺傳機(jī)理。Metzger等[33]對(duì)矮種馬的測(cè)序研究,結(jié)合26個(gè)品種的馬屬動(dòng)物,發(fā)現(xiàn)基因ACAN的外顯子7的突變的g.94370258G>C與矮化表型相關(guān)。Yakutian是北亞極寒地區(qū)的品種,對(duì)寒冷環(huán)境具有獨(dú)特的適應(yīng)機(jī)制,利用比較基因組的方法,Librado等[34]發(fā)現(xiàn)BARX2、PHIP、PRKG1等受選擇作用的基因可能與適應(yīng)亞北極區(qū)寒冷環(huán)境機(jī)制有關(guān)。
鑒于馬在娛樂(lè)、疾病研究等方面的重要作用,在基因組的水平上更大規(guī)模群體和品種的研究以及古DNA的研究有助于更好的理解馬的進(jìn)化、群體遺傳結(jié)構(gòu)和選擇作用導(dǎo)致的表型差異,對(duì)馬的定向選育和研究是一件迫切需要的科研工作,也定會(huì)一定程度上對(duì)揭示人類疾病遺傳機(jī)理提供重要的參考。
作為第一個(gè)被研究的反芻動(dòng)物,2003年,由多個(gè)國(guó)家聯(lián)合啟動(dòng)了“牛基因組測(cè)序計(jì)劃”。結(jié)合BCA克隆與全基因組鳥(niǎo)槍測(cè)序方法,到2009年正式公布了第一頭牛(海福特牛)的全基因組序列,功能注釋發(fā)現(xiàn)了?;蚪M中包含22 000多個(gè)編碼蛋白基因,對(duì)基因組的深入分析也揭示了反芻動(dòng)物特有的多個(gè)生物學(xué)特性,如5個(gè)與人類脂肪酸、甲戊二羥酸、解毒、嘧啶代謝途徑相關(guān)的基因在牛基因組中缺失或者變異[35]。同年,由美國(guó)馬里蘭大學(xué)牽頭的牛基因組研究團(tuán)隊(duì)通過(guò)改進(jìn)組裝方法獲得2.67 Gb大小的?;蚪M,完成了Y染色體序列較為完整的組裝在共線性研究中發(fā)現(xiàn)了268個(gè)與人的同源線性區(qū)域,基因組序列測(cè)定的完成對(duì)加快牛類疾病遺傳基礎(chǔ)的認(rèn)識(shí),減少養(yǎng)牛業(yè)對(duì)抗生素的依賴的遺傳研究,并為生產(chǎn)出更好質(zhì)量的牛肉和牛奶等產(chǎn)品提供了可靠的依據(jù),也為加速遺傳改良提供了更精確的分子輔助育種基礎(chǔ)[35]。隨后,瘤牛(Bos indicus)和牦牛(Bos grunniens)的基因組序列均被組裝成功,并揭示了大量種群特異基因,為品種鑒定和物種遺傳多樣性提供了基因組水平的依據(jù)[36-37]。
為研究牛的進(jìn)化歷史。Bovine等[38]通過(guò)對(duì)19個(gè)不同品種的497頭牛的重測(cè)序數(shù)據(jù)與參考基因組之間的比對(duì)分析產(chǎn)生的34 470 SNP,推測(cè)??赡芤蝰Z化瓶頸、選擇作用及育種等原因?qū)е屡5挠行后w大小迅速降低,但非洲的達(dá)摩牛沒(méi)有受到強(qiáng)烈的馴化瓶頸。日本科研人員Kawahara-Miki等[39]對(duì)地方品種口子島牛進(jìn)行深度達(dá)15.8 x的深度測(cè)序,共獲得550個(gè)新發(fā)現(xiàn)的SNP和約65萬(wàn)個(gè)Indels。檢測(cè)分析發(fā)現(xiàn)了分布在4 643個(gè)基因中的 11 713個(gè)非同義突變,其中大約有100個(gè)基因與蛋白結(jié)合、活性催化及代謝通路等有關(guān),為亞洲牛重要經(jīng)濟(jì)性狀表型變異的關(guān)聯(lián)分析及分子水平上的遺傳改良提供了可能。此外,研究中還結(jié)合已有的基因組序列進(jìn)行系統(tǒng)發(fā)育研究,發(fā)現(xiàn)在遺傳上口子島牛與歐洲家養(yǎng)牛表現(xiàn)出極大的不同,可能具有獨(dú)特的進(jìn)化地位。
牦牛是西藏高原及其毗鄰地區(qū)特有的物種之一,在缺氧、高輻射等惡劣環(huán)境下的適應(yīng)性引起科學(xué)家們的關(guān)注。邱強(qiáng)等[37]通過(guò)Illumina HiSeq 測(cè)序平臺(tái)采用鳥(niǎo)槍測(cè)序法一頭家牦牛進(jìn)行從頭組裝共獲得了65x深度的數(shù)據(jù),對(duì)獲得的測(cè)序數(shù)據(jù)進(jìn)行分析,在與家牛的同源基因分析中發(fā)現(xiàn)了牦牛特有的100個(gè)基因。在正選擇分析中,牦牛受到正選擇的基因主要富集在缺氧性應(yīng)激和能量代謝,如ADAM17、ARG2和MMP3基因等。在基因家族分析中發(fā)現(xiàn)大量擴(kuò)張基因主要富集在嗅覺(jué)受體活性、味覺(jué)感知、能量代謝和ATP合成等方面。對(duì)一些與高海拔低氧環(huán)境相適、嗅覺(jué)、防御和免疫等相關(guān)基因的重要選擇性變異的研究,將有利于揭示高海拔地區(qū)動(dòng)物高原適應(yīng)性生理性狀背后的遺傳基礎(chǔ)。Wang等[40]在野生與家養(yǎng)牦牛研究中,采用Illumina HiSeq 2000測(cè)序平臺(tái)分別對(duì)采自不同地區(qū)的3頭野牦牛和3頭家牦牛進(jìn)行測(cè)序分析,共檢測(cè)到700多萬(wàn)個(gè)新的SNPs突變,豐富了牦?,F(xiàn)有的遺傳資源庫(kù)。群體連鎖不平衡分析顯示,家牦牛的LD消減速率較慢,可能與牦牛馴化過(guò)程中的進(jìn)化瓶頸有關(guān)。在發(fā)現(xiàn)的1 000多個(gè)馴化過(guò)程中的受選擇區(qū)域進(jìn)行注釋和功能聚類分析發(fā)現(xiàn),主要富集在炎癥應(yīng)急、抗體轉(zhuǎn)運(yùn)和防御應(yīng)答等方面;與體型相關(guān)的基因PLAG1和奶品質(zhì)特征相關(guān)的基因DGAT1和ABCG2是重要的馴化相關(guān)基因。因此,加強(qiáng)牦牛遺傳資源的研究有助于分子標(biāo)記輔助選擇和其他牛科動(dòng)物的遺傳多樣性研究。
Choi等[41]采用Illumina測(cè)序儀分別對(duì)10個(gè)韓牛和10個(gè)延邊牛進(jìn)行平均深達(dá)10.71 x和10.53 x測(cè)序工作,比對(duì)到參考基因組后共檢測(cè)到一千七百多萬(wàn)個(gè)SNP突變,其中有22.3%為新發(fā)現(xiàn)的SNP;選擇性清除分析確定了幾個(gè)可能與重要經(jīng)濟(jì)性狀相關(guān)的位點(diǎn),例如PPP1R12A基因可能與肌內(nèi)脂肪沉積相關(guān)。這些研究為進(jìn)行亞洲牛的遺傳特征和起源馴化研究提供了資源,為種質(zhì)資源的保護(hù)提供了科學(xué)的借鑒資料。
為研究不同品種牛間的基因組遺傳差異。Stothard等[42]分別對(duì)一頭黑安格斯牛公牛和一頭美國(guó)荷斯坦公牛的進(jìn)行遺傳變異檢測(cè)和比較分析。比對(duì)參考基因組后,共發(fā)現(xiàn)7百多萬(wàn)個(gè)遺傳變異,其中僅24%是共有的,在一定程度上說(shuō)明了不同選擇作用會(huì)導(dǎo)致了不同品種間遺傳差異。研究中還發(fā)現(xiàn),PLA2G2D基因的拷貝數(shù)變異與安格斯牛的體重和屠宰性狀等相關(guān)。
世界范圍內(nèi)共有800多個(gè)牛品種,其中中國(guó)就有52個(gè)之多,品種之間的遺傳多樣性研究為現(xiàn)代化專業(yè)化商業(yè)品系的培育提供了廣泛的遺傳資源,進(jìn)一步挖掘、利用牛的遺傳資源,有利于生產(chǎn)產(chǎn)奶量高、質(zhì)量更好、肉品質(zhì)優(yōu)良的品種。傳統(tǒng)數(shù)量遺傳學(xué)育種方法在牛的重要經(jīng)濟(jì)性狀方面取得了巨大的成就,我們相信,利用現(xiàn)代的高科技技術(shù)可以在更短的時(shí)間內(nèi)培育出更多的理想品種(品系),因此加強(qiáng)對(duì)牛的基因組學(xué)的研究是非常有必要的。
綿羊(Ovis aries)和山羊(Caprine hircus),是最早被馴化飼養(yǎng)的反芻動(dòng)物,分別屬于牛科的山羊?qū)俸途d羊?qū)?,為人類提供肉、毛、奶、皮革等產(chǎn)品,是世界農(nóng)業(yè)經(jīng)濟(jì)的重要組成部分。據(jù)考古等方法研究表明,它們可能于10 000年前就在西亞的肥沃新月形地帶經(jīng)歷了最初的馴化過(guò)程[43-44]。
2.4.1 綿羊基因組測(cè)序研究 Jiang等[45]在2014年完成并在線發(fā)表了綿羊高質(zhì)量參考基因組解析工作,結(jié)合40個(gè)不同組織的轉(zhuǎn)錄組測(cè)序數(shù)據(jù),發(fā)現(xiàn)綿羊染色體上約有1 000萬(wàn)個(gè)單核苷酸多態(tài)性變異、141個(gè)大結(jié)構(gòu)改變和近10 000個(gè)拷貝數(shù)變異。此外,分析鑒定出一系列反芻動(dòng)物特有的基因家族擴(kuò)張事件、基因結(jié)構(gòu)變異和基因表達(dá)的組織特異性變化,其中最重要的是發(fā)現(xiàn)了反芻動(dòng)物獨(dú)特的消化系統(tǒng)和脂類代謝進(jìn)化相關(guān)聯(lián)的特異基因,并在綿羊皮膚中找到了控制脂類合成的關(guān)鍵基因MOGAT2和MOGAT3,綿羊參考基因組的發(fā)布和分析,使我們對(duì)反芻動(dòng)物生物學(xué)有了嶄新的認(rèn)識(shí)”,并了解了“反芻動(dòng)物成為最繁盛的陸地食草動(dòng)物的原因”。Miller等[46]采用ABI SOLiD測(cè)序平臺(tái)對(duì)一只大角羊公羊進(jìn)行了12x深度的基因組測(cè)序,檢測(cè)到1 400萬(wàn)個(gè)SNPs和一百多萬(wàn)個(gè)插入缺失變異,在同義與非同義突變基因本體論(GO)分析中有 40個(gè)差異表達(dá)的分類,其中導(dǎo)致氨基酸變化主要參與精子發(fā)生和乳腺上皮細(xì)胞增殖的負(fù)調(diào)控的兩個(gè)分類,揭示了馴化過(guò)程中選擇作用導(dǎo)致對(duì)繁殖性狀、肌肉特性等其他性狀上的差異。Kardos等[47]采用Illumina HiScan測(cè)序平臺(tái)對(duì)58個(gè)采自3個(gè)不同地方的大角羊群體進(jìn)行混合池測(cè)序,對(duì)測(cè)序結(jié)果分析檢測(cè)到280多萬(wàn)個(gè)SNP用于后續(xù)的分析。在群體遺傳差異分析中發(fā)現(xiàn)來(lái)自大提頓山脈的兩個(gè)群體間遺傳差異較大,推測(cè)是較低的基因流動(dòng)和群體內(nèi)嚴(yán)格的遺傳漂變?cè)斐傻?。在選擇信號(hào)分析發(fā)現(xiàn)可能與大角羊的環(huán)境適應(yīng)、身體生長(zhǎng)相關(guān)的14號(hào)染色體上HIF3A和IGFL1基因、16號(hào)染色體上GHR基因和8號(hào)染色體上的IGF2R基因。Yang等[48]對(duì)77只綿羊和3只野羊進(jìn)行重測(cè)序,比較極端環(huán)境下和對(duì)照環(huán)境下(如高原和平原、干旱沙漠和濕潤(rùn)地區(qū))樣本的基因組發(fā)現(xiàn)了一系列與綿羊極端環(huán)境適應(yīng)性相關(guān)的候選基因,并進(jìn)行生物學(xué)功能和信號(hào)通路分析發(fā)現(xiàn)高原環(huán)境下受選擇的基因和通路與低氧耐受相關(guān),沙漠環(huán)境下受選擇的基因與水分子的重吸收有關(guān),從基因組水平上闡明了極端環(huán)境下綿羊的適應(yīng)性遺傳機(jī)理。這些研究為探索羊?qū)賱?dòng)物遺傳適應(yīng)性和選擇進(jìn)化提供了良好的開(kāi)端。
Liu等[49]對(duì)多浪羊、小尾寒羊和蒙古羊的混合池測(cè)序發(fā)現(xiàn)1 700多萬(wàn)個(gè)SNP和290多萬(wàn)個(gè)Indels。此外,對(duì)全基因組選擇信號(hào)分析發(fā)現(xiàn)143基因組區(qū)域受到選擇作用,其中RPS6KA3、MAD2L1、CCNB2、GNAI2、ADCY5、PIK3R5和 CDC25B等 基因與短尾羊繁殖性狀相關(guān);與角的有無(wú)相關(guān)的基因(RXFP2),與耳朵發(fā)育相關(guān)的基因(OTX1、SOD1 LHFPL5、HOXA2和GJB6)與繁殖性狀相關(guān)的基因(TSHR和PRL)等也受到不同的選擇作用。全基因組水平遺傳變異的研究會(huì)進(jìn)一步加深我們對(duì)不同用途綿羊品種遺傳機(jī)理的理解,為培育肉羊新品種和滿足不斷增長(zhǎng)的肉品需求提供了科學(xué)依據(jù)。
2.4.2 山羊基因組測(cè)序研究 山羊是適應(yīng)性較強(qiáng)的馴化家畜,廣泛分布于世界范圍內(nèi)的山地、荒漠等環(huán)境惡劣的地區(qū),為人類提供肉、毛、皮等生活用品,尤其在偏遠(yuǎn)地區(qū)的經(jīng)濟(jì)發(fā)展中發(fā)揮著重要作用。
2012年,利用Illumina/Solexa短讀長(zhǎng)測(cè)序和全基因組酶切圖譜等技術(shù),Dong等[50]從頭組裝了首個(gè)山羊基因組序列精細(xì)圖譜,并完成了基因組的結(jié)構(gòu)和功能注釋工作,其中Contig N50 為18 720 bp,Scaffoled N50為16.3 Mb。利用山羊與牛的保守共線性關(guān)系,將超長(zhǎng)Scaffold序列定位到染色體上,最后獲得了2.66 Gb大小的高質(zhì)量基因組序列,共包括22 175個(gè)基因。轉(zhuǎn)座子分析中發(fā)現(xiàn)山羊基因組中的轉(zhuǎn)座子與牛的類似,包含大量的反芻動(dòng)物特異性重復(fù)序列,而在山羊中短散在核元件(SINE-tRNA)轉(zhuǎn)座子較多。通過(guò)比較基因組分析發(fā)現(xiàn)山羊與牛的親緣關(guān)系較近,大約在2 300萬(wàn)年前分化。此外,山羊基因組中約有44個(gè)基因受到正選擇,其中7個(gè)與免疫相關(guān),而與產(chǎn)奶量、胚胎發(fā)育以及羊毛形態(tài)等相關(guān)的垂體功能相關(guān)的基因發(fā)生了快速進(jìn)化。在基因家族分析中發(fā)現(xiàn)3個(gè)與味覺(jué)受體相關(guān)的基因亞家族擴(kuò)張和1個(gè)亞家族收縮現(xiàn)象,推測(cè)這可能與山羊的覓食能力相關(guān)(如FTH1基因家族的擴(kuò)張)。研究中還對(duì)我國(guó)內(nèi)蒙古絨山羊的初級(jí)毛囊和次級(jí)毛囊進(jìn)行轉(zhuǎn)錄組的比較分析發(fā)現(xiàn),KAP、FGF、Wntβcatenin等基因家族的51個(gè)差異表達(dá)基因。這些差異表達(dá)的基因在絨毛形態(tài)、毛囊周期變化、絨毛細(xì)度等性狀方面有重要作用,為在基因組水平上進(jìn)行絨山羊羊絨質(zhì)量的改良和分子標(biāo)記輔助山羊育種奠定了基礎(chǔ)。Du等[51]利用高密度放射自顯雜交(RH)技術(shù)對(duì)一代山羊參考基因組進(jìn)行了補(bǔ)充,極大的提高了基因組的可靠性和準(zhǔn)確性,為山羊重測(cè)序研究奠定了堅(jiān)實(shí)的基礎(chǔ)。2017年,結(jié)合二代Illumina、三代Pacbio單分子測(cè)序、光學(xué)圖譜BioNano和Hi-C等技術(shù),Bickhart等[16]對(duì)圣克利門(mén)蒂山羊進(jìn)行基因組從頭測(cè)序組裝,獲得了僅含有663個(gè)空白序列的高質(zhì)量山羊基因組精細(xì)圖譜(ARS1)。相較于之前的組裝版本 CHIR_2.0和CHIR_1.0,ARS1版本填補(bǔ)了CHIR_2.0版本中的3,495個(gè)內(nèi)含子或外顯子有空白序列的基因。研究中還把具有高度多態(tài)性和重復(fù)性免疫基因區(qū)的 LRC和NKC基因定位在一個(gè)獨(dú)立的常染色體scaffold上。而其他重復(fù)復(fù)雜序列區(qū)域,端粒序列、著絲粒區(qū)等都有較好的組裝結(jié)果,如在19號(hào)和23號(hào)染色體等組裝出高度重復(fù)的著絲粒和端粒區(qū)域,貫通了有結(jié)構(gòu)性異染色質(zhì)區(qū)的染色體。此次組裝的基因組為山羊基因組的研究將提供了更為全面的基因組信息,為山羊功能基因組的研究奠定了堅(jiān)實(shí)的基礎(chǔ)。
山羊的馴化過(guò)程導(dǎo)致家山羊與野山羊在體型、行為、角型和被毛顏色等方面發(fā)生顯著的變化。Dong等[52]對(duì)野山羊(Capra aegagrus)進(jìn)行了de novo從頭組裝測(cè)序,與參考基因組比較分析發(fā)現(xiàn)13拷貝數(shù)變異基因(ASIP、ATRN、Fig. 4、GNAQ、HELLS、MUTED、OSTM1、TRPM7、VPS33A、Adamts、MITF、OCA2和SLC7A11)與被毛顏色有關(guān),如ASIP基因重復(fù)與白色的表型相關(guān)。此外,與野山羊的較強(qiáng)的警覺(jué)行為(CACNA1C)、與家山羊的溫順行為(HTR3A)、免疫(CFH,TRIM5)、生產(chǎn)性狀(MYADM,BTN1A1,PRAME)等有關(guān)的基因也發(fā)生拷貝數(shù)變異和快速的進(jìn)化現(xiàn)象。這些基因組水平發(fā)生顯著差異變化的基因?yàn)槲磥?lái)山羊功能基因的研究提供候選基因和,也為理解動(dòng)物馴化的遺傳機(jī)制提供了有用的信息。
山羊自馴化之后,隨著人類活動(dòng)快速地?cái)U(kuò)散到世界不同的生態(tài)環(huán)境當(dāng)中,在長(zhǎng)期的自然選擇和人工選擇作用下,適應(yīng)了不同的自然環(huán)境和生產(chǎn)方向。Benjelloun等[53]對(duì)摩洛哥不同地區(qū)山羊基因組重測(cè)序研究發(fā)現(xiàn),與哺乳動(dòng)物毛發(fā)調(diào)控和色素沉著的基因ASIP受到選擇作用,而TRAP1基因也受到選擇作用,可能與惡劣環(huán)境適應(yīng)相關(guān),為干旱條件下山羊的適應(yīng)性遺傳機(jī)理研究奠定了基礎(chǔ)。為研究不同生產(chǎn)用途和自然環(huán)境的山羊基因組特征,Wang等[54]對(duì)中國(guó)八個(gè)山羊品種的進(jìn)行深度為9-13X混合測(cè)序,發(fā)現(xiàn)了1 000多萬(wàn)個(gè)SNP突變,通過(guò)選擇性清除分析發(fā)現(xiàn)了與毛色相關(guān)(ASIP、KITLG、HTT、GNA11和 OSTM1)、體格大?。═BX15、DGCR8、CDC25A和RDH16)、絨毛性狀(LHX2、FGF9和WNT2)和缺氧適應(yīng)性(CDK2、SOCS2、NOXA1和 ENPEP)等相關(guān)的候選基因在不同群體中受到選擇作用,加深了我們對(duì)中國(guó)山羊遺傳多樣性遺傳機(jī)制的理解。Guan等[55]對(duì)大足黑山羊和內(nèi)蒙古絨山羊阿拉善型進(jìn)行基因組測(cè)序發(fā)現(xiàn),5.03百萬(wàn)個(gè)SNP和334,151個(gè)InDels突變,選擇信號(hào)掃描分析發(fā)現(xiàn)了與大足黑山羊繁殖性狀相關(guān)的候選基因(PAIP2B、CCDC64、EPB41L5,BIRC6),與生產(chǎn)性狀相關(guān)的基因(如PAIP2B、CCDC64,EPB41L5等)、與脂肪沉積相關(guān)的基因(IKBKG,LOC102190823)、肌肉質(zhì)量性狀相關(guān)基因(PLD2)和產(chǎn)奶性狀相關(guān)基因(IDH1)等也受到了不同的選擇作用。這些加深了我們對(duì)絨毛性狀、繁殖性狀相關(guān)基因的理解,將進(jìn)一步促進(jìn)在基因組水平上進(jìn)行新品種的選育和基因改良。
為研究培育品種云南黑山羊的基因組分子特征(由云嶺黑山羊和努比羊雜交培育而成),蘭蓉等[56]利用混合池測(cè)序的方法對(duì)具有代表性的3個(gè)雜交母羊進(jìn)行全基因組重測(cè)序,檢測(cè)到了7 615 774 個(gè)SNP、877 232 個(gè) INDEL 和40 005 個(gè) SV 等遺傳變異,并對(duì)這些變異進(jìn)行注釋,闡明了云南黑山羊的分子特征,為后續(xù)功能基因的研究提供了強(qiáng)大的數(shù)據(jù)支撐,并為功能基因的定位提供新的思路和線索。此研究表明,全基因組重測(cè)序可以全面、快速、準(zhǔn)確地解析不同品種的分子遺傳特征,為品種的不斷選育提高及開(kāi)發(fā)利用奠定堅(jiān)實(shí)的基礎(chǔ)。
為研究韓國(guó)本地山羊?qū)χ笭钭捉z蟲(chóng)引起的的山羊腰麻痹病較強(qiáng)抵抗力的遺傳基礎(chǔ)。Lee等[57]對(duì)15韓國(guó)地方品種(韓國(guó)小黑山羊)個(gè)體和11雜交山羊個(gè)體(韓國(guó)小黑山羊與薩能奶山羊、波爾山羊的雜交)進(jìn)行全基因組重測(cè)序研究,其中遺傳多樣性分析發(fā)現(xiàn)本地山羊遺傳多樣性小于雜交山羊,可能與地方品種的近交繁殖以及雜交群體中不斷導(dǎo)入的外來(lái)血的遺傳信息相關(guān)。選擇性清除分析發(fā)現(xiàn)基因(CCR3、CLNK、HM13、IGSF10、ROBO1和 NTM)可能與韓國(guó)地方山羊?qū)τ芍笭钭捉z蟲(chóng)引起的的山羊腰麻痹病具有較強(qiáng)的抵抗力相關(guān);而基因(CYM和COL11A2)可能與地方山羊品種中羔羊的生長(zhǎng)發(fā)育相關(guān),進(jìn)而影響地方山羊的體格大小等表型性狀。抗病性差異的研究為今后利用基因組重測(cè)序數(shù)據(jù)來(lái)揭示地方品種適應(yīng)性的潛在遺傳機(jī)制和進(jìn)行疾病抗性山羊新品種的選育工作奠定了科學(xué)基礎(chǔ)。
隨著測(cè)序技術(shù)和分子生物學(xué)的進(jìn)一步發(fā)展,在越來(lái)越多的物種中開(kāi)展了基因組序列組裝及重測(cè)序研究,產(chǎn)生了海量的測(cè)序數(shù)據(jù)上傳到公共數(shù)據(jù)庫(kù)并仍在繼續(xù)增加。面對(duì)如此巨大的數(shù)據(jù)量,對(duì)當(dāng)前的數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析挖掘等技術(shù)提出了嚴(yán)峻的考驗(yàn),主要面臨以下問(wèn)題:(1)全基因組測(cè)序的成本依舊較高,在經(jīng)濟(jì)價(jià)值相對(duì)較低的物種中,很難開(kāi)展大規(guī)模的研究工作。雖然,基因分型芯片技術(shù)在一定程度上能夠補(bǔ)充以上缺點(diǎn),但其限于常見(jiàn)變異的研究,不能對(duì)稀有變異進(jìn)行分析研究。(2)盡管基因組序列組裝不斷的接近完成圖,但依然存在較多的空白,而且基因組中的高重復(fù)、復(fù)雜區(qū)域依舊是基因組組裝面臨的重要問(wèn)題,為深入研究基因組特征帶來(lái)一些困難。(3)第二代測(cè)序技術(shù)產(chǎn)生的序列讀長(zhǎng)較短,難以跨越高重復(fù)序列區(qū)域以及具有堿基偏好性,對(duì)復(fù)雜區(qū)域的研究一直是其短板。與參考基因組比對(duì)時(shí),短讀長(zhǎng)序列可能會(huì)在基因組中比對(duì)到多個(gè)位置。(4)第三代測(cè)序技術(shù)在讀長(zhǎng)方面較第二代測(cè)序技術(shù)具有明顯的優(yōu)勢(shì),但因其錯(cuò)誤率高的特點(diǎn)需要進(jìn)行大量測(cè)序數(shù)據(jù)進(jìn)行糾正,以及本身的測(cè)序費(fèi)用較高等原因,目前的重測(cè)序領(lǐng)域尚未進(jìn)行大規(guī)模應(yīng)用。(5)在測(cè)序數(shù)據(jù)快速增加的背景下,如何有效地深度挖掘其潛藏的遺傳信息,成為目前面臨的主要的問(wèn)題。因此,需要不斷的進(jìn)行算法和計(jì)算性能的優(yōu)化。(6)基因組數(shù)據(jù)研究是其他功能研究的基礎(chǔ),但表型性狀的遺傳機(jī)理十分復(fù)雜,如何有效的開(kāi)展多組學(xué)研究也是今后面臨的主要問(wèn)題。
面對(duì)以上問(wèn)題,科學(xué)家們也一直在不斷的進(jìn)行理論研究和技術(shù)應(yīng)用探索。在數(shù)據(jù)分析方面,各種分析網(wǎng)站和數(shù)據(jù)庫(kù)越來(lái)越智能化和簡(jiǎn)約化,實(shí)現(xiàn)了對(duì)算法不斷優(yōu)化、數(shù)據(jù)冗余的降低以及數(shù)據(jù)解碼效率的提高,雖然目前對(duì)數(shù)據(jù)存取的效率始終面臨的主要問(wèn)題,但不久的將來(lái)一定會(huì)取得突破性進(jìn)展[58]。今后,對(duì)長(zhǎng)度長(zhǎng)測(cè)序技術(shù)的不斷改進(jìn)和對(duì)相應(yīng)算法的開(kāi)發(fā)研究將是一個(gè)研究重點(diǎn)。對(duì)于測(cè)序成本問(wèn)題,需要不斷的優(yōu)化現(xiàn)有的測(cè)序技術(shù),進(jìn)一步降低研究成本。為充分利用財(cái)力、物力、人力資源和潛在的測(cè)序數(shù)據(jù)價(jià)值,各國(guó)科學(xué)家們也在不斷的加強(qiáng)國(guó)家間的合作研究,國(guó)際性的合作不僅加快了研究進(jìn)展,更是增加了學(xué)術(shù)間的交流,進(jìn)而促進(jìn)科學(xué)的快速發(fā)展。此外,古DNA保存技術(shù)和提取技術(shù)的不斷進(jìn)步,也為精確地進(jìn)行不同物種的群體歷史動(dòng)態(tài)研究提供了良好的研究材料?;蚪M學(xué)研究是從正向遺傳學(xué)的角度來(lái)進(jìn)行基因功能的研究,而生物體的基因與基因、基因與環(huán)境的復(fù)雜互作關(guān)系,容易導(dǎo)致假陽(yáng)性結(jié)果。因此,為解決基因組測(cè)序研究出現(xiàn)的假陽(yáng)性問(wèn)題,對(duì)物種進(jìn)行轉(zhuǎn)錄組學(xué)、代謝組學(xué)和蛋白質(zhì)組學(xué)比較,進(jìn)行反向遺傳學(xué)的功能驗(yàn)證手段,將是全基因組測(cè)序今后研究工作的重點(diǎn)和方向。在家畜上的基因組水平的深入研究也將不斷增加我們對(duì)重要經(jīng)濟(jì)性狀的遺傳機(jī)制的理解,在育種實(shí)踐上減少疾病或遺傳缺陷的發(fā)生,為提高產(chǎn)品質(zhì)量、生產(chǎn)效率及精確快速育種作出重要貢獻(xiàn)。此外,基因組測(cè)序的深入研究也有助于稀有變異的發(fā)掘,培育出更優(yōu)良的專門(mén)化畜禽新品種,發(fā)揮特色物種的各種遺傳潛力,具有重要的不可估量科研價(jià)值。
[1]Andersson L. Genetic dissection of phenotypic diversity in farm animals[J]. Nat Rev Genet, 2001, 2(2):130-138.
[2]Diamond J. Evolution, consequences and future of plant and animal domestication[J]. Nature, 2002, 418(6898):700-707.
[3]Bentley DR. Whole-genome re-sequencing[J]. Curr Opin Genet Dev, 2006, 16(6):545-552.
[4]Fuentes-Pardo AP, Ruzzante DE. Whole-genome sequencing approaches for conservation biology:Advantages, limitations and practical recommendations[J]. Mol Ecol, 2017, 26(20):5369-5406.
[5]Li M, Chen L, Tian S, et al. Comprehensive variation discovery and recovery of missing sequence in the pig genome using multiple De novo assemblies[J]. Genome Res, 2017, 27(5):865-874.
[6]Venter JC, Adams MD, Myers EW, et al. The sequence of the human genome[J]. Science, 2001, 291(5507):1304-1351.
[7]Lander ES, Linton LM, Birren B, et al. Initial sequencing and analysis of the human genome[J]. Nature, 2001, 409(6822):860-921.
[8]Koboldt DC, Steinberg KM, Larson DE, et al. The next-generation sequencing revolution and its impact on genomics[J]. Cell, 2013,155(1):27-38.
[9]Wang GD, Xie HB, Peng MS, et al. Domestication genomics:evidence from animals[J]. Annu Rev Anim Biosci, 2014, 2:65-84.
[10]Goodwin S, McPherson JD, McCombie WR. Coming of age:ten years of next-generation sequencing technologies[J]. Nat Rev Genet, 2016, 17(6):333-351.
[11]Mardis ER. Next-generation DNA sequencing methods[J]. Annu Rev Genomics Hum Genet, 2008, 9:387-402.
[12]Munroe DJ, Harris TJ. Third-generation sequencing fireworks at Marco Island[J]. Nat Biotechnol, 2010, 28(5):426-428.
[13]Ono Y, Asai K, Hamada M. PBSIM:PacBio reads simulator--toward accurate genome assembly[J]. Bioinformatics, 2013, 29(1):119-121.
[14]Mascher M, Gundlach H, Himmelbach A, et al. A chromosome conformation capture ordered sequence of the barley genome[J].Nature, 2017, 544(7651):427-433.
[15]Clavijo BJ, Venturini L, Schudoma C, et al. An improved assembly and annotation of the allohexaploid wheat genome identifies complete families of agronomic genes and provides genomic evidence for chromosomal translocations[J]. Genome Res, 2017,27(5):885-896.
[16]Bickhart DM, Rosen BD, Koren S, et al. Single-molecule sequencing and chromatin conformation capture enable De novo reference assembly of the domestic goat genome[J]. Nat Genet,2017, 49(4):643-650.
[17]Groenen MA, Archibald AL, Uenishi H, et al. Analyses of pig genomes provide insight into porcine demography and evolution[J]. Nature, 2012, 491(7424):393-398.
[18]Li M, Tian S, Jin L, et al. Genomic analyses identify distinct patterns of selection in domesticated pigs and Tibetan wild boars[J]. Nat Genet, 2013, 45(12):1431-1438.
[19]Ai H, Fang X, Yang B, et al. Adaptation and possible ancient interspecies introgression in pigs identified by whole-genome sequencing[J]. Nat Genet, 2015, 47(3):217-225.
[20]Li M, Tian S, Yeung CK, et al. Whole-genome sequencing of Berkshire(European native pig)provides insights into its origin and domestication[J]. Sci Rep, 2013, 4:4678.
[21]Ramírez O, Burgos-Paz W, Casas E, et al. Genome data from a sixteenth century pig illuminate modern breed relationships[J].Heredity(Edinb), 2015, 114(2):175-184.
[22]Rubin CJ, Megens HJ, Martinez Barrio A, et al. Strong signatures of selection in the domestic pig genome[J]. Proc Natl Acad Sci USA, 2012, 109(48):19529-19536.
[23]Choi JW, Chung WH, Lee KT, et al. Whole-genome resequencing analyses of five pig breeds, including Korean wild and native, and three European origin breeds[J]. DNA Res, 2015, 22(4):259-267.
[24]Wang C, Wang H, Zhang Y, et al. Genome-wide analysis reveals artificial selection on coat colour and reproductive traits in Chinese domestic pigs[J]. Mol Ecol Resour, 2015, 15(2):414-424.
[25]Groenen MA. A decade of pig genome sequencing:a window on pig domestication and evolution[J]. Genet Sel Evol, 2016, 48 :23.
[26]Fang X, Mou Y, Huang Z, et al. The sequence and analysis of a Chinese pig genome[J]. Gigascience, 2012, 1(1):16.
[27]Wade CM, Giulotto E, Sigurdsson S, et al. Genome sequence,comparative analysis, and population genetics of the domestic horse[J]. Science, 2009, 326(5954):865-867.
[28]Myka JL, Lear TL, Houck ML, et al. FISH analysis comparing genome organization in the domestic horse(Equus caballus)to that of the Mongolian wild horse(E. przewalskii)[J]. Cytogenet Genome Res, 2003, 102(1-4):222-225.
[29]Orlando L, Ginolhac A, Zhang G, et al. Recalibrating Equus evolution using the genome sequence of an early Middle Pleistocene horse[J]. Nature, 2013, 499(7456):74-78.
[30]Huang J, Zhao Y, Shiraigol W, et al. Analysis of horse genomes provides insight into the diversification and adaptive evolution of karyotype[J]. Sci Rep, 2014, 4:4958.
[31]Doan R, Cohen ND, Sawyer J, et al. Whole-Genome sequencing and genetic variant analysis of a quarter Horse mare[J]. BMC Genomics, 2012, 13:78.
[32]Jun J, Cho YS, Hu H, et al. Whole genome sequence and analysis of the Marwari horse breed and its genetic origin[J]. BMC Genomics, 2014, 15(Suppl 9):S4.
[33]Metzger J, Gast AC, Schrimpf R, et al. Whole-genome sequencing reveals a potential causal mutation for dwarfism in the Miniature Shetland pony[J]. Mamm Genome, 2017, 28(3-4):143-151.
[34]Librado P, Der Sarkissian C, Ermini L, et al. Tracking the origins of Yakutian horses and the genetic basis for their fast adaptation to subarctic environments[J]. Proc Natl Acad Sci USA, 2015, 112(50):E6889-E6897.
[35]Bovine Genome Sequencing and Analysis Consortium, Elsik CG,Tellam RL, et al. The genome sequence of taurine cattle:a window to ruminant biology and evolution[J]. Science, 2009, 324(5926):522-528.
[36]Canavez FC, Luche DD, Stothard P, et al. Genome sequence and assembly of Bos indicus[J]. J Hered, 2012, 103(3):342-348.
[37]Qiu Q, Zhang G, Ma T, et al. The yak genome and adaptation to life at high altitude[J]. Nat Genet, 2012, 44(8):946-949.
[38]Bovine HapMap Consortium, Gibbs RA, Taylor JF, et al. Genomewide survey of SNP variation uncovers the genetic structure of cattle breeds[J]. Science, 2009, 324(5926):528-532.
[39]Kawahara-Miki R, Tsuda K, Shiwa Y, et al. Whole-genome resequencing shows numerous genes with nonsynonymous SNPs in the Japanese native cattle Kuchinoshima-Ushi[J]. BMC Genomics, 2011, 12:103.
[40]Wang K, Hu Q, Ma H, et al. Genome-wide variation within and between wild and domestic yak[J]. Mol Ecol Resour, 2014, 14(4):794-801.
[41]Choi JW, Choi BH, Lee SH, et al. Whole-Genome Resequencing Analysis of Hanwoo and Yanbian Cattle to Identify Genome-Wide SNPs and Signatures of Selection[J]. Mol Cells, 2015, 38(5):466-473.
[42]Stothard P, Choi JW, Basu U, et al. Whole genome resequencing of black Angus and Holstein cattle for SNP and CNV discovery[J].BMC Genomics, 2011, 12:559.
[43]Luikart G, Gielly L, Excoffier L, et al. Multiple maternal origins and weak phylogeographic structure in domestic goats[J]. Proc Natl Acad Sci USA, 2001, 98(10):5927-5932.
[44]Chessa B, Pereira F, Arnaud F, et al. Revealing the history of sheep domestication using retrovirus integrations[J]. Science, 2009,324(5926):532-536.
[45]Jiang Y, Xie M, Chen W, et al. The sheep genome illuminates biology of the rumen and lipid metabolism[J]. Science, 2014,344(6188):1168-1173.
[46]Miller JM, Moore SS, Stothard P, et al. Harnessing cross-species alignment to discover SNPs and generate a draft genome sequence of a bighorn sheep(Ovis canadensis)[J]. BMC Genomics, 2015,16:397.
[47]Kardos M, Luikart G, Bunch R, et al. Whole genome resequencing uncovers molecular signatures of natural and sexual selection in wild bighorn sheep[J]. Mol Ecol, 2015, 24(22):5616-5632.
[48]Yang J, Li WR, Lv FH, et al. Whole-genome sequencing of native sheep provides insights into rapid adaptations to extreme environments[J]. Mol Biol Evol, 2016, 33(10):2576-2592.
[49]Liu Z, Ji Z, Wang G, et al. Genome-wide analysis reveals signatures of selection for important traits in domestic sheep from different ecoregions[J]. BMC Genomics, 2016, 17(1):863.
[50]Dong Y, Xie M, Jiang Y, et al. Sequencing and automated wholegenome optical mapping of the genome of a domestic goat(Capra hircus)[J]. Nat Biotechnol, 2013, 31(2):135-141.
[51]Du X, Servin B, Womack JE, et al. An update of the goat genome assembly using dense radiation hybrid maps allows detailed analysis of evolutionary rearrangements in Bovidae[J]. BMC Genomics, 2014, 15:625.
[52]Dong Y, Zhang X, Xie M, et al. Reference genome of wild goat(Capra aegagrus)and sequencing of goat breeds provide insight into genic basis of goat domestication[J]. BMC Genomics, 2015,16:431.
[53]Benjelloun B, Alberto FJ, Streeter I, et al. Characterizing neutral genomic diversity and selection signatures in indigenous populations of Moroccan goats(Capra hircus)using WGS data[J]. Front Genet, 2015, 6:107.
[54]Wang X, Liu J, Zhou G, et al. Whole-genome sequencing of eight goat populations for the detection of selection signatures underlying production and adaptive traits[J]. Sci Rep, 2016, 6 :38932.
[55]Guan D, Luo N, Tan X, et al. Scanning of selection signature provides a glimpse into important economic traits in goats(Capra hircus)[J]. Sci Rep, 2016, 6 :36372.
[56]蘭蓉, 朱蘭, 邵慶勇, 等. 云南黑山羊全基因組重測(cè)序[J].草食家畜, 2016, (5):11-17.
[57]Lee W, Ahn S, Taye M, et al. Detecting Positive Selection of Korean Native Goat Populations Using Next-Generation Sequencing[J].Mol Cells, 2016, 39(12):862-868.
[58]Erlich Y, Zielinski D. DNA Fountain enables a robust and efficient storage architecture[J]. Science, 2017, 355(6328):950-954.