許陶瑜,王長彪,韓 斌,趙興華,劉 江,任永康,牛瑜琦,唐朝暉
(1.山西大學(xué)生物工程學(xué)院,山西太原030006;2.山西省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所,山西汾陽032200;3.山西省農(nóng)業(yè)科學(xué)院生物技術(shù)研究中心,山西太原030031;4.山西省農(nóng)業(yè)科學(xué)院,山西太原030031)
小麥祖先種烏拉爾圖小麥、粗山羊草是異源六倍體小麥基因組A 和D 的供體,是構(gòu)成小麥基因的基礎(chǔ)。水稻(Oryza sativa)是較早進(jìn)行基因測序的物種,它具有較小的基因組、高效率的遺傳轉(zhuǎn)化、高密度的遺傳圖譜和物理圖譜等優(yōu)勢,使它成為了禾本科植物研究的模式作物。利用水稻作為參考基因組與小麥祖先種進(jìn)行全基因組比較分析,可以更深入地了解小麥祖先種的遺傳基礎(chǔ)、分子結(jié)構(gòu)、進(jìn)化關(guān)系,為小麥育種奠定基礎(chǔ)。
隨著基因組測序技術(shù)的發(fā)展[1-2],自SANGER 發(fā)明雙脫氧測序進(jìn)行核苷酸序列測定以來,越來越多的物種基因完成了全基因組測序。隨著對水稻[3]、小麥[4-5]及小麥祖先種烏拉爾圖[6-7]及粗山羊草[8]基因組測序工作的完成,使得水稻和小麥祖先種基因組比對分析成為可能?;蚪M比對分析是在基因組測序基礎(chǔ)上,通過對核苷酸序列、氨基酸序列進(jìn)行全基因組比對,從全基因組水平認(rèn)識基因組之間的異同[9-10]。比較基因組研究通常有2 種方式,一種是通過比較解釋差異,另一種是通過比較揭示共性。
培育高產(chǎn)[11]、抗病、抗蟲、抗逆[12]、高水肥利用效率的的優(yōu)質(zhì)小麥、水稻品種一直是育種家的目標(biāo)。過去田間育種,主要通過田間表型觀察、性狀分析來進(jìn)行選擇育種,往往需要多代,選育周期長,過程復(fù)雜,工作量大。隨著基因組測序的完成,育種家將基因組和表型觀察聯(lián)系起來,可以通過基因鑒定來發(fā)掘不易鑒定的表型,將基因分析和遺傳分析聯(lián)系起來,大大地縮短了育種年限,節(jié)約了成本,提高了育種效率。通過小麥祖先種與水稻基因組比對分析,可以挖掘祖先種優(yōu)異抗性基因輔助小麥分子育種。
為深入研究小麥祖先種與水稻的遺傳基礎(chǔ)、分子結(jié)構(gòu)、進(jìn)化關(guān)系,了解3 個(gè)物種同源核苷酸序列和基因序列的排列與分布[13],本試驗(yàn)構(gòu)建了3 個(gè)物種的核苷酸序列和基因序列庫,利用Blast 方法篩選同源核苷酸序列和同源基因序列,然后用circos,synmap 4.2 分別對同源核苷酸和同源基因序列作圖,旨在揭示3 個(gè)物種間分子水平的共線性關(guān)系[14-15]及進(jìn)化關(guān)系[16-18]。
烏拉爾圖小麥序列從https://www.ncbi.nlm.nih.gov/nuccore/MKGO00000000.1 下載,數(shù)據(jù)更新公布的時(shí)間為2018 年5 月。
粗山羊草序列從https://www.ncbi.nlm.nih.gov/n uccore/MCGU00000000.1 下載。數(shù)據(jù)更新公布的時(shí)間為2017 年11 月。
水稻基因組全基因組序列從https://www.ncbi.nlm.nih.gov/genome/10 下載,數(shù)據(jù)更新時(shí)間為2018 年12 月。
1.2.1 核苷酸序列全局比對 將烏拉爾圖小麥、粗山羊草作為目標(biāo)基因組,水稻作為參考基因組,對核苷酸序列進(jìn)行Blast N(e-value 為1e-20)比對,對結(jié)果篩選分析;使用circos 對同源核苷酸序列進(jìn)行關(guān)聯(lián)作圖。
1.2.2 核苷酸序列局部比對 選取水稻1 號染色體和烏拉爾圖小麥3 號染色體的同源核苷酸序列,使用軟件mauve 對同源核苷酸序列做線性比對。
1.2.3 基因比對 構(gòu)建3 個(gè)物種編碼蛋白質(zhì)的基因數(shù)據(jù)庫,對它們的氨基酸序列進(jìn)行Blast X(e-value為1e-10)比對,使用symap 4.2 對數(shù)據(jù)結(jié)果作圖。
結(jié)果表明,烏拉爾圖小麥中有6 786 546 條與水稻同源核苷酸序列,粗山羊草中有748 050 條與水稻同源核苷酸序列,小麥祖先種中存在大量水稻同源序列。篩選長度為4 kb 以上的同源核苷酸序列使用circos 軟件作圖(圖1),烏拉爾圖小麥篩選到2 007 條大片段(4 kb 以上)與水稻同源序列,而粗山羊草中篩選到6 252 條大片段序列。這說明粗山羊草在DNA 進(jìn)化中更保守,與水稻的親緣關(guān)系近。在序列比對中,本研究發(fā)現(xiàn),烏拉爾圖小麥、粗山羊草中的某條核苷酸序列可能在水稻的多條染色體中找到同源序列,水稻中的某條同源核苷酸序列也會匹配到烏拉爾圖小麥或粗山羊草的多條染色體上,這表明3 個(gè)物種均存在核苷酸序列的復(fù)制現(xiàn)象。
試驗(yàn)選取水稻1 號染色體和烏拉爾圖小麥3 號染色體的Blast 結(jié)果,使用mauve 軟件對同源核苷酸序列作線性比較。結(jié)果表明,水稻1 號染色體和烏拉爾圖小麥3 號染色體存在大量同源核苷酸序列。圖中使用相同顏色表示了相同的同源核苷酸序列區(qū)塊,水稻和烏拉爾圖標(biāo)識同源序列的顏色區(qū)塊一致性排列,這表明它們之間存在同源核苷酸序列宏觀的同線性和共線性(圖2)。
結(jié)果還表明,同源核苷酸序列主要分布在水稻正義鏈上,而烏拉爾圖小麥中同源序列正義鏈、反義鏈均有分布。在1 號染色體上的水稻某一同源核苷酸序列和烏拉爾圖小麥3 號染色體的多個(gè)不同位置的核苷酸序列存在同源關(guān)系。
氨基酸序列比對中,本研究用烏拉爾圖小麥、粗山羊草的每一條染色體和水稻全基因組進(jìn)行比較,發(fā)現(xiàn)每一條染色體都有80%以上的同源基因匹配到水稻全基因組中。烏拉爾圖小麥中5 號染色體與水稻的基因匹配率最高,為84%。粗山羊草中2 號染色體與水稻的匹配率最高,為88%。在共線性的區(qū)塊中發(fā)現(xiàn),約50%的基因共線性區(qū)塊存在倒位現(xiàn)象,這表明在烏拉爾圖小麥、粗山羊草和水稻的比較中,染色體的倒位現(xiàn)象是普遍存在的。
從基因比較的共線性排列中可以得出,烏拉爾圖小麥1 號染色體和水稻1,5,10 號染色體存在大片段共線性排列,由水稻5,10 號染色體融合形成。烏拉爾圖小麥2 號染色體和水稻4,7 號染色體有大片段共線性排列。烏拉爾圖小麥3 號染色體和水稻1 號染色體有大片段共線性排列,由1 號染色體進(jìn)化而來。烏拉爾圖小麥4 號染色體來源于水稻3,11 號染色體。烏拉爾圖小麥5 號染色體來源于水稻3,9,12 號染色體。烏拉爾圖小麥6 號染色體來源于水稻2 號染色體。烏拉爾圖小麥7 號染色體由水稻6,8 號染色體融合形成?;虮容^中還發(fā)現(xiàn),烏拉爾圖小麥4,5 號染色體均和水稻3 號染色體的某一片段存在共線性,而且在烏拉爾圖小麥4 號染色體中發(fā)生了倒位(圖3)。在粗山羊草和水稻的基因組比較中也發(fā)現(xiàn)了類似的基因共線性排列(圖3,4)。烏拉爾圖小麥、粗山羊草的3 號與6 號染色體基因分別與水稻的1,2 號同源整體,這表明在進(jìn)化中,這2 條染色體相對保守,沒有發(fā)生染色體大片段的移位和融合。
從圖3,4 可以看出,烏拉爾圖小麥和粗山羊草的差別為:和水稻共線性的基因在它們中不是相同排列的。例如,烏拉爾圖小麥7 號染色體和水稻8 號染色體只在短臂上有基因共線性,而在粗山羊草7 號染色體的短臂、長臂均與水稻8 號染色體有基因的共線性。這表明烏拉爾圖小麥和粗山羊草在分化過程中,DNA 分子也發(fā)生了選擇性進(jìn)化。一些DNA 分子由于插入、缺失、轉(zhuǎn)座子插入等原因而發(fā)生了基因的丟失。而一些同源基因的DNA 分子在進(jìn)化過程中由于變異的積累,形成了具有新功能基因的DNA 序列。
水稻和小麥都是禾本科單子葉植物。對小麥祖先種及水稻的基因組比較分析,有助于理解高等植物的進(jìn)化與發(fā)育關(guān)系。本試驗(yàn)表明,烏拉爾圖小麥、粗山羊草和水稻無論是核苷酸序列水平還是基因水平都存在高度的、整體水平的共線性,同時(shí)它們的染色體中存在著大量的倒位和復(fù)制現(xiàn)象。
本試驗(yàn)通過對小麥祖先種和水稻全基因組比較[19],全面地在核苷酸序列水平和基因水平對小麥祖先種和水稻進(jìn)行了DNA 水平和基因水平的關(guān)聯(lián)分析,闡述了小麥祖先種染色體的進(jìn)化過程,為進(jìn)一步研究小麥遺傳多樣性、基因組分子進(jìn)化、借鑒水稻基因組研究對小麥基因組進(jìn)行注釋[20]奠定了基礎(chǔ)。