崔鳳超, 王平喜, 劉小剛, 鄒 棖
中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所, 北京 100081
玉米(ZeamayesL.)是世界范圍內(nèi)重要的糧食作物之一,在工業(yè)原料、食品加工和飼料等方面應(yīng)用廣泛[1]。玉米灰斑病對(duì)玉米產(chǎn)量危害嚴(yán)重,危害程度受環(huán)境條件和玉米種質(zhì)的影響,在美國(guó),玉米灰斑病高發(fā)地帶玉米產(chǎn)量降低50%以上[2];在巴西中部,玉米灰斑病高發(fā)地帶玉米產(chǎn)量降低20%~50%[3];在南非,玉米灰斑病高發(fā)地帶玉米產(chǎn)量降低20%~60%[4]。玉米灰斑病是由玉米尾孢菌(Cercosporazeine)[5,6]和玉蜀黍尾孢菌(Cercosporazeae-maydis)[7]引起的真菌性病害,主要侵染玉米葉片,也可侵染苞葉和葉鞘。1925年,玉米灰斑病在美國(guó)的伊利諾伊州和亞歷山大州被首次報(bào)道[7],隨后開(kāi)始逐漸蔓延[8~10]。1991年,玉米灰斑病在我國(guó)首次發(fā)生于遼寧省丹東市[11],近年來(lái),在我國(guó)的西南地區(qū)、黃淮海地區(qū)和東北地區(qū)等玉米主產(chǎn)區(qū)均有發(fā)生,并呈現(xiàn)逐漸加重的態(tài)勢(shì)[12,13]。因此,開(kāi)展對(duì)玉米灰斑病的研究具有重要意義。
20世紀(jì)90年代以來(lái),科研人員一直對(duì)玉米灰斑病的抗性位點(diǎn)進(jìn)行挖掘。Lehmensiek等[14]將分離群體混合分析法[15,16]與RFLP標(biāo)記結(jié)合,在1、3和5號(hào)染色體上共鑒定了4個(gè)抗玉米灰斑病QTL(quantitative trait loci),其中1號(hào)染色體的表型變異解釋率最高,為37%。Zhang等[17]以玉米灰斑病抗病自交系Q11和感病自交系Y32構(gòu)建分離群體,在5號(hào)和8號(hào)染色體上分別鑒定出一個(gè)主效QTL,并將8號(hào)染色體的QTLqRgls1精細(xì)定位到1.4 Mb的區(qū)間;隨后,Xu等[18]在Zhang等研究的基礎(chǔ)上,將5號(hào)染色體的QTLqRgls2精細(xì)定位到約1Mb的區(qū)間。Shi等[19]通過(guò)元分析方法整合了57個(gè)玉米灰斑病抗病QTL,共鑒定了26個(gè)“真實(shí)”QTL和7個(gè)“熱點(diǎn)”QTL。王平喜等[20]以IBM2 2008為參考圖譜,利用元分析重新整合65個(gè)抗玉米灰斑病QTL,獲得11個(gè)“一致性”QTL區(qū)間,通過(guò)與擬南芥和水稻的基因組同源比對(duì)分析,最終確定了10個(gè)玉米灰斑病抗性基因。
分離群體混合分析是基因定位的有效手段之一。20世紀(jì)末,研究人員將具有多態(tài)性的分子標(biāo)記與極端表型材料的DNA混池結(jié)合,能夠成功鑒定與目標(biāo)性狀相關(guān)聯(lián)的位點(diǎn)[15,16];隨后,Sun等[21]發(fā)現(xiàn),群體大小、標(biāo)記密度和極端表型選擇比例等是分離群體混合分析中重要的影響因素。隨著生物技術(shù)的不斷發(fā)展,研究人員將分離群體混合分析與高通量測(cè)序技術(shù)相結(jié)合,開(kāi)發(fā)混池測(cè)序方法,該方法已在水稻、大豆等作物中得到廣泛應(yīng)用[22,23]。然而,混池測(cè)序方法在植物病害候選基因挖掘方面應(yīng)用較少。
本文采用混池測(cè)序方法對(duì)玉米灰斑病進(jìn)行研究,利用BC1F1群體中的極端表型,構(gòu)建兩個(gè)極端表型的DNA混池并完成高通量測(cè)序。數(shù)據(jù)分析后得到高質(zhì)量單核苷酸多態(tài)性標(biāo)記(single nucleotide polymorphism,SNP),并確定玉米灰斑病抗病區(qū)間。最后,通過(guò)抗病區(qū)間基因提取、注釋、同源分析等方法挖掘玉米灰斑病抗性基因。相比傳統(tǒng)基因定位的方法,混池測(cè)序方法簡(jiǎn)單、快速,無(wú)需篩選大量多態(tài)性標(biāo)記,為基因定位提供了新的思路。
本實(shí)驗(yàn)中,選擇玉米灰斑病抗病自交系Suwan1為供體親本,感病自交系HM01為受體親本。2013年夏季在河南新鄉(xiāng),將兩個(gè)親本雜交產(chǎn)生F1群體;2013年冬季在海南三亞,以HM01為輪回親本構(gòu)建BC1F1群體;2014年夏季在云南德宏,種植BC1F1群體,群體內(nèi)包括464份家系,在自然發(fā)病條件下對(duì)玉米單株進(jìn)行玉米灰斑病抗性鑒定,并以該BC1F1群體進(jìn)行后續(xù)研究。
在玉米授粉后7 d、14 d和21 d分別對(duì)BC1F1群體進(jìn)行玉米灰斑病抗病性鑒定。當(dāng)感病自交系丹340發(fā)病程度達(dá)到7級(jí)時(shí),開(kāi)始進(jìn)行田間調(diào)查,調(diào)查部位主要為玉米棒三葉(穗位葉片、穗位上方葉片和穗位下方葉片)。調(diào)查的標(biāo)準(zhǔn)如下:1級(jí)為高抗,葉片上無(wú)病斑或穗位下方葉片有極少量病斑,病斑占葉面積小于等于5%;3級(jí)為抗病,葉片上有少量病斑,占葉面積6%~10%;5級(jí)為中抗,穗位下方葉片上病斑較多,占葉面積11%~30%;7級(jí)為感病,穗位下方葉片上有大量病斑,占葉面積31%~70%;9級(jí)為高感,玉米植株基本被病斑所覆蓋或枯死,病斑占葉面積71%以上[24]。除上述情況,玉米植株還會(huì)出現(xiàn)非玉米灰斑病致死現(xiàn)象,這種情況需要額外記錄。
在BC1F1群體玉米灰斑病抗病性鑒定后,分別選擇30株抗病和30株感病植株構(gòu)建混池。具體步驟主要有:首先,利用CTAB法[25]分別提取玉米單株DNA;然后,在DNA濃度檢測(cè)后,將抗病植株DNA等量混合構(gòu)成抗病混池,感病植株DNA等量混合構(gòu)成感病混池;最后,將兩個(gè)DNA混池樣品送往測(cè)序公司(北京貝瑞和康生物技術(shù)有限公司),公司質(zhì)量檢測(cè)合格后,構(gòu)建插入片段為200 bp的測(cè)序文庫(kù),利用Illumina Hiseq 2500測(cè)序儀、雙端125 bp策略完成基因組測(cè)序。
1.4.1數(shù)據(jù)質(zhì)量控制 通常使用FastQC軟件(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)對(duì)原始數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估,分別查看單堿基測(cè)序質(zhì)量分布、序列測(cè)序質(zhì)量分布和序列GC含量分布等方面信息,若某評(píng)估項(xiàng)目不合格,需要依據(jù)情況進(jìn)行過(guò)濾,直到評(píng)估合格后進(jìn)行后續(xù)數(shù)據(jù)分析。
1.4.2序列比對(duì)參考基因組 為了提高序列比對(duì)的準(zhǔn)確性,本研究使用FLASH軟件[26]對(duì)雙端reads進(jìn)行合并。之后,使用BBMap軟件(http://sourceforge.net/projects/bbmap/)將序列比對(duì)到玉米參考基因組B73(RefGen_v3),將唯一比對(duì)的變異信息用于后續(xù)分析。隨后,運(yùn)用SAM tools[27]檢測(cè)SNP變異位點(diǎn),只保留SNP測(cè)序深度為20以上、比對(duì)質(zhì)量值大于等于30的結(jié)果。
1.4.3抗玉米灰斑病相關(guān)位點(diǎn)挖掘 針對(duì)SNP標(biāo)記在兩個(gè)混池中的測(cè)序深度差異進(jìn)行卡方檢驗(yàn),結(jié)果中P<0.01的標(biāo)記作為可能的信號(hào)位點(diǎn),將全基因組1Mb距離范圍內(nèi)大于等于3個(gè)信號(hào)的區(qū)段定義為玉米灰斑病抗性QTL的可能位點(diǎn)。依據(jù)此方法,充分挖掘可能的SNP變異位點(diǎn)。利用MaizeGDB[28]和Phytozome(http://www.phytozome.net/)網(wǎng)站,將抗病區(qū)間內(nèi)的基因與擬南芥和水稻基因組進(jìn)行同源比對(duì),最終確定候選基因。
2014年夏季,在云南德宏試驗(yàn)基地,對(duì)BC1F1群體中玉米灰斑病抗性進(jìn)行鑒定。具體依據(jù)圖1A(彩圖見(jiàn)圖版四)進(jìn)行病害分級(jí),該群體病害等級(jí)呈連續(xù)性分布(圖1B),7級(jí)數(shù)量最多,由此可見(jiàn),玉米灰斑病抗性是多基因控制的數(shù)量性狀,與前人研究結(jié)果一致[29,30]。
圖1 BC1F1群體玉米灰斑病抗性鑒定Fig.1 The identification of GLS resistance in the BC1F1 population in maize.
根據(jù)公司提供的測(cè)序數(shù)據(jù)資料,運(yùn)行FastQC軟件進(jìn)行數(shù)據(jù)質(zhì)量評(píng)估,結(jié)果表明,90%以上單堿基的測(cè)序質(zhì)量值在30以上,插入片段文庫(kù)分布集中在200 bp左右,與測(cè)序試驗(yàn)設(shè)計(jì)相吻合。整體評(píng)估結(jié)果表明,此次測(cè)序數(shù)據(jù)較好,可以用于后續(xù)數(shù)據(jù)分析。生物信息學(xué)軟件分析獲得高質(zhì)量的SNP標(biāo)記,最終依據(jù)抗病池和感病池測(cè)序深度差異的卡方檢驗(yàn),確定29個(gè)抗病QTL區(qū)間(表1)。從表1中可以看出,玉米灰斑病抗性相關(guān)位點(diǎn)在全基因組范圍內(nèi)分布廣泛,在玉米的10條染色體中,僅在8號(hào)染色體上未檢測(cè)到抗病位點(diǎn)。此外,檢測(cè)到的29個(gè)QTL區(qū)間中,最小的QTL區(qū)間可達(dá)43 bp。
表1 玉米灰斑病抗病QTL區(qū)間Table 1 Resistant QTL intervals to GLS in maize.
針對(duì)表1中抗玉米灰斑病的QTL區(qū)間,共提取2 768基因,結(jié)合MaizeGDB和Phytozome網(wǎng)站進(jìn)行基因功能分析。由于抗病基因編碼的蛋白質(zhì)具有高度保守的結(jié)構(gòu)域,如NBL-LRR(nucleotide-binding site leucine-rich repeat)類型的抗病蛋白、含有螺旋卷曲結(jié)構(gòu)域(coiled-coil)或蛋白激酶結(jié)構(gòu)域(protein kinase)的抗病蛋白等[31,32],根據(jù)這些結(jié)構(gòu)域特征,在表1中Chr1:196 330 746~208 023 939、Chr5:45 442 168~85 412 236和Chr10:4 324 495~5 916 937區(qū)間內(nèi)分別確定1個(gè)候選基因GRMZM2G322748、GRMZM2G091696和GRMZM2G350841(表2)。在表2中,同源比對(duì)分析表明,GRMZM2G322748基因在擬南芥和水稻中的同源基因分別為AT3G14460.1、LOC_Os08g43000;GRMZM2G091696基因的同源基因分別為AT3G07040.1、LOC_Os06g48520.1;GRMZM2G350841基因的同源基因分別為AT1G59780.1、LOC_Os11g38580.1。此外,3個(gè)候選基因的注釋信息包含LRR、NB-ARC等抗病基因保守結(jié)構(gòu)域,這些結(jié)構(gòu)域?qū)χ参锟共〉鞍椎幕钚哉{(diào)節(jié)具有重要作用[33]。綜上所述,這些基因?qū)τ衩谆野卟】剐缘慕馕鼍哂兄匾饬x,可用于后續(xù)研究。
表2 玉米灰斑病抗性相關(guān)候選基因Table 2 Candidate associated genes to GLS resistance in maize.
玉米灰斑病發(fā)病情況主要分為人工接種和自然發(fā)病兩種情況,對(duì)于人工接種而言,需要建立玉米灰斑病病原菌培養(yǎng)及接種體系[34]。此外,田間氣候條件對(duì)人工接種的菌株和鑒定等方面影響很大,人工接種的成功率也有待進(jìn)一步提高。對(duì)于自然發(fā)病而言,則有效避免了人工接種中出現(xiàn)的問(wèn)題,但是需要選定合適的種植區(qū)域,以保證玉米植株能夠穩(wěn)定發(fā)病,因此,我們選擇玉米灰斑病發(fā)病適宜的云南德宏地區(qū)進(jìn)行BC1F1群體的病害鑒定。一般選擇在授粉2~3周開(kāi)始玉米灰斑病調(diào)查,因?yàn)檫@是病害發(fā)病嚴(yán)重時(shí)期,是病害評(píng)價(jià)的理想階段[18]。在玉米灰斑病鑒定過(guò)程中,Zhang等[17]嘗試使用玉米穗位葉病斑掃描的方法進(jìn)行病害鑒定,但其研究表明這種方法并不理想,主要原因可能是單個(gè)葉片掃描結(jié)果很難代表整個(gè)植株的發(fā)病情況。在自然發(fā)病的條件下,一般采用人工目測(cè)的方法鑒定玉米灰斑病病害等級(jí)。
本研究通過(guò)混池測(cè)序方法確定了3個(gè)玉米灰斑病抗性候選基因GRMZM2G322748、GRMZM2G0911696和GRMZM2G350841。其中GRMZM2G322748基因位于bin1.06區(qū)域內(nèi),該區(qū)域與Lehmensiek等[14]玉米灰斑病研究結(jié)果一致;GRMZM2G0911696基因位于bin5.03區(qū)域內(nèi),與Xu等[18]玉米灰斑病抗病區(qū)間定位結(jié)果一致。同時(shí)bin1.06和bin5.03兩個(gè)區(qū)域與王平喜等[20]元分析的結(jié)果一致,這兩個(gè)區(qū)域都是玉米灰斑病抗性相關(guān)的熱點(diǎn)區(qū)域。GRMZM2G350841基因位于bin10.01~bin10.02區(qū)間內(nèi),是新發(fā)掘的抗病位點(diǎn),需要進(jìn)一步探究。以上結(jié)果表明混池測(cè)序方法是基因挖掘的有力手段,具有操作簡(jiǎn)單、試驗(yàn)周期短的特點(diǎn)。相比傳統(tǒng)的QTL定位,混池測(cè)序方法不需要篩選大量的分子標(biāo)記,也不需要構(gòu)建特定的近等基因系。通過(guò)高通量測(cè)序,成千上萬(wàn)的SNP標(biāo)記可以被一次性捕獲,這些變異信息既可以鑒定性狀關(guān)聯(lián)基因或QTL,也可以用于開(kāi)發(fā)分子標(biāo)記。后期我們將進(jìn)行基因功能解析,以期培育玉米灰斑病的抗病品種,進(jìn)而提升玉米材料抗病性等,這在遺傳育種方面具有重要意義。
混池測(cè)序結(jié)果的分析對(duì)玉米灰斑病抗性位點(diǎn)的鑒定至關(guān)重要,其影響因素較多。通常,精準(zhǔn)的田間表型鑒定是混池測(cè)序的基本要求,若表型鑒定不準(zhǔn)確,會(huì)降低混池測(cè)序的分析效果;除此之外,目前的測(cè)序技術(shù)仍存在一定程度的測(cè)序錯(cuò)誤[35],因此,需要選擇合適的測(cè)序深度,對(duì)于30個(gè)樣本的混池,混池測(cè)序深度通常大于等于30。在混池測(cè)序數(shù)據(jù)分析前期階段,首先應(yīng)該對(duì)測(cè)序數(shù)據(jù)的質(zhì)量進(jìn)行評(píng)估,若數(shù)據(jù)質(zhì)量存在問(wèn)題,應(yīng)該進(jìn)行適當(dāng)處理。對(duì)于數(shù)據(jù)分析過(guò)程也需要依據(jù)試驗(yàn)整體情況選擇合適的軟件和參數(shù),這樣才會(huì)得到更加優(yōu)化的結(jié)果。
混池測(cè)序可以應(yīng)用于多種植物和性狀,通過(guò)本研究,我們得到了玉米灰斑病抗性相關(guān)的基因,進(jìn)一步證實(shí)了混池測(cè)序的實(shí)用性?,F(xiàn)在比較常用的混池測(cè)序分析方法是基于等位基因頻率變化的QTL-seq[22,36,37]、MutMap[38~40]等,但群體結(jié)構(gòu)、連鎖不平衡等因素并沒(méi)有被考慮進(jìn)去,所以在未來(lái)研究中,對(duì)混池測(cè)序分析方法的優(yōu)化仍然是值得探究的問(wèn)題。