白明興 陳奮奇 陸晏天 丁永福 姬祥卓 彭云玲,2,*
(1 甘肅農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/甘肅省干旱生境作物學(xué)重點(diǎn)實(shí)驗(yàn)室, 甘肅 蘭州 730070;2 甘肅省作物遺傳改良與種質(zhì)創(chuàng)新重點(diǎn)實(shí)驗(yàn)室, 甘肅 蘭州 730070)
玉米(ZeamaysL.)是全球最重要的糧食、飼料和經(jīng)濟(jì)能源作物,其生產(chǎn)安全對(duì)保障國家糧食增產(chǎn)、促進(jìn)畜牧業(yè)發(fā)展以及改善人民生活質(zhì)量發(fā)揮著極其重要的作用。株高和穗位高等性狀是構(gòu)成玉米株型的主要因子,適當(dāng)調(diào)整玉米株型可以提高玉米單產(chǎn)的形成[1-2]。因此,通過研究玉米株型相關(guān)性狀不僅能有效改善玉米植株的空間分布形態(tài),促進(jìn)玉米增量,也可以為選育理想株型和分子標(biāo)記輔助選擇(marker-assisted selection, MAS)奠定基礎(chǔ)。近年來,國內(nèi)外諸多學(xué)者已經(jīng)利用數(shù)量性狀定位(quantitative trait loci, QTL)分析和全基因組關(guān)聯(lián)分析(genome-wide association study, GWAS)等手段對(duì)玉米株型和產(chǎn)量相關(guān)性狀進(jìn)行了研究,吳建偉等[3]以A188×91黃15構(gòu)建了1套F2∶3群體,在水分脅迫下檢測(cè)到了10個(gè)QTL與株高和穗位高相關(guān),并在8號(hào)染色體上檢測(cè)到了1個(gè)同時(shí)調(diào)控株高和穗位高的主效QTL。鄭德波等[4]以K22為共同父本,CI7和Dan340分別為母本開發(fā)了2套F2群體,分別構(gòu)建了含237和218個(gè)家系的兩套F2∶3群體,并采用1 536個(gè)單核苷酸多態(tài)性標(biāo)記(single nucleotide polymorphism, SNP)的基因芯片在不同環(huán)境下對(duì)2個(gè)群體的株高、穗位高等性狀進(jìn)行了QTL定位分析,共定位到48個(gè)QTL,其中多數(shù)QTL的作用方式以加性與部分顯性效應(yīng)為主。Pan等[5]采用10個(gè)重組自交系(recombinant inbred lines, RIL)群構(gòu)建了一套含有1 887個(gè)品系的ROAM(random-open-parent association mapping)群,并采用GWAS、SLM(single linkage mapping)和JLM(joint linkage mapping)等3種不同的方法對(duì)玉米的10個(gè)株型性狀進(jìn)行了定位,在3種不同分析方法下分別定位到38、83、86個(gè)與株高相關(guān)的QTL,找到1個(gè)控制株高的主效QTL(qPH3),并將其定位至600 kb(165.73~166.37 Mb)。另外,趙小強(qiáng)等[6]也通過構(gòu)建兩套F2群體對(duì)玉米的單穗重、穗軸重、百粒重、穗長等穗部性狀進(jìn)行QTL定位,共檢測(cè)到49個(gè)QTLs。上述結(jié)果表明不同研究所采用的群體及QTL定位方法不同,導(dǎo)致所檢測(cè)到相關(guān)農(nóng)藝性狀的QTL信息也存在差異,同時(shí)也反映出了這些玉米性狀遺傳基礎(chǔ)的復(fù)雜性,導(dǎo)致研究者還不能清晰剖析其遺傳機(jī)理。
關(guān)聯(lián)分析也稱作連鎖不平衡作圖,是利用分子標(biāo)記對(duì)供試群體基因進(jìn)行檢測(cè)或掃描,進(jìn)而獲得豐富的基因位點(diǎn)及其等位基因信息的技術(shù),可分為全基因組關(guān)聯(lián)分析和候選基因關(guān)聯(lián)分析兩類[7]。近年來,隨著高通量測(cè)序技術(shù)的快速發(fā)展,許多植物的基因組測(cè)序已逐漸完成,同時(shí)也開發(fā)了大量的分子標(biāo)記,為關(guān)聯(lián)分析的應(yīng)用提供了良好的條件。并且隨著SNP標(biāo)記的不斷開發(fā),全基因組關(guān)聯(lián)分析已成為剖析一些作物復(fù)雜農(nóng)藝性狀分子機(jī)理的主要手段[8-9],如在玉米[10-11]、水稻(OryzasativaL.)[12-13]、小麥(TriticumaestivumL.)[14-15]和油菜(BrassicacampestricL.)[16-17]等主要農(nóng)作物上均已被廣泛應(yīng)用。本研究以204份玉米自交系為關(guān)聯(lián)群體,并借助分布于玉米20條染色體上的558 529個(gè)SNP,對(duì)玉米株型與產(chǎn)量相關(guān)的5個(gè)性狀進(jìn)行GWAS分析,以期為玉米株型的改良和玉米理想株型MAS育種提供參考。
從中國農(nóng)業(yè)科學(xué)院提供的368份材料中選擇在武威適應(yīng)性較好的204份玉米自交系為試材。
于2018年在甘肅省武威試驗(yàn)站(37.97°N, 102.63°E)進(jìn)行試驗(yàn)。材料采用完全隨機(jī)區(qū)組設(shè)計(jì),3次重復(fù),且供試材料為雙行區(qū)種植,行長4 m,株距25 cm,行距40 cm。在玉米大喇叭口期從供試自交系中選擇長勢(shì)整體一致的植株3株,測(cè)定其株高(plant height,PH)、穗位高(ear height, EH)、總?cè)~片數(shù)(leaf number,LN)、穗上葉數(shù)(leaf number above ear,LNAE),并在2019年3月進(jìn)行室內(nèi)考種,采集供試材料的單穗重(ear weight, EW),計(jì)算均值。
采用Excel 2016對(duì)各性狀進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,并采用SPSS 22.0軟件對(duì)5個(gè)相關(guān)性狀進(jìn)行正態(tài)性檢驗(yàn)及主成分分析(principal component analysis,PCA),對(duì)各性狀進(jìn)行相關(guān)分析,熱圖層次聚類分析采用 MeV4.9.0處理[18],距離度量標(biāo)準(zhǔn)采用Pearson相關(guān)系數(shù)距離。
利用分布于玉米全基因組的最小等位基因頻率≥0.05的558 529個(gè)SNP位點(diǎn)進(jìn)行全基因組關(guān)聯(lián)分析,基因型數(shù)據(jù)可在網(wǎng)站(http://www.Maizego.org/Resources.html)獲得(n=368)。在TASSEL 5.0軟件中,采用3種不同的模型(即只控制群體結(jié)構(gòu)的Q模型,只控制親緣關(guān)系的K模型以及同時(shí)控制群體結(jié)構(gòu)和親緣關(guān)系的Q+K模型)對(duì)玉米的株高、穗位高、總?cè)~片數(shù)、穗上葉數(shù)及單穗重等5個(gè)性狀進(jìn)行關(guān)聯(lián)分析,并根據(jù)其Quantile-Quantile(QQ)散點(diǎn)圖選擇最佳模型對(duì)各性狀進(jìn)行GWAS分析。QQ圖利用R語言的“CMplot”包繪制。
前人已利用約56萬個(gè)SNP對(duì)該群體的連鎖不平衡(linkage disequilibrium,LD)衰減程度進(jìn)行了評(píng)價(jià),發(fā)現(xiàn)該關(guān)聯(lián)群體的LD衰減距離為50 kb(R2=0.1)[19]。因此,本研究將以此衰減距離作為該群體的LD衰減距離,基于顯著關(guān)聯(lián)的SNP標(biāo)記在玉米B73基因組序列RefGen_v3上的物理位置上、下游共100 kb范圍內(nèi),通過NCBI(https://www.ncbi.nlm.nih.gov/)和MaizeGDB(https://www.maizegdb.org/)搜索與各性狀相關(guān)的所有候選基因,并根據(jù)其基因功能注釋選擇最佳基因作為候選基因。
由供試自交系各性狀的表型鑒定結(jié)果可知(表1),玉米各性狀存在豐富的遺傳變異,其變異系數(shù)在9.00%~50.00%之間。通過對(duì)各性狀進(jìn)行描述統(tǒng)計(jì)發(fā)現(xiàn),各性狀的峰度和偏度都基本介于-1.0~1.0 之間,呈典型的數(shù)量遺傳特性,因此可以對(duì)各個(gè)性狀進(jìn)行關(guān)聯(lián)分析。此外,各性狀表型值的變幅波動(dòng)范圍較大,這可能是試驗(yàn)點(diǎn)環(huán)境因素復(fù)雜和材料自身差異共同作用的結(jié)果。
由表2可知,供試自交系的株高(PH)與穗位高(EH)、總?cè)~片數(shù)(LV)、穗上葉數(shù)(LNAE)及單穗重(EW)性狀間均呈顯著正相關(guān);穗位高與總?cè)~片數(shù)、穗上葉數(shù)及單穗重呈顯著正相關(guān);總?cè)~片數(shù)與穗上葉數(shù)呈顯著正相關(guān),與單穗重?zé)o顯著相關(guān)性;穗上葉數(shù)與單穗重?zé)o顯著相關(guān)性。且由各性狀的聚類分析(圖1)可知,5個(gè)性狀共聚成兩類,其中總?cè)~片數(shù)和穗上葉數(shù)2個(gè)性狀聚成第一類,株高、穗位高和單穗重3個(gè)性狀聚成第二類,熱圖層次聚類分析也進(jìn)一步表明玉米自交系的這5個(gè)性狀彼此間相互關(guān)聯(lián),相互協(xié)同,其相互作用共同構(gòu)成了不同玉米自交系間的差異。
表1 不同玉米自交系相關(guān)性狀的表型鑒定Table 1 Phenotypic identification of maize inbred lines
表2 不同玉米自交系各性狀的相關(guān)性分析Table 2 Correlation analysis of traits in different inbred lines of maize
通過對(duì)各性狀進(jìn)行主成分分析可知(表3、表4),在關(guān)聯(lián)群體的各性狀間篩選出特征值大于1的主成分2個(gè),且總體方差累計(jì)貢獻(xiàn)率達(dá)到71.667%,表明這2個(gè)主成分可以代表供試群體5個(gè)相關(guān)性狀的絕大多數(shù)信息。其中PC1的特征值是2.361,貢獻(xiàn)率為47.223%,除單穗重外,其他性狀載荷值都較高;PC2的特征值是1.222, 貢獻(xiàn)率達(dá)到24.444%,其單穗重的載荷值較高。
表3 各性狀特征值及貢獻(xiàn)率Table 3 Eigenvalue and contribution rate of each traits
2.4.1 閾值確定 利用R語言進(jìn)行Bonferroni閾值的確定,本研究采用P≤1×10-5作為此次全基因組關(guān)聯(lián)分析的顯著閾值。
表4 各表型因子載荷矩陣Table 4 Matrix of phenotypic factor loading
2.4.2 模型選擇 本研究采用3種模型(Q、K和Q+K)對(duì)各性狀進(jìn)行GWAS分析,由各性狀的QQ圖(圖2)可知,PH、EH、LN、LNAE及EW等5個(gè)性狀中,K模型和Q模型總體對(duì)假陽性控制較差,而Q+K模型雖然對(duì)部分性狀假陽性的控制過于嚴(yán)格,但總體對(duì)假陽性控制效果較好,綜合考慮,本研究采用Q+K模型的結(jié)果進(jìn)行后續(xù)分析。
2.4.3 關(guān)聯(lián)分析 由5個(gè)相關(guān)性狀的GWAS分析結(jié)果可知,以P≤1.0×10-5為顯著闕值,在關(guān)聯(lián)群體的5個(gè)性狀間共檢測(cè)到13個(gè)顯著SNP(附表1),分布于玉米的第3、第5、第6、第7號(hào)染色體上。其中,在與株高有關(guān)的9個(gè)SNP位點(diǎn)中,8個(gè)位于5號(hào)染色體上,1個(gè)在6號(hào)染色體上;與穗位高相關(guān)的3個(gè)SNP位點(diǎn)分別位于第3、第6和第7號(hào)染色體上以及檢測(cè)到1個(gè)與單穗重有關(guān)的SNP位點(diǎn),位于第6號(hào)染色上;但在總?cè)~片數(shù)和穗上葉數(shù)2個(gè)性狀間未關(guān)聯(lián)到顯著的SNP位點(diǎn)。
本研究在50 kb(R2=0.1)LD衰減距離范圍內(nèi)對(duì)13個(gè)與玉米相關(guān)性狀顯著SNP位點(diǎn)進(jìn)行相關(guān)基因的搜集,在所有顯著位點(diǎn)內(nèi)共搜集到39個(gè)相關(guān)基因,有12個(gè)基因可以搜索到相關(guān)的注釋信息(附表1)。其中,在與株高相關(guān)的9個(gè)顯著SNP位點(diǎn)間共搜索到12個(gè)基因,有注釋的基因5個(gè);在與穗位高相關(guān)的3個(gè)顯著SNP位點(diǎn)間共搜索到25個(gè)基因,有注釋的基因4個(gè);在與單穗重相關(guān)的1個(gè)顯著SNP位點(diǎn)間共搜索到2個(gè)基因,未搜到相關(guān)注釋。
高產(chǎn)、穩(wěn)產(chǎn)、優(yōu)質(zhì)一直是玉米育種的主要目標(biāo),而株高、穗位高、總?cè)~數(shù)、穗上葉片數(shù)等性狀與玉米單產(chǎn)的提高有著密不可分的關(guān)系。本研究以204份玉米自交系為關(guān)聯(lián)群體,通過對(duì)其株高、穗位高、總?cè)~片數(shù)、穗上葉片數(shù)及單穗重等5個(gè)性狀進(jìn)行相關(guān)分析和聚類分析發(fā)現(xiàn),各性狀間存在顯著的正相關(guān)性,說明各性狀緊密聯(lián)系,相互協(xié)同,共同影響玉米產(chǎn)量。隨著分子標(biāo)記技術(shù)的不斷發(fā)展,玉米株型及產(chǎn)量相關(guān)性狀的研究報(bào)道也逐漸增多,何坤輝等[20]利用玉米自交系許178×K12衍生的150個(gè)F7重組自交系在6種不同環(huán)境下定位到10個(gè)株高QTL和8個(gè)穗位高QTL,并找到了3個(gè)主效QTL,可以在3種及以上環(huán)境中被定位到。趙小強(qiáng)等[21]通過對(duì)兩套群體的7個(gè)農(nóng)藝性狀進(jìn)行QTLs檢測(cè),共定位到了56個(gè)QTLs位點(diǎn),并找到了12個(gè)在各性狀間穩(wěn)定表達(dá)的QTL位點(diǎn)。李凱等[22]以360份玉米自交系為試材,利用全基因組關(guān)聯(lián)分析在4種環(huán)境下對(duì)玉米株高、穗位高進(jìn)行了定位分析,共檢測(cè)到6個(gè)與株高顯著相關(guān)的SNP位點(diǎn),18個(gè)與穗位高顯著相關(guān)的SNP位點(diǎn)。馬娟等[23]以一套BC3F4群體為材料,利用56K SNP芯片對(duì)玉米產(chǎn)量相關(guān)性狀進(jìn)行QTL定位分析,并通過Meta-QTL分析對(duì)多年來玉米產(chǎn)量相關(guān)性狀的QTL位點(diǎn)進(jìn)行了整合。以上研究表明,不同群體在不同環(huán)境下對(duì)同一性狀檢測(cè)到的QTL位點(diǎn)雖有差異,但均可為今后對(duì)株型性狀和產(chǎn)量性狀相關(guān)基因的挖掘和基因克隆提供良好的基礎(chǔ)。本研究通過對(duì)3種模型進(jìn)行比較分析發(fā)現(xiàn),Q+K模型能較好地控制各性狀的假陽性,因此采用Q+K模型對(duì)玉米自交系的5個(gè)相關(guān)性狀進(jìn)行全基因組關(guān)聯(lián)分析,在株高、穗位高和單穗重等3個(gè)性狀間共檢測(cè)到13個(gè)顯著的SNP位點(diǎn)。而在總?cè)~片數(shù)和穗上葉片數(shù)間未檢測(cè)到顯著的SNP位點(diǎn),這可能是由于單一位點(diǎn)對(duì)表型的貢獻(xiàn)率不高,造成位點(diǎn)效應(yīng)太弱,不能達(dá)到顯著水平。
圖1 PH、EH、LN、LNAE、EW 5個(gè)性狀的熱圖層次聚類分析Fig.1 Heat map with hierarchical clustering analysis of PH, EH, LN, LNAE and EW
圖2 5個(gè)相關(guān)性狀的3種GWAS模型的QQ圖Fig.2 Quantile-quantile (QQ) plots resulting from GWAS results using three methods of five maize related traits
本研究也得到一些與前人QTL定位結(jié)果相似的SNP位點(diǎn),Yan等[24]以雜交種綜3×87-1的F2衍生出的266份F2∶3家系為材料,在2種環(huán)境下對(duì)不同發(fā)育時(shí)期玉米的株高進(jìn)行了QTL定位,并在Bin5.03處bnlg1879~bcd207標(biāo)記間檢測(cè)到株高相關(guān)QTL。湯繼華等[25]利用一套“永久F2”群體在Bin5.03處的bnlg1879~umc1935以及Bin5.03~ Bin5.04多處標(biāo)記間檢測(cè)到與株高相關(guān)的QTL。許誠等[26]也利用一套單片段代換系群體對(duì)玉米5個(gè)株型相關(guān)性狀進(jìn)行了QTL定位,指出umc1587-mmc0081-umc2072(Bin5.02~ Bin5.06)標(biāo)記間存在同時(shí)控制株高、穗位高、穗上葉片數(shù)和總?cè)~片數(shù)的QTL。另外,李賢唐等[27]利用一套重組自交系對(duì)玉米株型性狀進(jìn)行了QTL分析,在Bin6.04處檢測(cè)到1個(gè)與株高相關(guān)的QTL(mmc0523~umc2006),同時(shí)也在Bin6.03~Bin6.04處檢測(cè)到1個(gè)與穗位高相關(guān)的QTL(umc1887~umc1796)。李浩川等[28]也采用一套DH系對(duì)玉米株高和穗位高進(jìn)行遺傳分析,并在Bin3.01處定位到與穗位高相關(guān)的QTL。而本研究也在Bin5.03和Bin6.04處檢測(cè)到了9個(gè)與株高顯著相關(guān)的SNP,在Bin3.01、Bin6.03及Bin7.01處分別定位到1個(gè)與穗位高相關(guān)的SNP,結(jié)合前人研究進(jìn)一步表明,Bin 5.03、Bin6.04及Bin 3.01附近是調(diào)控玉米株高、穗位高等重要性狀的富集點(diǎn),且對(duì)玉米生長發(fā)育發(fā)揮著重要的積極效應(yīng)。
此外,本研究對(duì)玉米各性狀顯著關(guān)聯(lián)的SNP位點(diǎn)進(jìn)行了可能的候選基因預(yù)測(cè),在株高、穗位高、總?cè)~片數(shù)、穗上葉數(shù)及單穗重等5個(gè)性狀中,僅株高、穗位高及單穗重間檢測(cè)到了顯著的SNP位點(diǎn),并對(duì)每一性狀的顯著位點(diǎn)搜索其候選基因及其功能注釋(附表1)。在與株高相關(guān)的12個(gè)基因中,發(fā)現(xiàn)基因GRMZM2G048363(Bin5.03)編碼無機(jī)磷酸鹽轉(zhuǎn)運(yùn)蛋白(inorganic phosphate cotransporter),而磷元素作為植物生長發(fā)育所必需的三大元素之一,其對(duì)植物生長發(fā)育起著至關(guān)重要的作用,同時(shí)也參與植物體內(nèi)三磷酸腺苷和磷脂等重要分子的構(gòu)成,在能量轉(zhuǎn)移、代謝調(diào)節(jié)和蛋白活性調(diào)控等多方面起作用[29],因此推測(cè)該基因可能是通過對(duì)磷素的吸收來達(dá)到植物生長所需的最佳比例,從而促進(jìn)植物莖稈的生長。另外,本研究還發(fā)現(xiàn)在與穗位高相關(guān)的25個(gè)基因中,基因GRMZM2G042752(Bin7.01)編碼F-box蛋白At5g07610,Dieterle[30]和吳丹等[31]指出F-box蛋白在植物生長發(fā)育中發(fā)揮著重要作用,尤其在調(diào)節(jié)植物光形態(tài)建成方面有著極其重要的正向作用。秘彩莉等[32]也指出F-box蛋白在植物生長發(fā)育中至關(guān)重要,同時(shí)也參與植物激素(乙烯、生長素、赤霉素、茉莉酸)的信號(hào)傳導(dǎo)及花器官發(fā)育等多種生物學(xué)過程。而生長素和赤霉素在促進(jìn)植物生長方面有著積極的正向作用,且赤霉素最突出的生理效應(yīng)是促進(jìn)莖的伸長。因此,基因GRMZM2G042752可能通過調(diào)節(jié)植物體內(nèi)生長素和赤霉素等多種激素的共同作用,調(diào)節(jié)植物莖的伸長生長。
本研究采用3種模型(Q、K和Q+K)對(duì)玉米株高、穗位高、總?cè)~片數(shù)、穗上葉片、單穗重等5個(gè)株型相關(guān)性狀進(jìn)行全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)Q+K模型對(duì)假陽性的控制效果最好。基于Q+K模型的 GWAS 結(jié)果表明,以P≤1×10-5為顯著闕值在群體間共檢測(cè)到13個(gè)與玉米株高、穗位高及單穗重顯著相關(guān)的SNP,并搜素到39個(gè)相關(guān)基因,其中12個(gè)基因在NCBI和MaizeGDB中可以搜到相關(guān)的功能注釋。此外,通過對(duì)株高、穗位高及單穗重等3個(gè)性狀所有檢測(cè)到的SNP位點(diǎn)進(jìn)行候選基因挖掘及其功能注釋,推測(cè)出控制株高和穗位高最佳的候選基因。
附表1 玉米相關(guān)性狀候選基因及功能注釋Schedule 1 Candidate genes and functional annotation of corn-ear trifoliate traits