劉坤,張雪海,孫高陽(yáng),閆鵬帥,郭海平,陳思遠(yuǎn),薛亞?wèn)|,郭戰(zhàn)勇,謝惠玲,湯繼華,李衛(wèi)華
?
玉米株型相關(guān)性狀的全基因組關(guān)聯(lián)分析
劉坤1,張雪海1,孫高陽(yáng)1,閆鵬帥1,郭海平1,陳思遠(yuǎn)2,薛亞?wèn)|1,郭戰(zhàn)勇1,謝惠玲1,湯繼華1,李衛(wèi)華1
(1河南農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/省部共建小麥玉米作物學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,鄭州 450002;2鄭州市第一中學(xué),鄭州 450002)
【目的】玉米株型性狀與植株產(chǎn)量、光合效率、抗倒性等密切相關(guān),是理想株型設(shè)計(jì)育種的基礎(chǔ),通過(guò)對(duì)玉米多個(gè)株型相關(guān)性狀進(jìn)行全基因組關(guān)聯(lián)分析,構(gòu)建玉米理想株型,為抗倒伏、耐密性的玉米新品種選育提供理論基礎(chǔ)?!痉椒ā恳?84份溫帶、亞熱帶和熱帶材料組成的關(guān)聯(lián)群體為研究對(duì)象,在鄭州與??h2個(gè)環(huán)境下對(duì)玉米總?cè)~片數(shù)(LN)、穗上葉片數(shù)(LNAN)、穗上葉片數(shù)與總?cè)~片數(shù)比值(LNAN/LN)、株高(PH)、穗位高(EH)、穗位高與株高的比值(EH/PH)等6個(gè)玉米株型相關(guān)性狀進(jìn)行調(diào)查,借助覆蓋玉米全基因組約56萬(wàn)個(gè)SNP標(biāo)記,進(jìn)行全基因組關(guān)聯(lián)分析,以期為玉米新品種的選育提供理論依據(jù)。【結(jié)果】2個(gè)環(huán)境下,6個(gè)性狀均表現(xiàn)為正態(tài)分布;大多數(shù)性狀之間均存在高度正相關(guān)或負(fù)相關(guān);方差分析表明這6個(gè)株型相關(guān)性狀的基因型與環(huán)境以及基因型×環(huán)境的互作均達(dá)到顯著水平。在選擇最優(yōu)關(guān)聯(lián)分析模型時(shí),發(fā)現(xiàn)Q模型假陽(yáng)性較高,Q+K模型對(duì)假陽(yáng)性的控制過(guò)于嚴(yán)格,而K模型的表現(xiàn)最好;在2個(gè)環(huán)境下,全基因組關(guān)聯(lián)分析(K模型)共檢測(cè)到56個(gè)顯著SNP-性狀關(guān)聯(lián)(≤3.99E-6),這些SNPs共涉及5個(gè)性狀的17個(gè)位點(diǎn),每個(gè)位點(diǎn)解釋的表型變異從7.97%—10.56%不等。同時(shí)發(fā)現(xiàn)有4個(gè)位點(diǎn)能夠在2個(gè)環(huán)境中同時(shí)被檢測(cè)到,表明這4個(gè)位點(diǎn)受環(huán)境影響較小,在不同環(huán)境下可以穩(wěn)定存在。通過(guò)對(duì)顯著關(guān)聯(lián)的SNP上下游各50 kb范圍內(nèi)候選基因進(jìn)行搜索,共發(fā)現(xiàn)80個(gè)候選基因,其中42個(gè)具有功能注釋。例如,與株高和穗位高顯著相關(guān)的基因GRMZM2G161293編碼一個(gè)具有乙酰葡糖轉(zhuǎn)移酶活性的蛋白,該酶催化UDP-N-乙酰氨基葡萄糖生成糖過(guò)程中的N-乙酰葡糖氨基殘基的轉(zhuǎn)移,可能通過(guò)影響玉米籽??扇苄蕴呛窟M(jìn)而影響產(chǎn)量,推測(cè)其為最可能的候選基因?!窘Y(jié)論】K模型對(duì)假陽(yáng)性的控制效果最好,基于K模型的GWAS結(jié)果,一共檢測(cè)到17個(gè)株型性狀相關(guān)的位點(diǎn)。
玉米(L.);全基因組關(guān)聯(lián)分析(GWAS);株型性狀;理想株型
【研究意義】玉米的理想株型[1]具有較高的光能利用效率,具備制造更多干物質(zhì)的生理潛力。實(shí)現(xiàn)生育期內(nèi)源、流和庫(kù)的協(xié)調(diào)發(fā)展,合理分配光合產(chǎn)物,可使植株間的競(jìng)爭(zhēng)達(dá)到最小狀態(tài),從而提高產(chǎn)量。株型相關(guān)性狀如株高、穗位高、葉片數(shù)等與植株產(chǎn)量、光合效率、抗倒性等密切相關(guān),是理想株型設(shè)計(jì)育種的基礎(chǔ)。因此,對(duì)其遺傳基礎(chǔ)進(jìn)行研究,不但可以了解玉米理想株型建成的遺傳機(jī)制,而且還可幫助在育種實(shí)踐中有效降低植株高度與穗位高度、合理調(diào)控葉片數(shù)目及分布,從而提高作物產(chǎn)量?!厩叭搜芯窟M(jìn)展】玉米株型性狀是典型的數(shù)量性狀,由多基因控制并受多種因素尤其是環(huán)境的影響十分顯著。因此,科研工作者常利用數(shù)量性狀位點(diǎn)(quantitative trait locus,QTL)定位的方法分析玉米株型性狀的遺傳機(jī)制,解析基因的遺傳效應(yīng)、基因之間的互作及基因與環(huán)境之間的互作關(guān)系。近年來(lái),隨著測(cè)序技術(shù)和統(tǒng)計(jì)方法的發(fā)展,研究者借助高密度標(biāo)記分別對(duì)株高、穗位高、葉夾角、葉長(zhǎng)、葉寬、節(jié)間數(shù)等玉米株型性狀的遺傳規(guī)律進(jìn)行解析。玉米株高與穗位高是株型的重要構(gòu)成因子,并且是玉米數(shù)量遺傳學(xué)研究的模式性狀,前人分別利用不同的分離群體(如重組自交系群體)和關(guān)聯(lián)群體等[2-8],對(duì)玉米株高和穗位高的遺傳機(jī)制進(jìn)行了大量研究,檢測(cè)到多個(gè)與株高和穗位高相關(guān)的QTL,分布在玉米的10條染色體上[9-10]。其中位于玉米第1染色體的所在的玉米株高效應(yīng)位點(diǎn),可以解釋20%的表型變異。Teng等[11]克隆的株高基因,被認(rèn)為是調(diào)控玉米株高的主效QTL即的候選基因。Yang等[12]對(duì)玉米株高進(jìn)行了關(guān)聯(lián)分析,在混合線性模型下僅找到一個(gè)位于第3染色體的SNP(chr.3:162709488),該SNP可解釋9.61%的表型變異;Pan等[13]利用3種不同的定位方法(SLM、JLM和GWAS)對(duì)10個(gè)重組自交系群體組成的ROAM群體的株型性狀進(jìn)行定位,在SLM、JLM和GWAS下分別鑒定到83、86和38個(gè)株高QTL,并精細(xì)定位了一個(gè)位于第3染色體的株高主效QTL到600 kb(165.73—166.37 Mb)。國(guó)內(nèi)外許多學(xué)者對(duì)玉米葉片數(shù)與產(chǎn)量之間的關(guān)系也進(jìn)行了大量研究[14-16],發(fā)現(xiàn)雖然多葉品種可以增加穗上部分的葉片面積,增加了受光面積指數(shù),使得植株生物量增高,但是多葉品種并沒(méi)有增加籽粒產(chǎn)量。而玉米品種最終產(chǎn)量的提高是在種植密度不變的條件下增加了玉米的葉面積指數(shù),進(jìn)而增加受光面積,加速灌漿速率[17-20],其中穗上葉片數(shù)對(duì)單產(chǎn)有較大的正向直接效應(yīng)[21]。【本研究切入點(diǎn)】盡管前人利用不同的分離群體定位并克隆了一些與株高、穗位高、葉片數(shù)等株型性狀相關(guān)的QTL或基因,但由于這些性狀屬于復(fù)雜的數(shù)量性狀,人們對(duì)其遺傳機(jī)理還知之甚少。【擬解決的關(guān)鍵問(wèn)題】本研究以284份遺傳多樣性豐富的溫帶、亞熱帶和熱帶材料組成的關(guān)聯(lián)群體為研究對(duì)象,借助覆蓋玉米全基因組的約56萬(wàn)個(gè)SNP標(biāo)記,對(duì)玉米多個(gè)株型相關(guān)性狀進(jìn)行全基因組關(guān)聯(lián)分析,旨在為玉米理想株型的構(gòu)建,為抗倒伏、耐密植的玉米新品種選育提供理論基礎(chǔ)。
所用材料為華中農(nóng)業(yè)大學(xué)嚴(yán)建兵教授提供,是從關(guān)聯(lián)群體(n=513)中選擇的在鄭州及鶴壁適應(yīng)性較好的284份玉米自交系構(gòu)成,主要來(lái)源為熱帶(104份)、亞熱帶(42份)及溫帶材料(138份)。
關(guān)聯(lián)群體于2012年分別種植在鄭州河南農(nóng)業(yè)大學(xué)試驗(yàn)站(鄭州試驗(yàn)站)與鶴壁??h的鶴壁農(nóng)科院試驗(yàn)站(浚縣試驗(yàn)站)。田間設(shè)計(jì)采用完全隨機(jī)區(qū)組設(shè)計(jì),3次重復(fù),每個(gè)材料單行區(qū)種植,行長(zhǎng)4 m,行距0.67 m,株距0.25 m,密度63 000株/hm2,田間管理采用常規(guī)管理。為了葉片數(shù)目調(diào)查的準(zhǔn)確性,在小喇叭口和大喇叭口時(shí)期分別對(duì)玉米第5和第10片葉進(jìn)行標(biāo)記,并在玉米灌漿末期,每一行挑選10株長(zhǎng)勢(shì)均勻的植株對(duì)4個(gè)株型相關(guān)性狀株高(plant height,PH)、穗位高(ear height,EH)、總?cè)~片數(shù)(leaf number,LN)和穗上葉片數(shù)(leaf number above ear,LNAN)進(jìn)行調(diào)查。
1.3.1 一般統(tǒng)計(jì)分析 采用Excel、SPSS19.0統(tǒng)計(jì)軟件對(duì)2個(gè)環(huán)境下關(guān)聯(lián)群體的株高(PH)、穗位高(EH)、總?cè)~片數(shù)(LN)、穗上葉片數(shù)(LNAN)以及由此衍生的穗位高/株高(EH/PH)和穗上葉片數(shù)/總?cè)~片數(shù)(LNAN/LN)等6個(gè)性狀進(jìn)行統(tǒng)計(jì)分析,并分別計(jì)算各性狀的平均值、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、頻率分布等,并進(jìn)行相關(guān)性分析。
同時(shí)根據(jù)R語(yǔ)言的lme4包[22]的混合線性模型進(jìn)行最佳線性無(wú)偏預(yù)測(cè)(best linear unbiased prediction,Blup),評(píng)估2個(gè)環(huán)境下每一個(gè)材料每一個(gè)性狀的育種值,最終Blup值也用于后續(xù)的全基因組關(guān)聯(lián)分析。
1.3.2 全基因組關(guān)聯(lián)分析 所使用的基因型為華中農(nóng)業(yè)大學(xué)嚴(yán)建兵教授提供的覆蓋玉米全基因組的最小等位基因頻率大于0.05的558 629個(gè)SNPs組成[12],基因型數(shù)據(jù)可在網(wǎng)站http://www.Maizego.org/Resources.html下載??紤]到很多標(biāo)記間可能存在高度連鎖不平衡,因此,采用GEC軟件[23]計(jì)算了有效標(biāo)記數(shù)(effective number,Ne),并根據(jù)軟件給出的建議值(1/Ne)作為確定各性狀-SNP間是否顯著關(guān)聯(lián)的依據(jù)。
在全基因組關(guān)聯(lián)分析(GWAS)中,由于不同性狀對(duì)GWAS不同模型控制假陽(yáng)性和假陰性的敏感程度不同,因此統(tǒng)計(jì)功效是首先要考慮的因素。為了選擇最優(yōu)的GWAS模型,使用了3種常用的模型,即只控制群體結(jié)構(gòu)的Q模型(Q)、只控制親緣關(guān)系的K模型(K)及同時(shí)控制群體結(jié)構(gòu)和親緣關(guān)系的Q+K模型(Q+K),對(duì)每一個(gè)性狀進(jìn)行了GWAS分析。通過(guò)對(duì)3種模型的QQ Plot的比較來(lái)選擇最優(yōu)模型并對(duì)最優(yōu)模型的GWAS結(jié)果進(jìn)行進(jìn)一步解析,以上GWAS分析均在TASSEL3.0(http://www.maizegenetics.net/)軟件中完成。先前研究表明,該群體的連鎖不平衡(linkage disequilibrium,LD)衰減距離為50 kb[24-25],利用558 629個(gè)SNP標(biāo)記對(duì)所用材料的LD進(jìn)行了重新評(píng)價(jià),發(fā)現(xiàn)平均LD為50—100 kb(2=0.1),簡(jiǎn)便起見(jiàn),選擇50 kb作為L(zhǎng)D衰減距離。因此定義峰值SNP上下游各50 kb的區(qū)間范圍(即共100 kb)為一個(gè)位點(diǎn);同時(shí)定義不同位點(diǎn)間,若存在重疊部分,則這些位點(diǎn)構(gòu)成一個(gè)非重復(fù)的QTL。另外,基于B73參考基因組(B73 RefGen_v2),從玉米數(shù)據(jù)庫(kù)MaizeGDB(http://www.maizegdb.org)下載玉米基因組的基因列表搜索每一個(gè)位點(diǎn)內(nèi)的所有可能的候選基因。根據(jù)InterProScan數(shù)據(jù)庫(kù)(http: //www. ebi.ac.uk/ interpro/scan.html)并結(jié)合美國(guó)國(guó)立生物技術(shù)信息中心數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/)對(duì)每一個(gè)候選基因進(jìn)行功能注釋。最后根據(jù)每一個(gè)位點(diǎn)內(nèi)所有基因的功能注釋及其在B73的各組織的表達(dá)情況,選擇一個(gè)最可能的候選基因。
對(duì)此關(guān)聯(lián)群體在不同環(huán)境下的6個(gè)株型相關(guān)性狀LN、LNAN、LNAN/LN、PH、EH、EH/PH的表型進(jìn)行統(tǒng)計(jì)分析(表1),得知玉米株型相關(guān)性狀存在廣泛變異。同時(shí),也發(fā)現(xiàn)浚縣試驗(yàn)站的株高、穗位高、總?cè)~片數(shù)及穗上葉片數(shù)均高于鄭州試驗(yàn)站(圖1),主要是由于??h位于更高緯度,日照長(zhǎng)度要高于鄭州,導(dǎo)致?tīng)I(yíng)養(yǎng)生產(chǎn)期延長(zhǎng)所致,同時(shí)發(fā)現(xiàn)2個(gè)環(huán)境中株型相關(guān)性狀的峰度和偏度的絕對(duì)值均小于1(表1),暗示這些性狀均遵從正態(tài)分布,表明這些性狀均為典型的數(shù)量性狀,由微效多基因控制。
通過(guò)對(duì)2個(gè)環(huán)境的6個(gè)玉米株型性狀進(jìn)行相關(guān)性分析,發(fā)現(xiàn)除了??h試驗(yàn)站穗位高與穗上葉片數(shù)及2個(gè)環(huán)境下株高與穗位高/株高的比值不存在顯著相關(guān)之外。其余各性狀之間均表現(xiàn)出顯著正相關(guān)或顯著負(fù)相關(guān)(表2)。2個(gè)環(huán)境中的穗上葉片數(shù)與總?cè)~片數(shù)的比值和穗上葉片數(shù)之間、以及穗位高與株高比值和穗位高之間、株高和穗位高之間的相關(guān)系數(shù)較大,并處于極顯著水平。說(shuō)明各性狀的發(fā)育存在著相互協(xié)同促進(jìn)的作用。
a:葉片數(shù)相關(guān)性狀;b:株高相關(guān)性狀;XX表示??h試驗(yàn)站;ZZ表示鄭州試驗(yàn)站;LN:總?cè)~片數(shù);LNAN:穗上葉片數(shù);LNAN/LN表示穗上葉片數(shù)與總?cè)~片數(shù)比值;EH:穗位高;PH:株高;EH/PH:穗位高與株高的比值。下同
表1 玉米不同環(huán)境下株型相關(guān)性狀描述統(tǒng)計(jì)分析
表2 關(guān)聯(lián)群體株型性狀的相關(guān)性分析
**:在0.01水平上顯著相關(guān);*:在0.05水平上顯著相關(guān)。下同。對(duì)角線右上角表示??h點(diǎn),對(duì)角線左下角表示鄭州點(diǎn)
* *: Correlation is significant at the 0.01 level; *: Correlation is significant at the 0.05 level. The same as below. Correlation coefficients in Xunxian are above the diagonal, in Zhengzhou are below the diagonal
方差分析結(jié)果表明,關(guān)聯(lián)群體所有6個(gè)株型性狀的基因型效應(yīng)都達(dá)到極顯著水平,說(shuō)明關(guān)聯(lián)群體各材料間的株型性狀存在顯著的遺傳變異(表3)。同時(shí),環(huán)境間、基因型與環(huán)境互作的差異也達(dá)到極顯著水平,說(shuō)明玉米株型不同性狀受環(huán)境影響較大,同時(shí)也存在著基因型與環(huán)境之間的互作關(guān)系。
2.3.1 閾值確定 通過(guò)GEC軟件[23]計(jì)算了558 629個(gè)SNPs的有效標(biāo)記數(shù),結(jié)果表明,有效標(biāo)記數(shù)Ne為250 345,軟件給出的建議值為3.99E-6(1/Ne),因此,該值將作為后續(xù)GWAS分析的標(biāo)記-性狀間顯著關(guān)聯(lián)的閾值。
2.3.2 模型選擇 以2個(gè)環(huán)境下6個(gè)性狀的Blup值(作為一個(gè)新的環(huán)境)為例,用3種模型(Q、K和Q+K)分別進(jìn)行了GWAS分析,通過(guò)不同性狀3種模型的比較,從QQ圖中不難看出(圖2),對(duì)這6個(gè)性狀來(lái)說(shuō),Q模型(圖中紅色點(diǎn))對(duì)假陽(yáng)性的控制效果最差,而K(圖中黑色點(diǎn))和Q+K模型(圖中藍(lán)色點(diǎn))對(duì)假陽(yáng)性的控制較好,但是Q+K模型控制的過(guò)于嚴(yán)格,綜合考慮,在后續(xù)分析中,對(duì)這6個(gè)性狀,均選擇K模型的結(jié)果進(jìn)行進(jìn)一步闡述。
2.3.3 關(guān)聯(lián)分析結(jié)果解析 利用覆蓋全基因組的558 629個(gè)SNP標(biāo)記對(duì)關(guān)聯(lián)群體在2個(gè)環(huán)境下的6個(gè)株型性狀進(jìn)行關(guān)聯(lián)分析,基于K模型,在≤3.99E-6下,6個(gè)株型性狀一共檢測(cè)到56個(gè)SNPs-性狀關(guān)聯(lián)。2個(gè)環(huán)境聯(lián)合分析條件下(Blup),6個(gè)株型相關(guān)性狀的曼哈頓圖見(jiàn)圖3。
用55萬(wàn)SNPs標(biāo)記對(duì)該群體LD的評(píng)估表明,該群體的衰減距離為50 kb[24],基于此衰減距離,56個(gè)SNPs-性狀關(guān)聯(lián)涉及到的SNP一共分布于17個(gè)位點(diǎn)內(nèi),該結(jié)果與數(shù)量性狀位點(diǎn)的本質(zhì)相一致,即由微效多基因控制;其中在鄭州試驗(yàn)站、??h實(shí)驗(yàn)站及Blup下分別檢測(cè)到8個(gè)、5個(gè)和9個(gè)位點(diǎn)。具體來(lái)說(shuō)(表4和圖4),鄭州環(huán)境下一共檢測(cè)到10個(gè)SNP-性狀關(guān)聯(lián),涉及到8個(gè)位點(diǎn),分別是位于第5和第8染色體與株高有關(guān)的2個(gè)位點(diǎn),分別解釋8.73%和9.54%的株高表型變異;位于玉米第3、5、6、8染色體與穗位高有關(guān)的4個(gè)位點(diǎn),每個(gè)位點(diǎn)解釋的表型變異在8.19%—10.10%不等,平均為8.83%;及位于第4和第8染色體與穗位高與株高比值相關(guān)的2個(gè)位點(diǎn),分別解釋8.83%和10.42%的表型變異。并沒(méi)有檢測(cè)到與葉片數(shù)相關(guān)性狀的顯著位點(diǎn)。而在??h環(huán)境下,一共檢測(cè)到5個(gè)顯著位點(diǎn),分別為與株高有關(guān)的位于第1和第7染色體的2個(gè)位點(diǎn),分別可解釋9.69%和9.66%的表型變異;及與穗位高,穗位高與株高比值及總?cè)~片數(shù)有關(guān)的分別位于第8、7、10染色體的3個(gè)位點(diǎn),這3個(gè)位點(diǎn)分別能解釋10.31%、9.34%和10.46%表型變異。2個(gè)環(huán)境聯(lián)合分析(Blup)下,在第9染色體共檢測(cè)到與穗位高相關(guān)的8個(gè)顯著位點(diǎn)(涉及到16個(gè)顯著的SNP),每個(gè)位點(diǎn)平均可解釋8.76%的表型變異;同時(shí)發(fā)現(xiàn)位于第5、8、9染色體的3個(gè)與株高有關(guān)的位點(diǎn),分別解釋8.12%、9.20%和8.58%的表型變異,其中位于第9染色體的位點(diǎn)里有11個(gè)顯著的SNPs,并且該位點(diǎn)與穗位高的位點(diǎn)為同一個(gè)位點(diǎn)。還發(fā)現(xiàn)1個(gè)位于第8染色體的與穗位高與株高比值的位點(diǎn),可解釋10.12%的表型變異;2個(gè)與總?cè)~片數(shù)有關(guān)的位點(diǎn),位于第7和第10染色體,分別解釋8.12%和8.22%的表型變異;另外還發(fā)現(xiàn)2個(gè)分別位于第3和第5與穗上葉片數(shù)有關(guān)的位點(diǎn),分別可解釋8.06%和8.88%的表型變異。
表3 玉米不同環(huán)境下株型相關(guān)性狀的方差分析
E:環(huán)境;G:基因型;G×E:基因與環(huán)境互作
E: environment; G: genotype; G×E: genotype-by-environment interaction
同時(shí)發(fā)現(xiàn)有4個(gè)位點(diǎn),分別為表4中的第7、13、14和17位點(diǎn)可同時(shí)在2個(gè)以上環(huán)境中被檢測(cè)到,表明這些位點(diǎn)受環(huán)境影響較小,可在不同環(huán)境下穩(wěn)定遺傳,這些信息為將來(lái)繼續(xù)深入分析這些位點(diǎn)提供了有價(jià)值的信息。值得注意的是,在2個(gè)環(huán)境及Blup下均沒(méi)檢測(cè)到與穗上葉片數(shù)與總?cè)~片數(shù)比值相關(guān)的位點(diǎn)(圖3、圖4和表4),表明這一性狀受環(huán)境影響較大或在該群體中不存在控制這一性狀的主效位點(diǎn)。
a:株高_(dá)2012;b:穗位高_(dá)2012;c:穗位高/株高_(dá)2012;d:穗上葉片數(shù)_2012;e:總?cè)~片數(shù)_2012;f:穗上葉片數(shù)/總?cè)~片數(shù)_2012。下同
基于該群體的LD衰減距離,在峰值SNP上下游各50 kb范圍內(nèi)搜索候選基因。6個(gè)株型性狀的17個(gè)顯著關(guān)聯(lián)位點(diǎn)上下游各50 kb范圍內(nèi)一共搜到80個(gè)候選基因,其中有功能注釋的基因有42個(gè)。根據(jù)每一個(gè)位點(diǎn)內(nèi)所有候選基因的功能注釋及其在B73的各組織的表達(dá)情況,選擇一個(gè)最可能的候選基因及其注釋列于表4。
由于不同性狀對(duì)GWAS不同模型在控制Ⅰ型錯(cuò)誤(假陽(yáng)性)的敏感性不同,即存在性狀依賴性,因此,在進(jìn)行GWAS分析前首要考慮的是GWAS的統(tǒng)計(jì)功效,即最大可能的降低假陽(yáng)性。先前研究表明,對(duì)于玉米的開花期、穗位高和穗粗性狀來(lái)說(shuō),K模型和Q+K模型均能很好的控制假陽(yáng)性,但是Q+K模型比K模型更好[26]。本研究發(fā)現(xiàn)Q+K模型對(duì)假陽(yáng)性的控制較嚴(yán)格(圖2),若采用Q+K模型則會(huì)產(chǎn)生更多的假陰性結(jié)果,而K模型對(duì)假陽(yáng)性的控制效果最好,因此,最終選擇表現(xiàn)較好的K模型對(duì)GWAS結(jié)果進(jìn)行進(jìn)一步解析。
玉米的農(nóng)藝及產(chǎn)量相關(guān)性狀的研究近年來(lái)報(bào)道較多,陳榮江等[27]通過(guò)研究玉米的穗長(zhǎng)、穗行數(shù)、行粒數(shù)、百粒重、株高、穗位高、穗重及穗粗在內(nèi)的8個(gè)性狀與產(chǎn)量之間的關(guān)系,發(fā)現(xiàn)這8個(gè)性狀與產(chǎn)量存在正相關(guān);湯繼華等[2]以豫玉22構(gòu)建的260多個(gè)F2:3家系為材料,研究了不同環(huán)境條件下的穗位高、雄穗分枝數(shù)、莖粗與產(chǎn)量之間的關(guān)系,發(fā)現(xiàn)與產(chǎn)量之間也存在顯著正相關(guān)。本研究以284份遺傳性豐富的溫帶、熱帶、亞熱帶材料為研究對(duì)象,在鄭州和??h2個(gè)環(huán)境下對(duì)玉米株高、穗位高、總?cè)~片數(shù)和穗上葉片數(shù)以及株高/穗位高、總?cè)~片數(shù)/穗上葉片數(shù)等6個(gè)株型性狀進(jìn)行分析,發(fā)現(xiàn)在2個(gè)環(huán)境下的不同性狀之間均存在顯著正相關(guān)或者負(fù)相關(guān),說(shuō)明各性狀的發(fā)育存在著相互協(xié)同促進(jìn)作用。通過(guò)對(duì)鄭州和??h這6個(gè)株型性狀的全基因組關(guān)聯(lián)分析,在K模型下,一共檢測(cè)到56個(gè)SNP-性狀關(guān)聯(lián)(株高、穗位高、穗位高與株高比值、總?cè)~片數(shù)、穗上葉片數(shù)),這些SNP涉及到17個(gè)位點(diǎn)。而穗上葉片數(shù)與總?cè)~片數(shù)比值這一性狀沒(méi)有檢測(cè)到顯著的SNPs,表明該性狀受環(huán)境影響較大或者在該關(guān)聯(lián)群體中不存在控制這一性狀的主效位點(diǎn)。在這17個(gè)位點(diǎn)里,同時(shí)發(fā)現(xiàn)有4個(gè)位點(diǎn)能夠在2個(gè)環(huán)境中被檢測(cè)到,表明這4個(gè)位點(diǎn)受環(huán)境影響較小,在不同環(huán)境下可以穩(wěn)定存在。同時(shí)也發(fā)現(xiàn),有的性狀和多個(gè)位點(diǎn)顯著關(guān)聯(lián),表明這些性狀受微效多基因控制,符合數(shù)量性狀的本質(zhì)[28]。
圖3 ??h與鄭州2個(gè)環(huán)境結(jié)合分析(Blup)下株型相關(guān)性狀的曼哈頓圖
圖4 各個(gè)環(huán)境下株型相關(guān)性狀顯著位點(diǎn)的分布
表4 全基因組關(guān)聯(lián)分析鑒定到的顯著位點(diǎn)及有關(guān)信息以及每個(gè)位點(diǎn)里的最可能的候選基因及其功能注釋
a所有有重疊區(qū)間的QTL被歸為一個(gè)非重復(fù)的QTL或位點(diǎn),位點(diǎn)的ID根據(jù)染色體及物理位置升序排序命名;b每個(gè)SNP的物理位置是基于B73參考基因組v2版本得到;c相應(yīng)性狀的值是通過(guò)K模型計(jì)算得到;d相應(yīng)位點(diǎn)解釋的表型變異;e位點(diǎn)內(nèi)一個(gè)可能的生物學(xué)候選基因或離峰值SNP最近的候選基因。ZZ表示鄭州,XX表示??h,Blup表示2個(gè)環(huán)境的綜合
aAll QTLs with overlapping QTL regions were categorized as a non-redundant QTL or loci, ID of loci was numbered according to chromosome and position by a ascending order method;bPhysical position of each SNP based on B73 RefGen_v2.cP value of the corresponding trait calculated by K model.dThe phenotypic variance explained by the corresponding locus.eA plausible biological candidate gene in the locus or the nearest annotated gene to the lead SNP. ZZ: Zhengzhou; XX: Xunxian
基于B73參考基因組及每一個(gè)顯著位點(diǎn)的LD衰減距離,在這17個(gè)位點(diǎn)里一共發(fā)現(xiàn)80個(gè)候選基因,其中42個(gè)基因有功能注釋,其余38個(gè)基因的功能未知;42個(gè)已知功能的基因涉及到轉(zhuǎn)導(dǎo)蛋白、還原蛋白、金屬離子轉(zhuǎn)運(yùn)蛋白、脂類蛋白、纖維素合酶等,功能涉及能量代謝、物質(zhì)運(yùn)輸、生物調(diào)控、信號(hào)傳導(dǎo)等生化代謝途徑。
17個(gè)位點(diǎn)里,發(fā)現(xiàn)多個(gè)位點(diǎn)里存在多個(gè)顯著的SNP,比如位點(diǎn)16里含有17個(gè)顯著SNP,表明這些SNP間可能存在很強(qiáng)的連鎖不平衡關(guān)系,這些成簇SNP所在區(qū)域,是控制株型性狀的熱點(diǎn)區(qū)域,有必要對(duì)其加以深入挖掘,為培育理想株型品種的選育提供重要研究?jī)r(jià)值。鄭克志等[25, 29]以玉米自交系T319與9406為親本構(gòu)建的242個(gè)重組自交系(F8)對(duì)玉米株高和穗位高進(jìn)行QTL分析,結(jié)果發(fā)現(xiàn)6個(gè)株高相關(guān)的QTL,其中有2個(gè)QTL同時(shí)控制穗位高。本研究也發(fā)現(xiàn)了4個(gè)位點(diǎn)(位點(diǎn)7、13、14和17)可同時(shí)在2個(gè)以上環(huán)境中被檢測(cè)到(表4),表明這些位點(diǎn)受環(huán)境影響較小,可在不同環(huán)境下穩(wěn)定遺傳,同時(shí)也發(fā)現(xiàn)有些位點(diǎn)同時(shí)控制多個(gè)性狀,比如位點(diǎn)16同時(shí)控制株高和穗位高,這些信息為將來(lái)繼續(xù)深入利用和克隆這些位點(diǎn)提供了有價(jià)值的信息。
本研究通過(guò)玉米株型性狀顯著關(guān)聯(lián)的SNP所在位點(diǎn)對(duì)可能的候選基因進(jìn)行預(yù)測(cè)。6個(gè)性狀,有5個(gè)性狀均能檢測(cè)到顯著位點(diǎn),隨后對(duì)每一個(gè)性狀的顯著位點(diǎn)的候選基因及其功能進(jìn)行了預(yù)測(cè)(表4),值得注意的是,在鄭州和浚縣2個(gè)環(huán)境的綜合條件下,位于第9染色體的位點(diǎn)16(chr.9:139516295—chr.9:139517032)同時(shí)與株高和穗位高顯著關(guān)聯(lián),并且該位點(diǎn)在先前的兩個(gè)研究中也被報(bào)道與株高相關(guān)(假定2個(gè)研究定位的顯著SNP物理位置小于5 Mb被認(rèn)為同一個(gè)位點(diǎn))。比如,Yang等[12]通過(guò)A—D test共檢測(cè)到株高相關(guān)的107個(gè)顯著SNP,其中第9染色體的4個(gè)SNP(chr9..S_140356597、chr.9.S_140435314、chr.9.S_142397931和chr.9.S_142495942)與該位點(diǎn)共定位;Samayoa等[30]通過(guò)關(guān)聯(lián)分析檢測(cè)到18個(gè)株高顯著SNP,其中第9染色體的一個(gè)SNP, S9_142752809,與該位點(diǎn)共定位;該位點(diǎn)(位點(diǎn)16)內(nèi)一共存在4個(gè)候選基因(GRMZM5G872568、GRMZM2G063875、GRMZM2G161293和GRMZM2G366532),除GRMZM2G161293外,其余基因的功能未知。而GRMZM2G161293編碼一個(gè)BGGP Beta-1-3-半乳糖-O-糖基-糖蛋白,具有乙酰葡糖轉(zhuǎn)移酶活性,該酶催化UDP-N-乙酰氨基葡萄糖生成糖過(guò)程中的N-乙酰葡糖氨基殘基的轉(zhuǎn)移,猜測(cè)可能通過(guò)影響玉米籽??扇苄蕴呛窟M(jìn)而影響產(chǎn)量,推測(cè)其為最可能的候選基因;另外發(fā)現(xiàn)在2個(gè)環(huán)境下能同時(shí)檢測(cè)到的4個(gè)位點(diǎn)(位點(diǎn)7、13、14和17),其中基因GRMZM2G005082、GRMZM5G897342、GRMZM2G440125和GRMZM2G074689分別位于位點(diǎn)7、13、14和17中,這4個(gè)基因分別編碼水解酶,常溫蛋白,鋅離子結(jié)合蛋白及鈣離子結(jié)合蛋白;這些同時(shí)控制多個(gè)性狀的SNP或位點(diǎn)及其在2個(gè)環(huán)境中同時(shí)被檢測(cè)到的SNP或位點(diǎn)可能與株型相關(guān)性狀的候選基因緊密連鎖,可以作為下一步研究的重點(diǎn)區(qū)域。
本研究借助覆蓋玉米全基因組的約56萬(wàn)個(gè)SNP標(biāo)記,利用3種模型(Q、K和Q+K)對(duì)玉米總?cè)~片數(shù)(LN)、穗上葉片數(shù)(LNAN)、穗上葉片數(shù)與總?cè)~片數(shù)比值(LNAN/LN)、株高(PH)、穗位高(EH)、穗位高與株高的比值(EH/PH)等6個(gè)玉米株型相關(guān)性狀進(jìn)行全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)K模型對(duì)假陽(yáng)性的控制效果最好?;贙模型的GWAS結(jié)果,一共檢測(cè)到56個(gè)SNP-性狀關(guān)聯(lián),涉及17個(gè)位點(diǎn),對(duì)顯著關(guān)聯(lián)的SNP上下游各50 kb范圍內(nèi)候選基因進(jìn)行搜索,共發(fā)現(xiàn)80個(gè)候選基因,其中42個(gè)具有功能注釋。
致謝:華中農(nóng)業(yè)大學(xué)作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室嚴(yán)建兵教授為本試驗(yàn)提供關(guān)聯(lián)群體材料及基因型,在此表示感謝。
[1] Donald M. Breeding of crop ideotypes., 1968, 17(3): 385-403.
[2] 湯繼華, 謝惠玲, 黃紹敏, 胡彥民, 劉宗華, 季洪強(qiáng), 寇志安. 缺氮條件下玉米自交系葉綠素含量與光合效率的變化. 華北農(nóng)學(xué)報(bào), 2005, 20(5): 10-12.
TANG J H, XIE H L, HUANG S M, HU Y M, LIU Z H, JI H Q, KOU Z A. The changes of the content for chlorophyll and photosynthetic productivity in maize inbred lines under the low-nitrogen stress., 2005, 20(5): 10-12. (in Chinese)
[3] 何坤輝, 常立國(guó), 崔婷婷, 渠建洲, 郭東偉, 徐淑兔, 張興華, 張仁和, 薛吉全, 劉建超. 多環(huán)境下玉米株高和穗位高的QTL定位. 中國(guó)農(nóng)業(yè)科學(xué), 2016, 49(8): 1443-1452.
HE K H, CHANG L G, CUI T T, QU J Z, GUO D W, XU S T, ZHANG X H, ZHANG R H, XUE J Q, LIU J C. Mapping QTL for plant height and ear height in maize under multi-environments., 2016, 49(8): 1443-1452. (in Chinese)
[4] 殷鵬程. 玉米株高和穗位高的QTL定位[D]. 武漢: 華中農(nóng)業(yè)大學(xué), 2015.
YIN P C.QTL mapping of plant height and ear height in maize[D]. Wuhan: Huazhong Agricultural University, 2015. (in Chinese)
[5] 楊俊品, 榮廷昭, 向道權(quán), 唐海濤, 黃烈建, 戴景瑞. 玉米數(shù)量性狀基因定位. 作物學(xué)報(bào), 2005, 31(2): 188-196.
YANG J P, RONG T Z, XIANG D Q, TANG H T, HUANG L J, DAI J R. QTL mapping of quantitative traits in maize., 2005, 31(2): 188-196. (in Chinese)
[6] 曹永國(guó), 王國(guó)英, 王守才, 魏艷玲, 盧江, 謝友菊, 戴景瑞. 玉米R(shí)FLP遺傳圖譜的構(gòu)建及矮生基因定位. 科學(xué)通報(bào), 1999, 44(20): 2178-2182.
CAO Y G, WANG G Y, WANG S C, WEI Y L, LU J, XIE Y J, DAI J R. Construction and localization of dwarf gene RFLP genetic map of maize., 1999, 44(20): 2178-2182. (in Chinese)
[7] 蘭進(jìn)好, 李新海, 高樹仁, 張寶石, 張世煌. 不同生態(tài)環(huán)境下玉米產(chǎn)量性狀QTL分析. 作物學(xué)報(bào), 2005, 31(10): 1253-1259.
LAN J H, LI X H, GAO S R, ZHANG B S, ZHANG S H. QTL analysis of yield components in maize under different environments., 2005, 31(10): 1253-1259. (in Chinese)
[8] 許誠(chéng), 王彬, 毛克舉, 胡彥民, 謝惠玲, 湯繼華. 利用單片段代換系群體定位玉米株型性狀QTL. 玉米科學(xué), 2014, 22(2): 28-34.
XU C, WANG B, MAO K J, HU Y M, XIE H L, TANG J H. QTL mapping for plant-type related traits using single segment substitution lines in maize., 2014, 22(2):28-34. (in Chinese)
[9] 張志明, 趙茂俊, 榮廷昭, 潘光堂. 玉米SSR連鎖圖譜構(gòu)建與株高及穗位高QTL定位. 作物學(xué)報(bào), 2007, 33(2): 341-344.
ZHANG Z M, ZHAO M J, RONG T Z, PAN G T. SSR linkage map construction and qtl identification for plant height and ear height in maize (L)., 2007, 33(2): 341-344. (in Chinese)
[10] Xing A, Gao Y, Ye L F,CAI L CHING A, LLACA V, JOHNSON B, LIU L, YANG X H, KANG D M, YAN J B, LI J S. A rare SNP mutation in brachytic2 moderately reduces plant height and increases yield potential in maize., 2015, 66(13): 3791-3802.
[11] Teng F, Zhai L, Liu R, BAI W, WANG L, HUO D, TAO Y, ZHENG Y, ZHANG Z. ZmGA3ox2, a candidate gene for a major QTL, qPH3.1, for plant height in maize., 2013, 73(3): 405-416.
[12] YANG N, LU Y, YANG X, HUANG J, ZHOU Y, ALI F, WEN W, LIU J, LI J, YAN J.Genome wide association studies using a new nonparametric model reveal the genetic architecture of 17 agronomic traits in an enlarged maize association panel., 2014, 10(9): e1004573.
[13] PAN Q, XU Y, LI K, PENG Y, ZHAN W, LI W, LI L, YAN J. The genetic basis of plant architecture in 10 maize recombinant inbred line populations., 2017, 175(2): 858-873.
[14] SHAVER G R. Mineral nutrition and leaf longevity inthe role of individual nutrients and the timing of leaf mortality., 1983, 56(2): 160-165.
[15] Dwyer L M, Andrews C J, Stewart D W, MA B L, DUGAS J A. Carbohydrate levels in field-grown leafy and normal maize genotypes., 1995, 35(4): 1020-1027.
[16] Andrews C J, Dwyer L M, Stewart D W, DUGS J A, BONN P, DEYER L M. Distribution of carbohydrate during grainfill in leafy and normal maize hybrids., 2000, 80(1): 87-95.
[17] Stewart D W, Dwyer L M. Mathematical characterization of maize canopies., 1993, 66(3): 247-265.
[18] Modarres A M, Hamilton R I, Dwyer L M, STEWART D W, DIJAK M, SMITH D L. Leafy reduced-stature maize for short-season environments: yield and yield components of inbred lines., 1997, 97(2): 129-138.
[19] Begna S H, Hamilton R I, Dwyer L M, STEWART D W, SMITH D L. Effects of population density on the yield and yield components of leafy reduced-stature maize in short-season areas., 2010, 178(2): 103-110.
[20] DIJAK M, MODARRES A M, HAMILTON R I, DWYER L M, STEWART D W, MATHER D E, SMITH D L. Leafy reduced-stature maize hybrids for short-season environments., 1999, 39(39): 1106-1110.
[21] 曹靖生. 幾個(gè)玉米株型性狀的遺傳規(guī)律研究. 黑龍江農(nóng)業(yè)科學(xué), 1995(3): 16-19.
CAO J S. Genetic studies on some plant type traits in maize., 1995(3): 16-19. (in Chinese)
[22] CORETEAM R. R: a language and environment for statistical computing.,2015, 14: 12-21.
[23] LI M X, YEUNG J M, CHERNY S S, SHAM P C. Evaluating the effective numbers of independent tests and significant-value thresholds in commercial genotyping arrays and public imputation reference datasets., 2012, 131(5): 747-756.
[24] LI H, PENG Z, YANG X, WANG W, FU J, WANG J H, HAN Y G, CHAI Y C, GUO T T, YANG N, LIU J, WARBURTON M L, CHENG Y B, HAO X M, ZHANG P, ZHAO J Y, LIU Y J, WANG G Y, LI J S, YAN J B. Genome-wide association study dissects the genetic architecture of oil biosynthesis in maize kernels., 2013, 45(1): 43-50.
[25] Feng Y, Zheng Q, Song H, WANG Y, WANG A, JIANG L, YAN J, ZHENG Y, YUE B. Multiple loci not only Rf3 involved in the restoration ability of pollen fertility, anther exsertion and pollen shedding to S type cytoplasmic male sterile in maize., 2015, 128(11): 2341-2350.
[26] Yang X, Gao S, Xu S, Zhang Z, Prasanna BM, Li L, Li J, Yan J. Characterization of a global germplasm collection and its potential utilization for analysis of complex quantitative traits in maize., 2011, 28: 511-526
[27] 陳榮江, 劉永錄. 玉米若干農(nóng)藝性狀的遺傳相關(guān)分析. 河南科技學(xué)院學(xué)報(bào)(自然科學(xué)版), 1997(2): 19-24.
CHEN R J, LIU Y L. Genetic relation analysis of agronomic characters maize.(), 1997(2): 19-24. (in Chinese)
[28] Xiao Y, Tong H, Yang X, XU S, PAN Q, QIAO F, RAIHAN M S, LUO Y, LIU H, ZHANG X, YANG N, WANG X, DENG M, JIN M, ZHAO L, LUO X, ZHOU Y, LI X, LIU J, ZHAN W, LIU N, WANG H, CHEN G, CAI Y, XU G, WANG W, ZHANG D, YAN J. Genome-wide dissection of the maize ear genetic architecture using multiple populations., 2015, 210(3): 1095-1106.
[29] 鄭克志, 李元, 瞿會(huì), 閆偉, 張曠野, 宋茂興, 呂香玲, 李鳳海, 史振聲. 玉米株高和穗位高的QTL定位. 江蘇農(nóng)業(yè)科學(xué), 2015, 43(5): 61-63.
ZHENG K Z, LI Y, QU H, YAN W, ZHANG K Y, SONG M X, LüX L, LI F H, SHI Z S. QTL mapping of plant height and ear height in maize., 2015, 43(5): 61-63. (in Chinese)
[30] SAMAYOA L F, MALVAR R A, OLUKOLU B A, HOLLAND J B, BUTRON A. Genome-wide association study reveals a set of genes associated with resistance to the mediterranean corn borer (L.) in a maize diversity panel., 2015, 15: 35.
(責(zé)任編輯 李莉)
Genome-wide AssociationStudies of Plant Type Traitsin Maize
LIU Kun1, ZHANG XueHai1, SUN GaoYang1, YAN PengShuai1, GUOHaiPing1, CHEN SiYuan2, XUE YaDong1,GUO ZhanYong1, XIEHuiLing1,TANG JiHua1,LI WeiHua1
(1College of Agronomy, HenanAgriculturalUniversity/KeyLaboratory of Wheat and Maize Crops Science,Zhengzhou450002;2No.1 Middle School of Zhengzhou, Zhengzhou450002)
【Objective】Plant morphological traits arethebasis of ideotype-based maize breeding which are closely related to photosyntheticefficiency, lodgingresistance and grain yields. Genome-wide association studies (GWAS) of 558 629 SNPs with genome-wide coverage was used to elucidate the genetic basis of six plant morphological traits, including totalnumber of leaves (LN), leafnumber above ear (LNAN), the ratio of LNAN to LN (LNAN/LN), plantheight (PH), earheight (EH) and the ratio of EHtoPH (EH/PH), which could provide theoretical basis in enhancing ideotype-based maize breeding and facilitating the genetic improvement of new maize varieties with high plant density and lodging resistance. 【Method】Inthisstudy, a representative panel of 284 inbred lines plantedinZhengzhouandXunxian, including temperate,subtropicalandtropicalmaterials, were used for association mapping.【Result】 All traits measured in the two locations exhibited an approximately normal distribution. Highly positive or negative correlations between paired traits were observed. Variance analysis of these traits indicated that significant variations were observed across environment, genotype and the genotype × environment interaction. When test with the optimal GWAS model, we found that Q model showed high type I errors (false positive), while Q+K model were too strict in reducing false positive. K model is the best in reducing false positive. Totally, 56 significant SNP-trait associations involving in 17 loci were identified for five traits (≤3.99E-6), each locus can explain phenotypic variation ranging from 7.97% to 10.56%. Moreover, four loci were detected in both environments, indicating that these 4 loci were less affected by environment effects and could be stable in different environments. All potential candidate genes and their annotations within 100 kb (50 kb upstream and downstream of the lead SNP) of the loci were identified, in total, 80 candidate genes were found, including 42 genes that have functional annotation. For example,the gene GRMZM2G161293 encoding a protein that has acetylgluco-saminyl transferase is associated with plant height and ear height. It catalyzes the transfer of the amino group from N-acetyl glucosamine to glucose, which may improve yield by influencing the content of soluble sugars in maize kernels.【Conclusion】The results indicated that K model having the best result in reducing the type I errors (false positive). Based on K model, a total of 17 loci associated with plant morphological traits were identified.
maize (L.); genome-wide association study; plant type traits; ideotype
2017-09-26;
2017-11-26
國(guó)家自然科學(xué)基金(U1604231)、河南省重大科技專項(xiàng)(161100110500)、河南省科技攻關(guān)項(xiàng)目(152102110060)
劉坤,E-mail:lkun2017@163.com。張雪海,E-mail:xuehai85@126.com。劉坤和張雪海為同等貢獻(xiàn)作者。
李衛(wèi)華,Tel:0371-63558122;E-mail:liwh416@163.com