林曉雅,劉寶輝,孔凡江
廣州大學 生命科學學院 分子遺傳與進化創(chuàng)新研究中心,廣州 510006
大豆(Glycine max)是一種敏感的高溫短日照作物,是人類植物蛋白的主要來源。它起源于中國北緯30e~45e區(qū)域。成熟期是影響大豆產量的重要因素之一,早熟通常伴隨著低產,而大豆對光周期的反應通常影響著成熟期的長短。目前,大豆可以種植在廣大的地域,分布在北緯50e~南緯35e。然而,單個品種的生長通常限于狹窄的緯度范圍,主要是由于大豆對光周期的高度敏感性。高緯度地區(qū)的主栽品種種植到低緯度地區(qū)會提早開花,植株矮小,結粒很少;低緯度地區(qū)的主栽品種種植到高緯度地區(qū),則會開花時間過長,不能在冬天溫度下降前結莢。因此,大豆光周期調控和開花的分子機制的解析可以為解決早熟與高產之間的矛盾提供理論依據,也可以為高產大豆的分子設計育種提供關鍵的核心模塊,從而培育高產、優(yōu)質的大豆栽培品種。
大豆總體而言具有廣泛的生態(tài)適應性,但是單個大豆品種卻只能適應狹窄的緯度范圍。這似乎很矛盾,但它們之間可以通過控制大豆開花和成熟期的數量性狀基因座(quantitative trait locus,QTL)的遺傳變異和多樣化來得到完美平衡。這些控制光周期開花和成熟的QTL在不同地方受到不同的選擇壓力并產生不同的自然變異,使得大豆具有適應不同區(qū)域的能力。利用經典遺傳學方法,目前已經發(fā)現(xiàn)10個主要的控制開花期和成熟期的QTL:E1~E4、E6~E10和J[1-11]。顯性E1、E2、E3、E4、E7、E8、E10基因通常導致晚花,而顯性E6、E9和J基因導致早花(表1)。最近幾年,隨著大豆基因組測序的完成[12],反向遺傳學方法也揭示了許多對大豆開花至關重要的基因。
E1是影響大豆開花期和成熟期最重要的基因。E1基因位于大豆基因組6號染色體的著絲粒附近區(qū)域,編碼一個20.3 kDa的蛋白,是一個負調節(jié)開花的豆科特異的轉錄因子。E1主要表達于葉片,在其他組織中的表達很低,其編碼的蛋白定位于細胞核。天然突變的e1-as等位基因由于其核定位信號點突變而失去部分功能,導致一部分突變的蛋白質不能進入細胞核而無法行使功能,所以e1-as突變體的表型介于正常型和缺失突變體之間,是一個弱的等位變異(weak allele)[13]。E1基因參與調節(jié)大豆的光周期敏感性[14-15]。盡管E1基因在調節(jié)大豆光周期開花中起重要作用,但其同源基因在豆科植物中的功能似乎并不保守。大豆中異位過表達菜豆(common bean)E1同源基因PvE1L能抑制大豆開花,而MtE1L(來自于蒺藜苜蓿,Medicago truncatula)在大豆中異位過表達不影響其開花時間[16]。E1基因的轉錄水平在長日照下有兩個峰;在短日照下,E1表達被嚴重抑制。E1在大豆中有兩個同源基因E1La和E1Lb,它們也是大豆開花的抑制子,在長日照下的表達水平與E1相似[17]。利用近等基因系(near isogenic lines,NILs),研究人員發(fā)現(xiàn)E1Lb在富含紅光或富含遠紅光長日照條件下抑制開花的功能是獨立于E1的[18]。特別地,e1lb可以抵消E4在富含遠紅光的長日照下抑制開花的功能[18]。
表1 大豆生育期基因的功能
E2,在生物鐘調控和開花中具有多種功能,它是擬南芥GI的同源基因,通過在大豆中圖位克隆確定[19-20]。E2在調控大豆農藝性狀如開花、成熟、產量和種子質量方面都很重要[21-22]。研究表明,大豆中的E2和擬南芥中GI的功能可能已經分化:用E2全長基因轉入擬南芥gi突變體,完全不能互補其表型;在野生型擬南芥Col-0中轉入E2全長基因,卻可以導致擬南芥晚花[23-24]。E2通過抑制GmFT2a轉錄來調節(jié)開花,但是其中具體的分子調控機制尚不清楚[20]。通過研究中國不同地區(qū)栽培大豆和野生大豆的E2單倍型,研究人員發(fā)現(xiàn)E2單倍型多樣化可能有助于大豆開花時間適應,這種適應性促進馴化大豆的擴散[24]。E2基因座不參與調節(jié)光周期敏感性[15,25]。
E3和E4基因被證實是擬南芥光敏色素A(PHYA)基因的同源基因,分別為GmPHYA3和GmPHYA2[26-27]。E3和E4在自然條件和實驗室光條件下的光周期開花中都起著至關重要的作用[14-15]。在擬南芥中,phyA僅在遠紅光富集條件下或者自然光下調節(jié)光周期開花[28-29]。這表明大豆的phyA可能已經演化出新的功能。大豆E3和E4的功能也已經亞功能化,大豆E3基因座控制熒光燈(高比例的紅光/遠紅光)下長日照的光周期敏感性,而E3和E4基因座協(xié)同調節(jié)在白熾燈(低比例的紅光/遠紅光)下的光周期敏感性[30]。因此,E3和E4在信號轉導中可能具有某些功能冗余,同時也具有某些特異性。另一方面,大豆還具有另外兩種phyA的同源蛋白:GmphyA1和GmphyA4。GmphyA1和E4可協(xié)調調節(jié)低比例的紅光/遠紅光下的光形態(tài)建成[27],而GmphyA4可能是假基因[31]。核苷酸多樣性揭示GmphyA1在非同義位點具有比E4更低的核苷酸多樣化,表明GmphyA1可能具有的重要功能[32]。GmphyA1很可能調節(jié)更低比例紅光/遠紅光(<1.0)的長日照條件下的光周期敏感性,因為具有雙隱性等位基因(e3e3e4e4)的大豆在這種條件下表型為延遲開花[8,30,33] 。
E6和J基因座的隱性等位基因是大豆適應低緯度和延長生育期所必需的[5,34]。利用近等基因系材料,研究人員發(fā)現(xiàn):E6E6比e6e6早開花,在12 h的日照長度的時候達到最大化的差異[35];E6基因開花的延遲效應只能在短于14 h的日照時長內檢測到,在16 h光照的長日照下,E6E6和e6e6開花時間沒有差異。E6基因尚未確定,但遺傳研究表明E6和J基因座可能緊密關聯(lián)[11]。J基因通過正向遺傳學、QTL克隆和精細圖位克隆的方法獲得[10,36]。當由擬南芥EARLY FLOWERING 3(ELF3)啟動子驅動的J轉化到擬南芥elf3-8突變體時,可以互補突變體提早開花的表型,證明J是擬南芥ELF3同源基因,并且該基因的功能進一步通過大豆轉基因互補實驗和近等基因系材料進一步驗證。J蛋白在短日照和14 h的長日照條件下都能發(fā)揮作用[10]。J在短日照下通過抑制E1轉錄來調節(jié)開花[10]。
E7位點可以在白熾光或自然光的長日照條件下延長開花期和成熟期,但不能在高比例紅光/遠紅光下延長開花時間[7]。E8E8導致晚熟,而e8e8則提早成熟[37]。研究表明E7位于6號染色體上,并與E1位點輕微連鎖。E1和E7之間的遺傳連鎖估計為6.2厘摩(centimorgan)[38-39]。因此基于它們的基因組位置,兩個E1L基因(位于4號染色體上)或GmphyA1基因(位于10號染色體上)都不是E7的候選基因。由Suinong 14和Enrei親本(均具有E1e2e3E4基因背景)產生的重組自交系(recombinant inbred lines,RILs),在6號染色體上具有控制開花時間、成熟期和繁殖期的主要QTLü 這個QTL很可能是E7[40]。E8位于染色體4中,這條染色體上含有兩個E1L基因[37]。由Dongnong 50和William 82親本(均具有e1-asE2E3E4基因背景)產生的RILs,在4號染色體上具有控制開花時間、成熟期和繁殖期的主要QTLü 這個QTL很可能是E8[40]。還有報道顯示位于4號染色體上的QTL與E8相似,調節(jié)開花時間和成熟期[41-42]。但是,直到現(xiàn)在還沒有真正確定E7和E8位點的基因。
FT蛋白屬于磷脂酰乙醇胺結合蛋白家族,是一個關鍵的開花整合因子。FT蛋白質通過韌皮部從葉片轉移到側頂端分生組織并誘導花分生組織的發(fā)育,它們是開花途徑的主要輸出信號。大豆具有12個FT樣(FT-like)基因座位:GmFT1a、GmFT1b、GmFT2a、GmFT2b、GmFT2c、GmFT2d、GmFT3a、GmFT3b、GmFT4、GmFT5a、GmFT5b和GmFT6。其中GmFT2c基因中具有轉座子的插入導致其成為一個假基因,而GmFT2d具有結構重排,導致該基因的功能喪失[43-44]。短日照條件下大豆三出復葉中GmFT2b、GmFT4、GmFT5b和GmFT6的表達幾乎檢測不到[43]。當GmFT2a、GmFT2b、GmFT3a、GmFT3b、GmFT5a和GmFT5b以35S啟動子驅動異位在擬南芥中表達時,可以促進擬南芥開花,表明這些基因可能是開花的誘導因子[43,45-46]。當在大豆中使用RNAi技術將這些GmFT的表達下調時,大豆的開花時間被延遲了[46]。還有實驗證明,通過在大豆中過表達GmFT2a或GmFT5a,可以誘導大豆提早開花[46-47]。在用CRISPR/Cas9系統(tǒng)定點誘變大豆GmFT2a基因后,開花也能被延遲[48]。E9被證明是GmFT2a[6,49]。E1、E3和E4可以抑制GmFT2a和GmFT5a的轉錄水平[43,50]。
GmFT1a和GmFT4是開花抑制因子,其在長日照下高表達,在短日照中低表達,并且過表達實驗證明GmFT1a和GmFT4是延遲開花的因子。此外,E1可以誘導GmFT1a和GmFT4表達[51-52]。E10被證明是GmFT4[9]。GmFT1b與這兩個基因表達模式相似,即長日照下的表達高于短日照,所以它可能也是開花的抑制因子[52]。當異位表達擬南芥中的GmFT6時,開花時間不受影響[45]。然而,當它由At TFL1本源啟動子驅動,轉入到tfl1-1突變體時,它可以完全互補tfl1-1提早開花表型,表明其蛋白質功能與At TFL1類似,是開花抑制因子[53-54]。
這些基因座上的各種天然等位基因突變?yōu)榇蠖沟膹V泛適應性提供了條件。除了這些基因外,近年來大豆同源基因在擬南芥開花相關基因中的功能也得到了一定的研究[45,55-60]。這些為我們深入和全面地了解大豆光周期開花的機制打下了基礎。
為了適應高緯度地區(qū)的長日照條件,大豆需要減少或完全失去光周期敏感性,即在長日照條件下提早開花。E3基因座參與感受熒光燈(紅光/遠紅光為比例4.9~5.9)長日照(fluorescent long day, FLD)條件的光周期敏感性[30]。但是在自然光的條件下,紅光/遠紅光的比例要低得多:在日中,紅光/遠紅光的比例為1.05~1.25;在清晨和黃昏的時候,紅光/遠紅光的比例在0.65~1.15。所以大豆進化出了更加復雜的機制來應對低比例的紅光/遠紅光下的光周期敏感性,我們稱之為白熾燈長日照(incandescent long day, ILD)不敏感性。通常,驗證ILD不敏感性的實驗是在自然光和自然光的基礎上用白熾燈延長到日照時間為20 h下分別種植同一基因型的植株,比較這兩種條件下種植大豆的開花時間,如果開花的時間沒有差別,就認為它是對ILD不敏感的[30]。
據報道,3個成熟期位點E1、E3和E4在減少對ILD的敏感性方面起主要作用[15,30,61-62]。第一種對ILD不敏感的基因類型是同時缺失E3和E4基因型。這種類型也是最主要的ILD不敏感的機制,占了高緯度地區(qū)光周期不敏感植株的70%的基因型。雖然e3e3e4e4對用白熾燈延長到日照時間20 h的光周期是不敏感的,但是這種基因型在20 h的白熾燈光周期下相比12 h的白熾燈光周期下,開花時間仍然有明顯的延長,說明還有其他的基因在起作用[30]。第二種對ILD敏感性降低的基因型是功能缺失的e1和e3或e4等位基因。單獨將E1位點的功能缺失不能導致ILD不敏感,可能是因為存在E1L基因。我們可以從夜間打斷反應(night break responses)中了解E1L基因對光敏感性的影響。夜間打斷實驗是研究光周期的一種方法,是將完整的夜晚用一段時間的光照打斷,以研究植物對光周期的敏感性。缺乏功能性E3和E4基因的大豆對夜間打斷處理不敏感。然而,在植物缺失E1的情況下,打斷夜間響應仍然有部分保留。在e1背景下,同時用RNA干擾敲除E1La和E1Lb的植株中,夜間打斷反應就消失了[17]。這說明在沒有E1時,E1L還能起一定的調控光周期的作用。此外,除了調節(jié)E1的表達外,E3和E4還調節(jié)E1La和E1Lb的表達[17]。最后一種對ILD光周期不敏感的基因類型是e1-as e3E4,在這種遺傳背景下,存在對ILD敏感和對ILD不敏感的大豆品種,因此至少一個尚不明確的基因位點參與調控光周期不敏感,以調節(jié)對富含遠紅光的長日照的敏感性[15]。最近的研究表明,E1Lb是最有可能參與這種遺傳背景來調控ILD不敏感的[18]。
可以從已有的數據推測,大豆對光周期的敏感性主要是通過phyA和E1以及它們的同源蛋白介導的。因為缺乏遺傳材料,所以GmphyA1和E1La的功能沒有得到充分的研究。這并不能代表它們不在調控光周期的敏感性中起作用,有可能它們在非常低比例的紅光/遠紅光下起作用。在用CRISPR/Cas9基因編輯技術獲得了GmPHYA以及E1/E1L的單突變體以及多突變體后,可以更好地研究它們在不同比例紅光/遠紅光下光周期敏感性。
巴西是世界第二大豆生產國。1960年以前,巴西的品種都從美國進口,但是僅限于在緯度大于22e的地區(qū)種植。在1970年引入長童期(long juvenile,LJ)性狀之后,大豆種植的局限性被打破,這些大豆在熱帶地區(qū)種植也能得到很高的產量[63-64]。LJ性狀是指大豆品種在短日照條件下,延長營養(yǎng)生長期,延長大豆開花和生長期,增加大豆光合周期和生物量,最終提高產量的能力。到目前為止,關于LJ性狀的研究很少,只有J基因座基因已被克隆。
在短日照條件下,J蛋白可與E1啟動子區(qū)的LUX結合元件結合,抑制E1基因的表達,從而釋放E1對FT基因表達的抑制作用。J基因的表達受光敏色素蛋白E3和E4的調控。因此,J通過E1并在E3和E4的控制下調節(jié)大豆生長期和產量。需要進一步研究在短日照和長日照條件下的J蛋白水平,以及J蛋白水平是否也受E3和E4調節(jié)。在低緯度條件下(短日照條件下),J基因突變可以延緩大豆成熟,大大提高大豆產量。與野生型J相比,突變體j可使大豆產量增加30%~50%。適應低緯度的大豆栽培品種中存在至少8個J功能缺失等位基因變異。J基因中多個突變的出現(xiàn)是大豆適應低緯度和增加產量的重要進化機制,而低緯度環(huán)境脅迫是J基因變異的主要驅動力[10]。在育種中,為了讓高緯度地區(qū)的主栽優(yōu)質品種可以適應低緯度地區(qū),可以將J突變的位點通過雜交的方式引入其中,使它們能夠在低緯度地區(qū)獲得較高的產量。
在過去的幾十年中,通過研究模式植物擬南芥(Arabidopsis thaliana)和水稻(Oryza sativa),我們對光周期開花調控的基本框架和機制進行了系統(tǒng)而深入的了解。擬南芥是一種長日照植物,它的光周期調控以CO-FT為主。FKF-CDFGI蛋白復合物調節(jié)CO基因的特定生物鐘模式轉錄表達,CRY1/2-COP1復合物、phyA和phyB調節(jié)轉錄后水平的CO蛋白積累,從而調節(jié)FT表達豐度,控制開花[65-68]。ELF3提供了COP1與GI形成復合物的平臺,并讓COP1降解GI。GI是一種眾所周知的CO激活子,也可以直接結合FT的啟動子區(qū)域來調控開花[69-70]。CO直接與FT的啟動子區(qū)域結合并使其表達降低[71]。水稻是一種短日照植物,具有類似于擬南芥的Hd1(CO)-Hd3a(FT)途徑和水稻特異性Ghd7-Ehd1-RFT1(FT)調節(jié)途徑[65,72-74]。Hd3a是短日照主導的開花因子,而RFT1在長日照條件下占主導地位[75-76]。Hd1在短日照下誘導Hd3a,在長日照下卻抑制Hd3a,并且長日照抑制作用是PHYB依賴的[77-79],而我們不知道調節(jié)機制。雖然Hd1和Hd3a的分子特性分別類似CO和FT,但目前沒有關于Hd1與Hd3a啟動子結合以直接調節(jié)其表達的報道。Hd17/OsELF3參與生物鐘調節(jié)并通過抑制Ghd7和Hd1表達促進開花[80-82]。
盡管在大豆中存在許多調節(jié)光周期開花的信號傳導途徑[33,83-84],但大豆也存在一條特異性調節(jié)途徑。該途徑以phyA開始并最終體現(xiàn)在GmFT表達水平變化上,但重要的核心轉錄因子已經變?yōu)镋1。在長日照條件下,E3和E4協(xié)同延遲開花,GmFT5a和GmFT2a受主要成熟基因E1、E3和E4控制。E3和E4誘導E1表達。對于E1基因的調節(jié),E3和E4出現(xiàn)了功能分化:E3強烈誘導E1基因的表達,E4對E1的誘導相對較弱[56]。E1抑制GmFT5a和GmFT2a的表達[13,43,50],從而延遲開花。此外,E1誘導GmFT1a和GmFT4這兩個開花抑制因子[51-52]。E1Lb的轉錄也受E3和E4的控制[17],并且它在紅光/遠紅光高比例條件下在由E4介導的信號通路中起主要作用[18]。盡管E1和E1lb獨立地起作用,因為缺乏它們任何一個都可以導致大豆的開花時間提早,但是E1和E1La/b的總體水平對于下游GmFT2a和GmFT5a表達可能是重要的[18]。大豆中光周期開花分子調控途徑的模型是phyA(E3E4)-E1/E1LFT。
在短日照下,E3和E4的功能大大降低,同時E3和E4的突變只會對開花時間產生輕微影響[10]。E1的表達在短日照條件下也受到抑制,除非阻遏物J突變,導致E1在短日照下的黃昏時分表達上調,使得開花延遲[10]。J在LUX結合元件上與E1啟動子結合,這也暗示著生物鐘晚間復合體(evening complex)ELF4-ELF3-LUX在此處起作用[85],所以GmELF4和GmLUX對大豆光周期開花很可能也有作用。J對E1L的調控作用尚不清楚。盡管肯定還有其他因子在短日照下控制J的表達,但E3和E4可以部分地調控J的表達。我們所提出的短日照下大豆中光周期開花分子調節(jié)途徑的模型是phyA(E3E4)-J-E1-FT(圖1),同時可以得出結論:E1是作為開花的核心轉錄因子,整合了光信號和生物鐘信號,類似于擬南芥開花途徑中的CO。
在長短日照下,開花誘導因子GmFT2a和GmFT5a都會從葉片移動到頂端分生組織中,它們通過與GmFDL19互作,并直接結合到GmAP1a啟動子的順式作用元件上調控GmAP1a的表達,從而影響開花[86](圖1)。
圖1 大豆光周期調控開花的分子機制示意圖。E3和E4抑制J的表達,促進E1的表達,具體機制未知。J通過LUX結合元件結合到E1的啟動子上,直接抑制E1的表達。E1是一個轉錄因子,可能通過結合到FT2a和FT5a的啟動子上抑制它們的表達。FT2a和FT5a通過維管束從葉片轉移到花分生組織,與FDL19互作后,結合到AP1的啟動子區(qū)域,促進AP1的表達上調,起始開花。在長日照下,J的功能未知
在另一種長日照植物豌豆(Pisum sativum)中,其光周期開花機制也被深入地研究。與在大豆中一樣,phyA在感知日照時長方面至關重要,它也只在長日照條件下起作用[87-88]。生物鐘晚間復合體ELF-ELF4-LUX在光周期敏感性中發(fā)揮重要作用,特別是在短日照下[92]。盡管豌豆中尚未發(fā)現(xiàn)調控開花的核心轉錄因子,但也發(fā)現(xiàn)了對應的FT[93]。雖然發(fā)現(xiàn)的方式不同,但從大豆和豌豆中鑒定出的重要調節(jié)成分是相似的[94],表明豆科植物中可能存在保守的光周期開花調控機制。
多年來,大豆光周期開花的研究進展緩慢,但近年來已取得一系列突破。負責E1、E2、E3、E4、E9、E10和J基因座的基因已被確定,這極大地提高了我們對大豆光周期開花的理解。擬南芥和光周期開花的模型對于研究大豆光周期開花具有指導意義,擬南芥中的基礎研究推動了我們對大豆光周期開花機制的認識。在大豆中,其機制與長日植物擬南芥的機制不太相同。E1是擬南芥中不存在的豆科植物特異性轉錄因子,而在大豆光周期開花中起重要作用。除此之外,E2、E3和E4的分子特性也可能已經發(fā)生變化。研究大豆獨特的光周期開花的機制有助于從分子水平解析大豆的適應性機制,從而為優(yōu)質、高產大豆的推廣提供理論依據。
但是,要清楚地了解光周期如何調節(jié)大豆開花,還有許多問題需要解決。例如:E3和E4如何在長日照下調節(jié)E1表達?為什么E3和E4的功能在短日照下會受到很大影響?J是否在長日照下也能發(fā)揮作用?擬南芥中開花核心轉錄因子CO的調節(jié)非常精確。除了調節(jié)CO的轉錄水平外,蛋白質水平的調節(jié)也很重要[95-99]。作為控制大豆開花的核心轉錄因子,E1蛋白水平的調節(jié)也應該是重要的,但E1的蛋白質水平仍然是一個謎。需要進一步的研究來闡明大豆光周期開花的分子機制。在大豆中生物鐘相關基因的功能還亟待被鑒定,雖然J與大豆開花核心轉錄因子E1的功能被初步闡明,但E2的調控關系還基本不明確;目前已經報道的生育期相關的位點之間的互作關系需要被進一步鑒定。更多擬南芥開花相關基因在大豆中同源基因的功能也需要被研究,以完善我們對大豆光周期開花的理解。