張立全,張浩林,李叢叢,姚 磊,魏建華*,張杰偉*
(1.北京市農(nóng)林科學(xué)院農(nóng)業(yè)生物技術(shù)研究所,農(nóng)業(yè)基因資源與生物技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100097;2.上海師范大學(xué)生命科學(xué)學(xué)院,上海 200234)
【研究意義】生長(zhǎng)調(diào)節(jié)因子(growth regulating factor,GRF)是廣泛存在植物中的一類轉(zhuǎn)錄因子,主要參與調(diào)控植物細(xì)胞大小、葉綠體增殖、雌蕊發(fā)育、滲透脅迫等植物生長(zhǎng)發(fā)育過(guò)程[1-2]。GRF最初在水稻中被發(fā)現(xiàn),水稻OsGRF1的表達(dá)受到植物激素赤霉素的調(diào)控,OsGRF1基因過(guò)量表達(dá)能夠促進(jìn)深水稻(OryzasativaL.Carr.deepwater rice)莖的生長(zhǎng)[3],應(yīng)用RNAi 降低水稻OsGRF1在體內(nèi)表達(dá)時(shí),水稻出現(xiàn)株高變低、葉片變小以及抽穗期延遲等變化[4]。目前,在擬南芥、水稻、玉米、大白菜、二穗短柄草、煙草等植物中GRF基因家族均已報(bào)道[5-10]。GRF蛋白在N 端主要包含2個(gè)保守的結(jié)構(gòu)域,分別是QLQ (谷氨酸、亮氨酸、谷氨酸) 結(jié)構(gòu)域和WRC(色氨酸、精氨酸、半胱氨酸) 結(jié)構(gòu)域[11]。其中,QLQ結(jié)構(gòu)域在所有真核生物中都有存在,是重要的蛋白互作區(qū)域,通過(guò)與生長(zhǎng)調(diào)節(jié)因子互作因子(GRF-interacting factor,GIF)的SNH保守結(jié)構(gòu)相互作用行使轉(zhuǎn)錄激活作用[12];WRC結(jié)構(gòu)域是植物特有的,含有1個(gè)核定位信號(hào)區(qū)域和1個(gè)DNA結(jié)合區(qū)域,引導(dǎo)GRF蛋白進(jìn)入細(xì)胞核并結(jié)合其靶基因的順式作用元件調(diào)控下游基因表達(dá)[10]。擬南芥GRF基因家族中有9個(gè)成員[5],擬南芥AtGRF1,AtGRF2和AtGRF3蛋白參與葉片生長(zhǎng)和發(fā)育,擬南芥AtGRF1和AtGRF2 蛋白超量表達(dá)引起擬南芥葉片和子葉變大,延遲擬南芥開(kāi)花時(shí)間。利用RNAi干擾技術(shù)單獨(dú)干擾AtGRF1、AtGRF2和AtGRF3中任一基因,均與野生型擬南芥差異不明顯,只有同時(shí)干擾AtGRF1、AtGRF2和AtGRF3三個(gè)基因的atgrf1/2/3突變體時(shí),擬南芥表現(xiàn)出明顯的葉片變小變窄、葉柄變短,由此可見(jiàn),擬南芥AtGRF基因家族成員間存在功能冗余[2]。當(dāng)超量表達(dá)或干擾AtGRF5基因時(shí),影響擬南芥葉片的大小,相比擬南芥其他GRF家族成員,擬南芥AtGRF5在生長(zhǎng)發(fā)育過(guò)程具有更重要的作用[13]。擬南芥AtGRF7 作為多種滲透性應(yīng)激反應(yīng)基因的抑制因子,可通過(guò)與脫水反應(yīng)元件結(jié)合蛋白DREB2A 的一段短序列結(jié)合,抑制該基因在滲透脅迫下表達(dá),從而維持植株的正常生長(zhǎng)[14]。擬南芥AtGRF8 參與花器官發(fā)育[2]。擬南芥AtGRF9在葉原基通過(guò)抑制細(xì)胞的增殖負(fù)調(diào)控葉片的生長(zhǎng)[15]。【前人研究進(jìn)展】谷子起源于我國(guó),距今已有8700年的栽培歷史,伴隨我國(guó)經(jīng)濟(jì)社會(huì)的不斷發(fā)展,目前,谷子作為最大的雜糧作物,日益受到廣大消費(fèi)者的不斷關(guān)注[16]。由深圳華大基因研究院、張家口市農(nóng)業(yè)科學(xué)院等[17-18]單位共同完成的谷子全基因組測(cè)序和美國(guó)科學(xué)家主導(dǎo)的谷子“豫谷1號(hào)”全基因組測(cè)序計(jì)劃已于2012年公開(kāi)發(fā)表,最近,山西農(nóng)業(yè)大學(xué)主導(dǎo)谷子中的模式植物“小米”全基因組測(cè)序的完成,為后續(xù)通過(guò)生物信息學(xué)挖掘、鑒定和分析谷子功能基因提供重要基礎(chǔ)[19]?!颈狙芯壳腥朦c(diǎn)】本研究利用美國(guó)能源部谷子(豫谷1號(hào))基因組數(shù)據(jù)庫(kù),對(duì)谷子GRF基因家族成員的基因結(jié)構(gòu)、基本特征、編碼蛋白結(jié)構(gòu)、系統(tǒng)進(jìn)化關(guān)系和潛在的磷酸化位點(diǎn)進(jìn)行分析?!緮M解決的關(guān)鍵問(wèn)題】此結(jié)果為下一步研究特定谷子GRF 蛋白體內(nèi)生物學(xué)功能及其翻譯后修飾提供重要參考。
從TAIR數(shù)據(jù)庫(kù)(http://www.arabidopsis.org)中下載擬南芥(Arabidopsisthaliana) 9個(gè)GRF基因及其編碼蛋白序列;從phytozome 數(shù)據(jù)庫(kù)(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Sitalica)中下載谷子(Setariaitalica)GRF基因及其編碼蛋白序列;從NCBI數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/)中下載水稻(Oryzasativa)和玉米(Zeamays)GRF蛋白序列。
分別以水稻OsGRF01(DAA05205.1)、OsGRF02 (DAA05206.1)、OsGRF03(DAA05207.1)、OsGRF04(DAA05208.1)、OsGRF05 (DAA0520 9.1)、OsGRF06(DAA05210.1)、OsGRF07(DAA05211.1)、OsGRF08 (DAA05212.1)、OsGRF09(DAA04953.1)、OsGRF10 (DAA04954.1)、OsGRF11(DAA04955.1)和OsGRF12 (DAA04956.1)蛋白序列為參比序列,利用phytozome 數(shù)據(jù)庫(kù)(谷子)中Blast 程序進(jìn)行BlastP檢索,檢索結(jié)果的全序列E值大于e-60的舍去,再利用Pfam在線分析軟件(http://pfam.xfam.org/)分析這些蛋白是否具有QLQ(PF08880)和WRC(PF08879)結(jié)構(gòu)域,同時(shí)具備上述條件的蛋白序列屬于谷子GRF蛋白。
利用在線生物信息學(xué)軟件Expasy Protoparam(https://web.expasy.org/protparam/)分析10個(gè)谷子GRF蛋白理論分子量、理論等電點(diǎn)、不穩(wěn)定系數(shù)、親水性指數(shù)和脂溶指數(shù)[20]。
利用GSDS(http://gsds.cbi.pku.edu.cn/) 對(duì)10個(gè)谷子GRF的基因組序列和編碼區(qū)序列進(jìn)行基因結(jié)構(gòu)分析[21]。利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)對(duì)10個(gè)谷子GRF蛋白二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)。利用歐洲生物信息研究所Clustal Omega工具(https://www.ebi.ac.uk/Tools/msa/clustalo/)分析10個(gè)谷子SiGRFs蛋白間的相似性。
利用MEME(http://meme-suite.org/tools/meme)軟件對(duì)10個(gè)谷子GRF蛋白保守基序進(jìn)行分析[21]。參數(shù)設(shè)置如下:基序的最大發(fā)現(xiàn)數(shù)目是2個(gè),其它參數(shù)設(shè)置為程序默認(rèn)值。
利用Clustal X(2.0)[22]軟件對(duì)鑒定出10個(gè)谷子GRF蛋白、9個(gè)擬南芥GRF蛋白[5]、12個(gè)水稻GRF蛋白[6]和14個(gè)玉米GRF蛋白[7]進(jìn)行多重序列比對(duì),使用MEGA 6.0[22]軟件,采用鄰接(neighbor-joining,NJ)算法構(gòu)建系統(tǒng)進(jìn)化樹(shù),進(jìn)行1000次Bootstrap 抽樣。
利用NetPhos 3.1 Server軟件[23](http://www.cbs.dtu.dk/services/NetPhos/)對(duì)10個(gè)谷子GRF蛋白序列進(jìn)行磷酸化位點(diǎn)預(yù)測(cè),所有參數(shù)都選用程序默認(rèn)值。
表1 谷子GRF基因家族的基本特征
分別以12個(gè)水稻GRF蛋白序列為參比序列,利用phytozome 數(shù)據(jù)庫(kù)(谷子)提供的Blast P程序進(jìn)行檢索,共得到了10個(gè)谷子候選GRF基因。利用保守基序在線預(yù)測(cè)軟件Pfam進(jìn)行驗(yàn)證保守結(jié)構(gòu)域QLQ(PF08880)和WRC(PF08879)的存在,初步確定了10個(gè)谷子GRF基因。谷子GRF基因分布在第1、2、4、7、8和9號(hào)染色體上,按照通用植物基因的命名規(guī)則,對(duì)鑒定到出的10條GRF基因進(jìn)行了系統(tǒng)命名,并統(tǒng)計(jì)了它們對(duì)應(yīng)的轉(zhuǎn)錄本、別名、染色體定位、基因長(zhǎng)度、編碼蛋白長(zhǎng)度、預(yù)測(cè)分子量、等電點(diǎn)和外顯子個(gè)數(shù)等,谷子SiGRF01的編碼蛋白長(zhǎng)度最短,為232個(gè)氨基酸;谷子SiGRF09的編碼蛋白長(zhǎng)度最長(zhǎng),為590個(gè)氨基酸(表1)。
由圖1顯示,谷子GRF基因家族成員含有2~4個(gè)外顯子,其中谷子GRF05沒(méi)有5’和3’非翻譯區(qū),GRF10含有很長(zhǎng)的3’非翻譯區(qū)。GRF02、GRF04、GRF05、GRF07、GRF08和GRF09內(nèi)含子的長(zhǎng)度遠(yuǎn)大于外顯子的長(zhǎng)度。
表2顯示,利用歐洲生物信息研究所在線Clustal Omega工具對(duì)10個(gè)谷子SiGRFs的蛋白序列進(jìn)行多重序列比對(duì),發(fā)現(xiàn)他們的氨基酸相似性在27.84%~67.21%之間,其中,SiGRF04和SiGRF08的氨基酸相似性最低,僅為27.84%,而SiGRF02和SiGRF07的氨基酸相似性最高,高達(dá)67.21%。
由表3所示,利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)對(duì)10個(gè)谷子GRF蛋白二級(jí)結(jié)構(gòu)進(jìn)行分析。谷子SiGRF的二級(jí)結(jié)構(gòu)主要以無(wú)規(guī)則卷曲和α螺旋為主。其中,谷子SiGRF07的無(wú)規(guī)則卷曲的比例最高,為67.83%;谷子SiGRF04的無(wú)規(guī)則卷曲的比例最低,為49.63%。谷子SiGRF04的α螺旋占比最高,為36.57%;谷子SiGRF05的α螺旋占比最低,為18.26%。如圖2所示,利用MEME軟件對(duì)10個(gè)SiGRFs蛋白序列保守基序進(jìn)行分析,谷子SiGRFs蛋白序列中均包含由基序1和基序2,相似度分別為1.2e-298和7.9e-169。
圖1 谷子GRF基因家族結(jié)構(gòu)分析Fig.1 Gene structure of GRF gene family in S.italica
表2 谷子GRF蛋白氨基酸相似性分析
利用進(jìn)化樹(shù)分析軟件MEGA 6.0 對(duì)10個(gè)谷子SiGRFs蛋白、9個(gè)擬南芥AtGRFs蛋白、12個(gè)水稻OsGRFs蛋白和14個(gè)玉米ZmGRFs蛋白進(jìn)行系統(tǒng)進(jìn)化分析。結(jié)果顯示:這45個(gè)GRFs按照同源進(jìn)化關(guān)系可以分為4個(gè)亞家族,分別含有5、7、25和8個(gè)成員(圖3)。谷子SiGRFs在第Ⅰ~Ⅳ亞家族中均有分布,其中SiGRF10、AtGRF06、OsGRF09、ZmGRF08和ZmGRF13聚類于第Ⅰ亞家族;SiGRF04、AtGRF07、AtGRF08、AtGRF09、OsGRF11、ZmGRF04和ZmGRF10聚類于第Ⅱ亞家族;SiGRF08、SiGRF09、AtGRF01、AtGRF02、OsGRF06、OsGRF07、OsGRF08、ZmGRF04聚類于第Ⅳ亞家族;其余蛋白聚類于第Ⅲ亞家族。
利用在線軟件NetPhos 3.1 Serverl對(duì)10個(gè)谷子SiGRFs蛋白進(jìn)行磷酸化位點(diǎn)分析,結(jié)果顯示,谷子SiGRFs蛋白中存在著20~73個(gè)絲氨酸、蘇氨酸及酪氨酸潛在磷酸化位點(diǎn),預(yù)測(cè)磷酸化位點(diǎn)主要是以絲氨酸的形式存在,其次是蘇氨酸,絡(luò)氨酸的磷酸化位點(diǎn)最少(圖4)。其中,谷子SiGRF01的潛在磷酸化位點(diǎn)中是唯一不含有酪氨酸位點(diǎn),其含有17個(gè)絲氨酸和5個(gè)蘇氨酸位點(diǎn)。谷子SiGRF04 僅含有20個(gè)潛在磷酸化位點(diǎn),其具有13個(gè)絲氨酸位點(diǎn)、6個(gè)蘇氨酸位點(diǎn)和1個(gè)酪氨酸位點(diǎn)。谷子SiGRF05含有73個(gè)潛在磷酸化位點(diǎn),其具有52個(gè)絲氨酸位點(diǎn)、15個(gè)蘇氨酸位點(diǎn)和6個(gè)酪氨酸位點(diǎn)(表4)。
表3 谷子GRF蛋白家族二級(jí)結(jié)構(gòu)分析
圖2 谷子GRFs蛋白保守基序分布Fig.2 Distribution of conserved motifs in S.italica GRF proteins
圖3 谷子、水稻、玉米和擬南芥GRFs蛋白進(jìn)化樹(shù)Fig.3 Phylogenetic tree for S.italica,Oryza sativa,Zea mays and Arabidopsis GRF proteins
圖4 谷子SiGRFs編碼蛋白磷酸化位點(diǎn)預(yù)測(cè)Fig.4 Phosphorylation site prediction of S.italica GRF proteins
本研究鑒定谷子GRF基因家族含有10個(gè)成員,而已鑒定的擬南芥[5]、水稻[6]、玉米[7]和小麥[25]GRF基因家族分別含有9、12、14和30個(gè)成員,表明在進(jìn)化過(guò)程中,植物GRF基因可能經(jīng)歷了不斷發(fā)生譜系的特異擴(kuò)張和拷貝丟失。谷子GRF基因家族的10個(gè)成員均含有保守的QLQ(PF08880)和WRC(PF08879)結(jié)構(gòu)域,而個(gè)別物種存在GRF蛋白成員可能缺少Q(mào)LQ或WRC結(jié)構(gòu)域、可能有第二個(gè)WRC結(jié)構(gòu)域等[23]。表明GRF基因家族具有一定保守性,推測(cè)GRF蛋白在植物生理過(guò)程中發(fā)揮類似作用。植物中GRF基因家族的成員數(shù)目各不同,推測(cè)不同植物GRF蛋白在特定組織、不同生長(zhǎng)發(fā)育階段,響應(yīng)低溫、干旱和高鹽等非生物和生物脅迫信號(hào)后精細(xì)調(diào)節(jié)各生理過(guò)程。
進(jìn)化分析表明,谷子GRF蛋白在第Ⅰ~Ⅳ亞家族中均有分布,谷子SiGRF10在第Ⅰ亞家族、SiGRF04在第Ⅱ亞家族、SiGRF08和SiGRF09在第Ⅳ亞家族,其余成員均位于第Ⅲ亞家族。目前,基因家族各成員確切的功能分析主要集中在擬南芥和水稻中。最近研究發(fā)現(xiàn),水稻OsGRF1可能通過(guò)精準(zhǔn)調(diào)控OsGIF1特異性的介導(dǎo)葉片生長(zhǎng)[26]。不同綠色革命水稻品種氮吸收水平與編碼生長(zhǎng)調(diào)控轉(zhuǎn)錄因子水稻OsGRF4的基因相關(guān),而水稻OsGRF4與OsDELLA作用恰恰相反,水稻OsGRF4和OsDELLA共同調(diào)控生長(zhǎng)和氮代謝的平衡狀態(tài)。水稻OsGRF4超量表達(dá)不僅維持半矮桿水稻和小麥品種高產(chǎn),同時(shí)明顯提升植株的氮利用效率[27]。水稻OsGRF4直接結(jié)合在OsMYB61基因的啟動(dòng)子上,從而增強(qiáng)MYB61的表達(dá),OsGRF4-OsMYB61模塊整合調(diào)控了纖維素合成和氮利用效率的作用通路[28]。聚類于一起的不同植物的同源基因可能具有不同的生物學(xué)功能,因此不能簡(jiǎn)單據(jù)此推測(cè)谷子GRFs在體內(nèi)的功能,其各成員確切的生物學(xué)功能仍然需要逐一進(jìn)行遺傳學(xué)實(shí)驗(yàn)進(jìn)行驗(yàn)證。
表4 谷子GRF蛋白潛在磷酸化位點(diǎn)分析
植物主要通過(guò)蛋白質(zhì)來(lái)行使其生物學(xué)功能,磷酸化是最常見(jiàn)的一類蛋白質(zhì)翻譯后修飾,其主要通過(guò)蛋白激酶或磷酸酶在特定絲氨酸(Ser)、蘇氨酸(Thr)和酪氨酸(Tyr)的羥基上增加或去除一個(gè)或多個(gè)磷酸基團(tuán),從而有效地改變蛋白質(zhì)的結(jié)構(gòu)和功能[29]。擬南芥色氨酸轉(zhuǎn)氨酶(TAA1)的101 位蘇氨酸被磷酸化修飾后,調(diào)節(jié)了生長(zhǎng)素生物合成,同時(shí)調(diào)節(jié)根分生組織和根毛的發(fā)育[30]。目前,谷子GRF蛋白確切的生物學(xué)功能尚未見(jiàn)報(bào)道。磷酸化分析表明,谷子GRF蛋白存在大量潛在磷酸化位點(diǎn),暗示谷子GRF蛋白可能通過(guò)磷酸化的方式來(lái)行使其生物學(xué)功能。
本研究從谷子基因組中鑒定出10個(gè)GRF基因家族成員,含有2~4個(gè)外顯子,位于谷子第1、2、4、7、8和9號(hào)染色體上,可分為4 個(gè)亞家族。谷子SiGRFs蛋白均含有保守的QLQ(PF08880)和WRC(PF08879)結(jié)構(gòu)域,均含有大量潛在的磷酸化位點(diǎn)。