張苗苗,于江珊,施 江,楊 雨,孟 雪,孫 偉,萬會花*,薛建平*
1.淮北師范大學(xué)安徽省特色資源植物利用工程實(shí)驗(yàn)室,安徽 淮北 235000
2.中國中醫(yī)科學(xué)院中藥研究所,北京 100700
轉(zhuǎn)錄因子的研究是功能基因組學(xué)的重要組成部分。自從第一個(gè)轉(zhuǎn)錄因子在玉米中被發(fā)現(xiàn)[1],至今大量的轉(zhuǎn)錄因子已經(jīng)被證明參與高等植物的各種生理過程和調(diào)控網(wǎng)絡(luò)。GRAS 蛋白是一個(gè)重要的植物特異性蛋白家族,是以該家族中最早鑒定的3個(gè)成員GAI(gibberellic-acid insensitive)、RGA(repressor of GAI)和SCR(scarecrow)[2-3]命名。GRAS 轉(zhuǎn)錄因子作為植物所特有的因子,參與植物的信號轉(zhuǎn)導(dǎo)、生長發(fā)育、逆境脅迫等過程。該家族蛋白具有保守的羧基末端,其中包括LRI、VHIID、LRII、PFYRE 和SAW 5 個(gè)基序,在N 端各不相同的序列是基因功能特異性的主要原因。到目前為止,GRAS基因家族已經(jīng)在多種植物中進(jìn)行了全基因組研究,包括楊樹、擬南芥、水稻、大白菜、梅花、松樹等[4-7]。在模式植物擬南芥和水稻基因組中分別有34、60 個(gè)GRAS基因家族成員。以擬南芥GRAS家族成員的分類為依據(jù),將大麻GRAS基因家族分為10 類。GRAS基因家族的代表基因是DELLA基因,它是環(huán)境與激素,激素與激素信號途徑之間的聯(lián)系樞紐,如負(fù)調(diào)節(jié)赤霉素(gibberellin,GA)信號通路、脫落酸信號傳導(dǎo)和光信號傳導(dǎo)[8]等,同時(shí)還參與植物次生代謝產(chǎn)物的合成調(diào)控,例如在缺氮條件下,DELLA 蛋白促進(jìn)花青素的合成和積累[9]。王立儒[10]研究發(fā)現(xiàn)丹參SmDELLA1 蛋白可能是丹參總酚酸和總黃酮生物合成途徑中的正調(diào)控因子。
大麻Cannabis sativaL.又名火麻,是大麻科(Cannabinaceae)大麻屬CannabisL.一年生草本植物[11],具有很高的藥用價(jià)值和商業(yè)價(jià)值。我國是最早利用大麻的國家,也是大麻原產(chǎn)地之一[12]。大麻以合成大麻素而聞名,大麻素是具有多種藥理活性的酚萜類物質(zhì),主要積累在雌花的腺毛中[13]。大麻二酚(cannabidiol,CBD)具有阻斷某些多酚對人體神經(jīng)系統(tǒng)的影響,并且有止痛抗炎、抗癲癇、抗焦慮、抗類風(fēng)濕關(guān)節(jié)炎和抗失眠等一系列生理活性功能,對治療多發(fā)性硬化癥具有良好的效果[14]。隨著高純度大麻二酚液體制劑Epidiolex?藥物在美國上市,并且成為治療小兒癲癇的“孤兒藥”,大麻素的市場需求量迅速增加。具有精神活性的四氫大麻酚(tetrahydrocannabinol,THC)還具有抗癌、抗菌、抗嘔吐、利尿等作用,但四氫大麻酚也會導(dǎo)致焦慮、認(rèn)知功能障礙和降低免疫力,是被嚴(yán)格管控的物質(zhì)[15]。大麻環(huán)萜酚(cannabichromen,CBC)具有消炎等作用,是大麻幼苗期主要的大麻素成分,但隨著植株的逐漸成熟大麻環(huán)萜酚的含量迅速降低,以至于可以忽略不計(jì)[16]。李秋實(shí)等[12]明確了大麻種質(zhì)資源管理三級分類體系,根據(jù)THC 的含量將大麻分為工業(yè)大麻、藥用大麻和醫(yī)用大麻3 類。THC<0.3%時(shí)為藥用大麻和工業(yè)大麻,其中CBD 含量高為藥用大麻,CBD 含量低為工業(yè)大麻,用于獲取纖維和種子;THC>0.3%時(shí)為醫(yī)用大麻,嚴(yán)禁種植和使用。
大麻素的前體物質(zhì)來源于甲基赤蘚糖醇-4-磷酸(methylerythritol 4-phosphate,MEP)和脂肪酸2個(gè)代謝途徑。首先,在MEP 途徑,順式異戊烯己基二磷酸(cis-isopentenyl dephosphate,IPP)在IPP異構(gòu)酶以及GPP 合成酶作用下形成了香葉基二磷酸(geranyl diphosphate,GPP)。同時(shí),脂肪酸類合成途徑中丙二酰輔酶A(malonyl-CoA)在橄欖酸環(huán)化酶(olivetolic acid cyclase,OAC)和橄欖醇合成酶(olivetol synthase,OLS)的作用下形成2,4-二羥基-6-戊基苯甲酸(olivetolic acid,OA)。然后,底物OA 和GPP 在大麻醇酸合成酶(cannabigerolic acid synthase,CBGAS)的作用下合成了大麻素生物合成的主要前體物質(zhì)大麻醇酸(cannabigerolic acid,CBGA),CBGA 在四氫大麻酸合成酶(tetrahydrocannabinolic acid synthase,THCAS)、大麻二酸合成酶(cannabidiolic acid synthase,CBDAS)和大麻黃酸合成酶(cannabichromenic acid synthase,CBCAS)的催化作用下分別形成了四氫大麻酚酸(tetrahydrocannabinolic acid,THCA)、大麻二酚酸(cannabidiolic acid,CBDA)和大麻色烯酸(cannabichromenic acid,CBCA)。最后在光和熱的物理作用下發(fā)生脫羧基反應(yīng)分別生成了四氫大麻酚、大麻二酚和大麻環(huán)萜酚。
隨著大麻全基因組序列的公布,對整個(gè)基因家族的綜合分析變得便捷。由于GRAS 蛋白在調(diào)控植物次生代謝和逆境脅迫方面起重要作用,但是該基因家族在大麻中的信息缺乏,因此,本研究首次對大麻中GRAS基因家族全序列進(jìn)行了研究。本研究鑒定了44 個(gè)CsGRAS基因,并對它們的基因分類、染色體定位、系統(tǒng)發(fā)育和外顯子-內(nèi)含子分布進(jìn)行了分析。此外,采用數(shù)據(jù)庫及本課題組完成的轉(zhuǎn)錄組數(shù)據(jù),分析大麻GRAS基因家族的表達(dá)模式,推測參與大麻素生物合成的相關(guān)基因。本研究提供了GRAS基因家族的詳細(xì)信息,為進(jìn)一步研究GRAS基因在大麻中的功能奠定了基礎(chǔ)。
從NCBI(https://www.ncbi.nlm.nih.gov) 網(wǎng)站上獲取大麻(GCA_900626175.1)、擬南芥(GCA_000005425.2)和水稻(GCA_000005425.2)的全基因組及注釋文件。采用的大麻品種為CRBRx,性別為雌株。應(yīng)用TBtools 軟件[17]提取的大麻蛋白序列,放入PlantTFDB 網(wǎng)站進(jìn)行轉(zhuǎn)錄因子預(yù)測,預(yù)測得到的所有GRAS家族成員去除重復(fù)轉(zhuǎn)錄本數(shù)據(jù),得到大麻GRAS家族的gene ID,利用TBtools 軟件獲得大麻GRAS家族的gene ID 所對應(yīng)的蛋白序列。使用在線生物信息學(xué)工具ExPASy-ProSite(http://web.expasy.org/protparam/)對大麻GRAS 蛋白的分子量和等電點(diǎn)進(jìn)行預(yù)測。利用 Cell-PLoc (http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)網(wǎng)站進(jìn)行亞細(xì)胞定位預(yù)測。使用TBtools 軟件解析大麻的注釋文件,確定每個(gè)GRAS基因的位置信息并繪制其所對應(yīng)的染色體物理位置圖。
使用從NCBI 網(wǎng)站上下載的大麻、擬南芥及水稻全基因組及注釋文件,利用MEGA-X 軟件,采取鄰接法(neighbor-joining,NJ)法,對擬南芥和大麻GRAS 蛋白構(gòu)建無根系統(tǒng)發(fā)育樹。使用TBtools軟件對其3 者共線性關(guān)系進(jìn)行可視化,并找到3 者GRAS基因家族的同源基因?qū)Α?/p>
使用MEGA-X 通過NJ 方法構(gòu)建了基于比對的系統(tǒng)發(fā)育樹,并進(jìn)行了重復(fù)1000 次的Bootstrap 檢驗(yàn),所有的設(shè)定均采用默認(rèn)值。大麻GRAS 蛋白質(zhì)motif 的發(fā)掘與位置分布均采用 MEME(http://meme-suite.org/tools/meme) 蛋白質(zhì)序列分析在線程序,并設(shè)定目標(biāo)motif 數(shù)量為10。通過使用TBtools 軟件對大麻的GRAS 注釋文件的解析,對大麻GRAS基因家族進(jìn)行了外顯子-內(nèi)含子、保守結(jié)構(gòu)域和motif 3 者可視化處理,并使用DNAMAN 軟件進(jìn)行保守結(jié)構(gòu)域蛋白序列的比對分析。
使用PlantCare(http://www.plantcare.co.uk/)網(wǎng)站對從TBtools 軟件提取的大麻GRAS基因上游2000 bp 序列進(jìn)行順式作用元件預(yù)測,并使用TBtools 軟件對其可視化構(gòu)圖。
利用本課題組ZYS 品種(由Purple Kush 和Dinamed Autoflowering CBD 雜交獲得的高CBD、低THC 品種)大麻花、莖和葉的轉(zhuǎn)錄組數(shù)據(jù),使用TBtools 軟件繪制大麻GRAS家族基因表達(dá)模式熱圖,GRAS成員基因表達(dá)量(FPKM)經(jīng)row scale 均一化處理,并進(jìn)行聚類和差異表達(dá)分析。
從NCBI(https://www.ncbi.nlm.nih.gov) 網(wǎng)站上獲取CRBRx 品種的大麻全基因組及注釋文件,將 TBtools 軟件提取的大麻蛋白序列,放入PlantTFDB 網(wǎng)站進(jìn)行轉(zhuǎn)錄因子的預(yù)測,預(yù)測得到54個(gè)GRAS,去除10 個(gè)重復(fù)轉(zhuǎn)錄本數(shù)據(jù)后,最終得到44 個(gè)GRAS家族成員,命名為CsGRAS1~CsGRAS44。利用大麻GRAS家族的gene ID,使用TBtools 軟件獲得大麻GRAS家族的gene ID 所對應(yīng)的蛋白序列。大麻 GRAS 蛋白長度最小的是CsGRAS8,由436 個(gè)氨基酸殘基組成,長度最大的蛋白質(zhì)為CsGRAS21,包含757 個(gè)氨基酸殘基。大麻GRAS 蛋白質(zhì)等電點(diǎn)介于4.77~7.24,相對分子質(zhì)量介于49 164.54~85 748.52(表1)。
GRAS基因在染色體上的位置分布如圖1所示,該家族44 個(gè)基因不均勻地分布在大麻的10 條染色體上( NC_044370.1、NC_044371.1、NC_044372.1、NC_044373.1、NC_044374.1、NC_044375.1、NC_044376.1、NC_044377.1、NC_044378.1、NC_044379.1 分別分布了3、6、3、6、5、7、5、4、1、4 個(gè)GRAS基因),其中NC_044375.1 染色體上GRAS基因家族數(shù)目最多,含有 7 個(gè)基因,其次是NC_044371.1 和NC_044373.1 都含有6 個(gè)基因,最少的是NC_044378.1 只含有1 個(gè)基因。最長的CsGRAS33基因在NC_044374.1 染色體下臂,最短的CsGRAS7在NC_044376.1 染色體上臂。NC_044371.1 染色體上的CsGRAS34和CsGRAS35,CsGRAS43和CsGRAS44;NC_044372.1 染色體上的CsGRAS2和CsGRAS3;NC_044373.1 染色體上的CsGRAS38和CsGRAS40;NC_044374.1 染色體上的CsGRAS12 和CsGRAS13;NC_044375.1 染色體上的CsGRAS20、CsGRAS21、CsGRAS22、CsGRAS23、CsGRAS24、CsGRAS25和CsGRAS26;NC_044376.1 染色體上的CsGRAS6、CsGRAS7、CsGRAS8和CsGRAS9成簇排列,序列比對分析發(fā)現(xiàn)這些成簇的基因之間存在串聯(lián)重復(fù)現(xiàn)象。
表1 大麻GRAS 基因家族基本信息及特征Table 1 Information and characteristics of CsGRAS genes
圖1 大麻44 個(gè)GRAS 基因在10 條染色體的分布Fig.1 Distribution of 44 GRAS genes on 10 chromosomes in C.sativa
圖2 大麻和擬南芥 GRAS 轉(zhuǎn)錄因子系統(tǒng)發(fā)育樹Fig.2 Phylogenetic trees of GRAS transcription factors in C.sativa and Arabidopsis thaliana
利用MEGA-X(圖2)軟件,采取NJ 法,對擬南芥34 個(gè)和大麻44 個(gè)GRAS 蛋白進(jìn)行分析,構(gòu)建無根系統(tǒng)發(fā)育樹。根據(jù)系統(tǒng)發(fā)育樹,GRAS 蛋白可分為10 個(gè)亞家族:HAM、LS、DLT、SCR、DELLA、SCL3、LISCL、SHR、PAT1 和HAMlike。HAMlike亞家族包含5 個(gè)CsGRAS 蛋白(CsGRAS6、CsGRAS7、CsGRAS8、CsGRAS9、CsGRAS11),與HAM屬于同一分支卻不包含擬南芥GRAS蛋白。HAM 亞家族有8 個(gè)CsGRAS 蛋白(CsGRAS5、CsGRAS16、CsGRAS32、CsGRAS34、CsGRAS35、CsGRAS36、CsGRAS38、CsGRAS41)。有 5個(gè)CsGRAS 蛋白(CsGRAS2、CsGRAS4、CsGRAS10、CsGRAS31、CsGRAS39)屬于DELLA 亞家族。PAT1 亞家族包括來自工業(yè)大麻的 6 個(gè)成員(CsGRAS12、CsGRAS13、CsGRAS15、CsGRAS17、CsGRAS18、CsGRAS44)。SHR 和SCR 亞家族分別擁有4 個(gè)蛋白(CsGRAS28、CsGRAS29、CsGRAS37、CsGRAS43)和3 個(gè)蛋白(CsGRAS27、CsGRAS33、CsGRAS42),推測這些蛋白可能與植物的發(fā)育有關(guān)[18]。SCL3 亞家族包含2 個(gè)蛋白(CsGRAS3、CsGRAS30),在擬南芥中同家族AtSCL3 蛋白通過整合多種信號來調(diào)節(jié)根細(xì)胞的伸長[19]。CsGRAS19 是DLT 亞家族中唯一的成員,它通過調(diào)節(jié)油菜素甾體信號參與控制株高[20]。LS 有2 個(gè)成員CsGRAS1 和CsGRAS40。其余8 個(gè)蛋白(CsGRAS14、CsGRAS20、CsGRAS21、CsGRAS22、CsGRAS23、CsGRAS24、CsGRAS25、CsGRAS26)屬于LISCL 家族。
圖3 擬南芥、大麻和水稻共線性關(guān)系Fig.3 Collinear relationship between A.thaliana,C.sativa,and Oryza sativa
利用水稻、擬南芥和大麻的同源關(guān)系,運(yùn)用比較基因組學(xué)的方法找到大麻基因組、擬南芥基因組和水稻基因組之間的共線性關(guān)系,圖3中一共有12 條亮線,代表有12 個(gè)GRAS同源基因?qū)?,大麻和擬南芥中,一共發(fā)現(xiàn)7 對同源基因,分別為CsGRAS34/AtSCL23、CsGRAS4/AtRGA、CsGRAS37/AtSCL22、CsGRAS37/AtSCL27、CsGRAS38/AtSCL16、CsGRAS40/AtSCL2和CsGRAS40/AtSCL3,與大麻和擬南芥構(gòu)建的系統(tǒng)發(fā)育樹結(jié)果一致;在大麻和水稻中,一共發(fā)現(xiàn)了5 對同源基因,分別為CsGRAS44/Os07t0583600-01、CsGRAS40/Os03t0723000-02、CsGRAS41/Os02t0662700-01、CsGRAS41/Os04t 0555000-01 和CsGRAS29/Os05t0500600-01,根據(jù)大麻與擬南芥和水稻的同源基因可以推測其可能具有相似的生物學(xué)功能。
為了了解大麻GRAS 轉(zhuǎn)錄因子的保守性及相關(guān)性,對大麻GRAS 蛋白構(gòu)建進(jìn)化樹,并整合了domain 和motif 信息,如圖4所示?;蚣易宄蓡T是由同一個(gè)基因通過復(fù)制重組不斷演化而來。因此,基因家族成員在序列上具有高度的保守性,包含了一些高度保守性的motif。大麻GRAS家族中共鑒定出10 個(gè)保守基序,CsGRAS8 包含的保守基序種類最少,為8 個(gè)。結(jié)合圖4分析發(fā)現(xiàn)大麻GRAS家族蛋白的domain 和motif 的分布相對保守。大麻GRAS每個(gè)亞家族所包含的基序數(shù)量也有所差別,保守基序在一定程度上反映了大麻GRAS基因家族在進(jìn)化過程中的結(jié)構(gòu)特點(diǎn),為研究基因家族的功能提供了理論基礎(chǔ)和研究依據(jù)。大麻GRAS家族基因結(jié)構(gòu)相對比較簡單,內(nèi)含子數(shù)量在0~2,其中 81.8% 基因不含有內(nèi)含子,15.9% 基因(CsGRAS5、CsGRAS6、CsGRAS8、CsGRAS19、CsGRAS26、CsGRAS37、CsGRAS39)含有1 個(gè)內(nèi)含子,只有2.3%基因(CsGRAS2)含有2 個(gè)內(nèi)含子。
通過MEME 網(wǎng)站的分析,大麻GRAS家族一共發(fā)現(xiàn)了10 個(gè)motif(圖5),其中有5 個(gè)最保守的motif 分別為VHIID、PFYRE、LRI、SAW、LRII。經(jīng)過分析發(fā)現(xiàn)motif 1包含了GRAS家族中最保守的VHIID 結(jié)構(gòu)域,其在靠近N 端的部位出現(xiàn)5 個(gè)保守的位點(diǎn)。motif 3 為PFYRE 區(qū);motif 4 為LRI 區(qū);motif 5 為SAW 區(qū),在C 端末尾處存在保守的3 個(gè)氨基酸殘基;motif 10 為LRII 區(qū)。
使用Jalview 軟件對44 個(gè)大麻GRAS 蛋白保守結(jié)構(gòu)域進(jìn)行多重序列比對,在圖6中,比對結(jié)果顯示,所有蛋白序列中VHIID 基序中的H 位點(diǎn)絕對保守;不同序列中的LRI 和PFYRE 基序存在較大的差異,但所有的LRI 基序均呈現(xiàn)亮氨酸富集狀態(tài),PFYRE 基序保守性不如VHIID 基序,但也表現(xiàn)出高度的相似性;LRII 基序的保守性比LRI 基序高;在SAW 基序內(nèi)檢測出了S-A-W 3 個(gè)保守氨基酸殘基。以上結(jié)果表明,大麻GRAS 蛋白在C 端存在高度的保守性。
圖4 大麻GRAS 家族進(jìn)化樹、保守基序及基因結(jié)構(gòu)Fig.4 Phylogenetic,conserved motifs,and gene structure analyses of GRAS transcription factor family of C.sativa
圖5 MEME 預(yù)測的10 個(gè)motifs LOGOFig.5 Logos of ten motifs predicted by MEME online software
圖6 大麻GRAS 家族保守結(jié)構(gòu)域序列比對Fig.6 Sequence alignment of conserved domains of GRAS family proteins in C.sativa
圖7 大麻GRAS 基因家族順式作用元件預(yù)測圖Fig.7 Prediction of cis-elements of hemp GRAS genes
對大麻GRAS 基因家族成員順式作用元件進(jìn)行預(yù)測。從圖7可以看出,大麻GRAS 家族主要包含光響應(yīng)元件、厭氧誘導(dǎo)元件、脫落酸響應(yīng)元件、赤霉素響應(yīng)元件和茉莉酸甲酯響應(yīng)元件等。光響應(yīng)元件涵蓋了所有CsGRAS 家族成員,元件數(shù)量也是最多,共有284 個(gè)。其次,預(yù)測到厭氧誘導(dǎo)的順式作用元件為104 個(gè),響應(yīng)脫落酸的順式作用元件為88 個(gè),響應(yīng)茉莉酸甲酯的順式作用元件為72 個(gè),含量最少的是光敏色素下調(diào)表達(dá)的順式作用元件和根特異性順式作用調(diào)控元件,都只含有2 個(gè),分別存在于CsGRAS14、CsGRAS34和CsGRAS9、CsGRAS16啟動(dòng)子區(qū)。
為探究大麻GRAS基因的表達(dá)情況,利用課題組的1 個(gè)大麻品種花、莖和葉的轉(zhuǎn)錄組數(shù)據(jù),繪制大麻GRAS基因表達(dá)熱圖(圖8),并將表達(dá)模式進(jìn)行聚類。GRAS基因在大麻ZYS 品種花、莖和葉中的表達(dá)譜分析表明,在花中,除CsGRAS42不表達(dá)外,其他基因均有不同程度表達(dá),其中CsGRAS4、CsGRAS13、CsGRAS15、CsGRAS17和CsGRAS44相對其他38個(gè)基因的表達(dá)量更高,其中最高的基因是CsGRAS17,CsGRAS2、CsGRAS9、CsGRAS11、CsGRAS23和CsGRAS31基因表達(dá)量極低;在葉中,除CsGRAS8、CsGRAS9、CsGRAS18、CsGRAS23和CsGRAS24不表達(dá),其他基因均有不同程度表達(dá),其中CsGRAS4和CsGRAS39相對其他37 個(gè)基因的表達(dá)量更高,其中最高的基因是CsGRAS4,CsGRAS1、CsGRAS5、CsGRAS11、CsGRAS31、CsGRAS32和CsGRAS42基因表達(dá)量極低;在莖中,除CsGRAS9、CsGRAS18和CsGRAS24不表達(dá),其他基因均有不同程度表達(dá),其中CsGRAS4、CsGRAS39、CsGRAS40和CsGRAS44相對其他37 個(gè)基因的表達(dá)量更高,其中最高的基因是CsGRAS40,CsGRAS8、CsGRAS23、CsGRAS29、CsGRAS31和CsGRAS37基因表達(dá)量極低。GRAS基因在ZYS 品種不同器官中的表達(dá)量存在顯著差異,其中CsGRAS17在花中顯著高表達(dá)。
本研究從大麻基因組中篩選到44 個(gè)GRAS基因家族成員,GRAS 轉(zhuǎn)錄因子在楊樹、擬南芥、水稻、番茄、蓖麻、百脈根、大麻黃等作物中分別有106、34、60、53、48、18、11 個(gè)家族成員[4,21-24],GRAS基因家族在不同物種中數(shù)量差異較大。
大麻與擬南芥GRAS家族成員進(jìn)行系統(tǒng)進(jìn)化分析,根據(jù)結(jié)果可分成10 個(gè)亞族,與Tian 等[25-27]的系統(tǒng)發(fā)育樹一致,基因結(jié)構(gòu)域分析發(fā)現(xiàn)大麻GRAS基因家族在C 端出現(xiàn)多個(gè)保守結(jié)構(gòu)域。大麻GRAS基因家族成員81.8%都不含有內(nèi)含子,在梅花、番茄、擬南芥、水稻和楊樹中無內(nèi)含子GRAS 蛋白的比例分別占82.2%、77.4%、67.6%、55.0%、54.7%[4-5,28-30]。說明了大麻GRAS家族基因結(jié)構(gòu)相對簡單,植物中無內(nèi)含子的GRAS基因所占比例較高。
圖8 ZYS 品種不同部位的CsGRAS 基因表達(dá)模式Fig.8 CsGRAS gene expression pattern of different organs of ZYS
很多GRAS 轉(zhuǎn)錄因子的功能已在模式植物中得到鑒定,但該家族在藥用植物中的功能仍有待進(jìn)一步研究。在本研究中,通過系統(tǒng)進(jìn)化樹的劃分,根據(jù)己報(bào)道基因的功能[31],能幫助了解和預(yù)測分在同一支中大麻GRAS基因的功能。如CsGRAS15、CsGRAS17與AtPAT1基因分在一支,通過查詢AtPAT1的功能,推測CsGRAS15和CsGRAS17可能參與了光敏色素phyA 信號轉(zhuǎn)導(dǎo)[31]。大麻素是一種具有精神活性的酚萜類物質(zhì)。除了種子,大麻植物其他部位都含有大麻素,它們主要在花中合成和積累[13],其生物合成涉及酚類和萜類化合物。花青素屬于酚類化合物,與大麻素具有相同的上游代謝途徑。在擬南芥中RGA、RGL1 和RGL2 這3 種DELLA蛋白對擬南芥的花瓣、花蕊及花藥的發(fā)育具有重要的調(diào)控作用[32],GA 調(diào)控成花的作用部位為葉片和莖尖,而DELLA 蛋白在長日照下可沉默葉片中的miR172基因和莖尖中的MADS基因,參與GA 信號轉(zhuǎn)導(dǎo)途徑抑制開花[33],PAP1 蛋白是參與花青素合成的轉(zhuǎn)錄因子,GAI 和RGA 蛋白能與PAP1 蛋白相互作用,從而促進(jìn)花青素合成[34-35]。而在缺氮條件下,DELLA 蛋白又能通過與PAP1 蛋白相互作用,實(shí)現(xiàn)花青素的積累[36],而DELLA 蛋白又可能是酚酸和黃酮生物合成途徑中的正調(diào)控因子[10]。根據(jù)以上信息,推測大麻中的5 個(gè)DELLA 蛋白CsGRAS2、CsGRAS4、CsGRAS10、CsGRAS32和CsGRAS40 可能調(diào)控大麻的花期,參與大麻素的合成。在系統(tǒng)發(fā)育樹中,CsGRAS4 蛋白與AtGAI和AtRGA 蛋白聚為一支,在共線性關(guān)系分析中也顯示為同源基因?qū)Γ珻sGRAS15 和CsGRAS17 與AtPAT1 聚為一支,其中CsGRAS17 在花中顯著高表達(dá),推測CsGRAS4 蛋白可能降低大麻素生物合成相關(guān)的蛋白表達(dá)水平,抑制大麻素合成,而CsGRAS15 和CsGRAS17 蛋白可能與CsGRAS4 蛋白相互作用,從而促進(jìn)大麻素合成[34]。CsGRAS3與AtSCL3 蛋白是同源基因,推測CsGRAS3 蛋白可能正向調(diào)控GA 的信號通路[37],促進(jìn)大麻素合成。
在大麻GRAS基因家族中發(fā)現(xiàn)很多參與光響應(yīng)的順式作用元件、根特異性順式作用調(diào)控元件和光敏色素下調(diào)表達(dá)的順式作用元件,表明該基因家族廣泛地參與了大麻的生長發(fā)育過程,在種子萌發(fā)和腋芽及根的發(fā)育[38]等方面發(fā)揮重要的調(diào)控作用;而赤霉素、脫落酸、茉莉酸甲酯等激素誘導(dǎo)類順式作用元件的發(fā)現(xiàn),可以推測出大麻GRAS基因受到多種激素信號分子的誘導(dǎo)[39]。對大麻GRAS成員的鑒定、系統(tǒng)發(fā)育和表達(dá)分析將有助于全面研究GRAS基因家族的功能,更好地理解它們在大麻的生長發(fā)育、大麻素的生物合成、生物和非生物脅迫中的作用。
利益沖突所有作者均聲明不存在利益沖突