魯?shù)さ?譚政委 李 磊 余永亮 許蘭杰 楊紅旗 董 薇 梁慧珍
(河南省農業(yè)科學院芝麻研究中心,河南 鄭州 450002)
紅花(CarthamustinctoriusL.)屬于菊科紅花屬一年生雙子葉草本植物,是一種非常古老的多用途經濟作物。紅花種子的亞油酸含量很高,可用于榨油,幼苗可作為蔬菜食用,花可以用于制作染料和化妝品等,干燥花還有活血通經、散瘀止痛的功效[1]。在我國,紅花作為藥物已有2 100多年的歷史,大量研究表明,紅花花中主要的活性化合物是黃酮類化合物,如羥基紅花黃色素A、紅花素和黃酮醇等[2]。紅花的品質也直接受這些物質含量的影響。
黃酮類化合物是植物中普遍存在的次級代謝產物,是以黃酮為母核而衍生的一系列化合物,它在植物體內既可以與糖結合成苷類或碳糖基,也能以游離形式存在。黃酮類化合物復雜的結構多樣性決定了其功能的多樣性,如抵御紫外線照射[3],防御蟲害、病害[4-6]等,而食物中的黃酮類化合物通過人體吸收后可以維護身體健康[7]。植物體內黃酮的生物合成途徑一直是科學界廣泛關注的課題,在模式植物擬南芥中,黃酮的生物合成途徑已基本明確,但植物體內黃酮代謝極其復雜多變,因而其他物種中黃酮的合成和調控機制還亟待解決。近年來,越來越多紅花黃酮生物合成途徑的基因被鑒定克隆,如脂肪酸去飽和酶基因(fatty and desaturase,FAD2)[8]、查爾酮合成酶基因(chalcone synthase,CHS)[9-10]、黃烷酮3-羥化酶基因(flavanone 3-hydroxylase,F3H)[11]、UDP-糖基轉移酶基因(UDP-glycosyl transferase, UGT)[12]、花青素合成酶基因(anthocyanidin synthase,ANS)[13]、查爾酮異構酶基因(chalcone isomerase,CHI)[14-15]等。
花青素又稱花色素,是重要的黃酮類化合物,也是植物體內普遍存在的天然色素?;ㄇ嗨厥怪参锊煌M織部位在不同的pH值條件下呈現(xiàn)不同的顏色。原花青素是花青素在花青素還原酶的催化下形成的產物,是類黃酮代謝途徑下游的次級代謝產物。原花青素具有強抗氧化、消除自由基的作用,是強力的金屬螯合劑,還可以保護和穩(wěn)定維生素C[16]。花青素還原酶是合成原花青素即縮合單寧的關鍵酶,它可以將有色的花青素(矢車菊素、天竺葵素、翠雀素)還原合成表兒茶素,通過進一步向液泡轉運聚合成為原花青素,對花青素含量具有一定的負調控作用[17-18],因而其表達也對植物花瓣、種皮等呈色有重要影響。1997年,Albert等[19]在擬南芥中克隆到了第一個花青素還原酶基因,隨后在桑樹[20]、越橘[21]、油茶[22]、蛇根草[23]、芒果[24]、花生[25]、紅掌[26]、甘薯[27]、篤斯越橘[28]、川桑[29]、苗藥艾納香[30]、葡萄[31]等植物中也相繼克隆出了ANR基因,而在紅花中花青素還原酶基因相關研究還鮮見報道。本研究以前期紅花花期轉錄組測序的Unigene序列為參考序列設計引物,以紅花花冠總RNA反轉錄出cDNA為模板,通過PCR擴增及測序分析,獲得紅花花青素還原酶基因ANR的全長序列;通過生物信息學的分析方法對該序列的理化性質、保守結構域、疏水/親水性、二級結構及三級結構進行分析,并對該序列進行系統(tǒng)進化分析;另外檢測該基因在不同花色紅花品種的不同組織及不同花期的表達量,以期為解析紅花類黃酮生物合成的分子機制及應用分子技術的方法提高紅花黃酮類化合物的含量,培育優(yōu)質紅花品種提供理論基礎。
供試材料為河南省農業(yè)科學院芝麻研究中心提供的紅色大果球紅花品種及白色紅花品種,于2018年11月下旬種植于河南省農業(yè)科學院現(xiàn)代農業(yè)研究開發(fā)基地。待幼苗長至3~5片真葉時,采取不同花色紅花幼嫩根、莖、葉,現(xiàn)蕾后,取苞片以及不同開花時期的花瓣置于液氮中,每個樣品取3個重復,-80℃冰箱保存?zhèn)溆谩?/p>
液氮研磨樣品,按照華越洋生物公司的Quick RNA Isolation Kit試劑盒說明書提取紅花樣品的總RNA。利用1.2%瓊脂糖凝膠電泳檢測提取的總RNA的質量和完整性,濃度的測定利用 NanoDrop 2000分光光度計進行。利用反轉錄試劑盒(大連TaKaRa, PrimeScriptTMRT reagent Kit with gDNA Eraser)將總RNA反轉錄為cDNA第一鏈,反轉錄操作步驟詳見其說明書(Code No. RR047A)。
以花瓣基本伸出苞片時的紅花花器官cDNA為模板,根據(jù)轉錄組測序的Unigene基因序列設計引物(表1),利用KOD酶進行PCR擴增。擴增體系總體積 20 μL,包含 2×PCR buffer for KOD FX 10 μL、2 mmol·L-1dNTPs 4 μL、cDNA 模板 2 μL、正反向引物各 0.6 μL、KOD FX 0.4 μL和ddH2O 2.4 μL。反應程序如下:94℃預變性 2 min;98℃變性 10 s,52℃退火 30 s,68℃延伸 2 min,共35個循環(huán);68℃延伸 5 min。經瓊脂糖凝膠電泳檢測獲得預期大小的片段,利用生工生物工程上海(股份)有限公司Sangon Biotech SanPrep柱式DNA膠回收試劑盒(Lot.: AA24KA4369)回收目的片段,連接到TaKaRa pMD19-T載體上,熱擊法轉化TaKaRa DH5α感受態(tài)細胞,涂布于含氨芐青霉素抗性的LB培養(yǎng)基[胰蛋白胨(Tryptone) 10 g·L-1;酵母提取物(Yeast extract) 5 g·L-1;氯化鈉(NaCl) 10 g·L-1;用NaOH調節(jié)該培養(yǎng)基的pH至7.4]上,37℃培養(yǎng)16 h。挑取單菌落,PCR檢測后,陽性菌落送往河南尚亞生物技術有限公司測序。
將CtANR基因FASTA格式的核苷酸序列導入DNAMAN6.0軟件,利用軟件自帶的翻譯功能對CtANR基因編碼的氨基酸序列進行預測,使用NCBI中的CD-Search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)對氨基酸序列的保守結構域進行鑒定。使用ProtParam(https://web.expasy.org/protparam/)對CtANR蛋白質的相對分子質量、等電點、穩(wěn)定性等進行分析。使用ProtScale(https://web.expasy.org/protscale/)在線工具對紅花ANR蛋白的疏水性和親水性進行預測分析。CtANR蛋白的二級結構及三級結構的預測分別使用在線工具SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)及SWISSMODLE(https://swissmodel.expasy.org/interactive)。通過NCBI數(shù)據(jù)庫中的Blastp進行CtANR同源序列的搜索,并使用DNAMAN軟件進行紅花和其他植物的ANR氨基酸同源序列比對分析。使用MEGA 5.05軟件中的Neighbor-joining構建關于CtANR蛋白的系統(tǒng)化進化樹,并通過Bootstrap方法對進化樹進行檢測,Bootstrap值設置為1 000。系統(tǒng)發(fā)育樹中序列的模體結構采用MEME(https://meme-suite.org/meme/tools/meme)在線網站進行分析。
通過實時熒光定量PCR(quantitative real-time PCR, qRT-PCR)技術檢測CtANR基因在紅花不同組織及花發(fā)育不同時期的表達情況,利用Primer Premier5設計熒光定量PCR引物,內參基因Ct60S引物序列參考文獻[32](表1)。qRT-PCR在德國艾本德公司的Eppendorf Mastercycler ep Realplex 2.2 Detection System上進行,試劑使用大連TaKaRa公司的 TB Green?Premix Ex TaqTMⅡ(Tli RNaseH Plus)。反應體系為10 μL:5 μL TB GreenPremix Ex TaqⅡ(Tli RNaseH Plus)(2×),1.5 μL cDNA,0.4 μL正向引物(10 μmol·L-1),0.4 μL反向引物(10 μmol·L-1),2.7 μL無酶ddH2O。首先將相同組分混勻配成混合液,之后分別加入不同體系中,以保證反應條件的一致性,再加入差異組分。反應程序:95℃預變性3 min; 95℃變性10 s,55℃退火30 s;72℃延伸28 s,45 個循環(huán)。通過熔解曲線分析監(jiān)測PCR擴增的特異性,反應程序為以0.1℃·s-1的速度從55℃逐漸升溫到94℃。每個樣品的檢測平行重復3次。通過2-ΔΔCT法對基因進行表達水平分析,利用Microsoft Excel 2007中的統(tǒng)計分析方法T-檢驗對不同開花時期、不同組織CtANR的表達量進行顯著性分析。
表1 試驗中所用CtANR基因引物序列、名稱及用途Table 1 Oligonucleotide primer names, sequences and function in the amplification of CtANR genes
以大果球紅花品種花瓣總RNA反轉錄合成的cDNA為模板,根據(jù)紅花轉錄組測序的Unigene基因序列設計引物CtANR-F/R(表1)進行PCR擴增,擴增得到的條帶在1 000 bp左右的位置上(圖1)。將該條帶切膠回收后與載體pMD19-T連接,轉化至DH5α感受態(tài)細胞后,將菌液均勻涂布在含有氨芐青霉素抗性的培養(yǎng)基上,37℃培養(yǎng)16 h后,隨機挑選單菌落進行PCR鑒定,將陽性菌落送往上海生工生物工程有限公司測序。測序結果用MEGA5.05軟件進行分析,結果顯示,目的片段大小1 020 bp,堿基序列與預期一致,將其命名為CtANR。
注: M:DL2000 DNA marker; 1:CtANR基因PCR擴增產物。Note: M:DL2000 DNA marker. 1:PCR product of CtANR gene.圖1 CtANR基因的擴增Fig.1 Amplification of CtANR from Carthamus tinctorius L.
注: A: CtANR基因的核苷酸序列及其推導的氨基酸序列;B: CtANR蛋白的保守結構域。Note: A:Nucleotide and deduced amino acid sequences of CtANR. B: Conserved domains of CtANR protein.圖2 CtANR基因的核苷酸序列和推導的氨基酸序列及序列特征Fig.2 Nucleotide and deduced amino acid sequences of CtANR and its sequence character
經NCBI的BLAST比對后,發(fā)現(xiàn)該片段含有一個長為1 020 bp的完整開放閱讀框(open reading frame, ORF),起始密碼子為ATG,終止密碼子為TAA。利用DNAMAN6.0軟件對該序列進行分析發(fā)現(xiàn),該基因編碼339個氨基酸(圖2-A),通過Prot Param軟件在線預測CtANR蛋白的氨基酸組成及比例,Glu數(shù)量最多,占9.1%,Trp數(shù)量最少,占0.6%(表2)。CtANR基因編碼的蛋白質分子質量為37 958.28,理論等電點(pI)為5.87,包括5 318個原子,分子式為C1697H2649N445O512S15。帶負電荷殘基(Asp+Glu)43個,正電荷殘基(Arg+Lys)35個,在哺乳動物體內的半衰期為30 h,脂肪系數(shù)為87.70,親水性指數(shù)為-0.242,不穩(wěn)定指數(shù)為41.63,為不穩(wěn)定的親水性蛋白。
利用ExPASy-Prot Scale在線工具的Hphob./Kyte & Doolittle分析CtANR蛋白的親水/疏水性(正值表示疏水性,負值表示親水性),分析結果表明,負值數(shù)量多于正值數(shù)量,且198位蘇氨酸(Pro,P)具有最高分值(2.2),疏水性最強,285位脯氨酸(Glu,E)具有最低分值(-2.6),親水性最強(圖3)。
利用SOPMA在線工具對CtANR蛋白的二級結構預測發(fā)現(xiàn),該蛋白編碼的339個氨基酸殘基中42.18%的氨基酸組成α-螺旋,無規(guī)則卷曲占36.28%,延伸鏈占13.57%,僅有7.96%的氨基酸組成β-折疊(圖4-A)。
為了進一步了解紅花ANR蛋白的結構,利用SWISS-MODEL對紅花ANR蛋白進行三維結構的建模分析(圖4-B)。結果表明,其三維結構模型與蛋白質二級結構預測的結果一致。
用NCBI的CD-Search分析紅花ANR蛋白的功能結構域,結果顯示該蛋白含有3個功能位點,即活性位點4個,煙酰胺腺嘌呤二核苷酸磷酸(nicotinamide adenine dinucleotide phosphate, NADP)結合位點10個,底物結合位點10個,屬于NADPH結合位點超家族(NADB-Rossmann superfamily)(圖2-B)。
通過NCBI Blastp查找紅花ANR的同源氨基酸序列,并通過DNAMAN6.0軟件將紅花ANR和其他植物中的ANR進行氨基酸多序列比對。分析表明紅花ANR的氨基酸序列和其他植物的ANR在氨基酸水平上同源性很高,其中紅花ANR與刺菜薊ANR的相似
表2 CtANR氨基酸成分Table 2 Amino acid composition of CtANR
圖4 CtANR蛋白的二級結構和三級結構Fig.4 Secondary and tertiary structure of CtANR protein
圖3 CtANR蛋白疏水性/親水性預測Fig.3 Hydrophobicity or hydrophilia prediction of CtANR protein
性為83.98%,與萵苣ANR的相似性為79.46%,與向日葵ANR的相似性為76.56%,與黃花蒿ANR的相似性為70.24%,與薇甘菊ANR的相似性為71.08%(圖5)。此外,與其他植物ANR類似,紅花ANR也含有NADP輔酶結合位點(GGAGYI/LR/VATPL/TA/CGLV/S)、活性位點(105T/130S/170Y/174K)和底物結合位點(90L/92H/131V132V/135S/199C200G201L/217S/243P)。序列比對表明,ANR的輔酶結合位點及活性位點都是比較保守的,而底物結合位點存在較大變異,如紅花ANR在214位和231位有底物結合位點S和Ⅰ(圖5),其他植物ANR則不含有這兩個底物結合位點。
從NCBI數(shù)據(jù)庫中選取其他植物ANR蛋白序列與紅花ANR蛋白序列進行系統(tǒng)進化樹分析,從進化樹(圖6)可以看出,CtANR蛋白與同為菊科的刺菜薊進化關系最近,首先聚為一支,與菊科萵苣、黃花蒿,豆科花生、大豆、赤豆聚為一個大分支,親緣關系較近,而與薔薇科蘋果、梅花、歐洲甜櫻桃,葡萄科葡萄等的親緣關系較遠。除葡萄、陸地棉、榴蓮外,其他各科不同物種各自聚成一組,表明不同物種的ANR蛋白具有明顯的種屬特性。模體結構分析顯示,基序3、6、8比較保守,在系統(tǒng)進化樹的17個物種中都含有,而基序1比較特異,只在梅花和歐洲甜櫻桃中有。此外,聚合在系統(tǒng)進化樹同一分支內的不同植物ANR的模體基序是相似的,關系越近,模體基序越相似。紅花ANR蛋白的模體基序和其他植物ANR蛋白的非常相似,且與刺菜薊、萵苣的模體基序最相似(圖6)。
注: Ct: 紅花; Aa: 黃花蒿; Mm: 薇甘菊; Ls: 萵苣; Ha: 向日葵; Cc: 刺菜薊。方框標志為 NADP輔酶結合位點, *為活性位點,#為底物結合位點。Note: Ct: Carthamustinctorius. Aa: Artemisia annua(PWA68657.1). Mm: Mikania micrantha(KAD3069085.1). Ls: Lactuca sativa(XP_023746445.1). Ha: Helianthus annuus(XP_022035717.1). Cc: Cynara cardunculusvar. scolymus(XP_024992787.1). Coenzyme NADP binding sites are framed. Active sites are marked with*. Substrate binding sites are marked with #.圖5 紅花和其他植物的ANR蛋白多序列比對Fig.5 Multiple sequence alignment of ANR protein from Carthamus tinctorius and other plants
圖6 不同植物基于ANR氨基酸序列的鄰接法系統(tǒng)進化樹及模體分析Fig.6 A neighbor-joining phylogenetic tree and motif prediction of different plants based on amino acid sequence of ANR
利用qRT-PCR技術檢測不同花色紅花品種開花各時期即花組織形成初期(S1)、花組織形成中后期(S2)、花瓣基本伸出期(S3)、盛花期(S4)、花凋謝期(S5)及不同組織[初期果球(F)、苞片、根、莖、葉]中CtANR基因的表達量。熔解曲線分析表明,內參基因Ct60S和目標基因CtANR都只出現(xiàn)了一個特異峰(圖7),表明引物具有很好的特異性,排除了引物二聚體和非特異性擴增產物對結果帶來影響的可能。定量數(shù)據(jù)分析表明,紅色和白色紅花品種中CtANR基因均在果球形成初期表達量最低,其次是根和莖,在花中的表達量相對較高。另外,在花發(fā)育的不同時期,紅色紅花品種中CtANR基因的表達量呈現(xiàn)先降低后升高再降低的趨勢,而白色紅花品種中CtANR基因的表達量呈現(xiàn)先降低后升高的表達趨勢。其次,紅色和白色紅花品種中CtANR基因的表達量在花發(fā)育的S1、S3和S5時期差異極顯著(P<0.01),S4、苞片、根、葉中差異顯著(P<0.05),其他時期、其他組織中差異不顯著(圖8)。
圖7 Ct60S和CtANR基因的熔解曲線Fig.7 The melting curves for Ct60S and CtANR
注:*表示差異顯著(P<0.05);**表示差異極顯著(P<0.01);R:根;S: 莖;L:葉;B: 苞片;F:初期果球;S1~S5:開花各時期。Note: * denoted significant difference at 0.05 level. ** denoted extremely significant difference at 0.01 level. R: Root. S: Stem. L: Leaf. B: Bract. F: Initial fruit ball. S1-S5: Flowering periods.圖8 CtANR基因各時期相對表達分析Fig.8 Relative expression analysis of CtANR gene in each period
花青素還原酶是類黃酮物質合成途徑中與原花青素相關的一個關鍵酶,它催化花青素合成表兒茶素、兒茶素、沒食子酸酯衍生物等類黃酮化合物。本研究根據(jù)課題組前期轉錄組測序的Unigene基因序列,設計特異性引物,從紅花花冠中克隆到紅花花青素還原酶基因CtANR,并對其理化性質及氨基酸序列進行了分析。通過生物信息學分析,發(fā)現(xiàn)紅花ANR蛋白和大多數(shù)植物ANR蛋白一樣都屬于親水性蛋白[23-24,28],且其二級結構和篤斯越橘ANR蛋白的二級結構類似,主要由α-螺旋組成,僅含有少量β-折疊[28],而與芒果ANR蛋白二級結構主要以無規(guī)則卷曲和β-折疊為主,α-螺旋較少[24]相反,表明紅花ANR蛋白的功能更類似于篤斯越橘ANR蛋白。
氨基酸多序列同源比對發(fā)現(xiàn)CtANR和其他植物ANR的同源性較高,相似性達70.24%~83.98%,桑樹及紫花苜宿中ANR蛋白的序列比對也得到了相似的結果,表明植物中ANR蛋白的氨基酸序列較為保守[20,33]。這一點在模體結構分析中也得到了驗證,模體結構分析發(fā)現(xiàn),不同植物ANR蛋白基序大多較為保守,如在系統(tǒng)進化樹的17個物種中都含有基序3、6、8,16個物種中都含有基序2和5。此外,系統(tǒng)進化樹及模體結構分析還發(fā)現(xiàn),親緣關系越近的種屬,其ANR蛋白的模體結構越相似,CtANR蛋白的模體基序和刺菜薊、萵苣的最相似,由此推測CtANR蛋白也具有相似的功能。
前人研究表明,ANR基因存在組織表達特異性[25],本研究組織表達分析也表明,CtANR基因在紅花不同組織部位均有表達,為組成型基因,且在果球形成初期表達量最低,根和莖中表達量也較低,而在花中的表達量相對較高。此外,研究還發(fā)現(xiàn)MaANR在桑椹中的表達量最高,在莖中的表達量最低,且在桑椹不同發(fā)育時期,MaANR的表達量呈現(xiàn)先升后降的趨勢[20],川桑ANR基因在葉片中的表達量最高,其次是果、皮、花,根中表達量較低[29],藥用植物黑果枸杞中ANR在果實中的表達量較高,其次是幼葉,成熟葉及根和莖中表達量較低,且隨著果實的成熟,ANR表達量下降,呈現(xiàn)先升后降的趨勢[34],表明植物ANR基因的表達受發(fā)育階段和環(huán)境因子的影響,在不同植物、不同組織及不同時期的表達量不同。
在不同花色的紅花品種中,CtANR基因的表達量在花發(fā)育的S1、S3和S5時期差異極顯著(P<0.01),S4、苞片、根、葉中差異顯著(P<0.05),而在其他時期、其他組織中差異不顯著。另外,在花發(fā)育的前期,也是花色變化較大的階段,ANR基因的表達量出現(xiàn)驟降,而后隨著花的進一步發(fā)育,紅色紅花品種ANR基因的表達量在花瓣基本伸出期(S3)表達量最高,隨后逐漸降低,白色紅花品種ANR基因的表達量逐漸升高,在花衰落期(S5)表達量最高,表明CtANR基因可能參與了紅花花色的形成,但其表達量不是決定紅花花色的主要因素,后期仍需檢測花青素含量和其他顏色紅花品種不同花期CtANR基因的表達量及克隆其他花色基因做進一步驗證。目前國內外對于紅花花色形成相關基因的研究較少,因此對于花色基因在紅花花色形成中的作用仍有待進一步研究。
本研究從紅花花冠中克隆到花青素還原酶基因CtANR,全長1 020 bp,編碼339個氨基酸,為不穩(wěn)定的親水性蛋白,且與刺菜薊ANR親緣關系最近,與梅花、歐洲甜櫻桃ANR親緣關系較遠。CtANR基因在果球形成初期表達量最低,根和莖中表達量也很低,而在花中的表達量相對較高。在花發(fā)育的不同時期,紅色紅花品種和白色紅花品種中CtANR基因的表達分別呈現(xiàn)降低-升高-降低的趨勢和降低-升高的趨勢。不同花色的紅花品種中,CtANR基因的表達在花發(fā)育的S1、S3和S5時期差異極顯著(P<0.01)。CtANR基因可能參與了紅花花色的形成,但其表達量不是決定紅花花色的主要因素,后期仍需檢測花青素含量和其他顏色紅花品種不同花期CtANR基因的表達量及克隆其他花色基因做進一步驗證。