謝炳春,黃俊霖,溫松森,李 濤,李 穎,徐小萬,徐曉美,吳智明,衡 周
(1.仲愷農(nóng)業(yè)工程學(xué)院園藝園林學(xué)院,廣東 廣州 510225;2.廣東省農(nóng)業(yè)科學(xué)院蔬菜研究所/廣東省蔬菜新技術(shù)研究重點實驗室,廣東 廣州 510640)
【研究意義】辣椒(Capsicumspp.)是茄科(Solanaceae)辣椒屬(CapsicumL.)植物,原產(chǎn)于中南美洲,是我國種植面積最大的蔬菜[1]。中國辣椒(Capsicum chinenseJacq.)是辣椒5 個主要栽培種之一,其大多數(shù)資源均富含濃郁果香味,具有更豐富的味覺層次,是極好的商品性狀,如海南黃燈籠辣椒[2]、廣西小黃燈籠辣椒[3]和云南涮辣[4]等。據(jù)報道,中國辣椒中果香物質(zhì)主要為3-甲基丁酸-4-甲基戊酯、2-甲基丁酸-4-甲基戊酯和3-甲基丁酸-4-烯-6-甲基庚酯等支鏈酯類物質(zhì)[5]。植物支鏈酯類主要通過支鏈氨基酸途徑合成。BCAT 催化支鏈氨基酸生成相應(yīng)的2-氧代酸[6],經(jīng)過多步反應(yīng)后合成支鏈酯[8]。研究表明,BCAT基因在辣椒支鏈酯及相關(guān)代謝物合成過程中發(fā)揮著重要作用,因此開展中國辣椒BCAT基因的克隆和時空表達特征分析,對該基因功能研究和提升華南地區(qū)辣椒品質(zhì)育種具有重要意義[8-9]?!厩叭搜芯窟M展】BCAT 作為催化植物支鏈酯類物質(zhì)合成第一步反應(yīng)的酶,受到許多研究重視。2002 年Diebold 等[10]首次鑒定并克隆出擬南芥中6 個BCAT基因并對其進行基因功能驗證,結(jié)果顯示AtBCAT1、AtBCAT2、AtBCAT3、AtBCAT5和AtBCAT6參與支鏈氨基酸合成,AtBCAT2、AtBCAT3、AtBCAT5 蛋白定位于葉綠體,AtBCAT1 蛋白位于線粒體。Schuster 等[11]2005 年使用GUS 染色和酶促動力學(xué)等方法證明AtBCAT1 參與擬南芥所有組織中支鏈氨基酸代謝;2006 年發(fā)現(xiàn)AtBCAT4 參與蛋氨酸的鏈延長途 徑[12]。2008 年Knill 等[13]推 測AtBCAT3 最有可能催化蛋氨酸鏈延長過程中的末端步驟,從而產(chǎn)生短鏈硫代葡萄糖苷。隨后又有研究者相繼對番茄[14]、水稻[6]和小麥[14-15]中的BCAT基因進行功能驗證,相關(guān)基因功能與擬南芥的結(jié)果一致。2014 年郭道義[16]通過聯(lián)合改造酵母的亮氨酸、纈氨酸和脂肪酸途徑,成功實現(xiàn)支鏈醇和支鏈酯的生物合成,目前微生物中BCAT 參與支鏈醇和支鏈酯合成已經(jīng)被研究得比較清楚[17-18]。在乳球菌[19]、甜瓜[20]和香蕉[21]中均有報道顯示其表達量與支鏈酯類含量呈正相關(guān)?!颈狙芯壳腥朦c】廣東省農(nóng)業(yè)科學(xué)院蔬菜研究所茄果研究室研發(fā)的辣椒品種金田1 號具有濃郁果香,據(jù)先前預(yù)實驗分析得知其揮發(fā)性有機物質(zhì)主要為支鏈酯,這為中國辣椒支鏈氨基酸轉(zhuǎn)氨酶研究提供了物質(zhì)基礎(chǔ),前人研究表明BCAT基因參與支鏈酯和辣椒素等次生代謝物的生物合成,但在辣椒中還沒有BCAT基因家族相關(guān)的報道。【擬解決的關(guān)鍵問題】本研究擬通過對中國辣椒BCAT基因家族的生物信息學(xué)鑒定、表達模式分析及克隆,明確中國辣椒基因組中BCAT基因的數(shù)目及分布,獲得其BCAT基因時空表達特征及確切序列。本研究是辣椒BCAT功能研究的基礎(chǔ),可為辣椒支鏈酯類物質(zhì)代謝機理研究提供一定的理論支持。
供試材料為中國辣椒栽培種金田1 號(圖1、圖2),由廣東省農(nóng)業(yè)科學(xué)院蔬菜研究所茄果研究室李穎提供。2021 年7 月將辣椒種子浸泡12 h后于28℃催芽,露白后播種于裝有專用育苗基質(zhì)的32 孔穴盤,待幼苗長至5~6 片真葉,移栽到廣東省農(nóng)業(yè)科學(xué)院白云試驗基地露地栽培,按常規(guī)田間栽培管理。開花坐果后分別掛牌,每隔5 d取樣1 次,分別取名為F1~F8,設(shè)3 個生物學(xué)重復(fù),液氮速凍后帶回實驗室液氮下研磨成粉末保存于–80℃超低溫冰箱。
圖1 辣椒植株Fig.1 Plant of Capsicum chinense
圖2 不同生長時期辣椒果實Fig.2 Different stage of pepper fruit
1.2.1 辣椒BCAT 家族數(shù)據(jù)獲取與鑒定 由NCBI網(wǎng)站(https://www.ncbi.nlm.nih.gov/)下載中國辣椒基因組數(shù)據(jù),查詢相關(guān)文獻已經(jīng)驗證過的BCAT基因的序列信息(表1),在Pfam 網(wǎng)站(https://pfam.xfam.org/search/#tabview=tab1)下載BCAT(PF01063)的hmm 文件,使用HMMER(V3.3.1)軟件和TB Tools(V1.09876)軟件對蛋白質(zhì)的氨基酸序列進行比對(E-value<1×10-5,其余參數(shù)默認)。通過在線BLAST、hmmsearch及hmmbuild 和hummsearch 聯(lián)用等手段對辣椒BCAT 基因家族成員進行鑒定。
表1 已鑒定的BCAT 基因Table 1 Identified BCAT genes
1.2.2 辣椒BCAT基因家族成員蛋白理化性質(zhì)、亞細胞定位預(yù)測和染色體定位 辣椒BCAT 蛋白的氨基酸數(shù)目、分子量大小、等電點、親水性及亞細胞定位預(yù)測分別由在線軟件ExPASy-ProtParam(https://web.expasy.org/protparam/)和Plant-mPLoc serve(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)完成,染色體分布圖繪制在軟件MapChart 2.32 上完成。
1.2.3 辣椒BCAT基因家族進化樹構(gòu)建 使用MAGA X(Version 10.2.6)軟件對擬南芥、番茄、水稻、小麥和辣椒BCAT 家族成員構(gòu)建系統(tǒng)進化樹(鄰接法,1 000 次重復(fù))。
1.2.4 辣椒BCAT基因家族成員內(nèi)含子外顯子分析 使用在線工具GSDS2.0(http://gsds.gao-lab.org/)對辣椒BCAT基因家族成員內(nèi)含子外顯子進行分析。
1.2.5 辣椒BCAT家族基因保守基序分析 使用在線軟件MEME(http://memesuite.org/tools/meme)對辣椒BCAT 蛋白進行保守基序(Motif)分析,最大motif 檢索數(shù)值為20。
1.2.6 辣椒BCAT家族基因蛋白質(zhì)二級結(jié)構(gòu)、三級結(jié)構(gòu)分析、活性位點和配體預(yù)測 分別使用在線軟件SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)和數(shù)據(jù)庫Phyre2(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)提交所得蛋白序列,經(jīng)過運算后得到蛋白質(zhì)二級結(jié)構(gòu)和三級結(jié)構(gòu)。使用蛋白質(zhì)活性位點預(yù)測數(shù)據(jù)庫COACH(https://zhanggroup.org/COACH/)對辣椒BCAT 蛋白進行活性位點及配體預(yù)測,提取配體結(jié)合度最高的結(jié)果,使用軟件PyMOL(https://pymol.org/2/)進行修飾,查看BCAT 基因家族成員蛋白的溶劑催化通道。
1.2.7 辣椒BCAT家族基因啟動子區(qū)域順式作用元件分析 提取BCAT基因家族成員起始密碼子上游2 000 bp 序列,利用在線網(wǎng)站Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)結(jié)合TBtool 軟件對BCAT基因家族成員啟動子區(qū)域的順式作用元件進行預(yù)測分析。
1.2.8 辣椒BCAT基因家族成員時空表達量分析 使用北京全式金生物技術(shù)股份有限公司RNA提取試劑盒提取辣椒根、莖、葉、花和各個時期果實的總RNA;反轉(zhuǎn)錄試劑盒和熒光定量試劑盒SYBR Premix Ex TaqTM均購自日本TaKaRa 公司,以上所有操作均按照試劑盒說明書進行。反轉(zhuǎn)錄體系使用20 μL 體系,熒光定量PCR 采用25 μL體系,擴增程序為95℃ 30 s、95 ℃ 5 s、60℃ 30 s,40 個循環(huán);溶解曲線繪制程序為:65 ℃到95 ℃每0.5℃依次讀板,每個樣品3 次重復(fù)。目標(biāo)基因相對表達量計算使用2–ΔΔCT法。熒光定量PCR引物信息如表2。
1.2.9CcBCAT1~4 基因克隆 根據(jù)CcBCAT1~4基因模板序列于目標(biāo)基因前后設(shè)計帶接頭特異引物(表2),使用cDNA 進行擴增膠回收后連接pNC-Cam1304-SubN 載體[22]。連接好的載體轉(zhuǎn)入Trans5α,菌液PCR 陽性后送北京擎科生物科技有限公司測序。
表2 引物信息Table 2 Information of the primers
通過自建隱馬爾可夫模型和下載隱馬爾可夫模型分別得到7 個BCAT基因,去除重復(fù)和保守結(jié)構(gòu)域篩選后鑒定出5 個BCAT基因家族成員,分別命名為CcBCAT1、CcBCAT2、CcBCAT3、CcBCAT4、CcBCAT5。染色體物理位置定位分析顯示,辣椒BCAT1~BCAT5 染色體位置分別位于12、4、2、8 和4 號染色體(圖3)。這些基因位于4 條染色體末端,其中CcBCAT2和CcBCAT5重復(fù)相近地位于4 號染色體上,這兩個基因在表達上可能有所聯(lián)系,其余辣椒BCAT 基因分別位于一條染色體上。
圖3 CcBCATs 基因染色體定位圖Fig.3 Chromosome location of the CcBCAT genes
系統(tǒng)進化分析顯示辣椒BCAT基因的同源性與同為茄科的番茄同源性極高,如SlBCAT1、SlBCAT2和SlBCAT3分別與CcBCAT1、CcBCAT2、CcBCAT3高度同源,可以推測對應(yīng)蛋白質(zhì)具有相似的功能;CcBCAT4則呈現(xiàn)獨立進化;CcBCAT5與AtBCAT1同源性較高(圖4)。
圖4 擬南芥、番茄、水稻小麥和中國辣椒中BCAT 蛋白的系統(tǒng)發(fā)育樹Fig.4 Phylogenetic tree of BCAT proteins in Arabidopsis,tomato,rice,wheat and Capsicum chinense
辣椒BCAT基因家族成員內(nèi)含子外顯子分析結(jié)果(圖5)表明,BCAT1 和BCAT3 含有9 個內(nèi)含子,BCAT2、BCAT4 和BCAT5 分別含有8、18、4 個內(nèi)含子。BCAT1 的內(nèi)含子序列最長,將近17 kb;BCAT2 的內(nèi)含子序列最短,僅有2 kb左右。
圖5 CcBCATs 基因的結(jié)構(gòu)Fig.5 Structure of CcBCAT genes
啟動子控制著基因的時空表達,對基因的調(diào)控具有重要作用。辣椒BCAT 基因家族成員啟動子順式作用元件如圖6 所示,BCAT基因家族成員啟動子區(qū)域含有14 種啟動子,如光響應(yīng)元件、茉莉酸響應(yīng)元件、低溫響應(yīng)元件等常見啟動子。BCAT1-5 啟動子區(qū)域均發(fā)現(xiàn)MYB 轉(zhuǎn)錄因子結(jié)合位點。
圖6 CcBCAT 基因家族成員啟動子區(qū)域順式元件分析Fig.6 Cis-acting elements analysis for the promoter of CcBCAT gene family members
CcBCATs 蛋白的理化性質(zhì)如表3,CcBCATs編碼氨基酸序列長度在184 aa(CcBCAT5)至557 aa(CcBCAT4),分子量 在20 289.41 u(CcBCAT5)至89 598.03 u(CcBCAT4),等電點從5.57(CcBCAT5)至8.34(CcBCAT2),疏水性系數(shù)均為負值,為親水性蛋白。亞細胞定位預(yù)測顯示,CcBCAT1基因編碼的蛋白定位在葉綠體和線粒體,其他CcBCAT 家族基因編碼的蛋白均定位在葉綠體,這與番茄中BCAT基因定位結(jié)果[13]一致。
表3 中國辣椒CcBCAT 基因家族分布及理化性質(zhì)分析Table 3 Basic information of BCAT family genes in Capsicum chinense
在線軟件MEME 對CcBCATs 基因保守基序(Motif)分析結(jié)果表明,CcBCAT 蛋白中含有8個保守基序,有著相似的保守基序組成的辣椒BCAT 基因家族成員可能有著相似功能。其中基序4 和基序7 共同組成Aminotran_4 結(jié)構(gòu)域(圖7),除CcBCAT5基因不含有此結(jié)構(gòu)域,其他辣椒BCAT基因家族成員均含有。對應(yīng)MEME 預(yù)測的辣椒中基序1、基序2、基序4 和基序7 均為4 個基因成員含有,其中CcBCAT4 不含基序1 和基序2、CcBCAT5 不含基序4 和基序7。
圖7 CcBCAT 蛋白質(zhì)Motif 分析Fig.7 Protein motif analysis of CcBCAT protein
CcBCAT基因家族成員蛋白質(zhì)二級結(jié)構(gòu)分析結(jié)果(圖8)表明,5 個基因家族成員均有α-螺旋、延伸鏈、β-轉(zhuǎn)角和無規(guī)則卷曲4 種結(jié)構(gòu)元件。CcBCAT4 的α-螺旋占比(34.83%)高于其他4 個基因家族成員;CcBCAT5 延伸鏈占比高于其他4 個基因家族成員,β-轉(zhuǎn)角則相反;5個基因家族成員蛋白的無規(guī)則卷曲數(shù)量占比一致(表4)。
圖8 CcBCAT 蛋白二級結(jié)構(gòu)預(yù)測分析結(jié)果Fig.8 Prediction analysis of the secondary structure of CcBCAT protein
表4 CcBCATs 蛋白二級結(jié)構(gòu)元件Table 4 Secondary structure of CcBCATs proteins
CcBCAT基因家族成員蛋白三級結(jié)構(gòu)、活性位點和配體預(yù)測如圖9 所示,其蛋白質(zhì)三級結(jié)構(gòu)外型相似,活性位點均在蛋白質(zhì)腔體內(nèi)部。配體預(yù)測結(jié)果顯示BCAT1-4 的配體均為4-甲基-2-氧戊酸,BCAT5 則沒有合適配體。
圖9 CcBCAT 蛋白三級結(jié)構(gòu)預(yù)測分析結(jié)果Fig.9 Prediction analysis of the tertiary structure of CcBCAT protein
CcBCAT基因家族成員時空表達量分析如圖10 所示,辣椒BCAT基因家族成員在不同組織表達情況分析發(fā)現(xiàn):CcBCAT1在F1 期表達量最高,CcBCAT2在花中的表達量最高,CcBCAT3、CcBCAT4在成熟辣椒中表達量最高,CcBCAT5在根、莖、葉、花和果實中均沒有表達。
圖10 CcBCAT 基因在不同組織及果實發(fā)育中的表達情況Fig.10 Expression of CcBCAT genes in different tissues and developing fruits
對BCAT基因家族成員在辣椒果實成熟過程基因表達量進行分析,結(jié)果顯示,CcBCAT1表達量在辣椒果實成熟過程中呈現(xiàn)逐步下調(diào)的趨勢并在成熟果實中達到最低值,CcBCAT2和CcBCAT3的表達量在辣椒發(fā)育過程中呈現(xiàn)先下降后升高并在成熟果實中達到峰值,CcBCAT4表達量在辣椒發(fā)育成熟過程中逐步提升并在成熟果實中達到最高。
根 據(jù)CcBCAT1~CcBCAT4的CDS 序列設(shè) 計PCR 特異引物,以cDNA 為模板,對目標(biāo)基因進行PCR 擴增,獲得長度約為2 000 bp 大小的片段(圖11)。片段膠回收,連載體轉(zhuǎn)入大腸桿菌中,將PCR 陽性菌落送測序,測序序列與目標(biāo)參考序列進行比對,CcBCAT1、CcBCAT2和CcBCAT4克隆序列與模板序列完全一致;CcBCAT3則顯示第18、23、225 和903 處有單個堿基突變,造成CcBCAT3 氨基酸序列第8 處的纈氨酸(V)變成丙氨酸(A)。
圖11 CcBCAT1~CcBCAT4 基因擴增結(jié)果Fig.11 Amplification result of CcBCAT1~CcBCAT4 genes
BCAT基因家族作為一個小基因家族,最早于擬南芥中開始研究,是生物體內(nèi)支鏈氨基酸代謝的重要一環(huán),對辣椒合成相關(guān)支鏈氨基酸衍生物如辣椒素[23]和支鏈酯[7,24]等應(yīng)對生物及非生物脅迫具有重要意義,在擬南芥[10-11]、番茄[14]、水稻[6]和小麥[15]中均有報道。本研究從中國辣椒基因組中鑒定出5 個BCAT基因,發(fā)現(xiàn)CcBCAT1~CcBCAT3在進化關(guān)系上分別與番茄[14]SlBCA-T1-3 高度同源;CcBCAT4雖然在進化樹位置上呈現(xiàn)獨立進化,但是CcBCAT4的氨基酸序列擁有BCAT 基因的Aminotran_4 結(jié)構(gòu)域,并且配體預(yù)測結(jié)果與4-甲基-2-氧戊酸[7]底物特異性結(jié)合;CcBCAT5則與擬南芥AtBCAT1同源性較高。CcBCAT 亞細胞定位結(jié)果顯示,除CcBCAT1 定位在葉綠體或線粒體,其他均在葉綠體中,符合支鏈氨基酸轉(zhuǎn)氨酶亞細胞定位結(jié)果[6,14]。因此所鑒定出的5 個CcBCAT基因與經(jīng)過驗證的BCAT[6,10-11,14-15]基因序列特征相似,具有支鏈氨基酸轉(zhuǎn)氨酶蛋白的主要特征。
啟動子是一段位于結(jié)構(gòu)基因5′端上游區(qū)的DNA 序列,決定基因的表達與否。對啟動子的研究有利于了解CcBCAT基因的調(diào)控模式和對外界環(huán)境的響應(yīng)。啟動子順式元件分析顯示,辣椒BCAT基因家族成員基因在啟動子區(qū)域具有多種順式作用元件,包括調(diào)控辣椒素及次生代謝物合成的MYB 轉(zhuǎn)錄因子結(jié)合區(qū)域。MYB 轉(zhuǎn)錄因子是植物中第一大類轉(zhuǎn)錄因子家族,廣泛參與調(diào)控植物次生代謝物合成,對植物抵御外界生物脅迫[25-27]和非生物脅迫具有重要意義。例如,2014年Li等[28]發(fā)現(xiàn)蘋果MYB1 和MYB6 可以與蘋果AAT2 啟動子區(qū)域的MYB 位點結(jié)合,增強其轉(zhuǎn)錄活性;2019年Zhu 等[29]發(fā)現(xiàn)MYB31基因能激活辣椒合成途徑相關(guān)基因,使辣椒素得以合成積累,2022 年Zhang 等[30]對辣椒素合成途徑相關(guān)基因啟動子區(qū)域分析,發(fā)現(xiàn)多個功能基因上游均有MYB 結(jié)合位點。還有研究發(fā)現(xiàn),蘋果中BCAT 參與了蘋果支鏈酯合成[31]。結(jié)合本研究結(jié)果和已有文獻推測,CcBCAT 可能在辣椒素和相關(guān)酯類物質(zhì)合成中起到重要作用。
基因的表達量是影響蛋白表達豐度進而影響相應(yīng)酶功能的重要因素。對CcBCAT基因的表達分析顯示其存在組織特異性表達,且在果實的不同發(fā)育時期表達規(guī)律也有所差異。CcBCAT5 雖然有完整的開放閱讀框、能編碼完整的蛋白,但是在所有組織器官中均檢測不到表達,這一結(jié)果與番茄中SlBCAT5-6 表達模式[32]一致。但CcBCAT5是否是一個假基因還需要進一步驗證。CcBCAT4 僅在辣椒花和果實中有表達,并且隨著果實的生長表達量不斷提高,與辣椒素積累量[33]、辣椒揮發(fā)性有機物質(zhì)積累量呈正相關(guān),推測其參與中國辣椒的辣椒素合成,該結(jié)果與Zhang 等[30]、Zhang 等[34]和Kim 等[23]研究結(jié)果一致,而番茄果實中BCAT 則一直呈現(xiàn)低水平表達[14]。CcBCAT2 和CcBCAT3 的表達模式相似,辣椒果實發(fā)育時兩者的表達量變化一致,CcBCAT2 和CcBCAT3 兩者之間有可能與擬南芥AtBCAT3-4的關(guān)系[12-13]相似,參與蛋氨酸碳鏈延長步驟中的一環(huán),不過兩者的功能和相關(guān)性還需要更多實驗數(shù)據(jù)進行支撐。
通過生物信息學(xué)的方法鑒定出中國辣椒基因組中5 個BCAT 基因,并對其蛋白質(zhì)理化性質(zhì)、二級結(jié)構(gòu)、三級結(jié)構(gòu)、活性位點、配體和時空表達特異性等進行分析,克隆出CcBCAT1~CcBCAT4等4 個關(guān)鍵基因。結(jié)果表明中國辣椒BCAT 基因家族是一個結(jié)構(gòu)復(fù)雜的小基因家族,除CcBCAT5可能是個假基因,其他基因的表達均有特異性,如CcBCAT4在辣椒果實中表達模式與辣椒素和相關(guān)揮發(fā)性代謝物積累模式一致,有可能參與支鏈氨基酸衍生物合成。本研究將有利于推進辣椒支鏈氨基酸代謝研究,為辣椒風(fēng)味品質(zhì)提升提供數(shù)據(jù)支持。