李 彪,趙德剛,楊仕梅,趙懿琛
(1.貴州大學生命科學學院/茶學院/山地植物資源保護與種質創(chuàng)新省部共建教育部重點實驗室/貴州省農業(yè)生物工程重點實驗室,貴陽 550025;2.貴州省農作物品種資源研究所,貴陽 550006;3.貴州省農業(yè)科學院,貴陽 550006)
YABBY基因是存在于種子植物中特有的轉錄因子基因家族,在植物的生長發(fā)育側生器官的建成中起關鍵調控作用[1],其家族成員在葉及葉的衍生器官如子葉和花的發(fā)育中起關鍵作用。在植物的生長發(fā)育過程中,從早期的胚胎發(fā)育至后期側生器官的分化,極性的建立起著重要的作用。隨著遺傳學和分子生物學技術的發(fā)展,人們對植物極性建立分子機理的認識也深入到分子水平。背腹極性是植物側生器官發(fā)育過程中建立的主要極性之一,YABBY基因能調控擬南芥(Arabidopsisthalian)花的發(fā)育[2],YABBY基因家族在背腹極性的建立中發(fā)揮關鍵作用[3]。YABBY家族具有的典型結構域:C端YABBY結構域和N端的C 2 C 2型鋅指結構域[4]。在其他植物中已得到廣泛的研究,在水稻(OryzasativaL.)中,YABBY6參與了水稻葉的發(fā)育調控,與泡狀細胞的發(fā)育相關[5];在蘋果(Malusdomestica)中,在花、果和葉中的表達量較高,部分成員在果實發(fā)育時期明顯上調表達[6];在辣椒(CapsicumannuumL.)中,YABBY基因家族成員廣泛表達于葉和花[1];在番茄(Solanumlycopersicum)中,YABBY家族對根、莖、葉、花、蜜腺、心皮、胚珠等部位起到重要的調控作用,番茄YABBY基因家族部分成員具有較強組織特異性[7]。
杜仲(EucommiaulmoidesOliv.)是多年生的杜仲科落葉喬木,是我國獨特的第三紀孑遺植物,是極重要的藥用植物,并且杜仲的膠在航天航空設備中也有廣泛的應用[8]。研究表明,杜仲具有抗高血壓[9]、減肥[10]、抗糖尿病[11]、抗骨質疏松[12]、抗病毒、抗菌[13]、抗氧化[14]、抗腫瘤、保肝等功效。杜仲EuYABBY基因相關的研究尚未見報道,對該基因的挖掘和分析,可以為后續(xù)杜仲花、果實、子葉的分子機理研究提供一定基礎和理論支撐。對杜仲基因組中關鍵功能基因的挖掘和研究至關重要,可為杜仲品種和種質資源改良提供技術支持,為杜仲可持續(xù)產膠產藥等提供技術支持,以期能提高杜仲產業(yè)經濟效益。本研究以擬南芥的YABBY基因為檢索序列,挖掘杜仲基因組中的EuYABBY基因序列,并進行基因鑒定、基因結構分析、蛋白理化性質分析、系統進化、基因定位以及系列功能等分析,為杜仲基因組中EuYABBY基因家族的功能研究奠定了理論基礎。
杜仲基因組來自BIG(https://bigd.big.ac.cn/)數據庫;擬南芥基因組數據庫來自TAIR(http://www.arabidopsis.org/index.jsp)網站[15];蘋果基因組來自GDR (Genome Database for Rosaceae)(http://www.phytozome.net/apple)數據庫[6];桃樹(PrunuspersicaL.)基因組來自Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)數據庫[16]。
從數據庫Pfam(http://pfam.xfam.org/)下載EuYABBY家族的Stockholm (PF 04690)文件,通過HMMER軟件與BIG數據庫下載的杜仲蛋白數據庫做比對,識別和鑒定杜仲EuYABBY基因家族成員。通過Pfam(http://pfam.xfam.org/)鑒定家族成員的保守結構域。蛋白理化性質利用在線工具ExPASy(https://www.expasy.org/resources)進行分析[17-18]。利用MEGA 7.0軟件[19]對鑒定的杜仲基因組中EuYABBY基因家族氨基酸序列與擬南芥中6條[15]、蘋果13條[6]和桃樹15條EuYABBY基因家族[16]的氨基酸序列進行多重序列比對,采用鄰接(Neighbor-Joining,NJ)算法構建進化樹,進行1 000次Boot strap抽樣,再通過iTOL(https://itol.embl.de/)在線軟件對進化樹進行美化和修飾。
利用在線工具GSDS(http://gsds.cbi.pku.edu.cn/)對杜仲EuYABBY基因家族成員進行基因結構分析。通過在線工具MEME(http://meme-suite.org/tools/meme)分析和預測杜仲EuYABBY蛋白的基序(motif)[20]。
從Ensembl植物全基因組數據庫(http://plants.ensembl.org/Solanum_lycopersicum/)獲得EuYABBY基因在基因組上的位置信息,并用在線工具MG 2 C(http://mg2c.iask.in/mg2c_v2.0/)制作基因定位圖。
利用工具TBtools[21]提取杜仲EuYABBY基因家族成員上游2 000 bp序列,用在線分析工具PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)[22]對杜仲EuYABBY基因家族成員的啟動子順式作用元件進行預測,然后利用TBtools軟件對啟動子元件批量可視化。
在杜仲全基因組范圍內共鑒定出10個EuYABBY基因。對杜仲EuYABBY基因家族和EuYABBY蛋白的理化性質進行分析,發(fā)現EuYABBY基因家族的CDS長度在228(EuYABBY2)~612 bp(EuYABBY4);EuYABBY蛋白有75(EuYABBY 2)~203(EuYABBY 4)個氨基酸;分子量為8 422.54(EuYABBY 2)~22 738.98 u(EuYABBY 4);等電點在6.58(EuYABBY 7)~10.24(EuYABBY 10)。所有預測的EuYABBY蛋白的GRAVY值均為負值,即EuYABBY蛋白均為親水蛋白,只是親水程度不同(表1)。對EuYAB基因家族的保守結構域分析,發(fā)現EuYABBY基因家族的10個成員中EuYABBY1、EuYABBY2、EuYABBY3、EuYABBY5、EuYABBY7只含有YABBY保守結構域;EuYABBY4、EuYABBY6、EuYABBY8、EuYABBY9除含有YABBY保守結構域外還含有HMG-box-2結構;EuYABBY9除含有YABBY保守結構域外還含有Ccdc 124結構(圖1)。這些分析結果可以為EuYABBY基因的功能以及EuYABBY蛋白的提純、活性和功能的研究提供參考和理論基礎。
表1 杜仲EuYABBY基因家族Table 1 EuYABBY gene family of E. ulmoides
圖1 杜仲EuYABBY基因家族保守結構域預測結果Fig.1 Prediction of conserved domains in EuYABBY gene family of E. ulmoides
為了解杜仲EuYABBY基因結構進化關系,運用GSDS軟件繪制EuYABBY基因內含子-外顯子結構圖并比較其基因結構。EuYABBY基因家族成員內含子數量不定,EuYABBY9含6個內含子,EuYABBY10、EuYABBY4含有5個內含子,EuYABBY7、EuYABBY6以及EuYABBY1含有4個內含子,EuYABBY8和EuYABBY3含有3個內含子,EuYABBY2含有2個內含子,EuYABBY5只含有1個內含子。與模式植物擬南芥以及木本植物桃樹和蘋果建立系統發(fā)育樹,發(fā)現杜仲EuYABBY可分為三個亞類,第一類EuYABBY1、EuYABBY9與蘋果的INO亞類相近;第二類EuYABBY2、EuYABBY6、EuYABBY8和EuYABBY10與桃樹的CRC亞類相近;第三類EuYABBY3、EuYABBY4、EuYABBY5和EuYABBY7與擬南芥的Ⅰ亞組和蘋果YAB1/YAB 3亞組相近(圖2)。
圖2 杜仲EuYABBY基因家族結構預測結果Fig.2 Prediction of EuYABBY gene family structure in E. ulmoide
圖3 杜仲EuYABBY基因家族系統發(fā)育樹 Fig.3 Phylogenetic tree of EuYABBY gene family of E. ulmoides
利用MEME工具對杜仲EuYABBY家族的基序進行搜索鑒定,共鑒定出10個基序,其中Motif 2和Motif 3代表C 2 C 2型鋅指結構域,Motif 1代表YABBY結構域。同一個亞家族的成員表現出類似的基因結構和蛋白基序分布,比如第二類亞家族的成員類似的Motif 1、Motif 3和Motif 4。上述結果表明,無論是基因結構還是蛋白保守基序,EuYABBY基因家族都有一定的保守性(圖4)。對EuYABBY基因進行基因定位分析,結果顯示,10條EuYABBY基因不均勻的分布在基因組的scaffold上。其中EuYABBY1在scaffold_61上,EuYABBY2和EuYABBY3分布在scaffold_91上,EuYABBY4分布在scaffold_116上等,其余基因組scaffold僅有1條EuYABBY基因(圖5),為杜仲染色體組裝后染色體定位提供理論依據。
圖4 杜仲EuYABBY基因家族基因基序預測結果Fig.4 Prediction of gene motifs in EuYABBY gene family of E. ulmoides
圖5 杜仲EuYABBY基因家族基因定位Fig.5 Gene mapping of EuYABBY gene family in E. ulmoides
分析蛋白質三級結構的方法一般有同源模建法、串線法和從頭預測法,本研究采用同源建模法對EuYABBY蛋白質三級結構進行預測。將EuYABBY序列提交到在線網站(https://swissmodel.expasy.org)的SWISS-MODEL Workspace端口構建其三級結構模型。EuYABBY三級結構的分析結果顯示,基因結構相似的EuYABBY蛋白三級結構相近,如EuYABBY 4和EuYABBY 6以及EuYABBY 8等;而EuYABBY 5片段短,生成的三維結構簡單;EuYABBY 2和EuYABBY 3等更能清晰地體現EuYABBY的結構。EuYABBY結構的蛋白質模型,能清楚觀察到EuYABBY 1、EuYABBY 2以及EuYABBY 9等C端YABBY結構域和N端的C 2 C 2型鋅指結構域的空間分布(圖6),EuYABBY三級結構的建模和預測為后續(xù)EuYABBY家族蛋白的研究提供理論參考。
圖6 杜仲EuYABBY基因家族三級結構預測結果Fig.6 Prediction of tertiary structure of EuYABBY gene family in E. ulmoides
截取EuYABBY基因家族成員上游2 000 bp序列進行分析,通過PlantCARE軟件預測基因啟動子的順式作用元件。EuYABBY基因家族除了存在大量的基本元件CAAT-box和TATA-box外,其他調控元件也極其豐富,例如可能參與光響應的調節(jié)元件ACE、AEbox、AT 1-motif、Box 4、GA-motif、GT 1-motif、G-box等,胚乳表達所需順式作用調節(jié)元件GCN 4_motif。此外,EuYABBY基因家族的啟動子中還含有茉莉酸甲酯(MeJA)響應的順式作用元件CGTCA-motif、水楊酸(SA)響應的順式作用元件TCA-element、低溫響應順式元件LTR、參與應激和防御反應的TC-rich repeats、干旱響應元件MBS、厭氧應答元件O 2-site、生長素反調控元件TGA-element、晝夜響應調控元件circadian以及赤霉素反應順式作用元件TATC-box等。分析結果表明,EuYABBY基因家族可能受自然環(huán)境的光、溫度、干旱非生物脅迫反應,以及外源激素如生長素、赤霉素、茉莉酸甲酯、水楊酸等調控,并可能通過這些順式作用元件參與杜仲的防御機制,在杜仲的生長過程中從基因編碼區(qū)或者轉錄區(qū)起到調控杜仲葉、花甚至果實等的生長發(fā)育的作用。
YABBY基因家族是存在于種子植物中特有的轉錄因子基因,在植物的生長發(fā)育側生器官的建成中起關鍵的調控作用[23]。研究發(fā)現,其家族成員在葉及葉的衍生器官如子葉和花等的發(fā)育中起關鍵作用[24]。本研究通過生物信息學,在杜仲基因組中篩選出了EuYABBY基因家族10個成員,并進行了基因結構、進化樹分析,亞細胞定位、基因定位等較為全面的分析,旨在對該基因家族的研究提供理論支撐和基礎。
YABBY家族具有兩個典型的結構域:N端的C 2 C 2型鋅指結構域和C端YABBY結構域[25]。通過保守結構域的分析發(fā)現,該基因家族10個成員均有YABBY保守結構域,將家族成員與擬南芥以及木本植物桃、蘋果建立系統發(fā)育樹,發(fā)現杜仲的EuYABBY基因家族成員可分為3個亞組,在前人的研究中發(fā)現,在擬南芥中該家族基因分為4個亞組,蘋果為5個亞組,辣椒分為5個亞組,與這些植物相比,杜仲EuYABBY家族亞組較少,可能原因是杜仲中該基因家族成員較少。對EuYABBY基因家族蛋白進行三級結構預測,發(fā)現家族成員中多個成員結構相似,類似于番茄的YABBY蛋白結構[7]。通過對杜仲EuYABBY基因家族蛋白理化性質的分析,發(fā)現該家族蛋白全為親水性蛋白,與前人其他植物的YABBY基因家族蛋白預測基本一致。
圖7 杜仲EuYABBY基因家族順式作用元件預測Fig.7 Prediction of cis-acting elements in EuYABBY gene family of E. ulmoides
杜仲基因組尚未組裝到染色體水平,本研究通過目標基因的定位,發(fā)現EuYABBY基因家族定位到scaffold上,為杜仲染色體組裝后的EuYABBY基因家族染色體定位以及其他功能研究提供理論依據。YABBY基因家族在其他植物的表達調控方面已有較多研究和報道,在水稻中,YABBY6參與了水稻葉的發(fā)育調控,與泡狀細胞的發(fā)育相關[5];在蘋果中,YABBY基因在花、果和葉中的表達量較高,部分YABBY基因家族成員在果實發(fā)育的明顯上調表達[6];在辣椒中,YABBY基因家族成員在葉和花中廣泛表達;番茄YABBY基因家族對根、莖、葉、花、蜜腺、心皮、胚珠等部位發(fā)育具有重要調控作用,且部分成員具有較強組織特異性[7]。通過分析發(fā)現,杜仲中EuYABBY基因含有大量的MBS、G-box以及LTR等非生物脅迫響應元件,以及茉莉酸甲酯(MeJA)、水楊酸(SA)等激素響應元件,即杜仲的EuYABBY基因家族表達調控方式可能受非生物和激素的調控和響應,與其他植物有類似的調控形式。
杜仲是重要的藥用植物,并且杜仲膠在航天航空設備中也有廣泛的應用。對杜仲基因組中關鍵功能基因的挖掘,可為杜仲品種和種質資源改良提供技術支持,提高杜仲產業(yè)經濟效益。本研究以擬南芥YABBY基因為檢索序列,挖掘杜仲基因組中的EuYABBY基因序列,并進行基因鑒定、基因結構、理化性質、系統進化及系列功能等分析,以期為杜仲基因組中EuYABBY基因家族的功能研究和驗證等奠定理論基礎。