朱曉慶,李寧寧,王瑋,張少英
(內蒙古農業(yè)大學甜菜生理研究所,呼和浩特 010018)
植物持續(xù)光形態(tài)建成與矮化基因(Constitutive photomorphogenesis and dwarf,CPD)編碼細胞色素P450類固醇側鏈羥化酶(CYP90),在植物激素油菜素甾醇(Brassinosteroids,BRs)的生物合成中起重要作用[1-2]。已有研究表明,CPD 基因在植物生長發(fā)育過程中通過促進BRs 的合成,調控植物的株高、產(chǎn)量、粒型、育性、纖維等多種農藝性狀[3-5],參與細胞的伸長與分裂、維管束分化、光形態(tài)建成、葉和根的發(fā)育、衰老、育性以及對逆境脅迫的響應等多個生物學過程,對植物生長發(fā)育起著至關重要的作用[6-8]。在BR 合成過程中參與催化反應的酶主要有6 種,其中有5 種為細胞色素P450 單加氧化酶(Cytochrome P450s,CYPs)。到目前為止,與擬南芥CPD 同源的基因已經(jīng)在豌豆、番茄、水稻、大豆、馬鈴薯、胡楊、棉花、玉米、楊樹等[9-16]植物中被鑒定和研究,但在甜菜上未見報道。本研究以P450保守結構域序列,為檢索序列通過HMM 和BLAST 在甜菜基因組數(shù)據(jù)中進行同源性搜索,對BvCPD 家族成員進行分析。利用ExPASy、MEGA 7.0、MapInspect、MEME等生物信息學分析工具對BvCPD 家族成員進行理化性質、系統(tǒng)進化關系、基因染色體定位及模體分析。同時,根據(jù)本課題組在甜菜塊根不同發(fā)育時期的轉錄組數(shù)據(jù)分析已得出的BvCPD 家族成員Bv2_qyup 與甜菜塊根膨大有關的結果[17],進一步對Bv2_qyup 蛋白的理化性質、蛋白質結構、蛋白信號肽和跨膜預測、亞細胞定位、蛋白保守結構域以及蛋白磷酸化位點進行生物信息學分析,以期闡明BvCPD 的基本理化特性,并為Bv2_qyup的克隆及功能鑒定提供理論依據(jù)。
以擬南芥CPD 氨基酸序列(ACCESSION:At5g05690,來自擬南芥數(shù)據(jù)庫及蛋白序列數(shù)據(jù)庫)作為探針序列,基于“隱馬爾可夫模型”(HMM)下載自Pfam 蛋白家族數(shù)據(jù)庫(http://pfam.xfam.org/)的保守性P450 結構域序列在甜菜基因數(shù)據(jù)庫RefBeet-1.1和RefBeet-1.2中進行BLASTP搜索,把編碼完整的任何P450結構域均視為BvCPD家族基因,并確保其非冗余(E值≤10-15)。將SMART分析作為二次檢驗的標準,確保每一條蛋白質序列都包含保守性P450結構域。
利用軟件ExPASy 中的Prot-Param 工具對BvCPD 蛋白的氨基酸組分和理化性質進行分析;利用ClusterW(在默認設置下)軟件對來自甜菜和擬南芥的CPD 蛋白氨基酸序列進行多序列比對;利用MEGA7.0 軟件分析與構建無根系統(tǒng)進化樹;統(tǒng)計方法為鄰接(Neighbor joining)法。同時利用Maximum Likelihood 和Minimum Evolution法分別構建的系統(tǒng)進化樹對所得系統(tǒng)進化樹進行驗證。
根據(jù)上面分析,再通過對甜菜基因組數(shù)據(jù)集RefBeet-1.1(http://bvseq.molgen.mpg.de/Genome/Download/index.shtml)的搜索確定BvCPD 家族基因所在的位置,利用Mapin-spect 軟件繪制BvCPD 家族基因的染色體定位圖譜。
進一步,使用在線工具MEME(http://meme-suite.org/tools/meme)統(tǒng)計分析BvCPD 家族蛋白序列中的保守性模體,模體數(shù)量上限設為10,其他值均設為默認值。
利用ExPASy-Protparam 和Protscale在線軟件預測分析蛋白的理化性質和親水性;利用NCBI CD search及NPSA-PRABI、Swiss-Model 軟件分別預測蛋白的保守結構域及二、三級結構;并在線網(wǎng)站Psort 進行亞細胞定位預測。根據(jù)SignalP4.1、TMHMM Server v.2.0 和NetPhos 3.1 Server軟件預測分析蛋白信號肽、蛋白跨膜及磷酸化位點[18-21]。
以P450保守結構域序列為檢索序列通過HMM和BLAST在甜菜基因組數(shù)據(jù)中進行同源性搜索,共獲得76個BvCPD家族成員,其mRNA 長度范圍在786~4 132 bp,外顯子數(shù)為1~16個;編碼蛋白質的氨基酸數(shù)量為235(Bv6_pfpc)~767(Bv7u_xmah)個,分子質量為26.40(Bv1_iokn)~87.49(Bv7u_xmah)kDa,等電點變化范圍為5.59(Bv2_dnyj)~9.45(Bv0_xcyt),親水性指數(shù)為-0.369~0.077(表1)。
表1 部分BvCPD 家族成員信息Table 1 Part of the BvCPD family genes information
將76 個BvCPD 的氨基酸序列與52 個AtCPD 的氨基酸序列用NJ 法構建系統(tǒng)進化樹,并根據(jù)BvCPD 家族成員與AtCPD 家族成員的進化關系將BvCPD 家族成員分成10 個亞組(圖1),1~10 個亞組中的BvCPD數(shù)量分別是3、16、13、3、11、9、7、7、2和5個,其中Bv2_qyup和AtCYP90A1同源性最高,共同位于亞組Ⅹ中。
圖1 CPD基因家族系統(tǒng)進化樹分析Fig.1 Phylogenetic tree analysis of CPD gene family
對BvCPD蛋白序列進行保守性模體預測,經(jīng)分析共得到10個保守性模體,所有BvCPD家族成員均含有4~10 個模體,且均含有模體2 和模體7,除Bv_hhum 外均含有模體1,除Bv_sqfu 外均含有模體4 和模體5(圖2)。結合系統(tǒng)進化樹的分組,每個亞組中模體數(shù)量和種類相近。
通過Mapin-spect 軟件分析發(fā)現(xiàn),有66 個BvCPD 家族成員分布在甜菜的9 條染色體上,其中第7 條染色體上分布最多,分布有13 個基因;其次為第5 條和第1 條,分別分布有11 個和9 個基因;在第3 條染色體上分布的基因最少,只有3 個基因(圖3)。除此之外,還有10 個基因尚未明確定位。Bv2_qyup被定位于第2 條染色體上。
圖2 CPD家族蛋白保守性模體分布Fig.2 Conservative pattern distribution of CPD family protein
圖3 BvCPD家族成員的染色體分布Fig.3 Chromosome distribution of BvCPD family genes
為進一步調查BvCPD 的功能,結合本課題組對甜菜塊根發(fā)育的轉錄組數(shù)據(jù)分析所發(fā)現(xiàn)的BvCPD 基因家族中Bv2_024470_qyup.t1與甜菜塊根膨大呈正相關的結果,我們進一步對Bv2_qyup 及其編碼蛋白進行生物信息學分析,以期為研究該基因在甜菜塊根發(fā)育中的功能奠定基礎。
2.5.1Bv2_qyup的序列分析
利用NCBI 數(shù)據(jù)庫中ORF finder 軟件預測Bv2_qyup 的開放閱讀框(ORF),結果顯示Bv2_qyup 的cDNA序列包含有1 422 bp 的ORF,編碼473 個氨基酸(圖4)。其中亮氨酸(Leu)、蘇氨酸(Thr)所占比例較高,分別為12.1%、7.8%,半胱氨酸(Cys)的占比最低,為1.1%;含堿性氨基酸精氨酸(Arg)和賴氨酸(Lys)共58 個;含酸性氨基酸天冬氨酸(Asp)和谷氨酸(Glu)共52個。
圖4 Bv2_qyup的核苷酸序列及推測的氨基酸序列Fig.4 Nucleotide and deduced amino acid sequences of Bv2_qyup
圖5 Bv2_qyup的理化性質及結構分析Fig.5 Physical and chemical properties and structure of Bv2_qyup
2.5.2Bv2_qyup的理化性質及結構
通過ExPASy-Protparam 在線工具對Bv2_qyup 的理化性質進行分析。得出該蛋白的相對分子量為54.11 kD,等電點為8.85;蛋白質不穩(wěn)定指數(shù)為37.49,說明該蛋白是穩(wěn)定蛋白(不穩(wěn)定系數(shù)<40)[22];總平均親水指數(shù)(GRAVY)為-0.107,再根據(jù)ProtScale 軟件檢測其親水性和疏水性。Bv2_qyup 最大的親水性和疏水性值分別為-4.033和2.833。從圖5a可以看出Bv2_qyup親水性和疏水性氨基酸分別為157個和135個,說明Bv2_qyup屬于親水蛋白。
通過在線網(wǎng)站NPSA-PRABI預測Bv2_qyup的二級結構,如圖5b 所示:Bv2_qyup由α-螺旋、延伸鏈和無規(guī)卷曲組合的超二級結構,其中α-螺旋區(qū)域有230 個氨基酸,占48.63%;參與形成無規(guī)則卷曲的氨基酸有187個,占39.53%;參與形成延伸鏈的氨基酸有56個,占11.84%。
通過Swiss-Model 數(shù)據(jù)庫運用同源建模的方法預測Bv2_qyup 的三級結構,預測的結果如圖5c 所示,Bv2_qyup 的主要空間結構由α-螺旋和無規(guī)則卷曲構成,與其二級結構預測分析一致,經(jīng)折疊、彎曲等一系列復雜的過程形成了一個穩(wěn)定的三級結構。
利用軟件NCBI CD search 預測Bv2_qyup 蛋白序列保守結構域(圖5d)。預測結果表明Bv2_qyup 具有細胞色素p450超家族結構。
2.5.3Bv2_qyup的亞細胞定位、磷酸化位點、跨膜區(qū)域及信號肽預測
通過Psort分析表明,Bv2_qyup定位于細胞質中可能性占比最高(表2)。
表2 Bv2_qyup 的亞細胞定位分析Table 2 Analysis of subcellular localization of Bv2_qyup
通過軟件TMHMM Server v.2.0 分析Bv2_qyup 的跨膜結構,其N 末端位于膜內側的概率為0.4541(圖6a),預測該蛋白在第4~23 個氨基酸存在跨膜結構域,說明Bv2_qyup是一種膜蛋白。根據(jù)對目的肽鏈氨基酸間潛在酶切位點的預測來判斷是否存在信號肽[23]。預測分析表明:Bv2_qyup在第28~29個氨基酸位置存在信號肽(圖6b)。
圖6 Bv2_qyup的跨膜區(qū)域、信號肽及磷酸化位點預測Fig.6 Prediction of transmembrane region,signal peptide and phosphorylation site of Bv2_qyup
蛋白修飾在翻譯后細胞的調控機制中起極其重要的作用,磷酸化修飾是蛋白修飾的主要方式。對Bv2_qyup 編碼蛋白磷酸化位點進行分析預測,當潛在磷酸化位點的閾值為0.5 時,Bv2_qyup 潛在的磷酸化位點有44 個,其中22 個絲氨酸(Ser)位點、19 個蘇氨酸(Thr)位點、3 個酪氨酸(Tyr)位點(圖6c),推測Bv2_qyup被這3種氨基酸的磷酸激酶磷酸化并激活。
2.5.4Bv2_qyup蛋白序列的同源性分析
利用ClustalW 軟件進行同源多重比對,結果如圖7 所示,Bv2_qyup 與藜麥CqCPD、菠菜SoCPD、毛果楊PtCPD、黃瓜CsCPD 和擬南芥AtCPD的同源性較高,分別為91%、89%、75%、75%和75%。
圖7 Bv2_qyup與不同植物的CPDs氨基酸序列比對Fig.7 Sequence alignment of CPDs amino acids between Bv2_qyup and different plants
通過生物信息學分析可以了解基因的結構、染色體定位、保守結構域、編碼蛋白序列及結構、信號肽、跨膜結構和磷酸化位點等信息。本研究對甜菜CPD 基因家族進行了生物信息學分析,研究結果表明,甜菜CPD 基因共有76 個家族成員,分為10 個亞組,66 個BvCPD 家族基因分布在甜菜9條染色體上,有10個基因尚未明確定位;編碼蛋白含10 個保守性模體,系統(tǒng)進化樹分組中每個亞組的模體數(shù)量和種類相近。進一步對Bv2_qyup 基因及其編碼的蛋白質分析表明,Bv2_qyup 由473 個氨基酸組成,是一種含信號肽的親水跨膜蛋白,二級結構以α-螺旋和無規(guī)則卷曲為主要組成部分,與藜麥、菠菜、毛果楊、黃瓜和擬南芥CPD的同源性較高。細胞定位預測表明該蛋白在細胞質中存在的可能性最大,與中國櫻桃Unigene5028(CPD)定位于葉綠體中不同[24],表明甜菜CPD 家族成員在細胞中的定位不同,Bv2_qyup 存在44 個磷酸化位點,可被絲氨酸、蘇氨酸、酪氨酸磷酸激酶磷酸化并激活。根據(jù)以上研究結果,我們將對Bv2_qyup克隆,并對其在甜菜塊根發(fā)育中的功能進行深入研究。