康曉慧, 雷 桅, 張 梅
(1.西南科技大學生命科學與工程學院, 中國 綿陽 621010;2.中山大學生命科學學院, 國家教育部食品與健康工程研究中心, 中國 廣州 510650)
抗病性是植物與其病原生物在長期的協(xié)同進化過程中相互適應、相互選擇所形成的一種可遺傳特性.植物被病原物侵染后,會發(fā)生一系列生理變化和防衛(wèi)反應,包括植保素和木質素等抗病物質的合成和積累,其中苯丙烷類代謝與植物的抗病性密切相關,苯丙氨酸解氨酶(phenylalanine ammonia-lyase, PAL)是該途徑中的第一個關鍵酶,也是限速酶.它催化L-苯丙氨酸非氧化性脫氨生成反式肉桂酸(cinnamic acid,CA),即是植保素、木質素、類黃酮和某些酚類等生物合成的通用前體.因此,該酶在植物病理學研究中有極重要的地位.PAL為多基因家族所編碼,但遺傳特性相當保守,目前已從馬鈴薯(Solanumtuberosum)、水稻(Oryzasativa)、煙草(Nicotianatabacum)和黃瓜(Cucumissativus)等多種植物中克隆了pal基因,并將其作為植物抗病機制研究的重要內容.
水稻是世界上最重要的糧食作物之一,而病害給水稻的產量和質量造成了巨大的損失,因此水稻抗病的分子機理和遺傳改良成為一項重要的課題,而作為關鍵防衛(wèi)基因的pal則有望成為理想的調控靶點.粳稻品種日本晴(Nipponbare)是單子葉植物基因組學研究的模式植物,測序發(fā)現其pal基因家族包含9個成員.本文利用生物信息學的方法,選取其中一個成員基因,對其核苷酸及相應氨基酸序列的理化性質、結構特征、生化功能和系統(tǒng)演化等進行了預測和分析,為今后深入研究PAL蛋白的酶學特性和植物病害脅迫的分子機理提供一定的理論參考.
粳稻品種日本晴的苯丙氨酸解氨酶(PAL)核苷酸與氨基酸序列均來自于GenBank中已登錄的數據信息:水稻Oryzasativa(japonica cultivar-group)(Accession:AY224546).
利用Vector NTI Suit 8等序列分析軟件和www.ncbi.nlm.nih.gov、www.expasy.org等網站提供的各種在線生物信息學工具進行預測和分析.核苷酸和氨基酸序列的分子結構和理化性質分析使用ProtParam工具和 Vector NTI Suit 8軟件完成[1];序列同源性比對使用Vector NTI Suit 8完成;分子系統(tǒng)發(fā)生樹使用Clustal X軟件比對后在MEGA3的Phylogeny中以Neighbor-Joining方法構建[2];亞細胞定位情況的考察使用TargetP 1.1 Server在線完成[3];跨膜結構域和疏水性分析分別使用TMHMM[4]和ProtScale[5]完成;motif和蛋白質功能分別用Scanprosite[6]和Protfun[7]分析;蛋白質二級結構預測和三級建模分別使用GOR[6]和SWISS-MODEL[8-9]完成,3D模型在WebLab ViewerLite 4.2軟件中編輯.
圖1 水稻PAL的核苷酸及其編碼氨基酸序列
水稻pal基因的全長mRNA序列及其推導的氨基酸序列如圖1所示,利用Vector NTI Suit 8軟件分析得到的Ospal基因的核苷酸序列及其相應氨基酸序列的結構和性質數據,發(fā)現Ospal基因全長為2 136 bp,其中開放閱讀框(ORF)長為2 133 bp,起始密碼子為ATG,終止密碼子為TGA,3′和5′非編碼區(qū)(UTR)均不存在.水稻Ospal基因編碼蛋白的分子式為C3188H5129N891O973S24,相對分子質量為72 273,等電點為6.12,摩爾消光系數為37 590,肽鏈長為671 aa,其中含帶電氨基酸27.72%,極性氨基酸23.85%,疏水性氨基酸38.15%,酸性和堿性氨基酸比例為11.33%和10.13%,而含量最豐富的4種氨基酸占比為Ala:10.88%;Leu:10.13%;Val:8.20%;Gly:7.90%.
圖2 水稻PAL和其他植物PAL的氨基酸序列多重比對注:一致位點顯示為黑底白字,保守位點顯示為灰底白字,其他顯示為白底黑字.活性位點標注*,MIO區(qū)用方框表示.Salvia miltiorrhiza(GenPept accession No.:ABR14606); Trifolium pretense(GenPept accession No.: BAE71252); Daucus carota(GenPept accession No.:BAA23367); Ipomoea batatas(GenPept accession No.:BAA11459); Nicotiana tabacum(GenPept accession No.:BAA22947); Oryza sativa (GenPept accession No.: AAO72666).
選取水稻(japonica cultivar-group)等6條植物PAL氨基酸序列,在Vector NTI 8軟件中進行多重比對分析.分析結果用不同顏色顯示(圖2),顏色越深的表示同源性越高,最深的區(qū)域則表示可能存在的重要功能域.分析結果顯示所選植物PAL具有較高的同源性,一致性達到57.4%,可見PAL編碼區(qū)高度保守,但是在N端也表現出較明顯的長度和組成上的變異性.推測這可能是由于苯丙烷類途徑是植物初生代謝轉向次生代謝的重要通路,廣泛存在于植物體中,而作為苯丙烷類化合物生物合成途徑中的第一個關鍵酶PAL必須保持足夠的遺傳穩(wěn)定性和演化趨同性.此外,在保守的PAL比對圖譜中,發(fā)現水稻PAL具有典型的苯丙氨酸和組氨酸解氨酶的標志性模式,該保守基序(GTITASGDLVPLSYIAG)被包埋在酶活性中心;此外,也存在已查明的MIO域,它通過Ala-Ser-Gly三肽的自動環(huán)化合脫水生成,毗鄰底物結合位點,并負責產物E-肉桂酸酯/氨的催化形成.
將9條來自不同植物的PAL氨基酸序列在Clustal X軟件中進行完全比對后,在MEGA3軟件中按照Neighbor-Joining方案進行分子進化樹分析,獲得PAL氨基酸序列的分子進化樹分析結果(如圖3).進化樹用MEGA3軟件基于Neighbor-Joining方法(重復1 000次)構建.遺傳距離顯示在分支上.9種植物的PAL氨基酸序列聚成3支:甘薯、番薯和煙草聚成第1支,它們的多酚類物質含量較高;粘毛黃芩、丹參、豌豆和胡蘿卜聚成第2支,前二者是主產黃酮活性成分的草藥,后二者是含有豐富的香豆素和花青素等的蔬菜;馬蹄竹和水稻聚成第3支,這兩種植物的木質素合成能力較強,且同屬禾本科.該進化樹除反映了這9種植物間的親緣關系外,也反映了不同植物類群所含苯丙素類化合物的種類和含量差異,即說明該指標與植物的系統(tǒng)演化進程密切相關.苯丙烷類代謝作為植物次生代謝的起始途徑,廣泛存在于所有植物,其衍生途徑隨著生命進化而分化出黃酮類、木質素類、植保素類等某些植物的主流次生代謝通路,而PAL作為苯丙烷類途徑的第一個關鍵酶,顯然在植物的功能分化和系統(tǒng)進化過程發(fā)揮著重要作用.因此,以PAL序列分析作為分子指標進行的遺傳聚類,對于系統(tǒng)分類和自然進化研究具有一定的參考價值,同時也反映出植物的抗病性與植物本身的種質特性和進化水平密切相關.
圖3 水稻PAL家庭和其他植物PAL的分子進化分析
TargetP 1.1 Server在線工具分析結果顯示,水稻PAL定位于細胞質基質,且無轉運肽,預測可靠性等級均為2.可見水稻PAL在游離核糖體上起始合成后,不進行蛋白轉運,而是繼續(xù)保留在細胞質基質中,直接催化苯丙素類化合物的生成.
PAL的多個重要保守結構域在OsPAL蛋白中也被找到,包括S213、Y120、L148、N269、Q357、Y360、R363、F409、Q497和4-methylideneimidazole-5-one(MIO),這些區(qū)域對于PAL的底物結合、催化活性和MIO形成都至關重要.這與歐芹的實驗結果一致,表明水稻PAL也屬于PAL蛋白家族.
圖4 水稻PAL蛋白的跨膜結構域預測
用TMHMM Server v. 2.0對水稻PAL氨基酸序列的跨膜結構域進行預測,結果如圖4所示,水稻PAL整條肽鏈都位于細胞膜內,也即是水稻PAL不存在跨膜結構域,結合上述轉運肽的預測,可以推斷,水稻PAL在細胞質基質中合成后,不經蛋白轉運,直接錨定于細胞質基質中的特定部位行使催化功能.這與上述亞細胞定位分析結果相一致.
圖5 水稻PAL蛋白的疏水性預測
由ProtScale進行水稻pal基因編碼蛋白的氨基酸序列的疏水性預測結果表明(圖5),多肽鏈具有最低分值-2.778,親水性最強;而最高分值為2.389疏水性最強.整條多肽鏈表現為親水性,但沒有明顯的親水區(qū)域.結合跨膜結構域的預測結果,可以推斷,水稻PAL不存在明顯的疏水區(qū)域,與OsPAL不存在跨膜結構域的特征相吻合.
GOR4在線工具預測水稻PAL氨基酸序列的二級結構,結果如圖6所示,水稻PAL多肽鏈中,隨機卷曲占44.02%,α-螺旋占43.88%,延伸鏈占12.10%,即隨機卷曲和α-螺旋是OsPAL多肽鏈中的主要結構元件,延伸鏈散布于整個蛋白質中.
圖6 水稻PAL蛋白的二級結構預測
在PROSTIE中通過與已知物種PAL功能位點的比對和計算,成功預測了水稻PAL的Motif,發(fā)現OsPAL含有5個重要的基序,分別是苯丙氨酸與組氨酸標記(Phenylalanine and histidine ammonia-lyases signature)(153~168 GTITASGDLVPLSYIA, 153~169 GTITASGDLVPLSYIAG),氨基化位點(183~186 DGKK),蛋白激酶C磷酸化位點(Protein kinase C phosphorylation site)(16~18 SLR, 74~76 SHR, 172~174 TGR, 260~262 THK, 452~454 SAR, 513~515 SAR, 517~519 SEK, 648~650 SER),酪氨酸激酶II磷酸化位點(Casein kinase II phosphorylation site)(335~338 SVND, 523~526 TAID, 532~535 SYAD, 575~578 TAFE, 635~638 SPGE),N-糖基化基序(N-glycosylation motif)(99~102 NGSD)和N-肉豆蔻酰化位點(N-myristoylation site)(20~25 GQVAAV, 65~70 GVTTGF, 95~100 GIFGNG).再將水稻PAL氨基酸序列上傳到SWISS-MODEL的建模服務器中進行PAL結構的三維建模,通過同源搜索和比對,以毆芹(Petroselinum crispu)為模板初步構建了OsPAL的三維模型,然后在ViewerLite 4.2軟件中進行序列編輯和位點設置,獲得OsPAL的三級結構模型,相關功能位點見標示于圖7.
圖7 水稻PAL的三維建模及重要基序
苯丙氨酸解氨酶在木質素、植保素等植物抗病物質的代謝途徑中起著重要作用,在水稻的抗病機制研究中也被公認為是重要的生理指標.生物信息學是后基因組時代,以計算機科學技術為平臺,分析并挖掘生物學數據,從而為實驗研究提供理論依據的新興學科.本文利用生物信息學軟件和方法,對日本晴水稻防衛(wèi)基因pal的結構性質、生化功能和系統(tǒng)進化等進行了預測和分析,發(fā)現Ospal基因的核苷酸序列只包含ORF,缺少兩端UTR,無跨膜結構域和質體轉運肽,定位于細胞質基質.近年的研究也發(fā)現,細胞間質部分PAL活性最高,電鏡技術顯示PAL分散在細胞的基質中.這些實驗結果也間接地驗證了本定位預測的可能性.本項研究明確了PAL蛋白的二級結構以α-螺旋和隨機卷曲為主,三維建模成功,并明確了多個功能基序.這些重要生物學參數的獲得為進一步研究PAL的酶學性質和水稻的抗病機制奠定了理論基礎.
PAL作為抗病性指標蛋白的水稻生物學研究已有諸多報道,但大多是以PAL酶活變化表征抗病能力強弱的生化研究.本文解析了OsPAL蛋白的分子結構,并描述了其細胞學特性,將有助于深入闡述水稻病理生理與抗性獲得機制;而對Ospal基因的序列和系統(tǒng)學演化分析結果,將為基于Ospal的基因操作和遺傳工程提供重要的調控靶點.因此,本項研究對于水稻抗病性分子育種也有重要參考價值.
參考文獻:
[1] LEI W, LUO K M, SHUI X R,etal. Compute simulation to characterize structure and function of chalcone synthase from scutellaria baicalensis georgi[J]. Molecular Biology, 2009, 43(6): 1 012-1 017.
[2] KUMAR S K, TMAMURA K, JAKOBSENI I B,etal. MEGA2: Molecular evolutionary genetics analysis software[J]. Bioinformatics, 2001, 17: 1 244-1 245.
[3] OLOF E, HENRIK N, S?REN B,etal. Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J]. J Mol Biol, 2000, 300:1 005-1 016.
[4] IKEDA M, ARAI M, LAO D M. Transmembrane topology prediction methods: A reassessment and improvement by a consensus method using a dataset of experimentally characterized transmembrance topologies[J]. In Silico Biol, 2002, 2: 19-33.
[5] GASTEIGER E, HOOGLAND C, GATTIKER A,etal. Protein Identification and analysis tools on the ExPASy Server[C]//John M Walker. The Proteomics Protocols Handbook. New York: Humana Press, 2005.
[6] COMBET C, BLANCHET C, GEOURJON C,etal. NPS@: Network protein sequence analysis[J]. TIBS, 2000, 25: 147-150.
[7] JENSEN J L, ST?RFELDT H H, BRUNAK S. Prediction of human protein function according to Gene Ontology categories[J]. Bioinformatics, 2003, 19: 635-642.
[8] ARNOLD K, BORDOLI L, KOPP J,etal. The SWISS-MODEL Workspace: A web-based environment for protein structure homology modelling[J]. Bioinformatics, 2006, 22: 195-201.
[9] SCHWEDE T K J, GUEX N, PEITSCH M C. SWISS-MODEL: an automated protein homology-modeling server[J]. Nucleic Acids Res, 2003, 31:3 381-3 385.