裴 培
(北京林業(yè)大學(xué)生物科學(xué)與技術(shù)學(xué)院,北京 100083)
LEA蛋白的同源性及其應(yīng)用潛力
裴 培
(北京林業(yè)大學(xué)生物科學(xué)與技術(shù)學(xué)院,北京 100083)
LEA蛋白(晚期胚胎豐富的蛋白質(zhì))是一種植物在干旱條件誘導(dǎo)下產(chǎn)生的蛋白[1]。本文使用軟件繪制出它的結(jié)構(gòu)圖,并對(duì)可以產(chǎn)生LEA蛋白的多種不同植物的基因序列進(jìn)行了比對(duì),從而找到猜想的保守序列。通過分析一未知的序列和在擬南芥中可以產(chǎn)生LEA蛋白的基因序列的同源性,從而得出關(guān)于二者序列和功能之間的關(guān)系的結(jié)論。同時(shí),根據(jù)多種近似物種LEA蛋白的保守性和同源性,分析得到其系統(tǒng)進(jìn)化樹。植物L(fēng)EA蛋白的研究有助于對(duì)植物抗旱性的認(rèn)識(shí),并為調(diào)整種植布局提供參考。
保守序列; LEA蛋白; 系統(tǒng)發(fā)生樹
近年來,由于全球變暖,干旱性自然災(zāi)害頻繁發(fā)生,對(duì)植物生長(zhǎng)造成了巨大的影響。在植物抗旱性方面進(jìn)行研究與應(yīng)用,可調(diào)整植物適應(yīng)性布局,增加土地收入。高等植物在復(fù)雜多變的環(huán)境生長(zhǎng)過程中,陣發(fā)性和短暫性干旱經(jīng)常發(fā)生,細(xì)胞水分虧缺引起的生理干旱,影響著植物的正常生長(zhǎng)發(fā)育[2]。提高植物對(duì)水分虧缺的耐性是一項(xiàng)復(fù)雜工程。一般認(rèn)為,伴隨種子成熟過程而形成的LEA (Late-embryogenic-abundant protein)蛋白(主要為脫水素)的生理功能與種子耐脫水性形成有關(guān),缺乏這類蛋白使種子對(duì)脫水敏感。具有高度保守的氨基酸序列是LEA蛋白的一大特征[3]。植物賴以生存的環(huán)境并不總是適宜的,干旱缺水、炎熱、霜凍、鹽堿、礦質(zhì)元素過多過少等都會(huì)制約植物生長(zhǎng)、降低產(chǎn)量。為了適應(yīng)各種脅迫,植物在長(zhǎng)期的進(jìn)化過程中發(fā)展了各種不同的生理生化機(jī)制,以抵抗、適應(yīng)各種環(huán)境脅迫低分子量滲透物質(zhì)的積累,如糖醇、甘氨酰甜菜堿等,被認(rèn)為是增強(qiáng)植物對(duì)滲透脅迫適應(yīng)和耐受的主要機(jī)制[4-5]。近年來的研究表明.環(huán)境脅迫除了引起代謝變化和低分子保護(hù)性化合物的積累外,植物的許多其它基因可被激活,并導(dǎo)致植物營(yíng)養(yǎng)組織中新蛋白的積累[6]。近年來,植物干旱誘導(dǎo)蛋白的研究已受到普遍關(guān)注,其中LEA蛋白是胚胎發(fā)生后期種子中大量積累的一系列蛋白質(zhì),它廣泛存在于高等植物中,且受發(fā)育階段、脫落酸(ABA)和脫水信號(hào)的調(diào)節(jié),因此成為當(dāng)前在逆境研究方面的一個(gè)熱點(diǎn)。
1981年,Dure等在胚胎發(fā)育后期的棉花子葉中分離到一組豐富的mRNA,命名為L(zhǎng)ea mRNA,即為L(zhǎng)EA蛋白[7-8]。胚胎發(fā)育晚期豐富蛋白(LEA)是種子發(fā)育后期產(chǎn)生的一類小分子,它是伴隨著種子成熟過程而產(chǎn)生的。 LEA蛋白有較高親水性,不僅有序列特異性,空間結(jié)構(gòu)也有特點(diǎn)。在水分缺乏時(shí),此種蛋白在細(xì)胞中有增強(qiáng)束縛水的作用[9-10]。Baker等研究證明:缺水條件下,D13和D11 LEA蛋白能“溶解”在細(xì)胞質(zhì)的結(jié)構(gòu)中,它們的結(jié)構(gòu)中未卷曲部分,能形成適應(yīng)其它結(jié)構(gòu)的形狀;在一般生理?xiàng)l件下,70% 以上肽鏈處于無規(guī)則卷曲狀態(tài),植物缺水時(shí),這些特殊結(jié)構(gòu)有束縛水分子的作用。
LEA蛋白的抗旱性也可能與它的蛋白質(zhì)序列和基因序列相關(guān)。D29 LEA蛋白含有11個(gè)氨基酸[11],即T / A, A / T, Q / E,A / T, A / T, K / R, Q / ED, K / R, A / T, X, ED / Q,這些氨基酸序列能形成鹽橋[12-13],可以豐富蛋白質(zhì)結(jié)構(gòu),提高細(xì)胞液的離子強(qiáng)度,從而抵御或減輕干旱造成的危害[14-15]。
2.1材料
NCBI網(wǎng)站,PDB,晶體結(jié)構(gòu),DNAMAN,BIOEDIT,GeneDoc,RasMol2.71,EndNote X(10.0),LEA蛋白在PDB網(wǎng)站上的圖片,LEA蛋白序列。
2.2方法
(1) 在NCBI網(wǎng)站上搜索多條不同植物上的可編碼LEA蛋白的基因序列并下載LEA蛋白的圖片。
(2) 使用DNAMAN軟件比較所下載編號(hào)為1至8號(hào)的序列(即花生、芥菜、溫州蜜柑、油棕、苜蓿蒺藜、水稻、松、小麥)相似性。
(3)選擇最相似序列,再次用DNAMAN比較相似性。
(4)推測(cè)保守序列并且在網(wǎng)站上用BLAST軟件搜索,比對(duì)相關(guān)結(jié)果。
(5)搜索具有更高分值或低e值的序列并下載該序列。
(6)將該未知序列與擬南芥中可編碼LEA蛋白的
序列進(jìn)行各方面比對(duì)。
3.1LEA蛋白的空間結(jié)構(gòu)圖及相關(guān)分析
LEA蛋白共同的結(jié)構(gòu)特征是由氨基酸組成,形成高度親水性的多肽。大多數(shù)LEA蛋白缺乏半胱氨酸和酪氨酸殘基,但富含賴氨酸和甘氨酸。
圖1 從NCBI網(wǎng)站上獲得的LEA蛋白空間結(jié)構(gòu)圖[16]
由圖1可見:該蛋白質(zhì)包含A(紅)、B(黃)、C(灰)3種肽鏈,它們之間的角度為90 °。該蛋白質(zhì)由6個(gè)α-螺旋和6個(gè)β轉(zhuǎn)角構(gòu)成。且A、B、C 3種肽鏈長(zhǎng)度均為141個(gè)氨基酸,分子量均為15553.23道爾頓。
3.2與LEA蛋白有關(guān)的同源性分析
3.2.1 花生、芥菜、溫州蜜柑、油棕、苜蓿蒺藜、水稻、松、小麥8種植物與擬芥南的基因序列比較 用DNAMAN比較1號(hào)到8號(hào)不同種類的均能編碼LEA蛋白的植物的基因序列,見表1。即對(duì)花生、芥菜、溫州蜜柑、油棕、苜蓿蒺藜、水稻、松和小麥的mRNA序列進(jìn)行比對(duì),得到其同一性是60.3%。由上述植物繪制的系統(tǒng)進(jìn)化樹看出,芥菜和苜蓿蒺藜差距很小,而芥菜、苜蓿蒺藜、油棕和擬南芥中編碼LEA蛋白的序
表1 下載的所有序列編號(hào)植物名稱拉丁名基因名稱1花生Arachishypogaea蛋白3基因,完整序列2芥菜Brassicajuncea胚胎發(fā)育晚期豐富蛋白(LEA1a)mRNA的完整序列3溫州蜜柑Citrusunshiu5組胚胎發(fā)育晚期豐富蛋白(LEA5)mRNA的完整序列4油棕ElaeisguineensisEMZ08基因,完整序列5苜蓿蒺藜MedicagotruncatulaEm6基因,完整序列6水稻(粳稻品種組)Oryzasativa(japonicacultivar?group)LEA蛋白12(LEA12)mRNA的完整7松Pinus克隆15r的LEA基因,完整序列8小麥TriticumaestivumLinnLEA2蛋白(LEA2)9擬南芥ArabidopsisthalianaAt1g01470基因,完整序列10擬南芥ArabidopsisthalianaAt2g23110基因,完整序列11擬南芥ArabidopsisthalianaAt2g44060基因,完整序列12擬南芥Arabidopsisthaliana纖維蛋白1(At2g19760)mRNA的完整序列
列在系統(tǒng)進(jìn)化樹中距離較近,關(guān)系較密切。用DNAMAN對(duì)芥菜、苜蓿蒺藜、油棕和擬南芥中編碼LEA蛋白的序列進(jìn)行同一性的比對(duì),同一性較高,基因序列中有多處重復(fù)部分(標(biāo)記藍(lán)色)。從序號(hào)為171到217的序列部分重復(fù)性較高。47個(gè)堿基中,僅僅有11個(gè)堿基不同,重復(fù)率為76.6%。
3.2.2 對(duì)編碼LEA蛋白的保守序列的預(yù)測(cè)和分析 由DNAMAN的同一性比對(duì)預(yù)測(cè)保守序列結(jié)果為(從第171號(hào)到第217號(hào)可編碼LEA蛋白的序列):
CATCTTGCTGAAGGAAGGAGCAAGGGAGGGCAGA-
CAAGGAAGGAGCA預(yù)測(cè)的保守序列在NCBI網(wǎng)站上BLAST所得到的結(jié)果,幾乎所有得到的序列都與LEA蛋白相關(guān),從而可以推斷,預(yù)測(cè)的保守序列具有一定的可靠性。而BLAST的結(jié)果中有2種未知的基因序列,一是大豆克隆JCVI-FLGm-6A14(未知),另一種是大豆克隆JCVI-FLGm-5F4(未知)。這兩種基因序列登錄號(hào)分別為:BT094816.1和BT090966.1。
用第一個(gè)未知的mRNA,即大豆克隆JCVI-FLGm-6A14(未知)的基因與表1中列出的1至8號(hào)植物的序列分別進(jìn)行同一性比對(duì)。大豆克隆JCVI-FLGm-6A14未知基因與其他序列比對(duì)得到同一性為47.33%。然而,大豆克隆JCVI-FLGm-5F4未知基因的同一性比較結(jié)果較低,最高的同一性僅為13.3%。由此可以推測(cè)第一種未知的基因序列與可以表達(dá)LEA蛋白的基因序列具有一定的相似性。
從以上分析可以得出預(yù)測(cè),大豆克隆JCVI-FLGm-6A14未知基因同可以編碼LEA蛋白的基因具有一定的相似性,從而推測(cè)其可以翻譯并表達(dá)LEA蛋白,在該植物中表現(xiàn)出LEA蛋白的抗旱性。
3.2.3 大豆克隆JCVI-FLGm-6A14未知基因所表達(dá)的蛋白和擬南芥(克隆AT10-3)胚晚期豐富蛋白基因轉(zhuǎn)錄的蛋白之間的同源性比較 大豆克隆JCVI-FLGm-6A14未知基因表達(dá)的氨基酸序列為:
MESQQANREELDEKARQGETVVPGGTGGKSLEAQ-EHLAEGRSRGGQTRKQQLGSEGYHEMGTKGGQTRKEQ-MGREGYQEMGRKGGLSTMDKSGRERAEEEGIEIDESKF-KIT
擬南芥(克隆AT10氨基酸序列-3)胚晚期豐富蛋白(LEA)的基因所表達(dá)的氨基酸序列為:
MASKQLSREELDEKAKQGETVVPGGTGGHSLEAQE-HLAEGRSKGGQTRKEQLGHEGYQEIGHKGGEARKEQL-GHEGYKEMGRKGGLSTMEKSGGERAEEEGIEIDESKFT-NK
將大豆克隆CVI FLGm-6A14未知基因表達(dá)的氨基酸序列與擬南芥(克隆AT10氨基酸序列-3)胚晚期豐富蛋白(LEA)的基因所表達(dá)的氨基酸序列進(jìn)行BLAST分析得到結(jié)果為:score=172bits(437),Expect=9e-49,Method:Compositional matrix adjust. Identities=90/109(82%),Positives=100/109(91%),Gaps=0/109(0%)。即總分是172,而E值是9e - 49,E值相當(dāng)小。兩種蛋白質(zhì)序列的相似性為82%。從而可以得出結(jié)論,大豆克隆JCVI-FLGm-6A14未知基因可以編碼LEA蛋白或LEA蛋白的類似物。從而可以推測(cè)該基因所表達(dá)的蛋白具有抗旱功能。
3.2.4 大豆克隆JCVI-FLGm-6A14未知基因序列的基本屬性 通過BIOEDIT分析大豆克隆JCVI-FLGm-6A14未知基因序列的長(zhǎng)度是569個(gè)堿基對(duì),單鏈分子量為174281.00,雙鏈分子量為345192.00道爾頓。G和C含量為42.36%,而A 和 T含量為57.64%。
3.3系統(tǒng)進(jìn)化樹的構(gòu)建
利用DNAMAN軟件,采取默認(rèn)參數(shù),選取進(jìn)化中具有代表性的14個(gè)物種構(gòu)建系統(tǒng)進(jìn)化樹,見圖2。結(jié)果顯示,所有這些物種均屬同一分支,且各個(gè)物種間的進(jìn)化距離均在0.001與0.172之間。如果數(shù)據(jù)庫(kù)中這幾種同源蛋白的序列是正確的,則利用LEA蛋白的保守性對(duì)不同植物物種進(jìn)行分類的價(jià)值有待進(jìn)一步探討。
圖2 基于LEA蛋白序列構(gòu)建的物種進(jìn)化樹狀圖
本文主要討論了LEA蛋白的同源性,并利用DNAMAN對(duì)不同植物能表達(dá)產(chǎn)生LEA蛋白的基因序列進(jìn)行分析比較,預(yù)測(cè)出保守序列。憑借預(yù)測(cè)的保守序列BLAST得到一種未知的大豆序列。通過BLAST比較此未知mRNA序列和擬南芥中可表達(dá)LEA蛋白的序列(clone AT10-3),認(rèn)為二者有很大的相似性。從而推測(cè)未知的基因序列所表達(dá)的蛋白可行使與LEA蛋白相同的功能,即該未知大豆mRNA序列在植物抗旱性方面可能有相關(guān)作用。然而,本研究所預(yù)測(cè)的保守序列未經(jīng)測(cè)試,所得到的結(jié)果還須經(jīng)進(jìn)一步檢驗(yàn)。本研究為該未知大豆mRNA序列(Soybean clone JCVI-FLGm5F4 unknown mRNA )的功能做了可能性分析,也為大豆的抗旱性機(jī)理提供了一種推斷,可以在實(shí)踐中更進(jìn)一步的探討和驗(yàn)證。
同時(shí),由于LEA蛋白是一種較保守的蛋白,利用DNAMAN繪制的進(jìn)化樹可以在一定程度上顯示不同植物之間的進(jìn)化關(guān)系。 因本實(shí)驗(yàn)所選取的材料較少,系統(tǒng)進(jìn)化樹可靠性有一定的局限。盡管如此,我們可以運(yùn)用此方法對(duì)眾多植物進(jìn)行抗旱性研究并做出分類,以便我們根據(jù)自然環(huán)境狀況,特別是干旱情況的發(fā)生頻率,對(duì)植物的種植布局做出調(diào)整,優(yōu)化種植結(jié)構(gòu)避免自然災(zāi)害帶來?yè)p失,獲取更大社會(huì)經(jīng)濟(jì)效益。
[1] Yuan, K., et al., Alterations in human breast cancer adhesion-motility in response to changes in cell surface glycoprotein displaying alpha-L-fucose moieties[J].International Journal of Oncology, 2008,32(4): 797-807.
[2] Wysocki, R., et al., Transcriptional Activation of Metalloid Tolerance Genes in Saccharomyces cerevisiae Requires the AP-1ike Proteins Yap1p and Yap8p[J]. Molecular Biology of the Cell, 2004,15(5): 2049-2060.
[3] Valente, M.A.S., et al., The ER luminal binding protein (BiP) mediates an increase in drought tolerance in soybean and delays drought induced leaf senescence in soybean and tobacco[J]. Journal of Experimental Botany, 2009,60(2): 533-546.
[4] Ruijne, N., et al., Understanding the Immune Responses to the Meningococcal Strain-Specific Vaccine MeNZB Measured in Studies of Infants[J].Clinical and Vaccine Immunology,2006,13(7): 797-801.
[5] Rodriguez, M., et al., Tumor Necrosis Factor is Reparative via TNFR1 in the Hippocampus and via TNFR2 in the Striatum after Virus-Induced Encephalitis[J].Brain Pathology,2009,19(1): 12-26.
[6] Macconi, D., et al., Permselective Dysfunction of Podocyte-Podocyte Contact upon Angiotensin II Unravels the Molecular Target for Renoprotective Intervention[J]. American Journal of Pathology,2006,168(4): 1073-1085.
[7] Matsoso, L.G., et al., Function of the Cytochrome bc1-aa3 Branch of the Respiratory Network in Mycobacteria and Network Adaptation Occurring in Response to Its Disruption Bacteriol[J].American Society for Microbio-logy 2005,187(18):6300-6308.
[8] Jansson, L., et al., The Major Subunit, CfaB, of Colonization Factor Antigen I from Enterotoxigenic Escherichia coli Is a Glycosphingolipid Binding Protein[J].Infection and Immunity,2006,74(6): 3488-3497.
[9] Deane, J.E., et al., Structures of the Shigella flexneri Type 3 Secretion System Protein MxiC Reveal Conformational Variability Amongst Homologues[J].Journal of Molecular Biology 2008,377(4-3):985-992.
[10] Beeson, J.G., et al., Plasmodium falciparum Isolates from Infected Pregnant Women and Children Are Associated with Distinct Adhesive and Antigenic Properties[J].The Journal of Infectious Diseases. 1999.180(2): 464-472.
[11] Li, L., et al., MAIGO2 Is Involved in Exit of Seed Storage Proteins from the Endoplasmic Reticulum in Arabidopsis thaliana [J].Plant Cell, 2006,18(12):3535-3547.
[12] Abdo, M., et al., The expression of tumor necrosis factor-alpha, its receptors and steroidogenic acute regulatory protein during corpus luteum regression[J].Reproductive Biology and Endocrinology, 2008,6: 50.
[13] 馬建華,鄭海雷.植物耐鹽的分子生物學(xué)基礎(chǔ)[J].生物學(xué)雜志,2007,24(1):5-8.
[14] 俞磊寧.山侖.LEA蛋白與植物的抗旱性[J].生物工程進(jìn)展,2002,22(2):10-14.
[15] 魯剛寧.植物抗性與農(nóng)業(yè)[J].中國(guó)科技信息,2006(3A):73.
[16] LEA蛋白空間結(jié)構(gòu)圖[OL].http://www.ncbi.nlm. nih.gov/Structure/mmdb/mmdbsrv.cgi?uid=76476.
(責(zé)任編輯:譚著明)
LEAproteinhomologyanditsapplicationpotentiality
PEI Pei
(College of Biological Sciences and Biotechnology, Beijing Forestry University, Beijing 100083, China)
LEA protein (Late-embryogenic-abundant protein) is a kind of induced protein by plants under drought stress[1]. This paper used software to map out its structure diagram and analyzed different plants which can produce LEA protein with mRNA sequence alignment to find conjectured conserved sequences. By analysis of the homology of the sequences in some unknown sequences and the original LEA protein inArabidopsisthaliana, some conclusions on the relationship between sequence and function of them were obtained. The phylogenetic tree of LEA proteins was also obtained based on their conservative property and homology. The research result on LEA protein would benefit to awareness on plant drought resistance, and be a reference for adjusting planting layout.
conservative sequence; LEA protein; phylogenetic tree
2010-03-19
2010-03-25
Q 943
A
1003-5710(2010)02-0020-04