李 蒙
(西安文理學(xué)院 生物與環(huán)境工程學(xué)院,陜西 西安 710065)
半胱氨酸蛋白酶(Cysteine Protease, CP, EC3.4.22)是一類重要的蛋白水解酶,廣泛參與植物機(jī)體各種生理過程[1],如種子萌發(fā)與生長、組織分化與衰老、應(yīng)激反應(yīng)等[2-3]。近年來發(fā)現(xiàn),不同植物中半胱氨酸蛋白酶分屬于五大類的不同家族,在植物生長過程中起著重要的作用[4]。
在多種植物中研究發(fā)現(xiàn)蛋白的貯藏與降解、對非生物與生物脅迫的響應(yīng)、自然衰老和脅迫誘導(dǎo)的衰老過程等與CP基因的表達(dá)相關(guān)[5]。目前在GenBank數(shù)據(jù)庫中登錄的植物CP基因序列有1萬多條。有關(guān)學(xué)者已對擬南芥[6]、煙草[7]、水稻[8]等植物中的CP基因進(jìn)行了大量的研究,發(fā)現(xiàn):在水稻種子發(fā)芽期間CP基因REP-1參與種子儲存蛋白的降解,以供種子萌發(fā)之需[9];在逆境脅迫下,水稻CP基因OsMC5表達(dá)量的增加明顯增強(qiáng)了抗曲霉感染的能力,當(dāng)感染牛肉粘蟲受傷后,CP基因OsMC6的表達(dá)量增加[10];在衰老期間,煙草不同組織器官中CP基因NTCP-23的轉(zhuǎn)錄水平都有提高,表明CP在植物衰老過程中參與調(diào)控作用[11]。目前在多種植物中發(fā)現(xiàn)了半胱氨酸蛋白酶抑制劑CPI,如水稻、擬南芥、馬鈴薯、番茄等[12];在植物體內(nèi)CPI與CP催化位點相互作用,它們之間維持動態(tài)平衡,調(diào)節(jié)機(jī)體的各種生理生化反應(yīng)[13]。因此,探討CP基因及酶的結(jié)構(gòu)功能對明確植物參與逆境應(yīng)答、細(xì)胞程序化死亡等生理過程具有重要的科學(xué)意義。
隨著越來越多的CP基因被鑒定出來[14],在后續(xù)基因的表達(dá)調(diào)控機(jī)理研究中,將進(jìn)一步探究CP酶的理化性質(zhì)對植物生長發(fā)育的影響。本文通過生物信息學(xué)方法,對不同植物CP基因及其蛋白質(zhì)的組成、結(jié)構(gòu)與特征進(jìn)行了預(yù)測分析,有助于發(fā)揮CP的功能,從而為農(nóng)業(yè)大規(guī)模生產(chǎn)中改良作物開辟新途徑。
在NCBI中查詢10種不同植物的半胱氨酸蛋白酶的核酸序列及其對應(yīng)的氨基酸序列,即以擬南芥(NM_120069.5)、草莓(JN979371.1)、葡萄(EU280160.1)、番茄(AJ841791.1)、小麥(AY841792.2)、煙草(EU429306.1)、菠菜(AB377534.1)、豌豆(Z68291.1)、馬鈴薯(AJ245924.1)、水稻(X80876.1)作為研究對象。
采用DNAStar、Clustal X2和Genedoc軟件對10種植物CP的核酸序列和氨基酸序列進(jìn)行分析與比對。采用ProtParam (http://web.expasy.org/protparam/)分析蛋白質(zhì)的分子量、等電點、半衰期和穩(wěn)定性等理化性質(zhì)。采用TargetP (http://www. cbs.dtu.dk/services/TargetP/)、SignalP 4.1 (http://www.cbs.dtu.dk/services/Sig nalP/)進(jìn)行蛋白質(zhì)亞細(xì)胞定位、分泌信號肽分析等。采用SOPMA (https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)分析預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。采用NetNGlyc (http://www.cbs.dtu.dk/services/NetN Glyc/)在線分析蛋白質(zhì)糖基化。采用MotifScan (https://myhits.isb- sib.ch/cgi-bin/motif_scan)在線分析蛋白質(zhì)脂?;?、磷酸化、cAMP和cGMP依賴蛋白激酶磷酸化位點。采用ClustalX 2.0和TreeView進(jìn)行多重序列全局比對和系統(tǒng)發(fā)育樹構(gòu)建。
利用DNAStar軟件和ProParam進(jìn)行在線分析,結(jié)果如表1所示。10種植物半胱氨酸蛋白酶基因的ORF全長在1053~1443 bp,GC含量適中(除小麥和水稻略高外),氨基酸數(shù)目在350~480,分子量大小在38.58~52.99 kD,pI值在5.13~6.75,說明CP呈酸性,與蛋白序列中酸堿氨基酸比例結(jié)果一致。對氨基酸序列的組成進(jìn)行分析,發(fā)現(xiàn):氨基酸Ser和Gly在所有植物CP中含量較高,分別為6.8%~11.2%和7.2%~11.6%;還有部分氨基酸如Ala、Leu在大多數(shù)植物CP中含量也較高;而氨基酸Met和Trp在所有植物CP中含量較低,分別在1.3%~2.9%和1.3%~2.3%;還有部分氨基酸如Gln和Cys在大多數(shù)植物CP中含量也較低。所有植物CP蛋白質(zhì)中負(fù)電荷氨基酸殘基總數(shù)高于正電荷氨基酸殘基總數(shù),疏水性氨基酸的比例高于酸性、堿性和極性氨基酸的比例;在溶液中CP的不穩(wěn)定指數(shù)為26.60~44.87,除番茄和馬鈴薯外均低于閥值(<40為穩(wěn)定蛋白),推測絕大多數(shù)植物的CP為穩(wěn)定蛋白。脂肪系數(shù)為62.04~80.27,親水性平均系數(shù)為-0.578~0.195,說明CP蛋白質(zhì)總體親水性較低。
表1 植物CP的核苷酸及氨基酸序列組成和理化性質(zhì)
經(jīng)ClustalX 2.0和Genedoc軟件比對,發(fā)現(xiàn)不同植物CP的氨基酸序列具有同源性,普遍具有4個活性位點相關(guān)氨基酸殘基Gln-Cys-His-Asn/Asp,以及半胱氨酸蛋白酶特有的保守結(jié)構(gòu)域:ERFNIN基序、GNFD基序和GCDGG基序(圖1)。說明不同植物半胱氨酸蛋白酶在進(jìn)化過程中在功能區(qū)域具有較好的保守性。
NetNGLyc在線分析結(jié)果(如表2)表明,除了草莓和水稻外,擬南芥(253NFSD)、葡萄(263NFSV)、番茄(136NKTA和322NYTY)、小麥(259NFSV)、煙草(115NGTF)、菠菜(447NASK)、豌豆(117NCSA、177NISL和246NITL)、馬鈴薯(125NKSD)的CP蛋白含有不同的糖基化位點。MotifScan在線分析結(jié)果(如表2)表明:所有植物CP蛋白都具有酪蛋白激酶Ⅱ磷酸化修飾位點和N端肉豆蔻?;揎椢稽c;蛋白激酶C磷酸化修飾位點普遍存在于不同植物成熟的CP蛋白中(除煙草外);酪氨酸激酶磷酸化位點的修飾唯有擬南芥、葡萄、小麥、馬鈴薯CP蛋白含有; cAMP和cGMP依賴蛋白激酶磷酸化唯有番茄(283KKRT)、煙草(226KRNS)、菠菜(117RKKS和442RKGT)、豌豆(88RRLS)、馬鈴薯(120RKLS和462KKSS)蛋白序列位點修飾。
黑色和灰色分別表示氨基酸的相似性;紅色方框標(biāo)明催化位點;黃色方框標(biāo)明保守結(jié)構(gòu)域。AtCP:擬南芥(Arabidopsis thaliana)CP; FaCP:草莓(Fragaria xananassa)CP; VvCP:葡萄(Vitis vinifera)CP; LeCP:番茄(Lycopersicon esculentum)CP; TaCP:小麥(Triticum aestivum)CP; NtCP:煙草(Nicotiana tabacum)CP; SoCP:菠菜(Spinacia oleracea)CP; PsCP:豌豆(Pisum sativum)CP; StCP:馬鈴薯(Solanum tuberosum)CP; OsCP:水稻(Oryza sativa)CP。
10種植物CP蛋白經(jīng)TargetP在線分析,結(jié)果如表3所示,信號肽預(yù)測分值為0.768~0.994, cutoff值為0.430,說明存在信號肽。此結(jié)果與Signal P 4.0預(yù)測的信號肽結(jié)果相符,且Signal P 4.0預(yù)測10種植物CP蛋白序列在N端的19~25位氨基酸是信號肽的切割位點。亞細(xì)胞定位分析表明,線粒體定位預(yù)測值為0.008~0.145,定位于其他位置的預(yù)測值為0.005~0.158。采用SOPMA對CP蛋白進(jìn)行二級結(jié)構(gòu)預(yù)測,結(jié)果表明在不同植物CP蛋白的二級結(jié)構(gòu)中α螺旋占23.64%~45.00%,β折疊占8.46%~16.58%,無規(guī)則卷曲占29.58%~45.06%,延伸鏈占12.47%~24.46%,說明CP蛋白的二級結(jié)構(gòu)以α螺旋和無規(guī)則卷曲為主。
利用ClustalX 2.0和TreeView進(jìn)行分析,結(jié)果(如圖2)表明:不同植物CP在進(jìn)化過程中,豆科豌豆和茄科番茄的CP與其他科植物距離較遠(yuǎn),親緣性較遠(yuǎn);十字花科的擬南芥、葡萄科的葡萄和禾本科的小麥聚為一個分支,說明它們親緣性較近;而薔薇科的草莓、藜科的菠菜、茄科的馬鈴薯、茄科的煙草和禾本科的水稻聚為一個分支,說明其親緣性較近。說明植物CP在進(jìn)化過程中同一科植物也有較大的差距。
表2 植物CP翻譯后修飾和結(jié)構(gòu)特征性序列分析結(jié)果
注:N-端糖基化位點的Threshold等于0.5。
植物半胱氨酸蛋白酶主要分為Papain(木瓜蛋白酶家族,C1)、Legumain(豆類天冬氨酸蛋白內(nèi)切酶,C13)、Caspase(天冬氨酸特異性的半胱氨酸蛋白酶,C14)、Calpain(鈣依賴半胱氨酸蛋白酶,C2)和其他半胱氨酸蛋白酶家族,目前對其中Papain的研究最為詳盡[15],其氨基酸序列從N端到C端分為信號肽序列、前體肽序列和成熟酶序列[16],信號肽引導(dǎo)新生蛋白轉(zhuǎn)移,前體肽序列在酶發(fā)揮活性時被切除[17],其中保守結(jié)構(gòu)域就可能發(fā)揮至關(guān)重要的作用。本文通過生物信息學(xué)方法對蛋白質(zhì)序列進(jìn)行分析,發(fā)現(xiàn)了不同植物中CP的保守結(jié)構(gòu)域:ERFNIN基序、GNFD基序和GCDGG基序。在CP酶發(fā)揮活性時,與4個活性位點相關(guān)的氨基酸殘基Gln-Cys-His-Asn/Asp共同決定CP的功能特異性。在保守結(jié)構(gòu)域與活性位點中個別氨基酸的替換可能決定了不同植物CP的活性差異,這為應(yīng)用半胱氨酸蛋白酶在植物育種中提供了理論依據(jù)。
表3 植物CP蛋白的亞細(xì)胞定位及二級結(jié)構(gòu)預(yù)測與分析結(jié)果
注:信號肽預(yù)測分值、線粒體位置預(yù)測值以及定位于其他位置預(yù)測值的specificity均大于0.95。
圖2 不同植物CP的系統(tǒng)進(jìn)化樹
隨著轉(zhuǎn)錄組測序在不同植物中開展,生物信息學(xué)為功能基因研究提供了便利的手段。本文通過生物信息學(xué)方法對影響10種植物生長的半胱氨酸蛋白酶進(jìn)行分析,發(fā)現(xiàn)CP蛋白分子大小相差不大,GC含量適中(除小麥和水稻略高外),這些會影響植物組織中CP的轉(zhuǎn)錄和翻譯,也會影響基因在體外(簡單原核和真核細(xì)胞中)的表達(dá)[18],進(jìn)而影響其功能。蛋白質(zhì)的理化性質(zhì)會影響其結(jié)構(gòu)和生理功能;糖基化是蛋白質(zhì)的主要修飾手段,影響其在組織或細(xì)胞中的定位與活性,疾病的發(fā)生與其相關(guān)位點的變異有關(guān)[19];蛋白質(zhì)磷酸化修飾能夠調(diào)節(jié)細(xì)胞之間的信號傳導(dǎo),在機(jī)體中影響細(xì)胞的再生和分化[20];酶的二級或空間結(jié)構(gòu)直接決定了其底物的特異性,為酶學(xué)性質(zhì)的研究提供了依據(jù)和理論參考[21]。
大量研究已證明,CP在植物生長過程中參與了抵抗生物脅迫及非生物脅迫等過程。因此,深入探索CP在轉(zhuǎn)錄和翻譯水平上的調(diào)控機(jī)制,可以為今后采用基因手段改良農(nóng)作物的性狀和提高農(nóng)作物的產(chǎn)量提供重要的理論依據(jù)。