沈清清 ,劉 芳 ,趙 芳 ,張玉潔
(1.文山學(xué)院 環(huán)境與資源學(xué)院,云南 文山 663099;2.文山學(xué)院 化學(xué)與工程學(xué)院,云南 文山 663099)
肌動(dòng)蛋白(actin)是1941年首先在脊椎動(dòng)物骨骼細(xì)胞中發(fā)現(xiàn)并命名的一種蛋白,廣泛存在于真核生物細(xì)胞膜、細(xì)胞質(zhì)和細(xì)胞核中,是細(xì)胞骨架微絲的主要成分,在氨基酸序列組成和長(zhǎng)度上( 374~376個(gè)氨基酸)具有高度保守性[1-4]。長(zhǎng)期以來(lái),人們認(rèn)為細(xì)胞骨架僅存在于真核生物中,然而近十年來(lái)科研人員逐漸在許多種類的原核生物中也發(fā)現(xiàn)了細(xì)胞骨架蛋白,其中MreB蛋白就是一類與細(xì)菌和原核藻類形態(tài)維持密切相關(guān)的蛋白,且該蛋白在氨基酸序列組成、裝配方式和功能等方面都與真核生物肌動(dòng)蛋白具有高度相似性[5-7]。這一發(fā)現(xiàn)推動(dòng)了學(xué)術(shù)界轉(zhuǎn)換角度重新審視肌動(dòng)蛋白的起源以及真核生物與原核生物的進(jìn)化關(guān)系,并成為近年來(lái)的研究熱點(diǎn)。生物大分子蛋白質(zhì)的三級(jí)結(jié)構(gòu)決定蛋白質(zhì)的生物學(xué)功能,因此比較蛋白質(zhì)的三級(jí)結(jié)構(gòu)可以使我們了解蛋白之間的相互作用和進(jìn)化關(guān)系,發(fā)現(xiàn)遠(yuǎn)程同源關(guān)系[8-9]。但是,目前已知的蛋白質(zhì)序列數(shù)據(jù)庫(kù)中,已經(jīng)根據(jù)實(shí)驗(yàn)測(cè)出其結(jié)構(gòu)和功能的蛋白質(zhì)只占其中的小部分,大部分晶體結(jié)構(gòu)尚未解析,因此利用一級(jí)氨基酸序列信息和已知蛋白質(zhì)的空間結(jié)構(gòu)信息來(lái)研究預(yù)測(cè)未知蛋白質(zhì)的空間結(jié)構(gòu),已成為結(jié)構(gòu)生物學(xué)中研究蛋白質(zhì)結(jié)構(gòu)和功能關(guān)系的主要手段[10]。當(dāng)前實(shí)際有效的方法是蛋白質(zhì)同源建模,即根據(jù)模板蛋白將一級(jí)序列轉(zhuǎn)成3D結(jié)構(gòu)的技術(shù)[11-13]。本研究擬采用生物信息學(xué)的手段和方法對(duì)幾種原核MreB蛋白和真核actin蛋白進(jìn)行同源建模,預(yù)測(cè)蛋白的三維結(jié)構(gòu),分析原核MreB蛋白和真核actin蛋白結(jié)構(gòu)相關(guān)性和進(jìn)化關(guān)系,旨在為實(shí)驗(yàn)尚不能攻克的生物細(xì)胞骨架蛋白起源和進(jìn)化問(wèn)題提供一些基礎(chǔ)理論數(shù)據(jù),同時(shí)也為MreB蛋白在系統(tǒng)發(fā)育學(xué)研究中的應(yīng)用奠定理論基礎(chǔ)和參考價(jià)值。
從美國(guó)生物信息中心(National Center for Biotechnology Information,NCBI)蛋白數(shù)據(jù)庫(kù)篩選出來(lái)自于19種細(xì)菌的MreB蛋白和16種真核生物的actin蛋白作為分析材料,選取的蛋白相關(guān)信息見(jiàn)表1。
蛋白數(shù)據(jù)庫(kù)(Rcsb-PDB)檢索獲得有價(jià)值的模板,利用SWISS-MEDOL服務(wù)器進(jìn)行同源建模,獲得蛋白的預(yù)測(cè)模型和相關(guān)參數(shù)。
利用在線工具PROCHECK對(duì)蛋白結(jié)構(gòu)模型進(jìn)行評(píng)估,獲得蛋白模型的氨基酸殘基二面角分布圖(Ramachandran Plot),由圖中相關(guān)參數(shù)評(píng)鑒模型的質(zhì)量等級(jí),確定其可信度與合理性。
利用可視化分析軟件PyMOL疊合比對(duì)預(yù)測(cè)模型,分析蛋白三維結(jié)構(gòu)的構(gòu)象差異。
應(yīng)用序列比對(duì)軟件ClustalX2.0對(duì)表1所列出的蛋白序列進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果用MEGA6構(gòu)建NJ系統(tǒng)進(jìn)化樹。Bootstrap 分析中使用1000次重復(fù)計(jì)算NJ樹的支持率。
表1 MreB蛋白和actin蛋白相關(guān)信息
3.1.1 同源建模模板的篩選
利用SWISS-MODEL對(duì)表1所列35種蛋白全部進(jìn)行了同源建模,發(fā)現(xiàn)該軟件檢索系統(tǒng)為各蛋白建模所篩選出的最佳模板存在一定程度的重復(fù)性,如表2所示,其中SWISS-MODEL為克雷伯氏桿菌屬的肺炎克雷伯氏菌、產(chǎn)酸克雷伯菌、鼻硬結(jié)克雷伯氏桿菌;埃希氏菌屬的大腸桿菌、弗格森埃希菌、赫爾曼埃希菌、傷口埃希菌,氣單胞菌屬的維氏氣單胞菌所選擇的最佳模板均為4czm;為氣單胞菌屬的殺鮭氣單胞菌、嗜水氣單胞菌、豚鼠氣單胞菌和類芽孢桿菌屬的蜂房芽孢桿菌選擇的模板均為4czf;為類芽孢桿菌屬的膠質(zhì)類芽胞桿菌、北方類芽孢桿菌、多粘類芽孢桿菌和乳酸桿菌屬的干酪乳桿菌、短乳桿菌和加氏乳桿菌選擇的模板均為2wus;為真菌中的釀酒酵母、黃曲霉和草酸青霉菌選擇的模板均為1yag;為大變形蟲、向日葵和鞘毛藻選擇的模板均為4efh;為野豬和真蛸選擇的模板均為3b5u;為大豆、大麥、鐵皮石斛和水仙選擇的模板均為3ci5。從以上數(shù)據(jù)可知不同類群的生物可能選擇相同的模板進(jìn)行同源建模,SWISSMODEL系統(tǒng)選擇的模板蛋白與建模蛋白可能屬于不同類群的生物,表明模板與建模蛋白并不存在類群或種屬對(duì)稱性。
表2 同源建模的模板信息
3.1.2 同源建模及質(zhì)量評(píng)估
SWISS-MODEL預(yù)測(cè)系統(tǒng)中,用同一模板構(gòu)建的模型存在相似性較高的特點(diǎn),因此本文僅列出分別 以 4czm、4czf、2wus、4cze、1yag、4efh、2btf和3ci5為模板構(gòu)建的8種生物(每個(gè)類群至少1種)的預(yù)測(cè)模型,結(jié)果如圖1所示,A為肺炎克雷伯氏菌MreB蛋白模型,B為嗜水氣單胞菌MreB蛋白模型,C為多粘類芽孢桿菌MreB蛋白模型,D為嗜酸乳酸桿菌MreB蛋白模型,E為草酸青霉菌actin蛋白模型,F(xiàn)為大變形蟲actin蛋白模型,G為布氏雙尾藻actin蛋白模型,H為大麥actin蛋白模型。
圖2 蛋白氨基酸殘基二面角分布圖
為證實(shí)SWISS-MODEL系統(tǒng)同源建模模型的可靠性,對(duì)圖1中構(gòu)建的模型進(jìn)行PROCHECK質(zhì)量評(píng)估,結(jié)果如圖2所示,A模型的蛋白氨基酸殘基二面角分布圖顯示該模型99.3%的氨基酸殘基落在允許區(qū),其中93.5%落在最適區(qū),5.4%落在附加區(qū),0.4%落在寬容區(qū),剩余0.7%落在非允許區(qū);B模型的蛋白氨基酸殘基二面角分布圖顯示該模型99.6%的氨基酸殘基落在允許區(qū),其中88.7%落在最適區(qū),10.2%落在附加區(qū),0.7%落在寬容區(qū),剩余0.4%落在非允許區(qū);C模型的蛋白氨基酸殘基二面角分布圖顯示該模型100%的氨基酸殘基落在允許區(qū),其中92.8%落在最適區(qū),6.5%落在附加區(qū),0.7%落在寬容區(qū);D模型的蛋白氨基酸殘基二面角分布圖顯示該模型100%的氨基酸殘基落在允許區(qū),其中87.5%落在最適區(qū),11.8%落在附加區(qū),0.7%落在寬容區(qū);E模型的蛋白氨基酸殘基二面角分布圖顯示該模型100%的氨基酸殘基落在允許區(qū),其中92.5%落在最適區(qū),7.5%落在附加區(qū);F模型的蛋白氨基酸殘基二面角分布圖顯示該模型99.7%的氨基酸殘基落在允許區(qū),其中92.2%落在最適區(qū),7.5%落在附加區(qū),剩余0.3%落在非允許區(qū);G模型的蛋白氨基酸殘基二面角分布圖顯示該模型98.8%的氨基酸殘基落在允許區(qū),其中82.8%落在最適區(qū),15.3%落在附加區(qū),0.6%落在寬容區(qū),剩余1.2%落在非允許區(qū);H模型的蛋白氨基酸殘基二面角分布圖顯示該模型100%的氨基酸殘基落在允許區(qū),其中93.8%落在最適區(qū),5.9%落在附加區(qū),0.3%落在寬容區(qū)。以上結(jié)果表明通過(guò)SWISSMODEL構(gòu)建的8個(gè)蛋白模型基本符合立體化學(xué)規(guī)則,有較高的合理性與可靠性,其中A、C、E、F、H模型均屬高質(zhì)量模型(落于最適區(qū)的氨基酸殘基數(shù) >90%)。
8個(gè)模型中A、B、C和D結(jié)構(gòu)比較相似,E、F、G和H結(jié)構(gòu)較為相似,因此A、B、C和D做第一組,E、F、G和H做第二組分別進(jìn)行疊合比對(duì)處理,分別比較兩組存在的差異。結(jié)果如圖3A所示,PyMOL軟件將肺炎克雷伯氏菌、嗜水氣單胞菌、多粘類芽孢桿菌和嗜酸乳酸桿菌的MreB蛋白模型疊合比對(duì)后得出的RMSD值為0.951,4個(gè)蛋白的骨架折疊非常相似,α螺旋和β折疊在數(shù)量和構(gòu)型上都很接近,表明核心結(jié)構(gòu)差別不大,主要在Ⅰ、Ⅱ和Ⅲ表面環(huán)區(qū)空間結(jié)構(gòu)上存在較大差異;如圖2B所示,將草酸青霉菌、大變形蟲、布氏雙尾藻和大麥actin蛋白模型疊合比對(duì)后PyMOL軟件計(jì)算的RMSD值為0.535,4個(gè)蛋白的骨架折疊也非常相似,α螺旋和β折疊在數(shù)量和構(gòu)型上都很接近,主要是Ⅰ表面環(huán)區(qū)空間結(jié)構(gòu)上存在較大差異。另外,第一組模型(圖2A)與第二組模型(圖2B)從大致框架上比較有很多相似的結(jié)構(gòu),特別是核心部位,但周邊蛋白骨架和表面環(huán)區(qū)結(jié)構(gòu)上差異度較大,表明MreB和actin蛋白雖為同源蛋白,氨基酸序列和結(jié)構(gòu)上存在一定相似性,但兩者從三維結(jié)構(gòu)上比較存在特異性差異。
圖3 蛋白晶體結(jié)構(gòu)、同源建模結(jié)構(gòu)的疊合比較
將表1中35種生物的MreB和actin蛋白序列比對(duì)和構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)行系統(tǒng)進(jìn)化分析,結(jié)果如圖4所示,整棵進(jìn)化樹明顯分為兩支,其中19種細(xì)菌同屬于第一分支,而植物、藻類、動(dòng)物和真菌同屬于第二分支。由此表明雖然MreB和actin在氨基酸序列和結(jié)構(gòu)上雖存在相似性,但兩者仍具有顯著的獨(dú)立性,可以比較容易地將真核生物和原核生物分別聚類。MreB蛋白的聚類情況表明克雷伯氏桿菌屬、埃希氏菌屬和氣單胞菌屬親緣關(guān)系較近,而類芽孢桿菌屬和乳酸桿菌屬親緣關(guān)系較近,腸球菌屬與乳酸桿菌屬親緣關(guān)系較遠(yuǎn),這一結(jié)果與張斌等[14]在研究FtsZ蛋白同源性時(shí)獲得的結(jié)果一致。另外圖中還顯示加氏乳桿菌和干酪乳桿菌與類芽孢桿菌屬的親緣關(guān)系比另外兩種乳酸桿菌的親緣關(guān)系較近。actin蛋白是一種非常保守的蛋白質(zhì),各種生物間氨基酸序列的同源性高達(dá)70%~100% ,植物與動(dòng)物之間的氨基酸序列差異在11%~15%,大豆與玉米之間的差異在8%~10%,因此肌動(dòng)蛋白是一種非常適合研究生物進(jìn)化規(guī)律的分子工具。早在1999年國(guó)內(nèi)胡年松等[1]就研究了74種生物共128個(gè)肌動(dòng)蛋白序列,將這些蛋白序列比對(duì)后構(gòu)建了進(jìn)化樹,分析得出肌動(dòng)蛋白進(jìn)化樹能較好的反映真核生物間的進(jìn)化關(guān)系。2012年張珍等[15]利用肌動(dòng)蛋白分析了千里光與其他植物的親緣關(guān)系,發(fā)現(xiàn)千里光與甘草和鷹嘴豆的親緣關(guān)系較近。本研究構(gòu)建的進(jìn)化樹中,肌動(dòng)蛋白actin將表1中16種真核生物分別進(jìn)行了聚類,分出植物、真菌、動(dòng)物3個(gè)分支,均顯示了與傳統(tǒng)分類系統(tǒng)一致的親緣關(guān)系,只有藻類生物聚類不明顯,表明真核藻類actin蛋白的來(lái)源或進(jìn)化分歧可能不同。
圖4 蛋白系統(tǒng)發(fā)育樹分析
1)SWISS-MODEL系統(tǒng)選擇的模板蛋白與建模蛋白可能屬于不同類群的生物,模板與建模蛋白不存在類群或種屬對(duì)稱性。PROCHECK評(píng)估結(jié)果表明,預(yù)測(cè)得到的蛋白模型基本符合立體化學(xué)規(guī)則,有較高的合理性與可靠性,其中大部分屬于高質(zhì)量模型(落于最適區(qū)的氨基酸殘基數(shù)>90%)。
2)用可視化分析軟件PyMOL將蛋白疊合比對(duì),結(jié)果表明MreB蛋白和actin蛋白雖為同源蛋白,氨基酸序列和結(jié)構(gòu)上存在一定相似性,但存在特異性差異。
3)以MreB蛋白和actin蛋白為分子指標(biāo)應(yīng)用MEGA6軟件構(gòu)建的進(jìn)化樹基本能反映與傳統(tǒng)分類系統(tǒng)一致的進(jìn)化軌跡,但在某些細(xì)節(jié)方面顯示出與傳統(tǒng)分類系統(tǒng)相異的親緣關(guān)系。
[1]胡松年,閻隆飛.肌動(dòng)蛋白與真核生物的進(jìn)化[J].動(dòng)物學(xué)報(bào),1999(4): 440-443.
[2]曲東明,韓梅,溫進(jìn)坤.肌動(dòng)蛋白結(jié)合蛋白[J].細(xì)胞生物學(xué)雜志,2007(2):219-224.
[3]劉曦,張少斌,汪澈.植物肌動(dòng)蛋白功能的研究進(jìn)展[J].生物技術(shù)通報(bào),2010(3):13-16.
[4]Reisler E, Egelman E H.Actin Structure and Function :What We Still Do Not Understand[J].Journal of Biological Chemistry,2007(50):36133-36137.
[5]van den Ent F, Johnson C M, Persons L, et al.Bacterial actin MreB assembles in complex with cell shape protein RodZ[J].The EMBO Journal,2010(6):1081-1090.
[6]陳曉燕,汪志平,楊靈勇.原核細(xì)胞骨架蛋白的結(jié)構(gòu)與功能[J].細(xì)胞生物學(xué)雜志,2006(5):699-703.
[7]Hu B, Yang G, Zhao W, et al.MreB is important for cell shape but not for chromosome segregation of the filamentous cyanobacterium Anabaena sp.PCC 7120[J].Molecular Microbiology,2007(6):1640-1652.
[8]郎美娜.蛋白質(zhì)三級(jí)結(jié)構(gòu)比對(duì)方法及其應(yīng)用[D].吉林大學(xué),2009.
[9]趙東明,強(qiáng)小利,劉向榮.一種蛋白質(zhì)結(jié)構(gòu)同源建模的DNA算法[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2009(5):748-752.
[10]陳紅梅,周俊祥.基于同源建模的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法的研究[J].河南科學(xué),2009(9):1108-1110.
[11]秦菠,張博,周艷芬,等.鯽魚GABAARβ3亞基生物信息學(xué)分析與同源建模[J].世界農(nóng)藥,2014(2):27-33.
[12]王世佳,林浩鵬,李升康.擬穴青蟹(Scylla paramamosain)NOS蛋白結(jié)構(gòu)分析及同源建模[J].汕頭大學(xué)學(xué)報(bào):自然科學(xué)版,2013(2):39-44.
[13]陸宗超,王邦平,李振興.褐蝦過(guò)敏原Cra c 8蛋白的結(jié)構(gòu)分析和同源建模[J].食品科學(xué),2012(9):177-181.
[14]張斌,東秀珠.FtsZ蛋白同源性分析在乳酸菌系統(tǒng)學(xué)研究中的應(yīng)用[J].微生物學(xué)報(bào),2005(5):661-664.
[15]張珍,平軍嬌,蔡振鋒,等.千里光肌動(dòng)蛋白基因(Actin)的生物信息學(xué)及功能分析[J].植物研究,2012(5):591-595.