賈杏林,鄒亞文,劉思遠,程天印
?
豬附紅細胞體基因的克隆與生物信息學分析
賈杏林,鄒亞文,劉思遠,程天印
(湖南農(nóng)業(yè)大學動物醫(yī)學院,湖南長沙410128)
為研究豬附紅細胞體蛋白質(zhì)的結(jié)構(gòu)與功能,應(yīng)用巢氏PCR技術(shù)克隆出1 011 bp的豬附紅細胞體基因,構(gòu)建系統(tǒng)進化樹并進行生物信息學分析。系統(tǒng)進化樹分析結(jié)果顯示,豬附紅細胞體與小附紅細胞體之間的親緣關(guān)系較近。生物信息學分析結(jié)果顯示,基因編碼336個氨基酸,理論等電點()為6.21,相對分子質(zhì)量為36 745.8,無信號肽和跨膜區(qū),抗原指數(shù)較高,具有較大的免疫原性。蛋白質(zhì)的柔韌性區(qū)域較多,蛋白質(zhì)3D結(jié)構(gòu)顯示為“X”立體結(jié)構(gòu),外周區(qū)域結(jié)構(gòu)松散。
豬附紅細胞體;基因;生物信息學分析;克隆
豬附紅細胞體()屬于支原體科(Mycoplasmataceae)、支原體屬()血營養(yǎng)型支原體,引起的疾病被稱為豬傳染性貧血綜合征(infectiousanaemia in pigs,IAP)[1]。不能在體外進行長期的連續(xù)培養(yǎng),目前僅能在體外連續(xù)培養(yǎng)280 d左右。體外連續(xù)培養(yǎng)方法的缺乏在一定程度上制約著對該病原的深入研究[2]。Guimaraes等[3]和Joern等[4]均于2011年報道了豬附紅細胞體的全基因組序列?;蚓幋a的蛋白質(zhì)是位于表面的一種粘附蛋白,能特異性粘附在紅細胞表面,在侵染宿主機體紅細胞的過程中具有粘附功能,并能引起動物機體強烈的免疫反應(yīng)[5]。本研究中采用巢氏PCR對基因進行克隆,利用生物信息學軟件分析蛋白的抗原性、跨膜區(qū)、信號肽、預(yù)測二級結(jié)構(gòu)等,以期為該蛋白功能的進一步研究提供參考。
1.1樣品與試劑
豬附紅細胞體病原由湖南農(nóng)業(yè)大學動物輸血與血液病研究實驗室保存。2×MasterMix、DL2 000 DNA Marker、DL5 000 DNA Marker購自北京天根生化科技有限公司;PMD19–T載體、大腸桿菌 ()DH5α感受態(tài)細胞、膠回收試劑盒、質(zhì)粒小量提取試劑盒購自南京金斯瑞生物技術(shù)有限公司。
1.2DNA模板的提取與引物設(shè)計
取500 μL豬附紅細胞體培養(yǎng)物,按DNA提取試劑盒操作提取病原的DNA,從GenBank中下載豬附紅細胞體的全基因組序列(登錄號NC_015153.1)與基因的序列(登錄號AM407404.1),使用DNA Star軟件來確定基因在全基因組序列中所在的位置。利用Primer 5.0設(shè)計外引物(F1,5–CA TTCATTATTGGCGACTT–3;R1,5–GCTATTACCT TCAGGCTCT–3),目的基因大小為1 841 bp。用Primer 5.0設(shè)計內(nèi)引物(F2,5–ATGACAATCCACAA AGT–3;R2,5–TTAA AGAGAAATGTAGT –3),目的基因大小約為1 011 bp,引物由南京金斯瑞生物技術(shù)有限公司合成。
1.3巢氏PCR反應(yīng)
第一輪PCR反應(yīng)體系:DNA模板1 μL,2×MasterMix 25 μL,外引物F1、R1各1 μL,加ddH2O至50 μL。反應(yīng)條件為94 ℃預(yù)變性4 min;94 ℃變性30 s,58 ℃退火30 s,72 ℃延伸100 s,35個循環(huán)后總延伸7 min,4 ℃保存。將膠回收試劑盒回收的第1輪PCR產(chǎn)物作為第2輪PCR的模板,隨后進行第2輪PCR反應(yīng)。反應(yīng)體系:第一輪膠回收產(chǎn)物2.5μL,2×MasterMix 25 μL,內(nèi)引物F2、R2各1 μL,加ddH2O至50 μL。反應(yīng)條件為94 ℃預(yù)變性4 min;94 ℃變性30 s,55 ℃退火30 s,72 ℃延伸60 s,35個循環(huán)后總延伸7 min,4 ℃保存。
1.4基因的克隆與鑒定
將第2輪的PCR產(chǎn)物進行回收,于16 ℃與PMD19–T載體進行連接,將連接產(chǎn)物轉(zhuǎn)化進大腸桿菌DH5α,并接種于含氨芐的LB培養(yǎng)板中,篩選出陽性的單克隆菌落,用質(zhì)粒小量提取試劑盒提取質(zhì)粒,送至南京金斯瑞公司進行測序。
1.5基因全長序列的生物信息學分析
在DNA Star的Editseq區(qū)域中將核酸序列轉(zhuǎn)變成氨基酸序列,利用ProParam(http://web.expasy. org/protparam/)分析該蛋白質(zhì)的氨基酸等電點、相對分子質(zhì)量等。用MEGA 6.0構(gòu)建系統(tǒng)進化樹。用SignalP 3.0 Server(http://www.cbs.dtu.dk/services/ SignalP–3.0/)分析預(yù)測信號肽。用ProtScale (http:// web.expasy.org/protscale/)分析該蛋白質(zhì)的疏水性。用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/ TMHMM/)分析蛋白的跨膜區(qū)。采用DNA Star軟件中的Protean功能分析預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)、柔韌性、表面可及性等,結(jié)合IEDB在線分析軟件(http://tools. immuneepitope.org/bcell/)分析抗原表位指數(shù)信息。采用SWISS–MODEL(http:// swissmodel. expasy.org/)與PyMOL軟件預(yù)測蛋白質(zhì)的三級結(jié)構(gòu)。
2.1基因的克隆與鑒定結(jié)果
根據(jù)GenBank中豬附紅細胞體的全基因組序列(登錄號NC_015153.1),發(fā)現(xiàn)基因(登錄號AM407404.1)位于豬附紅細胞體全基因組堿基序列的41 589至42 599處。第1次PCR得到與預(yù)期片段大小相符的條帶(圖1),大小為1 841 bp。第2次PCR得到的目的條帶為1 011 bp(圖2),克隆測序結(jié)果基因長度為1 011 bp,與基因序列(登錄號AM407404.1)的同源性為100%。
M DL 5 000 DNA Marker;1 PCR產(chǎn)物。
M DL 2 000 DNA Marker;1 PCR產(chǎn)物。
2.2系統(tǒng)進化分析
在NCBI數(shù)據(jù)庫中用基因編碼的氨基酸序列進行在線Blast,找出同源性較高的不同種類的支原體,將其序列下載后采用鄰接法構(gòu)建系統(tǒng)進化樹(圖3)。由該系統(tǒng)進化樹可見,豬附紅細胞體與小附紅細胞體()處于同一個分支,親緣關(guān)系較近,并與貓血巴爾通氏體()、溫氏附紅細胞體()、羊附紅細胞體()之間具有一定的相關(guān)性。
2.3豬附紅細胞體蛋白質(zhì)的生物信息學分析
基因的編碼序列是一個完整的開放閱讀框,編碼336個氨基酸,其中,極性氨基酸(M、N、S、Y、C、Q、W、T)96個,占28.6%;非極性疏水性氨基酸(A、F、G、V、P、L、I)156個,占46.4%;堿性氨基酸(R、H、K)45個,占13.4%;酸性氨基酸(E、D)39個,占11.6%。蛋白質(zhì)的原子組成為C1628H2612N450O500S8,相對分子質(zhì)量為36 745.8,理論等電點值()為6.21。正電荷殘基(Arg+Lys)總數(shù)是35,負電荷殘基(Asp+Glu)總數(shù)為39,不穩(wěn)定系數(shù)為25.00,脂肪系數(shù)為102.8,屬于穩(wěn)定性蛋白。
MSG1蛋白質(zhì)無信號肽,無跨膜區(qū),位于膜外。疏水性分析結(jié)果顯示,MSG1蛋白質(zhì)的最小疏水值為–2.25,最大疏水值為2.21。親水區(qū)主要位于50~90、110~120、180~210、260~280、310~350位,疏水區(qū)主要位于25~40、150~180、210~250、285~300位。
2.4二級結(jié)構(gòu)、柔韌性、抗原指數(shù)以及表面可及性分析
二級結(jié)構(gòu)主要由α–螺旋、β–折疊、β–轉(zhuǎn)角與無規(guī)則卷曲構(gòu)成。對二級結(jié)構(gòu)的預(yù)測方法分為Gamier–Robson與Chou–Fasman共2種方法。α–螺旋約占二級結(jié)構(gòu)的30.65%,2種方法預(yù)測α–螺旋的結(jié)果一致的區(qū)域主要集中在51~55、107~~124、201~207、249~255、260~268、272~282位。預(yù)測β–折疊的結(jié)果一致的區(qū)域分布在5~9、12~24、29~35、76~80、181~185、210~215、235~239、285~289、328~336位。Gamier–Robson法預(yù)測β–轉(zhuǎn)角的區(qū)域較少,能見到單個氨基酸,β–轉(zhuǎn)角約占二級結(jié)構(gòu)的11.01%,2種方法預(yù)測β–轉(zhuǎn)角結(jié)果一致的區(qū)域為361–324。無規(guī)則卷曲的分布較分散,約占二級結(jié)構(gòu)的29.17%,出現(xiàn)較長的位點為24~26、70~75、175~179、195~199位。對蛋白質(zhì)骨架的柔韌性進行預(yù)測,柔韌區(qū)域主要分布在50~59、70~78、103~111、143~155、187~204、251~265、289~310位。蛋白質(zhì)的抗原指數(shù)預(yù)測結(jié)果顯示,該蛋白抗原指數(shù)偏高的區(qū)域主要集中在47~70、72~81、85~93、104~112、114~118、128~136、144~156、170~182、188~210、223~236、251~274、285~301、311~319位,抗原指數(shù)平均值為1.044。表面可及性主要存在區(qū)域為130~139、183~205、268~275、315~326位。
2.5三級結(jié)構(gòu)預(yù)測
預(yù)測的氨基酸位置為第5~336位,模擬出該蛋白質(zhì)的3D基本模型如圖4所示。MSG1蛋白質(zhì)的3D結(jié)構(gòu)類似于字母“X”的立體形狀。β–折疊位于蛋白質(zhì)的中心,主要是由疏水性氨基酸構(gòu)成,成為一個疏水中心。無規(guī)則卷曲主要分布在蛋白質(zhì)外部,與蛋白質(zhì)松散的結(jié)構(gòu)有關(guān)。
α–螺旋、β–折疊和無規(guī)則卷曲分別用紅色、黃色、綠色標記。
豬附紅細胞體引發(fā)疾病的前提是能夠粘附在紅細胞表面,而引起粘附的主要蛋白質(zhì)是MSG1。用生物信息學分析基因的序列,并對其結(jié)構(gòu)、編碼蛋白質(zhì)的氨基酸序列、生物學功能等進行分析能為后期的研究提供基礎(chǔ)[6]。親緣關(guān)系分析結(jié)果表明,貓血巴爾通氏體、溫氏附紅細胞體、羊附紅細胞體與豬附紅細胞體的親緣關(guān)系較近,豬附紅細胞體與小附紅細胞體的親緣關(guān)系最近。小附紅細胞體能感染豬群,引起的癥狀與豬附紅細胞體感染豬群后的癥狀相似[7]。上述的支原體都屬于血營養(yǎng)型支原體,宿主不同,因此不同的生存條件引發(fā)進化的方向不一樣[8–9]。
MSG1蛋白沒有信號肽,目前已知該蛋白質(zhì)具有粘附在紅細胞表面的功能,并且還能夠粘附在HeLa細胞、BHK–21、HEK–293上[10]。該蛋白質(zhì)的結(jié)構(gòu)與甘油醛–3–磷酸脫氫酶的結(jié)構(gòu)相似。該蛋白質(zhì)可能參與動物機體的糖代謝,獲取能量用以生存,從而引起動物機體產(chǎn)生低血糖等癥狀[11]。MSG1蛋白質(zhì)沒有跨膜區(qū),分析結(jié)果顯示,該蛋白質(zhì)完全處于膜外,這與其在入侵動物機體時具有的粘附功能相關(guān)。疏水性分析得出,約46.4%的非極性疏水性殘基在蛋白質(zhì)中,疏水性殘基一般位于蛋白質(zhì)內(nèi)部,在蛋白質(zhì)的表面一般為親水殘基。柔韌性指數(shù)較高時,蛋白質(zhì)骨架的可塑性強,這些區(qū)域有利于抗體插入而發(fā)揮作用。蛋白質(zhì)空間結(jié)構(gòu)對蛋白的功能及抗原表位有重要影響。在蛋白質(zhì)的二級結(jié)構(gòu)中,β–轉(zhuǎn)角一般位于蛋白的表面,形成的突起結(jié)構(gòu)有利于與抗體嵌合??梢?,在蛋白質(zhì)的氨基酸序列中,利用生物信息學預(yù)測的結(jié)果的抗原指數(shù)高,具有表面可及性區(qū)域與親水殘基區(qū)域,柔韌性強,這些區(qū)域成為抗體識別抗原表位的可能性高,可為具有生物活性藥物靶向位點的確定提供有利證據(jù)。蛋白質(zhì)的空間結(jié)構(gòu)、空間模型顯示,該蛋白質(zhì)呈“X”立體結(jié)構(gòu),蛋白質(zhì)中心結(jié)構(gòu)相對于外圍結(jié)構(gòu)更加緊密。外圍結(jié)構(gòu)主要以無規(guī)則卷曲為主,這與該蛋白質(zhì)的粘附性質(zhì)關(guān)系密切,有較大的可塑性,從而容易粘附在動物機體細胞表面。
[1] Hoelzle L E.Haemotrophic mycoplasmas:recent advances in[J].Vet Microbiol,2008,130(3/4):215–226.DOI:10.1016/j.vetmic.2007.12.023.
[2] 李曉云,賈杏林,石德時,等.豬附紅細胞體的體外連續(xù)培養(yǎng)[J].畜牧獸醫(yī)學報,2008,39(8):1142– 1146.DOI:10.3321/j.issn:0366–6964.2008.08.024.
[3] Guimaraes A M,Santos A P,SanMiguel P,et al. Complete genome sequence ofand insights into its biology and adaption to an erythrocyte niche[J].PLoS ONE,2011,6(5):e19574.DOI:10.1371/journal.pone. 0019574.
[4] Oehlerking J,Kube M,F(xiàn)elder K M,et al.Complete genome sequence of the hemotrophicstrain KI3806[J].J Bacteriol,2011,193(9):2369–2370.DOI:10.1128/JB.00187–11.
[5] Hoelzle K,Doser S,Ritzmann M,et al.Vaccination with therecombinant adhesion proteinelicits a strong immune response but fails to induce protection in pigs[J].Vaccine,2009,27(39):5376–5382.DOI:10.1016/j.vaccine.2009.06.072.
[6] 張偉,方梅霞,聶慶華,等.豬基因的電子克隆及生物信息學分析[J].湖南農(nóng)業(yè)大學學報(自然科學版),2010,36(6):672–677.DOI:10.3724/SP.J.1238.2010. 00672.
[7] do Nascimento N C,dos Santos A P,Chu Y,et al. Microscopy and genomic analysis ofstrain Indiana[J].Vet Res,2014,45:86.DOI:10.1186/s13567–014–0086–7.
[8] de Morais H A,Guimar?es A M,Vidotto O,et al. Co– infection withand ‘Candidatus’ in three cats from Brazil[J].J Feline Med Surg,2007,9(6):518–520.DOI:10.1016/j.jfms.2007.05.005.
[9] dos Santos A P,Guimaraes A M,do Nascimento N C,et al. Complete genome sequence ofstrain Massachusetts[J].J Bacteriol,2012,194(19):5458–5459.DOI:10.1128/JB.01240–12.
[10] Zhang Y,Zou Y,Ma P,et al.Identification ofinteraction proteins on porcine erythrocytes[J].Arch Microbiol,2015,197(2):277–283.DOI:10.1007/s00203–014–1050–7.
[11] Hoelzle L E,Zeder M,F(xiàn)elder K M,et al.Pathobiology of[J].Vet J,2014,202(1):20–25.DOI:10.1016/j.tvjl.2014.07.023.
Clone and bioinformatics analysis ofprotein gene
Jia Xinglin, Zou Yawen, Liu Siyuan, Cheng Tianyin
(College of Veterinary Medicine, Hunan Agricultural University, Changsha 410128, China)
To investigate the structure and function ofgene of, a 1 011 bp genewas cloned using nested PCR and a phylogenetic tree was constructed, bioinformatics analysis was hence studied. From the results of phylogenetic tree showed that thewas the most homogeneous to the, and from the results of bioinformatics analysis showed that the sequence encoded 336 amino acids. Its isoelectric point and molecular weight were 6 210 and 36 745.8 respectively, and the protein had no signal peptide and transmembrane region, and had higher antigen index and immunogenicity. The protein had lots of flexible regions, and its 3D structure presented as capital letter X, the peripheral structure was looser.
;gene; bioinformatics analysis; clone
S852.6;Q786
A
1007-1032(2016)05-0524-04
2016–01–05
2016–09–02
湖南農(nóng)業(yè)大學博士后基金
賈杏林(1970—),男,湖北天門人,博士,主要從事動物輸血與血液病研究,1376163191@qq.com
投稿網(wǎng)址:http://xb.ijournal.cn
責任編輯:王賽群
英文編輯:王庫