李岱容,穆柳青,張春燕,楊 春
(1.重慶醫(yī)科大學附屬第一醫(yī)院 呼吸科, 重慶 400016;2.重慶醫(yī)科大學 病原微生物教研室, 重慶 400016)
結核分枝桿菌(mycobacteriumtuberculosis, MTB)引起的結核病是重要的傳染病,隨著耐藥和泛耐藥菌株增多,結核病仍然給人們的生命健康帶來了巨大的威脅[1]。目前結核桿菌的診斷與治療均存在很多的難點,急需新的診斷指標與治療靶點。ATP依賴的Clp蛋白酶系統(tǒng)是重要的酶系統(tǒng),參與調節(jié)體內蛋白質代謝,清除不可逆損傷蛋白,對外應激耐受及維持內環(huán)境的穩(wěn)態(tài)。MTB具有自身特殊的Clp蛋白酶系統(tǒng),含有多個Clp亞基: ClpP1、ClpP2、ClpB、ClpC1、ClpC2、ClpX[2]。目前MTB的Clp蛋白酶中除ClpP1、ClpC1外,其余亞單位的結構功能仍然未有文獻對其詳細闡述[3-4]。由于MTB生長緩慢,具有高致病性,實驗條件苛刻,本文應用生物信息學的方法,重點對ClpC2亞單位的保守性及其生物學作用進行分析,希望能從中得到更多的信息,為結核桿菌的診斷和治療提供新的靶點。
1.1 多重序列比對和進化樹構建 首先在NCBI數(shù)據(jù)庫中查找MTB的標準菌株H37Rv的clpC2基因核苷酸序列,用NCBI的BLAST程序搜索其同源生物序列。使用 ClustX 2.0版軟件進行多重序列比對,序列對齊后再加以人工檢查。進化樹使用MEGA5.1軟件的鄰接歸并法(Neighbor-Joining Method, NJ)構建,Kimura兩參數(shù)模型(Kimura′s two-parameter),自展檢驗(bootstrap analysis)重復1 000次?;诜种U菌16s rRNA基因進化樹的構建也采用上述同樣的方法進行。
1.2 種內及種間進化分歧 運用MEGA5.1軟件包中的Kimura′s two-parameter模式對分枝桿菌屬16s rRNA和clpC2基因序列進行分析后,計算種內及種間進化分歧。
1.3 ClpC2保守結構域與二級結構的預測 從NCBI下載ClpC2的序列后,提交序列至http://swissmodel.expasy.org網(wǎng)站預測ClpC2 的保守結構域與二級結構[5]。
1.4 ClpC2蛋白酶的基本生物信息學分析 應用ExPASy的ProtParam對ClpC2氨基酸序列進行氨基酸數(shù)量、分子量、等電點、氨基酸組成及親水性等基本理化性質的分析。應用PSORTb version 3.0.0分析蛋白質的亞細胞定位。蛋白質信號肽預測采用SignalP,參數(shù)選取革蘭氏陽性菌和隱馬爾可夫模型(HMM)。ProtScal分析重組蛋白質的疏水性。應用Gene ontology(GO)在線軟件對ClpC2蛋白酶的功能進行分析(見表1)。
表1生物信息學分析網(wǎng)址
程序 應用網(wǎng)址ProtParam理化性質分析http://www.expasy.ch/tools/protparam.html/PSORTb亞細胞定位預測http://www.psort.org/ProtScal疏水性分析http://www.expasy.org/tools/protscale.html/SignalP信號肽預測http://www.cbs.dtu.dk/services/SignalP/Geneontology(GO)蛋白功能預測http://www.ebi.a(chǎn)c.uk/ego/
1.5 跨膜分析 用TMHMM2.0 在線工具對ClpC2的氨基酸序列跨膜進行預測分析。
2.1 clpC2基因核苷酸序列分析及進化樹構建 庫中所有的分枝菌屬的16s rRNA 和clpC2基因同源序列分別構建的系統(tǒng)進化樹(見圖1)。與16s rRNA基因相比,clpC2基因在分枝桿菌不同種之間的相似性降低,進化距離明顯變大,明顯分為兩個大群。從圖1B中可見,結核分枝桿菌復合群菌株(M.africanum,M.canettii,M.tuberculosis,M.bovis等)聚為一族,然而在非典型分枝桿菌中同源性低,在麻風桿菌中該同源基因缺如,總的平均進化距離為0.59,高于16s rRNA的總的平均進化距離(0.17)。
2.2 16s rRNA和clpC2同源基因之間的基因距離 雖然,clpC2基因與16s rRNA基因相比,進化距離明顯變大,分枝桿菌不同種之間的相似性降低,但是,我們從表2中看出,clpC2在結核分枝桿菌復合群中基因距離幾乎沒有差距(0.00~0.01),顯示clpC2在結核分枝桿菌復合群中高度同源,非常保守,而在其他分枝菌屬中則呈現(xiàn)出不同的進化距離,明顯高于16s rRNA的基因距離。
2.3 保守結構域的預測 經(jīng)由Interproscan預測,ClpC2 的結構特征是具有兩個Clp-氨基末端結構域(Clp-N)和一個Double Clp-N 基序(見圖2)。Clp-N結構域序號為PF02861,分別位于第110與162、183與233位aa之間,與ClpA 和 ClpB蛋白氨基端同源,雖然這些域的功能不肯定,但是可以形成蛋白的結合位點[6]。Double Clp-N 基序序號為IPR023150,位于97與230位aa之間。Double Clp-N 基序可見于ATP依賴的Clp蛋白酶的N端,這個N端域可以與AAA(+)蛋白配體結合域D1相互作用[7]。
注:用Clustal X 軟件作多重序列比對后,進化樹采用neighbor-joining法用MEGA 5.1軟件構建而成,評估方法為Bootstrap法。標尺的一個刻度代表0.1的進化距離,節(jié)點旁的數(shù)值表示1000 次重復中Bootstrap值的百分數(shù)??偟钠骄M化距離分別為0.17(見圖1A)、0.59(見圖1B)。圖1 基于16s rRNA(A)和clpC2基因(B)核苷酸序列的分枝桿菌的系統(tǒng)進化樹
圖2 預測的結核分枝桿菌ClpC2蛋白結構域
表2 H37Rv菌中16s rRNA和clpC2基因與其他分枝桿菌屬同源基因之間的基因距離
Species16srRNAclpC2M.tuberculosis?0.000.00M.a(chǎn)fricanum?0.000.00M.bovis?0.000.00M.canettii?0.000.01M.sp.0.000.25M.ulcerans0.010.24M.marinum0.011.08M.a(chǎn)vium0.010.24M.paratuberculosis0.010.24M.vanbaalenii0.041.07M.intracellulare0.020.24M.gilvum0.040.40M.indicus0.020.25M.smegmatis0.041.06M.liflandii0.991.08
注:*為結核分枝桿菌復合群的成員。
2.4 二級結構預測 將ClpC2序列上傳到SWISS-MODEL服務器,對其進行二級結構預測。結果表明ClpC2具有螺旋(helix)和卷曲(coil)兩種折疊結構,在兩個Clp-N功能域部分,彼此肽鏈的折疊差異很小,預示著高度保守的二級結構與功能的穩(wěn)定有著緊密的聯(lián)系。
2.5 ClpC2蛋白基本信息預測結果 ClpC2分子量26.6kD,理論等電點5.54,ProtParam預測ClpC2蛋白酶的總平均疏水值 (Grand Average of Hydropathy,GRAVY)為-0.122,為親水性蛋白。PSORTb version 3.0.0 亞細胞定位預測ClpC2在細胞質表達(亞細胞定位分數(shù):cytoplasmic 9.97)。SignalP預測ClpC2不是信號肽。G O 分析表明ClpC2具有水解、參與蛋白代謝、ATP-結合、肽酶活力功能,由此推知ClpC2應具有水解和催化功能,對細菌的代謝過程起作用,從而影響細菌的生理,在這些過程中需要消耗能量ATP。
2.6 跨膜分析 TMHMM2.0 軟件分析結果表明,對ClpC2蛋白未形成跨膜結構域(見圖3)。
圖3 結核分枝桿菌ClpC2蛋白跨膜分析
1998年結核分支桿菌基因組測序的完成標志著人類與MTB的斗爭進入到一個新的階段[8],每個可能的藥物靶子和可用于疫苗設計的保護性抗原均可能從基因組序列中檢索。生物信息學是生物學與計算機科學及應用數(shù)學等學科相互交叉而形成的一門新興學科,利用生物信息學方法尋找新的基因或蛋白質已有一定的基礎,可以大大的節(jié)約時間和精力。
蛋白酶一直被認為是致病微生物的重要毒力因子。細菌可以通過ATP依賴的蛋白酶Clp系統(tǒng)調節(jié)其蛋白質水平及活性,以幫助細菌適應環(huán)境,從而進行生長、繁殖、轉移等生命活動,進而引起各種感染性疾病[9]。作為一類高度保守并廣泛存在的熱休克蛋白,ATP依賴的蛋白酶Clp系統(tǒng)可幫助其他蛋白質進行正確折疊、修復、降解、復合物形成、運輸?shù)?,從而影響細胞的生命活動,因此倍受科學家們的關注。
結核分枝桿菌Clp酶含有6個Clp亞單位:ClpB、ClpC1、ClpC2、ClpP1、ClpP2、ClpX。文獻已經(jīng)報道了ClpP1、ClpP2、ClpX、ClpC1等幾個亞單位具有重要的功能,是生物的生理調控和蛋白質量控制所必需的,與結核分枝桿菌的致病性和在單核細胞、巨噬細胞中的持留性相關[10-12]。而對于ClpC2等亞基,到現(xiàn)在為止,蛋白的空間結構尚未解析出來,且對其在MTB致病中的作用,相關文獻所提供的信息也很少。
clpC2基因又名clpx’,編碼ClpC2單體蛋白,在結核分枝桿菌中,每個單體都為252個aa,基因功能未知,是假想的ATP結合亞單位。本研究經(jīng)過核苷酸的多重序列分析,發(fā)現(xiàn)clpC2在結核分枝桿菌復合群中保守性非常高,而在其他非結核分枝桿菌中的同源性低,在麻風分枝桿菌中該同源基因缺如。
結構域是蛋白質中具有進化保守性的一段氨基酸序列,同時也是分子相互作用過程中發(fā)揮重要作用的結構和功能的區(qū)域。本研究發(fā)現(xiàn)ClpC2 的結構特征是具有兩個Clp-N結構域和一個Douple Clp-N 基序。Clp-N結構域是Clp蛋白酶和Dnak/DnaJ分子伴侶的亞單位[6],Douple Clp-N基序與AAA(+)蛋白配體結合域D1相互作用,含有ClpA/ClpB家族、ClpC超家族所有的基序特征,歸屬于ClpA/ClpB家族和ClpC超家族。因此推測ClpC2同ClpA、ClpB功能相似,應該是Clp蛋白酶系統(tǒng)的調節(jié)亞基。
隨著人類基因組計劃的開展,在基因結構、定位、表達和功能研究等方面都積累了大量的數(shù)據(jù),如何充分利用這些已有的數(shù)據(jù)資源,加速人類基因克隆研究,同時避免重復工作,節(jié)省開支,已成為一個急迫而富有挑戰(zhàn)性的課題擺在我們面前。本文通過生物信息學預測,獲得了ClpC2蛋白的許多基本信息:ClpC2蛋白為親水性、非跨膜蛋白、在細胞質內表達,推測該蛋白可能作為分子伴侶具有穩(wěn)定細胞內蛋白質量的作用。此外,由于具有水解和催化功能,可能還對細菌的代謝過程起作用,影響細菌的生理。由于這些過程中需要消耗能量,因而該蛋白仍然是一個依賴于ATP的Clp亞單位,可能是潛在的抗結核藥物的作用靶點。
本研究通過對clpC2基因的信息學預測,為后續(xù)深入研究ClpC2蛋白的生物學功能、驗證ClpC2作為藥靶的候選蛋白的可行性提供基礎資料。另外本文還發(fā)現(xiàn)clpC2基因的進化距離明顯大于16s rRNA基因,且在結核分枝桿菌復合群中高度保守,在其他分枝桿菌的種間保守性相對較差,因而該基因還可用于鑒別結核分枝桿菌和非結核分枝桿菌。
[參考文獻]
[1] World Health Organization. Global Tuberculosis Control: Surveillance P, Financing. WHO Report.(2010) http://www.who.int/tb/publications/global_report/2010/en/index.html.
[2] Ribeiro-Guimar?es M L, Pessolani M C.Comparative genomics of mycobacterial proteases[J].Microb Pathog, 2007,43(5-6):173-178.
[3] Ollinger J, O′Malley T, Kesicki EA ,et al. Validation of the essential ClpP protease in Mycobacterium tuberculosis as a novel drug target[J].J Bacteriol, 2012,194(3):663-668.
[4] Schmitt E K, Riwanto M, Sambandamurthy V, et al. The natural product cyclomarin kills Mycobacterium tuberculosis by targeting the ClpC1 subunit of the caseinolytic protease[J].Angewandte Chemim (International Ed. In English), 2011,50(26):5889-5891.
[5] Zdobnov E M,Apweiler R. InterProScan-an integration platform for the signature-recognition methods in InterPro[J].Bioinformatics,2001,17: 847-848.
[6] Barnett M E,Zolkiewska A,Zolkiewski M.Structure and activity of ClpB from Escherichia coli:Role of the amino-and carboxyl-terminal domains[J].J Biol Chem, 2000,275(48):37565-37571.
[7] Guo F, Maurizi M R , Esser L , et al. Crystal structure of ClpA, an Hsp100 chaperone and regulator of ClpAP protease[J].The Journal of biological chemistry, 2002,277(48) :46743-46752.
[8] Cole S T, Brosch R, Parkhill J, et al. Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence[J].Nature,1998, 393(6685):537-544.
[9] Kajfasz J K, Martinez A R, Rivera-Ramos I, et al. Role of Clp proteins in expression of virulence properties of Streptococcus mutans[J].J Bacteriol,2009,191(7):2060-2068.
[10] Raju R M, Unnikrishnan M, Rubin D H, et al.Mycobacterium tuberculosis ClpP1 and ClpP2 function together in protein degradation and are required for viability in vitro and during infection[J].PLoS Pathog, 2012,8(2):e1002511.
[11] Kar N P, Sikriwal D, Rath P,et al.Mycobacterium tuberculosis ClpC1: characterization and role of the N-terminal domain in its function[J].Febs J, 2008,275(24):6149-6158.
[12]Dziedzic R, Kiran M, Plocinski P, et al.MycobacteriumtuberculosisClpX interacts with FtsZ and interferes with FtsZ assembly[J].PLoS One, 2010,5(7):e11058.