程杏安 葉靜敏 蔣旭紅 劉展眉 胡美英
(1. 仲愷農(nóng)業(yè)工程學院天然產(chǎn)物化學研究所,廣州 510225;2. 華南農(nóng)業(yè)大學昆蟲毒理研究室,廣州 510642)
昆蟲組織蛋白酶,尤其是Cathepsin B類酶,在不同物種中被研究,包括雙翅目,鞘翅目,半翅目,鱗翅目等。在大多數(shù)鞘翅目昆蟲中,組織蛋白酶B是腸內(nèi)的一類蛋白水解酶,屬于木瓜蛋白酶類[1]。大量的研究表明,組織蛋白酶與昆蟲的消化作用、昆蟲的個體發(fā)育、組織分化以及變態(tài)反應密切相關(guān),因此已被考慮為該目害蟲防治的靶蛋白。在某些雙翅目和半翅目昆蟲中,半胱氨酸蛋白酶也是重要的消化蛋白酶[2]。許多研究證實組織蛋白酶參與了昆蟲的胚前期卵子發(fā)生以及卵子發(fā)生過程中某些卵子細胞的退化,蚊子(Culex pipiens pallens)產(chǎn)卵前的卵子細胞解體過程中,出現(xiàn)了Cathepsin B和Cathepsin L的活化[3]。在棉鈴蟲(Helicoverpa armigera)成蟲的脂肪體、卵巢、卵中含有組織蛋白酶B[4-5]。經(jīng)證實蚊子的卵子退化實際上是一種細胞凋亡,也即程序性細胞死亡過程(program cell death,PCD)[6]。這說明組織蛋白酶參與了卵子細胞的程序化死亡。
昆蟲組織蛋白酶通過其蛋白降解活性和維持正常的細胞程序性死亡功能,在昆蟲生長發(fā)育和代謝過程中起著重要的作用。在各種卵生動物中,胚胎發(fā)育處于外源營養(yǎng)缺乏的條件下,因此發(fā)育的胚胎必須從卵儲存物中獲取所需的營養(yǎng),組織蛋白酶作為重要的消化蛋白酶[7],在這一過程中通過分解氨基酸組分高度豐富的卵黃蛋白提供營養(yǎng)物質(zhì)。大量實驗證實,組織蛋白酶通過降解卵黃蛋白為胚胎發(fā)育提供營養(yǎng)物質(zhì),從而參與胚胎發(fā)生過程[8-9]。全變態(tài)昆蟲的變態(tài)發(fā)育是一個包含了大量組織降解與重建的關(guān)鍵發(fā)育事件。此期間,大多數(shù)幼蟲組織逐步被破壞分解,而成蟲組織則從成蟲盤中重新發(fā)育分化形成。棉鈴蟲組織蛋白酶B在成蟲期表達,參與成蟲脂肪的解體,為卵母細胞發(fā)育提供養(yǎng)料,在胚胎發(fā)育中水解卵黃蛋白供給胚胎發(fā)育必需的氨基酸[10]。用抑制劑抑制組織蛋白酶活性,可以擾亂昆蟲的正常代謝、導致昆蟲發(fā)育不正?;蚪K止胚胎發(fā)育,進而殺死蟲體[11-12],達到防治害蟲的目的。因此,組織蛋白酶可以成為害蟲防治的重要靶標蛋白,尤其是Cathepsin B(SCB)這種組織蛋白酶,它們在昆蟲體內(nèi)含量豐富,功能多樣,已在多種昆蟲中被研究,其基因序列被克隆和深入分析,這些研究為進一步探索組蛋白酶的功能奠定基礎(chǔ)。
綜上所述,組織蛋白酶參與昆蟲發(fā)育過程正常的細胞程序性死亡是昆蟲完成變態(tài)發(fā)育所必需的,因此組織蛋白酶可以成為農(nóng)藥作用的新靶標,任何抑制組織蛋白酶活性的化合物都有可能干擾昆蟲正常發(fā)育,研究組織蛋白酶及其與抑制化合物的相互作用,對新農(nóng)藥開發(fā)有重要理論指導意義。本研究以草地貪夜蛾離體細胞Sf9為對象開展研究,克隆組織蛋白酶SCB基因,分析序列特征,再采用分子模擬軟件包以同源建模的方法模擬預測SCB三維結(jié)構(gòu)和活性中心,以及其與對應抑制劑的結(jié)合模式,旨為基于組織蛋白酶靶標的新農(nóng)藥開發(fā)及其作用機理研究奠定基礎(chǔ)。
草地貪夜蛾(Spodoptera frugiperda)Sf9細胞系(中山大學生命科學學院生物防治重點實驗室惠贈)。trans1-T1感受態(tài)細胞和pEASY-T1克隆載體購自北京全式金生物技術(shù)有限公司。ExTaq DNA聚合酶(5 U/μL)、dNTPs(each 15 mmol/L)購自東盛生物公司;凝膠DNA回收試劑盒購自天根生化科技有限公司;DL2000、AMV 反轉(zhuǎn)錄酶(10 U/μL)購自 TaKaRa公司;CA-074me(CA)購自默克公司;EB自北京百泰克生物科技有限公司;質(zhì)粒抽提試劑盒購自天根生化科技有限公司;RNA提取試劑Trizol 購自Invitrogen公司;基因組DNA小樣抽提試劑盒購自碧云天生物技術(shù)研究所;引物合成和測序均由上海英駿生物技術(shù)有限公司完成。其它常規(guī)試劑為分析純試劑;DU-640核酸蛋白檢測儀(Beckman公司);PCR儀(Bio-Red公司);Power Pac1000電泳儀(Bio-Red公司);Tanon-4200凝膠成像系統(tǒng)(上海天能科技有限公司);Discovery Studio 2.1分析軟件購自創(chuàng)藤科技有限公司。
1.2.1 PCR引物的設(shè)計與合成 借助NCBI信息庫的BLAST程序和DNAStar 軟件對NCBI公布的棉鈴蟲(Helicoverpa armigera)、煙夜蛾(Helicoverpa assulta)和甜菜夜蛾(Spodoptera exigua)三種夜蛾科昆蟲Cathepsin B cDNA序列進行輔助分析,發(fā)現(xiàn)三者的ORF序列保守性很強,同源性在90%以上。同時前人研究表明可以利用棉鈴蟲Cathepsin B ORF序列兩端直接設(shè)計引物克隆煙夜蛾Cathepsin B ORF序列[12],本研究中Sf9細胞從草地貪夜蛾(S. frugiperda)分離獲得,而甜菜夜蛾與草地貪夜蛾同屬灰翅夜蛾屬,所以甜菜夜蛾與草地貪夜蛾Cathepsin B基因的同源性應該更高,利用甜菜夜蛾的Cathepsin B ORF序列兩端設(shè)計引物更能直接克隆出草地貪夜蛾的Cathepsin B ORF序列,引物為:SexiCB P1:5'- atggtcgcttcgcgt-3'(正向引物);SexiCB P2 :5'- ttaaacatcaacaag-3'(反向引物)。
1.2.2 RNA和DNA的提取 Sf9細胞總RNA和基因組DNA的提取,cDNA的反轉(zhuǎn)錄合成,均參照對應的試劑盒說明和步驟進行。
1.2.3 SCB ORF序列的克隆與分析 以反轉(zhuǎn)錄合成的Sf9細胞cDNA為模板,利用引物SexiCB P1和SexiCB P2分別進行PCR擴增,反應條件為:95℃預變性 5 min;95℃變性 1 min,54℃退火 1 min,72℃延伸1 min,35個循環(huán)。最后72℃延伸10 min。電泳分析PCR產(chǎn)物,出現(xiàn)一條1 000 bp左右的條帶,DNA回收試劑盒純化PCR產(chǎn)物,產(chǎn)物序列,利用NCBI BLAST程序把測定結(jié)果與甜菜夜蛾的Cathepsin B基因序列進行比對分析,確定目的基因SCB片段序列。
為了獲得SCB基因ORF全長序列,將所獲的PCR產(chǎn)物切膠回收克隆到pEASY-T1克隆載體上構(gòu)建SCB- pEASY-T1重組質(zhì)粒,將重組質(zhì)粒轉(zhuǎn)化到大腸桿菌trans1-T1,挑取陽性克隆先進行菌落PCR鑒定和質(zhì)粒PCR鑒定,確定陽性克隆。把陽性克隆菌液送測序,通過序列比對分析,確定SCB基因ORF全長序列。采用NCBI的BLAST,ClustalX2等生物信息學軟件對SCB ORF序列進行特征分析。
1.2.4 SCB編碼區(qū)內(nèi)含子的確定 根據(jù)已獲得的SCB ORF cDNA序列兩端設(shè)計對應的特異性引物:
SCB P1:5'-ATGGTCGCTTCGCGTGCAAC-3'(正向引物),SCB P2:5'-TTAAACATCAACAAGGAGTG-3'(反向引物)。
以提取的Sf9細胞基因組DNA為模板進行PCR擴增,PCR條帶與基因克隆過程的PCR產(chǎn)物電泳檢測結(jié)果比較,如結(jié)果一致,將PCR產(chǎn)物測序,繼而把基因組DNA為模板的擴增產(chǎn)物序列與SCB ORF進行序列比對,如結(jié)果一致,表明SCB編碼區(qū)沒有內(nèi)含子。
1.2.5 SCB同源建模預測三維結(jié)構(gòu) 同源建模是以已知三維結(jié)構(gòu)的高同源性蛋白為模板,所需模板序列相似度超過30%[13]。步驟包括:(1)模板蛋白的確定:采用BLAST把SCB氨基酸序列在PDB蛋白結(jié)構(gòu)數(shù)據(jù)庫中進行序列相似性搜索,確定用于SCB三維結(jié)構(gòu)建模的同源蛋白。(2)序列聯(lián)配:采用Discovery Studio/Homology軟件包中的Clustal W程序?qū)δ康牡鞍着c模板蛋白序列進行比對[14],然后根據(jù)晶體結(jié)構(gòu)知識手動調(diào)整序列聯(lián)配結(jié)構(gòu),以確定模建蛋白的SCRs(Structural Conserved Regions,結(jié)構(gòu)保守區(qū))和Loop區(qū)。(3)蛋白質(zhì)三維結(jié)構(gòu)的模建和動力學優(yōu)化:在序列比對基礎(chǔ)上,利用軟件包的Homology模塊中的Modeler程序構(gòu)建SCB的三維結(jié)構(gòu)。模建后對各模型以PDF total energy 進行排序,選取能量最低的構(gòu)象作為目的蛋白的初始三維結(jié)構(gòu)。利用軟件包的Standard Dynamics Cascade 程序?qū)CB的初始三維結(jié)構(gòu)模型進行分子力學和分子動力學優(yōu)化,以獲得蛋白更接近其在溶液環(huán)境的構(gòu)象。首先采用最陡下降法(Steepset descent method,SD)對初始結(jié)構(gòu)進行500步的優(yōu)化,然后采用500步的共軛梯度法(Conjugate gradient method,CG)進行能量優(yōu)化。完成上述優(yōu)化后,在300 K的溫度下對模型進行分子動力學模擬[15-16]。(4)蛋白結(jié)構(gòu)合理性評價:為了驗證所模擬和預測的模建蛋白三維結(jié)構(gòu)模型的合理性。采用軟件包中的Profile-3D程序和拉曼圖Ramachandran對分子力學和分子動力學優(yōu)化后的蛋白結(jié)構(gòu)進行合理性評價[17]。
1.2.6 SCB的活性位點分析及其與抑制劑的對接
1.2.6.1 SCB的活性位點分析 應用Discovery Studio軟件包中的Binding Site模塊搜索SCB可能的活性位點,位點分析過程采用CVFF力場。Binding Site模塊提供兩種方法尋找蛋白質(zhì)中可能的活性位點:通過對蛋白質(zhì)表面的幾何形狀分析尋找能與底物結(jié)合的口袋,預測可能的結(jié)合位點;通過對蛋白質(zhì)家族在進化過程中的保守氨基酸進行研究,確定這些氨基酸殘基在三維結(jié)構(gòu)中的位置,預測蛋白質(zhì)的活性位點。
1.2.6.2 SCB與抑制劑的對接 首先應用Discovery Studio軟件包中Builder程序構(gòu)建抑制劑小分子并同時進行能量最小化優(yōu)化。采用Cdock對接程序?qū)⒌鞍着c化合物對接,對接中參數(shù)設(shè)置為對接后配體自動產(chǎn)生10個不同的對接構(gòu)象,采用score ligand pose程序的不同打分函數(shù)對這些構(gòu)象進行評價[18],并采用consensus score 程序?qū)ζ溥M行打分排列[19];蛋白與化合物小分子的最佳對接復合物將由對接能量、氫鍵結(jié)合數(shù)和一致性打分結(jié)果決定。同時,采用軟件包中Calculate Interaction Energy程序進行抑制劑小分子與活性位點每個氨基酸的結(jié)合自由能計算,以確定蛋白與抑制劑小分子對過程中的關(guān)鍵氨基酸。
我國成人患者抗生素相關(guān)性腹瀉危險因素的Meta分析…………………………………………………… 毛 婷等(20):2845
本研究抽提Sf9細胞總RNA,采用1.5%瓊脂糖凝膠電泳檢測RNA,紫外燈下可見到清晰18S rRNA帶型(圖1-A),結(jié)果表明RNA抽提質(zhì)量較好,未發(fā)生明顯降解,再進行RT-PCR反應獲得Sf9細胞總cDNA,以其為模板,利用SexiCB P1和SexiCB P2引物進行擴增(圖1-B),分別獲得1 000 bp左右的片段序列,進行序列測定,序列比對分析發(fā)現(xiàn)所獲的擴增片段與甜菜夜蛾的Cathepsin B基因序列同源性高達90%,表明所獲PCR產(chǎn)物為Sf9細胞即草地貪夜蛾的SCB基因序列。
圖1 Sf9細胞總RNA的瓊脂糖電泳圖(A)和SCB PCR產(chǎn)物瓊脂糖電泳分析圖(B)
挑取SCB- pEASY-T1重組質(zhì)粒轉(zhuǎn)化后的大腸桿菌trans1-T1陽性克隆,進行菌落PCR和質(zhì)粒PCR鑒定均擴增出1 000 bp左右條帶(圖2),表明挑取的克隆為含有重組質(zhì)粒的真陽性克隆。把陽性克隆菌液送測序,將測序結(jié)果與上述目的片段進行比對,結(jié)果一致,即得到SCB基因ORF全長序列。SCB基因ORF為1 026 bp,編碼341個氨基酸。SCB ORF的cDNA全長序列已經(jīng)登錄GenBank,登錄號為HQ110064。
圖2 SCB-pEASY-T1重組質(zhì)粒PCR鑒定
以基因組DNA為模板,分別利用 SCB P1和SCB P2引物進行PCR擴增,由圖3可知,擴增產(chǎn)物均為1 000 bp左右,與基因克隆過程的PCR產(chǎn)物電泳檢測結(jié)果一致。將PCR產(chǎn)物送測序,比對分析發(fā)現(xiàn),基因組DNA為模板的擴增產(chǎn)物與對應的SCB ORF序列一致,表明SCB編碼區(qū)沒有內(nèi)含子。
圖3 SCB PCR產(chǎn)物瓊脂糖電泳分析
用程序SignalP 3.0分析蛋白質(zhì)SCB信號肽剪切位點(圖4),SCB信號肽的最有可能的剪切位點在20到21位之間,預測其蛋白信號肽序列為:MVASRATFVALVCALALASA。蛋白質(zhì)切割信號肽后經(jīng)過簡單的加工過程而成為成熟肽。SCB成熟肽含有321個氨基酸。
圖4 SCB推導的氨基酸序列信號肽預測
SCB氨基酸成分分析結(jié)果(表1)顯示,SCB分別由321個氨基酸組成,蛋白質(zhì)中酸性氨基酸為Asp,在SCB中占蛋白分子量的12.68%,利用頻率為11.53%;堿性氨基酸為Lys,占蛋白分子量的12.23%,利用頻率為9.97%;極性氨基酸為Asn、Cys、Gln、Ser、Thr和Tyr,占蛋白分子量的28.76%,利用率為28.66%;疏水氨基酸為Ala、Ile、Leu、Phe、Trp和Val,占蛋白分子量的29.35%,利用頻率為28.66%。各種氨基酸在同一蛋白質(zhì)組成中利用次數(shù)不一樣,SCB 利用最多的是Gly,利用32次,占蛋白分子量的5.13%,利用頻率為9.97%;其次為Leu,利用25 次,占蛋白分子量的7.95%,利用頻率為7.79%,Met利用最少為3 次,占蛋白分子量的1.11%,利用頻率為0.93%。
用ExPASy Proteomics Server軟件的Kyte-Doolittle法(Window size設(shè)為9)對SCB編碼的氨基酸序列進行親水性分析,結(jié)果(圖5)表明SCB整個蛋白分子呈親水性,但在0線以上的A、B、C、D、E五個區(qū)域表現(xiàn)出較強的親脂性,其中A區(qū)域為信號肽。
表1 SCB編碼蛋白的氨基酸組成
將SCB氨基酸序列在NCBI信息庫中進行同源性搜索,在鱗翅目、鞘翅目、雙翅目、半翅目4個目7個科選出12種昆蟲以及家鼠(Rattus norvegicus)和獼猴(Rhesus monkey)兩種哺乳動物的組蛋白酶Cathepsin B基因氨基酸序列。應用DNAStar軟件對SCB氨基酸序列用Clustal W方法進行一致性比對,結(jié)果見圖7,包括草地貪夜蛾在內(nèi)的15個物種的Cathepsin B氨基酸序列有12個保守的半胱氨酸殘基(Cys,C)位點,而保守性最強的氨基酸殘基為甘氨酸(Gly,G),有23個保守位點,酸性氨基酸(Asp,D)有5個保守位點,另外,Gly是SCB氨基酸序列中含量最豐富的氨基酸。計算各序列的遺傳距離(圖6),可知SCB與甜菜夜蛾的Cathepsin B基因相似度最高,相似度達96.2%,其次與煙夜蛾和棉鈴蟲的相似度也較高,分別為88.8%和88.5%,與半翅目的錐獵蝽(Triatoma infestans)相似度最低為51.2%,與兩個哺乳動物家鼠和獼猴的Cathepsin B基因相似度分別為57.7%和55.2%,高于半翅目昆蟲錐獵蝽。
圖5 SCB氨基酸親脂性分析
根據(jù)距離建立系統(tǒng)進化樹[20]將15個Cathepsin B 基因的氨基酸序列分為四大類(圖8):第1類主要為鱗翅目昆蟲的Cathepsin B,本研究中的SCB也聚到這類,與同屬的甜菜夜蛾Cathepsin B一致性最高。鱗翅目各昆蟲間Cathepsin B相對距離根據(jù)科屬的不同差異較大,同屬距離最近,不同屬或不同科距離較遠。第2類為半翅目,哺乳動物的家鼠和獼猴聚到這類;第3和4類分別為雙翅目和鞘翅目。
2.7.1 SCB二級結(jié)構(gòu)預測 蛋白質(zhì)二級結(jié)構(gòu)是氨基酸序列和三維構(gòu)象之間的橋梁,對蛋白質(zhì)二級結(jié)構(gòu)的預測能得到許多重要的結(jié)構(gòu)信息[21]。SCB 成熟肽氨基酸序列用DNAStar軟件的Garnier-Robson法進行結(jié)構(gòu)預測。由圖9可知,SCB的二級結(jié)構(gòu)主要由19個α螺旋,10個β折疊,32個β轉(zhuǎn)角以及26個不規(guī)則轉(zhuǎn)曲結(jié)構(gòu)組成。
圖6 昆蟲 SCB一致性和差異度矩陣
圖7 昆蟲SCB 氨基酸序列比對
圖8 昆蟲SCB的系統(tǒng)進化樹
圖9 Garnier-Robson方法預測SCB二級結(jié)構(gòu)
圖10 SCB和1MIR氨基酸序列比對結(jié)果
圖11 SCB蛋白溫度(A)和內(nèi)能(B)在500 ps動力學模擬中隨時間變化情況
圖12 SCB三維結(jié)構(gòu)模型(A)和親疏水性三維結(jié)構(gòu)模型(B)
2.7.3 SCB三維結(jié)構(gòu)模型可靠性分析 利用Discovery Studio 軟件的Verify Protein(Profile-3D)程序?qū)σ褬?gòu)建的SCB的三維結(jié)構(gòu)模型進行可靠性分析,圖13-A顯示除了N端和C端(肽鏈兩端的得分與許小于0),兩個模型絕大部分氨基酸殘基的Profile-3D得分都大于0,說明幾乎所有殘基都位于合理位置。為了進一步直觀地對SCB的三維結(jié)構(gòu)模型進行其合理性分析,運用拉曼圖檢測所模擬蛋白結(jié)構(gòu)的合理性。由圖13-B可知,絕大部分氨基酸殘基落在非常合理的藍色區(qū)域內(nèi)。由上述Profile-3D分析和拉曼圖分析表明構(gòu)建的SCB的三維結(jié)構(gòu)的二面角分布和立體構(gòu)象均較為合理,符合立體化學φ、ψ二面角分布的要求。
圖13 SCB三維模型的Profile-3D分析(A)和拉曼圖分析(B)
使用Discovery Studio 軟件包中的Binding Site 程序?qū)CB 三維結(jié)構(gòu)進行可能活性位點搜索,得到15個結(jié)合位點。選取軟件中排列在第1位的作為最佳活性位點用于下一步的模擬對接。采用軟件包中的Cdock程序進行SCB與抑制劑(CA)的模擬對接,對接后每個抑制劑將產(chǎn)生10個與蛋白結(jié)合的不同構(gòu)象,根據(jù)程序?qū)Σ煌瑯?gòu)象的打分評價,選出最優(yōu)構(gòu)象。SCB與CA對接后形成的最優(yōu)復合物結(jié)構(gòu)模型。由圖14-A可知,SCB結(jié)合口袋比較淺,形狀不規(guī)則、袋口較寬。不同化合物結(jié)構(gòu)不相同,進入蛋白活性中心后,與活性中心位點相互作用的氨基酸,以及作用強弱、作用方式等也不同,本研究對CA與SCB活性位點的相互作用進行模擬。由圖14-B可知,CA與SCB活性位點的ILE5、VAL23等多個氨基酸相互作用,其中分別與VAL23和ASN24形成兩個氫鍵。由此可見CA和與SCB具有較強的相互作用。
蛋白與不同化合物形成的復合物中起主要作用的氨基酸殘基可能不同。本研究計算了抑制劑分子CA與SCB對應蛋白酶活性位點中單個氨基酸殘基的相互作用能。根據(jù)這個相互作用能,進一步確定SCB與CA分子相互作用的關(guān)鍵氨基酸殘基。由表2可知CA與SCB活性位點單個氨基酸殘基相互作用的能量包括:總相互作用能、范德華力相互作用能和靜電相互作用能(表中只顯示總能量小于-0.5 kcal/mol的氨基酸殘基)。CA與SCB活性位點的ARG19、VAL23、ASN24有較強的相互作用,是關(guān)鍵的氨基酸,總作用能分別為-11.43、-9.22、-8.67 kcal/mol,3個殘基對復合物形成的貢獻最大,且均主要表現(xiàn)為靜電相互作用能,其中VAL23、ASN24與CA形成氫鍵。
圖14 CA與SCB對接復合物(A)和CA與SCB活性位點的結(jié)合模式(B)
研究蛋白質(zhì)的結(jié)構(gòu)是了解蛋白質(zhì)的生物學功能的重要途徑。氨基酸序列對蛋白質(zhì)構(gòu)象起著決定性的作用,很多同源性的氨基酸序列就可以決定同一蛋白構(gòu)象,這是蛋白質(zhì)三維結(jié)構(gòu)預測的理論基礎(chǔ)[22]。目前研究蛋白質(zhì)空間結(jié)構(gòu)方法包括X射線晶體衍射技術(shù)和核磁共振技術(shù)[23]均屬于生物學實驗方法,它們能夠準確測定蛋白三維結(jié)構(gòu),但同時也存在許多技術(shù)難點,使得測定進度性對于大量未知蛋白來說顯得十分緩慢。為了加快新蛋白質(zhì)的結(jié)構(gòu)測定及其與化合物的相互作用方式,當前通過PDB蛋白結(jié)構(gòu)信息庫中搜索已知結(jié)構(gòu)的同源蛋白質(zhì)作為模板,利用同源建模軟件對新蛋白進行結(jié)構(gòu)建模是最為常用且有效的一種蛋白質(zhì)結(jié)構(gòu)預測方法[22]。隨著生物信息學的快速發(fā)展及其在生物學研究中的突出作用,蛋白質(zhì)同源模建技術(shù)已經(jīng)成為一種可靠性高且被廣泛認可的蛋白結(jié)構(gòu)預測技術(shù)。任何一對氨基酸序列長度大于80的蛋白質(zhì),如果兩者的序列同源性超30 %,則可認為它們具有相似的三維結(jié)構(gòu),即蛋白質(zhì)的基本折疊相同[24]。本研究中克隆的組織蛋白酶基因SCB的ORF,編碼區(qū)能夠分別編碼321個氨基酸,在PDB數(shù)據(jù)庫中搜索發(fā)現(xiàn)蛋白1MIR與SCB的氨基酸序列同源性高達60%以上。因此符合蛋白同源建模的條件,可以以1MIR為模板分別對SCB的三維結(jié)構(gòu)模型進行預測。
表2 CA與SCB氨基酸殘基的相互作用
有關(guān)組織蛋白酶的結(jié)構(gòu)分析及其與化合物相互作用的機理,在各種物種中做了較多的研究。晶體學分析結(jié)果表明錐蟲Cathespin B在Pro93和Leu94斷裂形成成熟蛋白,而且在N端活性位點之前還有16 個額外的氨基酸殘基。錐蟲Cathespin B與抑制劑CA-074[25]相互作用形成的復合物結(jié)構(gòu),以人類 Cathepsin B(1GMY),老鼠 Cathepsin B(1CTE)and 斑馬Cathepsin B(1F2A),作為模板蛋白用MODELLER[26]同源建模技術(shù)以及MODELLER分析替換技術(shù)進行了分析研究。CA-074通過與Cathespin B結(jié)合位點的氨基酸殘基Gly165、Gys122等形成多個氫鍵而牢固結(jié)合與Cathespin B,同時大量的疏水氨基酸殘基在S2位點上提供結(jié)合能。有研究還發(fā)現(xiàn)錐蟲Cathespin B活性位點有一個橫跨的‘occluding loop’結(jié)構(gòu),在Cathepsin L同源物rhodesain上沒有發(fā)現(xiàn)這個結(jié)構(gòu),這與‘occluding loop’是Cathespin B區(qū)別Cathepsin L類組織蛋白酶特征的觀點一致[27-28],然而該研究發(fā)現(xiàn)錐蟲Cathespin B的‘ occluding loop’ 結(jié)構(gòu)比哺乳動物的Cathespin B多3個氨基酸殘基,而且在His 194 and His195之間形成一個雙重構(gòu)造。這些區(qū)別的發(fā)現(xiàn)對設(shè)計錐蟲組織蛋白酶專一性抑制劑類藥物,防治錐蟲病很有意義的。本研究用Discovery Studio同源建模軟件對SCB蛋白與其對應抑制劑CA的相互作用模式進行模擬,結(jié)果表明SCB結(jié)合口袋比較淺,形狀不規(guī)則、袋口較寬。結(jié)合能預測發(fā)現(xiàn)CA與SCB活性位點的ARG 19、VAL 23、ASN 24有較高的相互作用能,是關(guān)鍵的氨基酸。這些研究對進一步運用生物實驗手段研究其結(jié)構(gòu)和功能,為設(shè)計和開發(fā)昆蟲組織蛋白酶類抑制劑殺蟲劑有重要意義。
本研究克隆獲得草地貪夜蛾Cathepsin B基因ORF序列,該基因的ORF為1 026 bp 的片段,編碼341 個氨基酸。同源建模預測該組織蛋白酶的三維結(jié)構(gòu),確定其折疊成緊密而穩(wěn)定的球狀結(jié)構(gòu),含6 個二硫鍵。分子對接模擬表明該酶活性中心的ARG19、VAL23和ASN24為關(guān)鍵氨基酸殘基,以氫鍵與抑制劑分子為結(jié)合。
[1] Li Y, Wang K, Xie H, et al. Cathepsin B cysteine proteinase is essential for the development and pathogenesis of the plant parasitic nematode Radopholus similis[J]. International Journal of Biological Sciences, 2015, 11(9):1073-1087.
[2]Cristofoletti PT, Ribeiro AF, Deraison C, et al. Midgut adaptation and digestive enzyme distribution in a phloem feeding insect, the pea aphid Acyrthosiphom pisum[J]. Journal of Insect Physiology,2003, 49(1):11-24.
[3]Uchida K, Ohmori D, Ueno T, et al. Preoviposition activation of cathepsin-like proteinases in degeneratingovarian follicles of the mosquito Cuxel pipiens pallens[J]. Developmental Biology, 2001,237(1):68-78.
[4]徐夏蓮, 趙小凡, 王金星. 棉鈴蟲組織蛋白酶B組織分布與合成部位研究[J]. 動物學研究, 2001, 22(3):242-245.
[5]羅梅, 董章勇, 賓淑英, 等. 扶桑綿粉蚧組織蛋白酶B基因的克隆、原核表達和不同發(fā)育階段表達分析[J]. 昆蟲學報,2012, 55(3):276-283.
[6]Uchida K, Nishizuka M, Ohmori D, et al. Follicular epithelial cell apoptosis of atretic of follicles within developing varies of the mosquito Cuxel pipiens pallen[J]. Journal of Insect Physiology,2004, 50(10):903-912.
[7]Cristofoletti PT, Ribeiro AF, Deraison C, et al. Midgut adaptation and digestive enzyme distribution in a phloem feeding insect, the pea aphid Acyrthosiphon pisum[J]. Insect Physiol, 2003, 49(1):11-24.
[8] Cho WL, Tsao SM, Hyas AR. Mosquito cathepsin B-like Protease involved in embryonic degradation of vitelin is produced as alatent extraovarian precursor[J]. Journal of Biochemistry, 1999, 274(19):13311-13321.
[9]Zhao XF, An XM, Wang JX, et al. Expression of the Helicoverpa cathepsin B like proteinase during embryonic development[J].Archives of Insect Biochemistry and Physiology, 2005, 58(1):39-46.
[10]張新昌, 劉楊, 王金星, 等. 從大豆中純化棉鈴蟲組織蛋白酶B 抑制因子 HCB-SoyI[J]. 昆蟲學報, 2005, 48(6):849-853.
[11]Luo M, Dong ZY, Bin SY, et al. Molecular cloning, prokaryotic expression and expression at different developmental stages of cathepsin B gene in mealybug Phenacoccus solenopsis Tinsley(Hemiptera:Pseudococcidae)[J]. Acta Entomologica Sinica,2012, 55(3):276-283.
[12]趙艷艷, 劉建兵, 羅梅浩, 等. 煙夜蛾組織蛋白酶B酶原基因的克隆、序列分析和原核表達[J]. 昆蟲學報, 2008, 51(11):1121-1128.
[13]林春嬌, 楊立榮, 徐剛, 等. R-2-鹵代酸脫鹵酶的同源模建及底物對映體選擇性研究[J]. 生物技術(shù)通報, 2011, 0(10):191-198.
[14]張乃心, 張玉娟, 余果, 等. 雙翅目昆蟲線粒體基因組結(jié)構(gòu)特點及其測序通用引物的設(shè)計和應用[J]. 昆蟲學報, 2013, 56(4):398-407.
[15]馮磊, 花慧, 邱麗穎, 等. 白藜蘆醇靶點蛋白質(zhì)的研究[J].生物技術(shù)通報, 2009(8):128-133.
[16]朱威, 張蓮芬, 雷楗勇, 等. 羥喜樹堿結(jié)合肽的研究[J]. 生物技術(shù)通報, 2009(1):126-129.
[17]吳玲, 何佩勛, 孫磊, 等. G蛋白偶聯(lián)受體81同源建模及其與二羥基苯甲酸對接研究[J]. 化學研究與應用, 2017, 29(6):841-846.
[18] Ruvinsky A, Watson C. Intron Phase Patterns in Genes:Preservation and Evolutionary Changes[J]. Open Evolution Journal,2007, 107(1):1-14.
[19]Teramoto R, Fukunishi H. Supervised Consensus Scoring for Docking and Virtual Screening[J]. Journal of Chemical Information & Modeling, 2007, 47(2):526.
[20]滕飛翔, 崔玉寶. 昆蟲AQPs系統(tǒng)進化樹構(gòu)建及分析[J]. 西南農(nóng)業(yè)學報, 2013, 26(6):2642-2647.
[21]李任峰, 田香勤, 何啟蓋, 等. 大腸桿菌P4 FliC蛋白結(jié)構(gòu)分析及同源建模[J]. 生物技術(shù)通報, 2010, 0(10):143-148.
[22]鄧海游, 賈亞, 張陽. 蛋白質(zhì)結(jié)構(gòu)預測[J]. 物理學報, 2016,65(17):169-179.
[23]樊盛博, 吳妍潔, 楊兵, 等. 蛋白質(zhì)結(jié)構(gòu)與相互作用研究新方法——交聯(lián)質(zhì)譜技術(shù)[J]. 生物化學與生物物理進展, 2014(11):1109-1125.
[24]Gunasekaran K, Nussinov R. How different are sttiructurally flexible and rigid binding sites? Sequence and structural features discriminating proteins that do and do not undergo conformational change upon ligand binding[J]. Journal of Molecular Biology,2007, 365(1):257-273.
[25]Xu M, Yang L, Rong JG, et al. Inhibition of cysteine cathepsin B and L activation in astrocytes contributes to neuroprotection against cerebral ischemia via blocking the tBid-mitochondrial apoptotic signaling pathway[J]. Glia, 2014, 62(6):855-880.
[26] Webb B, Sali A. Comparative protein structure modeling using MODELLER[J]. Current Protocols in Protein Science, 2014, 47(5, 6):1-32.
[27] Sajid M, McKerrow JH. Cysteine proteases of parsitic organisms[J]. Molecular and Biochemical Parasitology, 2002, 120(1):1-21.
[28] Abdulla MH, Lim KC, Sajid M, et al. Schistosomiasis mansoni:novel chemotherapy using a cysteine protease inhibitor[J]. PLoS Medicine, 2007, 4(1):e14.