張俊令,彭雪輝,2,王富強,徐平,2
1 軍事科學院軍事醫(yī)學研究院 生命組學研究所 蛋白質(zhì)組學國家重點實驗室 國家蛋白質(zhì)科學中心 (北京) 北京蛋白質(zhì)組研究中心,北京 102206
2 武漢大學 藥學院 組合生物合成和藥物開發(fā)教育部重點實驗室,湖北 武漢 430071
蛋白質(zhì)不僅是細胞的主要組成成分,也是生物學功能的主要執(zhí)行者。蛋白質(zhì)組學是系統(tǒng)鑒定、定量蛋白質(zhì)及其翻譯后修飾形式,并研究這些蛋白質(zhì)生物學功能的新興學科。隨著質(zhì)譜技術的快速發(fā)展,基于質(zhì)譜的蛋白質(zhì)組學方法已經(jīng)成為生命科學和健康醫(yī)學研究中不可或缺的工具[1]。
鳥槍法是基于質(zhì)譜的蛋白質(zhì)組學最常用的研究策略。其技術流程是先將蛋白質(zhì)組樣品經(jīng)位點特異性蛋白酶消化形成肽組,再進行高效液相色譜分離和質(zhì)譜檢測。其中位點特異性蛋白酶的研發(fā)和使用是高效蛋白質(zhì)組學技術發(fā)展的前提和基礎[2]。
隨著蛋白質(zhì)組研究的迅速發(fā)展,新的特異性蛋白酶陸續(xù)被開發(fā),多組合酶切方法的建立促進了蛋白質(zhì)組深度覆蓋鑒定技術的發(fā)展,也進一步提升了翻譯后修飾位點鑒定的效率[3-4]。
胰蛋白酶 (Trypsin) 是蛋白質(zhì)組學研究中最常用的蛋白酶,可以高效、特異地切割賴氨酸和精氨酸的C端。由于賴氨酸和精氨酸在蛋白質(zhì)序列中分布較廣,蛋白質(zhì)樣品經(jīng)Trypsin消化后可產(chǎn)生平均長度為14個氨基酸殘基并以堿性氨基酸結(jié)尾的肽段[3,5-8]。這些肽段的羧基端的賴氨酸或精氨酸殘基上以及氨基端分別帶有一個正電荷[9],使得它們在離子阱中碰撞誘導解離(Collision-induced dissociation,CID) 時產(chǎn)生b、y類型(y離子為主)的離子碎片,便于被質(zhì)譜有效檢測[9-11]。因此,胰蛋白酶貢獻了目前蛋白質(zhì)組數(shù)據(jù)庫中絕大部分的數(shù)據(jù)[3]。
絲氨酸蛋白酶LysC可特異性地切割賴氨酸的C端,對多種變性劑,如即使高達8 mol/L的尿素,都具有較好的耐受性,因此,LysC經(jīng)常被用于Trypsin處理之前的消化,可提高Trypsin的消化效率[4],從而實現(xiàn)蛋白質(zhì)組的高效鑒定。
同屬絲氨酸蛋白酶的GluC能特異切割天冬氨酸和谷氨酸的C端,但其酶切特異性受制于反應緩沖液的pH值和組成成分[3,12]。在碳酸氫銨和醋酸銨緩沖液中,該酶對谷氨酸殘基的酶切特異性高達80%左右,而對天冬氨酸殘基的酶切特異性僅占8%左右;而在磷酸鹽緩沖液中,谷氨酸和天冬氨酸殘基均可被酶切。GluC 用于多組合酶切可以有效縮短那些不含賴氨酸和精氨酸肽的長度,使之更容易被檢測,從而有效提高蛋白質(zhì)鑒定的覆蓋度。
ArgC則是一種半胱氨酸蛋白酶,可以特異性地切割精氨酸的C端。此外,該酶還可以低效切割賴氨酸的C端。因此,ArgC的酶切特異性較差[13],經(jīng)常用于多組合酶切,從而提高蛋白質(zhì)鑒定的覆蓋度[14]。
胃蛋白酶 (Pepsin) 屬天冬氨酸蛋白酶,傾向于切割芳香族氨基酸 (酪氨酸、苯丙氨酸和色氨酸) 的C端,它在低pH (pH 1–4)下活性最高,對于二硫鍵的質(zhì)譜解析非常有利[4]。
糜蛋白酶 (Chymotrypsin),又叫胰凝乳蛋白酶,可以切割疏水性氨基酸 (苯丙氨酸、酪氨酸、亮氨酸、色氨酸和甲硫氨酸等) 的C端,可用于膜蛋白的跨膜區(qū)域的鑒定。但是,由于該酶的酶切位點為多種疏水性氨基酸而容易導致過多的漏切[4]。
同屬絲氨酸蛋白酶的野生型和突變型α-溶解性蛋白酶 (α-lytic protease,WaLP/MaLP) 可以特異性地切割脂肪族氨基酸的羧基端,因此,WaLP/MaLP可以用于膜蛋白的鑒定。但是,由于酶切位點太多,消化產(chǎn)生的肽段較隨機,會影響蛋白質(zhì)組學實驗數(shù)據(jù)的重復性[4,15]。
另外,在結(jié)構(gòu)蛋白質(zhì)組學研究中,非特異性的蛋白酶K (Proteinase K) 被應用于交聯(lián)肽的結(jié)構(gòu)解析[16];在膜蛋白的鑒定中,利用蛋白酶K消化產(chǎn)生的重疊肽幫助鑒定共價修飾 (磷酸化和甲基化)[17]。
除這些C端蛋白酶外,越來越多的N端蛋白酶被發(fā)現(xiàn)和應用。如金屬蛋白酶AspN,可以特異性地切割天冬氨酸的N端或谷氨酸的N端。同屬金屬蛋白酶的LysN則特異地切割賴氨酸的N端。而賴氨酸精氨酸N端蛋白酶 (LysargiNase) 是一種鋅離子依賴的金屬蛋白酶,可以特異性地切割賴氨酸和精氨酸的N端。
這些切割特異位點的N端蛋白酶與對應的C端蛋白酶,如 LysC/LysN[18]、GluC/AspN[4]、Trypsin/LysargiNase[19]可以產(chǎn)生除末端氨基酸殘基之外中間位置的氨基酸順序一致的肽段[20],因此被形象地稱為鏡像酶。在質(zhì)譜檢測時,N端蛋白酶酶切產(chǎn)生的肽段中堿性氨基酸殘基位于N端,使得電荷主要集中分布在肽段的N端,因此,在CID/HCD碎裂模式下形成的譜圖具有比y系列離子更強的b系列離子峰,與普通C端蛋白酶消化肽段得到的y離子峰較強的特性形成互補,成對使用可以提高碎片離子的覆蓋度,實現(xiàn)所鑒定肽段的完整測序[20]。
其中,最近發(fā)現(xiàn)、鑒定的胰蛋白酶的鏡像酶——LysargiNase表現(xiàn)出較高的酶切特異性和活性,與Trypsin組合使用顯示了廣泛的應用前景,因此,文中對其特點及應用進行綜述。
LysargiNase的發(fā)現(xiàn)源于對人妊娠相關血漿蛋白A (Pregnancy-associated plasma protein A,PAPP-A)的研究。PAPP-A是metzincin部落(Metzincin clan) 中的一員,也稱為pappalysin-1或IGFBP-4蛋白酶,是一種高度糖基化的170 kDa的多結(jié)構(gòu)域蛋白酶,特異性切割胰島素樣生長因子結(jié)合蛋白 (IGFBPs)。Tallant等通過生物信息學檢索分析,從古菌嗜乙酸甲烷八疊球菌Methanosarcina acetivoransC2A 中鑒定了一個新的可能的PAPP-A,將其命名為“ulilysin”[21]。
通過對ulilysin和pappalysin的底物特異性和活性的研究,Tallant等發(fā)現(xiàn)ulilysin可以特異地切割賴氨酸和精氨酸的N端[22-23]。2015年Huesgen等根據(jù)ulilysin的酶切位點特異性將其名稱改為LysargiNase[19]。由于LysargiNase的酶切位點與Trypsin成鏡像,因此,也稱之為胰蛋白酶鏡像酶。
在嗜乙酸甲烷八疊球菌中,LysargiNase以酶原形式表達,由342個氨基酸組成,分子量大小為40 kDa。在Ca2+的介導下,LysargiNase酶原(Pro-LysargiNase) 可以在Arg61和Ala322兩個位點發(fā)生自切,從而產(chǎn)生有活性的29 kDa成熟的LysargiNase (Arg61–Ala322)[21]。
LysargiNase是唯一一個被發(fā)現(xiàn)的古菌pappalysin,與人類PAPP-A具有序列相似性,均屬于金屬蛋白酶中的鋅金屬蛋白酶超家族(Zincins superfamily) 中的 metzincin部落(Metzincin clan)。該部落中的蛋白酶都包含一個鋅結(jié)合共有序列 (Zinc-binding consensus sequence,ZBCS) HEXXHXXGXXH/D (X代表20種氨基酸中的任何一種)。該序列提供了3個鋅配體殘基(由3個或2個組氨酸和1個天冬氨酸組成) 和作為廣義堿 (General base) 的谷氨酸殘基,具有高度保守性[21]。此外,該部落蛋白在鄰近活性中心特定位置還有一個含甲硫氨酸的1,4-β-轉(zhuǎn)角,稱之為甲硫氨酸轉(zhuǎn)角 (Met turn),甲硫氨酸轉(zhuǎn)角在結(jié)構(gòu)和空間上具有保守性,且對于酶結(jié)構(gòu)的完整性和功能的發(fā)揮是不可缺少的[24]。Metzincin部落的命名也源于此特性。Metzincin部落已有多個家族成員,如蝦紅素astacins、ADAMs4/adamalysins、serralysins、matrix metalloproteinases (MMPs)、leishmanolysins、snapalysins和 pappalysins,它們均已有其蛋白質(zhì)結(jié)構(gòu)信息,為深入研究這些蛋白的功能創(chuàng)造了條件[25-29]。
根據(jù)這些蛋白質(zhì)結(jié)構(gòu)預測,metzincin部落成員具有相似的骨架結(jié)構(gòu)和活性位點。利用鋅結(jié)合蛋白家族蛋白酶的序列和結(jié)構(gòu)相似性,預測LysargiNase (Arg61–Ala322) 的二級結(jié)構(gòu)主要包括8個β鏈 (β-strand) (β1、β2、β3、β4、β5、β6、β7、β8)和5個α螺旋 (α-helix) (α1、α2、α3、α4、α5),其三維結(jié)構(gòu)為橢球狀分子[21]。
LysargiNase分子可被鋅離子結(jié)合位點即活性位點分為兩部分。其中,一部分是富含規(guī)則的二級結(jié)構(gòu)的蛋白質(zhì)N端亞結(jié)構(gòu)域 (NTSD,Arg61–Asn235),另一部分為具有不規(guī)則二級結(jié)構(gòu)的蛋白質(zhì)C端亞結(jié)構(gòu)域 (CTSD,Leu236–Ala322)。NTSD是通過強烈扭曲的 β1從分子的背面進入,主要是5個平行的β折疊片;CTSD起始于Leu236,并具有可作為兩個鄰近鈣結(jié)合位點的支架[24]。
LysargiNase活性位點裂縫的頂部由NTSD的反平行鏈β7 (其反向平行于結(jié)合的肽底物) 和β5–β6帶構(gòu)成,其中,β5–β6帶遠離活性位點裂縫的區(qū)域用來調(diào)節(jié)填裝進去的底物殘基。裂縫底部由CTSD內(nèi)的Tyr237–Trp240、Pro265–Gly268、甲硫氨酸轉(zhuǎn)角 (Met turn) 及其后的4個殘基(Asn288–Asp295) 的片段組成[23]。起催化作用的鋅離子通過溶劑分子和ZBCS中的His228、His232和His238的N原子形成四面體配位嵌入活性位點α4中。
控制LysargiNase活性的開關是2個鈣離子[24]。它們的結(jié)合位點位于LysargiNase的CTSD中。當鈣離子缺失時,LysargiNase是無活性的;當鈣離子存在時,該酶的結(jié)構(gòu)才能被固定,并具有特異的酶切活性。
LysargiNase可特異地切割賴氨酸和精氨酸的N端,酶切特異性高達92%,而且與Trypsin類似,酶切活性略傾向于賴氨酸殘基 (K∶R約52%∶40%)[19]。由于LysargiNase的酶切特點,可以產(chǎn)生N端帶堿性氨基酸殘基 (K/R) 的肽段,這種肽段的正電荷都位于其N端,因此,胰蛋白酶鏡像酶消化的肽段在CID和HCD碎裂模式下產(chǎn)生以b離子為主的碎片離子,而在ETD碎裂模式下產(chǎn)生以c離子為主的碎片離子[20]。不僅如此,LysargiNase消化產(chǎn)生的肽段在碎裂時也易產(chǎn)生a離子,這些a離子可增加肽段鑒定的可信度[19]。
LysargiNase還可切開多種翻譯后修飾,如甲基化、對稱或不對稱的二甲基化修飾的賴氨酸或精氨酸殘基的N端,呈現(xiàn)出一定的二位、三位的羧肽酶活性。但LysargiNase無法切開乙酰化修飾的賴氨酸殘基[19],這為該酶的結(jié)構(gòu)改造和穩(wěn)定性研究指明了方向。
LysargiNase的特性研究顯示了與Trypsin有很好的互補性,因此Trypsin/LysargiNase的聯(lián)合使用或許可以彌補各自單獨使用的缺陷,為解決質(zhì)譜蛋白質(zhì)鑒定中的系列難題提供廣闊的應用前景。
蛋白質(zhì)羧基端的氨基酸序列及其修飾狀態(tài)影響著蛋白質(zhì)的生物學功能,在多種生物學過程中發(fā)揮重要作用。例如,許多生物活性肽羧基端的α-酰胺化可以中和羧基的負電荷,從而提高其與受體的結(jié)合能力,增強結(jié)合的穩(wěn)定性[30]。因此蛋白質(zhì)羧基端結(jié)構(gòu)解析至關重要[31-32]。
在基于質(zhì)譜的蛋白質(zhì)組學研究中,傳統(tǒng)的Trypsin可以特異性地切割賴氨酸和精氨酸的C端,產(chǎn)生C端帶堿性氨基酸的肽段,但這使得蛋白質(zhì)的羧基端肽段缺乏堿性氨基酸從而易產(chǎn)生一價離子,不能被質(zhì)譜檢測。LysargiNase可特異地切割賴氨酸和精氨酸的N端,產(chǎn)生N端帶堿性氨基酸的肽段,這一特點可有效促進蛋白質(zhì)羧基端肽段的鑒定。質(zhì)譜檢測發(fā)現(xiàn),Trypsin消化的MDA-MB-231細胞裂解物中鑒定到39個蛋白質(zhì)C端肽段,占肽段總鑒定量的0.9%;而在LysargiNase消化的MDA-MB-231細胞裂解物中鑒定到了70個蛋白C端肽段,占肽段總鑒定量的2.1%,是胰蛋白酶的2倍[19]。因此,利用LysargiNase可實現(xiàn)蛋白質(zhì)C端蛋白質(zhì)組學深度覆蓋。
2015年Overall等[19]研究發(fā)現(xiàn),LysargiNase可在Trypsin基礎上將磷酸化位點的覆蓋度提高23%。有意思的是LysargiNase更有利于鑒定到RXS和RXXSP等類型的motif。而這一類motif正是PKC、ERK和CDK5等激酶識別的底物[33]。2017年Heck等關于LysargiNase的研究表明,ETD碎裂模式可將LysargiNase酶切后的產(chǎn)物二級譜鑒定率由20%提高到41%。他們分別利用Trypsin和LysargiNase鑒定到12 280個和6 686個磷酸化位點,但其中僅有3 852個位點被共同鑒定,LysargiNase單獨鑒定到2 834個磷酸化位點,使得磷酸化位點的鑒定量提高了18.7%。對這些位點的深入分析發(fā)現(xiàn),LysargiNase對某些位點的鑒定具有偏好性,如RB1的S788 和Y813位點只能被LysargiNase鑒定到,不能被Trypsin鑒定到[20]。
我們實驗室的研究發(fā)現(xiàn),LysargiNase酶切后鑒定的磷酸化肽段與Trypsin具有很強的互補性。因此用它來提高磷酸化蛋白質(zhì)組覆蓋度的同時,也能夠提供新的磷酸化motif和位點信息 (Peng,X et al.未發(fā)表數(shù)據(jù))。
蛋白質(zhì)甲基化是一種重要的翻譯后修飾,主要發(fā)生在精氨酸和賴氨酸殘基上。蛋白質(zhì)的甲基化修飾參與多種細胞過程,包括信號轉(zhuǎn)導、mRNA剪接、轉(zhuǎn)錄控制、DNA修復和蛋白質(zhì)易位等。精氨酸的甲基化主要有ω-NG-單甲基精氨酸(MMA)、ω-NG,NG-不對稱二甲基精氨酸 (aDMA)和ω-NG,NG-對稱二甲基精氨酸 (sDMA) 3種形式[34]。賴氨酸的甲基化主要有ε-N-單甲基賴氨酸、ε-N-二甲基賴氨酸或ε-N-三甲基賴氨酸3種類型[35-36]。蛋白質(zhì)甲基化的失調(diào)通常與各種疾病狀態(tài)相關,包括癌癥[37-38]、心血管和肺部疾病[37]、神經(jīng)退行性疾病[39-41]等。因此,對于蛋白質(zhì)甲基化修飾的鑒定有助于相關疾病的診療。
在翻譯后修飾蛋白質(zhì)組學研究中,胰蛋白酶(Trypsin) 對于被修飾的賴氨酸和精氨酸殘基會產(chǎn)生漏切,從而影響甲基化位點的鑒定[11,42]。而LysargiNase可以切割甲基化修飾的賴氨酸和精氨酸,比Trypsin切割甲基化賴氨酸的能力高出7倍左右[19]。另外,LysargiNase還可以切割精氨酸的3種甲基化形式,而Trypsin只能切割未修飾的精氨酸[1]。Ma等[43]利用LysargiNase和Trypsin的組合酶切,將甲基化位點的鑒定量在傳統(tǒng)的Trypsin消化基礎上提高了80%,且LysargiNase消化產(chǎn)生的甲基化肽段表明其切割可能更傾向于某些特定motif,例如RG、RGG等。
LysargiNase與Trypsin的互補性可用于提高甲基化位點的鑒定量,促進表觀遺傳學的研究和甲基化修飾相關疾病的研究。
雖然LysargiNase與Trypsin相比,在鑒定翻譯后修飾方面有較好的優(yōu)勢和補充,但是,實驗數(shù)據(jù)顯示LysargiNase的肽段和蛋白鑒定量略低于Trypsin[17],而鏡像酶的成對使用對兩個酶的活性、位點特異性等提出了更高的要求。因此,要想使LysargiNase和Trypsin組合的使用發(fā)揮更好的作用,可能需要根據(jù)LysargiNase的結(jié)構(gòu)和活性特點對其進行改造。
蛋白質(zhì)及其翻譯后修飾鑒定技術的發(fā)展得益于位點特異性蛋白酶的開發(fā)和性能的改善。以LysargiNase為代表的鏡像酶的開發(fā)及其在蛋白質(zhì)組學研究中的應用,不僅促進了傳統(tǒng)蛋白質(zhì)組學中難鑒定的C端蛋白質(zhì)組研究,提升了蛋白質(zhì)組研究的技術水平,而且已為多種蛋白質(zhì)翻譯后修飾鑒定研究提供了強有力的技術支持。隨著對LysargiNase性質(zhì)認識的不斷深化、樣品制備技術的改進以及質(zhì)譜技術的發(fā)展,針對LysargiNase開發(fā)出更加高效甚至全新的鑒定策略,必然會進一步推動蛋白質(zhì)組學深度覆蓋鑒定和定量技術的進步,為深入探究蛋白質(zhì)在生命活動中的功能奠定堅實的技術基礎。