李 娜 蔡潭溪 楊福全**
(1)中國科學(xué)院生物物理研究所,北京 100101;2)中國科學(xué)院大學(xué),北京 100049)
低分子量蛋白與多肽(low molecular weight proteins and peptides,LMWPs)通常指復(fù)雜生物樣本中分子質(zhì)量≤30 ku 的所有蛋白質(zhì)及多肽,也被稱作多肽組。LMWPs 是繼基因組、轉(zhuǎn)錄組及蛋白質(zhì)組之后,更復(fù)雜的一種分子組合,造成其復(fù)雜程度如此高的原因主要有:a.體內(nèi)具有多種蛋白酶(超過550種)[1];b.底物多樣性,即同種酶有多種底物;c.體內(nèi)存在多種蛋白酶抑制劑和激活劑。在龐大的蛋白酶調(diào)節(jié)網(wǎng)絡(luò)中,體內(nèi)上百萬的蛋白質(zhì)變體(proteoforms)可產(chǎn)生數(shù)量巨大的酶解產(chǎn)物[2]。血漿作為循環(huán)系統(tǒng)的一部分,不僅可以協(xié)助細(xì)胞、組織或器官之間進行物質(zhì)交換,還可以攜帶大量來源不同的多肽、蛋白質(zhì)及其降解物等,而LMWPs以其分子質(zhì)量較小的優(yōu)勢,可通過血腦屏障、腫瘤等從組織或病灶進入血漿。與血漿蛋白相比,LMWPs 的組成或豐度差異與疾病的相關(guān)性更強[3]。因此,血漿LMWPs 可用于病理生理的探究、生物標(biāo)志物的挖掘、治療靶點的發(fā)現(xiàn)等。此外,通過血漿LMWPs也可以發(fā)現(xiàn)新的分子并進一步探究其功能,例如新型活性肽[4]以及小開放閱讀框編碼的多肽(sORF?encoded peptides,SEPs)。本文立足于當(dāng)前的研究熱點,綜述LMWPs的分類(圖1)及其應(yīng)用,以期為血漿LMWPs的研究與發(fā)展提供參考。
血漿中常見的完整小蛋白包括激素、白介素、趨化因子、生長因子和干擾素等,它們可參與調(diào)控細(xì)胞生長、增殖、分化、炎癥、組織修復(fù)和免疫反應(yīng)等多種重要生物學(xué)過程,在腫瘤治療[5]、造血功能障礙[6]、自身免疫性疾?。?]等方面具有廣闊的應(yīng)用前景。近年來,完整小蛋白的研究熱點是表征樣本中的蛋白質(zhì)變體,即來自同一基因所有形式的蛋白質(zhì)分子的集合,包括由遺傳變異、RNA 轉(zhuǎn)錄本選擇性剪接和翻譯后修飾(post?translational modifications,PTMs)引起的各類變化[8]。不過,隨著分子質(zhì)量增加,蛋白質(zhì)的離子化效率降低、質(zhì)譜信號抑制作用與擴散作用增強,使得譜圖解析更加困難,從而阻礙了完整蛋白質(zhì)的檢測[9]。因此,在組學(xué)水平表征血漿中小蛋白的完整序列是一件充滿挑戰(zhàn)性的工作。
Fig.1 The classify of plasma LMWPs圖1 血漿LMWPs的組成
大部分LMWPs 是由蛋白質(zhì)經(jīng)酶解作用產(chǎn)生的多肽組成。根據(jù)催化機理,蛋白酶可分為5 大類,包括天冬氨酸類、半胱氨酸類、絲氨酸類、金屬蛋白酶類和其他類。在哺乳動物體內(nèi),蛋白酶可選擇性地切割特定的蛋白質(zhì)底物,以影響細(xì)胞的行為、存活和死亡[10]。研究發(fā)現(xiàn),它們在腫瘤中的功能更加復(fù)雜與多樣[11?12]。轉(zhuǎn)移性癌癥的多種特征是蛋白酶活性發(fā)生變化直接導(dǎo)致的結(jié)果。蛋白酶通過介導(dǎo)蛋白質(zhì)、細(xì)胞外基質(zhì)降解過程來影響腫瘤細(xì)胞侵入間質(zhì)、血管生成和轉(zhuǎn)移;級聯(lián)蛋白水解相互作用控制著細(xì)胞凋亡,癌細(xì)胞在其發(fā)展為惡性腫瘤的過程中必須逃脫該調(diào)控過程;蛋白酶通過特異性裂解前體蛋白來激活其他蛋白酶或信號分子,如激酶和細(xì)胞表面受體,控制信號在腫瘤細(xì)胞與其他細(xì)胞之間進行傳導(dǎo)。腫瘤中失調(diào)的蛋白酶可改變LMWPs的分子組成,而這些LMWPs不同于高分子質(zhì)量蛋白質(zhì),易分泌至細(xì)胞外間質(zhì),通過血管屏障最終釋放到循環(huán)系統(tǒng)中。Li 等[3]研究發(fā)現(xiàn),與健康對照相比,羧肽酶N(carboxypeptidase N,CPN)在乳腺腫瘤組織中的表達(dá)水平上調(diào),但在血漿中的含量沒有顯著變化。不過其催化產(chǎn)物C3f_R1310?L1319在血漿中的含量顯著增加,且該增加主要與早期乳腺癌相關(guān),表明腫瘤微環(huán)境中失調(diào)的蛋白酶催化而產(chǎn)生的多肽片段可在血漿中被檢測到,且含量與腫瘤早期的病理變化有相關(guān)性,提示蛋白降解物可作為疾病早期的診斷標(biāo)志物。
在神經(jīng)元之間傳遞信號的一類多肽被稱為神經(jīng)肽。神經(jīng)肽來源于前體蛋白質(zhì),以一種受調(diào)控的方式釋放,并通過與細(xì)胞表面的G蛋白偶聯(lián)受體或酶偶聯(lián)受體(如胰島素受體)結(jié)合,在中樞和周圍神經(jīng)系統(tǒng)中發(fā)揮作用。它們作用的靶點包括神經(jīng)元、膠質(zhì)細(xì)胞或非神經(jīng)元靶細(xì)胞,如腺體或肌細(xì)胞[13]。不同于經(jīng)典的神經(jīng)遞質(zhì),這些神經(jīng)肽生理功能的調(diào)節(jié)不是通過特定的突觸再攝取機制實現(xiàn),而是通過降解機制實現(xiàn)。它們不僅在神經(jīng)元中表達(dá),也在大腦其他類型細(xì)胞(如膠質(zhì)細(xì)胞)和外周組織細(xì)胞(如內(nèi)分泌細(xì)胞)中表達(dá)[14],影響著廣泛的生理過程,包括進食、體重調(diào)節(jié)、晝夜節(jié)律、睡眠、疼痛、恐懼、焦慮、學(xué)習(xí)和記憶,以及獎勵機制等[15]。中國肥胖人群隊列研究顯示,神經(jīng)肽Y(neuropeptide Y,NPY)在血清中的含量增加與代謝異常型肥胖(metabolically unhealthy obesity,MUO)表型存在正相關(guān)性[16],且NPY過表達(dá)可導(dǎo)致轉(zhuǎn)基因小鼠出現(xiàn)肥胖表型和胰島素抵抗[17],表明NPY 與肥胖相關(guān),提示神經(jīng)肽在血液循環(huán)中的含量變化可作為評價生理功能失調(diào)程度的指標(biāo)。此外,值得注意的是,根據(jù)人類基因組分析,100多個G 蛋白偶聯(lián)受體的配體未知[18],因此識別特定細(xì)胞、組織或體液中與G 蛋白偶聯(lián)受體結(jié)合的配體,可用于新型神經(jīng)肽的發(fā)現(xiàn)[19]。
免疫多肽組指由主要組織相容性復(fù)合體(MHC)分子(在人類中稱為人類白細(xì)胞抗原,HLA)呈遞到細(xì)胞表面的所有多肽。其中,部分呈遞到細(xì)胞表面的HLA 分子及其結(jié)合的多肽被釋放到血漿中,形成血漿可溶性HLA 多肽組(soluble HLA?peptidome,sHLA)。sHLA 與呈遞到細(xì)胞表面的膜多肽組(membranal peptidomes,mHLA)類似,均由細(xì)胞蛋白質(zhì)降解產(chǎn)生的多肽組成[20]。當(dāng)處于病理狀態(tài)時,細(xì)胞產(chǎn)生并降解疾病相關(guān)的蛋白質(zhì),然后將降解產(chǎn)生的多肽呈遞出來,因此HLA 多肽組可作為癌癥免疫治療靶點候選物來源之一[21]。此外,正常情況下,HLA 多肽組在人體內(nèi)保持相對穩(wěn)定,但在特定疾病影響下,細(xì)胞會向血漿中釋放比正常狀態(tài)下更多的sHLA 分子,所以血漿sHLA與疾病嚴(yán)重程度相關(guān),可用于疾病潛在生物標(biāo)志物的挖掘[22]。Shraibman 等[23]通過對142 份多形性膠質(zhì)母細(xì)胞瘤(glioblastoma multiforme,GBM)患者血漿樣本的sHLA 和其中10例腫瘤樣本的mHLA進行大規(guī)模質(zhì)譜鑒定分析,發(fā)現(xiàn)無論是分子組成還是含量sHLA和mHLA均有較強的相關(guān)性。此外,經(jīng)過數(shù)據(jù)庫篩選,作者也提供了多個GBM 早期診斷的潛在生物標(biāo)志物(如僅在GBM 中檢測到的來自SOX11 的多肽AHSASEQQL和NFSDLVFTY)以及免疫治療的潛在靶點(如來自ETV5的6條多肽)。這強有力地說明,在癌癥生物標(biāo)志物和免疫抑制劑候選物篩選中,血漿sHLA 研究意義重大。總之,系統(tǒng)表征HLA多肽組有助于診斷、預(yù)防和治療感染性疾病、自身免疫病和癌癥等。
相較于其他類型的多肽,sHLA 多肽在富集技術(shù)上更具有優(yōu)勢,它們主要是利用HLA?A/B/C 單克隆抗體(W6/32)進行富集純化,該方法簡單且高效。
血漿中蛋白質(zhì)濃度的高動態(tài)范圍是限制血漿蛋白質(zhì)組及LMWPs研究的重要因素之一,例如白蛋白(albumin)是血漿中豐度最高的蛋白質(zhì),含量高達(dá)50 g/L,遠(yuǎn)大于細(xì)胞因子等低豐度蛋白質(zhì)的含量(ng/L),嚴(yán)重阻礙了LMWPs 的發(fā)現(xiàn)與檢測。因此,在富集和提取血漿LMWPs時,去除被視為“污染蛋白”的高豐度蛋白質(zhì)是實驗方法中的首要步驟。不過,白蛋白具有多種功能,包括維持血漿滲透壓,作為脂蛋白、小分子和藥物的載體等,同時,因分子質(zhì)量高于腎臟過濾和清除功能的界限,白蛋白成為LMWPs 常見的天然循環(huán)載體。Mehta等[24]在其研究中提出了以下幾個發(fā)現(xiàn)與觀點:a.LMWPs 在循環(huán)載體蛋白上的累積極大地放大了潛在生物標(biāo)志物在血漿中的總濃度;b.血漿LMWPs 的濃度主要由載體蛋白而非其本身清除速率決定;c.與特定載體蛋白結(jié)合的LMWPs可能包含重要的診斷信息。隨后,許多研究人員將焦點轉(zhuǎn)向載體蛋白結(jié)合的LMWPs,試圖分析載體蛋白結(jié)合的LMWPs 與各類疾病之間的關(guān)系,包括卵巢癌[25]、子宮內(nèi)膜癌[26]、阿爾茨海默?。?7]、腦卒中[28]、酒精濫用[29]等。例如,Kikuchi等[26]在研究子宮內(nèi)膜癌患者和健康對照的血清白蛋白結(jié)合的多肽時,發(fā)現(xiàn)3 種多肽(m/z4769、6254 和11792)的質(zhì)譜信號強度在兩組之間存在顯著性差異。在這些研究中,質(zhì)譜技術(shù)分析載體蛋白結(jié)合的LMWPs已被證明是一種識別疾病潛在生物標(biāo)記物的有效手段。
一直以來,大多數(shù)尋找開放閱讀框(ORF)的算法都將300 個核苷酸或100 個氨基酸作為最小檢測限,以降低假陽性編碼區(qū)被檢測的可能性。然而,這種過濾方法直接導(dǎo)致一些小的具有蛋白質(zhì)編碼潛力的轉(zhuǎn)錄本被錯誤地歸類為更大類別的非編碼RNA(ncRNAs)。近年來,核糖體圖譜結(jié)合質(zhì)譜技術(shù)加速了這類SEPs或小蛋白(microproteins)的發(fā)現(xiàn)[30]。與經(jīng)典的多肽類激素或神經(jīng)肽不同,SEPs不是由前體蛋白經(jīng)酶解產(chǎn)生,而是由sORF直接翻譯而來,也屬于LMWPs。
迄今為止,許多研究發(fā)現(xiàn)了SEPs 的存在,并表明這類多肽在生長發(fā)育[31]、機體調(diào)節(jié)[32],以及疾病發(fā)生中(如癌癥[33])具有重要作用。例如,由pri 基因編碼的SEP,可以引發(fā)轉(zhuǎn)錄因子Svb 的截短,使之從阻遏物轉(zhuǎn)變?yōu)榧せ钗铮绊懝壍谋砥し只^程[34];在D’lima 等[35]研究中,lncRNA翻譯而成的NoBody 被證實位于P?bodies 中,與mRNA 脫帽蛋白(尤其是EDC4)存在相互作用,可調(diào)節(jié)P?body 的數(shù)量。該研究揭示,NoBody 是mRNA 脫帽復(fù)合物中的一個新成分,為SEPs 作為調(diào)節(jié)因子參與重要生物過程提供了新的證據(jù);Pauli 等[36]發(fā)現(xiàn),在斑馬魚原腸胚形成過程中,lncRNA 編碼的多肽Toddler,通過與APJ/Apelin 受體結(jié)合激活G 蛋白偶聯(lián)信號,促進細(xì)胞運動;Humanin 是Hashimoto 等在篩選阻止阿爾茨海默病患者神經(jīng)元死亡的相關(guān)因子時發(fā)現(xiàn)的,它可以影響B(tài)ax 定位,進而阻止細(xì)胞死亡[37?38]。目前,SEPs的存在已被廣泛接受并引起了越來越多的關(guān)注。
雖然生物信息學(xué)結(jié)合核糖體圖譜技術(shù)在多種物種中預(yù)測發(fā)現(xiàn)了大量SEPs[39?40],但是證實這些SEPs 的表達(dá)較難。質(zhì)譜技術(shù)作為一種高通量的發(fā)現(xiàn)及驗證手段,能夠檢測蛋白質(zhì)/多肽的分子質(zhì)量和氨基酸序列,目前已廣泛應(yīng)用于SEPs 表征和驗證中。不過,SEPs 分子質(zhì)量小且濃度低,它們在高豐度蛋白質(zhì)的掩蓋下很難被有效地富集和鑒定,所以如何有效地富集SEPs 至關(guān)重要。為此,Ma等[41]比較了幾種富集K562 細(xì)胞中SEPs 的方法,包括酸沉淀、30 ku分子截斷超濾法及反相C8固相萃取法,結(jié)合其他參數(shù)的優(yōu)化,建立了一套高效表征細(xì)胞中SEPs 的方法。截至目前,細(xì)胞、組織、體液等樣本中均有大規(guī)模SEPs的鑒定報告。Zhang等[42]系統(tǒng)開展了SEPs富集和鑒定方法學(xué)研究,從人源和鼠源細(xì)胞或組織中共鑒定到762條SEPs。Li等[43]首次報道了在血漿中鑒定到19 條SEPs,而Cai 等[44]也首次報道了在血漿外泌體中鑒定到48條SEPs。
相較于蛋白質(zhì)組學(xué)持續(xù)、蓬勃的發(fā)展,LMWPs 相關(guān)研究處于相對滯后狀態(tài),主要是因為血漿樣本具有蛋白質(zhì)豐度的高動態(tài)范圍和組成的高度復(fù)雜性。長期以來,研究血漿LMWPs受限于富集與分析方法。不過,近年來,隨著新方法、新技術(shù)的應(yīng)運而生,LMWPs的研究也取得可喜進展。
在富集血漿LMWPs 的策略中,去除高豐度蛋白質(zhì)是關(guān)鍵的一步,常用的方法有:有機溶劑沉淀法、分子截斷超濾法、固相萃取法、親和法和凝膠分離法(圖2a)。雖然這些方法在一定程度上可降低血漿樣本的復(fù)雜性和動態(tài)范圍,但高豐度蛋白質(zhì)去除的效果有限,質(zhì)譜定性分析的再現(xiàn)性差,例如,固相萃取法三次技術(shù)重復(fù)的結(jié)果僅有40%重疊[45]。所以,LMWPs相關(guān)研究迫切需要一種更高效、穩(wěn)定、便捷的富集或分離方法,以進一步降低樣品的復(fù)雜性,便于利用組學(xué)手段研究其組成和變化情況。2017 年,悉尼大學(xué)Parker 等[46]運用三氯乙酸(trichloroacetic acid,TCA)沉淀法開展了運動相關(guān)的血漿多肽組研究。在這項研究中,該團隊首先將TCA 沉淀法與乙腈沉淀法、丙酮沉淀法和分子截斷超濾法進行了比較,發(fā)現(xiàn)TCA 法鑒定的LMWPs數(shù)目最多(近550個)。雖然TCA沉淀法展現(xiàn)出較好的鑒定結(jié)果,但是血漿樣本基質(zhì)的復(fù)雜性,例如大量脂質(zhì)小分子存在,依然干擾著LMWPs 的富集與鑒定。2019 年,Harney 等[47]發(fā)表 了SPEA(small?protein enrichment assay)方法學(xué)研究工作。該方法的卓越之處是在單針非靶向進樣分析的前提下,共定性到100多種低分子質(zhì)量蛋白質(zhì),有效地提高了小蛋白的鑒定率。雖然該方法結(jié)合分子排阻色譜法實現(xiàn)了小蛋白與載體蛋白的分離、高豐度蛋白質(zhì)和脂質(zhì)的去除,但整個實驗流程過于繁瑣,難以應(yīng)用于大規(guī)模臨床樣本制備中。Li等[43]提出了一種新的富集血漿LMWPs 的方法——順序沉淀脫脂法(sequential precipitation and delipidation,SPD),該方法的再現(xiàn)性及定量穩(wěn)定性顯著高于經(jīng)典的乙腈沉淀法與近期報道的TCA沉淀法(圖2b)。
Fig.2 Strategies for enrichment of plasma LMWPs[43,48]圖2 血漿中LMWPs的富集策略[43,48]
除了富集方法上的進步,質(zhì)譜鑒定策略也趨于多樣化,不斷更新?;|(zhì)輔助激光解吸電離飛行時間質(zhì)譜(matrix?assisted laser desorption/ionization time?of?flight mass spectrometry,MALDI?TOF?MS)是表征LMWPs 常用的質(zhì)譜技術(shù),具有靈敏度高、檢測快速、通量高和成本低等優(yōu)勢,已廣泛應(yīng)用于癌癥[49?51]、慢性腎病[52]、感染性疾病[53?54]、認(rèn)知障礙[55],甚至是當(dāng)前全球流行的COVID?19[56]等疾病潛在生物標(biāo)志物的挖掘中。不過,該技術(shù)無法在較寬的質(zhì)量范圍內(nèi)實現(xiàn)多肽組可靠的定性定量分析。隨著高分辨、高靈敏度質(zhì)譜儀器與相應(yīng)軟件的不斷發(fā)展,多肽組學(xué)研究也變得越來越全面和系統(tǒng)。
LMWPs 鑒定策略的進步主要包括:a.蛋白質(zhì)組學(xué)研究策略的進步。在自下而上蛋白質(zhì)組學(xué)(bottom?up proteomics,BUP)技術(shù)中,質(zhì)譜采集速度的大幅提升顯著增加了蛋白質(zhì)組的鑒定深度,推動了該技術(shù)的廣泛應(yīng)用;作為表征完整小蛋白的理想手段之一,自上而下蛋白質(zhì)組學(xué)(top?down proteomics,TDP)的技術(shù)策略是結(jié)合多種質(zhì)譜碎裂模式,直接使樣本中的LMWPs實現(xiàn)有效碎裂并最終完成氨基酸序列的完整解析[57]。相較于BUP,TDP 的技術(shù)優(yōu)勢是保留了LMWPs 的原始序列信息,但是由于完整LMWPs的分子質(zhì)量較大,該技術(shù)難以產(chǎn)生信息豐富的串聯(lián)質(zhì)譜數(shù)據(jù),不過新一代Orbitrap儀器的開發(fā)為TDP技術(shù)的快速發(fā)展奠定了堅實的基礎(chǔ)。b.質(zhì)譜碎裂模式的多樣化應(yīng)用。例如Parker 等[46]利用具有高效分離能力的納流速超高效毛細(xì)管液相色譜與新一代超高分辨三合一質(zhì)譜聯(lián)用技術(shù),在EThcD 和HCD 兩種質(zhì)譜碎裂模式下分別對樣本進行數(shù)據(jù)采集,極大地提高了多肽的鑒定數(shù)目。c.質(zhì)譜數(shù)據(jù)采集方法的進步。近年來,隨著數(shù)據(jù)非依賴采集(data?independent acquisition,DIA)技術(shù)的蓬勃發(fā)展,LMWPs 的相關(guān)研究也得到了進一步延伸。Lin 等[58]首次運用DIA 技術(shù)開展了腎透明細(xì)胞癌相關(guān)的血清LMWPs研究,在該臨床研究中,研究人員將DIA 技術(shù)與傳統(tǒng)的數(shù)據(jù)依賴采集(data?dependent acquisition,DDA)技術(shù)進行了對比,雖然兩種技術(shù)在3次重復(fù)實驗中鑒定的多肽數(shù)目相差無幾,但DIA 技術(shù)定性結(jié)果的重現(xiàn)性與定量結(jié)果的穩(wěn)定性均顯著高于DDA,具有巨大的發(fā)展?jié)摿?。d.各類數(shù)據(jù)檢索軟件及算法的進步。例如,具有de novo未知序列解序功能的PEAKS 軟件[59]、第一個TDP 質(zhì)譜鑒定算法ProSight[60]、高譜圖解析率的新一代開放式搜索引擎Open?pFind[61]以及DIA 數(shù)據(jù)解析軟件Spectronaut[62]等。
從葡萄糖調(diào)節(jié)(胰島素)到免疫識別(MHC分子),以各類生物活性肽形式存在的LMWPs,構(gòu)成了眾多生理穩(wěn)態(tài)調(diào)節(jié)機制。在細(xì)胞和組織中,蛋白酶/肽酶密切參與了這些多肽的產(chǎn)生、降解和信號轉(zhuǎn)導(dǎo),調(diào)控著LMWPs的組成、濃度及生物活性。探究體內(nèi)LMWPs,一方面可發(fā)現(xiàn)具有生物活性的新分子;另一方面可揭示內(nèi)源性多肽代謝的途徑以及體內(nèi)調(diào)節(jié)生物活性肽水平和信號轉(zhuǎn)導(dǎo)的新靶點。
Taguchi等[4]利用肽組學(xué)技術(shù)鑒定到幾千個多肽,通過化學(xué)合成多肽序列及功能研究,他們發(fā)現(xiàn)了3 種來自表皮分化標(biāo)記蛋白suprabasin 的新型生物活性肽。當(dāng)向小鼠腹腔注射SBSN_HUMAN[279?295]時,該多肽可有效地抑制食物/水的攝入,并誘導(dǎo)小鼠運動,而SBSN_HUMAN[225?237]和SBSN_HUMAN[243?259]通過激活血管細(xì)胞內(nèi)NF?κB信號,刺激炎癥前細(xì)胞因子的表達(dá)。該研究基于從頭測序的數(shù)據(jù)庫檢索方式生成多肽庫,結(jié)合功能研究,為發(fā)現(xiàn)血漿中未知生物活性肽提供了新的途徑。
研究蛋白酶?多肽的關(guān)系可以揭示蛋白酶調(diào)節(jié)生理功能的機制以及疾病潛在的治療靶點。二肽基肽酶IV(dipeptidyl peptidase IV,DPPIV 或CD26)參與了多種激素和趨化因子生物活性的調(diào)節(jié),包括胰高血糖素樣肽1(glucagon?like peptide 1,GLP?1)和葡萄糖依賴性促胰島素多肽(glucose?dependent insulinotropic polypeptide,GIP)[63?64]。盡管完整的GLP?1?(7?36)?酰胺和GIP?(1?42)可以增強葡萄糖刺激的胰島素分泌,但是當(dāng)它們N端二肽在體外被DPPIV 剪切后即失去這種活性[65]。N 端截短的GLP?1 和GIP 可以在血液循環(huán)中被檢測到[64,66],提示蛋白質(zhì)降解可能是調(diào)節(jié)它們生理活性的機制。因此,Marguet等[67]利用CD26基因靶向失活的小鼠探究了該酶在血糖控制中的作用,發(fā)現(xiàn)在葡萄糖的刺激下,CD26?/?小鼠血液中的胰島素與完整形式的GLP?1含量增加,同時CD26酶活性特異性抑制劑可以提高野生型小鼠的葡萄糖耐受性,表明CD26 很可能通過調(diào)節(jié)GLP?1 或其他底物的活性控制血糖,提示CD26可作為II型糖尿病的潛在治療靶點。
成纖維細(xì)胞生長因子21(fibroblast growth factor 21,F(xiàn)GF21)是一種參與調(diào)節(jié)葡萄糖穩(wěn)態(tài)、胰島素敏感性、脂質(zhì)代謝和體重的激素,是治療代謝紊亂的潛在靶點。但是FGF21 在血液循環(huán)中的快速水解降低了其潛在的生物活性。為探究FGF21的調(diào)控機制,Zhen等[68]利用質(zhì)譜技術(shù)系統(tǒng)地研究了人FGF21 的加工過程,證明了DPPIV 是負(fù)責(zé)其在Pro?2和Pro?4殘基后N端裂解的主要蛋白酶,以及成纖維細(xì)胞活化蛋白(fibroblast activation protein,F(xiàn)AP)是負(fù)責(zé)FGF21 在Pro?171 后C 端裂解的蛋白酶。FAP可使FGF21失活,該功能的發(fā)現(xiàn)不僅擴展了FGF21 的信號通路,也在治療上為增強FGF21 生物活性提供了新的方法。與之類似,Sierra 等[69]發(fā)現(xiàn),細(xì)胞表達(dá)、分泌的完整趨化因子基質(zhì)衍生因子1α(stromal cell?derived factor 1α,SDF?1α)經(jīng)血清處理后以截短體的形式存在,同時,與其結(jié)構(gòu)對應(yīng)的生物功能隨之降低,揭示了蛋白質(zhì)降解是調(diào)節(jié)SDF?1α 生物功能的重要機制。該團隊還進一步從人血清中分離、純化和鑒定了這種特異性剪切SDF?1α C 端賴氨酸的蛋白酶,即羧肽酶N[70]。SDF?1α 是造血、淋巴細(xì)胞歸家、B 細(xì)胞生長和血管生成的重要調(diào)節(jié)因子,該發(fā)現(xiàn)闡明了SDF?1α功能活性精細(xì)調(diào)控的重要分子機制。
臨床上,癌癥等重大疾病的高發(fā)病率及高死亡率威脅著全球人口的健康,而當(dāng)前老齡化社會的發(fā)展也凸顯了各類慢性病對人們生活質(zhì)量的影響。因此,目前迫切需要發(fā)展各類疾病早期診斷的生物標(biāo)志物。Anderson[71]分析了2008年美國食品和藥物管理局批準(zhǔn)的所有蛋白質(zhì)類的實驗項目,結(jié)果顯示在這些實驗中來自血漿的蛋白質(zhì)共有109個,其中第一類高豐度蛋白質(zhì)約占50%,由組織分泌到血漿中的蛋白質(zhì)約占25%,剩余則是一些異常分泌的蛋白質(zhì)或者激素、受體等。在回顧利用血漿蛋白質(zhì)組學(xué)技術(shù)挖掘生物標(biāo)志物的研究時,Geyer 等[72]提出血漿蛋白質(zhì)組鑒定深度達(dá)1 500 個蛋白質(zhì)時才能覆蓋由組織分泌出來的蛋白質(zhì),在此鑒定深度下,將蛋白質(zhì)按豐度高低進行排序,依照前300個蛋白質(zhì)中約23%的蛋白質(zhì)為生物標(biāo)志物這一比例進行推算,在后續(xù)1 200 個蛋白質(zhì)中應(yīng)該還存在許多生物標(biāo)志物。
一般認(rèn)為,源自組織的蛋白質(zhì)分子質(zhì)量較大,無法以被動運輸?shù)姆绞酵ㄟ^內(nèi)皮擴散到循環(huán)系統(tǒng)中,而LMWPs以其分子質(zhì)量較小的優(yōu)勢,可作為細(xì)胞間信息交流的媒介。同時,LMWPs 富含更多可用于臨床診斷的信息,包括多肽數(shù)目、序列信息、蛋白質(zhì)歸屬、酶切位點信息等。因此,來源廣泛的LMWPs中尚有大量生物標(biāo)志物有待挖掘,具有巨大發(fā)展?jié)摿Α?/p>
在腫瘤微環(huán)境中,蛋白質(zhì)水解異常可促進腫瘤生長、細(xì)胞外和組織的重塑、炎癥、細(xì)胞侵襲和轉(zhuǎn)移[73]。因此,與癌癥生物學(xué)相關(guān)的蛋白酶催化而產(chǎn)生的蛋白質(zhì)降解物可以用作指示癌癥發(fā)生、發(fā)展及治療情況的生物標(biāo)志物。據(jù)Petricoin 等[74?75]報道,在卵巢癌與前列腺癌中,血漿/血清中多肽組合模式在癌癥及其早期診斷中展現(xiàn)的臨床特異性與靈敏度均顯著高于臨床上已有的生物標(biāo)志物——分別是癌癥抗原(cancer antigen 125,CA125)[74]與前列腺特異性抗原(prostate?specific antigen,PSA)[75]。隨后,Zhang等[76]利用交叉驗證和獨立的多中心樣本鑒定出3 個LMWPs,這些潛在生物標(biāo)志物結(jié)合CA125 提高了早期卵巢癌檢測的靈敏度與特異性。此外,Bedin 等[51]探索了與結(jié)腸癌進展相關(guān)的多肽組,通過研究發(fā)現(xiàn),蛋白質(zhì)降解模式在結(jié)腸癌的不同階段各不相同。相較于健康對照,患者的蛋白酶活性更高,揭示了疾病進展與LMWPs 變化的相關(guān)性。癌癥的早期檢測是治療惡性腫瘤的關(guān)鍵,因此,早期生物標(biāo)志物的發(fā)現(xiàn)將極大地幫助患者進行疾病控制,顯著提高患者的生存率。
除了癌癥之外,基于質(zhì)譜技術(shù)探究LMWPs 已被廣泛應(yīng)用于各類疾病潛在生物標(biāo)志物的發(fā)現(xiàn)中,例如代謝綜合征[77?78]、精神類疾?。?9?80]和感染性疾病[81]等。不過,隨著研究的逐漸增多與深入,越來越多的結(jié)果表明,血漿中與不同疾病相關(guān)的差異多肽大部分源自高豐度蛋白質(zhì),這些蛋白質(zhì)似乎沒有特異性,因為它們在不同類型的疾病中也有差異表達(dá)。這可能是因為高豐度蛋白質(zhì)確實與多種疾病之間存在顯著性關(guān)聯(lián)[82]。另外,在復(fù)雜生物體中,多種因素調(diào)控著多肽的產(chǎn)生,因此,與疾病生理病理直接相關(guān)的或許不是差異多肽,而是與多肽產(chǎn)生相關(guān)的蛋白酶或其調(diào)控因子,豐度發(fā)生改變的多肽是疾病間接相關(guān)標(biāo)志物;LMWPs 富集方法的局限性也是一個重要原因,血漿樣本中高豐度蛋白質(zhì)及其衍生的多肽片段的存在極大地掩蓋了低豐度LMWPs 的鑒定,現(xiàn)有的檢測深度降低了其他可能具有診斷作用的低豐度多肽的檢出率,這也再次強調(diào)了推動方法學(xué)及研究策略進展的必要性。不過,從多種研究結(jié)果來看,比起單一的生物標(biāo)志物,多肽組合或指紋圖譜有望滿足更高的臨床敏感性和特異性的要求[73?75]。因此,無論是什么原因?qū)е铝瞬町惗嚯牡漠a(chǎn)生,LMWPs 在生物標(biāo)志物的挖掘方面仍具有無限的潛力。
隨著樣本處理技術(shù)、質(zhì)譜技術(shù)以及計算機技術(shù)的高速發(fā)展,大量關(guān)于血漿LMWPs的質(zhì)譜數(shù)據(jù)已產(chǎn)生,如何從多肽數(shù)量、含量和序列組成等信息中尋找與臨床應(yīng)用、生理病理現(xiàn)象相關(guān)的分子,需要生物信息學(xué)等多種技術(shù)的支持。其次,LMWPs 的研究策略仍需進一步優(yōu)化。事實上,受限于疾病的異質(zhì)性、研究方法的再現(xiàn)性以及研究隊列的有限性與延伸性,研究發(fā)現(xiàn)的差異多肽并沒有得到很好的隊列或功能驗證,因此,研究策略的轉(zhuǎn)變與升級將是促進LMWPs 研究進展的重要環(huán)節(jié)。實踐證明,多中心、多樣本、多疾病的研究策略將有助于挖掘臨床有效的差異分子。最后,探究差異多肽的來源、功能作用將有助于疾病病理學(xué)的理解,并推動其向臨床轉(zhuǎn)化的速度。未來,血漿LMWPs全面而深入的研究將為多種疾病的早期診斷、病理分型、預(yù)后判定和精準(zhǔn)治療帶來新的希望。