牛 歡,張紅燕,彭佳喜,王 莉,趙興云,周孝禹,萬麗紅,吳仁安*
(1.中國科學(xué)院大連化學(xué)物理研究所,遼寧 大連 116023;2.中國科學(xué)院大學(xué),北京 100049)
糖尿病是一種由多種因素引起糖代謝穩(wěn)定功能受損而致高血糖為主要特征的全身性代謝紊亂綜合征,患者高血糖的形成與肝臟、胰臟、腸道、脂肪肌肉組織、腎臟、腦等多臟器的功能失調(diào)相關(guān),已成為嚴(yán)重危害人類健康的全球性流行的多發(fā)疾病[1,2]。血糖控制的失穩(wěn)可導(dǎo)致多種糖尿病并發(fā)癥,如:并發(fā)心腦血管、腎臟、視網(wǎng)膜及神經(jīng)系統(tǒng)的慢性病變和各種感染,嚴(yán)重時可發(fā)生酮癥酸中毒等,甚至導(dǎo)致殘疾或死亡[3]。據(jù)統(tǒng)計,我國已成為全球糖尿病第一大國,目前糖尿病人數(shù)已超過1億,其中,1型糖尿病主要由自身免疫系統(tǒng)損害所致,約占糖尿病患者總數(shù)的5%;2型糖尿病(T2D)主要以胰島素抵抗和胰島β細(xì)胞功能受損為特點,患者數(shù)約占糖尿病患者總數(shù)的90%[4]。糖尿病的早發(fā)現(xiàn)、早診斷及早治療對于病情的延緩和控制至關(guān)重要。在分子水平上呈現(xiàn)、跟蹤糖尿病發(fā)生發(fā)展過程中的變化分子譜圖,對糖尿病臨床診斷、分子分型及病理過程的理解可提供更加全面的數(shù)據(jù)支持。
隨著系統(tǒng)生物學(xué)的發(fā)展,組學(xué)分析技術(shù)已發(fā)現(xiàn)部分蛋白質(zhì)、糖、脂質(zhì)、代謝物等生物分子在糖尿病中異常表達(dá),可以作為糖尿病的潛在分子標(biāo)志物[5-8]。內(nèi)源性多肽是相對分子質(zhì)量小于10 kDa的多肽或蛋白質(zhì)水解片段,是細(xì)胞合成、調(diào)控等過程的重要內(nèi)源性生物分子,能夠反映機(jī)體基因表達(dá)的變化,也能引起相應(yīng)新陳代謝活動的改變[9-11]。多肽組學(xué)作為一門系統(tǒng)性、全面性研究內(nèi)源性多肽結(jié)構(gòu)、功能及變化規(guī)律的學(xué)科,是蛋白質(zhì)組學(xué)的重要補(bǔ)充,也是目前的熱點研究領(lǐng)域[12-15]。血清中含有豐富的內(nèi)源性多肽,可實時反映人體生理、病理狀態(tài)的變化和特性,被認(rèn)為是最有價值的生物標(biāo)本之一。血清內(nèi)源性多肽組的研究對于疾病標(biāo)志物的篩選、早期診斷、疾病動態(tài)監(jiān)測及治療具有重要的臨床意義,已受到研究者的廣泛關(guān)注[16-18]。針對白血病,有研究者采用弱陽離子交換磁珠對血清內(nèi)源性多肽進(jìn)行純化并結(jié)合基質(zhì)輔助激光解吸-飛行時間質(zhì)譜(MALDI-TOF-MS)鑒定技術(shù),對比分析了急性淋巴細(xì)胞白血病患者和健康對照者血清樣本的內(nèi)源性多肽組,篩選出33條差異多肽[19]。此外,葡萄膜黑色素瘤[20]、兒童自閉癥[21]及膿毒癥[22]等多種疾病研究中也通過多肽組學(xué)技術(shù)鑒定到潛在的血清內(nèi)源性多肽標(biāo)志物。針對2型糖尿病,Wang等[23]通過對糖尿病患者和健康對照者血清樣本的內(nèi)源性多肽組的分析,鑒定到6條差異多肽,可作為診斷2型糖尿病的潛在多肽標(biāo)志物。在臨床樣品分析的多肽組學(xué)技術(shù)中所使用的MALDI-TOF-MS定性定量分析準(zhǔn)確性往往較差,而液相色譜-串聯(lián)質(zhì)譜(LC-MS/MS)能夠提供較為穩(wěn)定、精確的多肽定性定量結(jié)果。本工作應(yīng)用低濃度乙腈輔助超濾聯(lián)合LC-MS/MS的定量多肽組學(xué)技術(shù),對臨床上健康組、糖尿病前期組及2型糖尿病組的血清樣本的內(nèi)源性多肽組進(jìn)行對比分析,篩選識別糖尿病發(fā)展過程中的差異內(nèi)源性多肽,旨在尋找2型糖尿病早期診斷及分子分型的多肽分子標(biāo)志物。
截留相對分子質(zhì)量為10 kDa的離心超濾管購于Millipore公司(美國);甲酸(formic acid,FA)購自Sigma-Aldrich公司(美國);23例人血清樣品(包括7例健康者血清樣本、7例糖尿病前期患者血清樣本和9例2型糖尿病患者血清樣本)來自上海第六人民醫(yī)院。實驗用的乙腈為色譜純(Merck公司),實驗用水全部經(jīng)Milli-Q(Millipore,美國)處理。
血液樣品采集后保存于-80 ℃冰箱。糖尿病前期患者和2型糖尿病患者由專家確診或排除,3組受試人群的年齡、體重指數(shù)(BMI)、血糖等指標(biāo)均相匹配。血液樣品獲得當(dāng)?shù)蒯t(yī)院倫理委員會的批準(zhǔn),所有受試者都簽署知情同意書。樣本臨床信息見表1。
血清內(nèi)源性多肽的提取采用低濃度乙腈輔助超濾離心法。具體操作流程如下:從-80 ℃冰箱中取出血樣并在冰浴中解凍,渦旋混勻,20 000 g離心5 min,棄去脂質(zhì)。每例血清樣本取25 μL于1.5 mL離心管中,加入125 μL去離子水稀釋并煮沸變性5 min。待溫度冷至室溫后,加入150 μL 40% ACN(含0.1% FA)溶液使乙腈終體積分?jǐn)?shù)為20%,渦旋混勻并于冰浴中靜置40 min。然后將樣品轉(zhuǎn)移到截留相對分子質(zhì)量為10 kDa超濾管中,在6 000 g、4 ℃條件下離心20 min,并用300 μL 20% ACN(含0.1% FA)溶液清洗濾餅兩次。收集濾液,冷凍干燥,經(jīng)C18 SPE柱除鹽后,儲存在-80 ℃冰箱中備用。進(jìn)樣分析前,樣品復(fù)溶到25 μL 0.1% FA溶液中,渦旋混勻2 min,在20 000 g、4 ℃條件下離心5 min,取上清液置于進(jìn)樣瓶中用于nano-LC-MS/MS分析。
表1 血液樣本的臨床信息Table1 Clinical information of blood samples
LC-MS/MS數(shù)據(jù)采集由nano-RPLC-MS/MS系統(tǒng)完成。該系統(tǒng)由四元梯度泵的高效液相色譜(Ultimate 3000)、自動進(jìn)樣器和線性離子阱-靜態(tài)軌道阱(LTQ-Orbitrap Elite)組成,采用3 cm長的C18預(yù)柱(200 μm i.d.)輔助自動進(jìn)樣,樣品首先保留到預(yù)柱上,然后經(jīng)梯度洗脫到分析柱上(150 μm i.d.,14 cm)進(jìn)行分離,質(zhì)譜鑒定。
液相色譜流動相組成:A相為0.1%的FA水溶液,B相為80% ACN(含0.1% FA)溶液。分離梯度設(shè)為:0~10 min,2%B;10~13 min,2%B~5%B;13~73 min,5%B~28%B;73~88 min,28%B~45%B;88~89 min,45%B~95%B;89~94 min,95%B;94~95 min,95%B~2%B;95~105 min,2%B。流動相流速為0.5 μL/min。
質(zhì)譜條件:LTQ離子傳輸管的溫度設(shè)為275 ℃,電噴霧電壓設(shè)為2.7 kV。所有的數(shù)據(jù)采集模式均為數(shù)據(jù)依賴模式(data-dependent mode,DDA),質(zhì)譜全掃描在Orbitrap中采集,掃描范圍為200~2 000 Da,分辨率設(shè)為12 000。二級質(zhì)譜掃描在LTQ中采集,采用碰撞誘導(dǎo)解離(CID)碎裂方式。利用Xcalibur軟件(version 2.1,Thermo公司)進(jìn)行系統(tǒng)控制和數(shù)據(jù)收集。
LTQ-Orbitrap質(zhì)譜儀所采集的質(zhì)譜數(shù)據(jù)利用Mascot(Version 2.6.0)軟件進(jìn)行數(shù)據(jù)檢索,檢索數(shù)據(jù)庫為人源庫(UniProt,約17萬個蛋白質(zhì))。檢索參數(shù)設(shè)為:甲硫氨酸殘基(+15.994 9 Da)為可變修飾,無酶切,母離子質(zhì)量誤差為20 ppm,二級碎片離子誤差為0.8 Da。多肽篩選門檻設(shè)定如下:得分值高于20,假陽性率(FDR)小于1%。多肽定量采用MaxQuant軟件(http://maxquant.org/,version 1.6.1.0)進(jìn)行數(shù)據(jù)分析。假陽性率(false discovery rate,FDR)為0.01。
將MaxQuant軟件所得的肽段信號強(qiáng)度導(dǎo)入Perseus軟件進(jìn)行過濾無效值、對數(shù)變換、正態(tài)分布以及缺失值補(bǔ)齊等數(shù)據(jù)前處理。采用悟空平臺(https://www.omicsolution.org/wu-kong-beta-linux/main/)構(gòu)建PLS-DA模型及非參數(shù)檢驗。使用在線數(shù)據(jù)庫Panther和String分別對差異肽段匹配的蛋白質(zhì)進(jìn)行GO功能和KEGG信號通路分析。
采用超濾法提取血清內(nèi)源性多肽時,多肽與蛋白質(zhì)的結(jié)合以及超濾膜的吸附作用會導(dǎo)致嚴(yán)重的多肽損失。為此,本實驗對超濾法提取血清內(nèi)源性多肽過程進(jìn)行了優(yōu)化,以低濃度乙腈處理超濾管中被截留的蛋白質(zhì)組分,改善了多肽回收率。標(biāo)準(zhǔn)多肽回收率測試表明,無低濃度乙腈處理的直接超濾法中,強(qiáng)疏水性多肽(AINVAVHVF、VLDAVRGSPAINVAVHVF、NVHSAGAAGSRMNFRPGVLS)無法被檢測到,弱疏水性和親水性多肽(ATASRGASQAGAPQGR、SSKITHR、RHDWGHEKQ)的回收率均低于40%。而經(jīng)低濃度乙腈處理后,弱疏水性和親水性多肽的回收率均提高至90%以上,強(qiáng)疏水性多肽被質(zhì)譜成功鑒定,回收率也可達(dá)約30%~50%。進(jìn)一步將該方法用于血清內(nèi)源性多肽的提取中,通過LC-MS/MS可從5 μL健康人血清中鑒定到868條內(nèi)源性多肽,3針重復(fù)可鑒定到598條內(nèi)源性多肽,是血清直接超濾鑒定數(shù)量的2倍,顯示了低濃度乙腈輔助超濾在實際樣本多肽組深度鑒定中的有效性與可靠性。由此,建立了低濃度乙腈輔助超濾法結(jié)合LC-MS/MS的多肽組學(xué)分析方法,用于糖尿病3個發(fā)展階段的血清內(nèi)源性多肽組的分析鑒定。根據(jù)Mascot檢索結(jié)果及MaxQuant定量結(jié)果,認(rèn)為至少一組中有60%以上樣本鑒定到的肽段為可靠肽段。對23例血清樣本所鑒定的unique peptide取并集,共鑒定到690條可靠血清內(nèi)源性肽段。構(gòu)建PLS-DA模型,將實際樣品投影到兩個主成分組成的二維平面上(見圖1),對照組(N組)、糖尿病前期組(preT2D組)和2型糖尿病組(T2D組)之間有明顯的分離趨勢,表明3類樣本在多肽水平上具有顯著性差異。
圖1 3組樣品間構(gòu)建的PLS-DA模型散點圖Fig.1 Partial least squares-discriminant analysis(PLS-DA)score plots for the three groups
2.2.1僅在preT2D組表達(dá)和僅在T2D組表達(dá)的血清內(nèi)源性多肽
對這690條可靠肽段進(jìn)一步分析發(fā)現(xiàn)有39條內(nèi)源性多肽(對應(yīng)23個蛋白質(zhì))僅在preT2D組中被鑒定(表2,上標(biāo)為a的肽段),有97條內(nèi)源性多肽(對應(yīng)43個蛋白質(zhì))僅在T2D組中被檢測(表2,上標(biāo)為b的肽段)。
表2 差異多肽及匹配蛋白質(zhì)的詳細(xì)信息列表Table2 Detailed information of differential peptides and matched proteins
表2 (續(xù))Table2 (Continued)
表2 (續(xù))Table2 (Continued)
表2 (續(xù))Table2 (Continued)
a:endogenous peptides detected only in preT2D group;b:endogenous peptides detected only in T2D group;-:not significantly changed peptide compared with the normal group.
2.2.2ANOVA方差分析尋找3組間顯著性變化的內(nèi)源性多肽
對3組均鑒定到的內(nèi)源性多肽(376條)進(jìn)行ANOVA方差分析(p-value<0.05,fold change>2),發(fā)現(xiàn)3組間有27條顯著性變化多肽。
對這27條差異多肽做聚類分析并對每個聚類部分的差異多肽在3組中的強(qiáng)度進(jìn)行統(tǒng)計(見圖2),結(jié)果顯示這些差異肽段主要聚類為4部分(以N組作為參考),包括在T2D組顯著性變化的肽段(圖2a:下調(diào)4條肽段,上調(diào)9條肽段)、在preT2D組顯著性變化的肽段(圖2b:下調(diào)3條肽段,上調(diào)2條肽段)、在preT2D組和T2D組同時顯著性變化的肽段(圖2c:1條下調(diào)和5條上調(diào)的肽段)以及3條在preT2D組上調(diào)而在T2D組下調(diào)的肽段(圖2d)。
將2.2.1節(jié)和2.2.2節(jié)所得的差異多肽進(jìn)行匯總,共篩選出163條差異多肽(匹配56個蛋白質(zhì)),作為進(jìn)一步研究糖尿病標(biāo)志物的候選集。它們的詳細(xì)信息(包括肽段序列、匹配的蛋白質(zhì)信息以及它們在preT2D組和T2D組的變化趨勢)見表2。
圖2 3組間顯著性變化多肽的強(qiáng)度Fig.2 Intensities of the significantly changed peptides among the three groups a.Cluster that the peptide contents are significantly different (p-value<0.05,fold change>2)only in the type 2 diabetes (T2D)group;b.cluster that the peptide contents are significantly different only in the preT2D group.c.cluster that the peptides are up-regulated or down-regulated in both preT2D and T2D groups;d.cluster that the peptides are up-regulated in the preT2D group but down-regulated in the T2D group.
2.3.1GO功能分析
對這些差異多肽所匹配的蛋白質(zhì)通過在線數(shù)據(jù)庫Panther進(jìn)行功能注釋分析(見圖3)。結(jié)果表明這些蛋白質(zhì)的功能類別主要涉及分子水平的結(jié)合、催化、轉(zhuǎn)運(yùn)、調(diào)節(jié),其中結(jié)合功能占主導(dǎo)地位;它們多數(shù)位于細(xì)胞外,也有一部分位于細(xì)胞膜以及組織中;所參與的生物學(xué)過程主要為代謝、應(yīng)激、生物黏附、免疫系統(tǒng)、生物調(diào)節(jié)等過程。
圖3 差異多肽所匹配蛋白質(zhì)的GO分析Fig.3 Gene ontology analysis of the differential peptide matched proteins a.molecular function analysis;b.cellular component analysis;c.biological process analysis.
圖4 差異多肽匹配蛋白質(zhì)的KEGG信號通路分析Fig.4 KEGG signal pathway of differential peptide matched proteins
2.3.2KEGG信號通路分析
將差異蛋白質(zhì)導(dǎo)入在線數(shù)據(jù)庫String中進(jìn)行KEGG信號通路分析,結(jié)果顯示這些蛋白質(zhì)主要富集在補(bǔ)體(complement cascade)和凝血(coagulation cascade)通路中,共涉及14個蛋白質(zhì)(見圖4)。此外,還有4個蛋白質(zhì)(APOA1、APOA4、APOC3、APOE)富集在膽固醇代謝(cholesterol metabolism)通路中。補(bǔ)體系統(tǒng)是固有免疫系統(tǒng)的重要組成部分,通過經(jīng)典途徑、旁路途徑及凝集素途徑被激活,主要介導(dǎo)免疫和炎癥過程。補(bǔ)體系統(tǒng)的激活也與胰島素抵抗存在潛在聯(lián)系,可能與2型糖尿病及其并發(fā)癥相關(guān)[24,25]。凝血系統(tǒng)在機(jī)體中也發(fā)揮著重要的作用,尤其是在抵抗感染和維持機(jī)體止血方面。糖尿病的發(fā)生發(fā)展過程也涉及凝血系統(tǒng)的激活,研究發(fā)現(xiàn)高血糖可以通過加劇葡萄糖氧化和使線粒體產(chǎn)生活性氧成分而增加氧化應(yīng)激,損傷血管內(nèi)膜使病人處于凝血、纖溶等血液病理狀態(tài)[26,27]。糖尿病患者長期高凝血狀態(tài)還是其發(fā)生心血管疾病腦卒中和栓塞的高風(fēng)險因素[28,29]。另外,血脂代謝的異常也被報道為2型糖尿病高風(fēng)險因素以及病理表現(xiàn)特點之一,可以作為糖尿病早期篩查和診斷以及預(yù)測糖尿病患者脂質(zhì)代謝紊亂相關(guān)并發(fā)癥的早期指標(biāo)[30]。
除此之外,還有包括S100-A8蛋白、凝溶膠蛋白、叢生蛋白、結(jié)合珠蛋白、組蛋白H2B型F-S、胰島素樣生長因子結(jié)合蛋白3、胸腺素β4、α2-HS-糖蛋白、甲狀腺素轉(zhuǎn)鐵蛋白等蛋白質(zhì)可能也參與了2型糖尿病的病理過程。S100-A8蛋白、凝溶膠蛋白主要介導(dǎo)炎癥過程,與糖尿病的發(fā)生發(fā)展密切相關(guān)[31-35]。叢生蛋白和結(jié)合珠蛋白被報道與糖尿病眼病、腎病等并發(fā)癥有關(guān)[36-39]。胰島素樣生長因子結(jié)合蛋白3是一種癌癥風(fēng)險的保護(hù)劑,是評估癌癥風(fēng)險的重要因子,具有潛在的應(yīng)用價值,也與糖尿病相關(guān)[40-42]。胸腺素β4具有多重生物學(xué)功能,在組織再生、重塑、創(chuàng)傷愈合、維持肌動蛋白平衡、腫瘤發(fā)病與轉(zhuǎn)移、細(xì)胞凋亡、炎癥、血管生成、毛囊發(fā)育等生理、病理過程中扮演著極為重要的角色,也可能參與糖尿病病理過程[43]。α2-HS-糖蛋白是先天免疫Toll-like受體(TLR)-4,也可以與胰島素受體β亞單位相結(jié)合來阻止胰島素受體酪氨酸激酶調(diào)節(jié)胰島素信號,從而出現(xiàn)胰島素抵抗,與T2D的發(fā)病關(guān)系密切[44]。
綜上所述,通過對2型糖尿病3個不同發(fā)展階段的血清樣本內(nèi)源性多肽組的定性定量分析,從正常組、糖尿病前期組及2型糖尿病組樣品中篩選出163條差異內(nèi)源性多肽,為2型糖尿病早期篩查、早期診斷及分子分型等生物標(biāo)志物的發(fā)現(xiàn)提供了可能。