尚詩婷, 董航言, 李圓圓, 張萬軍, 李 航, 秦偉捷, 錢小紅
(軍事科學(xué)院軍事醫(yī)學(xué)研究院生命組學(xué)研究所, 北京蛋白質(zhì)組研究中心,蛋白質(zhì)組學(xué)國家重點實驗室, 北京 102206)
N-糖基化修飾是一種普遍的生物學(xué)過程,在蛋白質(zhì)的折疊、運輸中都承擔(dān)著重要的作用[1]。許多細(xì)胞生理功能及生物學(xué)過程對糖基化高度敏感[2,3],如細(xì)胞識別和信號轉(zhuǎn)導(dǎo)[4]、細(xì)胞黏附[5]、免疫應(yīng)答[6]及細(xì)胞凋亡等。當(dāng)N-糖基化修飾進(jìn)程表現(xiàn)異常,多種疾病,包括神經(jīng)性疾病[7]、糖尿病[8]、腎病[9]、腫瘤[10,11]及炎癥疾病[12,13]等通常會被引發(fā)。因此,深入考察N-糖蛋白/N-糖肽對疾病預(yù)防、診斷[14,15]、分期和療效追蹤評價有顯著的臨床參考意義。
尿液是發(fā)現(xiàn)疾病生物標(biāo)志物、監(jiān)測身體健康狀態(tài)及臨床診斷的常用生物樣本。來源于腎小球濾過及泌尿系統(tǒng)分泌的尿液蛋白質(zhì)組的變化可以反映人體的生理、病理狀態(tài)[16]。因為血液受機體的穩(wěn)態(tài)調(diào)節(jié),在N-糖蛋白質(zhì)組層面發(fā)生的早期細(xì)微變化一般只能短暫存在即可能被清除,然而尿液作為人體廢棄或有害物質(zhì)的集中儲存場所,則剛好可以接收、儲存并累積機體中的生理及病理因素,并不受機體穩(wěn)態(tài)調(diào)節(jié)影響,因此尿液在N-糖蛋白質(zhì)組上的研究意義和價值無法被忽略。除泌尿系統(tǒng)外,尿液蛋白質(zhì)組研究對消化系統(tǒng)、心血管和內(nèi)分泌系統(tǒng)等的快速診斷、療效觀察、預(yù)后評估以及人群健康保健都有重要價值。同時尿液取樣方式完全無侵入性,可重復(fù)多次取樣,且由于尿液具有更低的生物復(fù)雜性,易于分析而被廣泛研究[17]。但尿液中糖蛋白質(zhì)組的生理豐度會因個體間差異和生理條件的變化而波動[18],目前尚無針對健康人群尿液中N-糖蛋白生理豐度范圍的研究。因此,難以判斷臨床疾病生物標(biāo)志物研究中所發(fā)現(xiàn)的糖蛋白差異究竟是來自于正常生理波動、個體間差異還是疾病導(dǎo)致的變化,對后期大規(guī)模樣本驗證提出極大挑戰(zhàn)[18]。
在復(fù)雜生物樣本中,糖基化肽段豐度較低[19-21](在全部蛋白質(zhì)酶解肽段的占比不高于5%),同時其具有高異質(zhì)性[8,22]及較寬的動態(tài)范圍,且糖肽離子化效率較低,因此進(jìn)行N-糖蛋白/N-糖肽的高效分離富集是實現(xiàn)N-糖蛋白質(zhì)組深度覆蓋的重要前提[23]。目前N-糖蛋白/N-糖肽的富集方法主要包括凝集素純化法、酰肼化學(xué)法、硼酸法和親水相互作用色譜法等[21,24]。凝集素純化法主要用于分析具有特定類型聚糖結(jié)構(gòu)的糖蛋白/糖肽,聚糖結(jié)構(gòu)覆蓋率低[25]。酰肼化學(xué)法[26]反應(yīng)時間過長,糖鏈結(jié)構(gòu)易被破壞。硼酸法[9,27]因糖型不同會產(chǎn)生較大富集差別。親水相互作用色譜法(hydrophilic interaction chromatography, HILIC)[28-30]對聚糖的俘獲呈現(xiàn)廣譜性、強保留性以及較高穩(wěn)定性,同時HILIC高效快捷[21],具有不易破壞糖鏈、溶劑溫和以及易兼容質(zhì)譜等優(yōu)點,已經(jīng)被廣泛應(yīng)用于生物樣本中N-糖肽的富集[11,31,32]。
本研究從HILIC填料粒徑和緩沖溶液兩方面優(yōu)化了HILIC富集條件,并考察評價了N-糖肽富集的選擇性與穩(wěn)定性。之后,我們選取了20例健康男性志愿者和20例健康女性志愿者的中段晨尿?qū)-糖蛋白/N-糖肽進(jìn)行了定性、定量及功能分析,并對健康人群男性與女性尿蛋白N-糖基化水平的性別差異探索研究。在此基礎(chǔ)上采用非標(biāo)定量策略對同一個體多時間點及不同個體的尿液N-糖肽的生理豐度波動進(jìn)行了考察。本工作為基于尿液糖蛋白質(zhì)組學(xué)的功能與機制研究和臨床生物標(biāo)志物篩選奠定了基礎(chǔ)[8]。
1.2.1丙酮提取尿蛋白
取20 mL尿液在4 ℃條件下以3 000 g離心30 min,隨后以12 000 g離心30 min,提取上清液。將上清液均分至2個高速離心管中,再加入其3倍體積的預(yù)冷丙酮(-20 ℃),混合均勻后放入-20 ℃冰箱中沉淀4 h。取出以后將樣本在4 ℃以12 000 g離心30 min,取管中的沉淀加入400 μL 8 mol/L尿素溶液溶解尿蛋白,200 W超聲后離心棄去沉淀,取上清液備用。
1.2.2FASP酶解
將所提取的尿蛋白轉(zhuǎn)移至30 kD超濾管中,以14 000 g離心10 min。在尿蛋白樣本中加入DTT保持終濃度為10 mmol/L,于37 ℃變性反應(yīng)4 h。再向樣本中加入200 μL 50 mmol/L的IAA,于室溫避光處孵育40 min,隨后加入200 μL 50 mmol/L的ABC溶液(pH=8.4)清洗置換溶液體系。在尿蛋白中加入0.5 mg/mL胰蛋白酶(胰蛋白酶與蛋白質(zhì)的質(zhì)量比為1∶100)于37 ℃酶切,共加入兩次,第一次酶切時間為12 h,第二次為4 h。酶切后14 000 g離心10 min收集肽段,并測定濃度,然后移取80 μg肽段,在45 ℃下離心濃縮至3~5 μL,剩余肽段置于-80 ℃冰箱保存?zhèn)溆谩?/p>
1.2.3HILIC富集N-糖肽
采用C18反相毛細(xì)管柱(120 mm×150 μm, 1.9 μm),流動相A和B分別為含0.1% (v/v) FA的水溶液和含0.1% (v/v) FA的乙腈溶液,以0.6 μL/min流速洗脫樣本90 min。洗脫梯度為8~60 min, 10%B~30%B; 60~79 min, 30%B~42%B; 79~80 min, 42%B~95%B; 80~85 min, 95%B。在正離子模式下采集譜圖,一級質(zhì)譜掃描質(zhì)荷比范圍是300~1 400,分辨率為70 000。二級質(zhì)譜分辨率為17 500,隔離窗口(m/z)為3,動態(tài)排除時間是15 s。
質(zhì)譜數(shù)據(jù)在Maxquant 1.5.2.8軟件中以Uniprot_human(2015.7, 20207條肽段)為蛋白數(shù)據(jù)庫進(jìn)行檢索。檢索參數(shù)設(shè)置如下:蛋白水解酶為胰蛋白酶,糖蛋白鑒定最大漏切數(shù)目為兩個,每個肽段最大修飾數(shù)設(shè)為5個,最大電荷數(shù)設(shè)為7,可變修飾包括蛋白質(zhì)N末端乙?;?、甲硫氨酸氧化修飾和脫酰胺18O位點修飾,固定修飾包括半胱氨酸烷基化修飾。母離子的質(zhì)量容差最大設(shè)置為0.000 45% (w/w),二級碎片離子的質(zhì)量容差最大為0.002% (w/w),蛋白質(zhì)及肽譜匹配(peptide-spectrum match, PSM)的假陽性率(false discovery rate, FDR)設(shè)為1%。
為了篩選尿液中與性別相關(guān)的N-糖蛋白,對N-糖肽進(jìn)行統(tǒng)計學(xué)分析。先對每個N-糖肽的豐度值進(jìn)行轉(zhuǎn)換后進(jìn)行統(tǒng)計學(xué)檢驗,再以p<0.05和倍數(shù)變化(fold change, FC)>4的標(biāo)準(zhǔn)篩選出存在性別特異性的差異蛋白,隨后對篩選出的N-糖蛋白進(jìn)行聚類分析,定量分析不同性別組蛋白質(zhì)表達(dá)水平的差異。通過Uniprot及DAVID對具有顯著表達(dá)差異的蛋白(前景蛋白)進(jìn)行細(xì)胞定位、生物學(xué)過程及功能的基因本體(gene ontology, GO)注釋和富集分析,同時通過京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes, KEGG)數(shù)據(jù)庫進(jìn)行代謝通路分析。
在親水相互作用色譜法的基礎(chǔ)上,優(yōu)化條件使HILIC富集具有更高選擇性和穩(wěn)定性對于糖蛋白質(zhì)組研究至關(guān)重要。當(dāng)前N-糖肽提取富集的過程主要包括提取、酶切和富集3個步驟。我們對富集過程中HILIC填料的活化、孵育、清洗及特異性洗脫步驟進(jìn)行了優(yōu)化,主要涉及對填料粒徑與緩沖溶液等條件的深入考察。
2.1.1HILIC填料粒徑篩選
評估了1.5 μm、3 μm和5 μm 3種粒徑的填料對N-糖肽富集的效果。在FA富集體系下,清洗液為FA-H2O-ACN (5∶15∶80, v/v/v),洗脫過程包括80 μL 0.5% (v/v) FA洗脫3次,80 μL FA-H2O-ACN (0.5∶94.5∶5, v/v/v)洗脫1次。結(jié)果如下:使用1.5 μm粒徑進(jìn)行HILIC富集,N-糖蛋白及N-糖肽平均鑒定量為512和865,選擇性為64.08%;使用3 μm粒徑填料,N-糖蛋白及N-糖肽平均鑒定量分別為549和942,選擇性為73.92%;使用5 μm粒徑填料,N-糖蛋白及N-糖肽平均鑒定量分別為575和1 008,選擇性為78.27%。HILIC富集法主要基于N-糖肽在流動相與HILIC固定相之間“富水層”分配系數(shù)不同而實現(xiàn)分離[33]。如圖1所示,采用5 μm粒徑的HILIC填料進(jìn)行富集顯示出更高的N-糖蛋白及N-糖肽鑒定量,且5 μm粒徑下的富集選擇性(N-糖肽鑒定量/肽段鑒定量)及穩(wěn)定性也最高,因此選擇5 μm粒徑并進(jìn)行下一步條件優(yōu)化。
圖 1 同一健康志愿者樣本使用3種不同粒徑HILIC填料富集后的質(zhì)譜鑒定規(guī)模(n=3)Fig. 1 Scales of MS-based identification after enrichment of different samples from the same healthy volunteer using HILIC fillers of three particle sizes (n=3)
2.1.2緩沖體系優(yōu)化
為了評價不同緩沖體系的富集效果,我們主要采用TFA與FA兩種緩沖體系進(jìn)行對比考察,涉及ACN濃度、酸濃度和洗脫次數(shù)等參數(shù)的評估,分別對兩種緩沖體系下的清洗液和洗脫液及洗脫步驟進(jìn)行了優(yōu)化,并采用N-糖蛋白、N-糖肽、肽段鑒定量及選擇性作為評價指標(biāo)。在TFA體系下對一名健康志愿者的6例晨尿進(jìn)行質(zhì)譜分析,平均鑒定到1 142條N-糖肽,621個N-糖蛋白,選擇性為78.80%。在FA體系下從相同樣本中鑒定到812條N-糖肽,478個N-糖蛋白,平均選擇性為58.18%。如圖2所示,TFA體系下的N-糖蛋白和N-糖肽的平均鑒定量均高于FA體系,且TFA體系下數(shù)據(jù)的平均相對標(biāo)準(zhǔn)偏差(RSD)值遠(yuǎn)低于FA體系。同時TFA體系下具有更高的選擇性,說明TFA體系下N-糖蛋白/N-糖肽鑒定覆蓋率更高,方法更穩(wěn)定。研究顯示,相比于非離子對試劑,TFA作為離子對試劑通常對N-糖肽具有更高的特異選擇性,該實驗結(jié)果與文獻(xiàn)[31,34]相符。
圖 2 同一健康志愿者樣本在2種富集體系下的質(zhì)譜鑒定水平(n=6)Fig. 2 Levels of MS-based identification in different samples from a healthy volunteer under two distinct enrichment systems (n=6)
為了觀察健康人隨時間推移的N-糖蛋白質(zhì)組表達(dá)水平變化情況,本研究采集了同一健康青年志愿者連續(xù)5天晨尿的N-糖蛋白質(zhì)組信息。質(zhì)譜分析共鑒定出665個N-糖蛋白,1 238條N-糖肽,可定位到1 239個N-糖基化位點。根據(jù)樣本兩兩比較的相關(guān)性分析結(jié)果,如圖3顯示,樣本間N-糖蛋白質(zhì)組Spearman平均相關(guān)性系數(shù)為0.901,波動范圍在0.854~0.942,具有較高相關(guān)性,說明同一健康人短時間內(nèi)尿液N-糖蛋白質(zhì)組的生理波動比較穩(wěn)定。
圖 3 同一健康志愿者連續(xù)5天尿樣相關(guān)性分析Fig. 3 Correlation analysis of urine samples taken from a healthy volunteer for five consecutive days
本實驗在經(jīng)過倫理委員會審查與批準(zhǔn)后進(jìn)行志愿者招募,參與的受試志愿者均已知悉實驗?zāi)康那液炇鹬橥鈺1狙芯坎捎肔C-MS/MS對40例健康志愿者(男性20例,女性20例)尿樣進(jìn)行個體化N-糖蛋白質(zhì)組鑒定,采用非標(biāo)定量法對每例尿樣中的N-糖肽豐度進(jìn)行定量,并進(jìn)行后續(xù)差異蛋白篩選及功能分析。
2.3.1尿液N-糖蛋白質(zhì)組分析
實驗從40例尿樣中共鑒定到1 016個N-糖蛋白、2 192條N-糖肽和2 194個N-糖基化位點。根據(jù)40例尿樣的Spearman相關(guān)性分析結(jié)果(見圖4a),40例健康人尿樣平均相關(guān)性系數(shù)為0.475,其中20例男性和20例女性尿樣平均相關(guān)性系數(shù)分別為0.544和0.460(見圖4b和4c),男性樣本相關(guān)性高于女性,也說明尿液中N-糖蛋白質(zhì)組的生理豐度可能會因存在生理方面差異、個體間差異(如性別差異)而產(chǎn)生波動。N-糖蛋白和N-糖基化位點鑒定量累積曲線如圖5所示,其累積鑒定量分別在樣本數(shù)量達(dá)到14例與20例之后趨于飽和,沒有繼續(xù)顯著上漲趨勢。這為40例樣本的N-糖蛋白鑒定及后續(xù)定量分析奠定基礎(chǔ)。
圖 4 不同健康志愿者尿樣的相關(guān)性分析Fig. 4 Correlation analyses of urine samples from different healthy volunteers a. 40 healthy volunteers; b. 20 healthy males; c. 20 healthy females.
圖 5 不同樣本量下N-糖蛋白及N-糖基化位點累積鑒定量曲線圖Fig. 5 Curves of cumulative identification number of N-glycoproteins and N-glycosylation sites according to sample size
2.3.2尿液N-糖蛋白定量解析
為滿足大規(guī)模人群尿液N-糖蛋白分析的需求,本研究采用了非標(biāo)定量法。為了更直觀地獲取健康人尿液N-糖蛋白質(zhì)組動態(tài)變化范圍,我們對40例健康個體的N-糖肽豐度分布情況進(jìn)行分析,如圖6所示,橫坐標(biāo)代表非標(biāo)定量所得N-糖肽豐度的對數(shù)值,縱坐標(biāo)代表不同豐度區(qū)間內(nèi)N-糖肽的比例分布情況。N-糖肽的豐度動態(tài)范圍跨越了5個數(shù)量級,并且右半部分曲線比左側(cè)走勢更加平緩,N-糖肽豐度為正偏態(tài)分布。這說明尿液N-糖肽的豐度跨度范圍較大,并且該富集鑒定方法可有效覆蓋較多低豐度的N-糖肽,對于生物標(biāo)志物研究至關(guān)重要。N-糖肽在低-中-高的豐度范圍內(nèi)所占比例展現(xiàn)為先增加后減少的變化趨勢,反映了健康人尿液中N-糖肽豐度的總體分布規(guī)律。
圖 6 40例健康志愿者尿樣N-糖肽豐度的總體分布規(guī)律圖Fig. 6 Overall distribution of N-glycopeptide abundance in urine samples from 40 healthy volunteers
2.3.3N-糖蛋白功能注釋與通路分析
為了初步了解富集到的N-糖蛋白的功能與相關(guān)通路,我們對全部N-糖蛋白進(jìn)行了GO分析和KEGG通路富集分析。GO分析主要包括生物學(xué)過程、分子功能及亞細(xì)胞定位3個方面。生物學(xué)過程中,N-糖蛋白中占比較高的為血管生成、絲裂原活化蛋白激酶(mitogen-activated protein kinase, MAPK)級聯(lián)、血小板脫粒、細(xì)胞形態(tài)發(fā)生及RNA聚合酶II對轉(zhuǎn)錄的負(fù)調(diào)控等。細(xì)胞亞細(xì)胞定位為高爾基體膜、細(xì)胞外區(qū)域、質(zhì)膜及胞外空間等。主要涉及的細(xì)胞功能有鈣離子結(jié)合、絲氨酸型內(nèi)肽酶活性、病毒受體活性、跨膜信號受體活性及細(xì)胞外基質(zhì)結(jié)構(gòu)組成等(見附圖1a,http://www.chrom-China.com)。其中顯著富集的前5個GO條目是血管生成、細(xì)胞外區(qū)域、病毒受體活性、高爾基體及絲氨酸型內(nèi)肽酶活性(見附圖1b,http://www.chrom-China.com)。KEGG富集分析中,與N-糖蛋白相關(guān)的疾病主要有心血管疾病和免疫疾病等,涉及免疫系統(tǒng)、發(fā)育與再生等生物系統(tǒng)等(見附圖2a, http://www.chrom-China.com)。其中顯著富集到的5個通路為細(xì)胞黏附分子、補體和凝血級聯(lián)、溶酶體、軸突導(dǎo)向及細(xì)胞因子-細(xì)胞因子受體相互作用(見附圖2b, http://www.chrom-China.com)。
2.3.4男女人群差異蛋白分析
通過分析40例健康志愿者尿液N-糖蛋白質(zhì)的表達(dá)情況,我們共鑒定到206個差異表達(dá)蛋白。如圖7a所示,橫坐標(biāo)為女性與男性N-糖肽定量值倍數(shù)比的對數(shù)值,縱坐標(biāo)表示p值的負(fù)對數(shù)。其中藍(lán)色代表相比于男性,女性顯示下調(diào)的N-糖肽,紅色代表相比于男性,女性顯示上調(diào)的N-糖肽。女性人群有175個N-糖蛋白相比于男性明顯下調(diào),有31個N-糖蛋白比男性顯著上調(diào)。接下來對篩選到的差異N-糖蛋白的表達(dá)水平進(jìn)行聚類分析。如熱圖7b顯示,兩者N-糖肽的表達(dá)量顯示出明顯的性別差異,說明性別可能是正常個體尿液中N-糖蛋白質(zhì)組存在差異的一項重要因素,在臨床診斷及生物標(biāo)志物的篩選中應(yīng)予以考慮。
圖 7 (a)依賴于性別差異表達(dá)的N-糖蛋白的火山圖與(b)差異表達(dá)水平熱圖Fig. 7 (a) Volcano plot of gender-dependent differentially expressed N-glycoproteins and (b) heatmap of protein expression levels a. In the volcano plot, blue dots represent down-regulated N-glycopeptides in women compared to men, and red dots represent up-regulated N-glycopeptides in women compared to men; b. The heatmap shows the expression levels of N-glycopeptides differentially expressed between men and women.
2.3.5N-糖蛋白功能注釋與通路分析
為研究男女人群中存在表達(dá)差異的N-糖蛋白在生物學(xué)過程、分子功能及亞細(xì)胞定位方面的差異,我們對其進(jìn)行了GO分析。如圖8a所示,差異蛋白中占比高的生物學(xué)過程包括血小板脫粒、血管生成、骨化、成骨細(xì)胞分化與RNA聚合酶II對轉(zhuǎn)錄的負(fù)調(diào)控等。差異蛋白定位的主要亞細(xì)胞區(qū)域包括細(xì)胞外區(qū)域、高爾基體膜、細(xì)胞質(zhì)膜與細(xì)胞質(zhì)等。分子功能分析發(fā)現(xiàn)鈣離子結(jié)合、絲氨酸型內(nèi)肽酶活性、病毒受體活性、細(xì)胞外基質(zhì)結(jié)構(gòu)構(gòu)成與蛋白酶結(jié)合等與差異蛋白密切相關(guān)。其中顯著富集到的前5個GO條目為血小板脫粒、細(xì)胞外區(qū)域、骨化、急性炎癥反應(yīng)的正調(diào)控及細(xì)胞外基質(zhì)結(jié)構(gòu)組成等(見圖8b)。
圖 8 基于差異表達(dá)的N-糖蛋白的功能注釋與通路分析Fig. 8 Functional and pathway analysis of differentially expressed N-glycoproteins a. The results of GO analysis are sorted in ascending order of protein ratio, and the top five items of the categories “biological process”, “cellular component”, and “molecular function” are displayed; b. The results of GO analysis are sorted in ascending order with respect to their p value, and the top 12 GO items are shown; c. The results of KEGG analysis are sorted in ascending order of protein ratio, and include cellular processes, environmental information, human diseases, metabolism, and organismal systems.
此外根據(jù)KEGG數(shù)據(jù)庫分析,顯著富集到的代謝通路涉及130個N-糖蛋白。在差異蛋白中占比較高的前3個通路為聚糖的生物合成與代謝、輔助因子和維生素代謝及脂質(zhì)代謝。疾病方面,差異蛋白在心血管疾病、內(nèi)分泌和代謝疾病、細(xì)菌或病毒性傳染病及癌癥疾病中具有較高比例。生物系統(tǒng)里,在免疫系統(tǒng)、發(fā)育與再生與消化系統(tǒng)等占比更豐富(見圖8c)。其中顯著富集到的前3個代謝通路為細(xì)胞黏附分子、補體和凝血級聯(lián)反應(yīng)及其他糖降解。
綜上所述,本研究在優(yōu)化HILIC富集條件的基礎(chǔ)上,通過5例同一健康人的多時間點尿液樣本考察了短時間內(nèi)尿液N-糖蛋白質(zhì)組的生理性波動情況。并通過對20例健康男性和20例健康女性尿液樣本的N-糖蛋白/N-糖肽的定性、定量分析,考察了健康人群尿液N-糖蛋白/N-糖肽的定量范圍。進(jìn)而對健康人群尿蛋白N-糖基化水平進(jìn)行了性別差異研究,篩選到206個男性和女性的差異N-糖蛋白。通過對差異N-糖蛋白的功能注釋及通路解析,挖掘了男女健康人群尿蛋白N-糖基化水平呈現(xiàn)顯著變化的分子信息,提示性別差異作為一個影響因素在基于尿液糖蛋白質(zhì)組的疾病標(biāo)志物研究中需給以重視。