哈爾濱醫(yī)科大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(150081) 張 薇 孫 琳 王玉鵬 劉美娜
【提 要】 目的 基于加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)方法識(shí)別IgG介導(dǎo)的西紅柿不耐受相關(guān)蛋白質(zhì)共表達(dá)模塊及樞紐蛋白,為其發(fā)生機(jī)制研究提供依據(jù)。方法 收集IgG介導(dǎo)的西紅柿不耐受患者及健康對(duì)照血清樣本,使用DIA全掃描蛋白質(zhì)組學(xué)定性定量技術(shù)獲得蛋白質(zhì)表達(dá)數(shù)據(jù);利用WGCNA方法構(gòu)建共表達(dá)網(wǎng)絡(luò),識(shí)別與IgG介導(dǎo)的西紅柿不耐受相關(guān)的模塊,并進(jìn)行模塊GO功能注釋及KEGG通路富集分析;利用Cytoscape獲得IgG介導(dǎo)的西紅柿不耐受相關(guān)模塊的樞紐蛋白。結(jié)果 獲得IgG介導(dǎo)的西紅柿不耐受相關(guān)的蛋白質(zhì)模塊兩個(gè),分別為blue模塊和turquoise模塊。blue模塊與IgG介導(dǎo)的西紅柿不耐受相關(guān)系數(shù)為-0.90;GO富集分析發(fā)現(xiàn),該模塊中蛋白主要參與脂蛋白重構(gòu)、脂質(zhì)代謝等相關(guān)生物過(guò)程以及蛋白質(zhì)級(jí)聯(lián)激活、補(bǔ)體激活等免疫調(diào)節(jié)過(guò)程;KEGG分析富集到5條通路,包括膽固醇代謝通路、PPAR信號(hào)通路、補(bǔ)體和凝血級(jí)聯(lián)通路、類維生素A代謝和運(yùn)輸通路、維生素和輔酶因子代謝通路。turquoise模塊與IgG介導(dǎo)的西紅柿不耐受相關(guān)系數(shù)為0.72;GO富集分析發(fā)現(xiàn),該模塊主要與蛋白質(zhì)級(jí)聯(lián)激活、補(bǔ)體激活經(jīng)典途徑、體液免疫應(yīng)答、受體介導(dǎo)的內(nèi)吞,血小板脫顆粒、抗氧化活性等生物過(guò)程有關(guān);KEGG分析富集到2條通路,補(bǔ)體和凝血級(jí)聯(lián)通路、吞噬體通路。篩選出IgG介導(dǎo)的西紅柿不耐受相關(guān)模塊中的樞紐蛋白為APOA1、APOA4、APOC3、APOA2、APOC1、C3、HRG、FGB、HP、TF。結(jié)論 WGCNA方法進(jìn)行IgG介導(dǎo)的西紅柿不耐受蛋白質(zhì)表達(dá)數(shù)據(jù)分析發(fā)現(xiàn):脂質(zhì)、膽固醇代謝等過(guò)程的改變可能是其發(fā)生的重要環(huán)節(jié);獲得的載脂蛋白類蛋白質(zhì)及其他樞紐蛋白是其潛在關(guān)鍵調(diào)控蛋白;本研究從系統(tǒng)生物學(xué)的角度,為IgG介導(dǎo)的西紅柿不耐受發(fā)生機(jī)制探索提供了依據(jù)和研究方向。
食物不耐受是一種常見(jiàn)的由食品或食品添加劑引起的食物不良反應(yīng),發(fā)生率為5~20%[1]。其中,IgG介導(dǎo)的西紅柿不耐受在我國(guó)食物不耐受中占較高比例[2-3],患者多伴有蕁麻疹、腸易激綜合癥、偏頭痛等全身系統(tǒng)性癥狀[4-10],但其發(fā)病機(jī)制尚未明確。加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)是一種常用的系統(tǒng)性網(wǎng)絡(luò)分析方法,利用WGCNA分析轉(zhuǎn)錄組和基因組數(shù)據(jù),可識(shí)別疾病相關(guān)基因模塊及樞紐基因,發(fā)現(xiàn)疾病診斷、治療等潛在重要靶點(diǎn)[11-13]。近年來(lái),該方法也被用于分析大規(guī)模蛋白質(zhì)組學(xué)數(shù)據(jù),從系統(tǒng)生物學(xué)的角度,研究疾病相關(guān)的蛋白質(zhì)組學(xué)變化[14-15]。本研究利用WGCNA方法進(jìn)行系統(tǒng)性分析,從調(diào)控網(wǎng)絡(luò)整體出發(fā),識(shí)別IgG介導(dǎo)的西紅柿不耐受相關(guān)蛋白質(zhì)模塊,揭示其蛋白變化情況及參與的生物學(xué)過(guò)程,獲得IgG介導(dǎo)的西紅柿不耐受相關(guān)模塊的樞紐蛋白,為其發(fā)病機(jī)制研究提供新的思路。
研究對(duì)象來(lái)源于2017年3月至2017年12月在某醫(yī)院過(guò)敏反應(yīng)科就診患者及體檢中心健康人群,收集血清樣本,利用酶聯(lián)免疫吸附測(cè)定法進(jìn)行14項(xiàng)食物特異性IgG抗體檢測(cè):特異性IgG抗體濃度<50U/ml為陰性結(jié)果,≥50U/ml為陽(yáng)性結(jié)果。結(jié)合臨床癥狀、就診患者自述飲食情況及酶聯(lián)免疫吸附檢測(cè)結(jié)果,排除其他食物特異性IgG抗體陽(yáng)性患者,獲得僅為西紅柿特異性IgG抗體陽(yáng)性的患者7例,作為IgG介導(dǎo)的西紅柿不耐受患者組;對(duì)照組按照年齡±2歲、性別相同與病例組進(jìn)行1:2匹配,得到檢測(cè)結(jié)果為陰性且無(wú)食物過(guò)敏史的14例健康人作為對(duì)照組?;颊呒皩?duì)照的年齡、性別、西紅柿特異性IgG抗體濃度信息如表1所示。
表1 IgG介導(dǎo)的西紅柿不耐受患者及健康對(duì)照基本信息
本研究采用非數(shù)據(jù)依賴性采集(DIA)技術(shù)進(jìn)行蛋白表達(dá)數(shù)據(jù)檢測(cè),將質(zhì)譜的整個(gè)全掃描范圍分為若干個(gè)窗口,每個(gè)窗口中的所有母離子進(jìn)行選擇、碎裂、檢測(cè),無(wú)遺漏地獲得樣本中所有母離子的全部碎片信息。
WGCNA是一種數(shù)據(jù)驅(qū)動(dòng)的共表達(dá)網(wǎng)絡(luò)構(gòu)建方法,將表達(dá)模式相似的蛋白質(zhì)聚類于同一模塊,該模塊中的蛋白質(zhì)可能共同參與調(diào)控某個(gè)生物過(guò)程,根據(jù)模塊與性狀之間的相關(guān)性獲得疾病相關(guān)模塊。主要步驟為:
第一,確定最佳軟閾值:蛋白共表達(dá)網(wǎng)絡(luò)應(yīng)符合無(wú)尺度特征,服從冪律分布;將軟閾值取值范圍設(shè)為1~20,以首次出現(xiàn)無(wú)尺度擬合指數(shù)R2接近0.9,且同時(shí)使網(wǎng)絡(luò)平均連接度不至于太低(需顯著大于0)的閾值作為最佳軟閾值,用于拓?fù)渲丿B矩陣(TOM)的計(jì)算。
第二,構(gòu)建蛋白共表達(dá)模塊:計(jì)算蛋白之間的Pearson相關(guān)系數(shù)矩陣,利用最佳軟閾值計(jì)算TOM和蛋白間相異性系數(shù),得到蛋白系統(tǒng)聚類樹(shù);按照每個(gè)模塊中至少包含30個(gè)蛋白的原則,混合動(dòng)態(tài)剪切樹(shù),初步構(gòu)建蛋白模塊;計(jì)算每個(gè)模塊的特征向量值(ME),對(duì)模塊進(jìn)行聚類分析,以高度值0.25作為分割線合并相似度較高的模塊,得到最終的蛋白共表達(dá)模塊。
第三,模塊與疾病的關(guān)聯(lián)分析:每個(gè)模塊的第一主成分作為特征向量蛋白,代表該模塊內(nèi)蛋白表達(dá)的整體水平,將模塊特征值與是否患病進(jìn)行關(guān)聯(lián)分析,確定與疾病相關(guān)的蛋白共表達(dá)模塊和模塊內(nèi)蛋白集合。
在WGCNA分析結(jié)果的基礎(chǔ)上,利用Metascape對(duì)識(shí)別出的疾病相關(guān)模塊中的蛋白集合進(jìn)行GO功能注釋和KEGG通路富集分析,獲得包括生物過(guò)程(biological process,BP)、細(xì)胞組分(cellular component,CC)、分子功能(molecular function,MF)在內(nèi)的模塊功能注釋信息和KEGG通路,揭示疾病發(fā)生涉及的生物學(xué)過(guò)程和信號(hào)調(diào)控轉(zhuǎn)導(dǎo)機(jī)制。
WGCNA分析識(shí)別的疾病相關(guān)模塊中的蛋白集合,在Cytoscape軟件中進(jìn)行網(wǎng)絡(luò)構(gòu)建,并借助其中的CytoHubba插件,選擇MCC算法,獲得每個(gè)模塊網(wǎng)絡(luò)中的蛋白重要性排序,篩選模塊中的樞紐蛋白。
利用DIA蛋白質(zhì)組學(xué)檢測(cè)技術(shù),從血清樣本中鑒定并定量出1132個(gè)蛋白質(zhì),進(jìn)行WGCNA分析。根據(jù)無(wú)尺度擬合指數(shù)R2和平均連接度在軟閾值不同取值時(shí)的變化情況,確定了最佳軟閾值為3,此時(shí)無(wú)尺度擬合指數(shù)R2首次接近0.9,且網(wǎng)絡(luò)的平均連接程度相對(duì)較高,能夠包含足夠的信息。
利用最佳軟閾值3計(jì)算得到的網(wǎng)絡(luò)拓?fù)渲丿B矩陣TOM進(jìn)行聚類分析,最終得到14個(gè)蛋白共表達(dá)模塊,如圖1所示。圖中聚類樹(shù)的每個(gè)分支代表一個(gè)蛋白,每個(gè)顏色代表一個(gè)模塊,模塊中的蛋白數(shù)目從32到158不等;每個(gè)模塊內(nèi)的蛋白間共表達(dá)程度高,在功能上具有緊密的關(guān)系;不同模塊間蛋白的共表達(dá)程度低;grey模塊代表未分配到任何模塊中的蛋白集合,包含95個(gè)蛋白。
圖1 IgG介導(dǎo)的西紅柿不耐受的蛋白聚類樹(shù)及蛋白共表達(dá)模塊
每個(gè)蛋白共表達(dá)模塊與IgG介導(dǎo)的西紅柿不耐受發(fā)生的關(guān)聯(lián)性分析結(jié)果如圖2所示。blue模塊與IgG介導(dǎo)的西紅柿不耐受的相關(guān)系數(shù)為-0.9,turquoise模塊與IgG介導(dǎo)的西紅柿不耐受的相關(guān)系數(shù)為0.72,二者與IgG介導(dǎo)的西紅柿不耐受發(fā)生的相關(guān)性較高,可以作為關(guān)鍵模塊進(jìn)行后續(xù)分析。圖3為blue模塊和turquoise模塊中蛋白顯著性與模塊隸屬度的關(guān)系,以及兩個(gè)模塊的蛋白表達(dá)量熱圖與特征值柱狀圖。模塊中蛋白在該模塊內(nèi)的模塊隸屬度,為該蛋白與本模塊特征蛋白的相關(guān)系數(shù),與性狀高度相關(guān)的蛋白也是與性狀模塊高度相關(guān)的蛋白,值得進(jìn)一步的深入研究。
圖2 蛋白共表達(dá)模塊與性狀相關(guān)性
圖3 (a)blue模塊蛋白顯著性與模塊隸屬度關(guān)系;(b)blue模塊蛋白表達(dá)量熱圖與特征值柱狀圖;(c)turquoise模塊蛋白顯著性與模塊隸屬度關(guān)系;(d)turquoise模塊的蛋白表達(dá)量熱圖與特征值柱狀圖
blue模塊和turquoise模塊的GO功能注釋結(jié)果分別如圖4(a)和圖4(b)所示。blue模塊中蛋白主要參與血漿脂蛋白顆粒組裝、重構(gòu),高密度脂蛋白顆粒重構(gòu),膽固醇酯化調(diào)節(jié)等脂蛋白相關(guān)過(guò)程以及蛋白質(zhì)級(jí)聯(lián)激活,補(bǔ)體激活,體液免疫應(yīng)答等免疫過(guò)程;turquoise模塊中蛋白主要與蛋白質(zhì)級(jí)聯(lián)激活,補(bǔ)體激活經(jīng)典通路,體液免疫應(yīng)答,受體介導(dǎo)的內(nèi)吞,血小板脫顆粒,抗氧化活性等有關(guān)。此外,兩個(gè)模塊的KEGG通路分析發(fā)現(xiàn),blue模塊富集到5條通路,包括膽固醇代謝通路、PPAR信號(hào)通路、補(bǔ)體和凝血級(jí)聯(lián)通路、類維生素A代謝和運(yùn)輸通路、維生素和輔酶因子代謝通路;turquoise富集到2條KEGG通路,為補(bǔ)體和凝血級(jí)聯(lián)通路、吞噬體通路。
圖4 blue模塊和turquoise模塊GO富集分析結(jié)果
圖5為blue模塊和turquoise模塊的網(wǎng)絡(luò)構(gòu)建結(jié)果,獲得每個(gè)模塊網(wǎng)絡(luò)中的蛋白重要性排序后,在兩個(gè)模塊中各選前5個(gè)蛋白作為樞紐蛋白,包括APOA1、APOA4、APOC3、APOA2、APOC1、C3、HRG、FGB、HP、TF。這些蛋白在模塊中與其他蛋白的關(guān)聯(lián)性較多,發(fā)揮重要的作用,可作為IgG介導(dǎo)的西紅柿不耐受發(fā)生的潛在關(guān)鍵調(diào)控蛋白進(jìn)行深入研究。
圖5 blue模塊和turquoise模塊樞紐蛋白網(wǎng)絡(luò)圖
本研究利用WGCNA分析IgG介導(dǎo)的西紅柿不耐受蛋白質(zhì)表達(dá)數(shù)據(jù),獲得了疾病相關(guān)的蛋白共表達(dá)模塊,篩選出樞紐蛋白,為揭示IgG介導(dǎo)的西紅柿不耐受潛在的發(fā)病機(jī)制和調(diào)控過(guò)程提供依據(jù)。番茄紅素是西紅柿中富含的主要營(yíng)養(yǎng)素,具有較強(qiáng)的抗氧化性和清除自由基的能力,被聯(lián)合國(guó)糧農(nóng)組織和世界衛(wèi)生組織認(rèn)定為A類營(yíng)養(yǎng)素,可以調(diào)整腸胃功能,增強(qiáng)免疫力,降低血壓和膽固醇,促進(jìn)脂質(zhì)代謝,抑制胰島素抵抗和代謝紊亂等[16-17]。因此,IgG介導(dǎo)的西紅柿不耐受發(fā)病機(jī)制及其關(guān)鍵調(diào)控蛋白的研究具有重要意義。
西紅柿中的番茄紅素可以促進(jìn)脂質(zhì)代謝,而脂質(zhì)代謝及相關(guān)產(chǎn)物對(duì)免疫系統(tǒng)具有重要的影響[18],能夠預(yù)防自身免疫性疾病的發(fā)生,促進(jìn)皮膚和淋巴結(jié)炎性反應(yīng)。WGCNA分析識(shí)別IgG介導(dǎo)的西紅柿不耐受相關(guān)模塊的GO功能注釋分析發(fā)現(xiàn),模塊中蛋白主要富集于血漿脂蛋白顆粒組裝、高密度脂蛋白顆粒重構(gòu)、膽固醇酯化調(diào)節(jié)、抗氧化活性、補(bǔ)體激活、體液免疫應(yīng)答等生物過(guò)程;關(guān)鍵模塊蛋白的KEGG通路分析也富集到了膽固醇代謝、補(bǔ)體和凝血級(jí)聯(lián)反應(yīng)等通路,揭示了脂質(zhì)、膽固醇代謝等過(guò)程的改變,引起免疫系統(tǒng)功能變化,可能是IgG介導(dǎo)的西紅柿不耐受發(fā)生的重要環(huán)節(jié)。此外,本研究識(shí)別出的IgG介導(dǎo)的西紅柿不耐受相關(guān)模塊樞紐蛋白APOA1、APOA4、APOC3、APOA2、APOC1,均為載脂蛋白類蛋白質(zhì),參與脂質(zhì)代謝過(guò)程,且與免疫功能有關(guān),提示我們載脂蛋白可能在IgG介導(dǎo)的西紅柿不耐受發(fā)生中起到了關(guān)鍵作用,是參與其發(fā)病機(jī)制調(diào)控的重要蛋白,但還需要進(jìn)一步的實(shí)驗(yàn)研究,收集更多的臨床樣本進(jìn)行驗(yàn)證。
綜上,本研究利用WGCNA分析IgG介導(dǎo)的西紅柿不耐受蛋白質(zhì)表達(dá)數(shù)據(jù),富集到多個(gè)有意義的生物學(xué)過(guò)程和通路。其中,脂質(zhì)、膽固醇代謝等過(guò)程的改變可能是IgG介導(dǎo)的西紅柿不耐受發(fā)生的重要環(huán)節(jié);獲得的載脂蛋白類蛋白質(zhì)是IgG介導(dǎo)的西紅柿不耐受發(fā)生的潛在關(guān)鍵調(diào)控蛋白,為IgG介導(dǎo)的西紅柿不耐受發(fā)生及調(diào)控機(jī)制的探索研究提供了參考和依據(jù)。
中國(guó)衛(wèi)生統(tǒng)計(jì)2021年3期