童譯慶,高婧,段光臣,周偉,秦海軍
(上海交通大學(xué)附屬第六人民醫(yī)院 急診醫(yī)學(xué)科,上海 200233)
膿毒癥是機(jī)體對于感染反應(yīng)失調(diào)導(dǎo)致的器官功能失調(diào)的綜合征[1],是急診ICU常見的急危重癥,臨床上有極高的發(fā)病率和病死率[2],世界衛(wèi)生組織每年有3000萬膿毒癥,1940萬嚴(yán)重膿毒癥每年有600萬病例死于膿毒癥[3]。病原體入侵引起免疫失衡最終導(dǎo)致的持續(xù)過度的炎癥反應(yīng)和晚期劇烈持久免疫抑制是它的主要病理特征,免疫介導(dǎo)損傷被仍為是導(dǎo)致器官損傷的重要原因[4-5]。促炎反應(yīng)包括有補(bǔ)體系統(tǒng),凝血反應(yīng),血管內(nèi)皮細(xì)胞,白細(xì)胞以及血小板的激活,免疫抑制主要是抗原提呈的重新編排以及淋巴細(xì)胞的耗竭[6-7]。盡管目前對于膿毒癥發(fā)病機(jī)制較前已經(jīng)大大增加,但仍需轉(zhuǎn)化為新的靶向治療。因此通過系統(tǒng)生物學(xué)方法深入了解膿毒癥的免疫發(fā)病機(jī)制對于膿毒癥的診斷和治療都有極其重要的作用。近年來隨著基因檢測技術(shù)和生物信息學(xué)的發(fā)展,這一領(lǐng)域的突破將為膿毒癥的早期診斷、預(yù)后分析和基因治療提供新的思路。目前已經(jīng)有對膿毒癥基因表達(dá)譜進(jìn)行的大量的研究,篩選出數(shù)千個可能與膿毒癥相關(guān)的差異表達(dá)基因(DEGs),但是各個樣本的異質(zhì)性不同,不同技術(shù)檢測的平臺,不同數(shù)據(jù)處理的方法以及樣本來自不同的背景等,均可能導(dǎo)致不同研究間存在差異,即使在單一的隊列研究中仍然存在局限性。因此,我們需要用一種不偏倚的統(tǒng)計方法處理數(shù)據(jù),通過合并分析基因表達(dá)譜可以解決部分問題。RobusRankAggreg使用一個概率模型對于合并的基因進(jìn)行比較打分排名,能有效降低模型噪聲以及區(qū)分顯著性差異基因,篩選出的基因排名越高,P值越小[8]。本研究通過檢索GEO數(shù)據(jù)庫中膿毒癥患者的基因芯片,利用R軟件分析分析和篩選DEGs以及相互作用關(guān)系及其調(diào)控網(wǎng)絡(luò),為深入研究膿毒癥分子機(jī)制及其早期診斷提供思路。
1.1 數(shù)據(jù)集的獲取和資料分析。以“sepsis”作為搜索詞,進(jìn)入美國國立生物技術(shù)信息中心(NCBI)的GEO數(shù)據(jù)庫搜索已公布膿毒癥數(shù)據(jù)集,獲取數(shù)據(jù)集GSE57065,GSE33118,GSE28750三套數(shù)據(jù)集,三套數(shù)據(jù)集的信息見表1。
表1 三組數(shù)據(jù)集的基本信息
1.2 DEGs的表達(dá)分析與數(shù)據(jù)合并 數(shù)據(jù)分析均采用R語言各軟件包進(jìn)行,原始數(shù)據(jù)通過RMA算法對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,DEGs的分析采用R軟件的limma包,limma是Bioconductor下專門用于處理芯片數(shù)據(jù)的R語言包,其中l(wèi)imma算法設(shè)計到實驗矩陣、基因表達(dá)線性模型、先驗分布引入、后驗分布分析和超參數(shù)估計等多方面的算法,是目前基因芯片數(shù)據(jù)處理中較好的算法,也是目前使用較多的算法[9]。選擇差異倍數(shù) log fold change>1.0,P<0.05來篩選DEGs。數(shù)據(jù)合并采用R語言RobustRankAggreg(RRA)包,RRA是使用概率模型對于芯片基因進(jìn)行聚合排名,篩選P<0.05,對于三套數(shù)據(jù)DEGs進(jìn)行打分聚合,篩選出差異表達(dá)的關(guān)鍵基因。
1.3 功能富集分析和蛋白相互作用 獲得DEGs后采用DAVID在線數(shù)據(jù)庫對于DEGs進(jìn)行GO分析、通路分析。分別從基因的生物過程(biological process)、分子功能(molecular function)、細(xì)胞組分(cellular component)3個方面對于基因進(jìn)行富集分析,結(jié)果采用Benjamini矯正法矯正P值進(jìn)行篩選,P<0.05。使用STRING在線數(shù)據(jù)庫(https://string-db.org)對于DEGs進(jìn)行蛋白-蛋白相互作用的網(wǎng)絡(luò)分析(PPI),采用Cytoscape軟件獲取PPI網(wǎng)絡(luò)圖,使用M-CODE插件對于PPI網(wǎng)絡(luò)進(jìn)行模塊分析獲取關(guān)鍵靶基因。
2.1 膿毒癥患者的DEGs表達(dá)分析。在進(jìn)行差異分析前先對進(jìn)行預(yù)處理,刪除缺失值以及基因?qū)Χ嗵结樓闆r,隨后對于樣本進(jìn)行標(biāo)準(zhǔn)化處理及數(shù)據(jù)整理,由圖1的箱式圖可見3組數(shù)據(jù)標(biāo)準(zhǔn)化后數(shù)值分布較好,然后使用Limma包對標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行差異分析發(fā)現(xiàn)3組數(shù)據(jù)分別有881,935,2526個,DEGs表達(dá)火山圖見圖2,由圖可知這些差異基因?qū)τ谀摱景Y和健康對照區(qū)分良好。隨后這些DEGs進(jìn)行聚類分析,聚類熱圖見圖3。三組數(shù)據(jù)都能明顯區(qū)分膿毒癥組和健康對照組,通過采用RobustRankAggreg法對于三組數(shù)據(jù)進(jìn)行篩選共獲得DEGs 281個,其中上調(diào)基因181個,下調(diào)100個。DEGs前20個基因見圖4。
圖1 三組數(shù)據(jù)的標(biāo)準(zhǔn)化,藍(lán)圖為原始數(shù)據(jù)的箱圖,紅圖為中位數(shù)標(biāo)準(zhǔn)化后的箱圖
圖2 三組數(shù)據(jù)的火山圖,紅色部分為上調(diào)基因,綠色部分為下調(diào)基因
圖3 三組數(shù)據(jù)的聚類熱圖
圖4 三組數(shù)據(jù)差異基因根據(jù)RRA分析分值做的聚類分析
表2 差異基因在reactome在線網(wǎng)站上做的通路分析
2.2 差異基因的GO分析以及Pathway分析。采用David在線工具對于DEGs做GO分析,如圖5組圖所示,細(xì)胞組分(cellular component)中差異最顯著的依次為細(xì)胞膜,細(xì)胞外外泌體,T細(xì)胞受體復(fù)合物。生物過程(biological process)中差異最顯著的是T細(xì)胞受體信號通路,MHC-II多肽多糖抗原提呈和加工,以及固有免疫激活,免疫應(yīng)答等。分子功能(Molecular function)中差異最顯著的是MHCII受體的活性,結(jié)合蛋白激酶,白介素-1受體活性,結(jié)合RAGE受體等。Pathway分析采用在DAVID在線工具中reactome通路分析如表2所示,其中差異最顯著的通路是中性粒細(xì)胞脫顆粒,免疫激活和固有免疫的激活,通路分析中還有T細(xì)胞受體瀑布通路。通過STRING在線工具繪出這差異的281個差異基因的蛋白蛋白互相作用網(wǎng)絡(luò)分析圖,結(jié)果如圖6所示,將蛋白蛋白互相作用結(jié)果導(dǎo)入Cytoscape采用MCODE對差異基因進(jìn)行模塊分析,共篩選4個模塊,篩出16個關(guān)鍵基因,其包括FCER1G,CLEC4D,BST1,CKAP4,HVCN1,C3AR1,CD59,CYSTM1,MGAM,STOM,GPR84,ITGAM,CLEC5A,CEACAM1,F(xiàn)CAR,MCEMP1關(guān)鍵靶基因圖見圖7。
圖5 DEGs做的基因本體分析(GO分析):分別為差異基因的分子功能、細(xì)胞組分和生物過程
作為ICU患者死亡原因的首位,膿毒癥發(fā)病率高,病死率高,醫(yī)療資源消耗大,被譽為隱藏的“公共衛(wèi)生災(zāi)難”[10]。膿毒癥的發(fā)生源于宿主對于感染產(chǎn)生的免疫失調(diào),膿毒癥的發(fā)生和發(fā)展是一個動態(tài)復(fù)雜的過程,有各種相關(guān)基因的異常表達(dá),炎癥因子及趨化因子共同參與的。早期診斷及治療有助于降低膿毒癥的死亡率。因此探索膿毒癥發(fā)展的相關(guān)基因,以期找到新的治療靶點,提供有效治療手段有極為重要的臨床及科研意義。
圖6 差異基因蛋白-蛋白相互作用網(wǎng)絡(luò)圖
圖7 利用Cytoscape篩選關(guān)鍵模塊中關(guān)鍵基因,紅色為上調(diào)基因,綠色為下調(diào)基因
本研究利用基因組學(xué)分析方法對于GEO數(shù)據(jù)庫中膿毒癥和正常人的血液芯片數(shù)據(jù)作了挖掘和分析。與正常人群比較,膿毒癥患者的血液中有顯著變化,共發(fā)現(xiàn)281個DEGs,其中上調(diào)181個下調(diào)101個,reactome通路分析主要涉及到中性粒細(xì)胞脫顆粒,免疫激活和固有免疫的激活,通路分析中還有T細(xì)胞受體瀑布通路。發(fā)現(xiàn)差異顯著的通路主要集中在免疫反應(yīng)方面。由此可見膿毒癥的發(fā)生與免疫異常促炎反應(yīng)過度有關(guān)。通過STRING對這些基因做相互作用的網(wǎng)絡(luò)分析以及Cytoscape的模塊分析發(fā)現(xiàn)FCER1G,CLEC4D,B S T 1,C K A P 4,H V C N 1,C 3 A R 1,C D 5 9,CYSTM1,MGAM,STOM,GPR84,ITGAM,CLEC5A,CEACAM1,F(xiàn)CAR,MCEMP1。這16個差異基因可能是膿毒癥發(fā)生的關(guān)鍵位點。其中,F(xiàn)CER1G能轉(zhuǎn)導(dǎo)來自各種免疫受體的信號信息,并激活下游通路,能誘導(dǎo)ITAM磷酸化,引發(fā)SYK,CARD9以及NF-KB的活化,引發(fā)外源抗原引起的促炎反應(yīng),調(diào)節(jié)急性炎癥反應(yīng)[11]。CLEC4D和CLEC5A是C型凝集素結(jié)構(gòu)域家族成員,CLEC4D是一種鈣依賴的凝集素,真菌感染時,能與病原相關(guān)分子模式(PAMPs)相結(jié)合,引起下游的NF-KB的活化從而影響T細(xì)胞向Th1細(xì)胞和Th17細(xì)胞分化,促進(jìn)ROS產(chǎn)生,參與固有免疫反應(yīng)[12],CLEC5A則是巨噬細(xì)胞上的受體,在病毒感染時觸發(fā)信號轉(zhuǎn)導(dǎo)引起促炎因子釋放[13]。BST1是ADP-核糖基環(huán)化酶參與體液免疫的激活以及正向B細(xì)胞增殖的作用[14]。HVCN1介導(dǎo)質(zhì)子跨膜轉(zhuǎn)運介導(dǎo)中性粒細(xì)胞脫顆粒[15]。CYSTM1、MGAM、STOM被富集到與中性粒細(xì)胞脫顆粒有關(guān)。GPR84是炎癥相關(guān)的G蛋白偶聯(lián)受體EX33。整合素ITGAM參與單核細(xì)胞、巨噬細(xì)胞、粒細(xì)胞的相互粘附,參與中性粒細(xì)胞吞噬作用、誘導(dǎo)細(xì)胞凋亡以及參與補(bǔ)體介導(dǎo)的病原體的識別[16]。CEACAM1參與病毒感染后T細(xì)胞信號通路的負(fù)性調(diào)節(jié),IL-1的負(fù)性調(diào)節(jié)以及粒細(xì)胞分化的負(fù)調(diào)節(jié)、血小板聚集的負(fù)性調(diào)節(jié),在炎癥瀑布發(fā)展中起到一定促進(jìn)作用[17]。FCAR是免疫球蛋白FC受體,參與介導(dǎo)細(xì)胞因子的產(chǎn)生、細(xì)胞對于脂多糖及IL-6反應(yīng)、中性粒細(xì)胞凋亡的正調(diào)節(jié)[18]。這些基因均在感染后宿主的免疫中起到重要作用,推測可能是膿毒癥發(fā)展中的關(guān)鍵基因之一。
綜上所述:本研究以膿毒癥為中心,通過GEO數(shù)據(jù)庫的芯片數(shù)據(jù)進(jìn)行挖掘檢索,對采用RRA法對于3組膿毒癥血樣本芯片原始數(shù)據(jù)內(nèi)容進(jìn)行分析,并通過統(tǒng)計學(xué)分析方法找到膿毒癥和正常人血的差異表達(dá)基因,有望為膿毒癥發(fā)生的機(jī)制研究,膿毒癥標(biāo)志物的篩選及治療靶點的選擇提供參考。但是膿毒癥的發(fā)生發(fā)展是復(fù)雜且多因素的疾病,研究中所涉及的差異基因僅部分基因,甚至可能膿毒癥發(fā)生后的部分基因,以后的研究仍然需要進(jìn)一步的分子研究進(jìn)行驗證。