夏守兵,許春杰,蔣春暉,顧 磊,孫隆慈,徐 慶
上海交通大學醫(yī)學院附屬仁濟醫(yī)院胃腸外科,上海 200127
潰瘍性結腸炎(ulcerative colitis,UC),又稱特發(fā)性潰瘍性結腸炎,是一種起始于直腸的非特異性慢性腸道炎癥性疾病,目前發(fā)病原因尚不明確。UC可發(fā)病于任何年齡,但多見于青春末期和成年早期。臨床癥狀主要以持續(xù)或反復發(fā)作的腹瀉、黏液膿血便為主,可伴有不同程度的全身癥狀。遷延不愈的患者最后可發(fā)展為炎癥相關惡性腫瘤[1-2]。目前普遍認為,UC的發(fā)病是環(huán)境、患者自身的易感基因、精神心理因素及腸道微生物等多種因素共同疊加的結果[3-4],但針對UC及其惡性并發(fā)癥的致病相關基因尚未得到充分研究。本研究旨在通過分析比較UC樣本與正常樣本,以及UC樣本與UC伴瘤變樣本的基因表達譜數據,構建關于差異表達基因編碼蛋白質相互作用(proteinprotein interaction,PPI)網絡,對UC及其惡性并發(fā)癥的致病相關基因進行系統(tǒng)的生物信息學分析,從而為進一步探究UC及其惡性并發(fā)癥的具體分子機制提供新的研究思路。
從美國國立生物技術信息中心(National Center for Biotechnology Information,NCBI)的基因表達數據庫(Gene Expression Omnibus,GEO)(https://www.ncbi.nlm.nih.gov/gds) 中 下 載 編 號 為 GSE13367、GSE9452、GSE36807、GSE37283的基因表達數據集及樣本臨床信息,其中GSE13367數據集包含16例UC樣本及20例對照樣本,GSE9452數據集包含8例UC樣本及18例對照樣本,GSE36807數據集包含15例UC樣本及7例對照樣本,GSE37283數據集包含5例健康人群對照樣本、4例靜止期UC樣本以及11例UC伴瘤變樣本。GSE13367、GSE9452、GSE36807基因表達數據集都是基于GPL570注釋平臺中Affymetrix(昂飛)Human Genome U133 Plus 2.0 Array [HG-U133_Plus_2]的人類全基因轉錄本生物信息,GSE37283基因表達數據集是基于GPL13158注釋平臺中Affymetrix(昂飛)HT HG-U133+ PM Array Plate的人類全基因轉錄本生物信息,故以GSE13367、GSE9452、GSE36807數據集作為UC組,GSE37283為UC伴腺瘤組(UCN組)。首先依據UC組的K均值聚類算法結果對該組的3個數據集樣本進行無監(jiān)督聚類分析,剔除臨床表型與聚類分析結果不符的樣本。
基因表達譜數據經注釋及聚類分析等預處理之后,利用R語言limma函數包分別對UC組與UCN組進行差異基因分析,篩選出P<0.05且|log2FC|>1.5的基因作為顯著差異表達基因,并通過基于R語言的VennDiagram函數包對UC組中3個數據集進行單獨分析以及聯合分析得到差異基因,繪制韋恩圖以分析差異基因的交并集,再利用ggplot2包繪制差異基因的火山圖。
基因集富集分析(Gene Set Enrichment Analysis,GSEA)可用來評估一個預先定義的基因集中的基因在以表型相關度排序的基因列表中的分布趨勢,從而判斷其對表型的貢獻。為進一步探究UC致病相關基因的生物學功能,將從MSigDB數據庫(http://software.broadinstitute.org/gsea/msigdb/)中獲得的KEGG功能基因集作為參照基因集[5],采用R語言GSEA函數包分析以上2組差異基因數據 在 KEGG(Kyoto Encyclopedia of Genes and Genomes)信號通路中的富集情況。通過定義|NES|>1,NOM P-value<0.05,FDR Q-value<0.25的通路下的基因集合是有意義的,篩選得到2組差異基因在KEGG信號通路中的富集情況及其所包含的具體基因集。
STRING數據庫(https://string-db.org/)主要通過實驗數據、文獻報道摘要和來自其他數據庫的綜合數據實現預測PPI功能。在本研究中,根據顯著差異基因符合P<0.05且|log2FC|>1.5的篩選條件,使用STRING數據庫分析顯著差異表達基因的PPI網絡,并利用Cytoscape 3.6.1軟件的CytoHubba插件[6]提供的12種算法對PPI網絡中的各個節(jié)點基因進行評分分析以識別網絡中的核心基因,從而可以較為準確地找出在UC及其惡性并發(fā)癥病程中起核心作用的致病相關基因。
TIMER數據庫(https://cistrome.shinyapps.io/timer/)是系統(tǒng)分析不同類型癌癥組織中的免疫細胞浸潤情況的綜合數據庫。通過此數據庫可以查詢特定基因與不同腫瘤組織中6種免疫細胞(B細胞、CD4+T細胞、CD8+T細胞、中性粒細胞、巨噬細胞和樹突狀細胞)的浸潤關系、基因表達量與腫瘤患者預后關系以及基因在多種腫瘤和正常組織中的差異表達情況。
LINCS L1000數據庫(https://clue.io/)是由博德研究所(Broad Institute)開發(fā)的基于小分子藥物、基因表現與疾病相互關聯的藥物篩選數據庫。目前該數據庫已收集7 000余個經小分子藥物處理后的人類細胞基因表達譜數據,廣泛應用于探索藥物作用的機制以及研發(fā)新的治療藥物。通過利用該數據庫查詢特異性針對PPI網絡核心基因的小分子藥物,以發(fā)現具有潛在治療效果的藥物。
采用Graphpad prism 7.0統(tǒng)計學軟件對組間的基因表達量數據進行單因素t檢驗。通過Pearson相關系數分析評估基因表達量之間的相關性。P<0.05表示差異具有統(tǒng)計學意義。
剔除聚類分析結果中與臨床表型不符的樣本后(圖1),通過limma函數包分析UC組與UCN組的差異表達基因。以P<0.05且|log2FC|>1.5為標準,針對23例UC樣本與33例正常樣本的差異基因分析共發(fā)現顯著差異基因86個,其中43個為上調基因,43個為下調基因;而針對4例靜止期UC樣本與11例UC伴瘤變樣本的差異基因分析共得到253個顯著差異基因,其中160個為上調基因,93個為下調基因。從UC組的差異基因韋恩圖中可以發(fā)現該組3個數據集聯合分析得到的差異基因均處在與各數據集單獨分析結果的交集中,這表明多數據集聯合分析可以有效提高分析結果的可信度(圖2A)。利用ggplot2包繪制2組差異基因中上調基因和下調基因的火山圖,能夠直觀地顯示2組差異基因的表達情況(圖2B、2C)。
圖1 剔除與臨床表型不符的樣本前后的聚類分析結果Fig 1 Results of cluster analysis before and after excluding the samples inconsistent with clinical phenotype
圖2 UC組差異基因分析得到的韋恩圖及火山圖及UCN組差異基因分析得到的火山圖Fig 2 Venn diagram and volcano plot obtained from differential genetic analysis of UC group and volcanic map obtained by differential gene analysis of UCN group
通過GSEA軟件對2組基因全轉錄本進行KEGG富集分析,以 |NES|>1,NOMP-value<0.05 且 FDRQ-value<0.25為篩選標準,發(fā)現UC組差異基因的KEGG富集分析結果中顯著上調的通路為IL-17信號通路、Toll樣受體信號通路、NOD樣受體信號通路等多條信號通路,顯著下調的通路為檸檬酸循環(huán)(TCA循環(huán))、礦物質吸收、丁酸代謝、氧化磷酸化、脂肪酸降解;UCN組的KEGG富集分析結果中顯著上調的通路為IL-17信號通路、TNF信號通路、Toll樣受體信號通路等,顯著下調的通路為TCA循環(huán)、類固醇激素生物合成、礦物質吸收、膽汁分泌、近端小管碳酸氫鹽重吸收,富集分析得到的具體通路如圖3A、3B所示。此外,在2組KEGG富集分析的結果中都發(fā)現了炎癥性腸?。╥nflammatory bowel disease,IBD)信號通路和IL-17信號通路,利用R語言enrichplot函數包繪制的這2個信號通路的GSEA富集分析曲線圖如圖3D所示?;诨虮磉_量的變化對IBD信號通路及IL-17信號通路進行KEGG信號通路注釋,從IL-17信號通路的KEGG通路注釋圖中可以發(fā)現CXCL8(C-X-C motif chemokine ligand 8)參與了對中性粒細胞的招募作用(圖3C、4B)。
圖3 2組差異基因KEGG富集分析及GSEA分析得到的部分結果Fig 3 Partial results of KEGG enrichment analysis and GSEA analysis of two groups of differential genes
基于STRING數據庫的PPI分析得到了UC組顯著差異基因的PPI網絡(圖4A)。基于Cytoscape的CytoHubba插件提供的12種拓撲分析算法對PPI網絡各個節(jié)點基因進行評分排序,得到網絡中的核心節(jié)點基因(表1)。評分分析發(fā)現CXCL8在10種算法評分排序中均位列第1。在UC組及UCN組的差異基因分析結果中均發(fā)現了上調基因CXCL8(圖2B、2C),這表明CXCL8可能是在UC及其惡性并發(fā)癥的發(fā)生發(fā)展過程中起核心作用的基因。
TIMER數據庫的分析顯示結直腸腺癌組織中CXCL8主要對中性粒細胞的浸潤起到趨化作用(圖4C),相比于在正常組織中的表達量,CXCL8在多種腫瘤組織中呈高表達狀態(tài)(圖5A)?;趯颊叩念A后數據分析發(fā)現CXCL8呈高表達狀態(tài)的結直腸腺癌患者預后較差(圖5B)?;赑earson相關性分析發(fā)現CXCL8的表達量與中性粒細胞的2種表面抗原以及程序性死亡配體1(programmed deathligand 1,PD-L1)的表達量呈正相關(圖4D~4G、5C、5D)。通過對UCN組的分析,發(fā)現CD206及PD-L1的表達量隨著UC病程的發(fā)展逐漸上調(圖5E、5F)。
基于LINCS L1000數據庫的查詢結果,共篩選出3種小分子藥物,分別為紫鉚因(butein)、左旋西替利嗪(levocetirizine)、偽麻黃素(pseudoephedrine)(圖5G)。
圖4 CXCL8參與對中性粒細胞招募作用的多種分析結果Fig 4 Multiple analysis results of CXCL8 involved in the recruitment of neutrophils
表1 利用CytoHubba提供的12種算法對UC組PPI網絡中的節(jié)點基因評分分析得到的排名前10位的節(jié)點基因Tab 1 Top 10 node genes obtained by using 12 algorithms of CytoHubba for scoring analysis of the node genes in PPI networks of UC group
圖5 UC患者體內CXCL8與PD-L1表達量的相關性分析以及3種小分子藥物對CXCL8抑制效果的分析Fig 5 Correlation analysis of the expression of CXCL8 and PD-L1 in ulcerative colitis patients and analysis of the inhibitory effect of three small molecule drugs on CXCL8
本研究通過分析正常人群與UC患者以及UC患者與UC伴瘤變患者的2組差異基因,發(fā)現顯著上調的差異基因CXCL8,而后對于通過基于Cytoscape的網絡核心基因分析插件CytoHubba深入挖掘篩選到的顯著差異基因,CytoHubba的評分分析亦發(fā)現CXCL8在10種核心基因算法評分結果中均排名第1?;谝陨戏治鼋Y果,我們推測CXCL8可能在UC及其惡性并發(fā)癥的病程發(fā)展中發(fā)揮了重要作用。
CXCL8,又稱嗜中性粒細胞因子,屬于CXC趨化因子家族,主要由外周血中的淋巴細胞、單核細胞以及中性粒細胞等多種細胞產生,是炎癥反應的重要介質,常與局部組織的炎癥細胞浸潤相一致[7]。研究[8]發(fā)現慢性炎癥組織中的多種免疫細胞可持續(xù)性釋放CXCL8,CXCL8及其配體CXCR1/2主要負責中性粒細胞的激活過程和誘導中性粒細胞向炎癥部位遷移和著陸。本研究中2組差異基因的KEGG功能富集分析的結果也顯示了在IL-17信號通路中CXCL8等趨化因子對中性粒細胞有招募作用。CXCL8在腫瘤微環(huán)境中對中性粒細胞的招募功能已得到van den Steen等[9]的證實,該研究結果發(fā)現CXCL8可以刺激中性粒細胞釋放基質金屬蛋白酶9(matrix metalloproteinase-9,MMP-9),而MMP-9可以強化CXCL8的趨化能力,使得更多的中性粒細胞聚集在腫瘤組織周圍。
慢性炎癥長期以來被認為是促發(fā)癌癥,尤其是結腸癌的一個重要風險因子,超過20%的UC患者會在確診后的數十年內轉化成結腸癌患者[10]。而結腸炎相關性癌變進程緩慢,干預治療的效果非常差且死亡率高[11]。但長久以來慢性炎癥如何抵御免疫反應并最終導致癌癥發(fā)生與發(fā)展的確切機制尚不明確。作為人體固有免疫應答系統(tǒng)的重要組成成分,中性粒細胞可通過多種方式在結腸炎相關性結腸癌的形成過程中發(fā)揮促瘤形成作用,例如促瘤型中性粒細胞(N2型)分泌的趨化因子CXCL8與腫瘤細胞表面的趨化因子受體結合后,既能招募更多的中性粒細胞進入腫瘤微環(huán)境,又能促進腫瘤血管生成[12-14]。而近年來針對中性粒細胞的深入研究[15-16]發(fā)現,腫瘤微環(huán)境中N2型中性粒細胞還可通過PD-1/PD-L1信號轉導途徑抑制T細胞的正常功能,從而在多種癌癥中實現促瘤作用。
PD-L1是程序性死亡受體1(programmed death-1,PD-1)的主要配體,研究[17-18]顯示兩者在結合后可通過“耗竭”腫瘤效應T細胞的方式起到對免疫應答的負性調控作用,并使腫瘤細胞發(fā)生免疫逃逸現象。Nakazawa等[19]通過研究UC患者的手術切除標本,發(fā)現患者結腸上皮細胞PD-L1表達水平明顯高于健康對照者。Lin等[20]通過研究胃癌腫瘤微環(huán)境發(fā)現,CXCL8能夠通過誘導腫瘤相關巨噬細胞表達PD-L1從而抑制CD8+T細胞的功能活化,導致腫瘤細胞逃過免疫檢查。Wang等[15]發(fā)現胃癌腫瘤微環(huán)境中激活的中性粒細胞同樣可以通過PD-1/PD-L1通路抑制T細胞的功能,從而抑制其對腫瘤細胞的殺傷作用。以上這些研究結果表明腫瘤微環(huán)境對腫瘤相關免疫細胞的“馴化”作用有助于實現PD-L1在這些細胞中的表達上調。
本研究中,我們通過差異基因分析及CytoHubba核心基因算法分析的結果發(fā)現顯著差異基因PPI網絡的核心基因為CXCL8;通過差異基因的KEGG富集分析發(fā)現顯著上調的CXCL8基因參與了IL17信號通路對中性粒細胞的招募作用;通過基因表達量之間的相關性分析則發(fā)現CXCL8與中性粒細胞表面特異性抗原以及PD-L1的表達量呈正相關。以上分析結果在一定程度上驗證了TIMER數據庫及前述文獻報道中CXCL8可通過招募中性粒細胞的方式以實現對PD-L1表達量調控這一結論。同時,有研究[21]發(fā)現調控PD-L1表達量的主要信號通路為JAK-STAT信號通路。此外,還有研究[22]發(fā)現N2型中性粒細胞表面特異性抗原CD206的表達量也會隨著病程的發(fā)展而逐漸升高。我們由此推測腸道炎癥組織中的中性粒細胞可能會在慢性炎癥組織中逐漸被“馴化”而演變發(fā)展為激活/抑制的“雙重”表型,并在CXCL8的作用下通過JAK-STAT信號通路上調PD-L1的表達量以實現負性調控T細胞功能,從而促使腸道炎癥惡性并發(fā)癥的發(fā)生。
此外,通過LINCS L1000數據庫查詢特異性針對CXCL8的小分子藥物,得到紫鉚因、左旋西替利嗪、偽麻黃素3種小分子藥物。查閱文獻[23]發(fā)現紫鉚因具有抗氧化、抗炎癥、誘導腫瘤細胞凋亡等多種藥理作用。紫鉚因可以顯著降低脂多糖(lipopolysaccharide,LPS)刺激小膠質細胞后細胞內多種炎癥因子mRNA的表達上調,這說明紫鉚因可以抑制LPS誘導的小膠質細胞的活化,從而明顯減少炎癥因子的產生[24]。而左旋西替利嗪、偽麻黃素作為在臨床上應用已久的藥物也都可以通過不同的方式達到抑制炎癥的效果,其中第3代抗過敏藥物的代表左旋西替利嗪可以直接發(fā)揮抑制炎癥細胞聚集和浸潤的功能,而偽麻黃堿則可通過發(fā)揮擬腎上腺素作用以減少中性粒細胞在呼吸道細胞內的聚集、黏附。以上3種小分子藥物的藥理分析表明,抑制腸道黏膜組織內中性粒細胞的長期異常聚集可能是阻止UC及其惡性并發(fā)癥發(fā)生和發(fā)展的關鍵因素。
總而言之,本研究利用生物信息學方法建立的篩選分析流程為研究UC提供了一個新的思路:基于多種數據庫對UC的致病相關基因進行全面分析,并對表達量發(fā)生變化的基因進行KEGG信號通路分析,再通過PPI網絡分析對處于網絡中心節(jié)點的基因進行深入挖掘,找出與疾病相關的核心基因,從而為研究提供新的突破點。通過綜合利用以上方法,本研究發(fā)現了一些可能在UC發(fā)展過程中發(fā)揮核心作用的基因(如CXCL8)。這為UC及惡性并發(fā)癥的研究提供了新的思路,為理解UC發(fā)生過程中的復雜分子機制提供了新的視角,也為進一步推動臨床藥物研發(fā)提供了依據。然而,考慮到本研究尚有一定的局限性,未來還需要進一步開展更為深入的實驗來驗證本研究的結果。