楊凈 龍世棋 熊研 葛毓臻 楊香蓮 羅傳粉 趙元橋 朱莉△
(1.貴陽市婦幼保健院兒童消化科,貴州 貴陽 550001;2.貴州醫(yī)科大學(xué)免疫學(xué)教研室,貴州 貴陽 550001;3.貴州醫(yī)科大學(xué)臨床專業(yè),貴州 貴陽 550004)
潰瘍性結(jié)腸炎(UC)是一種原因尚不十分清楚的慢性非特異性結(jié)腸炎癥反應(yīng)。主要表現(xiàn)為連續(xù)彌漫性淺表性炎癥病變,病變主要累及黏膜和黏膜下層,黏膜基底部灶性或彌漫性漿細(xì)胞浸潤伴隱窩結(jié)構(gòu)變形破壞。UC的治療目前主要是緩解臨床癥狀,而其長期目標(biāo)則是預(yù)防殘疾和結(jié)直腸癌的發(fā)生[1-3]。基因芯片是一種非常成熟的基因檢測(cè)技術(shù),該方法可以高效、大規(guī)模的檢測(cè)生物樣本中的基因信息,特別適用于差異表達(dá)的基因篩選[4-5]。隨著基因芯片的廣泛應(yīng)用,目前已經(jīng)產(chǎn)生了大量的基因數(shù)據(jù),并且大部分?jǐn)?shù)據(jù)已經(jīng)上傳并存儲(chǔ)在公共數(shù)據(jù)庫中。整合和重新分析這些數(shù)據(jù)可以為研究提供有價(jià)值的線索[6]。本研究利用基因表達(dá)數(shù)據(jù)庫(GEO)中的芯片原始數(shù)據(jù)進(jìn)行差異基因分析,探討在UC轉(zhuǎn)歸過程中的關(guān)鍵基因并對(duì)其進(jìn)行初步生物信息學(xué)分析,以期為深入研究UC發(fā)生、發(fā)展的分子機(jī)制提供理論依據(jù)。
1.1材料 GSE38713數(shù)據(jù)集:基因表達(dá)數(shù)據(jù)庫(GEO)隸屬于美國國立衛(wèi)生研究院,是當(dāng)今最大、最全面的公共基因表達(dá)數(shù)據(jù)庫。從GEO數(shù)據(jù)庫中下載GSE38713數(shù)據(jù)集(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE38713),該數(shù)據(jù)集由Planell N,Salas A等于2012年上傳。選取其中正常人結(jié)直腸黏膜數(shù)據(jù)13例,UC活動(dòng)期黏膜數(shù)據(jù)23例,UC緩解期黏膜數(shù)據(jù)8例。樣本經(jīng)RNA提取、逆轉(zhuǎn)錄、熒光標(biāo)記等步驟處理后,與GPL570平臺(tái)(Affymetrix Human Genome U133 Plus 2.0 Array)雜交,經(jīng)圖像掃描、數(shù)據(jù)標(biāo)準(zhǔn)化處理后以CEL格式上傳至GEO數(shù)據(jù)庫。
1.2方法
1.2.1差異基因篩選 GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r/)是一個(gè)在線工具,可以比較GEO系列的不同樣本組,以便識(shí)別差異表達(dá)的基因。以 logFold Change (FC) ≥2.0,P值<0.05 作為篩選標(biāo)準(zhǔn),獲得UC活動(dòng)期、UC恢復(fù)期相比于正常人腸黏膜的差異基因。隨后將UC活動(dòng)期高表達(dá),恢復(fù)期表達(dá)降低的基因進(jìn)行交叉分析,并對(duì)其生物信息學(xué)進(jìn)行初步分析。
1.2.2基因本體論(GO)和DEGs的富集分析 GO數(shù)據(jù)庫(http://www.geneontology.org)可對(duì)基因組數(shù)據(jù)的功能分類,成為了生物信息分析物種注釋的必用數(shù)據(jù)庫。整體來說GO分為三個(gè)不同的本體,包括生物過程(BP),細(xì)胞成分(CC)和分子功能(MF)。GO分析是一種常見的基因和基因產(chǎn)物注釋方法。京都基因和基因組百科全書(KEGG,http://www.genome.ad.jp/kegg/)數(shù)據(jù)庫是整合基因組、化學(xué)和系統(tǒng)功能信息的數(shù)據(jù)庫??蛇M(jìn)行基因功能的系統(tǒng)分析,注釋和數(shù)據(jù)的可視化。Discovery(DAVID,http://david.abcc.ncifcrf.gov/)是一種基因功能分類的在線工具,是高通量基因分析,理解基因生物學(xué)意義的重要基礎(chǔ)。在本研究中,為了分析DEG的功能,使用DAVID在線工具對(duì)UC活動(dòng)期表達(dá)上調(diào),恢復(fù)期表達(dá)下調(diào)的差異基因進(jìn)行GO富集和KEGG途徑分析,篩選條件為P<0.05。
1.2.3蛋白質(zhì) —蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)構(gòu)建及核心關(guān)鍵基因分析 STRING(http://string.embl.de/)是一個(gè)用于預(yù)測(cè)蛋白質(zhì)與蛋白質(zhì)相互作用(PPI)信息的生物學(xué)數(shù)據(jù)庫。將DEG映射到STRING以評(píng)估交互關(guān)系,可信度≥0.4被定義為顯著。 然后使用Cytoscape,一種用于構(gòu)建生物分子相互作用網(wǎng)絡(luò)的生物圖形可視化工具,構(gòu)建PPI網(wǎng)絡(luò)。最后基于STRING數(shù)據(jù),利用cytohubba中的三種算法解析核心關(guān)鍵基因。
2.1差異基因篩選 剔除重復(fù)探針后發(fā)現(xiàn),與正常人結(jié)腸黏膜相比,UC活動(dòng)期結(jié)腸黏膜中有587個(gè)差異基因,其中410個(gè)表達(dá)上調(diào),177個(gè)表達(dá)下調(diào)。UC恢復(fù)期腸黏膜相比活動(dòng)期結(jié)腸黏膜有373個(gè)差異基因,其中289個(gè)表達(dá)下調(diào),84個(gè)表達(dá)上調(diào)(表1)。交叉分析顯示,在UC活動(dòng)期表達(dá)上調(diào)而恢復(fù)期表達(dá)下調(diào)的基因有202個(gè)(圖1)。
表1 不同組別間顯著差異表達(dá)基因
注:*只列出部分差異表達(dá)基因。
注:A: UC活動(dòng)期表達(dá)上調(diào)的基因;B: UC恢復(fù)期表達(dá)下調(diào)的基因圖1 不同組別差異表達(dá)基因韋恩圖
2.2GO term及 KEGG富集分析 為了進(jìn)一步解析UC活動(dòng)期表達(dá)上調(diào),恢復(fù)期表達(dá)下調(diào)的202個(gè)差異基因的功能,將這些差異基因上傳到DAVID,以確定重要的GO類別和KEGG途徑。 GO分析結(jié)果顯示差異基因在BP中的顯著富集主要包括炎癥反應(yīng),趨化因子介導(dǎo)的信號(hào)通路以及白細(xì)胞遷移等(圖2 A); MF分析顯示,差異基因具備趨化因子活性,絲氨酸型內(nèi)肽酶活性及糖基化終產(chǎn)物受體結(jié)合活性等(圖2 B); CC分析顯示,差異基因富集在胞外間隙、胞外區(qū)和細(xì)胞外基質(zhì)等(圖2 C);KEGG分析顯示,差異基因顯著富集在補(bǔ)體和凝血級(jí)聯(lián)反應(yīng)途徑、趨化因子信號(hào)通路途徑、細(xì)胞因子—細(xì)胞因子受體相互作用途徑、Toll樣受體(TLR)信號(hào)通路等(圖2 D)。
圖2 差異基因的GO及KEGG分析
2.3PPI網(wǎng)絡(luò)構(gòu)建和分析 關(guān)鍵基因DEGs的PPI網(wǎng)絡(luò)由STRING數(shù)據(jù)庫(版本11.0)中構(gòu)建的153個(gè)節(jié)點(diǎn)和1058個(gè)邊緣組成,并使用Cytoscape軟件可視化(圖3)。從拓?fù)鋵W(xué)角度通過cytohubba中最大鄰域分量密度、程度和最大中心性在內(nèi)的三種中心算法獲取了PPI網(wǎng)絡(luò)中的hub關(guān)鍵基因[7](圖4)。
圖3 蛋白互作分析
圖4 hub關(guān)鍵基因
隨著DNA微陣列和高通量測(cè)序技術(shù)的發(fā)展,在基因水平上研究包括UC在內(nèi)的疾病已成為很常用的方法?;蛐酒褟V泛應(yīng)用于探索疾病發(fā)生、診斷和治療中的差異表達(dá)基因。目前對(duì)UC發(fā)病的相關(guān)基因的研究已經(jīng)取得一定進(jìn)展,但在UC進(jìn)展中的作用尚不十分明確,需要進(jìn)一步探究以便更好地針對(duì)其進(jìn)行靶向治療。在本研究中,我們從GSE38713中提取數(shù)據(jù),并利用生物信息學(xué)篩選出在UC活動(dòng)期表達(dá)上調(diào),恢復(fù)期表達(dá)下調(diào)的差異基因202個(gè)。GO term分析表明這些差異基因在 BP的顯著富集主要包括炎癥反應(yīng),趨化因子介導(dǎo)的信號(hào)通路以及白細(xì)胞遷移等。這符合目前對(duì)UC發(fā)病原因的認(rèn)識(shí),即UC與遺傳易感性、環(huán)境、微生物因素、腸上皮屏障功能及免疫反應(yīng)等因素有關(guān)。其中白細(xì)胞的快速募集和不適當(dāng)?shù)臏羰锹匝装Y的標(biāo)志,也是UC潛在的治療靶點(diǎn)[8]。KEGG分析顯示,差異基因顯著富集在補(bǔ)體和凝血級(jí)聯(lián)反應(yīng)途徑、趨化因子信號(hào)通路途徑、細(xì)胞因子—細(xì)胞因子受體相互作用途徑、Toll樣受體(TLR)信號(hào)通路等。研究認(rèn)為UC的發(fā)病可能與TLRs的表達(dá)及隨后炎性細(xì)胞因子的釋放有關(guān)[9-10]。因此,研究這些信號(hào)通路有助于預(yù)測(cè)UC的進(jìn)展。
用DEGS構(gòu)建PPI網(wǎng)絡(luò),獲得了hub基因CCR2、CXCL2、CXCL9、CCL4、CXCR2、CXCL11、CXCL5、AGT、SELE和CASP1。其中CCR2、CXCL2、CXCL9、CCL4、CXCR2、CXCL11、CXCL5均屬趨化因子家族成員。CCR2屬于G蛋白偶聯(lián)受體(GPCR)超家族成員,并且是單核細(xì)胞趨化蛋白1~4(MCP1~4) 的受體。CCR2主要針對(duì)的病癥包括類風(fēng)濕性關(guān)節(jié)炎、多發(fā)性硬化等,有研究認(rèn)為CCR2高表達(dá)與結(jié)直腸癌患者較短的總生存期有關(guān)[8-11]。CXCL2屬于CXC趨化因子家族,也稱為巨噬細(xì)胞炎癥蛋白2-α(MIP2-α),其也是強(qiáng)大的中性粒細(xì)胞趨化因子,參與許多免疫反應(yīng),包括傷口愈合、腫瘤轉(zhuǎn)移和血管生成[12]。有研究提出可以把檢測(cè)CXCL2等趨化因子 mRNA含量作為反應(yīng)UC腸黏膜炎癥分級(jí)的一種簡單、客觀的方法[13]。CXCL9是一種由干擾素-γ誘導(dǎo)的T細(xì)胞趨化因子。研究發(fā)現(xiàn)血清CXCL9水平與UC疾病活動(dòng)有關(guān),它是患者對(duì)治療反應(yīng)的一個(gè)指標(biāo),阻斷CXCL9可作為治療中重度活動(dòng)期UC的一種有效的治療方法[14]。CCL4又被稱為 巨噬細(xì)胞炎癥蛋白-1β(M IP-1β),有研究在評(píng)價(jià)UC治療效果時(shí)把CCL4的降低作為重要的評(píng)價(jià)指標(biāo)[15]。CXCR2在實(shí)驗(yàn)性UC中起著重要的病理生理作用,提示CXCR2的可以作為UC藥物治療的新靶點(diǎn)[16]。CXCL11、CXCL5循環(huán)水平增加對(duì)UC患者的腸道局部炎癥和組織損傷有重要影響[17]。探索阻斷這些炎癥介質(zhì)的方法可以作為減輕甚至逆轉(zhuǎn)UC癥狀的重要途徑。AGT(血管緊張素原)是一種能引起血管收縮和血壓升高的肽類激素。研究發(fā)現(xiàn),AGT-6和TGFβ1密碼子25變異在克羅恩病表型形成中具有重要作用[18]。血管緊張素原與UC的相關(guān)性還未見報(bào)道。SELE(E-選擇素)和CASP1(Caspase-1)又稱IL-1轉(zhuǎn)換酶,作為炎癥反應(yīng)的始發(fā)者,它在細(xì)胞免疫中起著重要的作用。一旦被激活,可以導(dǎo)致兩種炎性細(xì)胞因子IL-1β和IL-18激活從而進(jìn)一步誘導(dǎo)相鄰細(xì)胞的炎癥反應(yīng)[19]。研究發(fā)現(xiàn)抑制NRLP3/ASC/Caspase-1通路的激活可以對(duì)抗葡聚糖硫酸鈉誘導(dǎo)的潰瘍性結(jié)腸炎[20]。
綜上所述,本研究對(duì)UC活動(dòng)期表達(dá)上調(diào),恢復(fù)期表達(dá)下調(diào)的差異基因進(jìn)行了廣泛的生物信息學(xué)分析,揭示了一系列重要的影響UC發(fā)生和發(fā)展的靶點(diǎn)和途徑,為今后的研究奠定了基礎(chǔ)。這些發(fā)現(xiàn)增加了我們對(duì)該病的診斷和治療的認(rèn)識(shí)。