智鵬柯,石 見,周 博,楊言通,陳 曄△
河南科技大學(xué)第一附屬醫(yī)院:1.胃腸腫瘤外科;2.神經(jīng)內(nèi)科,河南洛陽 471003
胃癌發(fā)病率位居我國惡性腫瘤第3位,其病死率位居惡性腫瘤第2位[1]。我國胃癌患者被發(fā)現(xiàn)時(shí)70%已為進(jìn)展期,5年生存率僅30%[2]。目前,胃癌的靶向治療只有抗Her-2治療,其在晚期胃癌中可延長中位生存時(shí)間2.7個(gè)月,但胃癌患者Her-2陽性率不足20%,大部分患者無靶向治療機(jī)會(huì)[3]。因此,了解胃癌發(fā)生和轉(zhuǎn)移的分子機(jī)制,從而制訂有效的診斷和治療策略至關(guān)重要。在過去的幾十年中,隨著微陣列技術(shù)和生物信息學(xué)分析方法的廣泛應(yīng)用,越來越多的腫瘤發(fā)生、發(fā)展過程中的差異表達(dá)基因(DEGs)和功能通路被發(fā)現(xiàn)[4]。本研究通過生物信息學(xué)方法分析GSE54129微陣列數(shù)據(jù)集篩選胃癌標(biāo)本與正常胃黏膜標(biāo)本之間的DEGs,隨后將DEGs導(dǎo)入基因本體論(GO)和基因組百科全書(KEGG)進(jìn)行通路富集分析,然后構(gòu)建蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)并篩選關(guān)鍵基因,最后進(jìn)行驗(yàn)證并預(yù)測調(diào)控VCAN的上游miRNAs,旨在了解胃癌發(fā)生、發(fā)展的分子機(jī)制,也為胃癌的基因靶向治療提供新思路和新途徑。
1.1芯片數(shù)據(jù)來源 搜索GEO(http://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫中關(guān)于人類胃癌標(biāo)本的基因芯片數(shù)據(jù),選取并下載數(shù)據(jù)集GSE54129,芯片平臺為GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array,表達(dá)數(shù)據(jù)為expression profiling by array,此芯片包含132份標(biāo)本,其中有111份為胃癌組織標(biāo)本,21份為正常胃黏膜組織標(biāo)本。
1.2數(shù)據(jù)處理 使用GEO數(shù)據(jù)庫在線工具GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r/)[5]分析數(shù)據(jù)集GSE54129中正常胃黏膜組織標(biāo)本與胃癌組織標(biāo)本的有效基因數(shù)據(jù),之后將基因芯片數(shù)據(jù)集中的探針名轉(zhuǎn)化成基因名,排除重復(fù)及無名基因,以adj.P<0.01且|log2FC|>2為標(biāo)準(zhǔn)篩選DEGs。
1.3功能富集分析 DAVID(https://david.ncifcrf.gov/)[6]提供了一套全面的基因功能注釋工具,通過對GO分析及KEGG通路的功能富集分析,以了解DEGs背后的生物學(xué)含義。當(dāng)FDR<0.05時(shí)可認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
1.4PPI網(wǎng)絡(luò)構(gòu)建及功能模塊分析 使用在線數(shù)據(jù)庫STRING(https://string-db.org/)[7]分析DEGs的PPI網(wǎng)絡(luò),并將得到的數(shù)據(jù)以.tvs格式導(dǎo)出,之后導(dǎo)入Cytoscape軟件[8]中構(gòu)建可視化PPI網(wǎng)絡(luò),并使用MCODE插件對PPI網(wǎng)絡(luò)進(jìn)行聚類分析,將得到的聚類基因再次導(dǎo)入DAVID數(shù)據(jù)庫,進(jìn)行富集分析。
1.5關(guān)鍵基因篩選與驗(yàn)證分析 使用Cytoscape中的cytoHubba軟件選取關(guān)鍵基因,采用MCC算法,提取前10個(gè)基因,然后與MCODE聚類分析得到的degree>15的模塊基因進(jìn)行比對,得到重合的基因定義為候選基因,之后利用在線數(shù)據(jù)庫GEPIA(http://gepia.cancer-pku.cn)[9]對候選基因在408份胃癌組織標(biāo)本與211份正常胃黏膜組織標(biāo)本中的表達(dá)水平進(jìn)行對比分析,并繪制生存曲線,將與生存時(shí)間相關(guān)的基因定義為關(guān)鍵基因。
1.6組織標(biāo)本RNA提取及實(shí)時(shí)熒光定量聚合酶鏈反應(yīng)(qRT-PCR)驗(yàn)證 分析30例未接受過術(shù)前新輔助治療的胃癌患者術(shù)后標(biāo)本,其中男18例,女12例,中位年齡58歲。手術(shù)標(biāo)本離體后30 min內(nèi)采集組織標(biāo)本,包括胃癌組織標(biāo)本及正常胃黏膜組織標(biāo)本(距腫瘤邊緣至少5 cm),并立即置于液氮中,保存于-80 ℃冰箱中。使用Trizol試劑(碧云天生物技術(shù)有限公司,中國)從組織標(biāo)本中提取總RNA。然后,加入反轉(zhuǎn)錄試劑及隨機(jī)引物(Western Biotechnology)合成cDNA。之后,加入sybr greenⅠ后進(jìn)行qRT-PCR(Funglyn Biotech,Canada)檢測。反應(yīng)參數(shù)包括變性程序(95 ℃下5 min),然后是40個(gè)循環(huán)(95 ℃下15 s,65 ℃下45 s)的擴(kuò)增和定量程序。每份標(biāo)本都進(jìn)行了一式三份的測試,每份標(biāo)本都進(jìn)行了熔解曲線分析,以檢查擴(kuò)增的特異性。關(guān)鍵基因的引物序列見表1。以同一mRNA標(biāo)本中關(guān)鍵基因與內(nèi)對照GAPDH的比值確定關(guān)鍵基因的表達(dá)水平。
表1 3個(gè)基因的qRT-PCR引物序列
1.7VCAN與miRNAs關(guān)系預(yù)測 為了了解VCAN與胃癌的發(fā)生、發(fā)展機(jī)制的關(guān)系,通過Target Scan7.2(http://www.targetscan.org/)在線數(shù)據(jù)庫[10]來預(yù)測VCAN上游的調(diào)控miRNAs。
2.1胃癌組織與正常胃黏膜組織的DEGs 通過對基因數(shù)據(jù)集GSE54129的分析,得到了630個(gè)DEGs,包括305個(gè)上調(diào)基因和325個(gè)下調(diào)基因。使用DAVID數(shù)據(jù)庫對630個(gè)DEGs進(jìn)行GO分析和KEGG通路富集分析。GO分析主要從生物過程、細(xì)胞組成及分子功能3個(gè)層面進(jìn)行分析。DEGs參與的生物過程主要包括細(xì)胞外基質(zhì)組織形成、細(xì)胞黏附、內(nèi)胚層細(xì)胞分化、血管生成正調(diào)控、外源代謝過程等;細(xì)胞組成分析結(jié)果表明DEGs大多參與蛋白質(zhì)細(xì)胞外基質(zhì)、細(xì)胞外基質(zhì)、細(xì)胞外區(qū)域、細(xì)胞外間隙、胞外體等組成;分子功能分析提示這些基因主要在肝素結(jié)合、視黃醇脫氫酶活性、細(xì)胞外基質(zhì)結(jié)構(gòu)成分方面起作用。KEGG通路富集分析結(jié)果表明,DEGs功能分析主要涉及化學(xué)致癌信號通路、細(xì)胞色素P450的外源化合物代謝信號通路、藥物代謝-細(xì)胞色素P450信號通路、視黃醇代謝信號通路和黏合斑信號通路。
2.2DEGs的PPI網(wǎng)絡(luò)分析 將630個(gè)DEGs輸入在線數(shù)據(jù)庫STRING中,之后將所得的數(shù)據(jù)導(dǎo)入Cytoscape軟件中,得到蛋白質(zhì)共表達(dá)網(wǎng)絡(luò),然后利用插件cytoHubba中MMC算法找出前10位的基因?yàn)門IMP1、FN1、IGFBP4、C3、FSTL1、APOE、SPP1、IGFBP7、CYR61、VCAN。
2.3PPI功能模塊分析 利用Cytoscape軟件中的MCODE插件對PPI網(wǎng)絡(luò)進(jìn)行聚類分析,分?jǐn)?shù)最高的模塊被納入。該模塊包括41個(gè)功能基因,degree>15的共19個(gè),由高到低分別為C3、COL1A1、COL1A2、COL4A1、COL4A2、CTGF、CXCR4、CYR61、FN1、FSTL1、IGFBP4、IGFBP7、MMP2、SERPINE1、SPARC、TGFB1、THBS1、THBS2、VCAN。然后將它們導(dǎo)入DAVID數(shù)據(jù)庫進(jìn)行GO分析及KEGG 通路富集分析,結(jié)果表明聚類基因參與的生物過程主要包括細(xì)胞外基質(zhì)組織形成、膠原分解代謝過程、炎性反應(yīng)、細(xì)胞黏附、中性粒細(xì)胞趨化性的正調(diào)控等;細(xì)胞組成分析顯示這些基因大多參與細(xì)胞外區(qū)域、細(xì)胞外基質(zhì)、細(xì)胞外間隙、蛋白質(zhì)細(xì)胞外基質(zhì)和內(nèi)質(zhì)網(wǎng)腔等組成;分子功能的作用主要體現(xiàn)在細(xì)胞外基質(zhì)結(jié)構(gòu)成分及肝素結(jié)合方面。KEGG通路富集分析結(jié)果表明,DEGs主要參與細(xì)胞外基質(zhì)受體相互作用、蛋白質(zhì)消化吸收和黏合斑等信號通路調(diào)節(jié)。
2.4關(guān)鍵基因篩選及驗(yàn)證 將cytoHubba軟件計(jì)算得到的基因與MCODE軟件計(jì)算的degree>15的基因進(jìn)行比對,共得到5個(gè)候選基因,分別為VCAN、IGFBP7、FSTL1、FN1、C3。之后在GEPLIA數(shù)據(jù)庫中對候選基因在408份胃癌組織標(biāo)本和211份正常胃黏膜組織標(biāo)本中的表達(dá)水平進(jìn)行分析,發(fā)現(xiàn)它們在胃癌組織標(biāo)本中均高表達(dá),且差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。最后關(guān)鍵基因的生存曲線分析結(jié)果顯示,在胃癌組織中VCAN、IGFBP7、FSTL1高表達(dá)組的生存率明顯低于低表達(dá)組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),表明高表達(dá)的關(guān)鍵基因與患者的不良預(yù)后關(guān)系密切,并且VCAN高表達(dá)胃癌患者與不良預(yù)后的關(guān)系更加密切。為了進(jìn)一步驗(yàn)證生物信息學(xué)分析的結(jié)果,采用qRT-PCR檢測了30例胃癌患者配對的胃癌組織和正常胃黏膜組織標(biāo)本中3個(gè)關(guān)鍵基因(VCAN、IGFBP7和FTSL1)的mRNA水平,結(jié)果顯示3個(gè)關(guān)鍵基因在胃癌組織中均明顯上調(diào)(P<0.001),見圖1。
注:A、B、C分別為VCAN、IGFBP7和FTSL1的表達(dá)情況;正常胃黏膜組織與胃癌組織比較;*P<0.05。圖1 關(guān)鍵基因PCR結(jié)果分析
2.5VCAN與miRNAs相互作用預(yù)測結(jié)果 使用Target Scan7.2數(shù)據(jù)庫預(yù)測出has-miR-203a-3p.1直接參與VCAN mRNA的3′UTR結(jié)合,has-miR-203a-3p.1是VCAN轉(zhuǎn)錄后的調(diào)節(jié)因子。
胃癌是我國最常見的惡性腫瘤之一,全球大約60%新發(fā)胃癌病例來自東亞,特別是中國[1]。目前,尚缺乏胃癌早期診斷的敏感生物標(biāo)志物,因此,許多胃癌患者在被發(fā)現(xiàn)時(shí)已處于局部晚期或伴發(fā)肝、肺等遠(yuǎn)處轉(zhuǎn)移,從而失去臨床治愈機(jī)會(huì)[10-11]。越來越多的研究者將目光集中在尋找新的胃癌生物標(biāo)志物上,期待將其用于胃癌的早期診斷和復(fù)發(fā)預(yù)測[12]。
本研究采用生物信息學(xué)方法對GEO數(shù)據(jù)庫中的111份胃癌組織標(biāo)本和21份正常胃黏膜組織標(biāo)本的基因數(shù)據(jù)集進(jìn)行對比分析,發(fā)現(xiàn)共有630個(gè)DEGs,包括305個(gè)上調(diào)基因和325個(gè)下調(diào)基因。為了進(jìn)一步了解DEGs的功能,本研究進(jìn)行了GO分析和KEGG通路富集分析,生物過程主要涉及細(xì)胞外基質(zhì)組織形成、血管生成正調(diào)控、細(xì)胞黏附等;細(xì)胞組成分析說明這些基因基本參與蛋白質(zhì)細(xì)胞外基質(zhì)、細(xì)胞外區(qū)域、細(xì)胞外基質(zhì)等的組成;分子功能的變化主要集中在肝素結(jié)合、視黃醇脫氫酶活性、細(xì)胞外基質(zhì)結(jié)構(gòu)成分。KEGG通路富集分析主要涉及化學(xué)致癌信號通路等。健康人體的血管網(wǎng)絡(luò)生成于胚胎時(shí)期,成年后血管生成處于內(nèi)源性正調(diào)節(jié)和負(fù)調(diào)節(jié)的精確平衡中[13]。當(dāng)正調(diào)節(jié)加強(qiáng)時(shí),則促進(jìn)血管生成,參與腫瘤的發(fā)生。聚類基因分析的結(jié)果顯示,生物過程主要涉及細(xì)胞外基質(zhì)組織形成、炎性反應(yīng)、細(xì)胞黏附等;KEGG通路主要涉及細(xì)胞外基質(zhì)受體相互作用、蛋白質(zhì)消化吸收等。以上結(jié)果與另一項(xiàng)關(guān)于胃癌關(guān)鍵基因的生物信息學(xué)分析結(jié)果相似[14]。細(xì)胞外基質(zhì)由膠原蛋白、蛋白聚糖和糖蛋白組成。由跨膜分子介導(dǎo)的細(xì)胞外基質(zhì)與上皮細(xì)胞之間的相互作用可直接影響細(xì)胞黏附、遷移、分化、增殖和凋亡,這些生物過程在腫瘤的發(fā)生、發(fā)展中都起到重要作用[15]。
通過PPI網(wǎng)絡(luò)篩選的3個(gè)關(guān)鍵基因,在GEPIA數(shù)據(jù)庫中驗(yàn)證后得到VCAN的高表達(dá)與胃癌患者不良預(yù)后關(guān)系密切的結(jié)論,與SHEN等[16]的研究結(jié)果一致。最近有研究結(jié)果提示VCAN可作為胃癌早期診斷的標(biāo)志物[17]。VCAN編碼的蛋白質(zhì)是大分子硫酸軟骨素蛋白聚糖,是細(xì)胞外基質(zhì)的主要成分。該蛋白參與細(xì)胞黏附、增殖、遷移和血管生成,并在組織形態(tài)發(fā)生和維持中起關(guān)鍵作用[16]。既往研究發(fā)現(xiàn),VCAN在創(chuàng)傷修復(fù)組織和腫瘤組織中高表達(dá),其中包括腎癌、肝細(xì)胞癌、結(jié)直腸癌、膽囊癌、子宮內(nèi)膜癌和胃癌等惡性腫瘤,且與腫瘤的低分化率、高轉(zhuǎn)移率及不良預(yù)后關(guān)系密切[18-22]。miRNAs是由19~25個(gè)核苷酸組成的短RNA分子,它能靶向結(jié)合mRNA的3′UTR區(qū)域來調(diào)節(jié)靶基因的轉(zhuǎn)錄后沉默[23]。本研究還預(yù)測了調(diào)控VCAN的轉(zhuǎn)錄后調(diào)節(jié)因子has-miR-203a-3p.1。有研究表明,miR-203a-3p.1促進(jìn)肝癌細(xì)胞增殖和轉(zhuǎn)移[21]。過表達(dá) miR-203a-3p可抑制Barrett食管細(xì)胞增殖[24]。miR-203a-3p通過抑制PDE4D的表達(dá)促進(jìn)結(jié)直腸癌細(xì)胞增殖、侵襲和遷移[22]。
綜上所述,通過生物信息學(xué)方法分析確定了胃癌的DEGs,之后的富集分析和PPI網(wǎng)絡(luò)分析明確了VCAN在胃癌中的表達(dá)明顯升高,最后,預(yù)測了胃癌中has-miR-203a-3p.1可調(diào)節(jié)VCAN的表達(dá)。has-miR-203a-3p.1- VCAN軸是胃癌治療的潛在靶點(diǎn)。