蔣向輝, 徐玉平
(凱里學(xué)院大健康學(xué)院,貴州 凱里 556011)
食管癌(esophageal cancer,ESCA)是世界上最多見(jiàn)癌癥類(lèi)型之一.根據(jù)《2021年全球癌癥統(tǒng)計(jì)》,它的發(fā)病率位居第十,死亡率位居第六[1].食管癌的5年生存率為20%,且因性別而有很大差異[2].根據(jù)組織學(xué)分類(lèi),食管癌可分為食管腺癌(esophageal adenocar cinoma,EAC)和食管鱗癌(esophageal squamous cell carcinoma,ESCC).近十年來(lái),食管腺癌發(fā)病率在世界各地均呈現(xiàn)逐年增長(zhǎng)的趨勢(shì)[3],嚴(yán)重危害了人類(lèi)的生命健康.茯苓為多孔菌科真菌茯苓Poriscocos(Schw.) Wolf的干燥菌核,是傳統(tǒng)的藥食兩用中藥,現(xiàn)代藥理學(xué)研究表明,茯苓具有抗腫瘤、抗肝纖維化、免疫調(diào)節(jié)、抗過(guò)敏等功效[4].研究食管癌的發(fā)病機(jī)制并挖掘茯苓治療食管癌的潛在作用靶點(diǎn)將為食管癌的早期篩查和治療提供重要參考.
加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)是用于探索不同樣本之間高度相關(guān)基因模塊的系統(tǒng)生物學(xué)方法[5],通過(guò)分析模塊與臨床性狀的關(guān)聯(lián),挖掘出與臨床性狀緊密相關(guān)的關(guān)鍵模塊,經(jīng)過(guò)模塊內(nèi)分析和網(wǎng)絡(luò)可視化識(shí)別模塊內(nèi)的關(guān)鍵基因,這有助于找到與食管癌發(fā)生發(fā)展相關(guān)的核心基因.WGCNA方法已廣泛應(yīng)用于腫瘤和其他疾病的預(yù)后標(biāo)志物和治療靶點(diǎn)的篩選,特別是在膠質(zhì)母細(xì)胞瘤[6]、前列腺癌[7]等多種癌癥當(dāng)中得到了廣泛的應(yīng)用,效果較好.本研究基于差異表達(dá)分析篩選出TCGA-ESCA數(shù)據(jù)集和GSE22954數(shù)據(jù)集中的差異表達(dá)基因,運(yùn)用WGCNA方法進(jìn)行模塊化分析找出與食管癌顯著相關(guān)的基因模塊,通過(guò)比較兩個(gè)關(guān)鍵模塊中的差異表達(dá)基因,獲得最終的食管癌相關(guān)基因.對(duì)食管癌相關(guān)基因進(jìn)行g(shù)ene ontology (GO) 分析和kyoto encyclopedia of genes and genomes (KEGG) 富集分析,并進(jìn)行蛋白質(zhì)相互作用分析將核心基因可視化,進(jìn)行生存分析對(duì)核心基因進(jìn)行外部驗(yàn)證,利用臨床相關(guān)性分析來(lái)考察關(guān)鍵基因在不同臨床分組間的表達(dá)差異,借助HPA數(shù)據(jù)庫(kù)驗(yàn)證基因在蛋白水平的表達(dá).研究結(jié)果表明MCM2、CHAF1A的低表達(dá)與食管癌患者的生存期惡化有關(guān),為食管癌的臨床診治開(kāi)創(chuàng)了新思路.
茯苓有效活性成分及其作用靶點(diǎn)篩選→食管癌轉(zhuǎn)錄組數(shù)據(jù)與GEO數(shù)據(jù)交集基因篩選→交集基因GO和KEGG富集分析→食管癌關(guān)鍵基因篩選→關(guān)鍵基因臨床分析→小鼠食管癌模型構(gòu)建→茯苓水煎液對(duì)食管癌關(guān)鍵基因表達(dá)影響檢測(cè).
在TCMSP數(shù)據(jù)庫(kù)(https://tcmspw.com/tcmsp.php)中獲取茯苓所有的活性成分.根據(jù)篩選指標(biāo):口服生物利用度(oral bioavailability, OB) ≥ 30%、類(lèi)藥性(drug likeness, DL) ≥ 0.18,得出茯苓的主要活性成分及其對(duì)應(yīng)的靶點(diǎn)[8].利用universal protein (Uniprot)數(shù)據(jù)庫(kù)將靶基因全稱(chēng)置換為基因symbol,刪除重復(fù)項(xiàng)后將基因名輸入STRING數(shù)據(jù)庫(kù)(https://string-db.org/),構(gòu)建蛋白互作(protein-protein interaction,PPI)網(wǎng)絡(luò)圖.借助Cytoscape軟件篩選出前6個(gè)抗食管癌的候選藥物作用靶點(diǎn).
在TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)中下載的轉(zhuǎn)錄組數(shù)據(jù)共有171例樣本,其中包括160例食管癌和11例正常組織,共19 600個(gè)基因.在TCGA數(shù)據(jù)庫(kù)中下載的臨床數(shù)據(jù)共183例樣本.從GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/gds)中下載的GSE22954數(shù)據(jù)集共有90例樣本,其中包括80例正常樣本和10例食管癌樣本,將基因探針轉(zhuǎn)換為基因名,去重后共獲得8 622個(gè)基因用于后續(xù)分析.
R語(yǔ)言運(yùn)行WGCNA數(shù)據(jù)包,將TCGA-ESCA和GSE22954的基因表達(dá)數(shù)據(jù)譜構(gòu)建成共表達(dá)網(wǎng)絡(luò),創(chuàng)建基因聚類(lèi)樹(shù)狀圖.參照Miller等[9]驗(yàn)證特定的模塊與正常、腫瘤狀態(tài)的關(guān)聯(lián)性,并繪制模塊—性狀熱圖,鑒定出關(guān)鍵模塊.其中,相關(guān)系數(shù)絕對(duì)值最大的模塊被看作是與臨床性狀緊密相關(guān)的關(guān)鍵模塊,將用于后續(xù)分析.此外,通過(guò)對(duì)基因顯著性(gene significance,GS)和模塊隸屬度(module membership,MM)相關(guān)性進(jìn)行計(jì)算,以衡量基因與臨床性狀、基因與各模塊特征基因的相關(guān)性.
參照Miao等的方法[10],將limma數(shù)據(jù)包分別應(yīng)用于TCGA-ESCA和GSE22954數(shù)據(jù)集中篩選食管癌組織和正常組織之間的差異表達(dá)基因(differentially expressed genes,DEGs).接著運(yùn)用R軟件的ggplot2數(shù)據(jù)包,將TCGA-ESCA和GSE22954數(shù)據(jù)集的DEGs可視化為火山圖;運(yùn)行pheatmap數(shù)據(jù)包繪制DEGs的熱圖,運(yùn)行VennDiagram數(shù)據(jù)包,將關(guān)鍵模塊中的基因和差異表達(dá)基因取交集,獲得最終的食管癌相關(guān)基因,并以韋恩圖的形式呈現(xiàn).將最終的食管癌相關(guān)基因與茯苓的前6個(gè)候選藥物作用靶點(diǎn)進(jìn)行對(duì)比,最終確定茯苓抗食管癌的潛在作用靶點(diǎn).
參照Yu等[11]的方法利用R軟件運(yùn)行org.Hs.eg.db數(shù)據(jù)包將基因名轉(zhuǎn)換成基因ID,再利用clusterProfiler、ggplot2和enrichplot數(shù)據(jù)包對(duì)食管癌相關(guān)基因進(jìn)行GO和KEGG富集分析.借助KEGG orthology based annotation system (KOBAS) 數(shù)據(jù)庫(kù)(http://kobas.cbi.pku.edu.cn/download.php)中的Gene-list Enrichment功能,檢索出基因富集最顯著的代謝通路圖.
參照Szklarczyk等[12]的方法借助STING工具構(gòu)建食管癌相關(guān)基因的PPI網(wǎng)絡(luò)圖,導(dǎo)出PPI數(shù)據(jù),Shannon等[13]的方法使用Cytoscape對(duì)其進(jìn)行可視化分析,并進(jìn)行核心基因的查找.已有研究發(fā)現(xiàn),最大團(tuán)中心性(maximal clique centrality,MCC)算法是尋找PPI網(wǎng)絡(luò)中關(guān)鍵節(jié)點(diǎn)最有效的方法[14],下載Cytoscape軟件的插件CytoHubba,利用它計(jì)算每個(gè)節(jié)點(diǎn)的MCC值并排序.本研究參照張燕玲等[15]的方法,將MCC值位于前十的基因作為核心基因.
根據(jù)在TCGA數(shù)據(jù)庫(kù)中下載的食管癌相關(guān)核心基因的表達(dá)量,將食管癌患者分成高低表達(dá)兩組.運(yùn)行R語(yǔ)言的survival數(shù)據(jù)包對(duì)核心基因進(jìn)行總生存期(overall surviva, OS) 分析,使用gene expression profiling interactive analysis (GEPIA2) 數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn/index.html)進(jìn)行無(wú)病生存期(disease free survival, DFS)分析[16],方法選擇RFS,按中位數(shù)分組,腫瘤名稱(chēng)選擇食管癌.若p< 0.05,則說(shuō)明該核心基因的表達(dá)差異對(duì)食管癌患者的生存期惡化具有顯著影響.提取臨床數(shù)據(jù)中的臨床性狀,只保留分期列與基因ID列,并按分期進(jìn)行排序.運(yùn)行R語(yǔ)言的ggpubr數(shù)據(jù)包對(duì)核心基因進(jìn)行臨床相關(guān)性分析,當(dāng)不同分期之間的p< 0.05,則說(shuō)明該核心基因在食管癌患者不同分期間的表達(dá)差異具有統(tǒng)計(jì)學(xué)意義.
借助HPA數(shù)據(jù)庫(kù)(https://www.proteinatlas.org)獲取核心基因在正常樣品與食管癌樣品中的免疫組化圖片,觀察基因在正常樣品與食管癌樣品間是否真的具有差異.
1.10.1 不同濃度茯苓水煎液的制備 參照Huang等[17]的方法,取茯苓200 g于90 ℃下水煎三次,每次加水300 mL,過(guò)濾,合并三次濾液,40 ℃下減壓蒸餾,得浸膏18 g,加水90 mL得濃度為0.2 g·mL-1的水提液母液(高濃度),取母液30 mL分別稀釋2倍和5倍,制得濃度為0.1 g·mL-1(中濃度)和0.04 g·mL-1(低濃度)的2種茯苓水煎液稀釋液.
1.10.2 小鼠食管癌模型構(gòu)建與關(guān)鍵基因表達(dá)量檢測(cè) 雄性SCID小鼠(20~25 g)后肢皮下注射約6×105個(gè)ECA109細(xì)胞,40只荷瘤小鼠共分成四組,接種后3周開(kāi)始灌胃茯苓水煎液,實(shí)驗(yàn)組茯苓水煎液濃度分別為0.2 g·mL-1(高濃度)、0.1 g·mL-1(中濃度)和0.04 g·mL-1(低濃度),正常組給等量的水,每日給藥1次,連續(xù)15 d.采用TRIZOL試劑分離小鼠食管總RNA,將總RNA逆轉(zhuǎn)錄成cDNA,采用qRT-PCR方法檢測(cè)關(guān)鍵基因mRNA表達(dá)水平,參照Rubie等[18]的方法以人的磷酸甘露糖酶HMM1基因作為內(nèi)參基因,qPCR引物序列見(jiàn)表1.
表1 關(guān)鍵基因RT-PCR檢測(cè)引物
在TCMSP數(shù)據(jù)庫(kù)中檢索到茯苓的活性成分共34種,經(jīng)篩選得15種有效活性成分(見(jiàn)表2):去氫齒孔酸、常春藤皂苷元、茯苓新酸C、茯苓新酸B、茯苓新酸A、茯苓酸、3β-羥基-24-亞甲基-8-羊毛甾-21-酸、多孔覃酸C、過(guò)氧化麥角甾醇、星魚(yú)甾醇、去氫土莫酸、啤酒甾醇、去氫茯苓酸、栓菌酸、3β,16α-二羥基羊毛甾-7, 9 (11), 24-三烯-21-酸.其中去氫齒孔酸的OB、DL值最高,故去氫齒孔酸可能是茯苓發(fā)揮功效的核心活性成分.
表2 茯苓有效活性成分的相關(guān)信息
檢索有效活性成分的靶點(diǎn)并去重,最終獲得17個(gè)作用靶點(diǎn).按MCC算法從大到小排序,篩選得前6個(gè)候選藥物作用靶點(diǎn)(圖1):CHRM1、NCOA2、PGR、ADRA1B、ADH1B、PTGS2.
圖1 茯苓候選藥物作用靶點(diǎn)的鑒別Fig.1 Identification of drug target of Poria cocos
利用WGCNA數(shù)據(jù)包構(gòu)建TCGA-ESCA和GSE22954數(shù)據(jù)集的共表達(dá)網(wǎng)絡(luò).過(guò)濾掉具有缺失值的基因和樣本,TCGA-ESCA數(shù)據(jù)中有171例樣本(圖2a),GSE22954數(shù)據(jù)中有90例樣本,分別被用于構(gòu)建樣品聚類(lèi)圖(圖2b),結(jié)果表明兩個(gè)數(shù)據(jù)庫(kù)中的樣本均未出現(xiàn)離群樣本.
a.基于TCGA-ESCA數(shù)據(jù)集的樣品聚類(lèi)圖; b.基于GSE22954數(shù)據(jù)集的樣品聚類(lèi)圖圖2 樣品聚類(lèi)圖Fig.2 Sample cluster diagram
為達(dá)到無(wú)尺度網(wǎng)絡(luò)標(biāo)準(zhǔn),需篩選合適的軟閾值,利用“pickSoftThreshold”函數(shù)計(jì)算結(jié)果如圖3所示,本研究選取了R2大于0.9的β,最終TCGA-ESCA數(shù)據(jù)集和GSE22954數(shù)據(jù)集選取的軟閾值分別為β=2和7.根據(jù)這兩個(gè)軟閾值,分別對(duì)兩個(gè)數(shù)據(jù)庫(kù)中的基因作聚類(lèi)分析,并構(gòu)建基因聚類(lèi)樹(shù).使用動(dòng)態(tài)切割法進(jìn)行基因模塊的識(shí)別,設(shè)定每個(gè)基因模塊中的基因數(shù)不少于50,設(shè)置MEDissThres的值為0.25,最終TCGA數(shù)據(jù)庫(kù)中的基因被分成10個(gè)模塊(圖4a):Black(93個(gè))、Blue(2 722個(gè))、Brown(1 214個(gè))、Green(388個(gè))、Greenyellow(52個(gè))、Magenta(79個(gè))、Pink(91個(gè))、Red(262個(gè))、Turquoise(9 260個(gè))、Yellow(498個(gè)).GSE22954數(shù)據(jù)集中的基因被分成14個(gè)模塊(圖4b):Black(387個(gè))、Blue(1 240個(gè))、Brown(2 709個(gè))、Green(589個(gè))、Greenyellow(143個(gè))、Grey(591個(gè))、Magenta(334個(gè))、Pink(351個(gè))、Purple(222個(gè))、Red(423個(gè))、Salmon(70個(gè))、Yellow(920個(gè)).其中Grey模塊指難以分配給其余任何模塊的基因簇.
a. 基于TCGA-ESCA數(shù)據(jù)集的軟閾值的確定; b.基于GSE22954數(shù)據(jù)集的軟閾值的確定圖3 軟閾值的確定Fig. 3 Determination of soft threshold
a.TCGA-ESCA數(shù)據(jù)集的基因聚類(lèi)樹(shù)狀圖; b.GSE22,954數(shù)據(jù)集的基因聚類(lèi)樹(shù)狀圖;c.TCGA-ESCA數(shù)據(jù)集的基因模塊-特征關(guān)系熱圖; d.GSE22,954數(shù)據(jù)集的基因模塊-特征關(guān)系熱圖圖4 聚類(lèi)分析模塊的確定Fig.4 Determination of cluster analysis module
圖4c和圖4d中每個(gè)格子含有兩個(gè)數(shù)值,上方數(shù)值代表該模塊與臨床狀態(tài)的相關(guān)系數(shù),下方數(shù)值指相關(guān)性檢驗(yàn)的p值.在TCGA數(shù)據(jù)集中,Yellow(r=-0.72,p=9×10-29),Black(r=-0.24,p=0.002),Brown(r=-0.36,p=1×10-6)模塊與食管癌組織呈負(fù)相關(guān),Red(r=0.17,p=0.02)模塊與食管癌組織呈正相關(guān),Pink(r=-0.15,p=-0.05),Blue(r=0.083,p=0.3),Green(r=0.1,p=0.2),Greenyellow(r=-0.011,p=0.9),Magenta(r=-0.14,p=0.07)Turquoise(r=-0.15,p=0.06)模塊同臨床性狀的相關(guān)性較弱.在GEO數(shù)據(jù)集中,Blue(r=0.51,p=2×10-7),Red(r=0.21,p=0.04)模塊與食管癌組織呈正相關(guān),Green(r=-0.39,p=1×10-4),Magenta(r=-0.72,p=7×10-16),Salmon(r=-0.42,p=3×10-5),Purple(r=-0.24,p=0.02),Yellow(r=-0.27,p=0.009)與食管癌組織呈負(fù)相關(guān).Black(r=0.058,p=0.6),Brown(r=0.14,p=0.2),Greenyellow(r=0.13,p=0.2),Pink(r=-0.094,p=0.4)模塊與臨床狀態(tài)的相關(guān)性較弱.結(jié)果表明TCGA-ESCA中的Yellow模塊和GSE22,954中的Magenta模塊與食管癌組織的相關(guān)性最高.進(jìn)一步對(duì)Yellow模塊(cor=0.87,p=1.9×10-15)和Magenta模塊(cor=0.670,p=7.2×10-45)內(nèi)的GS和MM相關(guān)性進(jìn)行計(jì)算,也驗(yàn)證了這兩個(gè)模塊為關(guān)鍵模塊(圖5).
a. Yellow模塊的GS與MM相關(guān)性; b.Magenta模塊的GS與MM相關(guān)性圖5 GS與MM相關(guān)性Fig. 5 Correlation between GS and MM
利用limma數(shù)據(jù)包對(duì)TCGA-ESCA(圖6a)和GSE22954(圖6b)數(shù)據(jù)集中的基因進(jìn)行了差異表達(dá)分析,得到差異熱圖.其中橫坐標(biāo)表示樣品(淺藍(lán)色為正常樣品、淺紅色為食管癌樣品),縱坐標(biāo)表示基因,若某基因在正常樣品中是紅色,表示它在正常樣品中高表達(dá),而在食管癌樣品中有多種顏色,則表明它在食管癌樣品中是低表達(dá).在火山圖中,橫軸上的值表示log FC,縱軸上的值表示校正后的p值.黑點(diǎn)指的是某基因在正常樣品和食管癌樣品中無(wú)表達(dá)差異,綠點(diǎn)指的是某基因在食管癌樣品中下調(diào),紅點(diǎn)指的是某基因在食管癌樣品中上調(diào).
a. TCGA-ESCA數(shù)據(jù)集差異基因熱圖; b.GSE22954數(shù)據(jù)集差異基因熱圖圖6 差異熱圖和火山圖Fig.6 Differential heat map and volcano map
與正常食管組織相比,TCGA數(shù)據(jù)集中共鑒定出2 394個(gè)差異表達(dá)基因在食管癌組織中表達(dá)失調(diào),其中1 225個(gè)下調(diào),1 169個(gè)上調(diào).GSE22954數(shù)據(jù)集中共鑒定出1 505個(gè)差異表達(dá)基因在食管癌組織中表達(dá)失調(diào),其中872個(gè)下調(diào),595個(gè)上調(diào).通過(guò)火山圖(圖6)和熱圖(圖7)可視化.提取TCGA數(shù)據(jù)集中黃色模塊和GSE22954數(shù)據(jù)集中品紅色模塊的共表達(dá)基因,并與前面所得的差異表達(dá)基因進(jìn)行交集分析,最終識(shí)別出29個(gè)交集基因,結(jié)果通過(guò)韋恩圖可視化(圖8).將交集基因與茯苓抗食管癌的6個(gè)候選作用靶點(diǎn)作對(duì)比,發(fā)現(xiàn)ADH1B可能為茯苓抗食管癌的潛在作用靶點(diǎn).
a. TCGA-ESCA數(shù)據(jù)集差異基因的火山圖; b.GSE22954數(shù)據(jù)集差異基因的火山圖圖7 差異熱圖和火山圖Fig.7 Differential heat map and volcano map
圖8 交集基因與差異基因Venn圖Fig.8 Venn diagram of intersection genes and differential genes
GO富集分析結(jié)果如圖9所示,29個(gè)交集基因主要富集在細(xì)胞核分裂、有絲分裂細(xì)胞周期相關(guān)的調(diào)控、細(xì)胞周期G2/M期的轉(zhuǎn)換、姐妹染色單體分離、細(xì)胞器分裂等321個(gè)生物學(xué)過(guò)程(biological process,BP),微管結(jié)合、微管蛋白結(jié)合、3′→5′脫氧核糖核酸解旋酶活性、三磷酸腺苷酶活性等48個(gè)分子功能(molecular function,MF),紡錘體、微管、驅(qū)動(dòng)蛋白復(fù)合物、中間體等53個(gè)細(xì)胞組分(cell component,CC).KEGG富集分析結(jié)果如圖10所示,29個(gè)交集基因富集在細(xì)胞周期、范可尼貧血途徑、氮素代謝、孕酮介導(dǎo)的卵母細(xì)胞成熟、DNA復(fù)制、細(xì)胞衰老這6條代謝通路上.
a. GO富集氣泡圖;b. KEGG富集柱狀圖圖9 交集基因的 GO和KEGG富集分析圖Fig.9 GO and KEGG enrichment analysis of the intersection genes
注:紅色節(jié)點(diǎn)表示食管癌相關(guān)基因.圖10 代謝通路圖Fig. 10 Metabolic pathway diagram
借助KOABS數(shù)據(jù)庫(kù)獲取了交集基因富集最顯著的細(xì)胞周期通路圖.如圖10所示,CDKs是該通路中重要的調(diào)控酶,不同的CDK結(jié)合不同的周期蛋白(cyclin),在細(xì)胞周期不同階段使各自的底物蛋白磷酸化,改變其結(jié)構(gòu)和功能,從而調(diào)節(jié)細(xì)胞周期各階段的進(jìn)程.在G1期,CDK2、CDK4、CDK6將調(diào)節(jié)因子Rb磷酸化,使HDAC、轉(zhuǎn)錄因子E2F復(fù)合體得以解離,解離后的E2F在c-myc等物質(zhì)的幫助下與DNA啟動(dòng)子上的E2F位點(diǎn)結(jié)合,啟動(dòng)轉(zhuǎn)錄,進(jìn)一步合成DNA復(fù)制所需要的蛋白質(zhì).在S期,食管癌相關(guān)蛋白MCM被CDC7/DBF4復(fù)合體磷酸化,磷酸化的MCM與ORC組成復(fù)合體,啟動(dòng)DNA的復(fù)制,因此MCM在DNA復(fù)制過(guò)程中起著重要的作用.在G2期,周期蛋白cyclinA/cyclinB含量積累達(dá)到最大值,它們與食管癌相關(guān)蛋白CDK1結(jié)合形成復(fù)合物,Wee1等激酶對(duì)CDK1多個(gè)特定位點(diǎn)上的氨基酸殘基磷酸化.隨后在食管癌相關(guān)蛋白CDC25B,CDC25C的作用下,去掉某些位點(diǎn)的磷酸基團(tuán),此時(shí)CDK1開(kāi)始出現(xiàn)活性,具有活性的食管癌相關(guān)蛋白CDK1可以催化多種底物蛋白磷酸化,由此調(diào)控細(xì)胞從G2期向M期轉(zhuǎn)換.例如催化組蛋白H1磷酸化,促使染色質(zhì)凝縮;催化核仁蛋白磷酸化,促進(jìn)核仁解體;催化C-abl蛋白磷酸化,促使細(xì)胞形態(tài)調(diào)整等.
利用STING數(shù)據(jù)庫(kù)構(gòu)建29個(gè)交集基因的蛋白質(zhì)互作網(wǎng)絡(luò)圖,圖中顯示有18個(gè)節(jié)點(diǎn)和82根邊緣線(圖11a).運(yùn)用Cytoscape中的CytoHubba插件計(jì)算每個(gè)節(jié)點(diǎn)的MCC值,按MCC值的大小進(jìn)行排序,可從蛋白互作網(wǎng)絡(luò)圖中鑒定出前10個(gè)核心基因.結(jié)果如圖11b所示,篩選出的核心基因包括DLGAP5、MCM2、CCNA2、CDK1、TPX2、TRIP13、KIF23、KIF2C、CENPF和CHAF1A.另外,網(wǎng)絡(luò)圖中節(jié)點(diǎn)顏色越紅,則表明該節(jié)點(diǎn)越有可能是網(wǎng)絡(luò)的核心.
篩選出前十個(gè)核心基因和茯苓抗食管癌的潛在作用靶點(diǎn)ADH1B后,基于TCGA-ESCA的臨床數(shù)據(jù),運(yùn)用R軟件運(yùn)行survival數(shù)據(jù)包作OS分析,結(jié)果如圖12所示:DLGAP5(p=0.147)、CCNA2(p=0.613)、CDK1(p=0.111)、TPX2(p=0.977)、TRIP13(p=0.647)、KIF23(p=0.702)、KIF2C(p=0.947)、CENPF(p=0.384)、CHAF1A(p=0.334)、ADH1B(p=0.579)的表達(dá)量與食管癌患者的OS相關(guān)性低,而MCM2(p=
圖12 核心基因的總體生存分析圖Fig.12 Overall survival analysis diagram of hub genes
0.003)的低表達(dá)與食管癌患者的OS惡化顯著相關(guān).利用在線工具GEPIA2數(shù)據(jù)庫(kù)進(jìn)行DFS分析,結(jié)果如圖13所示,CCNA2的結(jié)果為logrankp=0.19,HR=1.4,CDK1的結(jié)果為logrankp=0.71,HR=0.91,DLGAP5的結(jié)果為logrankp=0.15,HR=1.4,TPX2的結(jié)果為logrankp=0.21,HR=1.4,TRIP13的結(jié)果為logrankp=0.6,HR=1.1,KIF23的結(jié)果為logrankp=0.56,HR=0.87,KIF2C的結(jié)果為logrankp=0.24,HR=1.3,CENPF的結(jié)果為logrankp=0.37,HR=1.2,MCM2的結(jié)果為logrankp=0.87,HR=0.96,CHAF1A的結(jié)果為logrankp=0.049,HR=0.62.ADH1B的結(jié)果為由logrankp=0.56,HR=0.86,由上可知CHAF1A的低表達(dá)水平與食管癌患者的DFS惡化顯著相關(guān).
圖13 核心基因的無(wú)病生存分析圖Fig.13 Disease-free survival analysis diagram of hub genes
利用R語(yǔ)言的ggpubr數(shù)據(jù)包對(duì)11個(gè)基因進(jìn)行臨床相關(guān)性分析,結(jié)果如圖14所示,CDK1、CHAF1A、DLGAP5、TPX2和TPIP13的表達(dá)量在Ⅰ期與Ⅱ期間的差異顯著性p值依次為0.044,0.039,0.040,0.014,0.035,MCM2的表達(dá)量在Ⅱ期與Ⅲ期間的差異顯著性p值為0.017,TPX2在Ⅰ期與IV期間的p值為0.032,均小于0.05.因此CDK1、CHAF1A、DLGAP5、TPX2和TPIP13在Ⅰ期與Ⅱ期之間、MCM2在Ⅱ期與Ⅲ期之間、TPX2在Ⅰ期與IV期的食管癌患者之間的表達(dá)量是有顯著差異的,而其它各期之間的p值均大于0.05,因此基因表達(dá)量無(wú)顯著差異.
圖14 臨床相關(guān)性分析圖Fig.14 Clinical correlation analysis
利用HPA數(shù)據(jù)庫(kù)獲取MCM2基因在正常組織(圖15a)和食管癌組織(圖15b)中的免疫組化圖片,圖像顯示MCM2在正常組織中呈現(xiàn)低等強(qiáng)度染色,染色細(xì)胞占比小于25%,在食管癌組織中呈現(xiàn)中等強(qiáng)度染色,染色細(xì)胞占比為25%~75%.這表明MCM2的表達(dá)在食管癌組織中顯著上調(diào).
a. 正常組織; b.食管癌組織圖15 正常組織與食管癌組織的免疫組化圖Fig.15 Immunohistochemical images of normal tissue and esophageal cancer tissue
對(duì)篩選到的CDK1、CHAF1A、DLGAP5、TPX2、TPIP13和MCM2等6個(gè)候選靶點(diǎn)基因進(jìn)行RT-PCR定量表達(dá)分析,結(jié)果如圖16所示,CDK1、CHAF1A、TPIP13和MCM2基因經(jīng)不同濃度的茯苓水煎液處理后,表達(dá)量與對(duì)照存在顯著差異(p< 0.05),其中CDK1、CHAF1A和TPIP13經(jīng)高濃度的茯苓水煎液處理后表達(dá)量顯著增加,而DLGAP5和TPX2表達(dá)量變化差異不明顯,但MCM2經(jīng)不同濃度的茯苓水煎液處理后表達(dá)量隨著茯苓水煎液濃度先升高后降低.結(jié)果進(jìn)一步顯示CDK1、CHAF1A、TPIP13和MCM2是茯苓水煎液治療食管癌的主要作用靶點(diǎn).
注:不同小寫(xiě)字母表示差異達(dá)到顯著水平(p< 0.05),相同字母則表示無(wú)統(tǒng)計(jì)學(xué)差異.圖16 茯苓水煎液對(duì)關(guān)鍵基因表達(dá)量影響Fig.16 Effect aqueous extract from Poria cocos to key gene expression
本研究利用TCMSP數(shù)據(jù)庫(kù)檢索出茯苓的有效活性成分,其中OB、DL值最高的是去氫齒孔酸,故去氫齒孔酸可能是茯苓發(fā)揮功效的核心活性成分.另外對(duì)有效活性成分對(duì)應(yīng)的作用靶點(diǎn)進(jìn)行研究,共獲得其作用靶點(diǎn)17個(gè),按MCC排序,最終篩選出6個(gè)候選藥物作用靶點(diǎn):CHRM1、NCOA2、PGR、ADRA1B、ADH1B和PTGS2,其中ADHIB被認(rèn)為是茯苓抗食管癌的潛在作用靶點(diǎn).ADH1B是乙醇脫氫酶,已有研究表明,ADH1B基因的多態(tài)性與食管癌的發(fā)病風(fēng)險(xiǎn)有關(guān),ADH1B在乙醇轉(zhuǎn)化為乙醛的代謝途徑中起著關(guān)鍵作用,攜帶ADH1BAA基因型的人,其編碼的
乙醇脫氫酶活性較高,乙醇較容易被轉(zhuǎn)換為乙醛.研究發(fā)現(xiàn),茯苓可能是通過(guò)其有效活性成分增加ADH1B的活性,從而增強(qiáng)人體抵抗力,抑制食管癌腫瘤細(xì)胞的生長(zhǎng).
本研究基于差異表達(dá)分析和WGCNA探討食管癌發(fā)生發(fā)展相關(guān)的核心基因.通過(guò)對(duì)差異基因進(jìn)行GO富集分析發(fā)現(xiàn),這些基因主要參與細(xì)胞核分裂、有絲分裂細(xì)胞周期的G2/M期轉(zhuǎn)換、細(xì)胞器分裂等生物學(xué)過(guò)程,主要與3′→5′脫氧核糖核酸解旋酶活性、微管結(jié)合、單鏈DNA結(jié)合等分子功能有關(guān),主要影響有絲分裂紡錘體、微管、驅(qū)動(dòng)蛋白復(fù)合物等細(xì)胞組分.KEGG富集分析結(jié)果表明,29個(gè)食管癌相關(guān)基因富集最顯著的通路是細(xì)胞周期代謝通路,在該通路中,食管癌相關(guān)基因MCM2是S期內(nèi)啟動(dòng)DNA復(fù)制的重要因子,CDK1在G2/M期轉(zhuǎn)換起著重要的調(diào)控作用,它們通過(guò)控制細(xì)胞周期運(yùn)轉(zhuǎn),防止細(xì)胞增殖失控,甚至細(xì)胞癌變.本研究根據(jù)Cytoscape中的插件CytoHubba計(jì)算每個(gè)節(jié)點(diǎn)的MCC值,篩選出前10個(gè)核心基因:DLGAP5、MCM2、CCNA2、CDK1、TPX2、TRIP13、KIF23、KIF2C、CENPF和CHAF1A,其中MCM2的低表達(dá)與食管癌患者的總生存期惡化顯著相關(guān);DFS分析發(fā)現(xiàn)CHAF1A的低表達(dá)與食管癌患者的無(wú)病生存期惡化顯著相關(guān).同時(shí),臨床相關(guān)性分析發(fā)現(xiàn)CDK1、CHAF1A、DLGAP5、TPX2和TPIP13表達(dá)量在Ⅰ期與Ⅱ期的食管癌患者之間的表達(dá)量存在顯著差異.CHAF1A是染色體組裝因子,它能夠調(diào)控DNA修復(fù)和細(xì)胞增殖[19].李雪玲等[20]研究發(fā)現(xiàn),CHAF1A在多種腫瘤中均高表達(dá),其中包括食管癌,并可能是影響肺癌、肝細(xì)胞癌和乳腺癌預(yù)后的治療靶點(diǎn).MCM2是微小染色體維持蛋白2,位于細(xì)胞核當(dāng)中,具有調(diào)控DNA復(fù)制的功能.目前它已被視作S期內(nèi)部檢驗(yàn)點(diǎn)激活的重要因子、特異性增殖相關(guān)因子, 且被認(rèn)為是癌前標(biāo)記[21].本研究分別對(duì)TCGA-ESCA和GSE22954數(shù)據(jù)集進(jìn)行差異表達(dá)分析,分析結(jié)果均顯示CHAF1A和MCM2在食管癌樣品中顯著上調(diào);生存分析結(jié)果顯示,CHAF1A和MCM2的低表達(dá)水平與食管癌患者的預(yù)后不良有關(guān);臨床相關(guān)性分析提示MCM2從Ⅱ期到Ⅲ期的表達(dá)量顯著下降,而CHAF1A從Ⅰ期到Ⅱ期表達(dá)量顯著上升.Zhong等[22]通過(guò)食管鱗癌GEO數(shù)據(jù)庫(kù)和TCGA數(shù)據(jù)庫(kù)比對(duì)發(fā)現(xiàn)MCM2 與總體生存無(wú)相關(guān)性.因此MCM2和CHAF1A可能是影響食管癌預(yù)后的治療靶點(diǎn),同時(shí)也是影響食管癌分期的靶點(diǎn).本研究結(jié)果可能為食管癌的早期篩查與靶向治療提供重要參考.