劉 遷,祁國(guó)萍,于華裔,戴宇陽(yáng),陸文斌,金建華
(江蘇大學(xué)附屬武進(jìn)醫(yī)院 徐州醫(yī)科大學(xué)武進(jìn)臨床學(xué)院腫瘤科,江蘇 常州 213017)
結(jié)腸癌是世界上致死率排名第三位的疾?。?]。目前存在一些臨床常用的結(jié)腸癌標(biāo)志物[2],但用于診療結(jié)腸癌的標(biāo)志物仍然較少,故探尋潛在的結(jié)腸癌標(biāo)志物仍是結(jié)腸癌研究的熱點(diǎn)和重點(diǎn)。近年來(lái),高通量測(cè)序和基因芯片技術(shù)被廣泛地應(yīng)用于生命科學(xué)領(lǐng)域[3-4]。生物信息學(xué)是分析現(xiàn)存大量生物數(shù)據(jù)的重要工具,通過(guò)分析數(shù)據(jù)中存在的潛在重要核心基因或預(yù)后因子[5-6],挖掘潛在腫瘤標(biāo)志物或治療靶點(diǎn)[7]。
當(dāng)前采用生物信息學(xué)分析的方法系統(tǒng)挖掘腫瘤致病基因及其調(diào)控機(jī)制將對(duì)腫瘤研究起到巨大的推動(dòng)作用?;诖?,有研究[5]通過(guò)分析基因表達(dá)綜合(Gene Expression Omnibus,GEO)數(shù)據(jù)庫(kù),聯(lián)合多種生物信息學(xué)分析方法,對(duì)GEO基因芯片數(shù)據(jù)庫(kù)分析篩選結(jié)腸癌樞紐基因,對(duì)結(jié)腸癌的發(fā)病機(jī)制研究提供理論基礎(chǔ)。本研究通過(guò)對(duì)癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(kù)和GEO數(shù)據(jù)庫(kù)獨(dú)立分析及采用2種不同的數(shù)據(jù)差異分析方法進(jìn)行聯(lián)合分析,獲得13個(gè)共有基因,進(jìn)一步行蛋白-蛋白互作 (protein-protein interaction,PPI)網(wǎng)絡(luò)構(gòu)建,并識(shí)別出具有相互聯(lián)系的7個(gè)核心基因。本研究對(duì)這7個(gè)核心基因進(jìn)行基因本體(Gene Ontology,GO)和京都基因和基因組百科全書(Kyoto Encylopaedia of Genes and Genomes,KEGG)富集分析,還對(duì)這7個(gè)核心基因進(jìn)行泛癌(32個(gè)不同腫瘤樣本)分析。通過(guò)對(duì)核心基因分別進(jìn)行結(jié)腸癌總生存的預(yù)后風(fēng)險(xiǎn)因素分析(單因素和雙因素COX分析),篩選出關(guān)鍵基因——AXIN2基因的表達(dá)對(duì)結(jié)腸癌患者總生存的預(yù)后具有顯著意義,為結(jié)腸癌的研究提供依據(jù)。
1.1 原始數(shù)據(jù)來(lái)源從TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)中下載結(jié)腸癌轉(zhuǎn)錄組數(shù)據(jù)和臨床數(shù)據(jù),并進(jìn)行標(biāo)準(zhǔn)化處理。從GEO數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo/)中下載高通量測(cè)序數(shù)據(jù)集GSE37182基因芯片數(shù)據(jù)。
1.2 差異分析篩選采用R/Bioconductor軟件包中的EdgeR用于處理來(lái)源于TCGA的數(shù)據(jù)。采用R軟件中的“l(fā)imma”[9]、“edgeR”[10]和“ggplot2”[11]程序包進(jìn)行數(shù)據(jù)處理分析和作圖觀察,倍數(shù)(fold change,F(xiàn)C)以∣logFC∣大于1及矯正后P<0.05作為篩選條件進(jìn)行篩選。GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r/)可用于分析GEO數(shù)據(jù)集中不同數(shù)據(jù)組的差異表達(dá)水平。采用GEO2R在線分析工具分別分析并篩選出GSE37182的差異表達(dá)基因 (differentially expressed genes,DEGs),以∣logFC∣>1,調(diào)整后以P<0.05作為識(shí)別DEGs的閾值。采用R軟件中的“ggplot2”和“pheatmap”程序包分析DEGs并進(jìn)行可視化,分別生成火山圖和熱圖。
1.3 加 權(quán) 基因 共 表 達(dá) 網(wǎng) 絡(luò) 分 析[12](weighted correlation network analysis,WGCNA)采 用R Studio軟件中“WGCNA”函數(shù)包,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,采用“goodsamplegenes()”函數(shù)檢查數(shù)據(jù)是否有異?;?,選擇合適的閾值剔除離群值。加載臨床特征數(shù)據(jù)并繪制基因-特征熱度聚類圖,完成共表達(dá)網(wǎng)絡(luò)的構(gòu)建和模塊的選擇。設(shè)定的模塊基因數(shù)為50個(gè)。表達(dá)相似的基因進(jìn)行聚類形成樹狀圖,樹狀圖中的每片葉子代表1個(gè)基因,每個(gè)分支代表1組表達(dá)相近或相似的基因組,每組不超過(guò)50個(gè)基因。
1.4 維恩分析WGCNA方法分析獲得TCGA數(shù)據(jù)中的magenta+salmon顏色模塊對(duì)應(yīng)的基因組合(TCGA_salmon+magenta)、GEO數(shù)據(jù)中的blue+pink顏色模塊對(duì)應(yīng)的基因組合(GEO_blue+pink)、差異分析獲得的TCGA數(shù)據(jù)中的差異基因(TCGA_diff)和GEO數(shù)據(jù)中獲得的差異基因(GEO_diff),將這4組基因取交集,獲得13個(gè)共有基因。
1.5 PPI和Hub基因篩選為了探討維恩分析結(jié)果中PPI,本研究采用STRING數(shù)據(jù)庫(kù)(https://string-db.org/)進(jìn)行分析比對(duì),獲得已知的蛋白之間的相互作用圖,構(gòu)建PPI網(wǎng)絡(luò)。為了進(jìn)一步挖掘模塊中的關(guān)鍵基因節(jié)點(diǎn),將PPI網(wǎng)絡(luò)導(dǎo)入Cytoscape3.6.1軟件可視化,通過(guò)cytoHubba插件中的最大團(tuán)中心性 (maximal clique centrality,MCC)算法篩選Hub基因。
1.6 GO和KEGG富集分析通過(guò)在線數(shù)據(jù)庫(kù)DAVID(http://dabid.ncifcrf.gov/)對(duì)核心基因進(jìn)行GO富集分析[13]和KEGG富集分析[14],分析核心基因主要參與的生物學(xué)功能及參與的重要信號(hào)通路等。
1.7 泛癌基因的免疫細(xì)胞亞型分析首先在UCSC Xena網(wǎng)站下載TCGA數(shù)據(jù)庫(kù)中的免疫亞型數(shù) 據(jù) 包 (https://xenabrowser.net/datapages/?cohort=TCGA%20Pan-Cancer%20(PANCAN)&remove Hub=https% 3A% 2F% 2Fxena.treehouse.gi.ucsc.edu%3A 443),通過(guò)“perl”腳本對(duì)數(shù)據(jù)進(jìn)行處理,采用R軟件中“l(fā)imma”、“ggplot2”[15]和“reshape2”程序包對(duì)數(shù)據(jù)進(jìn)行分析,分析核心基因的表達(dá)與免疫細(xì)胞亞型的相關(guān)性[16]。
1.8 核心基因的泛癌熱圖和相關(guān)性分析采用R軟件中的“pheatmap”程序包對(duì)處理后的數(shù)據(jù)進(jìn)行分析獲得熱圖。采用“corrplot”程序包分析核心基因之間相關(guān)性,通過(guò)每個(gè)基因在不同癌種中的相對(duì)表達(dá)量進(jìn)行相關(guān)性分析,此程序里會(huì)刪除正常樣品,只分析不同腫瘤組織中的基因表達(dá)。
1.9 核心基因與腫瘤微環(huán)境的相關(guān)性分析采用R軟件中的“estimate”和“corrplot”程序包進(jìn)行數(shù)據(jù)分析統(tǒng)計(jì),并分析基因表達(dá)與基質(zhì)細(xì)胞評(píng)分之間的相關(guān)性、基因表達(dá)與免疫細(xì)胞評(píng)分之間的相關(guān)性和本次檢測(cè)的基因表達(dá)與綜合(基質(zhì)細(xì)胞和免疫細(xì)胞的總和)評(píng)分之間的相關(guān)性[17]。
1.10 核心基因的風(fēng)險(xiǎn)回歸模型分析下載TCGA數(shù)據(jù)庫(kù)中臨床數(shù)據(jù)樣本,采用“perl”腳本進(jìn)行數(shù)據(jù)處理,再通過(guò)R軟件中的“survival”程序包進(jìn)行基因的單因素或多因素COX分析,采用R軟件中的“survminer”程序包繪制森林圖[18]。
1.11 實(shí)時(shí)熒光定量PCR(real-time fluorescence quantitative PCR,RT-qPCR)、Western blotting和免疫組織化學(xué)法檢測(cè)本研究對(duì)江蘇大學(xué)附屬武進(jìn)醫(yī)院收集的結(jié)腸癌組織和癌旁組織的臨床標(biāo)本分別進(jìn)行組織RNA提取、反轉(zhuǎn)錄及RT-qPCR檢測(cè)[19];行組織蛋白提取,制備蛋白樣品進(jìn)行Western blotting法檢測(cè);免疫組織化學(xué)法檢測(cè)所需的空白涂片由江蘇大學(xué)附屬武進(jìn)醫(yī)院病理科提供,上述實(shí)驗(yàn)具體實(shí)驗(yàn)方法參考文獻(xiàn)[20-21]。
1.12 統(tǒng)計(jì)學(xué)分析采用SPSS 22.0統(tǒng)計(jì)軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。結(jié)腸癌組織中NKD1和AXIN2表達(dá)水平多組間比較采用單因素方差分析,組間兩兩比較采用t檢驗(yàn)。采用單因素和多因素Cox回歸分析方法評(píng)估AXIN2基因的表達(dá)與結(jié)腸癌患者總生存(overall survival,OS)的關(guān)系。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 TCGA和GEO數(shù)據(jù)庫(kù)基因分別從TCGA和GEO數(shù)據(jù)庫(kù)中下載的結(jié)腸癌數(shù)據(jù)進(jìn)行基因表達(dá)差異分析,以∣logFC∣>1和矯正后的P<0.05作為篩選條件進(jìn)行篩選,獲得TCGA數(shù)據(jù)中的差異表達(dá)基因和GSE37182芯片中的基因表達(dá)差異圖,其中紅點(diǎn)代表結(jié)腸癌組織中高表達(dá)基因,綠點(diǎn)代表低表達(dá)基因,而黑點(diǎn)代表無(wú)明顯表達(dá)差異的基因。見圖1。
圖1 TCGA和GEO數(shù)據(jù)庫(kù)中的結(jié)腸癌數(shù)據(jù)差異表達(dá)分析Fig.1 Differential expression analysis on colon cancer data in TCGA and GEO databases
2.2 WGCNA分析采用WGCNA分析對(duì)TCGA和GEO數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行基因表達(dá)差異分析。分析TCGA數(shù)據(jù)獲得的樹狀圖及對(duì)應(yīng)的顏色模塊見圖2 A,其中洋紅和鮭魚色顏色模塊對(duì)應(yīng)腫瘤中高表達(dá)的基因組合,而藍(lán)色和黃色顏色模塊對(duì)應(yīng)正常結(jié)腸組織中高表達(dá)的基因組合(圖2B);GEO數(shù)據(jù)庫(kù)分析獲得的樹狀圖和對(duì)應(yīng)的顏色模塊見圖2 C,其中藍(lán)色和粉色顏色模塊對(duì)應(yīng)腫瘤組織中高表達(dá)的基因組合,而綠松石色、紅色、黃色及棕色顏色模塊對(duì)應(yīng)正常結(jié)腸組織中高表達(dá)的基因組合(圖2D)。
圖2 WGCNA法分析TCGA和GEO數(shù)據(jù)庫(kù)中的結(jié)腸癌數(shù)據(jù)Fig.2 Colon cancer data in TCGA and GEO databases analyzed by WGCNA method
2.3 維恩分析和核心基因識(shí)別對(duì)WGCNA分析得到的兩組高表達(dá)模塊基因進(jìn)行維恩分析,共獲得13個(gè)共有基因(圖3A)。通過(guò)在線STRING數(shù)據(jù)庫(kù)對(duì)這13個(gè)基因進(jìn)行PPI網(wǎng)絡(luò)構(gòu)建,檢測(cè)這些蛋白之間的相互結(jié)合關(guān)系,發(fā)現(xiàn)ARID3A、SALL 4、NKD1、KND2、AXIN 2、CA 9和TACSTD2 7個(gè)基因之間存在相互關(guān)系,認(rèn)為這7個(gè)基因?yàn)榻Y(jié)腸癌潛在的核心基因(圖3 B)。
圖3 維恩分析和PPI網(wǎng)絡(luò)Fig.3 Venn analysis and PPI network
2.4 核心基因的GO和KEGG富集分析對(duì)上述7個(gè)核心基因進(jìn)行基因功能GO富集分析顯示:在生物過(guò)程(biological process,BP)方面,NKD2/AXIN2/NKD1對(duì)經(jīng)典/非經(jīng)典Wnt信號(hào)通路進(jìn)行正/負(fù)調(diào)控[1];細(xì)胞成分(cellular component,CC)方面,基底外側(cè)質(zhì)膜(NKD2/CA 9/TACSTD2),質(zhì)膜外側(cè)(NKD2/TACSTD2);分子功能(molecular function,MF)方面,NKD2/AXIN2主要結(jié)合泛素蛋白連接酶或結(jié)合泛素樣蛋白連接酶。此外,對(duì)這7個(gè)核心基因進(jìn)行KEGG富集分析顯示:NKD2/AXIN2/NKD1主要集中在Hippo信號(hào)通路和Wnt信號(hào)通路。見圖4。
圖4 核心基因的GO和KEGG富集分析Fig.4 GO and KEGG enrichmental analysis on core genes
2.5 泛癌基因分析對(duì)上述7個(gè)核心基因進(jìn)行泛癌(32種不同腫瘤組織)分析,結(jié)果發(fā)現(xiàn)TASCTD2基因在泛癌中的表達(dá)量高于其他6個(gè)核心基因(圖5)。熱圖分析顯示:7個(gè)核心基因在結(jié)腸癌中的表達(dá)相對(duì)于其他癌種均明顯升高,其中NKD1和AXIN2在17個(gè)不同腫瘤組織中的表達(dá)量相似(圖6)。在線UALCAN數(shù)據(jù)庫(kù)分析顯示:AXIN2基因在結(jié)腸癌組織中的表達(dá)量明顯高于正常結(jié)腸組織中的表達(dá),而AXIN 2在腫瘤組織中的表達(dá)量明顯低于正常組織(圖7)。NKD1和AXIN2蛋白在32種不同腫瘤組織中的表達(dá)相關(guān)性最高(相關(guān)性系數(shù)為0.69),此外,NKD2還分別與NKD1、AXIN2和ARID3A具有較高的相關(guān)性,相關(guān)系數(shù)分別為0.30、0.38和0.32(圖8)。為分析核心基因的表達(dá)與免疫細(xì)胞亞型之間的關(guān)系,將腫瘤樣品中的免疫細(xì)胞分為6個(gè)亞型:C1為傷口愈合型,C2為IFN-γ主導(dǎo)型,C3為炎性型,C4為淋巴細(xì)胞缺失型,C5為免疫靜默型,C6為TGF-beta主導(dǎo)型等六個(gè)亞型。其中NKD2基因在C1、C2和C6亞型中高表達(dá),而在C3、C4和C5亞型中的表達(dá)相對(duì)較低;NKD1基因在C5亞型中高表達(dá),而在其他亞型中呈低表達(dá);AXIN2基因在C2和C4中呈低表達(dá),而其他亞型中呈高表達(dá)(圖9)。核心基因的表達(dá)與腫瘤微環(huán)境的相關(guān)性分析結(jié)果顯示:NKD2和NKD1基因的表達(dá)在泛癌中與綜合(樣品中基質(zhì)細(xì)胞和免疫細(xì)胞總和)評(píng)分大多呈正相關(guān)關(guān)系。NKD2、AXIN 2、ARID3A和NKD1等基因的表達(dá)與結(jié)腸腺癌組織的綜合評(píng)分呈負(fù)相關(guān)關(guān)系,即NKD2等基因的表達(dá)越高,結(jié)腸癌組織中腫瘤細(xì)胞數(shù)越多(圖10)。
圖5 泛癌分析法分析7個(gè)核心基因的相對(duì)表達(dá)量Fig.5 Relative expression amounts of 7 core genes detected by pan-cancer analysis method
圖6 熱圖分析核心基因在不同癌組織中的表達(dá)量Fig.6 Heat map analysis on expression amount of core genes in different kinds of cancer tissues
圖7 結(jié)直腸癌組織和癌旁組織中AXIN2基因的表達(dá)量Fig.7 Expression amounts of AXIN 2 gene in cancer and adjacent cancer tissues
圖8 7個(gè)核心基因的相關(guān)性分析Fig.8 Correlation analysis among 7 core genes
圖9 核心基因表達(dá)與免疫細(xì)胞亞型的相關(guān)性分析Fig.9 Correlation analysis between expression of core genes and immune cell subtypes
圖10 核心基因的表達(dá)與腫瘤微環(huán)境的相關(guān)性分析Fig.10 Correlation analysis between expression of core genes and microenvironment of tumor
2.6 NKD1與AXIN2在癌組織和癌旁組織中的表達(dá)水平為了驗(yàn)證生物信息學(xué)分析結(jié)果,采用臨床樣本分別檢測(cè)NKD1和AXIN 2在結(jié)腸癌組織和癌旁組織中的表達(dá)情況。RT-qPCR檢測(cè)結(jié)果顯示:AXIN2(圖11)和NKD1(圖12)在結(jié)腸癌組織中明顯高表達(dá),并且二者在結(jié)腸腫瘤組織中的表達(dá)水平具有顯著正相關(guān)關(guān)系(圖13)。通過(guò)免疫組織化學(xué)法檢測(cè)進(jìn)一步確認(rèn)AXIN2、NKD1和NKD2在結(jié)腸癌組織中高表達(dá),且表達(dá)水平具有正相關(guān)關(guān)系(圖14)。對(duì)癌和癌旁組織進(jìn)行Western blotting法檢測(cè)發(fā)現(xiàn):AXIN2和NKD1在結(jié)腸癌組織中明顯高表達(dá),且表達(dá)水平具有顯著的正相關(guān)關(guān)系(圖15)。
圖11 在結(jié)腸癌和癌旁組織中AXIN2基因表達(dá)水平Fig.11 Expression levels of AXIN2 gene in colon cancer and adjacent tissues
圖12 結(jié)腸癌和癌旁組織中NKD1基因表達(dá)水平Fig.12 Expression levels of NKD1 gene in colon cancer and adjacent tissues
圖13 結(jié)腸癌組織中NKD1和AXIN2表達(dá)水平相關(guān)關(guān)系Fig.13 Correlation between expression levels of NKD1 and AXIN2 in colon cancer tissue
圖14 結(jié)腸癌組織中AXIN2(A)、NKD2(B)和NKD1(C)表達(dá)情況(免疫組織化學(xué),×20)Fig.14 Expressions of AXIN 2(A),NKD2(B),and NKD1(C)in colon cancer tissue(Immunohistochemistry,×20)
圖15 Western blotting法檢測(cè)結(jié)腸癌和癌旁組織中NKD1、NKD2和AXIN2表達(dá)電泳圖Fig.15 Electrophoregram of expressions of NKD 1,NKD2,and AXIN2 in colon cancer and adjacent cancer tissues detected by Western blotting method
2.7 AXIN2基因的單因素和多因素預(yù)后風(fēng)險(xiǎn)分析對(duì)7個(gè)核心基因分別進(jìn)行單因素和多因素預(yù)后風(fēng)險(xiǎn)分析結(jié)果顯示:?jiǎn)我蛩仡A(yù)后風(fēng)險(xiǎn)分析和多因素預(yù)后風(fēng)險(xiǎn)分析均顯示:只有AXIN2表達(dá)差異有統(tǒng)計(jì)學(xué)意義(P=0.026),并且AXIN2表達(dá)量(0.82)<1,故AXIN2基因的表達(dá)可以作為結(jié)腸癌患者OS的低風(fēng)險(xiǎn)預(yù)后因子。此外,年齡(P=0.001)和原發(fā)腫瘤(T)(P=0.045)具有顯著意義,并且二者表達(dá)量均大于1,故可以作為結(jié)腸癌患者OS的高風(fēng)險(xiǎn)獨(dú)立預(yù)后因子。見表1。
表1 AXIN 2基因表達(dá)與結(jié)腸癌患者OS的單因素和多因素風(fēng)險(xiǎn)分析Tab.1 Univariate and multivariate risk analysis on expression of AXIN 2 gene and OS of colon cancer patients
隨著近兩年生物信息學(xué)的發(fā)展,有較多潛在重要的結(jié)腸癌基因已被檢測(cè)發(fā)現(xiàn),但應(yīng)用于臨床的較少,其中存在的問(wèn)題主要有:利用單一數(shù)據(jù)庫(kù)存在系統(tǒng)誤差、單一的差異分析方法導(dǎo)致假陽(yáng)性等誤差存在[25]以及對(duì)生物信息學(xué)分析結(jié)果進(jìn)行實(shí)驗(yàn)驗(yàn)證。為了尋找結(jié)腸癌特異性的腫瘤標(biāo)志物或潛在的重要的藥物靶點(diǎn),同時(shí)為了盡可能減少系統(tǒng)誤差或假陽(yáng)性等結(jié)果,本研究對(duì)2個(gè)不同的獨(dú)立數(shù)據(jù)庫(kù)(TGCA和GEO數(shù)據(jù)庫(kù))中結(jié)腸癌數(shù)據(jù)進(jìn)行分析,避免單一數(shù)據(jù)庫(kù)的系統(tǒng)誤差出現(xiàn)。本研究對(duì)結(jié)腸癌基因表達(dá)數(shù)據(jù)采用2種不同的數(shù)據(jù)差異分析方法進(jìn)行分析:基因表達(dá)差異分析方法和WGCNA法,通過(guò)2種不同的差異分析方法分析會(huì)較大程度上減少假陽(yáng)性等誤差的出現(xiàn)。本研究隨后對(duì)4組差異分析數(shù)據(jù)取交集進(jìn)行維恩分析,獲得了13個(gè)共有基因。本研究通過(guò)在線STRING數(shù)據(jù)庫(kù)對(duì)這13個(gè)基因進(jìn)行蛋白網(wǎng)絡(luò)構(gòu)建并識(shí)別了具有相互關(guān)系的7個(gè)潛 在 的 核 心 基 因(ARID3A[26]、SALL 4[27]、NKD1[21,28]、NKD2、AXIN2[29]、CA 9[30]和TACSTD2[31]),這些結(jié)果與上述文獻(xiàn)報(bào)道一致。
本研究對(duì)7個(gè)核心基因進(jìn)行泛癌(32種不同腫瘤樣本)分析,首先對(duì)7個(gè)核心基因在32個(gè)不同腫瘤組織中的相對(duì)表達(dá)量進(jìn)行分析,發(fā)現(xiàn)TACSTD5基因在泛癌中的表達(dá)量高于其他6個(gè)核心基因。進(jìn)行熱圖分析時(shí),將正常組織樣本量少于5個(gè)樣本的腫瘤樣本進(jìn)行刪除,使統(tǒng)計(jì)的數(shù)據(jù)更有意義,因此熱圖結(jié)果顯示了17個(gè)不同的腫瘤組織。熱圖結(jié)果顯示:7個(gè)核心基因在結(jié)直腸癌中的表達(dá)量均明顯升高,此外,TACSTD2還在ESCA、THCA、BLCA和UCEC中高表達(dá),CA 9基因還在BLCA、UCEC、HNSC、LUSC及GBM中高表達(dá)。整體而言,NKD1和AXIN 2基因在所有的腫瘤中的表達(dá)量均存在較高的相似度。本研究通過(guò)在線UALCAN數(shù)據(jù)庫(kù)分析AXIN2基因的泛癌表達(dá)情況發(fā)現(xiàn):AXIN2在結(jié)直腸癌組織中表達(dá)量明顯高于癌旁的正常結(jié)腸組織,而在其他腫瘤樣本中情況相反,即AXIN2在正常組織中的表達(dá)量明顯高于腫瘤組織,該結(jié)果與本研究通過(guò)R語(yǔ)言分析結(jié)果一致。本研究對(duì)7個(gè)核心基因進(jìn)行相關(guān)性分析顯示:NKD1和AXIN2基因在不同腫瘤組織中存在較高的相關(guān)性(相關(guān)系數(shù)為0.69),此外,NKD2還與NKD1、AXIN 2和ARID3A存在較高的相關(guān)性。核心基因與免疫細(xì)胞亞型之間的相關(guān)性分析結(jié)果顯示:TACSTD2基因在免疫細(xì)胞C1、C2、C3和C6亞型中表達(dá)量明顯高于其在C4和C5亞型中的表達(dá)量。NKD1基因在免疫細(xì)胞C5亞型中的表達(dá)量明顯高于其在C1、C2、C3、C4和C6亞型中的表達(dá)量。雖然本研究探討了核心基因與免疫細(xì)胞亞型之間的相關(guān)性,但是由于篇幅有限,未對(duì)所有基因進(jìn)行一一分析說(shuō)明,僅代表性地以NKD1和TACSTD2為例進(jìn)行說(shuō)明。7個(gè)核心基因與腫瘤微環(huán)境的相關(guān)性分析結(jié)果顯示:TACSTD2基因的表達(dá)與泛癌多數(shù)樣品中綜合(基質(zhì)細(xì)胞和免疫細(xì)胞總和)評(píng)分呈顯著正相關(guān)關(guān)系,即TACSTD2基因的表達(dá)越高,GBM、KICH、PCPG和UVM等腫瘤樣品中的基質(zhì)細(xì)胞和免疫細(xì)胞的總數(shù)越多,則腫瘤細(xì)胞數(shù)就會(huì)越少。AXIN 2基因的表達(dá)與ACC、COAD、GBM、MESO、READ、SARC和TGCT等腫瘤樣品綜合評(píng)分呈負(fù)相關(guān)關(guān)系,即AXIN2表達(dá)越高,這些腫瘤樣品中的腫瘤細(xì)胞總數(shù)越多。為了驗(yàn)證生物信息學(xué)篩選結(jié)果,本研究通過(guò)實(shí)驗(yàn)進(jìn)一步驗(yàn)證了AXIN2、NKD1和NKD2在結(jié)腸癌組織中高表達(dá),且其表達(dá)具有顯著正相關(guān)關(guān)系。本研究未對(duì)所有基因進(jìn)行逐一驗(yàn)證說(shuō)明,這也是本研究不足之處。此外,本研究對(duì)這7個(gè)核心基因進(jìn)行結(jié)腸癌生存風(fēng)險(xiǎn)概率分析,分別對(duì)其表達(dá)與結(jié)腸癌患者的臨床參數(shù),如年齡、性別、腫瘤分期、原發(fā)腫瘤、區(qū)域淋巴結(jié)和遠(yuǎn)處轉(zhuǎn)移等因素進(jìn)行單因素及多因素分析,結(jié)果發(fā)現(xiàn)僅AXIN2基因的表達(dá)與結(jié)腸癌患者OS存在顯著相關(guān)性;多因素分析結(jié)果顯示:AXIN2的表達(dá)量為0.82,P=0.026,因此AXIN2為結(jié)腸癌患者OS的低風(fēng)險(xiǎn)預(yù)后因子。研究[32]顯示:AXN2和β-catenin在結(jié)直腸癌組織中較高表達(dá),且β-catenin的表達(dá)可以作為結(jié)直腸癌患者OS的獨(dú)立預(yù)后因子,但是尚未提及AXIN 2與預(yù)后的相關(guān)性[32]。研究[33]顯示AXIN2可能是結(jié)腸癌的一個(gè)風(fēng)險(xiǎn)標(biāo)志物。但目前尚無(wú)文獻(xiàn)報(bào)道AXIN 2可作為結(jié)腸癌OS的低風(fēng)險(xiǎn)獨(dú)立預(yù)后因子,本研究是對(duì)該領(lǐng)域的重要補(bǔ)充。
本研究通過(guò)STRING數(shù)據(jù)庫(kù)篩選了具有相互聯(lián)系的7個(gè)核心基因,但這不代表另外6個(gè)基因無(wú)研究?jī)r(jià)值。本研究通過(guò)生物信息學(xué)數(shù)據(jù)分析發(fā)現(xiàn)這6個(gè)基因不能作為獨(dú)立因素起作用。本研究通過(guò)生物信息學(xué)方法篩選潛在重要的核心基因及獨(dú)立預(yù)后因子,這些結(jié)果需要更多數(shù)據(jù)進(jìn)行進(jìn)一步確認(rèn),為后續(xù)深入研究提供一定的數(shù)據(jù)支持。
吉林大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2022年3期