何天基,陳翔,王偉,劉峰,蔡孟會(huì),石海林#
1廣西醫(yī)科大學(xué)附屬柳州市人民醫(yī)院泌尿外科,廣西 柳州 545006
2桂林醫(yī)學(xué)院附屬醫(yī)院泌尿外科,廣西 桂林 541001
腎癌是常見的泌尿系統(tǒng)惡性腫瘤之一,據(jù)預(yù)測(cè)2021 年美國(guó)將發(fā)生約76 080 例腎癌病例,其中死亡病例約13 780 例,而腎透明細(xì)胞癌(kidney renal clear cell carcinoma,KΙRC)約占腎癌的85%。早期KΙRC 患者的生存率超過75%,但由于解剖位置隱蔽、患者認(rèn)知等因素影響,多數(shù)患者在確診時(shí)已發(fā)生轉(zhuǎn)移,而Ⅳ期患者的生存率﹤10%。既往對(duì)KΙRC 的研究多涉及單個(gè)基因,但隨著研究的深入,單基因單疾病理論難以解析腫瘤的發(fā)生及發(fā)展,并且KΙRC 存在較大的異質(zhì)性,靶向治療的效果在不同患者中差異很大,對(duì)個(gè)體治療藥物的選擇是臨床實(shí)踐中的一個(gè)巨大挑戰(zhàn)。因此,對(duì)KΙRC 患者的基因特征進(jìn)行系統(tǒng)分析以確定KΙRC新的生物標(biāo)志物是非常必要的,這不僅有利于提高KΙRC 的診斷率,還能夠?yàn)镵ΙRC 的治療提供新的藥物靶點(diǎn)。加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)是在復(fù)雜數(shù)據(jù)中快速提取出與樣本特征相關(guān)的基因共表達(dá)模塊,計(jì)算基因之間的表達(dá)相關(guān)性,從而將具有表達(dá)相關(guān)性的基因聚類到一個(gè)模塊中,再分析模塊與樣本特征(包括臨床特征、手術(shù)方式、治療方法等)的相關(guān)性。本文通過WGCNA 對(duì)腫瘤基因圖譜(The Cancer Genome Atlas,TCGA)及基因 表 達(dá) 匯 編(Gene Expression Omnibus,GEO)(GSE66272、GSE3)中的基因表達(dá)譜數(shù)據(jù)進(jìn)行分析,以期發(fā)現(xiàn)KΙRC 發(fā)生發(fā)展的關(guān)鍵基因及信號(hào)通路,為KΙRC 患者的精準(zhǔn)治療提供新的靶點(diǎn),現(xiàn)報(bào)道如下。
分別從TCGA(https://portal.gdc.cancer.gov/)和GEO(https://www.ncbi.nlm.nih.gov/gds)中 下 載KΙRC 的轉(zhuǎn)錄組數(shù)據(jù)及其對(duì)應(yīng)的臨床數(shù)據(jù),TCGA中含539 例KΙRC 組織和59 例正常腎組織;采用R語言(https://www.r-project.org/)中的“l(fā)imma”“edgeR”“pheatmap”“ggplot2”包對(duì)轉(zhuǎn)錄數(shù)據(jù)進(jìn)行提取,得到14 701 個(gè)表達(dá)譜基因,并篩選差異表達(dá)基因(differentially expressed gene,DEG)。通過GEO數(shù)據(jù)庫(kù)下載GSE66272 及GSE3 芯片基因表達(dá)數(shù)據(jù),分別包括27、171 例KΙRC 組織及其配對(duì)的正常組織,然后利用實(shí)用報(bào)表提取語言(practical extraction and report language,PERL)合并GEO 數(shù)據(jù)集,通過“ggplot2”“l(fā)imma”“pheatmap”包提取分析,共得到21 655 個(gè)DEG 用于后續(xù)研究。DEG篩選標(biāo)準(zhǔn)為錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)﹤0.05 和對(duì)數(shù)化表達(dá)變化倍數(shù)(fold change,|log2FC|)﹥2.0。
利用“WGCNA”包對(duì)方差前25%的基因構(gòu)建TCGA-KΙRC、GSE66272 及GSE3 基因共表達(dá)網(wǎng)絡(luò),通過分析所有基因表達(dá)量的Pearson 相關(guān)性,并轉(zhuǎn)化為拓?fù)渲丿B矩陣(topological overlap matrix,TOM)以及基因不相似性的矩陣(1-TOM),利用基因顯著性及模塊顯著性評(píng)估基因和臨床信息的相關(guān)性,高相關(guān)系數(shù)的模塊被認(rèn)為是與臨床性狀相關(guān)的候選模塊。利用R 語言中的“VennDiagram”包從TCGA 及GEO 數(shù)據(jù)庫(kù)的共表達(dá)網(wǎng)絡(luò)基因中提取重疊的預(yù)后基因。對(duì)預(yù)后基因進(jìn)行基因本體論(gene ontology,GO)富集分析,主要分為3 個(gè)部分:細(xì)胞組分(cellular component,CC)、分子功能(molecular function,MF)、生物過程(biological process,BP)。通過這3 個(gè)功能大類,對(duì)一個(gè)基因的功能進(jìn)行多方面的限定和描述;再通過京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)對(duì)所得差異表達(dá)基因的通路進(jìn)行富集分析,用到的R 包為“org.Hs.eg.db”“clusterProfiler”“enrichplot”等。
通 過STRΙNG(http://string-db.org/cgi/input.pl)在線工具預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)相互作用,從而構(gòu)建KΙRC 預(yù)后相關(guān)基因的PPΙ 網(wǎng)絡(luò);然后在STRΙNG 數(shù)據(jù)庫(kù)中選擇評(píng)分≥0.7 的基因且排除游離不相關(guān)的基因,所得基因應(yīng)用Cytoscape(v3.7.2)軟件中的cytoHubba插件以最大團(tuán)中心(maximal clique centrality,MCC)為原則,取前10個(gè)基因進(jìn)行排序并構(gòu)建可視化的網(wǎng)絡(luò)模型,從而篩選出KΙRC的關(guān)鍵基因。
P
﹤0.05 為差異有統(tǒng)計(jì)學(xué)意義。P
值為0.05)進(jìn)行篩選,在TCGA中得到DEG 3751 個(gè),其中下調(diào)1862 個(gè),上調(diào)1889 個(gè);同樣對(duì)GEO數(shù)據(jù)集合并,提取得到DEG 3629個(gè)(設(shè)置矯正后的P
值為0.05),其中下調(diào)1721 個(gè),上調(diào)1908個(gè)。構(gòu)建基因共表達(dá)網(wǎng)絡(luò),TCGA-KΙRC中共有9個(gè)模塊,進(jìn)一步利用R語言包(“WGCNA”“l(fā)imma”包)進(jìn)行評(píng)估,分析每個(gè)模塊與兩個(gè)臨床性狀(腫瘤和正常)之間的相關(guān)性,結(jié)果表明,TCGA-KΙRC 中的綠色模塊和GEO中的黑色模塊相關(guān)性最大(綠色模塊:r
=0.59,P
﹤0.05;黑色模塊:r
=-0.85,P
﹤0.05)。利用“VennDiagram”包找出基因集中的重疊基因,共提取出112 個(gè)重疊基因,作為用于后續(xù)進(jìn)行驗(yàn)證共表達(dá)模塊的基因。篩選出112 個(gè)在兩個(gè)數(shù)據(jù)庫(kù)中均表達(dá)的預(yù)后基因,選取112 個(gè)基因中表達(dá)量為前30 的預(yù)后基因進(jìn)行GO 富集分析,結(jié)果發(fā)現(xiàn),BP 以白細(xì)胞遷移、細(xì)胞黏附調(diào)節(jié)、上皮遷移及組織遷移為主,CC 以含膠原蛋白的細(xì)胞外基質(zhì)、細(xì)胞頂端、頂端質(zhì)膜及細(xì)胞-細(xì)胞連接為主,MF 以鈉離子跨膜轉(zhuǎn)運(yùn)蛋白活性、肌動(dòng)蛋白絲結(jié)合和鈉通道活性為主(圖1A);在KEGG 通路分析中,以細(xì)胞黏附分子、緊密連接和致病性大腸桿菌的感染為主要作用通路(圖1B)。
圖1 共表達(dá)基因的富集分析
利用STRΙNG 數(shù)據(jù)庫(kù)建立重疊基因的PPΙ 網(wǎng)絡(luò),共有21個(gè)節(jié)點(diǎn)和25個(gè)邊緣(圖2A)。采用Cyto-Hubba 插件的MCC 原則從PPΙ 網(wǎng)絡(luò)中選擇關(guān)鍵基因,排名前10 的基因包括RAS 癌基因家族成員25(member RAS oncogene family,RAB25)、上皮剪接調(diào)節(jié)蛋白1(epithelial splicing regulatory protein 1,ESRP1)、上皮細(xì)胞黏附分子(epithelial cell adhesion molecule,EPCAM)、血管內(nèi)皮生長(zhǎng)因子A(vascular endothelial growth factor A,VEGFA)、T 細(xì)胞分化蛋白2(T-cell differentiation protein 2,MAL2)、粒頭樣轉(zhuǎn)錄因子2(grainyhead like transcription factor 2,GRHL2)、銜接蛋白復(fù)合物1 亞單位mu 2(adaptor related protein complex 1 subunit mu 2,AP1M2)、磷 脂 酰 肌 醇 蛋 白 聚 糖3(glypican 3,GPC3)、銅藍(lán)蛋白(ceruloplasmin,CP)、緊密連接蛋白(occludin,OCLN)(圖2B)。
圖2 PPΙ網(wǎng)絡(luò)和關(guān)鍵基因的可視化圖
P
﹤0.05)(圖3)。OLCN 及MAL2 高表達(dá)患者的DFS 分別長(zhǎng)于OLCN 及MAL2 低表達(dá)患者,GPC3 及CP 低表達(dá)患者的DFS分別長(zhǎng)于GPC3 及CP 高表達(dá)患者,差異均有統(tǒng)計(jì)學(xué)意義(P
﹤0.05)(圖4)。圖3 TCGA數(shù)據(jù)庫(kù)中KΙRC患者關(guān)鍵基因的OS分析
圖4 GEPΙA22數(shù)據(jù)庫(kù)中KΙRC患者關(guān)鍵基因的DFS分析
RAB25
、ESRP1
、EPCAM
、VEGFA
、MAL2
、GRHL2
、AP1M2
、GPC3
、CP
、OCLN
),其中OCLN
、RAB25
、GRHL2
及GPC3
與KΙRC 患者的OS 有關(guān),而OLCN
、GPC3
、CP
及MAL2
與KΙRC 患者的DFS 有關(guān)。Rab 蛋白是真核生物中保守的小分子鳥苷三磷酸(guanosine triphosphate,GTP)酶家族,目前已有超過70 個(gè)Rab 蛋白成員被鑒定參與人類細(xì)胞囊泡轉(zhuǎn)運(yùn)的調(diào)控、內(nèi)小體的捕獲和循環(huán)以及胞吐作用等。RAB25 又名CATX-8 或RAB11C,是Rab家族中的一員,主要在上皮細(xì)胞中表達(dá),具有鳥嘌呤核苷酸結(jié)合序列,可與GTP 或鳥苷二磷酸(guanosine diphosphate,GDP)結(jié)合以調(diào)節(jié)RAB25 的活性,而羧基末端的CCXXX 基序決定了RAB25 在特定囊泡上的結(jié)合,并控制了膜轉(zhuǎn)運(yùn);當(dāng)鳥嘌呤核苷酸交換因子激活后,GDP 與RAB25 分離,活性的GTP 結(jié)合RAB25 并參與囊泡的轉(zhuǎn)運(yùn)和內(nèi)小體回收,高表達(dá)的RAB25 可不同程度地影響多種惡性腫瘤的發(fā)生發(fā)展過程,與腫瘤患者的不良預(yù)后密切相關(guān)。研究表明,RAB25 蛋白在腫瘤(如膀胱癌、前列腺癌、肺癌、胃癌等)組織中的表達(dá)水平明顯高于正常組織。目前主要認(rèn)為有3 種機(jī)制調(diào)控RAB25 的表達(dá):表觀遺傳調(diào)控、微小RNA(microRNA,miRNA)調(diào)控和拷貝數(shù)變異,當(dāng)RAB25 高表達(dá)時(shí)可導(dǎo)致預(yù)后不良。雖然各種細(xì)胞內(nèi)機(jī)制研究表明RAB25 可誘導(dǎo)惡性腫瘤進(jìn)展,但目前仍不清楚低水平的RAB25 如何抑制腫瘤發(fā)生和轉(zhuǎn)移。有研究表明,RAB25 的結(jié)合伙伴Rab 偶聯(lián)蛋白(Rab-coupling protein,RCP)可以促進(jìn)腫瘤的侵襲和轉(zhuǎn)移。Tang的研究發(fā)現(xiàn),腫瘤細(xì)胞中RAB25 效應(yīng)蛋白受體組分蛋白(receptor component protein,RCP)的表達(dá)水平可能是RAB25
基因在惡性腫瘤進(jìn)展中發(fā)揮依賴作用的關(guān)鍵因素,由于RCP 可以激活RAS 蛋白,推測(cè)RAB25
基因的過表達(dá)可使RCP 遠(yuǎn)離激活的RAS 蛋白,從而降低其轉(zhuǎn)化活性。本研究中,RAB25
基因高表達(dá)可導(dǎo)致KΙRC 患者預(yù)后不良,但其具體作用機(jī)制尚需進(jìn)一步實(shí)驗(yàn)驗(yàn)證。OCLN 蛋白是構(gòu)成細(xì)胞間緊密連接的重要蛋白分子,可調(diào)節(jié)細(xì)胞旁通透性屏障,OCLN
基因敲除小鼠在不同器官(如結(jié)腸、胃、膀胱)的上皮細(xì)胞中顯示出正常的屏障功能和跨上皮阻力,但該基因的突變可能導(dǎo)致細(xì)胞異常增殖及組織學(xué)異常,從而影響幼兒的生長(zhǎng)發(fā)育,甚至導(dǎo)致生殖缺陷;在人子宮內(nèi)膜癌中,OCLN 蛋白表達(dá)水平隨著惡性腫瘤的進(jìn)展而降低。GPC3 是蛋白聚糖家族成員之一,是一種硫酸乙酰肝素蛋白多糖和細(xì)胞表面癌胚蛋白,在多種實(shí)體胚胎腫瘤中高表達(dá),包括大多數(shù)肝母細(xì)胞瘤、腎母細(xì)胞瘤、某些生殖細(xì)胞腫瘤亞型和少數(shù)橫紋肌肉瘤。GPC3 通過其核心蛋白和硫酸乙酰肝素側(cè)鏈激活典型的WNT/β-聯(lián)蛋白(β-catenin)通路,在調(diào)控細(xì)胞生長(zhǎng)和分化方面具有重要作用,與多種惡性腫瘤的發(fā)生、發(fā)展密切相關(guān),在這些惡性腫瘤中經(jīng)常過表達(dá)。GPC3
的功能缺失突變可導(dǎo)致辛普森-戈拉比-貝梅爾綜合征,這是一種X 染色體連鎖的遺傳疾病,易導(dǎo)致惡性腫瘤,包括肝母細(xì)胞瘤和腎母細(xì)胞瘤。目前針對(duì)GPC3 有多種免疫治療方法,包括腫瘤疫苗、抗體-藥物結(jié)合物、雙特異性抗體、嵌合抗原受體T細(xì)胞(chimeric antigen receptor T-cell,CAR-T)免疫療法等,為多種實(shí)體胚胎腫瘤的治療提了更多可能。粒頭樣轉(zhuǎn)錄因子(grainyhead like transcription factor,GRHL)家族由3 種核蛋白組成,分別為GRHL1、GRHL2 和GRHL3,它們負(fù)責(zé)驅(qū)動(dòng)上皮細(xì)胞的命運(yùn)。GRHL2 在發(fā)育過程中的主要作用是維持適當(dāng)?shù)哪I小管形成和抑制上皮-間充質(zhì)轉(zhuǎn)化,有證據(jù)表明GRHL2 在各種惡性腫瘤中既有抑癌作用又有致癌作用。研究表明,GRHL2 與各種類固醇受體(如雄激素和雌激素受體)有關(guān);GRHL2 作為一個(gè)先鋒因子和輔激活因子,可能直接影響類固醇受體的轉(zhuǎn)錄活性,從而導(dǎo)致相應(yīng)細(xì)胞的突變。綜上所述,本文通過WGCNA 分析了不同數(shù)據(jù)庫(kù)的高通量測(cè)序數(shù)據(jù),識(shí)別了與KΙRC 預(yù)后相關(guān)的候選基因,其中OCLN
、RAB25
、GRHL2
及GPC3
與KΙRC 患 者 的OS 有 關(guān),而OLCN
、GPC3
、CP
及MAL2
與KΙRC 患者的DFS 有關(guān),這可能成為未來惡性腫瘤治療的新靶點(diǎn),但這些基因促進(jìn)或抑制KΙRC 發(fā)展的具體機(jī)制尚不清楚。此外,這些基因之間的關(guān)系及與腫瘤發(fā)生和轉(zhuǎn)移的關(guān)系也需進(jìn)一步的研究證實(shí)。