葉真逢,習(xí)小慶,黃高敏,黃雅為,汪建焜
(1.南昌大學(xué)第二附屬醫(yī)院泌尿外科,南昌 330008;2.景德鎮(zhèn)第一人民醫(yī)院泌尿外科,景德鎮(zhèn) 333000)
腎細(xì)胞癌中腎透明細(xì)胞癌(Kidney Renal Clear Cell Carcinoma, KIRC) 最為常見,約占全部病例的80%[1-3]。 如何識(shí)別腎透明細(xì)胞癌高危人群,進(jìn)一步降低發(fā)病率及死亡率, 是擺在我們面前的一個(gè)難題。 此外,不同群體及個(gè)體在相似暴露因素下對腫瘤發(fā)生與否及藥物治療反應(yīng)存在較大差異, 這種差異被稱為腫瘤遺傳易感性[3]。 因此,準(zhǔn)確的分子診斷和預(yù)后生物學(xué)指標(biāo)的發(fā)展對腎透明細(xì)胞癌患者個(gè)體化和精準(zhǔn)治療至關(guān)重要。
單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP) 是由單個(gè)核苷酸變異引起的DNA 序列多態(tài)性,是人類最常見的遺傳變異類型。 SNP 是研究不同癌癥或癌癥特征的重要遺傳標(biāo)記, 被認(rèn)為是潛在的癌變標(biāo)志物, 因此對于癌癥早期診斷和個(gè)性化的靶向治療有價(jià)值[4-5]。 此外有研究表明腎透明細(xì)胞癌易感性與遺傳SNP 有關(guān), 如醛脫氫酶2(Aldehyde Dehydrogenase 2, ALDH2) 與多種腫瘤的發(fā)生和進(jìn)展密切相關(guān)[6],編碼PD-1 和PD-L1 分子的基因單核苷酸多態(tài)性與腎細(xì)胞癌發(fā)展相關(guān),并影響腎癌患者預(yù)后[7]。 由于與癌癥風(fēng)險(xiǎn)相關(guān)的SNP 可能會(huì)影響預(yù)后, 因此對相關(guān)SNP 分析可能有助于確定新的癌癥預(yù)后生物標(biāo)志物。 故本研究探究單核苷酸多態(tài)性與腎透明細(xì)胞癌易感性的相關(guān)性,旨在為準(zhǔn)確識(shí)別腎透明細(xì)胞癌的高危人群提供科學(xué)依據(jù)。
1.1 TCGA 中突變和轉(zhuǎn)錄組數(shù)據(jù)獲取 從公共開源的TCGA 中下載關(guān)于SNP 的原始數(shù)據(jù)格式Masked Somatic Mutation, 選擇VarScan2 平臺(tái)測序的SNP相關(guān)數(shù)據(jù),并下載mRNA 原始表達(dá)數(shù)據(jù),收集611份mRNA 數(shù)據(jù),其中正常樣本72 份,癌癥樣本539份。 從腎透明細(xì)胞癌樣本SNP 數(shù)據(jù)中獲得突變基因。將mRNA 原始數(shù)據(jù)用edger 軟件包進(jìn)行整合和標(biāo)準(zhǔn)化,得到差異表達(dá)基因及其表達(dá)水平。
1.2 TCGA 突變頻率統(tǒng)計(jì) 應(yīng)用perl 軟件從原始SNP 相關(guān)數(shù)據(jù)中提取要可視化基因名稱、染色體位置、突變類型及樣本編號(hào)。 將準(zhǔn)備好的SNP 突變頻率數(shù)據(jù)用GenVisR 軟件包進(jìn)行整合和可視化,繪制瀑布圖。
1.3 突變基因的功能富集和通路分析 為了解這些突變基因的功能,使用R 軟件調(diào)用clusterProfiler、org.Hs.eg.db、enrichplot、ggplot2 軟件包進(jìn)行功能富集和通路分析,對超過8 個(gè)突變樣本的基因進(jìn)行基因本體論(gene ontology,GO)和京都基因和基因組百科全書 (kyoto gene and genome encyclopedia,KEGG)富集分析,完成篩選分子功能、生物過程、細(xì)胞組分和KEGG 通路進(jìn)行突變基因富集。
1.4 PPI 蛋白互作網(wǎng)絡(luò)的構(gòu)建 生物網(wǎng)絡(luò)的構(gòu)建可以以實(shí)際系統(tǒng)規(guī)模形式進(jìn)行擴(kuò)展, 并提供分子相互作用的可視化表征。 使用STRING 在線數(shù)據(jù)庫11.5 來描述突變基因的PPI 網(wǎng)絡(luò),并設(shè)置置信評分0.4 作為參考標(biāo)準(zhǔn), 然后使用Cytoscape 軟件可視化生成的PPI 網(wǎng)絡(luò)。
1.5 基因突變與表達(dá)之間的相關(guān)性分析 探索突變與基因表達(dá)之間的相關(guān)性以分析突變在腎透明細(xì)胞癌發(fā)生中的作用。 將轉(zhuǎn)錄組數(shù)據(jù)標(biāo)準(zhǔn)化后與SNP 數(shù)據(jù)進(jìn)行整合,分析基因突變與基因表達(dá)的聯(lián)系, 采用Wilcox 秩和檢驗(yàn)分析野生型與突變型基因表達(dá)的差異,以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
1.6 基因突變的生存分析 從TCGA 下載原始臨床數(shù)據(jù)中提取每個(gè)樣本生存時(shí)間與生存狀態(tài)信息, 使用hash 軟件包將基因突變信息與生存數(shù)據(jù)進(jìn)行合并, 利用survival 軟件包繪制突變基因的Kaplan-Meier 生存曲線, 評估突變基因?qū)δI透明細(xì)胞癌患者預(yù)后的影響。
2.1 腎透明細(xì)胞癌SNP 數(shù)據(jù)分析 結(jié)果發(fā)現(xiàn),106個(gè)基因超過8 例樣本中發(fā)生了突變(圖1)。 基于R軟件相關(guān)LIMMA 軟件包對腎透明細(xì)胞癌與正常組織樣本進(jìn)行表達(dá)差異分析, 設(shè)置|log FC|> 3, P<0.01,獲得1366 個(gè)差異表達(dá)基因(圖2)。
圖1 腎透明細(xì)胞癌的突變基因瀑布圖
圖2 腎透明細(xì)胞癌的差異基因火山圖
2.2 突變基因的功能富集和通路分析 功能分析顯示,在生物過程(Biological Process,BP)中,SNP 突變基因主要富集于肌肉組織的發(fā)育; 在分子功能(Molecular Function,MF)中,這些基因主要影響細(xì)胞外基質(zhì)結(jié)構(gòu)成分、ATP 酶活性和肌動(dòng)蛋白纖維的結(jié)合。 在細(xì)胞組分(Cellular Component,CC)中,SNP 基因主要定位于細(xì)胞質(zhì)和細(xì)胞外膠原纖維(圖3)。此外,KEGG 通路富集分析顯示,SNP 突變基因在許多癌癥信號(hào)通路中富集,包括肌醇磷脂-3-激酶(PI3K)-Akt、焦點(diǎn)粘連、細(xì)胞外基質(zhì)受體相互作用等信號(hào)通路(圖4)。
圖3 腎透明細(xì)胞癌突變基因的GO 功能富集分析
圖4 腎透明細(xì)胞癌突變基因的KEGG 信號(hào)通路富集分析
2.3 突變基因PPI 網(wǎng)絡(luò)的構(gòu)建 使用Cytoscape 軟件進(jìn)行可視化, 構(gòu)建的復(fù)雜PPI 網(wǎng)絡(luò), 并使用MCODE 功能篩選出重要子模塊(圖5)。
圖5 腎透明細(xì)胞癌突變基因的PPI 網(wǎng)絡(luò)及重要子模塊
2.4 基因突變與表達(dá)之間的相關(guān)性分析 將基因突變與經(jīng)標(biāo)準(zhǔn)化后基因表達(dá)進(jìn)行整合, 提取在腎透明細(xì)胞癌中突變頻率最高的5 個(gè)基因VHL、PBRM1、TTN、SETD2、BAP1 與IGF1R 的突變及表達(dá)數(shù)據(jù), 采用wilcox 檢驗(yàn)分析野生型與突變型基因表達(dá)的差異。 結(jié)果顯示,PBRM1、SETD2、BAP1這3 個(gè)基因的突變與表達(dá)之間存在相關(guān)性 (P<0.001),而突變體樣本中VHL、TTN、IGF1R 的表達(dá)量差異無統(tǒng)計(jì)學(xué)意義(圖6)。
圖6 腎透明細(xì)胞癌基因突變與表達(dá)的相關(guān)性分析
2.5 突變基因的生存分析 根據(jù)突變將患者分為野生型組和突變型組, 繪制VHL、PBRM1、TTN、SETD2、BAP1 與IGF1R 這6 個(gè)突變基因的Kaplan-Meier 曲線。 使用P<0.05 為顯著水平,發(fā)現(xiàn)這6 個(gè)基的突變與患者的預(yù)后差異無統(tǒng)計(jì)學(xué)意義(圖7)。
圖7 腎透明細(xì)胞癌突變基因的生存曲線
腎透明細(xì)胞癌是一種復(fù)雜的疾病, 是腎癌相關(guān)死亡的常見原因。 SNP 與多種癌癥相關(guān),如miRNA-146a 與胃癌化療療效有關(guān)等,故及早發(fā)現(xiàn)SNP 突變,對改善患者預(yù)后有重要意義[8]。 因此,生物信息學(xué)分析突變基因的預(yù)后和特定的SNP 基因突變篩查可以為臨床醫(yī)生提供治療病人和預(yù)測預(yù)后的新工具。
在本研究中, 為進(jìn)一步研究突變基因參與的相關(guān)分子機(jī)制,從而進(jìn)行功能富集和通路分析,結(jié)果顯示該類突變基因主要參與細(xì)胞外基質(zhì)結(jié)構(gòu)、肌肉組織發(fā)育。 通路富集分析表明,SNP 突變基因主要參與PI3K-Akt、焦點(diǎn)粘連、細(xì)胞外基質(zhì)受體相互作用等在許多癌癥中富集的信號(hào)通路。 功能富集和通路分析揭示了SNP 突變在疾病進(jìn)展中的分子機(jī)制,以及這些基因在功能水平上的相互作用。對在腎透明細(xì)胞癌患者中突變頻率最高的5 個(gè)基因(VHL、PBRM1、TTN、SETD2、BAP1) 與IGF1R 基因的突變與相應(yīng)的表達(dá)水平進(jìn)行分析,結(jié)果表明,PBRM1、SETD2、BAP1 這3 個(gè) 基 因 的 突 變 與 表 達(dá)水平之間顯著相關(guān), 且突變后的mRNA 表達(dá)水平升高, 而突變樣本中另外3 個(gè)基因VHL、TTN、IGF1R 的表達(dá)量無統(tǒng)計(jì)學(xué)差異。通過繪制該類突變基因的Kaplan-Meier 曲線,并進(jìn)行生存分析,發(fā)現(xiàn)該類基因突變與患者預(yù)后無相關(guān)性。 這可能與所選樣本大多來源于預(yù)后較好的早期局部腎透明細(xì)胞癌患者,導(dǎo)致生存時(shí)間差異不顯著。
VHL 蛋白在調(diào)節(jié)缺氧誘導(dǎo)因子(HIF)的蛋白酶體降解中起關(guān)鍵作用。 VHL 失活不能介導(dǎo)HIF蛋白降解,從而激活這些下游生長因子轉(zhuǎn)錄,導(dǎo)致血管生成和細(xì)胞增殖增強(qiáng), 促進(jìn)VHL 相關(guān)疾病中腫瘤發(fā)生[9]。 Sato 等[10]研究顯示VHL 基因內(nèi)突變,涉及VHL 染色體缺失,VHL 雙等位基因失活是散發(fā)性腎透明細(xì)胞癌發(fā)生的重要機(jī)制, 該研究還發(fā)現(xiàn)在KIRC 中反復(fù)突變的通路包括PI3K-AKTmTOR 信號(hào)傳導(dǎo)。 而PI3K/AKT 是細(xì)胞中重要信號(hào)轉(zhuǎn)導(dǎo)通路,與惡性腫瘤轉(zhuǎn)移顯著相關(guān),AKT 是PI3K下游直接靶蛋白,AKT 蛋白的激活在癌癥發(fā)展中具有重要生物學(xué)作用。 本研究結(jié)果顯示,PI3KAKT 信號(hào)通路及其他幾個(gè)與癌癥密切相關(guān)的信號(hào)通路中富集, 如癌癥中的焦點(diǎn)粘連和細(xì)胞外基質(zhì)受體相互作用。
VHL 突變并不是腎透明細(xì)胞癌腫瘤發(fā)生的唯一驅(qū)動(dòng)力,PBRM1、BAP1、SETD2 等染色質(zhì)修飾基因也發(fā)生高頻突變[11]。 PBRM1、SETD2 和BAP1 與VHL 類似, 這表明腎透明細(xì)胞癌發(fā)病機(jī)制的重要組成部分可能是3p 等位基因缺失導(dǎo)致四種腫瘤抑制因子同時(shí)發(fā)生失活。 而且BAP1 和SETD2 的突變可能是VHL 或PBRM1 丟失的繼發(fā)事件[12]。Hakimi 等[13]研究發(fā)現(xiàn),PBRM1、BAP1 或SETD2 中任何一個(gè)突變的腫瘤更可能出現(xiàn)III 期或更高分期的疾病,具有PBRM1 突變的小腫瘤(<4 cm)更有可能表現(xiàn)出III 期病理特征,BAP1 突變往往發(fā)生在Fuhrman III-IV 級(jí)腫瘤中, 并且與更差的腫瘤生存時(shí)間相關(guān)。 因此這些染色質(zhì)修飾基因發(fā)生突變, 可能與晚期、 高病理分期和更差的預(yù)后相關(guān)。
胰島素樣生長因子1 受體 (IGF1R) 基因位于15q26。 IGF1R 蛋白調(diào)節(jié)眾多下游信號(hào),通常通過調(diào)節(jié)腫瘤細(xì)胞生長和凋亡參與腫瘤發(fā)生、 存活和轉(zhuǎn)移[14-15]。IGF1R 包括2 個(gè)配體(IGF-1 和IGF-2),兩個(gè)細(xì)胞表面受體(IGF-1R 和IGF-2R)和至少六個(gè)IGF 結(jié)合蛋白(IGFBP 1-6),控制正常組織生長與大多數(shù)器官分化。 其中1%循環(huán)IGF-1 蛋白與IGF-1R 結(jié)合觸發(fā)兩個(gè)信號(hào),即刺激增殖和抗細(xì)胞凋亡。 IGF-1 可刺激細(xì)胞DNA 合成,上調(diào)細(xì)胞周期蛋白D1 表達(dá), 促使細(xì)胞由G1 期進(jìn)入S 期,同時(shí)通過調(diào)節(jié)Bcl 和Bax 蛋白,抑制細(xì)胞凋亡。 因此IGF-1 抗凋亡作用可使有惡性變傾向的細(xì)胞逃避凋亡而促使腫瘤發(fā)生。在本研究中,發(fā)現(xiàn)IGF1R 在突變樣本中表達(dá)水平降低,差異無統(tǒng)計(jì)學(xué)意義,這可能與該基因突變樣本比例較少有關(guān)。 此外,本研究結(jié)果未得到突變與不良預(yù)后的有效結(jié)果, 這需要進(jìn)一步的臨床研究及測序分析。
綜上所述, 本研究通過生物信息學(xué)分析為臨床診斷和預(yù)后評估提供新的思路, 為腎透明細(xì)胞癌的后續(xù)研究提供了重要的生物信息學(xué)基礎(chǔ)和相關(guān)理論依據(jù)。