席奕軼 施新澤 林 霖 郭文佳 劉天媛 王雨芊 林東昕 吳 晨
食管癌(esophageal cancer, EC)是原發(fā)于食管黏膜上皮的惡性腫瘤,其發(fā)生率位居惡性腫瘤第6位,在全球腫瘤相關(guān)死亡中位居第8位[1]。食管癌的組織類型主要包括鱗癌和腺癌兩種,其中食管鱗狀細(xì)胞癌(esophageal squamous cell carcinoma, ESCC)占全球食管癌病例的80%,尤其是中國,占比高達90%~95%,提示食管鱗癌相關(guān)研究的重要性[2~4]。
癌癥的發(fā)生、發(fā)展往往涉及基因變異、基因表達異常、表觀調(diào)控異常等多個層次的復(fù)雜調(diào)控機制。近年來,大規(guī)模測序研究已經(jīng)在人類癌癥中發(fā)現(xiàn)多個腫瘤驅(qū)動基因。一項整合TCGA基因突變、甲基化譜和表達譜數(shù)據(jù)的泛癌分析研究揭示了腫瘤驅(qū)動基因在表觀基因組中重要的調(diào)控作用[5]。研究者通過整合704例食管鱗癌全基因組或外顯子組測序數(shù)據(jù),鑒定了TP53、NOTCH1、MLL2、FAT1、NFE2L2、PIK3CA和EP300等20個驅(qū)動基因,其中93%(657/704)的患者存在至少一個驅(qū)動基因的體細(xì)胞突變[6~14]。然而尚未有研究系統(tǒng)探究驅(qū)動基因的體細(xì)胞突變、拷貝數(shù)改變、基因表達和甲基化等多組學(xué)數(shù)據(jù),以及20個驅(qū)動基因中各個分子層面數(shù)據(jù)間的調(diào)控關(guān)系。本研究整合了食管鱗癌驅(qū)動基因的拷貝數(shù)變異信息、DNA甲基化和基因表達數(shù)據(jù),分別進行突變與基因表達、拷貝數(shù)與基因表達和甲基化與基因表達的關(guān)聯(lián)分析,并結(jié)合患者的臨床資料進行生存分析,系統(tǒng)闡述了20個驅(qū)動基因在不同層面組學(xué)數(shù)據(jù)間的交互作用與潛在調(diào)控關(guān)系,為進一步闡明驅(qū)動基因在食管鱗癌發(fā)生、發(fā)展中的作用機制提供了思路。
1.研究對象:本研究所使用的91例食管鱗狀細(xì)胞癌患者的組織樣本均來自2010年~2014年在中國醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院及浙江省腫瘤醫(yī)院接受手術(shù)治療的患者。所有患者未經(jīng)過放射治療或化學(xué)藥物治療,以組織病理學(xué)診斷為最終判斷依據(jù)?;颊叩娜颗R床信息及生存時間來自病歷記錄及定期隨訪。所有患者均簽署了知情同意書。本研究通過了中國醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院及浙江省腫瘤醫(yī)院倫理學(xué)審查委員會的批準(zhǔn)。
2.數(shù)據(jù)來源:患者體細(xì)胞突變、拷貝數(shù)改變及基因表達數(shù)據(jù)來自本組前期研究[14]。DNA甲基化數(shù)據(jù)通過Illumina 450K甲基化芯片檢測獲取。另外,利用TCGA 數(shù)據(jù)庫(https://tcga-data.nci.nih.gov/docs/publications/tcga/)下載了95例食管鱗癌患者的體細(xì)胞突變、拷貝數(shù)改變、Illumina 450K甲基化芯片和轉(zhuǎn)錄組數(shù)據(jù)及相關(guān)臨床資料。Illumina 450K芯片的探針注釋文件來自ENCODE (http://genome.ucsc.edu/ENCODE/downloads. html)。
3. 數(shù)據(jù)分析:體細(xì)胞突變與驅(qū)動基因表達水平的比較分析,根據(jù)某個驅(qū)動基因在人群中是否存在突變,將患者分為突變組和非突變組,并分析20個驅(qū)動基因的表達水平在兩組間的差異。表達差異倍數(shù)(fold change, FC)定義為突變組的表達水平比非突變組的表達水平??截悢?shù)改變與驅(qū)動基因表達水平的關(guān)聯(lián)分析,通過Spearman秩相關(guān)分析鑒別驅(qū)動基因拷貝數(shù)改變與基因表達水平之間的關(guān)聯(lián),當(dāng)Spearman相關(guān)系數(shù) |r|>0.3 時認(rèn)為存在相關(guān)。DNA甲基化與驅(qū)動基因表達水平的關(guān)聯(lián)分析,通過Spearman秩相關(guān)分析,鑒別基因上甲基化位點的甲基化水平與基因表達之間的關(guān)聯(lián)。若甲基化位點位于啟動子區(qū)域,且Spearman相關(guān)系數(shù)r<-0.3時認(rèn)為存在相關(guān);若甲基化位點位于基因體區(qū)域,且Spearman相關(guān)系數(shù)r>0.3時認(rèn)為存在相關(guān)。
4.統(tǒng)計學(xué)方法:應(yīng)用R軟件(3.5.1版)對數(shù)據(jù)進行統(tǒng)計分析。體細(xì)胞突變與驅(qū)動基因表達水平的關(guān)聯(lián)分析采用非配對t檢驗??截悢?shù)改變、DNA甲基化與驅(qū)動基因表達水平的關(guān)聯(lián)分析采用Spearman秩相關(guān)。采用KaplanMeier法繪制生存曲線,通過Log-Rank檢驗進行生存曲線的比較,以P<0.05為差異有統(tǒng)計學(xué)意義。
1.體細(xì)胞突變與驅(qū)動基因表達水平的關(guān)聯(lián)分析:根據(jù)各個驅(qū)動基因突變與否將患者分為突變組與非突變組,并對兩組患者基因表達水平進行比較。結(jié)果顯示,CDKN2A突變組患者表達水平顯著高于非突變組(FC=7.73,P=0.002),而RB1突變組患者表達水平則顯著低于非突變組(FC=0.46,P=0.002)。另外,TCGA數(shù)據(jù)分析結(jié)果顯示,TP53(FC=1.70,P=0.018)和ZNF750(FC=2.31,P=0.026)突變組患者表達水平均顯著高于非突變組。最后,將兩部分?jǐn)?shù)據(jù)合并后進行分析,TP53(FC=1.43,P=0.011, 圖1A)、RB1(FC=0.44,P=0.045, 圖1B)和ZNF750(FC=2.20,P=0.012, 圖1C)的表達差異有統(tǒng)計學(xué)意義,同時還發(fā)現(xiàn)PTCH1(FC=2.62,P=0.011, 圖1D)突變組表達顯著高于非突變組。
圖1 驅(qū)動基因突變組與非突變組中基因表達水平*P<0.05
2.拷貝數(shù)改變與驅(qū)動基因表達水平的關(guān)聯(lián)分析:對20個驅(qū)動基因的拷貝數(shù)和表達水平進行關(guān)聯(lián)分析,以鑒別拷貝數(shù)變異與驅(qū)動基因轉(zhuǎn)錄水平的相關(guān)程度。10個驅(qū)動基因的表達水平與其拷貝數(shù)改變呈顯著正相關(guān)(r>0.3,P<0.05),其中PTEN、CUL3、PIK3CA和FAT1的相關(guān)系數(shù)明顯高于其他基因(r>0.5)。在TCGA數(shù)據(jù)中進行關(guān)聯(lián)分析,結(jié)果顯示大部分驅(qū)動基因(n=14,表1)的表達水平與其拷貝數(shù)呈正相關(guān)(r>0.3,P<0.05),其中5個驅(qū)動基因(CDKN2A、PIK3CA、FBXW7、CUL3、RBPJ)的相關(guān)系數(shù)明顯高于其他基因(r>0.5)。8個驅(qū)動基因的表達水平在兩部分?jǐn)?shù)據(jù)中均與拷貝數(shù)改變呈顯著正相關(guān)。
表1 拷貝數(shù)改變與表達水平呈顯著正相關(guān)的驅(qū)動基因
3.DNA甲基化與驅(qū)動基因表達水平的關(guān)聯(lián)分析:共發(fā)現(xiàn)11個驅(qū)動基因表達與其啟動子區(qū)甲基化呈負(fù)相關(guān)(r<-0.3,P<0.05),6個驅(qū)動基因表達與基因體甲基化呈正相關(guān)(r>0.3,P<0.05,表1)。CDKN2A、FBXW7、CUL3、FAT1和PTCH1的表達同時受到啟動子和基因體甲基化的協(xié)同調(diào)節(jié)。另外,與本研究結(jié)果不同,TCGA數(shù)據(jù)分析結(jié)果顯示KDM6A、NOTCH3和RBPJ的基因表達受到啟動子和基因體甲基化的共同調(diào)控(表1)。這些結(jié)果揭示了啟動子和基因體甲基化在食管鱗癌驅(qū)動基因轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)中可能存在協(xié)同作用。
4.驅(qū)動基因相關(guān)生存分析:兩組患者Kaplan-Meier生存曲線比較,CREBBP突變組患者的生存時間顯著短于非突變組患者(P=0.029),中位生存時間分別為11和19個月。TCGA數(shù)據(jù)中驅(qū)動基因生存分析的結(jié)果顯示,CREBBP突變組患者的生存時間同樣較短(中位生存時間為9和29個月,P=0.000),并且FAT1突變組患者生存情況明顯較差(中位生存時間為12和29個月,P=0.005)。為了進一步驗證上述結(jié)果,筆者將兩部分?jǐn)?shù)據(jù)合并進行生存分析,結(jié)果同樣發(fā)現(xiàn)CREBBP(中位生存時間為10和25個月,P=0.000,圖2)和FAT1(中位生存時間為14和26個月,P=0.002,圖3)突變組患者的生存情況較差。
圖2 CREBBP突變組與非突變組患者生存曲線比較
圖3 FAT1突變組與非突變組患者生存曲線比較
本研究利用本組和TCGA的多組學(xué)數(shù)據(jù),將食管鱗癌驅(qū)動基因的體細(xì)胞突變、拷貝數(shù)改變、基因表達和DNA甲基化等多個分子層面的數(shù)據(jù)整合起來進行關(guān)聯(lián)分析。通過體細(xì)胞突變與驅(qū)動基因表達的關(guān)聯(lián)分析,結(jié)果顯示TP53、RB1、ZNF750和PTCH1的表達水平在兩組間比較差異有統(tǒng)計學(xué)意義。為了探究食管鱗癌發(fā)生、發(fā)展過程中的異常甲基化改變對驅(qū)動基因轉(zhuǎn)錄調(diào)控的影響,筆者對單個位點甲基化與對應(yīng)驅(qū)動基因表達水平進行關(guān)聯(lián)分析??紤]到不同區(qū)域DNA甲基化調(diào)控基因表達的差異,筆者分別針對啟動子區(qū)域和基因體區(qū)域的關(guān)聯(lián)進行篩選[15-17]。ZNF750是一種譜系特異的轉(zhuǎn)錄因子,與其他轉(zhuǎn)錄因子共同參與鱗狀細(xì)胞分化的調(diào)控[18, 19]。這一結(jié)果提示驅(qū)動基因突變不僅可以通過影響編碼蛋白的功能參與異常信號網(wǎng)路的調(diào)控,而且可能通過調(diào)節(jié)其轉(zhuǎn)錄參與食管鱗癌的發(fā)生、發(fā)展。
通過拷貝數(shù)改變與基因表達的關(guān)聯(lián)分析中8個驅(qū)動基因的表達水平均與其拷貝數(shù)改變呈顯著正相關(guān),并在兩組數(shù)據(jù)中比較差異均有統(tǒng)計學(xué)意義,其中CUL3和RBPJ的敲降可以顯著增加食管鱗癌細(xì)胞的增殖和遷移等[14]。FAT1和MLL2的拷貝數(shù)僅在本研究數(shù)據(jù)中與表達呈正相關(guān),而NFE2L2等6個驅(qū)動基因表達水平僅在TCGA數(shù)據(jù)中與其拷貝數(shù)呈顯著正相關(guān)。NFE2L2是抗氧化信號通路的重要成員,其編碼蛋白NRF2可以激活多個控制氧化應(yīng)激基因的轉(zhuǎn)錄,該基因的突變還與食管鱗癌患者的不良預(yù)后和化療抵抗相關(guān)[20, 21]。
此外,本研究通過DNA甲基化與基因表達水平的關(guān)聯(lián)分析,探究了甲基化在驅(qū)動基因轉(zhuǎn)錄調(diào)控中的貢獻。已有的食管鱗癌甲基化報道僅關(guān)注啟動子區(qū)甲基化與基因表達間的調(diào)控關(guān)系[22, 23]。筆者同時考慮了啟動子和基因體甲基化對基因表達的調(diào)控作用,在本研究數(shù)據(jù)中發(fā)現(xiàn)CDKN2A、FBXW7、CUL3、FAT1和PTCH1的表達與啟動子和基因體的甲基化均顯著相關(guān),而TCGA數(shù)據(jù)中僅發(fā)現(xiàn)KDM6A、NOTCH3和RBPJ。這表明食管鱗癌驅(qū)動基因表達可能受到啟動子甲基化、基因體甲基化或二者的共同調(diào)控。
最后,本研究結(jié)果顯示CREBBP和FAT1突變均與患者的預(yù)后相關(guān),可能作為食管鱗癌潛在的預(yù)后標(biāo)志物。CREBBP是KAT3家族主要的賴氨酸乙酰轉(zhuǎn)移酶,可以作為許多信號通路的轉(zhuǎn)錄共激活因子[24, 25]。FAT1在多個發(fā)育過程中十分重要,其異常失活會導(dǎo)致多種腫瘤中Wnt信號通路的異常激活[26]。
綜上所述,本研究通過20個驅(qū)動基因多組學(xué)數(shù)據(jù)的整合分析,闡明了食管鱗癌驅(qū)動基因多個分子層面的異常改變以及它們間的交互作用。通過生存分析,本研究還鑒別了兩個潛在的食管鱗癌預(yù)后標(biāo)志物,為臨床患者的預(yù)后判斷和分層治療提供了幫助。