葉乃郗,何杰,李小燕,余覓,張維,孫建
(成都醫(yī)學院,四川 成都 610500 1 臨床醫(yī)學院; 2 第一附屬醫(yī)院呼吸與危重癥醫(yī)學科)
肺癌是一種高發(fā)病率和高病死率的惡性腫瘤,隨著環(huán)境污染和職業(yè)暴露的加劇、吸煙人群的增多、人口老齡化的進展,肺癌病人的數量呈逐年上升的趨勢。中國每年預計新增肺癌病例約70萬,新增肺癌死亡病例約40萬,其中非小細胞肺癌約占肺癌總數的70%以上,且非小細胞肺癌中主要為肺腺癌,而肺腺癌病人5年生存率不到15%[1-2]。究其原因可能是肺腺癌起病比較隱匿,早期無特殊癥狀,部分病人確診時已經發(fā)展至中期以后,失去了手術的機會。因此,早期確診和分子水平的研究有利于腫瘤的綜合治療和延長病人的生存期。
隨著生物信息技術的發(fā)展和分子生物學設備的更新,肺癌在分子水平的發(fā)生發(fā)展機制得到深入研究。目前研究發(fā)現,肺癌的發(fā)生發(fā)展及預后與多種基因的差異表達相關[3-4]。其中DNA聚合酶εB亞基(POLE2)基因以其獨特的超強分子突變表型,與多種腫瘤都有著密切的關系[5]。LI等[6]研究結果表明,POLE2在肺腺癌的發(fā)病機制中起著非常重要的調控作用,下調該基因的表達后,A549細胞增殖受到明顯抑制。因此,研究POLE2基因在肺腺癌中的表達情況,可能為臨床治療方案的選擇及預后評估提供可靠依據。但目前POLE2在肺腺癌和正常肺組織中的表達情況及其對預后的影響鮮有報道,且該基因在腫瘤中的生物學功能爭議較大,現仍沒有研究運用多個腫瘤數據庫對POLE2在肺腺癌中的作用進行綜合評價。故本研究利用多個腫瘤相關數據庫綜合分析POLE2在肺腺癌組織中的表達水平及其對病人生存預后的影響,分析肺腺癌組織中的POLE2表達相關基因并預測其潛在的生物學功能,為研究POLE2基因在肺腺癌發(fā)生發(fā)展過程和生存預后中的作用提供一定的生物學依據。
在GEPIA(Gene Expression Profiling interactive analysis)數據庫(http://gepia.cancer-pku.cn/detail.php)平臺上選擇“Single Gene Analysis”,在“Enter gene name”中輸入“POLE2”,在“Datasets Selection”中輸入“LUAD”,分析POLE2在不同腫瘤中的表達情況。利用Oncomine數據庫(http://www.oncomine.org)分析在不同肺腺癌數據集中POLE2的表達情況,其篩選條件如下:①Cancer Type為lung adenocarcinoma;②Gene為POLE2;③Data Type為mRNA;④Analysis Type為Cancer vs. Normal Analysis;⑤Oncomine 數據庫檢索結果的統(tǒng)計學納入條件為P<0.05,fold change>2,gene rank=top 10%。統(tǒng)一采用箱線圖對研究結果進行描述。
Kaplan-Meier Plotter(https://kmplot.com/analysis)是一款操作簡單的在線分析基因表達量與生存數據間關系的工具。利用Kaplan-Meier Plotter,以POLE2表達量前25%的病人為高表達組,后25%的病人為低表達組,分析兩組病人的總生存時間并繪制生存曲線。
利用cBioPortal數據庫(http://www.cbioportal.org/)以及LinkedOmics數據庫(http://www.linkedomics.org/login.php),共同分析TCGA(The Cancer Genome Atlas)子數據集LUAD(lung adenocarcinoma),以Pearson相關系數絕對值>0.6為篩選條件,獲取POLE2表達相關基因。用在線分析工具(http://www.bioinformatics.psb.ugent.be/webtools/Venn)做韋恩圖,并獲取兩者的交集。下載的TCGA數據的研究主要對象為LUAD,其中具有RNA-seq測序數據的肺腺癌樣本517例。
先利用Enrichr數據庫(https://amp.pharm.mssm.edu/Enrichr/)對POLE2表達相關基因進行GO分析和KEGG 信號通路分析,篩選條件為P<0.05。然后,利用STRING數據庫(http://string-db.org/)分析相關蛋白間的相互作用,在“Multiple proteins”窗口中輸入包括POLE2在內的一系列與POLE2表達相關的基因,物種選擇“Human”,代表蛋白間相互作用強度的置信度選擇“medium confidence(0.400)”。
所用TIMER(Tumor Immune Estimation Resource)數據庫(https://cistrome.shinyapps.io/timer/)是由哈佛大學免疫信息學院建立的一個網站工具,它利用RNA-Seq表達譜數據檢測腫瘤組織中6種免疫細胞的浸潤情況。分析設定條件如下:①Cancer為Lung Adenocarcinoma;②Gene為POLE2;③ Correlation為Pearson。
使用SPSS 20.0軟件對數據進行統(tǒng)計分析。采用獨立樣本t檢驗驗證肺腺癌和癌旁正常肺組織POLE2mRNA的表達差異;用Pearson相關系數分析與POLE2相關的主要基因和浸潤免疫細胞;采用Kaplan-Meier生存分析計算病人的生存率,并使用廣義log-rank檢驗估計生存預后的差異。
GEPIA數據庫分析結果顯示,POLE2基因在宮頸腺癌、睪丸癌等癌組織中的表達升高,而在急性髓細胞樣白血病中則呈現出低表達趨勢(圖1A)。POLE2基因在LUAD中的表達水平明顯高于正常肺組織(|log2FC|=0.5,P<0.01)(圖1B)。Oncomine數據庫在線搜索共得到與POLE2表達相關的不同類型研究414項,其中47項研究結果顯示POLE2表達水平差異有統(tǒng)計學意義,45項研究顯示表達增高,2項研究顯示表達降低(圖2A)。在Oncomine數據庫中進行篩選,從建庫至今,總共得到5項關于正常肺組織和肺腺癌組織POLE2表達比較的實驗研究,包含172例樣本,這5項研究還包含了大細胞肺癌、鱗癌與正常肺組織POLE2表達的比較[7-9]。5項研究結果顯示,POLE2在肺腺癌、肺鱗癌及大細胞肺癌中的表達量均顯著高于正常肺組織(t=17.53~35.88,P<0.01),其中肺腺癌POLE2表達量增高尤為突出(圖2B、C)。
A:POLE2在各種腫瘤組織和癌旁正常組織中的表達情況;B:POLE2在肺腺癌和正常肺組織中的表達差異,*P<0.01。
以POLE2表達量前25%的病人為高表達組(n=123),后25%的病人為低表達組(n=123),進行Kaplan-Meier Plotter分析,結果顯示,相對于高表達組,低表達組肺腺癌病人總體生存時間更長(χ2=9.134,P<0.01)。見圖3。
A:Oncomine數據庫中POLE2表達分布情況;B:POLE2在5項研究中的表達比較;C:POLE2在肺腺癌、肺鱗癌及大細胞肺癌中的差異表達。
圖3 POLE2表達水平與肺腺癌病人預后關系的生存曲線
利用cBioPortal數據庫和LinkedOmics數據庫分析TCGA中肺腺癌的數據,共獲取37個與POLE2表達相關的基因(圖4)。利用Enrichr數據庫進行GO分析,發(fā)現POLE2表達相關基因主要功能富集在DNA聚合酶的激活、DNA的復制和DNA的修復等生物學過程(圖5A)。KEGG 通路分析顯示,POLE2表達相關基因主要參與了堿基切除修復、DNA復制、核苷酸切除修復等信號通路過程(圖5B)。利用STRING數據庫進行蛋白相互作用(PPI)網絡分析顯示,節(jié)點數為11,POLE2在細胞增殖等相關信號轉導通路中處于核心位置。根據MMC算法篩選潛在的相關基因,發(fā)現PRIM2、POLA1、POLA2、CDC45等基因與POLE2表達密切相關。見圖6。
圖4 POLE2表達相關基因篩選韋恩圖
A:POLE2表達相關基因GO分析;B:POLE2表達相關基因KEGG通路分析。
圖6 POLE2表達相關基因PPI網絡分析及關鍵基因預測
利用腫瘤免疫微環(huán)境TIMER數據庫分析顯示,POLE2基因在肺腺癌免疫微環(huán)境中與B細胞、CD4+T細胞、CD8+T細胞、巨噬細胞、中性粒細胞、樹突狀細胞均無明顯相關性(partial.cor<0.3),提示POLE2基因可能與腫瘤免疫細胞浸潤無關。見圖7。
圖7 POLE2表達與肺腺癌6種免疫細胞浸潤的關系
非小細胞肺癌是肺癌中最常見的一種類型,包括肺鱗癌、肺腺癌、大細胞肺癌等,其中肺腺癌占絕大多數,其發(fā)病與環(huán)境因素、職業(yè)暴露、遺傳因素等諸多因素相關[10]。大部分肺腺癌病人確診時,可能已存在廣泛侵襲和淋巴結轉移,目前對于中晚期肺腺癌暫無切實有效的治療措施[11]。傳統(tǒng)治療方法有放療、化療、手術切除治療等,但這些方法并沒有使病人的預后得到明顯的改善[12]。隨著分子生物學技術的革新,基因靶向藥物和免疫治療成為了目前治療非小細胞肺癌的重要手段,并有效延長了病人的生存期,提高了病人的生活質量[13]。在肺癌分子水平的研究過程中,學者們發(fā)現肺腺癌是一種在分子水平上呈現出高度異質性的慢性疾病,其發(fā)生發(fā)展是一個復雜的過程,涉及基因的異常表達、腫瘤微環(huán)境變化、腫瘤免疫細胞浸潤、基因突變等,不同亞型肺腺癌的分子遺傳學和細胞內信號通路可能完全不同,從而導致肺腺癌的治療反應和臨床預后也不盡相同[14]。因此,深入研究肺腺癌的發(fā)生機制及預后相關的關鍵基因,對該病的臨床診斷、治療方案選擇、預后判斷具有重要價值。
POLE2基因是一種原癌基因,定位位于染色體14q22-q21上,分子量為59 000[15]。其主要功能是與人類DNA聚合酶ε其他兩個亞基(POLE3和POLE4)共同參與調控DNA的復制,催化DNA新鏈的合成,延長DNA新鏈的活性,進一步催化核酸外切酶區(qū)的校正活性等[16]。但該基因在腫瘤中的生物學功能目前仍不明確。李娜苗等[17]研究發(fā)現,POLE2基因與肺癌A549細胞的增殖密切相關,下調肺癌A549細胞POLE2基因的表達,可以顯著抑制肺癌細胞的增殖。因此推測POLE2可能在肺腺癌中發(fā)揮著重要作用。
雖然POLE2基因在食管癌、直腸癌、乳癌以及肺癌組織中均有表達[18-19],但由于不同的研究實驗條件不同,且單個研究樣本量相對較小,結論還有待于進一步驗證。本研究利用生物信息學技術,通過GEPIA、Oncomine等多個公共數據庫中肺腺癌病人的基因表達譜和臨床信息來闡明POLE2在肺腺癌中的預后價值和潛在機制。利用GEPIA數據庫研究顯示,POLE2在包括肺腺癌在內的多種腫瘤中高表達。Oncomine作為目前全世界最大的基因芯片數據庫研究平臺,給廣大醫(yī)學研究者提供了不同腫瘤的基因芯片信息,綜合這些信息進行分析,可以有效減少因樣本量較小導致的抽樣誤差,增加結論的可靠性。本研究在Oncomine數據庫中檢索出POLE2基因表達有關研究414項,其中47項研究結果差異有統(tǒng)計學意義,45項研究顯示表達增高,2項研究顯示表達降低,總共包含172例研究樣本。符合篩選條件的研究有5項,對其進行薈萃分析,顯示POLE2基因差異表達中位數值排名為500.0,在肺腺癌中呈現高表達。Oncomine和GEPIA兩個數據庫相互驗證結果表明,POLE2在肺腺癌中確實為高表達,該結果與李娜苗等[17]的體外實驗結果基本一致。分析其原因可能為,POLE2突變使得基因原本具有的校正功能缺失,大量堆積的偶然突變,抑制了Sp1元件的活性,使啟動子活性不能得到完全激活,導致肺癌細胞生長緩慢甚至死亡[20]。因此,POLE2基因對于肺腺癌病人生存預后的判斷有著重要意義。本研究Kaplan-Meier Plotter數據檢索結果也驗證了POLE2表達水平的高低與肺腺癌病人的總生存期相關,腫瘤組織POLE2基因表達水平高的病人總生存期比低表達組病人更短。HARTMANN等[21]的研究結果表明,在淋巴細胞腫瘤病人中,POLE2作為易感基因,其表達水平用于預測淋巴瘤病人的生存期也有重要價值。WU等[22]研究同樣得出相似的結論,即POLE2的高表達預示著肺鱗癌病人預后更差。導致這一現象的原因可能是,POLE2作為DNA復制、修復、重組和細胞周期控制的核心組分,主要涉及兩條有意義的通路,即堿基切除修復通路和核苷酸切除修復通路,通過調節(jié)這兩條通路中的上下游分子影響DNA復制、細胞的凋亡和增殖[23],從而影響病人的預后;其次,POLE2在肺腺癌中是一個癌基因,其致癌機制與POLE2高突變負荷和免疫檢查點相關基因的高表達有關[24]。本研究進一步通過TIMER數據庫分析POLE2與免疫細胞的關系,結果顯示POLE2在肺腺癌免疫微環(huán)境中與B細胞、CD4+T細胞、CD8+T細胞、巨噬細胞、中性粒細胞及樹突狀細胞均無明顯相關性。提示POLE2基因可能與腫瘤免疫細胞浸潤無關。推測其原因可能為POLE2的功能更多的是直接參與調控細胞的周期和增殖,而不是通過免疫細胞起作用。
因為本研究篩選的基因芯片數據量大,樣本量較多,且方法異質性較低,故本研究結果真實可靠。但由于樣本來源不同,可能會對最終結果造成一定的誤差;同時,本研究結論缺乏獨立的體內外實驗驗證,故需要后續(xù)實驗加以確認。
綜上所述,本研究通過深入挖掘以Oncomine為主的多個數據庫中POLE2基因芯片信息,證明POLE2基因在肺腺癌組織中呈現高表達,且該基因高表達的肺腺癌病人總生存期更短。本研究結果可能為肺癌藥物的研發(fā)和肺癌病人的預后評估提供一定的生物學依據。