梅 雯,孫如麗,李 云,熊 偉,趙 一*
(1.大理大學(xué)第四附屬醫(yī)院,云南楚雄 675000;2.楚雄彝族自治州第二人民醫(yī)院,云南楚雄 675000;3.大理大學(xué)基礎(chǔ)醫(yī)學(xué)院,云南大理 671000)
胰腺癌(pancreatic adenocarcinoma,PAAD)是惡性程度較高的消化道腫瘤,5 年生存率不足8%〔1〕。臨床上90%以上的胰腺癌為胰腺導(dǎo)管腺癌(pancreatic ductal adenocarcinoma,PDAC),胰腺癌起病隱匿,多以黃疸或腹痛為首發(fā)癥狀,就診時超過80%的患者已進入中晚期,出現(xiàn)局部或遠(yuǎn)處轉(zhuǎn)移,失去最佳手術(shù)時機,僅有少數(shù)可行根治性手術(shù)治療〔2〕。近年來胰腺癌相關(guān)診療方法取得了快速發(fā)展,對胰腺癌的治療采取外科手術(shù)、敏感的化療和放療聯(lián)合應(yīng)用,但患者術(shù)后遠(yuǎn)處轉(zhuǎn)移和局部復(fù)發(fā)仍然嚴(yán)重影響著患者生存率。隨著腫瘤個體化治療和靶向治療技術(shù)的發(fā)展,從分子水平研究胰腺癌發(fā)生、發(fā)展相關(guān)機制有利于發(fā)現(xiàn)新的分子靶點,提供新的治療手段和提高患者生存率,對臨床治療具有重要現(xiàn)實意義。
DNA 拓?fù)洚悩?gòu)酶(topoisomerase,Topo)是一種存在于細(xì)胞核內(nèi),調(diào)節(jié)DNA 空間動態(tài)變化的核內(nèi)蛋白質(zhì)。DNA 拓?fù)洚悩?gòu)酶通過結(jié)合并水解ATP,催化DNA 鏈的斷裂和結(jié)合,影響DNA 的拓?fù)浣Y(jié)構(gòu)〔3〕。拓?fù)洚悩?gòu)酶具有兩種同工酶,拓?fù)洚悩?gòu)酶Ⅰ(TopoⅠ)和拓?fù)洚悩?gòu)酶Ⅱ(TopoⅡ),TopoⅡ型在哺乳動物細(xì)胞中的催化活性由兩種不同的同工酶介導(dǎo),分別為TopoⅡα和TopoⅡβ,這兩種酶在結(jié)構(gòu)和功能上是相似的,但在細(xì)胞周期的核定位和相對濃度上都不同,兩種酶編碼不同的基因產(chǎn)物,表達(dá)TopoⅡα 的基因是TOP2A(topoisomeraseⅡalpha)。TOP2A基因位于17q12-21染色體,在DNA 復(fù)制、重組、轉(zhuǎn)錄、染色體濃縮及染色單體分離等過程發(fā)揮重要作用〔4〕。TOP2A表達(dá)水平的高低和數(shù)量變化可導(dǎo)致細(xì)胞內(nèi)物質(zhì)和結(jié)構(gòu)發(fā)生改變。TOP2A主要在增殖細(xì)胞中發(fā)揮重要作用,其表達(dá)水平與腫瘤細(xì)胞增殖與轉(zhuǎn)移密切相關(guān)。文獻(xiàn)報道,TOP2A是活躍增殖細(xì)胞的敏感特異標(biāo)記物,TOP2A在腫瘤細(xì)胞增殖的不同時相其表達(dá)水平有所差異,在S期晚期和G2∕M 期表達(dá)增加,在有絲分裂后下降,且TOP2A以細(xì)胞周期依賴的方式磷酸化〔5〕。有研究發(fā)現(xiàn),TOP2A在多種不同類型的腫瘤中均呈現(xiàn)高表達(dá),如腸癌、食管癌、肝癌、胃癌等多種類型癌癥,且TOP2A表達(dá)水平與腫瘤細(xì)胞增殖水平呈正相關(guān)〔6-9〕。TOP2A的異常表達(dá)最常發(fā)生在乳腺癌中,被視為乳腺癌發(fā)展進程中的重要預(yù)后分子指標(biāo)〔10〕。TOP2A在腫瘤的發(fā)生、發(fā)展中起著重要的調(diào)控作用,并與腫瘤的預(yù)后密切相關(guān),但目前關(guān)于TOP2A與胰腺癌的相關(guān)研究鮮有報道。從分子水平深入研究胰腺癌發(fā)生、發(fā)展機制,尋找高靈敏度的分子標(biāo)志物,對胰腺癌的早期篩查和臨床診斷具有重要意義。本研究旨在利用現(xiàn)有的各種腫瘤生物信息數(shù)據(jù)庫,通過數(shù)據(jù)挖掘分析TOP2A基因在胰腺癌中的表達(dá)及其預(yù)后意義,為TOP2A基因在胰腺癌發(fā)生、發(fā)展中的作用機制提供線索和思路。
1.1從ONCOMINE數(shù)據(jù)庫提取數(shù)據(jù)在ONCOMINE v4.5 數(shù)據(jù)庫中設(shè)定篩選和挖掘數(shù)據(jù)的條件為:①Gene:TOP2A;②Analysis Type:Cancervs.Normal Analysis;③Cancer Type:Pancreatic Cancer;④Data Type:mRNA;⑤Sample Type:Clinical Specimen;⑥臨界值設(shè)定條件(Pvalue<1E-4,fold change 2,gene rank=top 10%,data type=all)。
1.2從GEPIA數(shù)據(jù)庫提取數(shù)據(jù)在GEPIA 數(shù)據(jù)庫(http:∕∕gepia.cancer-pku.cn∕)中 設(shè)定 篩選 和 挖 掘數(shù)據(jù)的條件為:①Gene:TOP2A;②Cancer name:PAAD(pancreatic adenocarcinoma);③“Expression on Box Polts”框中設(shè)置條件|Log2FC |Cutoff:1,P-value Cutoff:0.01;④“Pathological Stage Plot”輸入TOP2A;⑤“Similar Genes Detection”選 擇PAAD Tumor 和PAAD Normal;然后輸入相應(yīng)基因進行分析。
1.3 MethHC數(shù)據(jù)庫提取數(shù)據(jù)在MethHC 數(shù)據(jù)庫(http:∕∕methhc.Mbc.Nctu.Edu.tw)中設(shè)定篩選和挖掘數(shù)據(jù)的條件為:①Gene Reach:PAAD;②“Elect a gene region”中選擇Promoter;③List your interested genes:TOP2A。
1.4 String數(shù)據(jù)庫提取數(shù)據(jù)String數(shù)據(jù)庫(https:∕∕string-db.org ∕)中設(shè)定篩選和挖掘數(shù)據(jù)的條件為:①Protein name:TOP2A;②Organism:Homo sapiens;③Munber of nodes:11;④PPI enrichmentP-value:1.3E-10;⑤High confidence:0.700;⑥Max number of interactors to show:10。
1.5從Kmplot數(shù)據(jù)庫提取數(shù)據(jù)在Kmplot 數(shù)據(jù)庫(http:∕∕kmplot.com∕analysis∕)中設(shè)定篩選和挖掘數(shù)據(jù)的條件為:①RNA-seq;②Gene:TOP2A;③Cancer symbol:pancreatic ductal adenocarcinoma;④Survival:分別選擇總體生存率(overall survival,OS)和無復(fù)發(fā)生存期(relapse-free survival,RFS)。
1.6 The Human Protein Atlas數(shù)據(jù)庫提取數(shù)據(jù)The Human Protein Atlas 數(shù)據(jù)庫中設(shè)定篩選和挖掘數(shù)據(jù)的條件為:TOP2A。數(shù)據(jù)庫共有3 種TOP2A 免疫組化抗體(No:HPA006458,No:HPA026773,No:CAB002448),對正常胰腺組織和胰腺癌組織進行免疫組化實驗。選擇克隆號為No:HPA006458 的抗體對1 例正常胰腺組織和11 例胰腺癌組織的TOP2A蛋白表達(dá)程度進行分析。
1.7統(tǒng)計學(xué)分析正常組織與腫瘤組織之間TOP2A基因表達(dá)差異采用t檢驗。TOP2AmRNA 表達(dá)水平與胰腺癌患者病理分期的關(guān)系采用單因素方差分析(one-way ANOVA)。TOP2A基因表達(dá)量與患者預(yù)后的關(guān)系采用Kaplan-Meier 和Log-Rank檢驗。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1TOP2A在部分腫瘤類型中的表達(dá)ONCOMINE數(shù)據(jù)庫共有462 項研究結(jié)果涉及TOP2A在腫瘤組織與對應(yīng)非腫瘤組織中表達(dá)差異的比較。其中差異有統(tǒng)計學(xué)意義的有132 項,TOP2A高表達(dá)的研究有125 項,低表達(dá)的研究有7 項(P<0.05)。TOP2A在消化系統(tǒng)腫瘤的表達(dá)情況見表1。
表1 ONCOMINE數(shù)據(jù)庫中TOP2A表達(dá)有差異的消化系統(tǒng)腫瘤
2.2TOP2A在胰腺癌中的表達(dá)結(jié)果提取ONCOMINE v4.5 數(shù)據(jù)庫中的信息發(fā)現(xiàn),從2003 年至2009年,共有10 個子數(shù)據(jù)集涉及TOP2A在胰腺癌組織和正常組織中的表達(dá),共包括322 個樣本。文章分 別發(fā)表于Hepatogastroenterology〔11〕、Oncogene〔12〕、Neoplasia〔13〕、Cancer Sci〔14〕、Cancer Cell〔15〕、Clin Cancer Res〔16〕和Am J Pathol〔17〕。對10 個子數(shù)據(jù)集薈萃分析發(fā)現(xiàn),與正常胰腺組織(對照組)相比,TOP2A在胰腺癌中呈現(xiàn)高表達(dá),中位表達(dá)數(shù)值為1 169.0,P=0.008,差異有統(tǒng)計學(xué)意義。
2.3TOP2A在不同胰腺癌研究芯片的表達(dá)差異在ONCOMINE數(shù)據(jù)庫中,獲取TOP2AmRNA在胰腺癌研究芯片中的表達(dá)結(jié)果,對相關(guān)數(shù)據(jù)作箱圖比較分析,有7 項研究(Lacobuzio-Donahue Pancreas 2,Pei Pancreas, Grutzmann Pancreas, Logsdon Pancreas,Segara Pancreas, Buchholz Pancreas, Badea Pancreas)均顯示,相較于正常胰腺組織,TOP2AmRNA 在胰腺癌中呈現(xiàn)高表達(dá),且差異具有統(tǒng)計學(xué)意義(P<0.05)。見圖1A~G。但其中1 項研究(Ishikawa Pancreas)中,TOP2AmRNA 在胰腺癌組織和正常胰腺組織中的表達(dá)量差異無統(tǒng)計學(xué)意義(P=0.109)。見圖1H。
圖1 ONCOMINE芯片數(shù)據(jù)庫TOP2A mRNA在正常胰腺組織和胰腺癌組織研究芯片中的表達(dá)差異
2.4TOP2A與多個基因的相關(guān)性分析基于GEPIA數(shù)據(jù)庫基因相關(guān)性分析結(jié)果顯示,胰腺癌組織TOP2A的mRNA表達(dá)水平與CDK1、HDAC1、NFE2L3、MTERF3、OLA1和RRM1基因mRNA 表達(dá)水平呈顯著正相關(guān)(P<0.05,R>0)。見圖2。
圖2 TOP2A mRNA表達(dá)水平在胰腺癌患者中與其他基因mRNA表達(dá)水平的相關(guān)性
2.5TOP2AmRNA表達(dá)水平與胰腺癌患者病理分期的關(guān)系從GEPIA 數(shù)據(jù)庫下載TOP2AmRNA 表達(dá)水平與胰腺癌患者病理分期的相關(guān)數(shù)據(jù),結(jié)果顯示TOP2AmRNA 表達(dá)水平在胰腺癌患者不同病理分期中的表達(dá)差異無統(tǒng)計學(xué)意義(P>0.05),單因素方差分析得出F值為1.64,其對應(yīng)P值為0.183。見圖3。
圖3 TOP2A mRNA表達(dá)水平與胰腺癌患者病理分期的關(guān)系
2.6TOP2AmRNA表達(dá)與胰腺癌患者預(yù)后的相關(guān)性為了進一步明確TOP2AmRNA 表達(dá)與胰腺癌患者預(yù)后之間的關(guān)系,在Kmplot 數(shù)據(jù)庫中對TOP2AmRNA 表達(dá)水平與胰腺癌患者預(yù)后相關(guān)的數(shù)據(jù)進行分析。結(jié)果表明,TOP2AmRNA 表達(dá)量與胰腺癌患者的OS和RFS均有顯著相關(guān)性,與TOP2AmRNA低表達(dá)組相比,TOP2AmRNA 高表達(dá)組胰腺癌患者總體生存時間和無復(fù)發(fā)生存時間顯著縮短(OS:LogrankP=4.9E-0.5;RFS:LogrankP=0.000 75)。見圖4。
圖4 胰腺癌患者的預(yù)后與TOP2A mRNA表達(dá)水平的關(guān)系
2.7TOP2A啟動子區(qū)DNA甲基化水平分析從Meth-HC數(shù)據(jù)庫下載相關(guān)數(shù)據(jù),結(jié)果顯示TOP2A共有1個轉(zhuǎn)錄模板,編號為NM_001067,在胰腺導(dǎo)管腺癌中TOP2A啟動子區(qū)甲基化與正常胰腺組織甲基化水平差異無統(tǒng)計學(xué)意義(P>0.05)。見圖5。
圖5 正常胰腺組織和胰腺導(dǎo)管腺癌TOP2A啟動子區(qū)甲基化水平比較
2.8 TOP2A相互作用蛋白網(wǎng)絡(luò)在String 數(shù)據(jù)庫中按照篩選條件,篩選出相互作用強度排位靠前的10 個與TOP2A 有相互作用的蛋白質(zhì),分別是NCAPG、CDC20、UBE2C、PBK、TPX2、DLGAP5、CCNB2、TOP1、CDK1、BUB1。見圖6。這些蛋白相互作用,可能參與了胰腺癌細(xì)胞增殖、分化及細(xì)胞周期調(diào)節(jié)等功能,在胰腺癌發(fā)生、發(fā)展中發(fā)揮著重要的調(diào)節(jié)作用。
圖6 與TOP2A相互作用的蛋白網(wǎng)絡(luò)圖
2.9 TOP2A蛋白在胰腺癌中的表達(dá)情況在The Human Protein Atlas 數(shù)據(jù)庫中,選擇克隆號為No:HPA006458 的抗體,分析TOP2A 蛋白在1 例正常胰腺組織和11 例典型胰腺癌組織中的表達(dá)情況。其中有5 例胰腺癌組織蛋白表達(dá)及抗體染色程度為“高等”水平;6例為“中等”水平;0例為“低等”水平。TOP2A 蛋白在胰腺癌組織中較正常胰腺組織高表達(dá)(左側(cè)正常組患者id 2032,蛋白表達(dá)水平低;右側(cè)腫瘤組患者id 1320,蛋白表達(dá)水平高)。見圖7。
圖7 TOP2A蛋白在正常胰腺組織和胰腺癌中的表達(dá)(免疫組織化學(xué)染色)
ONCOMINE 數(shù)據(jù)庫是目前世界最大的腫瘤基因芯片數(shù)據(jù)庫,提供癌癥全面的基因表達(dá)數(shù)據(jù)及相關(guān)臨床信息,整合了TCGA、GEO 和已發(fā)表文獻(xiàn)來源的DNA 和RNA-seq 數(shù)據(jù)。GEPIA 是由北京大學(xué)開發(fā)的基因表達(dá)譜數(shù)據(jù)動態(tài)分析網(wǎng)站,其數(shù)據(jù)來自于TCGA 和GTEx 兩大數(shù)據(jù)庫。MethHC數(shù)據(jù)庫其數(shù)據(jù)來自于TCGA,用于分析18 種腫瘤和對應(yīng)正常組織DNA 甲基 化和mRNA∕miRNA 相 關(guān)信 息。String 數(shù)據(jù)庫可用以提取蛋白質(zhì)-蛋白質(zhì)之間相互作用網(wǎng)絡(luò),預(yù)測蛋白質(zhì)-蛋白質(zhì)之間的關(guān)系。The Human Protein Atlas 數(shù)據(jù)庫采用特制抗體檢測每種蛋白在人正常組織、腫瘤組織、細(xì)胞系和血液內(nèi)的分布和表達(dá)情況,結(jié)果用免疫組織化學(xué)染色圖表示。為了更好地了解TOP2AmRNA 和蛋白在胰腺癌組織中的作用及其機制,通過數(shù)據(jù)挖掘,分析并探討其在胰腺癌組織中的表達(dá)水平及預(yù)后意義,為進一步研究TOP2A在胰腺癌發(fā)生、發(fā)展中的作用機制提供理論依據(jù)。
目前關(guān)于TOP2A與腫瘤進展的研究大多集中在其對DNA 結(jié)構(gòu)的調(diào)控上。TOP2A通過調(diào)控DNA鏈的斷裂和重新連接,從而影響DNA 的拓?fù)錉顟B(tài)和復(fù)制。研究表明,腫瘤的增殖、轉(zhuǎn)移和化療藥物耐藥性等主要是通過調(diào)節(jié)DNA 拓?fù)錉顟B(tài)和DNA 復(fù)制來實現(xiàn)〔18〕。有研究表明,TOP2A通常在增殖活躍的細(xì)胞中過度表達(dá),并且高表達(dá)可能與癌細(xì)胞侵襲性有關(guān)〔5〕。據(jù)報道,TOP2A過表達(dá)與脂肪肉瘤和肝細(xì)胞癌等癌癥的侵襲性密切相關(guān)〔19-20〕。另外有研究報道TOP2A在胰腺癌中呈現(xiàn)高表達(dá),且高表達(dá)患者生存率較低,TOP2A可激活Wnt-β-catenin 通路,誘導(dǎo)上皮-間充質(zhì)轉(zhuǎn)換,從而增加癌基因的轉(zhuǎn)錄,TOP2A的高表達(dá)可能與癌細(xì)胞生長速度、浸潤程度和遠(yuǎn)處轉(zhuǎn)移能力等有關(guān)〔21〕。通過比較TOP2A在胰腺癌和正常胰腺組織中的表達(dá),對ONCOMINE 數(shù)據(jù)庫和The Human Protein Atlas 數(shù)據(jù)庫中的TOP2A分析發(fā)現(xiàn),mRNA 水平和蛋白水平在胰腺癌中均呈高表達(dá)(P<0.05)。此外,TOP2A在乳腺癌、前列腺癌、鼻咽癌等惡性腫瘤中的預(yù)后價值已得到證實〔22-24〕。然而,目前TOP2A在胰腺癌中的預(yù)后價值尚未得到證實。通過Kmplot 數(shù)據(jù)庫中下載TOP2AmRNA 表達(dá)水平與胰腺癌患者預(yù)后相關(guān)的數(shù)據(jù),結(jié)果表明,TOP2AmRNA 與胰腺癌患者OS 和RFS 均有相關(guān)性,TOP2AmRNA 高表達(dá)者比低表達(dá)者預(yù)后差。因此,推測TOP2A可能成為胰腺癌預(yù)后的潛在生物標(biāo)志物。另外通過基因相關(guān)性分析發(fā)現(xiàn)TOP2A與CDK1、HDAC1和NFE2L3等基因有顯著相關(guān)性,這些基因可能相互作用參與了胰腺癌的發(fā)生與發(fā)展過程。在String 數(shù)據(jù)庫中按照篩選條件,篩選出相互作用強度排位靠前的10 個與TOP2A 有相互作用的蛋白質(zhì),這些蛋白相互作用,導(dǎo)致TOP2A在調(diào)節(jié)DNA 結(jié)構(gòu)方面的活性發(fā)生改變,可能參與了胰腺癌細(xì)胞增殖、分化及細(xì)胞周期調(diào)節(jié)等功能,在胰腺癌發(fā)生、發(fā)展中發(fā)揮著重要的調(diào)節(jié)作用,而具體機制需進一步實驗驗證加以闡明。值得注意的是,TOP2AmRNA 表達(dá)水平與胰腺癌臨床分期差異無統(tǒng)計學(xué)意義,分析可能原因:①上述研究結(jié)論僅僅是在轉(zhuǎn)錄水平上得出的,有一定局限性;②TOP2AmRNA 表達(dá)水平與胰腺癌臨床分期的關(guān)系受眾多因素共同參與調(diào)節(jié),絕非某一個促癌因子能起到?jīng)Q定性作用,TOP2A的作用勢必被其他拮抗因子影響,而具體原因需進行后續(xù)研究加以驗證。
總之,通過腫瘤基因數(shù)據(jù)庫相關(guān)基因信息的深入挖掘發(fā)現(xiàn),在mRNA 水平和蛋白水平上,TOP2A在胰腺癌組織中呈高表達(dá),其表達(dá)水平與胰腺癌的預(yù)后有明顯關(guān)聯(lián),通過對數(shù)據(jù)庫進行大量數(shù)據(jù)挖掘為發(fā)現(xiàn)胰腺癌新的分子靶點奠定理論基礎(chǔ),也為今后胰腺癌的研究提供重要線索和數(shù)據(jù)支持。與此同時,數(shù)據(jù)庫高效能的分析能力和大量的樣本使分析結(jié)果具有極大的參考價值,避免了由于研究樣本量過小產(chǎn)生的誤差,合理利用已有信息資源,縮短科研周期,降低科研成本。