鄧穎,熊安秀,劉景珍,祁閃閃,熊昊
(1. 華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬武漢兒童醫(yī)院公共衛(wèi)生科,武漢 430015; 2. 宜昌市中心人民醫(yī)院兒科,湖北 宜昌 443003; 3. 恩施州中心醫(yī)院兒童血液消化心血管腎病中心,湖北 恩施 445099; 4 .華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬武漢兒童醫(yī)院兒童血液疾病研究室,武漢 430015; 5.華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬武漢兒童醫(yī)院血液腫瘤科,武漢 430015)
急性髓細(xì)胞白血病 (acute myeloid leukemia,AML)約占兒童白血病的20%~25%[1]。雖然與急性淋巴細(xì)胞白血病相比,兒童AML的發(fā)病率低,預(yù)后較差。目前,AML的總生存率不到70%,復(fù)發(fā)率高達(dá)25%~35%[2-3]。細(xì)胞遺傳學(xué)被認(rèn)為是AML風(fēng)險(xiǎn)分層的主要依據(jù),然而在臨床實(shí)踐中,接近半數(shù)的AML患兒細(xì)胞遺傳學(xué)正常,疾病的轉(zhuǎn)歸卻有著顯著的差異[4]。近年來(lái),隨著二代基因測(cè)序技術(shù)的發(fā)展,AML相關(guān)的重現(xiàn)性遺傳學(xué)異常逐漸被發(fā)現(xiàn),并且在AML診斷、治療和預(yù)后等方面的重要性日益凸顯,但仍有部分患兒未攜帶已知的遺傳學(xué)異常。因此,探究與兒童AML相關(guān)的新的分子生物標(biāo)志物有助于對(duì)AML患兒進(jìn)行風(fēng)險(xiǎn)分層。本研究通過(guò)下載和整理有效治療方法適用性研究 (therapeutically applicable research to generate effective treatments,TARGET) 數(shù)據(jù)庫(kù)中兒童AML的基因表達(dá)數(shù)據(jù)和臨床信息,利用生物信息學(xué)分析手段對(duì)AML相關(guān)的致病基因進(jìn)行挖掘,以期為探索AML的發(fā)病機(jī)制及分子標(biāo)志物的篩選提供新的方向。
通過(guò)TARGET網(wǎng)站 (https://ocg.cancer.gov/programs/target) 檢索并下載兒童AML的臨床信息和基因表達(dá)數(shù)據(jù)。TARGET數(shù)據(jù)庫(kù)包含121例AML患兒的臨床信息,其中,女性患兒63例,男性患兒58例。TARGET數(shù)據(jù)庫(kù)中AML患兒的基因表達(dá)數(shù)據(jù)和臨床信息來(lái)自美國(guó)兒童腫瘤協(xié)作組 (children’s oncology group,COG) 的美國(guó)AML (America acute myeloid leukemia,AAML) 0531 Ⅲ期臨床試驗(yàn)。
采用R軟件的DESeq2包對(duì)TARGET數(shù)據(jù)庫(kù)AML患兒的基因表達(dá)數(shù)據(jù)進(jìn)行差異表達(dá)基因篩選,篩選條件為差異表達(dá)上調(diào)或下調(diào)≥2倍,即 | log2FC |≥1,且P< 0.05。
采用DAVID在線數(shù)據(jù)庫(kù)對(duì)篩選出的差異基因進(jìn)行基因本體論 (Gene Ontology,GO) 注釋和京都基因與基因組數(shù)據(jù)庫(kù) (Kyoto encyclopedia of genes and genomes,KEGG) 信號(hào)通路注釋,分析差異基因參與的生物學(xué)過(guò)程(biological process,BP) 以及涉及的相關(guān)通路,以P< 0.05 為入選標(biāo)準(zhǔn)。應(yīng)用STRING在線數(shù)據(jù)庫(kù)構(gòu)建差異基因的蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)結(jié)構(gòu)圖,然后使用Cytoscape 3.7.2 軟件進(jìn)行可視化,并通過(guò)cytoHubba插件篩選hub基因。
采用SPSS 22.0軟件進(jìn)行統(tǒng)計(jì)分析。使用R語(yǔ)言的survival包計(jì)算hub基因表達(dá)量的最佳cut-off值,并將表達(dá)量 TARGET數(shù)據(jù)庫(kù)中有121例AML患兒的臨床信息,除7例危險(xiǎn)度分層未知外,其余114例患兒中48例低危,61例中危,5例高危。進(jìn)一步對(duì)114例患兒初診時(shí)骨髓標(biāo)本的基因表達(dá)信息進(jìn)行分析。相較于低?;純海懈呶;純河? 092個(gè)差異基因,其中上調(diào)基因1 167個(gè),下調(diào)基因925個(gè) (圖1A)。相較初診患兒,39例復(fù)發(fā)患兒有785個(gè)差異基因,其中上調(diào)基因184個(gè),下調(diào)基因601個(gè) (圖1B)。繪制2組差異基因的韋恩圖,共得到差異基因96個(gè),其中上調(diào)基因38個(gè)(圖1C),下調(diào)基因58個(gè) (圖1D)。 圖1 TARGET數(shù)據(jù)庫(kù)AML患兒差異基因的篩選Fig.1 Screening of DEGs of childhood AML using the TARGET database 采用DAVID數(shù)據(jù)庫(kù)對(duì)96個(gè)差異基因進(jìn)行GO富集分析。結(jié)果顯示,差異基因在細(xì)胞組分 (cellular component,CC) 主要富集于核小體、細(xì)胞質(zhì)、晚期內(nèi)體膜、核染色體、濃縮染色體外著絲粒,在BP中主要富集于核小體組裝、染色體分離、對(duì)有毒物質(zhì)的反應(yīng)、染色質(zhì)沉默、紡錘組織,在分子功能 (molecular function,MF) 主要富集于蛋白質(zhì)異二聚活性、DNA結(jié)合、染色質(zhì)結(jié)合、微管結(jié)合、MAP激酶酪氨酸/絲氨酸/蘇氨酸磷酸酶活性,見(jiàn)圖2A。96個(gè)差異基因的KEGG通路富集分析結(jié)果顯示,差異基因在酗酒、系統(tǒng)性紅斑狼瘡、病毒致癌等通路聚集,見(jiàn)圖2B。 圖2 差異基因的富集分析Fig.2 Enrichment analysis of DEGs 通過(guò) STRING 數(shù)據(jù)庫(kù)構(gòu)建96個(gè)差異基因的PPI網(wǎng)絡(luò) (圖3A)。除去孤立無(wú)關(guān)系的蛋白節(jié)點(diǎn),通過(guò)Cytoscape 軟件對(duì)差異基因進(jìn)行PPI 網(wǎng)絡(luò)的可視化(圖3B),顏色越紅,關(guān)聯(lián)性越強(qiáng)。在Cytoscape 軟件的cytoHubba模塊,分別使用Betweenness、EPC、MCC、Radiality、Stress等5種計(jì)算方法計(jì)算 PPI 網(wǎng)絡(luò)節(jié)點(diǎn)的前10個(gè)有較高連接度的hub基因,見(jiàn)表1。得到的15個(gè)hub基因分別是細(xì)胞分裂周期相關(guān)蛋白2 (cell division cycle associated 2,CDCA2)、細(xì)胞周期蛋白依賴激酶1 (cyclin dependent kinase 1,CDK1)、著絲粒蛋白E (centromere protein E,CENPE)、DNA甲基轉(zhuǎn)移酶3B (DNA methyltransferase 3 beta,DNMT3B)、二肽基肽酶4 (dipeptidyl peptidase 4,DPP4)、核酸外切酶1 (exonuclease 1,EXO1)、TTK蛋白激酶 (TTK protein kinase,TTK)、FOS原癌基因 (Fos proto-oncogene,F(xiàn)OS)、H2B聚集組蛋白5 (H2B clustered histone 5,H2BC5)、H3聚集組蛋白4 (H3 clustered histone 4,H3C4)、H3聚集組蛋白10 (H3 clustered histone 10,H3C10)、H2A聚集組蛋白19 (H2A clustered histone 19,H2AC19)、H2A聚集組蛋白20 (H2A clustered histone 20,H2AC20)、H2B聚集組蛋白21 (H2B clustered histone 21,H2BC21)、轉(zhuǎn)化生長(zhǎng)因子β1誘導(dǎo)轉(zhuǎn)錄1(transforming growth factor beta 1 induced transcript 1,TGFB1I1)。 表1 5種計(jì)算方法的前10個(gè)hub基因Tab.1 The top 10 hub genes identified by five centrality methods 圖3 差異基因的PPI分析Fig.3 PPI analysis of DGEs 采用χ2檢驗(yàn)分析AML患兒臨床病理特征 (包括性別、年齡、初診時(shí)外周血白細(xì)胞、中樞浸潤(rùn)、危險(xiǎn)度分層) 與15個(gè)hub基因表達(dá)量之間的相關(guān)性。結(jié)果表明hub基因的表達(dá)與男女比例、年齡分布、是否中樞侵犯等無(wú)相關(guān)性 (均P> 0.05)。DNMT3B、DPP4、CENPE、TTK、CDCA2、EXO1、CDK1的高表達(dá)與危險(xiǎn)度分層呈正相關(guān) (均P< 0.05),H2BC21、H2AC19、H3C10、FOS、H3C4、TGFB1I1、H2BC5、H2AC20的高表達(dá)與危險(xiǎn)度分層呈負(fù)相關(guān) (均P< 0.05)。DPP4、CENPE、TTK、CDCA2基因高表達(dá)組患兒初診時(shí)外周血WBC高于低表達(dá)組 (均P< 0.05),H2BC21、H2AC19、H3C10、FOS、H3C4、H2BC5、H2AC20基因高表達(dá)組患兒初診時(shí)外周血白細(xì)胞低于低表達(dá)組(均P< 0.05),DNMT3B、EXO1、CDK1、TGFB1I1基因高表達(dá)組和低表達(dá)組患兒初診時(shí)白細(xì)胞計(jì)數(shù)無(wú)統(tǒng)計(jì)學(xué)差異 (均P> 0.05)。 對(duì)15個(gè)hub基因進(jìn)行單因素Cox回歸分析,結(jié)果顯示,DNMT3B、DPP4、CENPE、TTK、CDCA2、EXO1、CDK1等基因的高表達(dá)和H2BC21、H2AC19、H3C10、FOS、H3C4、TGFB1I1、H2BC5、H2AC20等基因的低表達(dá)是影響AML患兒總生存期的危險(xiǎn)因素。對(duì)以上因素進(jìn)行多因素Cox比例風(fēng)險(xiǎn)模型分析,結(jié)果顯示,15個(gè)相關(guān)聯(lián)的hub基因中DNMT3B的高表達(dá)、DPP4的高表達(dá)、CENPE的高表達(dá)、H3C10的低表達(dá)是AML患兒總生存期的獨(dú)立危險(xiǎn)因素,見(jiàn)表2。 表2 hub基因的單因素和多因素分析構(gòu)建預(yù)后風(fēng)險(xiǎn)模型Tab.2 Univariate and multivariate Cox regression analyses of the hub genes for constructing prognostic risk models 本研究通過(guò)分析TARGRT數(shù)據(jù)庫(kù)AML患兒的基因表達(dá)數(shù)據(jù),篩選出與危險(xiǎn)度分層和復(fù)發(fā)相關(guān)的96個(gè)差異基因。GO和KEGG富集分析結(jié)果顯示,差異基因編碼的蛋白主要富集于細(xì)胞核和細(xì)胞質(zhì),參與的BP主要有DNA結(jié)合、核小體組裝、染色體分離等。 在篩選出的hub基因中,DNMT3B與DNA甲基化的相關(guān)。DNMT3B負(fù)責(zé)DNA的從頭甲基化。雖然在AML中DNMT3B的突變很少見(jiàn),但DNMT3B的高表達(dá)預(yù)示著高耐藥率和高復(fù)發(fā)率[5-6]。髓過(guò)氧化物酶 (myeloperoxidase,MPO) 是診斷AML的生物標(biāo)志物,其高表達(dá)與更好的預(yù)后相關(guān)。據(jù)報(bào)道,DNMT3B可以上調(diào)AML細(xì)胞MPO啟動(dòng)子的甲基化,抑制MPO的表達(dá)。而且DNMT3B對(duì)MPO啟動(dòng)子的甲基化不受AML常見(jiàn)突變 (FLT3-ITD、CEBPA或NPM1突變) 的影響[7]。此外,DNMT3B高表達(dá)導(dǎo)致DNA超甲基化在T細(xì)胞急性淋巴細(xì)胞白血病和伯基特淋巴瘤中也有報(bào)道[8]。 DPP4表達(dá)于骨髓來(lái)源的細(xì)胞、骨骼肌細(xì)胞、血管平滑肌細(xì)胞和脂肪細(xì)胞等[9-11]。在慢性白血病,尤其是慢性B淋巴細(xì)胞白血病中,有大量研究[12-14]證明了DPP4的促癌作用。DPP4的表達(dá)影響臨床分期、治療緩解所需時(shí)間、總生存期、無(wú)病生存期,是負(fù)性的預(yù)后因素。雖然急性白血病樣本中,包括T細(xì)胞急性淋巴細(xì)胞白血病、B細(xì)胞急性淋巴細(xì)胞白血病和AML,白血病細(xì)胞膜DPP4的表達(dá)量與非白血病患者無(wú)差異,但白血病患者血漿sCD26/DPP4明顯高于非白血病患者[15]。 CENPE、CDCA2、CDK1、TTK、EXO1、FOS與細(xì)胞周期、細(xì)胞增殖密切相關(guān)。在AML中,CDK1的促癌作用相對(duì)明確,但關(guān)于CENPE、CDCA2、TTK、EXO1、FOS的報(bào)道較少。H2BC5、H2AC19、H2AC20、H2BC21、H3C4、H3C10是組蛋白H2和H3的成員,是構(gòu)成核小體的重要組成部分。目前,關(guān)于TGFB1I1、H2BC5、H2AC19、H2AC20、H2BC21、H3C4、H3C10在AML致病機(jī)制中的作用少有報(bào)道。 綜上所述,本研究通過(guò)對(duì)TARGET數(shù)據(jù)庫(kù)AML患兒初治時(shí)低危組與中高危組的骨髓差異基因、初治時(shí)與復(fù)發(fā)時(shí)骨髓差異基因的綜合分析,發(fā)現(xiàn)CDCA2、CDK1、CENPE、DNMT3B、DPP4、EXO1、TTK、FOS、H2BC5、H3C4、H3C10、H2AC19、H2AC20、H2BC21和TGFB1I115個(gè)與兒童AML相關(guān)的hub基因。這15個(gè)基因均與預(yù)后相關(guān),尤其是影響預(yù)后的獨(dú)立危險(xiǎn)因素的DNMT3B、DPP4、CENPE和H3C10基因可能成為兒童AML的分子機(jī)制研究以及預(yù)后判斷的新靶點(diǎn)。2 結(jié)果
2.1 差異基因的篩選
2.2 差異基因的GO富集分析和KEGG富集分析
2.3 分析與AML相關(guān)的hub基因
2.4 hub基因與AML患兒臨床病理特征的相關(guān)性
2.5 hub基因與AML患兒預(yù)后的關(guān)系。
3 討論