江建平,楊 芳,張 亮,竇同海,周 雁
(1.復(fù)旦大學(xué) 生命科學(xué)學(xué)院 微生物學(xué)與微生物工程系,上海 200438;2.上海人類基因組研究中心 上海市疾病與健康基因組學(xué)省部共建重點(diǎn)實(shí)驗(yàn)室,上海 201203)
急性髓細(xì)胞白血病(Acute Myelocytic Leukemia,AML)又稱為急性非淋巴細(xì)胞白血病(ANLL),它包括所有非淋巴細(xì)胞來源的急性白血病.AML是一類造血系統(tǒng)的克隆性惡性疾病,它是由于多能干細(xì)胞或已輕度分化的前體細(xì)胞核型發(fā)生突變所形成.AML是一個(gè)具有高度異質(zhì)性的疾病群,它可以由正常髓細(xì)胞分化發(fā)育過程中不同階段的造血祖細(xì)胞惡性轉(zhuǎn)化而來,并且起源于不同階段祖細(xì)胞的AML 具有不同的生物學(xué)特征[1].AML在發(fā)達(dá)國家的發(fā)病率要高于發(fā)展中國家,西方國家高于東方國家,世界各地年發(fā)病率約為2.25/10萬.隨年齡增加,AML 發(fā)病率增高,在美國,30歲以下發(fā)病率為1.2/10萬、80歲以上則高于20/10萬[2].因此,AML 實(shí)際上是一種中、老年疾病.急性髓細(xì)胞白血病占成人急性白血病的80%~90%,占兒童急性白血病的15%~20%,男性的發(fā)病率高于女性.研究表明,在人群接受大劑量放射線或長期接觸苯的情況下,AML發(fā)病率會(huì)增加[3].
研究表明,AML病人染色體結(jié)構(gòu)發(fā)生變異,并且通過對(duì)染色體結(jié)構(gòu)變異的識(shí)別,已經(jīng)形成一些診斷標(biāo)記用于臨床診斷.但是,仍然有50%左右的病人在用檢測染色體核型的方式進(jìn)行診斷時(shí),無法被確診[4].通過靶基因定向測序和第二代測序(Next Generation Sequencing)技術(shù)已經(jīng)確定了在AML 病人的基因組中常見的突變基因,包括:FLT3,NPM1,KIT,CEBPA,TET2,DNMT3A 以及IDH1[5-8].然而近期的研究表明,有些AML病人的這些關(guān)聯(lián)基因中并未發(fā)現(xiàn)任何突變[9],所以可能存在新的AML 關(guān)聯(lián)基因,有必要對(duì)AML病人基因組中所有的突變基因進(jìn)行更加深入的信息挖掘.
基于第二代測序技術(shù)的全基因組測序(Whole Genome Sequencing,WGS),全外顯子組測序(Whole Exome Sequencing,WES)以及轉(zhuǎn)錄組測序(Transcriptome Sequencing)極大地加速了疾病發(fā)病機(jī)制的研究.2008年,Ley等發(fā)表了1例AML患者的全基因測序結(jié)果,該研究發(fā)現(xiàn)了8個(gè)體細(xì)胞突變,對(duì)初發(fā)和復(fù)發(fā)腫瘤樣本的突變區(qū)域進(jìn)行擴(kuò)增后發(fā)現(xiàn),F(xiàn)LT3-ITD 和NPM1是疾病發(fā)展過程中相關(guān)的基因,但是據(jù)初發(fā)和復(fù)發(fā)腫瘤樣本中FLT3-ITD 出現(xiàn)率推斷出FLT3-ITD 并不存在于所有腫瘤細(xì)胞中,F(xiàn)LT3-ITD 的突變可能發(fā)生于腫瘤病程的后期[10].
生命科學(xué)研究已經(jīng)進(jìn)入后基因組時(shí)代,各大公共數(shù)據(jù)庫中已經(jīng)積累大量的基于不同技術(shù)的組學(xué)數(shù)據(jù),其中包含有多個(gè)研究機(jī)構(gòu)研究并共享的數(shù)據(jù),如人類基因組計(jì)劃(Human Genome Project,HGP),1 000人基因組計(jì)劃(1 000Genomes),癌癥和腫瘤基因圖譜計(jì)劃(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫等.除了大規(guī)模研究機(jī)構(gòu)共享的數(shù)據(jù)以外,還有大量由個(gè)人或研究機(jī)構(gòu)提交到美國國立生物信息中心(NCBI)數(shù)據(jù)庫中共享的數(shù)據(jù),如NCBI基因組(Genome)數(shù)據(jù)庫,基因表達(dá)組(GEO)數(shù)據(jù)庫,基因型和表型(dbGAP)數(shù)據(jù)庫等.這些海量數(shù)據(jù)雖然方便了研究者們將已有數(shù)據(jù)直接應(yīng)用于自己的研究中,但如何有效地對(duì)不同類型的組學(xué)數(shù)據(jù)進(jìn)行綜合解讀成為了一大難題.Califano等提出使用數(shù)據(jù)整合的方式來研究生物學(xué)機(jī)制,他們試圖將全基因組關(guān)聯(lián)分析(Genome Wide Association Study,GWAS)數(shù)據(jù)和基因調(diào)控網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行整合,使GWAS所獲得的差異基因在基因調(diào)控網(wǎng)絡(luò)中進(jìn)行富集,并獲得富集的調(diào)控網(wǎng)絡(luò),再對(duì)網(wǎng)絡(luò)進(jìn)行研究[11].Han 等使用整合全基因組關(guān)聯(lián)分析和人類蛋白互作網(wǎng)絡(luò)(Human Protein Interaction Network,HPIN)的方法研究歐洲人的酒精依賴癥,并且發(fā)現(xiàn)了一些新的可能增加患酒精依賴癥風(fēng)險(xiǎn)的代謝通路以及基因[12].許多研究均表明,結(jié)合不同組學(xué)數(shù)據(jù)進(jìn)行疾病的研究可以有效地發(fā)現(xiàn)單一組學(xué)數(shù)據(jù)研究中無法發(fā)現(xiàn)的疾病相關(guān)基因,并且不同組學(xué)數(shù)據(jù)之間可以進(jìn)行互相補(bǔ)充,從而更加準(zhǔn)確地解釋疾病的發(fā)病機(jī)制.
本文中結(jié)合AML病人的基因組中基因突變數(shù)據(jù),基于RNA-seq的轉(zhuǎn)錄組表達(dá)量數(shù)據(jù)以及人類蛋白互作網(wǎng)絡(luò)數(shù)據(jù),通過構(gòu)建網(wǎng)絡(luò)的方式,研究基因組中突變基因的功能,并試圖發(fā)現(xiàn)突變基因所富集的網(wǎng)絡(luò),從而為AML發(fā)病機(jī)制的闡明和診斷提供一些依據(jù).
AML基因組體細(xì)胞突變數(shù)據(jù)和RNA 轉(zhuǎn)錄組數(shù)據(jù)來源于TCGA 數(shù)據(jù)庫(https:∥tcga-data.ncbi.nih.gov/tcga/),數(shù)據(jù)集中包括200例病人的病變組織樣本.在TCGA 的初步分析數(shù)據(jù)中,200個(gè)樣本包含有體細(xì)胞突變數(shù)據(jù),173個(gè)樣本包含有RNA 轉(zhuǎn)錄組的表達(dá)量數(shù)據(jù)[13].本文篩選出同時(shí)包含體細(xì)胞突變數(shù)據(jù)和RNA 轉(zhuǎn)錄組數(shù)據(jù)的樣本進(jìn)行分析,篩選獲得173例AML 數(shù)據(jù),其中153個(gè)白人樣本,13個(gè)黑人樣本,以及7個(gè)其他人種樣本.樣本中92個(gè)為男性,81個(gè)為女性.
使用UCSC Genomes(http:∥genome.ucsc.edu/)數(shù)據(jù)庫對(duì)AML體細(xì)胞突變數(shù)據(jù)中的基因進(jìn)行名稱轉(zhuǎn)換,將數(shù)據(jù)中的原始基因名轉(zhuǎn)換為基于HCNC(Human Gene Nomenclature)的標(biāo)準(zhǔn)基因名.去除無法被轉(zhuǎn)換為HCNC基因名的基因,篩選并去除在所有研究樣本中均不表達(dá)的基因(RNA轉(zhuǎn)錄組表達(dá)量為0).
1.3.1 基因突變頻率的二項(xiàng)檢驗(yàn)
使用二項(xiàng)檢驗(yàn)對(duì)AML病人的基因突變頻率進(jìn)行檢驗(yàn),其中基因期望突變頻率是單位長度突變次數(shù)乘以基因的最長轉(zhuǎn)錄本長度.參考Lawrence等[14]對(duì)癌癥基因組中基因突變率的研究,本文使用單位長度突變次數(shù)為0.4次/Mb.基因轉(zhuǎn)錄本長度信息來源于UCSC Genomes數(shù)據(jù)庫,基因觀察到的突變率為基因在所有樣本中的突變次數(shù)除以樣本總數(shù).使用R 統(tǒng)計(jì)學(xué)軟件對(duì)每個(gè)基因進(jìn)行二項(xiàng)檢驗(yàn),檢驗(yàn)時(shí)使用單尾檢驗(yàn),并計(jì)算P 值,其中零假設(shè)為觀察到的基因突變頻率顯著不高于AML 病人基因組中基因的平均突變頻率.
1.3.2 高突變率基因互作網(wǎng)絡(luò)分析
使用R 軟件包dmGWAS[15]結(jié)合突變基因的RNA 轉(zhuǎn)錄組數(shù)據(jù)和HPIN 對(duì)AML 病人基因組中突變基因進(jìn)行分析.dmGWAS 分析中使用的基因權(quán)值為二項(xiàng)檢驗(yàn)所獲得的P 值,互作網(wǎng)絡(luò)數(shù)據(jù)來源于PINA[16],使用USCS Genomes數(shù)據(jù)庫將蛋白質(zhì)互作網(wǎng)絡(luò)中Uniprot基因名轉(zhuǎn)化為標(biāo)準(zhǔn)的HCNC 基因名,最終獲得約16.7萬對(duì)蛋白質(zhì)互作數(shù)據(jù).dmGWAS軟件包以HPIN 為基礎(chǔ),通過計(jì)算模塊值(S)的方式進(jìn)行模塊的識(shí)別和拓展,S 的計(jì)算結(jié)合邊權(quán)重(基因間RNA 表達(dá)量的Pearson相關(guān)系數(shù))和節(jié)點(diǎn)權(quán)重(基因二項(xiàng)檢驗(yàn)的P 值),S 的計(jì)算公式[15]如下:
其中λ是權(quán)衡邊權(quán)重和節(jié)點(diǎn)權(quán)重的參數(shù),本文中使用程序估算獲得的λ,新增加基因后,如果S 值的增量小于r×S 時(shí),dmGWAS停止模塊拓展,本文中使用的r值為0.1.計(jì)算獲得S 值后,根據(jù)模塊的大小對(duì)S值進(jìn)行修正,使用的修正公式為Sn=(S-μ)/σ.其中μ 和σ 分別為根據(jù)模塊大小隨機(jī)抽樣10 000次獲得的均值和方差;根據(jù)Sn大小對(duì)模塊進(jìn)行降序排列.一般認(rèn)為,Sn值越大的模塊與疾病的相關(guān)性越高,所以通常選取Sn靠前的模塊構(gòu)建子網(wǎng)絡(luò).
1.3.3 基因富集分析
使用在線分析工具DAVID[17]分別對(duì)候選基因集、高突變率基因(P<0.05)和子網(wǎng)絡(luò)中基因進(jìn)行GO[18]和KEGG[19]代謝通路富集分析.使用DAVID 中的Fisher精確檢驗(yàn)對(duì)富集的GO 和KEGG 代謝通路進(jìn)行統(tǒng)計(jì)檢驗(yàn)并計(jì)算P 值,使用Bonferroni對(duì)多重檢驗(yàn)的P 值進(jìn)行校正.
根據(jù)體細(xì)胞突變數(shù)據(jù)和RNA 轉(zhuǎn)錄組數(shù)據(jù)對(duì)樣本進(jìn)行篩選,得到173例AML 病例數(shù)據(jù).使用USCS Genomes數(shù)據(jù)庫將數(shù)據(jù)中基因名統(tǒng)一轉(zhuǎn)換為HCNC基因名,其中無法識(shí)別基因名的基因被去除,篩選并去除在173例樣本中均不表達(dá)的基因,最終得到1 450個(gè)基因滿足以上條件,并用于后續(xù)分析.
對(duì)173例病人的1 450個(gè)基因統(tǒng)計(jì)后發(fā)現(xiàn),AML病人基因組中22條常染色體和X 染色(23號(hào))上均發(fā)現(xiàn)了體細(xì)胞突變基因。其中1號(hào)染色體包含有最多體細(xì)胞突變基因,為130個(gè)基因,而18號(hào),21號(hào)染色體相對(duì)于其他染色體,包含較少的體細(xì)胞突變基因,分別為17個(gè)和18個(gè)體細(xì)胞突變基因.
通過對(duì)1 450個(gè)體細(xì)胞突變基因進(jìn)行KEGG 的代謝通路富集分析后,發(fā)現(xiàn)15個(gè)代謝通路在1 450個(gè)體細(xì)胞突變基因中發(fā)生了富集(P<0.05)(表1).經(jīng)過Bonferroni方法進(jìn)行多重檢驗(yàn)的P 值校正后,仍有1個(gè)代謝通路,黏著斑通路(hsa04510)的P 值達(dá)到顯著水平.在富集的15個(gè)代謝通路中,有4個(gè)是與癌癥直接相關(guān)的,包括神經(jīng)膠質(zhì)瘤通路(hsa05214),慢性髓細(xì)胞白血病通路(hsa05220),癌癥代謝通路(hsa05200)和急性髓細(xì)胞白血病通路(hsa05221);還有一些與其他疾病相關(guān)的代謝通路,如擴(kuò)張型心肌病通路(hsa05414),Ⅱ型糖尿病通路(hsa04930)等.
表1 AML中體細(xì)胞突變基因在KEGG 代謝通路富集分析中富集的通路Tab.1 The enriched pathways from KEGG pathway analysis of somatic mutated genes in AML
(續(xù)表)
使用DAVID 在線工具對(duì)1 450個(gè)體細(xì)胞突變基因進(jìn)行GO 富集分析,富集所得的GO 三大分類(生物過程、細(xì)胞組分和分子功能)中的前5位結(jié)果如下表(表2).從GO 三大類的富集結(jié)果中可以看出,在生物過程中,體細(xì)胞突變基因在細(xì)胞粘著的過程發(fā)生富集;細(xì)胞組分中,染色體組成相關(guān)的組分發(fā)生富集;分子功能中,離子通道和跨膜轉(zhuǎn)運(yùn)的功能發(fā)生富集.
表2 候選基因集在三大類GO 富集分析中富集的前5個(gè)GO 注釋Tab.2 The top 5items in three main categories from GO enrichment analysis of candidate genes
使用二項(xiàng)檢驗(yàn)對(duì)173例樣本中的1 450個(gè)候選基因進(jìn)行檢驗(yàn),從結(jié)果(圖1)中可以看出,大多數(shù)體細(xì)胞突變基因的P 值不顯著,只有約8%(114/1 450)的體細(xì)胞突變基因P 值達(dá)到統(tǒng)計(jì)學(xué)顯著水平(P<0.05),其中5號(hào),13號(hào)和2號(hào)染色體分別包含有AML病人基因組中P 值最為顯著的3個(gè)體細(xì)胞突變基因(NPM1,F(xiàn)LT3和DNMT3A).在18號(hào)染色體的17個(gè)體細(xì)胞突變基因中,未發(fā)現(xiàn)差異顯著的體細(xì)胞突變基因;在7號(hào)染色體上,差異顯著的體細(xì)胞突變基因占其染色體上總的體細(xì)胞突變基因的比例最多,為14.5%(10/69);21號(hào)染色體盡管整體包含較少的體細(xì)胞突變基因,但是其包含的2個(gè)P 值較顯著的體細(xì)胞突變基因.部分染色體上雖然包含有較多的體細(xì)胞突變基因,但是包含P 值顯著的體細(xì)胞突變基因較少,如6號(hào)染色體.
表3中列出了20個(gè)P 值較小的體細(xì)胞突變基因,其中NPM1,F(xiàn)LT3和DNMT3A 分別在48、49和48例樣本中被檢測到體細(xì)胞突變,11個(gè)高突變率基因在大于10例樣本中被檢測出突變.
圖1 1 450個(gè)體細(xì)胞突變基因二項(xiàng)檢驗(yàn)的P 值分布(彩頁見封3)Fig.1 The distribution of Pvalue in the binomial test of 1 450somatic mutated genes
圖1 1 450個(gè)體細(xì)胞突變基因二項(xiàng)檢驗(yàn)的P 值分布Fig.1 The distribution of Pvalue in the binomial test of 1 450somatic mutated genes
表3 二項(xiàng)檢驗(yàn)中P 值較小的前20個(gè)基因及其相關(guān)信息Tab.3 The general features of top 20low Pvalue genes in the binomial test
通過對(duì)二項(xiàng)檢驗(yàn)結(jié)果中基因突變頻率顯著高于平均突變頻率的114個(gè)體細(xì)胞突變基因進(jìn)行KEGG的代謝通路富集分析后,發(fā)現(xiàn)5個(gè)代謝通路在114個(gè)體細(xì)胞突變基因中發(fā)生了富集(P<0.05)(表4).經(jīng)過Bonferroni方法進(jìn)行多重檢驗(yàn)的P 值校正后,仍有1個(gè)代謝通路,即急性髓細(xì)胞白血病通路(hsa05221)P 值達(dá)到顯著水平(<0.05).在5個(gè)富集的代謝通路中,2個(gè)是與白血病直接相關(guān)的代謝通路(hsa05221和hsa05220),1個(gè)是甲狀腺癌相關(guān)代謝通路(hsa05216).
表4 高突變頻率基因集在KEGG 代謝通路富集分析中富集的通路Tab.4 The enriched pathways from KEGG pathway analysis of frequently mutated genes
使用DAVID 在線工具對(duì)114個(gè)高突變頻率基因進(jìn)行GO 富集分析,富集所得的GO 三大分類(生物過程、細(xì)胞組分和分子功能)中的前5位結(jié)果如下表(表5).從GO 三大類的富集結(jié)果中可以看出,在生物過程中,高突變頻率基因在神經(jīng)突觸調(diào)控和白細(xì)胞分化的過程發(fā)生富集;細(xì)胞組分中,染色體組成相關(guān)的組分發(fā)生富集;分子功能中、染色體結(jié)合,通道激活和跨膜轉(zhuǎn)運(yùn)的功能發(fā)生富集.
表5 高突變頻率基因集在三大類GO 富集分析中富集的前5個(gè)GO 注釋Tab.5 The top 5items in three main categories from GO enrichment analysis of frequently mutated genes
使用R 軟件包dmGWAS將1 450個(gè)體細(xì)胞突變基因結(jié)合RNA 轉(zhuǎn)錄組數(shù)據(jù)和蛋白互作網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)分析,獲得288個(gè)基因互作功能模塊.為了獲得與疾病相關(guān)性較高的互作子網(wǎng)絡(luò),本文選取前5%模塊值較大的功能模塊構(gòu)建基因互作子網(wǎng)絡(luò)(圖2),其中包含有21個(gè)體細(xì)胞突變基因.互作子網(wǎng)絡(luò)中節(jié)點(diǎn)表示基因,連線表示基因間的相互作用,節(jié)點(diǎn)顏色的深淺表示節(jié)點(diǎn)的權(quán)重,顏色越淺權(quán)重值越大(P 值越小),連線的粗細(xì)表示節(jié)點(diǎn)間的相關(guān)性,線條越粗,相關(guān)性約高.
使用DAVID 在線工具對(duì)互作子網(wǎng)絡(luò)中的21個(gè)體細(xì)胞突變基因進(jìn)行KEGG 代謝通路的富集分析,分析結(jié)果如下表(表6).其中3條代謝通路在21個(gè)體細(xì)胞突變基因中富集(P<0.05),分別為細(xì)胞循環(huán)(hsa04110),慢性髓細(xì)胞白血?。╤sa05220)和趨化因子信號(hào)通路(hsa04062),經(jīng)過Bonferroni方法進(jìn)行多重檢驗(yàn)的P 值校正后,細(xì)胞循環(huán)相關(guān)的代謝通路的P 達(dá)到顯著水平.
圖2 AML中體細(xì)胞突變基因的互作子網(wǎng)絡(luò)Fig.2 The interaction subnetwork of somatic mutated genes in AML
表6 互作子網(wǎng)絡(luò)中基因在KEGG 代謝通路富集分析中富集的通路Tab.6 The enriched pathways from KEGG pathway analysis of genes from subnetwork
使用DAVID 在線工具對(duì)互作子網(wǎng)絡(luò)中21個(gè)體細(xì)胞突變基因進(jìn)行GO 富集分析,富集所得的GO 三大分類(生物過程,細(xì)胞組分和分子功能)中的前5位結(jié)果如表7所示.從GO 三大類的富集結(jié)果中可以看出,在生物過程中,子網(wǎng)絡(luò)中的基因在染色體組成和修飾過程發(fā)生富集;細(xì)胞組分中,染色體組成相關(guān)的組分發(fā)生富集;分子功能中,染色體結(jié)合,轉(zhuǎn)錄調(diào)控和轉(zhuǎn)錄因子結(jié)合的功能發(fā)生富集.
表7 互作子網(wǎng)絡(luò)中基因在三大類GO 富集分析中富集的前5個(gè)GO 注釋Tab.7 The top 5items in three main categories from GO enrichment analysis of genes from subnetwork
(續(xù)表)
本文首先對(duì)1 450個(gè)AML中體細(xì)胞突變基因進(jìn)行KEGG 代謝通路和GO 富集分析.GO 富集分析結(jié)果表明,在生物過程中,體細(xì)胞突變基因在細(xì)胞黏著的過程發(fā)生富集;細(xì)胞組分中,染色體組成相關(guān)的組分發(fā)生富集;分子功能中,離子通道和跨膜轉(zhuǎn)運(yùn)的功能發(fā)生富集.已有研究表明,細(xì)胞黏著在很多惡性疾病的發(fā)展過程中具有重要作用,對(duì)細(xì)胞黏著過程中分子的相互作用進(jìn)行調(diào)控,是一種治療AML 的有效手段[20].可以看出,單純對(duì)AML中體細(xì)胞突變基因的富集分析,發(fā)現(xiàn)一些與AML 相關(guān)的生物過程發(fā)生了異常.
使用二項(xiàng)檢驗(yàn)對(duì)173例AML病人基因組中1 450個(gè)體細(xì)胞突變基因進(jìn)行檢驗(yàn),發(fā)現(xiàn)在AML病人基因組中常見的突變基因的突變頻率均顯著高于基因組中基因的平均突變頻率,這一結(jié)果表明FLT3,NPM1,KIT,CEBPA,TET2,DNMT3A 以及IDH1基因在這173例AML 病人中也是較為常見的突變基因.以P 值小于0.05作為差異顯著的標(biāo)準(zhǔn),經(jīng)二項(xiàng)檢驗(yàn)后,獲得了114個(gè)突變頻率顯著高于平均突變頻率的基因,對(duì)這114個(gè)突變頻率較高的基因進(jìn)行KEGG 代謝通路和GO 的富集分析,KEGG 代謝通路富集結(jié)果表明,114個(gè)突變基因在急性髓細(xì)胞白血?。╤sa05221)和慢性髓細(xì)胞白血病(hsa05220)代謝通路中發(fā)生了富集,這兩個(gè)代謝通路都是與白血病直接相關(guān)的疾病代謝通路,KEGG 代謝通路富集結(jié)果一方面說明白血病代謝通路中的基因突變頻率顯著高于其他代謝通路,另一方面說明,AML 發(fā)病機(jī)制相關(guān)的基因突變可能會(huì)包含在突變頻率較高的基因集中.GO 富集結(jié)果表明,在生物過程中,高突變頻率基因在神經(jīng)突觸調(diào)控和白細(xì)胞分化的過程發(fā)生富集;細(xì)胞組分中,染色體組成相關(guān)的組分發(fā)生富集;分子功能中,染色體結(jié)合,通道激活和跨膜轉(zhuǎn)運(yùn)的功能發(fā)生富集.這些AML 病人的神經(jīng)系統(tǒng)或相關(guān)功能可能出現(xiàn)異常;中樞神經(jīng)系統(tǒng)損傷是急性白血病的常見并發(fā)癥之一,許多AML 的中樞神經(jīng)系統(tǒng)會(huì)受到損傷[21],高突變率基因的GO 富集結(jié)果說明AML病人的基因組中,許多中樞神經(jīng)系統(tǒng)功能相關(guān)的基因發(fā)生突變可能是AML 的中樞神經(jīng)系統(tǒng)發(fā)生損傷的主要原因.雖然使用對(duì)基因富集的方法可以發(fā)現(xiàn)AML 中某些功能發(fā)生異常,但是仍然無法揭示這些基因突變的產(chǎn)生是AML作用的結(jié)果還是導(dǎo)致AML 的原因,所以需要我們從基因間相互作用的角度去研究AML中的突變基因.
本文使用AML中1 450個(gè)體細(xì)胞突變基因結(jié)合人類蛋白互作數(shù)據(jù)和基因的RNA 轉(zhuǎn)錄組數(shù)據(jù),構(gòu)建基因互作子網(wǎng)絡(luò),互作子網(wǎng)絡(luò)中包含有21個(gè)體細(xì)胞突變基因,其中部分基因是AML中常見的突變基因,如NPM1,SMC3等,另一些突變基因則在AML 中出現(xiàn)的頻率較低,如HIST3 H3,RBBP4等,但這些基因與AML中常見突變基因間具有相互作用;互作子網(wǎng)絡(luò)中包含5個(gè)驅(qū)動(dòng)基因(相鄰基因數(shù)大于5):SMC3,HDAC2,NPM1,RBBP4和HIST3 H3,這些驅(qū)動(dòng)基因可能與AML 的致病機(jī)制密切相關(guān);其中NPM1是已知的與AML 相關(guān)的基因[13];SMC3是黏連蛋白基因,在有絲分裂的過程中使得姐妹染色單體粘連在一起,該基因的突變可能會(huì)導(dǎo)致染色體核型的改變,并且SMC3的突變與NPM1之間具有很強(qiáng)的相關(guān)性[22];HDAC 是一類組蛋白脫乙酰酶基因,對(duì)HDAC 進(jìn)行阻斷是臨床上治療癌癥的有效手段[23];HIST3 H3是組蛋白基因,主要是控制細(xì)胞核中染色體牽絲的形成,HIST3 H3的突變可能會(huì)導(dǎo)致染色體核型發(fā)生改變,在AML 中對(duì)HIST3 H3 研究較少,而對(duì)AML 中HIST3 H3 的深入研究,可能會(huì)揭示AML病人基因組中染色體核型變化的原因;RBBP4是與組蛋白乙酰化和染色體組裝相關(guān)的基因,通過對(duì)RBBP4表達(dá)的上下調(diào)可以控制細(xì)胞的循環(huán)和凋亡[24].使用DAVID 在線工具對(duì)21個(gè)基因進(jìn)行KEGG代謝通路富集分析后發(fā)現(xiàn),3條代謝通路在21個(gè)基因中發(fā)生了富集,其中趨化因子代謝通路與AML 的致病機(jī)制相關(guān)性的研究較少,趨化因子在AML中細(xì)胞凋亡過程具有重要的調(diào)控作用,Kremer等的研究表明,趨化因子受體SDF-1/CXCR4可以誘導(dǎo)急性髓細(xì)胞白血病中細(xì)胞凋亡[25],趨化因子信號(hào)通路基因發(fā)生突變,可能會(huì)導(dǎo)致白細(xì)胞細(xì)胞凋亡過程異常,從而使得白細(xì)胞發(fā)生惡性增殖.互作子網(wǎng)絡(luò)中的體細(xì)胞突變基因代謝通路富集結(jié)果表明,趨化因子信號(hào)通路與急性髓細(xì)胞白血病的發(fā)病機(jī)制有密切關(guān)系.本文中還發(fā)現(xiàn)了一些AML潛在的相關(guān)基因,如CBX7,GNAI2和COPS2等;已有研究[26]表明,在甲狀腺癌中,CBX7表達(dá)水平發(fā)生下調(diào),并且GBX7的表達(dá)水平與甲狀腺癌的惡性程度相關(guān);在AML 中,CBX7突變可能引起GBX7表達(dá)水平變化,從而影響AML的發(fā)生或惡性程度.
綜上,使用不同的研究手段可以發(fā)現(xiàn)基因突變與疾病間的相互關(guān)系,并且,將基因組中發(fā)生突變的基因結(jié)合基因的RNA 轉(zhuǎn)錄組和人類蛋白互作網(wǎng)絡(luò),可以發(fā)現(xiàn)某些疾病基因組中突變基因間互作的子網(wǎng)絡(luò),從而發(fā)現(xiàn)那些在傳統(tǒng)研究方法中被忽視的基因或代謝通路;本文使用基于HPIN 網(wǎng)絡(luò)的方法研究突變基因,可以有效的揭示疾病中潛在的驅(qū)動(dòng)基因,這些驅(qū)動(dòng)基因可能在AML 的發(fā)病機(jī)制中具有重要作用,對(duì)這些驅(qū)動(dòng)基因的進(jìn)一步研究,可能會(huì)發(fā)現(xiàn)新的AML發(fā)病相關(guān)基因,為將來AML 的診斷以及個(gè)性化醫(yī)療提供一定的依據(jù).
[1]王福旭.造血干細(xì)胞移植治療高危急性髓細(xì)胞白血病的研究進(jìn)展[J].國際輸血及血液學(xué)雜志,2013,36(5):412-417.
[2]羊裔明.急性髓細(xì)胞白血病治療現(xiàn)狀及其展望[J].臨床誤診誤治,2006,19(9):1-4.
[3]王 星,王小欽,顧靜文,等.成人急性髓細(xì)胞白血病發(fā)病危險(xiǎn)因素的研究[J].中華全科醫(yī)師雜志,2011,10(9):637-640.
[4]Walter M J,Payton J E,Ries R E,et al.Acquired copy number alterations in adult acute myeloid leukemia genomes[J].Proc Natl Acad Sci USA,2009,106(31):12950-12955.
[5]Stirewalt D L,Radich J P.The role of FLT3in haematopoietic malignancies[J].Nature Reviews Cancer,2003,3(9):650-665.
[6]Bacher U,Schnittger S,Haferlach T.Molecular genetics in acute myeloid leukemia[J].Current Opinion in Oncology,2010,22(6):646-655.
[7]Ley T J,Ding L,Walter M J,et al.DNMT3A mutations in acute myeloid leukemia[J].The New England Journal of Medicine,2010,363(25):2424-2433.
[8]Yamashita Y,Yuan J,Suetake I,et al.Array-based genomic resequencing of human leukemia[J].Oncogene,2010,29(25):3723-3731.
[9]Shen Y,Zhu Y M,F(xiàn)an X,et al.Gene mutation patterns and their prognostic impact in a cohort of 1185 patients with acute myeloid leukemia[J].Blood,2011,118(20):5593-5603.
[10]Ley T J,Mardis E R,Ding L,et al.DNA sequencing of a cytogenetically normal acute myeloid leukemia genome[J].Nature,2008,456(7218):66-72.
[11]Califano A,Butte A J,F(xiàn)riend S,et al.Leveraging models of cell regulation and GWAS data in integrative network-based association studies[J].Nat Genet,2012,44(8):841-847.
[12]Han S,Yang B Z,Kranzler H R,et al.Integrating GWASs and human protein interaction networks identifies a gene subnetwork underlying alcohol dependence[J].American Journal of Human Genetics,2013,93(6):1027-1034.
[13]The Cancer Genome Atlas Research Network.Genomic and epigenomic landscapes of adult de novo acute myeloid leukemia[J].The New England Journal of Medicine,2013,368(22):2059-2074.
[14]Lawrence M S,Stojanov P,Mermel C H,et al.Discovery and saturation analysis of cancer genes across 21tumour types[J].Nature,2014,505(7484):495-501.
[15]Jia P,Zheng S,Long J,et al.dmGWAS:Dense module searching for genome-wide association studies in protein-protein interaction networks[J].Bioinformatics,2011,27(1):95-102.
[16]Wu J,Vallenius T,Ovaska K,et al.Integrated network analysis platform for protein-protein interactions[J].Nat Methods,2009,6(1):75-77.
[17]Huang Da W,Sherman B T,Lempicki R A.Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources[J].Nature Protocols,2008,4(1):44-57.
[18]Ashburner M,Ball C A,Blake J A,et al.Gene ontology:Tool for the unification of biology.The Gene Ontology Consortium[J].Nat Genet,2000,25(1):25-29.
[19]Du J,Yuan Z,Ma Z,et al.KEGG-PATH:Kyoto encyclopedia of genes and genomes-based pathway analysis using apath analysis model[J].Molecular Biosystems,2014,10(9):2441-2447.
[20]Kupsa T,Horacek J M,Jebavy L.The role of adhesion molecules in acute myeloid leukemia and(hemato)oncology:A systematic review[M].Olomouc,Czechoslovakia:Biomedical papers of the Medical Faculty of the University Palacky,2014.
[21]周小平,張永寧.3例急性白血病并發(fā)中樞神經(jīng)系統(tǒng)損害患者的臨床特征分析及文獻(xiàn)復(fù)習(xí)[J].中國臨床神經(jīng)科學(xué),2013,21(4):418-422,437.
[22]Thol F,Bollin R,Gehlhaar M,et al.Mutations in the cohesin complex in acute myeloid leukemia:Clinical and prognostic implications[J].Blood,2014,123(6):914-920.
[23]Boissinot M,Inman M,Hempshall A,et al.Induction of differentiation and apoptosis in leukaemic cell lines by the novel benzamide family histone deacetylase 2and 3inhibitor MI-192[J].Leukemia Research,2012,36(10):1304-1310.
[24]Casas S,Ollila J,Aventin A,et al.Changes in apoptosis-related pathways in acute myelocytic leukemia[J].Cancer Genetics and Cytogenetics,2003,146(2):89-101.
[25]Kremer K N,Peterson K L,Schneider P A,et al.CXCR4 chemokine receptor signaling induces apoptosis in acute myeloid leukemia cells via regulation of the Bcl-2family members Bcl-XL,Noxa,and Bak[J].The Journal of Biological Chemistry,2013,288(32):22899-22914.
[26]Pallante P,F(xiàn)ederico A,Berlingieri M T,et al.Loss of the CBX7gene expression correlates with a highly malignant phenotype in thyroid cancer[J].Cancer Research,2008,68(16):6770-6778.