郭文才 李 銳 李龍祥 吳 勇
神經母細胞瘤占15 歲以下兒童腫瘤的7%,可分為低危、中危和高危[1]。目前。中、低危神經母細胞瘤的長期生存率超過90%[2,3],但高危神經母細胞瘤的長期生存率仍低于50%[4]。研究表明,許多分子標志物與腫瘤的發(fā)生發(fā)展密切相關,可用于早期篩查[5]。GEO是一個國際公共數(shù)據庫,為探討腫瘤基因表達提供了基礎[6]。我們從GEO 數(shù)據庫下載2 個神經母細胞瘤數(shù)據集(GSE49710、GSE73517),篩選高危神經母細胞瘤差異表達基因(differential expression gene,DEG),為高危神經母細胞瘤的診治提供參考。
1.1 基因表達和臨床數(shù)據的收集 兩個基因表達數(shù)據集(GSE49710、GSE73517)來自NCBI 的GeneExpressionSynthesis(GEO)數(shù)據庫,可從網站(http://www.ncbi.nlm.nih.gov/geo/)獲取。GSE49710 陣列數(shù)據由Zhang 等提交,包括498 例神經母細胞瘤。GSE73517 數(shù)據集由105 個神經母細胞瘤組成,由Henrich 等 提 交。GSE49710 和GSE73517 數(shù) 據 集 基于GPL16876 平臺(Agilent-020382HumanCustomMicroarray44k;發(fā)布于2013年3月28日)。
1.2 DEG 的鑒定 應用Affy 軟件包(http://cran.r-project.org/)實現(xiàn)穩(wěn)健的多陣列平均算法,將原始陣列數(shù)據轉換為表達式值,并進行背景校正以歸一化和匯總探針?;赗語言的“l(fā)imma”軟件包的配對t檢驗用于分析高危和非高危神經母細胞瘤之間的DEG。調整后的P值<0.05 和|log2FC|>1.5 被認為是DEG 篩選的臨界值。“Venny”是一個網絡分析工具(https://bioinfogp.cnb.csic.es/tools/venny/index.html),用于分析交集EDG。
1.3 GO 和KEGG 對DEG 進行富集分析GO(http://www.geneontology.org)為基因數(shù)據提供功能分類,包括生物過程、細胞成分和分子功能。因此,GO 分析是一種廣泛使用的基因和基因產物注釋工具。KEGG(http://www.genome.ad.jp/kegg/)是一個網絡網站,分析、解釋和可視化基因功能。DAVID(http://david.abcc.ncifcrf.gov/)是一個帶注釋的、可視化的、全面的發(fā)現(xiàn)數(shù)據庫,也是一種基因功能分類的在線工具,可用于評估基因的生物學功能。利用DAVID 網站進行GO富集分析和KEGG通路分析,探討DEG的功能。P<0.05認為具有統(tǒng)計學意義。
1.4 PPI 網絡構建與中樞基因鑒定STRING(版本:11.0,https://string-db.org)用于識別相互作用的基因和蛋白質,將DEG導入其中構建PPI網絡,顯示物理和功能相互作用。選擇總分>0.4 的蛋白質對進行PPI網絡構建。此外,Cytoscape軟件(V.3.8.0)用于可視化PPI 網絡。使用cytoHubba 中的12 種方法(Betweenness、BottleNeck、Closeness、ClusteringCoefficient、Degree、DMNC、EcCentricity、EPC、MCC、MNC、Radality 和Stress)對hub 基因進行排序和評估,最終生成hub 基因網絡;DAVID 用于GO 的hub 基因富集分析,KEGG進一步說明結果的可靠性。
2.1 高危神經母細胞瘤的DEG識別GSE49710包括34 個上調DEG 和284 個下調DEG,GSE73517 包括62個上調DEG和309個下調DEG。見圖1。
圖1 高危神經母細胞瘤差異表達基因分析
2.2 高危神經母細胞瘤DEG 的GO 和KEGG 富集分析Venny 圖顯示補充表,255 個DEG 中,31 個上調(圖2a)和224個下調(圖2b)。GO分析顯示,高危神經母細胞瘤DEG 調節(jié)的生物過程主要集中在細胞粘附、GTP 酶活性的正調節(jié)、轉錄的負調節(jié)、DNA 模板化、凋亡過程的負調節(jié)、中樞神經系統(tǒng)發(fā)育,調節(jié)的細胞成分富集在膜的組成部分、細胞外區(qū)域、質膜的組成部分、細胞外空間,調節(jié)的分子功能富集于鈣離子結合、受體結合(圖2c)。KEGG 分析顯示高危神經母細胞瘤DEG 在可卡因成癮、造血細胞譜系、NOD 樣受體信號通路、糖胺聚糖生物合成-硫酸乙酰肝素/肝素中顯著富集(圖2d)。
圖2 高危神經母細胞瘤差異表達基因的富集分析
2.3 PPI 網絡構建、模塊分析和樞紐基因確定STRING 分析255 個DEG 生成PPI 網絡見圖3。在Cytoscape 中使用MCODE 插件識別中心模塊的基因,對得分最高的模塊(5.852)進行GO富集分析,共鑒定出5個重要的中心模塊,得分最高的模塊的GO分析表明其與細胞表面受體信號通路、質膜和早期內體有關(圖4a、4b)。同時,使用Cytoscape 中cytohubba 插件的“Degree”算法來計算EDG 的重要性排名,繪制top25DEGs的PPI網絡圖并進行GO分析,結果表明與腺苷酸環(huán)化酶調節(jié)G蛋白偶聯(lián)受體信號通路、胞外區(qū)和肽激素結合密切相關(圖4c、4d)。最終得到5個中樞基因為ADRB2、MC4R、CD69、RBFOX1和IL7R。
圖3 高危神經母細胞瘤255 個差異表達基因的蛋白質相互作用網絡圖
圖4 高危神經母細胞瘤中樞基因的鑒定
早診斷和早治療是延長高危神經母細胞瘤生存時間的關鍵。隨著生物信息學的發(fā)展,DNA 微陣列越來越多地用于研究腫瘤的早期診斷、治療和預后評估[7]。與單隊列研究相比,多隊列研究往往具有較低的假陽性和假陰性率[8]。然而,由于批次效應和生物學差異等原因,來自不同平臺的多個微陣列可能會掩蓋和混淆真實情況[9]。為了提高DEG鑒定的可靠性,我們在同一平臺上選擇了兩個微陣列數(shù)據集,共鑒定出689 個DEG,其中255 個DEG 在兩個數(shù)據集中有顯著差異;進一步GO 富集顯示DEG 的表達主要與生物過程有關,如細胞粘附、GTP酶活性的正調控、轉錄的負調控等;分子功能主要涉及鈣離子結合和受體結合;KEGG 富集分析顯示DEG 在可卡因成癮、造血細胞譜系和NOD樣受體信號通路中顯著富集。細胞粘附的減少、細胞能量供應的增加以及某些基因表達的失衡是腫瘤發(fā)生、發(fā)展的關鍵步驟[10,11]。Tajbakhsh 等[12]指出鈣離子在腫瘤的發(fā)生和發(fā)展中起著至關重要的作用。NOD 樣受體在腫瘤轉移和炎癥性疾病中也起著至關重要的作用[13,14]。本文篩選出的DEG 與這些文獻報道的分子功能密切相關。
為識別出的DEG 構建PPI 網絡,并根據度級別定義關鍵基因,最終確定5 個中樞基因(DRB2、MC4R、CD69、RBFOX1 和IL7R)。HUB 基因功能富集分析表明神經母細胞瘤的發(fā)生與環(huán)化酶調節(jié)G蛋白偶聯(lián)受體信號、胞外區(qū)、肽激素結合有關。對5個HUB 基因進行目標數(shù)據集的生存分析,篩選出具有預后意義的ADRB2、MC4R 和RBFOX1。ADRB2 屬于由腎上腺素或去甲腎上腺素激活的跨膜G蛋白偶聯(lián)受體的超家族A[15],與cAMP 的產生有關。cAMP與腫瘤的發(fā)生發(fā)展相關[16,17]。研究表明,ADRB2 與許多腫瘤的發(fā)生、發(fā)展、進展或轉移有關[18],以及腫瘤耐藥性[19],甚至有作為分子靶點進行靶向治療的潛力[20]。這提示ADBR2 基因可能是高危神經母細胞瘤潛在靶分子和早期檢測和預后的潛在標志物。
總之,ADRB2、MC4R、CD69、RBFOX1和IL7R為高危神經母細胞瘤的中樞基因。這些基因可能成為提高高危神經母細胞瘤診斷、優(yōu)化化療和預測預后的潛在靶點,也可能為高危神經母細胞瘤的治療提供潛在的治療靶點。