陶 然,趙衛(wèi)紅,秦博宇,焦順昌
解放軍總醫(yī)院第一醫(yī)學(xué)中心 腫瘤內(nèi)科,北京 100853
乳腺癌是世界范圍內(nèi)女性最常見(jiàn)的惡性腫瘤,嚴(yán)重威脅女性生命健康。近年來(lái)與西方發(fā)達(dá)國(guó)家比較,我國(guó)女性乳腺癌發(fā)病率和死亡率快速上升,且呈現(xiàn)出年輕化趨勢(shì)[1]。與中老年女性乳腺癌相比,年輕乳腺癌患者(≤35歲)就診時(shí)病理學(xué)分期更晚、組織學(xué)分級(jí)更高、侵襲性更強(qiáng),同時(shí)也更容易出現(xiàn)多器官轉(zhuǎn)移及骨髓侵犯[2-4]。由于該年齡段患者數(shù)量的限制,目前針對(duì)年輕女性乳腺癌相關(guān)基因的分子生物學(xué)功能及通路分析國(guó)內(nèi)外鮮有報(bào)道。本研究通過(guò)生物信息學(xué)方法處理醫(yī)學(xué)癌癥數(shù)據(jù)庫(kù)(The Cancer Genome Atlas,TCGA)中年輕女性乳腺癌相關(guān)轉(zhuǎn)錄組數(shù)據(jù),篩選出差異表達(dá)基因的同時(shí)構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò),并著重對(duì)網(wǎng)絡(luò)中表達(dá)上調(diào)的核心基因進(jìn)行分析。初步探索年輕女性乳腺癌在分子水平的發(fā)生發(fā)展機(jī)制。
1 資料 通過(guò)TCGA數(shù)據(jù)庫(kù)(https://gdc-portal.nci.nig.gov)下載女性乳腺癌相關(guān)轉(zhuǎn)錄組數(shù)據(jù)集(RNA-seq v2 level3),檢測(cè)平臺(tái)均為Illumina HiSeq 2000 RNA Sequencing。在保留篩選條件為年齡≤35歲的樣本數(shù)據(jù)后共得到了32例樣本,其中包括29例腫瘤組織樣本和3例正常乳腺組織樣本。
2 差異表達(dá)基因篩選 采用R3.4.1中的Limma程序包(Version 3.32.5)對(duì)TCGA數(shù)據(jù)庫(kù)中年輕女性乳腺癌轉(zhuǎn)錄組數(shù)據(jù)集歸一化處理并與正常乳腺組織的基因表達(dá)值進(jìn)行比對(duì)篩選差異表達(dá)基因(differentially expressed genes,DEGs)。對(duì)篩選出的差異表達(dá)基因采用R3.4.1中的Pheatmap Version 1.0.8包繪制火山圖以及雙向?qū)哟尉垲悷釄D。差異表達(dá)基因篩選條件為|log2FC|>0.5同時(shí)FDR<0.05。
3 蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建及核心基因篩選利用蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)STRING(Version:10.0,https://string-db.org)構(gòu)建差異表達(dá)基因編碼蛋白質(zhì)相互作用網(wǎng)絡(luò)(protein-protein interaction network,PPI)。通過(guò)Cytoscape Version 3.6.1對(duì)網(wǎng)絡(luò)進(jìn)行可視化展示。進(jìn)一步利用Cytoscape軟件中的MCODE(Molecular Complex Detection)插件篩選網(wǎng)絡(luò)中與年輕女性乳腺癌顯著相關(guān)的核心基因。
4 核心基因的GO功能及KEGG通路分析 著重對(duì)網(wǎng)絡(luò)中表達(dá)上調(diào)的核心基因進(jìn)行基于DAVID6.8在線分析工具的基因本體(gene ontology,GO)功能與京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。并通過(guò)超幾何分布Fisher exact檢驗(yàn)計(jì)算顯著性水平(顯著性篩選標(biāo)準(zhǔn):P<0.05)。
1 差異表達(dá)基因篩選 對(duì)年輕女性乳腺癌腫瘤組織及正常組織基因數(shù)據(jù)采用Limma程序包進(jìn)行預(yù)處理及篩選,共得到720個(gè)滿足設(shè)定閾值(|log2FC|>0.5且FDR<0.05)的差異表達(dá)基因。對(duì)比正常組織,癌組織中上調(diào)基因173個(gè),下調(diào)基因547個(gè)(圖1)。
2 編碼蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建及篩選核心基因利用STRING數(shù)據(jù)庫(kù)對(duì)篩選出的720個(gè)差異表達(dá)基因進(jìn)行分析處理,在保留相互作用預(yù)測(cè)得分高于0.4的作用對(duì)后共得到了1 061對(duì)連接對(duì),以此構(gòu)建差異表達(dá)基因編碼蛋白質(zhì)相互作用網(wǎng)絡(luò)并使用Cytoscape對(duì)網(wǎng)絡(luò)進(jìn)行可視化展示(圖2A)。通過(guò)MCODE(Molecular Complex Detection)插件對(duì)該蛋白質(zhì)相互作用網(wǎng)絡(luò)進(jìn)行分析,得出兩個(gè)核心基因模塊,進(jìn)一步篩選出核心基因NCAPG、NCAPH、MELK、PBK、CDCA5、CDCA8、CCNB2、CCNA2、SPC25、SKA1、NPY1R、CXCL9、CXCL10、GALR2、CCR8、CXCL2、CXCL3、CXCL5、PPBP、CCL16。 其 中 NCAPG、NCAPH、MELK、PBK、CDCA5、CDCA8、CCNB2、CCNA2、SPC25、SKA1、NPY1R、CXCL9、CXCL10、GALR2、CCR8在年輕女性乳腺癌腫瘤組織中表達(dá)上調(diào),CXCL2、CXCL3、CXCL5、PPBP、CCL16在 腫 瘤組織中表達(dá)下調(diào)(圖2B)。
3 核心基因的功能及通路分析 著重對(duì)網(wǎng)絡(luò)中表達(dá)上調(diào)的核心基因進(jìn)行GO功能和KEGG通路富集分析。結(jié)果顯示上調(diào)核心基因主要參與有絲分裂、細(xì)胞增殖正向調(diào)控和免疫應(yīng)答等生物學(xué)過(guò)程,同時(shí)與趨化因子信號(hào)通路以及神經(jīng)活性配體-受體相互作用等KEGG信號(hào)通路關(guān)系密切(圖3)。
圖1 差異表達(dá)基因火山圖(A)及表達(dá)水平雙向?qū)哟尉垲悷釄D(B)藍(lán)點(diǎn)為差異表達(dá)基因Fig. 1 Volcano map (A) and Heatmap of DEGs (B)Blue dots represent the DEGs
本研究通過(guò)對(duì)年輕女性乳腺癌腫瘤組織及正常乳腺組織的轉(zhuǎn)錄組數(shù)據(jù)分析,共篩選得到720個(gè)差異表達(dá)基因,其中上調(diào)基因173個(gè),下調(diào)基因547個(gè)。進(jìn)一步構(gòu)建差異表達(dá)基因編碼蛋白質(zhì)相互作用網(wǎng)絡(luò),最終得到與年輕女性乳腺癌顯著相關(guān)的核心基因NCAPG、NCAPH、MELK、PBK、CDCA5、CDCA8、CCNB2、CCNA2、SPC25、SKA1、NPY1R、CXCL9、CXCL10、GALR2、CCR8、CXCL2、CXCL3、CXCL5、PPBP、CCL16。以上核心基因中NCAPG、NCAPH、MELK、PBK、CDCA5、CDCA8、CCNB2、CCNA2、SPC25、SKA1、NPY1R、CXCL9、CXCL10、GALR2、CCR8在年輕女性乳腺癌組織中表達(dá)上調(diào),CXCL2、CXCL3、CXCL5、PPBP、CCL16在 癌 組織中表達(dá)下調(diào)。著重對(duì)表達(dá)上調(diào)的核心基因進(jìn)行GO與KEGG富集分析,顯示有絲分裂、細(xì)胞增殖正向調(diào)控和免疫應(yīng)答等生物學(xué)功能與其存在顯著相關(guān)性,同時(shí)趨化因子以及神經(jīng)活性配體-受體相互作用等信號(hào)通路與表達(dá)上調(diào)核心基因關(guān)系密切。
圖3 蛋白質(zhì)相互作用網(wǎng)絡(luò)中上調(diào)核心基因的GO和KEGG通路分析Fig. 3 GO and KEGG pathway analysis of up-regulated critical genes in protein-protein interaction network hsa: homo sapiens; MF: molecular function; CC: cellular component; BP: biological process
非染色體結(jié)構(gòu)維護(hù)凝縮蛋白Ⅰ復(fù)合體G亞基 (non-SMC condensingⅠcomplex subunit G,NCAPG)是凝縮蛋白復(fù)合物Ⅰ中的一個(gè)SMC調(diào)節(jié)亞基。既往研究初步證實(shí)NCAPG可能通過(guò)PI3K/AKT信號(hào)系統(tǒng)參與了多種腫瘤的發(fā)病過(guò)程并與預(yù)后不良相關(guān)[5-6]。利用siRNA-NCPAG技術(shù)可顯著抑制腫瘤細(xì)胞的增殖率及侵襲程度[7]。非染色體結(jié)構(gòu)維護(hù)凝縮蛋白Ⅰ復(fù)合體H亞基(non-SMC condensingⅠcomplex subunit H,NCAPH)作為另一種SMC調(diào)節(jié)亞基,是拓?fù)洚悩?gòu)酶Ⅱ(TopoisomeraseⅡ)活性的重要調(diào)控元件。NCPAH在黑色素瘤中可促進(jìn)DNA修復(fù)和細(xì)胞周期蛋白表達(dá)上調(diào),同時(shí)在非小細(xì)胞肺癌中NCAPH的過(guò)表達(dá)與預(yù)后不良相關(guān)[8-9]。
細(xì)胞周期蛋白A2(CCNA2)和細(xì)胞周期蛋白B2(CCNB2)通常與細(xì)胞增殖密切相關(guān),研究表明CCNA2缺失會(huì)抑制不同類型惡性腫瘤的發(fā)生[10],CCNB2則在惡性腫瘤中廣泛過(guò)表達(dá)[11]。細(xì)胞分裂周期相關(guān)蛋白5(cell division cycle-associated 5,CDCA5)作為細(xì)胞周期的核心調(diào)節(jié)因子被證實(shí)在肺癌發(fā)生過(guò)程中存在表達(dá)水平升高且與預(yù)后不良相關(guān)[12]。細(xì)胞分裂周期相關(guān)蛋白8(cell division cycle-associated 8,CDCA8)是染色體乘客復(fù)合體(chromosomal passenger complex,CPC)的組成部分,對(duì)CDCA8基因分析結(jié)果顯示其在人類胚胎干細(xì)胞(human embryonic stem cells,hESCs)和腫瘤細(xì)胞中高表達(dá),在正常細(xì)胞中弱或無(wú)表達(dá)[13]。
PDZ連接激酶/T-LAK細(xì)胞源蛋白激酶(PDZ-binding kinase/T-LAKcell-originatedproteinkinase,PBK/TOPK)是絲裂原活化蛋白激酶激酶(mi-togen activated protein kinasee,MAPK)家 族 的 絲 -蘇氨酸激酶。PBK/TOPK在乳腺癌中可激活p38及MAPK信號(hào)通路促進(jìn)腫瘤細(xì)胞增殖[14],在肺癌中通過(guò)激活PI3K/PTEN/AKT通路促進(jìn)上皮間質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT), 最 終 導(dǎo)致腫瘤細(xì)胞遷移[15]。
紡錘體和動(dòng)粒關(guān)聯(lián)蛋白-1(spindle and kinetochore-as-sociated complex subunit1,SKA1)是SKA蛋白復(fù)合體的成員,病理?xiàng)l件下SKA1可通過(guò)加快細(xì)胞周期檢查點(diǎn)轉(zhuǎn)換誘導(dǎo)腫瘤細(xì)胞增殖。目前證實(shí)SKA1在惡性腫瘤組織中表達(dá)增高且與腫瘤臨床分期密切相關(guān)[16]。Spc25(Spindle pole body compo-nent 25 homol)是核分裂周期蛋白80(nuclear division cycle 80,Ndc80)復(fù)合體的組成成員。初步報(bào)道Spc25在CpG島甲基化表型(CIMP)陽(yáng)性腎細(xì)胞癌中表達(dá)升高,同時(shí)在某些特殊病理類型乳腺癌基底部位高表達(dá)且與生存率相關(guān)[17-18],其意義仍有待進(jìn)一步明確。
神經(jīng)肽Y1受體(neuropeptide Y1 receptor,NPY1R)參與調(diào)節(jié)垂體激素的合成與分泌。實(shí)驗(yàn)證實(shí)經(jīng)雌激素處理過(guò)的大鼠下丘腦中NPY1R-mRNA轉(zhuǎn)錄水平上升,同時(shí)NPY1R可通過(guò)調(diào)控雌激素分泌進(jìn)一步誘導(dǎo)乳腺癌細(xì)胞增殖[19]。近期報(bào)道甘丙肽(galanin,GAL)及其受體系統(tǒng)(galanin receptor,GALR)與腫瘤發(fā)生發(fā)展密切相關(guān)。乳腺癌中甘丙肽前體基因(11q13)位點(diǎn)發(fā)生經(jīng)常性擴(kuò)增,同時(shí)GAL蛋白表達(dá)水平受雌激素分泌影響[20],提示其在腫瘤分子診斷方面的潛在價(jià)值。
母體胚胎亮氨酸拉鏈激酶(maternal embryonic leucine zipper kinase,MELK)是AMPK/snf1蛋白激酶家族的一種性絲-蘇氨酸激酶。沉默MELK會(huì)增加p53的表達(dá)水平[21],同時(shí)MELK抑制劑通過(guò)誘導(dǎo)p21表達(dá),控制細(xì)胞在G1期停滯從而抑制腫瘤細(xì)胞增殖[22]。目前MELK基因已成為抗癌藥物研發(fā)中的熱門靶點(diǎn)。
趨化因子受體8(chemokine receptor 8,CCR8)作為G蛋白偶聯(lián)受體家族成員是CC類趨化因子CCL1的唯一受體。CCR8主要在淋巴組織中表達(dá),近期研究認(rèn)為腫瘤細(xì)胞可通過(guò)其表面的CCR8受體與CCL1結(jié)合促進(jìn)淋巴轉(zhuǎn)移[23],乳腺癌組織中的CCR8高表達(dá)與患者總體不良預(yù)后相 關(guān)[24]。CXCL9(monokine induced by IFN-γ)和CXCL10(IFN-γ-inducible protein 10)是 由 IFN-γ誘導(dǎo)產(chǎn)生的ELR-(Glu-Leu-Arg)CXC類趨化因子,在抑制腫瘤血管生成的同時(shí)通過(guò)上調(diào)淋巴細(xì)胞黏附分子誘導(dǎo)多種免疫細(xì)胞遷移至腫瘤組織發(fā)揮殺傷作用[25-26]。小鼠腫瘤免疫模型研究發(fā)現(xiàn)抗PD-L1治療反應(yīng)率高的腫瘤組織中CXCL9、CXCL10表達(dá)水平升高[27],提示對(duì)未來(lái)抗腫瘤免疫治療的療效預(yù)測(cè)具有潛在價(jià)值。
值得注意的是,本研究同時(shí)篩選出5個(gè)表達(dá)下調(diào)核心基因。其中CXCL2、CXCL3和CXCL5均為ELR+CXC類趨化因子,可作為血管生成因子從而誘導(dǎo)腫瘤組織內(nèi)血管生成[28]。血小板堿性蛋白(pro-platelet basic protein,PPBP)參與調(diào)節(jié)有絲分裂、cAMP胞內(nèi)聚集以及DNA合成等細(xì)胞生物學(xué)過(guò)程。CCL16/HCC4作為CC類趨化因子的成員,主要在巨噬細(xì)胞炎癥歸巢過(guò)程中發(fā)揮關(guān)鍵作用。目前關(guān)于這5個(gè)下調(diào)基因及其編碼蛋白在腫瘤發(fā)生與發(fā)展機(jī)制中的相關(guān)性研究報(bào)道尚少,有待后續(xù)進(jìn)一步探索。
綜上所述,本研究基于生物信息學(xué)方法對(duì)年輕女性乳腺癌潛在核心基因進(jìn)行了初步分析探索。由于目前醫(yī)學(xué)癌癥數(shù)據(jù)庫(kù)中年輕女性乳腺癌相關(guān)數(shù)據(jù)較為有限,篩選出的核心基因仍需通過(guò)大量的基礎(chǔ)實(shí)驗(yàn)及臨床研究進(jìn)一步證實(shí)。但本研究依然有助于增強(qiáng)對(duì)年輕女性乳腺癌相關(guān)分子機(jī)制的了解,同時(shí)為該疾病的臨床診斷與治療提供了一定的理論基礎(chǔ)。