冷 紅,梁 斌,吳 斌
(西南醫(yī)科大學(xué)附屬醫(yī)院乳腺外科,瀘州 646000;*通訊作者,E-mail:wwbb129@sina.com)
乳腺癌目前已是我國(guó)女性發(fā)病率最高(16.51%)的惡性腫瘤[1],目前治療主要是以手術(shù)、化療、內(nèi)分泌治療、放療及靶向治療為一體的綜合治療,其中雌激素受體、孕激素受體和人表皮生長(zhǎng)因子受體2均為陰性的三陰性乳腺癌因預(yù)后差、復(fù)發(fā)率、轉(zhuǎn)移率和死亡率高、治療手段缺乏而受到廣泛關(guān)注。大量研究顯示腫瘤的發(fā)生為多基因參與和多階段協(xié)同作用的結(jié)果,而基因芯片作為一種能大規(guī)模、高通量檢測(cè)生物遺傳信息的技術(shù),能檢測(cè)和分析不同組織的差異表達(dá)基因。因此本研究利用公共基因芯片數(shù)據(jù)庫(kù)(GEO)中的三陰性乳腺癌與非三陰性乳腺癌的基因芯片數(shù)據(jù),對(duì)三陰性乳腺癌的相關(guān)基因進(jìn)行挖掘及生物信息學(xué)分析。
從美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)的公共基因芯片數(shù)據(jù)庫(kù)(GEO)[2,3]下載編號(hào)GSE76275基因芯片數(shù)據(jù),該芯片數(shù)據(jù)包含了198個(gè)三陰性乳腺癌樣本數(shù)據(jù)(GSE76124),67個(gè)非三陰性乳腺癌樣本數(shù)據(jù)(GSE7674),并均由GPL570實(shí)驗(yàn)平臺(tái)(Affymetrix公司的HG-U133-Plus-2芯片)進(jìn)行分析。
1.2.1 數(shù)據(jù)處理及差異基因分析 利用R統(tǒng)計(jì)軟件對(duì)原始數(shù)據(jù)進(jìn)行分析和處理。用RMA算法預(yù)處理樣本,后使用limma軟件包對(duì)三陰性乳腺癌及非三陰性乳腺癌基因芯片表達(dá)譜數(shù)據(jù)進(jìn)行分析和處理,獲得兩者的差異表達(dá)基因。
1.2.2 GO功能富集分析及KEGG通路富集分析 應(yīng)用DAVID在線數(shù)據(jù)庫(kù)[3]中的GO功能及KEGG通路富集分析模塊對(duì)篩選出的差異表達(dá)基因進(jìn)行分析。其中GO功能分析包括細(xì)胞成分(cellular component,CC)、生物過(guò)程(biological process,BP)和分子功能(molecular function,MF)分析。
1.2.3 構(gòu)建差異表達(dá)基因的蛋白-蛋白相互作用網(wǎng)絡(luò)(PPI) 應(yīng)用STRING在線數(shù)據(jù)庫(kù)[4]對(duì)差異表達(dá)基因進(jìn)行PPI分析。
1.2.4 Kaplan-Meier生存分析 應(yīng)用Kaplan-Meier繪圖儀生物信息學(xué)分析平臺(tái)對(duì)部分差異基因進(jìn)行生存分析。
根據(jù)設(shè)定的參數(shù)(差異表達(dá)倍數(shù)>1.0,P<0.05),用R軟件對(duì)兩組樣本進(jìn)行分析處理后,共發(fā)掘出298個(gè)差異表達(dá)基因,其中上調(diào)差異基因121個(gè),下調(diào)差異基因177個(gè)(熱圖見(jiàn)圖1,其中綠色為低表達(dá)基因,紅色為高表達(dá)基因;火山圖見(jiàn)圖2,其中虛線上方紅點(diǎn)為上調(diào)基因,下方紅點(diǎn)為下調(diào)基因)。
綠色:基因低表達(dá);紅色:基因高表達(dá)
圖2 差異表達(dá)基因火山圖Figure 2 Volcano plot of the differentially expressed genes
通過(guò)DAVID在線數(shù)據(jù)庫(kù)分析后,DEGs參與的主要生物過(guò)程有:有絲分裂、細(xì)胞增殖、正向調(diào)控細(xì)胞增殖、負(fù)向調(diào)控血小板源性生長(zhǎng)因子受體信號(hào)通路、樹(shù)突發(fā)育、腎臟發(fā)育;細(xì)胞成分有:細(xì)胞外隙、細(xì)胞外基質(zhì)外來(lái)體、刷狀緣膜、細(xì)胞外基質(zhì);分子功能有:鈣離子結(jié)合、蛋白質(zhì)同源二聚作用、受體結(jié)合、RNA聚合酶Ⅱ核心啟動(dòng)子序列特異性DNA結(jié)合(見(jiàn)表1)。
通過(guò)DAVID在線數(shù)據(jù)庫(kù)分析,DEGs的信號(hào)通路主要集中在PPAR信號(hào)通路,富集基因數(shù)5,P=0.011 477。
表1 差異表達(dá)基因的GO功能分析,包括生物過(guò)程,細(xì)胞成分,分子功能Table 1 Gene ontology(GO) function analysis of differentially expressed genes involved in biological process, cellular component and molecular function
將差異表達(dá)基因上傳至STRING在線數(shù)據(jù)庫(kù)分析它們之間的相互作用,將結(jié)果導(dǎo)入Cytoscape,總共發(fā)現(xiàn)400組蛋白存在作用關(guān)系(見(jiàn)圖3),運(yùn)用MCODE插件得出三陰性與非三陰性乳腺癌相關(guān)差異表達(dá)基因編碼的蛋白質(zhì)之間的相互作用主要集中在21個(gè)蛋白,FOXM1、RAD51AP1、CDCA2、EZH2、NDC80、PRC1、PTTG1、ASPM、TTK、ANLN、BUB1B、CDC20、TPX2、CEP55、MELK、NCAPD2、DLGAP5、NUF2、MCM10、FAM64A、SKA1,均為上調(diào)基因所編碼(見(jiàn)圖4),而其他基因所編碼的蛋白質(zhì)之間相互作用較分散。
通過(guò)既往研究,將編碼中心節(jié)點(diǎn)蛋白基因中NCAPD2、NUF2、SKA1、NDC80四個(gè)與乳腺癌研究較少的基因上傳至Kaplan-Meier繪圖儀生物信息學(xué)分析平臺(tái),結(jié)果顯示這些基因的高表達(dá)與乳腺癌患者的不利總體存活相關(guān)(見(jiàn)圖5)。
本研究從GEO數(shù)據(jù)庫(kù)里獲取三陰性及非三陰性乳腺癌的基因表達(dá)譜芯片數(shù)據(jù),經(jīng)過(guò)R語(yǔ)言處理數(shù)據(jù),并結(jié)合DAVID、STRING、Kaplan-Meier等生物信息學(xué)方法對(duì)二者的差異表達(dá)基因進(jìn)行分析,最后得到FOXM1、RAD51AP1、CDCA2、EZH2、NDC80、PRC1、PTTG1、ASPM、TTK、ANLN、BUB1B、CDC20、TPX2、CEP55、MELK、NCAPD2、DLGAP5、NUF2、MCM10、FAM64A、SKA1等核心基因,這些基因均為表達(dá)上調(diào)基因,主要參與正向調(diào)控細(xì)胞增殖,細(xì)胞增殖,有絲分裂,RNA聚合酶Ⅱ核心啟動(dòng)子序列特異性DNA結(jié)合,蛋白質(zhì)同源二聚作用,樹(shù)突發(fā)育調(diào)控及鈣離子結(jié)合等生物功能。通過(guò)既往研究顯示:FOXM1與三陰性乳腺癌細(xì)胞的增殖和侵襲性有關(guān)[5];EZHZ與三陰性乳腺癌細(xì)胞的遷移、侵襲性有關(guān)[6];FAM64A與BIRC5,CENPA被認(rèn)為與三陰性乳腺癌的預(yù)后有關(guān)[7];MELK[8,9]、ASPM[10]、TTK[11,12]被認(rèn)為可作為三陰性乳腺癌治療靶點(diǎn),且TTK考慮與三陰性乳腺癌的生存具有相關(guān)性[13];PRC1與FGF18,BCL2,MMP9及SERF1A可聯(lián)合使用以評(píng)估乳腺癌預(yù)后[14];PTTG1能促進(jìn)乳腺癌細(xì)胞生長(zhǎng)[15]或可作為浸潤(rùn)性導(dǎo)管癌增殖指標(biāo)[16],亦考慮與乳腺腫瘤分級(jí)[17]及乳腺癌內(nèi)分泌治療耐藥[18]相關(guān)。ANLN[19]、TPX2[20]、CEP55[21]與乳腺癌細(xì)胞的增殖、遷移相關(guān),且ANLN亦與患者的生存、預(yù)后相關(guān)[22,23],TPX2與乳腺癌轉(zhuǎn)移相關(guān)[24];RAD51AP1考慮參與乳腺癌的形成[25];BUB1B被認(rèn)為可應(yīng)用于前哨淋巴結(jié)活檢[26];CDC20與乳腺癌[27]、口腔鱗癌[28]及胃癌[29]等的預(yù)后相關(guān),且可能與人體包括乳腺癌在內(nèi)的多種腫瘤分期有關(guān)[30];CDCA2[31]可能參與腫瘤形成,DLGAP5與CDK1、MELK、NUSAP1及RRM2一起被認(rèn)為與接受他莫昔芬治療的雌激素受體陽(yáng)性患者的預(yù)后有關(guān)[32];MCM10被認(rèn)為是乳腺癌干細(xì)胞的特異基因[33];NCAPD2、NUF2、SKA1、NDC80等與乳腺腫瘤研究較少,但其高表達(dá)考慮與乳腺癌患者的不利總體存活相關(guān),其中NUF2[34,35]、SKA1[36]、NDC80[37,38]等考慮與胰腺癌、肝癌、前列腺癌、直腸癌等腫瘤的生長(zhǎng)有關(guān),而NCAPD2與腫瘤研究甚少,有相關(guān)研究顯示NCAPD2與帕金森病及小頭畸形相關(guān)。NCAPD2,非SMC縮合蛋白I復(fù)合物亞基2,位于染色體12p13.31,在淋巴結(jié)、骨髓、脂肪等組織中普遍表達(dá),其是參與染色體濃縮的大蛋白質(zhì)復(fù)合物。其在三陰性乳腺癌中的功能角色尚無(wú)明確研究。
圖中黃色為文中所說(shuō)的21個(gè)中心節(jié)點(diǎn)蛋白,藍(lán)色為剩余的蛋白
圖4 蛋白互作網(wǎng)絡(luò)的中心節(jié)點(diǎn)蛋白Figure 4 Central node protein of the protein-protein interaction network
圖5 NCAPD2、NUF2、SKA1、NDC80對(duì)乳腺癌患者的生存分析Figure 5 Effect of NCAPD2,NUF2,SKA1,NDC80 on overall survival of breast cancer patients
綜上所述,在對(duì)本文篩選到的差異基因如NCAPD2等這些分子生物功能及信號(hào)通路的進(jìn)一步研究中,對(duì)三陰性乳腺癌的診治將會(huì)有更多新的發(fā)現(xiàn),雖然其在三陰性乳腺癌中的價(jià)值仍需通過(guò)大量的臨床病例驗(yàn)證和體內(nèi)外實(shí)驗(yàn)研究證實(shí),但本文分析結(jié)果也為進(jìn)一步的實(shí)驗(yàn)研究提供了重要的線索和參考信息。
山西醫(yī)科大學(xué)學(xué)報(bào)2018年12期