謝忠偉 李普民 王進(jìn)
乳腺癌是女性發(fā)病率較高的惡性腫瘤之一,病因尚未完全清楚?,F(xiàn)在已知的乳腺癌易感基因有BRCA1和BRCA2等[1]。microRNA(miRNA)是一類內(nèi)源性的約22 nt的RNA,通過結(jié)合在基因的3’UTR抑制基因的表達(dá),大量癌癥研究表明,miRNA在癌癥發(fā)生過程中起到重要作用[2]。與傳統(tǒng)的針對(duì)單個(gè)基因的研究模式不同,系統(tǒng)生物學(xué)的方法試圖考慮到生物體內(nèi)多個(gè)基因之間的交互作用,避免以偏概全的局限性,從而揭示生物系統(tǒng)背后復(fù)雜的機(jī)制。本研究對(duì)人乳腺上皮細(xì)胞(HMEC)和乳腺癌細(xì)胞(MCF7)采用了RNA-seq技術(shù)篩選出差異表達(dá)的miRNA和基因,結(jié)合miRNA對(duì)基因的靶向關(guān)系,構(gòu)建差異miRNA與基因的調(diào)控關(guān)系,進(jìn)而分析差異表達(dá)基因參與的信號(hào)通路,從系統(tǒng)層面上了解乳腺癌細(xì)胞中的基因調(diào)控機(jī)制。
HMEC和MCF7購(gòu)買于ATCC平臺(tái),細(xì)胞按照ATCC要求進(jìn)行培養(yǎng),用Trizol方法提取細(xì)胞中的總RNA。
測(cè)序文庫(kù)的構(gòu)建使用的是NEB產(chǎn)品(E7645S),由北京百邁客生物科技有限公司測(cè)序。
去除測(cè)序數(shù)據(jù)中包含接頭序列、質(zhì)量值低于20及長(zhǎng)度大于30、低于18的序列。利用miRDeep2(https://github.com/rajewsky-lab/mirdeep2)軟件獲得成熟miRNA的表達(dá)情況,將變化倍數(shù)大于2的miRNA作為差異表達(dá)miRNA。成熟的miRNA數(shù)據(jù)下載于miRBase21(http://www.mirbase.org/)。
去除測(cè)序數(shù)據(jù)中包含接頭序列、質(zhì)量值低于20及長(zhǎng)度低于30的序列。利用TopHat軟件(https://ccb.jhu.edu/software/tophat/manual.shtml)將clean reads比對(duì)到參考基因組上,再用cufflink套件(http://cole-trapnell-lab.github.io/cufflinks/)進(jìn)行差異分析,將變化倍數(shù)大于2且P值小于0.01的基因作為差異表達(dá)基因。參考基因組序列信息及基因注釋文件均下載于Ensembl數(shù)據(jù)庫(kù)(ftp://ftp.ensembl.org/pub/)的hg38最新版本。
差異表達(dá)miRNA的靶基因預(yù)測(cè)使用Tarbase[3]。從預(yù)測(cè)結(jié)果中提取在HMEC和MCF7中差異表達(dá)且與miRNA表達(dá)變化負(fù)相關(guān)的基因。Hub基因取Top10高度值的節(jié)點(diǎn)。
使用R包c(diǎn)lusterProfiler(https://github.com/GuangchuangYu/clusterProfiler)對(duì)差異miRNA調(diào)控的基因進(jìn)行通路富集分析,設(shè)定P<0.01。
MCF7相比HMEC共發(fā)現(xiàn)456個(gè)差異表達(dá)miRNA,其中上調(diào)表達(dá)217,下調(diào)表達(dá)239。
MCF7相比HMEC共發(fā)現(xiàn)4 566個(gè)差異表達(dá)基因,其中上調(diào)表達(dá)2 710,下調(diào)表達(dá)1 856。
結(jié)合差異表達(dá)miRNA的靶基因信息,獲得表達(dá)變化呈負(fù)相關(guān)的348個(gè)miRNA和2 223個(gè)基因,共16 554條調(diào)控關(guān)系,構(gòu)成miRNA對(duì)靶基因的調(diào)控網(wǎng)絡(luò),網(wǎng)絡(luò)度分布示于圖1A,接近scale-free網(wǎng)絡(luò)。圖1B是hub節(jié)點(diǎn)構(gòu)成的子網(wǎng)絡(luò),hsa-miR-19a-3p與hsa-miR-30c-5p等hub miRNA在乳腺癌細(xì)胞中主要是通過靶向POU2F和CBX5等hub基因起作用。
2 223個(gè)被差異miRNA調(diào)控的基因共富集到64條通路上,最顯著的前5條通路分別是PI3K-Akt信號(hào)通路、人乳頭狀瘤病毒感染、細(xì)胞質(zhì)基質(zhì)粘連、癌癥蛋白聚糖和MAPK信號(hào)通路。
圖1 差異miRNA與靶基因的調(diào)控關(guān)系分析
乳腺癌作為女性發(fā)病率較高的惡性腫瘤之一,全球乳腺癌發(fā)病率自20世紀(jì)70年代末開始就一直呈現(xiàn)上升趨勢(shì),但是目前病因尚未完全清楚。大量研究發(fā)現(xiàn),miRNA作為重要的轉(zhuǎn)錄后調(diào)控因子,在癌癥的發(fā)生過程中起到重要的作用。系統(tǒng)生物學(xué)從生物系統(tǒng)的角度揭示復(fù)雜的機(jī)制,利用系統(tǒng)生物學(xué)的方法分析基因和miRNA在癌細(xì)胞中的轉(zhuǎn)錄活動(dòng),有助于分析癌癥的發(fā)病機(jī)制。
本研究對(duì)HMEC和MCF7采用了RNA-seq技術(shù)篩選出差異表達(dá)的456個(gè)miRNA和4 566個(gè)基因,文獻(xiàn)中被報(bào)導(dǎo)過的易感基因BRCA1與BRCA2[1]均顯著上調(diào),與乳腺癌密切相關(guān)的miR-221/222[4]也發(fā)生顯著變化。篩選出表達(dá)變化呈負(fù)相關(guān)的348個(gè)miRNA和2 223個(gè)基因,得到在細(xì)胞中發(fā)揮重要作用的hub基因和hub miRNA。此外還構(gòu)建了共16 554條調(diào)控關(guān)系,構(gòu)成miRNA對(duì)靶基因的調(diào)控網(wǎng)絡(luò),網(wǎng)絡(luò)度分布接近scale-free網(wǎng)絡(luò)。通過觀察hub節(jié)點(diǎn)構(gòu)成的子網(wǎng)絡(luò),發(fā)現(xiàn)hsa-miR-19a-3p與hsa-miR-30c-5p等hub miRNA在乳腺癌細(xì)胞中主要是通過靶向POU2F和CBX5等hub基因起作用。2 223個(gè)被差異miRNA調(diào)控的基因共富集到64條通路上,最顯著的前5條通路分別是PI3K-Akt信號(hào)通路、人乳頭狀瘤病毒感染、細(xì)胞質(zhì)基質(zhì)粘連、癌癥蛋白聚糖和MAPK信號(hào)通路。其中,眾多研究表明PI3K-Akt通路與腫瘤的耐藥和轉(zhuǎn)移密切相關(guān)[5];細(xì)胞基質(zhì)粘連在細(xì)胞遷移、細(xì)胞增殖、細(xì)胞分化、細(xì)胞表達(dá)的調(diào)控以及細(xì)胞生存方面發(fā)揮了不可或缺的作用[6];蛋白聚糖成為癌癥治療的靶標(biāo)和標(biāo)記物[7]。hub基因中CDK6參與其中PI3k-Akt、p53等15條通路,有研究表明,CDK6一般在癌細(xì)胞中下調(diào)表達(dá),是癌癥與疾病生成的重要標(biāo)記物,并且被廣泛用來作為藥物作用靶點(diǎn)[8]。
綜上所述,hsa-miR-19a-3p與hsa-miR-30c-5p等hub miRNA靶向CBX5和POU2F等hub基因與乳腺癌的生成密切相關(guān);PI3K-Akt與細(xì)胞基因粘連等通路在乳腺癌的基因調(diào)控機(jī)制中起著重要作用。