戴嘉婧 韓馨樂 鐘福波 林哲廣 江淑琪 韋偉 方征宇
乳腺癌是女性患病率最高的惡性腫瘤,也是女性患癌死亡的主要原因[1-2],其分子亞型之一的三陰性乳腺癌(triple negative breast cancer,TNBC)因免疫組化特征缺乏雌激素受體(ER)、孕激素受體(PR)及表皮生長因子受體2(HER2)而缺少靶向治療[3]。有臨床研究發(fā)現(xiàn),不同年齡段TNBC術(shù)后病人的臨床病理特征相近,而年齡越小,預(yù)后越差[4]。目前尋找可靠的生物標(biāo)記物來識別TNBC是藥物研發(fā)領(lǐng)域的首要難點。近年來很多非編碼RNA標(biāo)記物,如miRNA、lncRNA、circRNA都隨著測序技術(shù)得以發(fā)現(xiàn)。本研究利用生物信息學(xué)方法對從北京大學(xué)深圳醫(yī)院甲狀腺與乳腺外科收集到的1例TNBC病人手術(shù)樣本測序結(jié)果的circRNA表達譜進行分析,篩選TNBC癌組織與癌旁組織中差異表達的circRNA,并預(yù)測circRNA下游可能的miRNA及靶基因,為尋找circRNA在TNBC中的調(diào)控途徑及分子靶點的探究提供參考。
收集到1例在北京大學(xué)深圳醫(yī)院甲狀腺與乳腺外科接受手術(shù)治療的TNBC病人手術(shù)樣本,分析TNBC與癌旁組織轉(zhuǎn)錄組測序結(jié)果差異表達的circRNA。
1. TNBC與癌旁組織差異表達circRNA的篩選 :設(shè)定篩選條件為癌組織相對癌旁組織表達量變化≥5倍且P<0.05,得到差異表達的circRNA。
2.差異表達circRNA可能結(jié)合的miRNA及靶基因預(yù)測:分別選取在差異基因中表達上調(diào)或表達下調(diào)最顯著的circRNA即 |logFC| 排在前5共10個circRNA。通過RegRNA2.0 網(wǎng)站(http://regrna2.mbc.nctu.edu.tw/)預(yù)測這10個circRNA可能結(jié)合的miRNA。再通過三個生物信息學(xué)網(wǎng)站miRDB(http://mirdb.org/)、TargetScan(http://www.targetscan.org/mamm_31/)及RNAInter(http://www.rna-society.org/raid/search.html)預(yù)測每個miRNA的靶基因(mRNA)[5-8]。設(shè)定篩選條件為三個網(wǎng)站預(yù)測得分大于80分的靶基因。
3.下游靶基因的功能分析:通過在線生物信息注釋數(shù)據(jù)庫DAVID(Database for Annotation,Visualization and Integrated Discovery)[9],對所得靶基因進行基因本體(GO)和京都基因與基因組百科全書(KEEG)分析。P<0.05為差異有統(tǒng)計學(xué)意義。
4. 靶基因蛋白相互作用(PPI)網(wǎng)絡(luò)分析及TNBC關(guān)鍵基因篩選:應(yīng)用STRING在線工具分析預(yù)測出的靶基因PPI網(wǎng)絡(luò),將數(shù)據(jù)輸出并導(dǎo)入Cytoscape軟件,通過MCODE插件篩選關(guān)鍵基因。MCODE的標(biāo)準(zhǔn)設(shè)置:度值截止=2,節(jié)點得分截止值=0.2,K核心值=2。以MCODE≥2者作為TNBC關(guān)鍵基因。
5.關(guān)鍵基因表達與病人預(yù)后的關(guān)系分析:利用Kaplan-Meier Plotter在線數(shù)據(jù)庫(https://kmplot.com/)[10],在breast cancer里選取包含255例TNBC病人的數(shù)據(jù)庫。輸入關(guān)鍵基因,分析關(guān)鍵基因表達水平與TNBC病人的預(yù)后關(guān)系。
1. TNBC組織與正常組織中差異基因表達的circRNA見表1。 共篩選出6 547個差異表達的circRNA,其中在TNBC中表達上調(diào)2 311個、表達下調(diào)4 326個。選取其中變化最顯著的10個circRNA進行后續(xù)分析。
2.差異表達circRNA結(jié)合的miRNA及靶基因:通過RegRNA 2.0 網(wǎng)站預(yù)測上述顯著差異表達的circRNA結(jié)合的miRNA共12個,其中表達上調(diào)circRNA結(jié)合的miRNA共8個、表達下調(diào)circRNA可能結(jié)合的miRNA共4個。通過生物學(xué)信息網(wǎng)預(yù)測得到的得分≥ 80分的下游靶基因共1 161個。
3.靶基因GO分析及KEGG分析見表2。DAVID在線數(shù)據(jù)庫分析上述1 161個靶基因,進行GO及KEGG分析。這些基因主要參與的生物學(xué)過程包括RNA聚合酶Ⅱ啟動子的轉(zhuǎn)錄負調(diào)控、染色質(zhì)的共價修飾、RNA聚合酶Ⅱ啟動子的轉(zhuǎn)錄、轉(zhuǎn)錄調(diào)控、DNA模板、神經(jīng)系統(tǒng)的發(fā)育;相關(guān)分子功能包括蛋白結(jié)合、轉(zhuǎn)錄因子活性,序列特異性DNA結(jié)合、組蛋白乙酰轉(zhuǎn)移酶活性調(diào)節(jié)、轉(zhuǎn)錄激活因子活性,RNA聚合酶Ⅱ啟動子近端區(qū)域序列的特異性結(jié)合、beta-catenin結(jié)合;參與細胞成分包括細胞質(zhì)、細胞核、電壓門控鉀離子通道復(fù)合物、核質(zhì)、突觸后致密區(qū)。靶基因信號通路主要富集在細胞內(nèi)吞、縮宮素信號通路、Wnt信號通路及cGMP-PKG信號通路。
4.靶基因PPI網(wǎng)絡(luò)分析及關(guān)鍵基因篩選結(jié)果:將上述1 161個靶基因輸入STRING在線工具,再將所得數(shù)據(jù)導(dǎo)入Cytoscape軟件,得到PPI網(wǎng)絡(luò),并通過MCODE插件篩選出5個關(guān)鍵基因 (UBOX5、UBE2G2、DTX3L、FZR1、RNF19A)。
5.關(guān)鍵基因表達與TNBC病人預(yù)后的關(guān)系:將關(guān)鍵基因UBOX5、UBE2G2、DTX3L、FZR1、RNF19A輸入Kaplan-Meier Plotter在線數(shù)據(jù)庫,發(fā)現(xiàn)UBE2G2與DTX3L低表達與TNBC病人總生存率不良有關(guān)。UBE2G2對應(yīng)的上游miRNA和circRNA分別是hsa_miR-93-3p、hsa_circ_0001361;DTX3L對應(yīng)的上游miRNA和circRNA分別是hsa_miR-2115-5p、hsa_circ_0002874。
circRNA是目前非編碼RNA家族里最晚發(fā)現(xiàn)的一類RNA分子,其因特殊的首尾相連成閉合環(huán)狀結(jié)構(gòu)而得名。與其他小分子RNA相比,circRNA能耐受核酸外切酶的消化而具有更好的穩(wěn)定性[11]。有研究發(fā)現(xiàn),circRNA的異常表達與實體瘤的發(fā)生發(fā)展有密切關(guān)系[12]。在腫瘤的發(fā)生發(fā)展中,circRNA主要是通過影響腫瘤細胞的增殖、侵襲和遷移以及上皮間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT)等過程來調(diào)控腫瘤細胞的生物學(xué)行為[13]。有研究報道,circANKS1B通過海綿作用結(jié)合miR-148a和miR-152-3p從而增加轉(zhuǎn)錄因子USF1的表達并上調(diào)TGF-1的表達,從而激活TGF-1/Smad信號通路來促進EMT在TNBC的發(fā)生[14]。
本研究通過分析1例TNBC與癌旁組織的circRNA測序數(shù)據(jù),得到表達差異最為明顯的10個circRNA。其中,有研究報道,hsa_circ_0000907可以通過circMYO9B/miR-4316/FOXP4軸促進乳腺癌細胞的增殖,侵襲及遷移等,且已被實驗證實與正常乳腺上皮細胞相比,hsa_circ_0000907在乳腺癌細胞中表達水平增高[15]。此外,有研究證實,hsa_circ_0001361在膀胱癌中高表達,且通過circFNDC3B/miR-491-5p/MMP9軸促進膀胱癌細胞的侵襲和遷移[16];同樣在神經(jīng)母細胞瘤中,有學(xué)者發(fā)現(xiàn)hsa_circ_0001361可能與下游靶基因NOTCH2、SERPINH1、及LAMC1有結(jié)合作用,進而促進神經(jīng)母細胞瘤EMT的發(fā)生[17];hsa_circ_0001361還有可能與肝癌的發(fā)生發(fā)展相關(guān),一項以納入5例肝細胞癌病人的癌組織測序研究發(fā)現(xiàn),其親本基因FNDC3B可能為hsa_circ_0001361促進肝癌細胞發(fā)生發(fā)展的靶基因[18]。而hsa_circ_0001361在TNBC中并無相關(guān)實驗研究。
接下來本研究通過RegRNA 2.0網(wǎng)站分別預(yù)測出10個circRNA潛在調(diào)控的miRNA,進一步通過生物信息學(xué)網(wǎng)聯(lián)合預(yù)測miRNA下游的mRNA并對預(yù)測到1161個mRNA進行GO分析、KEGG分析和PPI網(wǎng)絡(luò)分析,得到了這些mRNA的功能、通路富集情況以及5個關(guān)鍵基因(UBOX5、UBE2G2、DTX3L、FZR1、RNF19A)。有學(xué)者發(fā)現(xiàn),DTX3L通過DTX3L-LIPG-ISG15信號通路促進基底樣TNBC細胞的轉(zhuǎn)移[19];此外,全反式維甲酸在乳腺癌細胞中刺激抗原呈遞反應(yīng)或調(diào)控免疫檢查點抑制劑等過程是通過調(diào)控下游DTX3L的表達而發(fā)揮調(diào)節(jié)作用[20]。通過Kaplan-Meier Plotter在線數(shù)據(jù)庫分析關(guān)鍵基因,結(jié)果顯示,UBE2G2和DTX3L的低表達與TNBC病人的總生存率低下有關(guān)。
本研究得出差異表達的circRNA可能通過circRNA/miRNA/mRNA調(diào)控模式影響TNBC細胞發(fā)生發(fā)展,hsa_circ_0001361/hsa_miR-93-3p/ UBE2G2軸和hsa_circ_0002874/hsa_miR-2115-5p/DTX3L軸可能在TNBC中發(fā)揮作用,其作用和功能有待深入的實驗去證實。circRNA較其他小分子RNA不易被核酸外切酶消化的生物學(xué)特性使得血液或者唾液中分泌的circRNA作為生物學(xué)標(biāo)志物被檢測,對診斷疾病包括TNBC在內(nèi)具有重要意義[21]。
總之,本研究通過生物信息學(xué)方法對TNBC與癌旁組織中差異表達的circRNA的進行分析,預(yù)測circRNA下游的miRNA及mRNA,得到TNBC中兩條可能的調(diào)控途徑,為TNBC的診斷和治療探索新的靶點。