王兆強(qiáng),裴露萍,李 剛
(山東省濱州市博興縣人民醫(yī)院,山東博興縣 256500)
環(huán)狀RNA(circular RNAs,circRNA)是一類長的非編碼RNA分子,它們形成共價(jià)閉合的環(huán)狀結(jié)構(gòu),沒有5′-3′極性和polyA尾,不受RNA外切酶影響,表達(dá)穩(wěn)定[1]。近幾年研究表明,哺乳動(dòng)物細(xì)胞中存在成千上萬種內(nèi)源性circRNA,它們通過充當(dāng)miRNA海綿與microRNA(miRNA)相結(jié)合,阻斷miRNA對(duì)下游靶基因的降解作用,從而使靶基因表達(dá)水平升高,被稱為競爭性內(nèi)源RNA(competing endogenous RNAs,ceRNA) 機(jī)制[2,3]。越來越多的研究證實(shí),體內(nèi)circRNA表達(dá)豐度的改變可以通過ceRNA機(jī)制影響下游靶基因的表達(dá),從而導(dǎo)致細(xì)胞生理功能失調(diào),在腫瘤的發(fā)生、發(fā)展和轉(zhuǎn)移中發(fā)揮重要作用[2]。
骨肉瘤(osteosarcoma,OS)是最常見的原發(fā)性惡性骨腫瘤,多發(fā)于四肢,而很少見于脊柱,在青春期和60歲以上的人群中有2個(gè)發(fā)病高峰[4,5]。盡管多藥化療和手術(shù)切除原發(fā)性腫瘤等醫(yī)學(xué)技術(shù)已經(jīng)改善,但由于骨肉瘤早期轉(zhuǎn)移的特征,其生存率仍然很低[6]。因此,尋找有效的用于骨肉瘤早期診斷的分子標(biāo)志物及優(yōu)化個(gè)體化治療是臨床亟待解決的問題。越來越多的研究表明,由非編碼RNA介導(dǎo)的關(guān)鍵信號(hào)通路的分子變化對(duì)骨肉瘤的發(fā)生發(fā)展機(jī)制(包括細(xì)胞生長、侵襲和轉(zhuǎn)移)至關(guān)重要[7]。因此,本實(shí)驗(yàn)通過GEO數(shù)據(jù)庫篩選出骨肉瘤中差異表達(dá)的circRNAs,miRNAs和 mRNAs,再構(gòu)建 circRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò),對(duì)其進(jìn)行功能和通路富集分析,最后篩選出與骨肉瘤患者預(yù)后相關(guān)的mRNAs。有望為骨肉瘤的早期診斷開發(fā)新的標(biāo)志物以及為骨肉瘤的治療開發(fā)新的治療靶點(diǎn)。
通過GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/) 下載 GSE140256,GSE28425,GSE36001 和GSE28424數(shù)據(jù)集中基因表達(dá)譜數(shù)據(jù)。在GSE140256數(shù)據(jù)集中,對(duì)3例骨肉瘤組織和3例正常骨組織進(jìn)行circRNA數(shù)據(jù)分析;在GSE28425數(shù)據(jù)集中,對(duì)19種骨肉瘤細(xì)胞系和4例正常骨組織進(jìn)行miRNA數(shù)據(jù)分析;在GSE36001和GSE28424數(shù)據(jù)集中,對(duì)19種骨肉瘤細(xì)胞系和8例正常骨組織進(jìn)行mRNA數(shù)據(jù)分析。
通過edgeR的R/Bioconductor包,設(shè)置|log2FC|的臨界值,進(jìn)行差異表達(dá)分析,以篩選骨肉瘤和正常組織之間差異表達(dá)的circRNA,mRNA和miRNA。|log2FC|>1(foldchange,變化倍數(shù)),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
通過 StarBase數(shù)據(jù)庫(http://starbase.sysu.edu.cn/)預(yù)測(cè)circRNA-miRNA間結(jié)合情況。通過TargetScan(http://www.targetscan.org/)和StarBase(http://starbase.sysu.edu.cn/)數(shù)據(jù)庫預(yù)測(cè)miRNA的mRNA靶標(biāo)?;赾ircRNA/miRNA和miRNA/mRNA的相互作用,利用Cy?toscape(3.5.1版)構(gòu)建circRNA-miRNA-mRNA網(wǎng)絡(luò)。
利用 Cytoscape(3.5.1版)中的 BiNGO和ClueGO插件進(jìn)行功能和通路富集分析,GO(gene ontology) 和 KEGG (kyoto encyclopedia of genes and genomes)富集分析評(píng)估網(wǎng)絡(luò)中過表達(dá)mRNAs的潛在生物學(xué)功能和相關(guān)信號(hào)通路(P<0.05)。
下載GEO中GSE 39055數(shù)據(jù)集基因表達(dá)譜數(shù)據(jù)和37例骨肉瘤患者的生存時(shí)間及生存狀態(tài)。ROC(receiver operating characteristic)分析用于確定曲線下的面積。在每個(gè)mRNA表達(dá)譜的ROC曲線上都可以清楚地觀察到(0,1)點(diǎn),該點(diǎn)可以同時(shí)最大化靈敏度和特異性。因此,作者將1 512.3、27 975.15、10 931.25、42.3、552.55表達(dá)量作為 NUDT11、FSCN1、MYO10、SDC4、UBE2V2生存分析的最佳截?cái)嘀怠Mㄟ^Kaplan-Meier生存分析評(píng)估這6種mRNAs與患者預(yù)后之間的關(guān)系。
使用SPSS統(tǒng)計(jì)學(xué)軟件進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,使用非配對(duì)T檢驗(yàn)分析骨肉瘤組織(細(xì)胞)與正常骨組織之間circRNA的差異表達(dá)。使用SPSS軟件生存函數(shù)中的Cox回歸模型進(jìn)行單因素分析。運(yùn)用Kaplan-Meier方法進(jìn)行生存分析,并使用log-rank檢驗(yàn)分析mRNA表達(dá)與骨肉瘤患者預(yù)后之間的相關(guān)性。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。運(yùn)用Graphpad Prism 7.0軟件作圖。
在GSE140256數(shù)據(jù)集中分析了骨肉瘤和正常骨組織之間circRNA的差異表達(dá)。定義變化倍數(shù)>2且P<0.05的circRNA為表達(dá)差異具有統(tǒng)計(jì)學(xué)意義,篩選出6個(gè)表達(dá)上調(diào)的circRNAs(hsa_circ_0000006、hsa_circ_0046264、 hsa_circ_0078767、 hsa_circ_0094088、hsa_circ_0096041和 hsa_circ_0049271)?;谏鲜鯿ircRNAs構(gòu)建表達(dá)熱圖(圖1a),circRNA差異表達(dá)見圖1b~g。
圖1 基于GEO數(shù)據(jù)集(GSE140256)的基因表達(dá)分析 1a:在3個(gè)OS組織中與3個(gè)正常骨組織相比,6個(gè)上調(diào)的cir?cRNAs的熱圖。每一列代表一個(gè)樣品,每一行代表一個(gè)circRNA。從藍(lán)色(低)到紅色(高)的色標(biāo)指示歸一化表達(dá)的水平 1b~1g:基于GSE140256數(shù)據(jù)集的相應(yīng)circRNAs差異表達(dá)圖
在GSE28425、GSE36001和GSE28424數(shù)據(jù)集中分析了骨肉瘤和正常骨組織之間miRNA和mRNA的差異表達(dá)。定義變化倍數(shù)>2且P<0.05的miRNA和mRNA具有差異表達(dá),篩選出124個(gè)表達(dá)下調(diào)的miRNA;GSE 36001和GSE 28424數(shù)據(jù)集分別篩選出604和687個(gè)表達(dá)上調(diào)的mRNA,做Venn圖篩選出504個(gè)共同表達(dá)上調(diào)的mRNAs(圖2a)。
圖2 circRNA-miRNA-mRNA網(wǎng)絡(luò)的富集分析 2a:基于2個(gè)GEO數(shù)據(jù)集(GSE36001,GSE28424),與正常骨組織相比,OS中上調(diào)的mRNAs的Venn分析 2b:OS中的circRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò)。節(jié)點(diǎn)顏色代表不同的RNA類型 2c:circRNA-miRNA-mRNA網(wǎng)絡(luò)中過表達(dá)mRNAs富集的前20 GO分析生物學(xué)過程。球的大小代表富集的基因個(gè)數(shù),顏色代表P值 2d:cir?cRNA-miRNA-mRNA網(wǎng)絡(luò)中過表達(dá)mRNAs富集的KEGG通路生物學(xué)過程?!?”代表P<0.05;“**”代表P<0.01
為了探索circRNA的功能,作者基于ceRNA預(yù)測(cè)了circRNA-miRNA-mRNA網(wǎng)絡(luò)內(nèi)的潛在相互作用。通過StarBase在線工具,預(yù)測(cè)出能夠與hsa_circ_0000006、 hsa_circ_0046264、 hsa_circ_0078 767結(jié)合的的下調(diào)miRNA分別有4、2、4個(gè)(表1)。通過TargetScan和StarBase在線工具,預(yù)測(cè)出52個(gè)能夠與上述10個(gè)miRNAs結(jié)合的上調(diào)mRNAs(表1)。根據(jù)circRNA,miRNA和mRNA之間的相互作用,使用Cytoscape軟件繪制包含3個(gè)circRNAs,10個(gè)miRNAs和52個(gè)mRNAs的ceRNA網(wǎng)絡(luò)圖(圖2b)。
表1 骨肉瘤circRNA相關(guān)ceRNA網(wǎng)絡(luò)中的circRNAs、miRNAs和mRNAs
功能分析表明,上述ceRNA網(wǎng)絡(luò)中52個(gè)上調(diào)的mRNAs富集20個(gè)GO生物學(xué)過程類別和8個(gè)KEGG類別(P<0.05)。與基因表達(dá)失調(diào)有關(guān)的GO生物學(xué)過程是正向調(diào)控細(xì)胞周期(GO:0048522),正向調(diào)控生物學(xué)過程(GO:0048518)和正向調(diào)控細(xì)胞增殖(GO:0008284)(圖2c)。根據(jù)KEGG分析,p53信號(hào)通路和病毒致癌通路與癌癥發(fā)生有關(guān)(圖2d)。
通過Kaplan-Meier生存分析評(píng)估了這52種mRNA與骨肉瘤患者預(yù)后之間的關(guān)系,結(jié)果表明,NUDT11、FSCN1、MYO10、SDC4、UBE2V2 過表達(dá)患者的總體生存時(shí)間顯著短于低表達(dá)患者(圖3)?;贑ox回歸模型的單因素分析,發(fā)現(xiàn)NUDT11、FSCN1、MYO10、SDC4、UBE2V2過表達(dá)均是預(yù)后不良的危險(xiǎn)因素(表2)。
表2 骨肉瘤中mRNAs的單因素Cox分析
圖3 基于GEO數(shù)據(jù)集(GSE39055)分析circRNA-miRNA-mRNA網(wǎng)絡(luò)中mRNAs表達(dá)與OS患者預(yù)后之間的關(guān)系 3a~3e:FSCN1、MMYO10、NUDT11、SDC4、UBE2V2過表達(dá)患者的總生存時(shí)間均顯著短于低表達(dá)患者(P<0.01,P<0.05,P<0.01,P<0.05,P<0.01)
circRNA是一類新型的非編碼RNA,它們可能在基因表達(dá)和信號(hào)通路中起重要作用,并參與多種疾病的發(fā)展。目前研究表明OS中存在特定的circRNA表達(dá)失調(diào),其高表達(dá)或低表達(dá)是OS發(fā)生、發(fā)展和轉(zhuǎn)移過程中的重要分子事件,但這些circRNAs的作用機(jī)制尚不清楚。差異表達(dá)的circRNAs可能作為疾病早期診斷的標(biāo)志物,也可作為新的潛在治療靶標(biāo)。
在本研究中,基于GEO數(shù)據(jù)庫,與正常骨組織相比,OS中有 6個(gè) circRNAs(hsa_circ_0000006,hsa_circ_0046264,hsa_circ_0078767,hsa_circ_0094 088,hsa_circ_0096041 和 hsa_circ_0049271)和 504個(gè)mRNAs表達(dá)上調(diào)。據(jù)報(bào)道,hsa_circ_0000006通過吸附miR-578上調(diào)VEGF表達(dá)促進(jìn)骨肉瘤細(xì)胞增殖和遷移[8],與本篩選結(jié)果一致。有研究發(fā)現(xiàn)hsa_circ_0046264通過靶向hsa-miR-1245上調(diào)BRCA2的表達(dá)抑制肺癌發(fā)生發(fā)展[9],與本篩選結(jié)果不一致,可能與其所在腫瘤微環(huán)境有關(guān),有待后續(xù)試驗(yàn)進(jìn)一步驗(yàn)證。其余4個(gè)circRNAs尚未有文獻(xiàn)報(bào)道。
circRNA被證實(shí)具有調(diào)節(jié)mRNA穩(wěn)定性和蛋白質(zhì)翻譯的能力[2]。作者推測(cè)OS中過表達(dá)的mRNAs可能受 circRNAs調(diào)控。 RPISeq(http://pridb.gdcb.ia?state.edu/RPISeq/)和LncTar(http://www.cuilab.cn/lnctar)預(yù)測(cè)發(fā)現(xiàn)沒有與6個(gè)circRNAs直接結(jié)合的mRNAs和蛋白。因此,作者認(rèn)為circRNAs可能間接作用于靶基因。據(jù)報(bào)道,miRNA與其靶基因的3'UTR區(qū)結(jié)合,降低了mRNA的穩(wěn)定性或抑制蛋白質(zhì)翻譯[10]。ceRNA假說認(rèn)為circRNA吸附miRNA,從而降低了其豐度并影響了下游靶基因的表達(dá)[2]。作者通過GEO數(shù)據(jù)庫篩選了在OS中下調(diào)的miRNAs,根據(jù)相互間的結(jié)合位點(diǎn)確定了潛在的circRNA-miR?NA-mRNA相互作用網(wǎng)絡(luò),構(gòu)建了一個(gè)完整的ceR?NA調(diào)控網(wǎng)絡(luò)。近幾年的研究表明,circRNA基于ceRNA機(jī)制可能在多種類型的癌癥中發(fā)揮作用[11~17]。在本研究中,hsa_circ_0000006、hsa_circ_0046264、hsa_circ_0078767結(jié)合OS中下調(diào)miRNAs分別有4、2、4個(gè)。有研究發(fā)現(xiàn),miR-665通過直接靶向HMGB1并激活Wnt/β-catenin途徑來抑制視網(wǎng)膜母細(xì)胞瘤的致癌性[18];miR-140-3p的高表達(dá)可抑制乳腺癌的增殖和遷移[19];miR-671-5p通過阻斷細(xì)胞周期來抑制骨肉瘤細(xì)胞增殖[20];hsa-miR-486-5p通過TGF-β/SMAD2信號(hào)通路抑制非小細(xì)胞肺癌的遷移和侵襲[21],與本篩選結(jié)果一致。作者預(yù)測(cè)發(fā)現(xiàn),能夠與10個(gè)miRNAs結(jié)合的mRNAs中,NUDT11、FSCN1、MYO10、SDC4、UBE2V2 過表達(dá)患者的總體生存時(shí)間明顯短于低表達(dá)患者?;贑ox回歸模型的單因素分析,發(fā)現(xiàn)NUDT11、FSCN1、MYO10、SDC4、UBE2V2過表達(dá)均是預(yù)后不良的危險(xiǎn)因素。FSCN1促進(jìn)骨肉瘤細(xì)胞的增殖和轉(zhuǎn)移,其高表達(dá)與患者預(yù)后不良有關(guān)[22];SDC4的高表達(dá)與遠(yuǎn)處轉(zhuǎn)移的發(fā)生和腫瘤的大小有關(guān),其高表達(dá)患者的總體生存期明顯縮短[23],上述研究與本分析結(jié)果一致。此外,功能分析表明,這些上調(diào)的mRNAs可能與腫瘤的發(fā)生發(fā)展有關(guān),目前對(duì)包括OS在內(nèi)的多種腫瘤均有報(bào)道,證實(shí)SOX4、FSCN1、SKP2可促進(jìn)OS 細(xì)胞的增殖[22、24、25]。
綜上所述,作者確定了3個(gè)circRNA-miRNA-mRNA信號(hào)軸,circRNA相關(guān)的ceRNA網(wǎng)絡(luò)可能為OS發(fā)生發(fā)展的分子機(jī)制提供有價(jià)值的數(shù)據(jù)支持。由于此分析僅基于生物信息學(xué)方法,因此還需要進(jìn)一步的實(shí)驗(yàn)研究,以驗(yàn)證這3條信號(hào)軸在OS的發(fā)生發(fā)展中發(fā)揮重要的調(diào)控作用。