張泉波 李玉蓮 陳綺 張艷艷 陳國榮
前列腺癌是男性最常見的泌尿系統(tǒng)惡性腫瘤之一,全世界每年新發(fā)病例約130萬例[1-3]。盡管前列腺癌的治療策略已有了明顯進步,患者的存活率得到了顯著提高[4],但患者的總體生存期仍未得到提升,5年總存活率只有28%左右[5-6]。目前,患者的預后評估方法主要依靠臨床TNM分期和常規(guī)組織病理學檢查[7-8],然而這并不能準確評價前列腺癌患者的預后情況,因此迫切需要新的早期診斷標志物以及治療靶點來協(xié)助改善前列腺癌患者的預后。miRNA是一類短鏈非編碼RNA,目前科學家已經(jīng)發(fā)現(xiàn)了1 400多個人類miRNA,這些miRNA可以通過抑制翻譯或促進mRNA降解從而調(diào)節(jié)基因的表達[9-10]。眾所周知,miRNA可以通過調(diào)節(jié)靶基因的表達來影響多種生物途徑,如細胞增殖、細胞分化、血管生成、腫瘤侵襲遷移等[11-12]。Wei等[13]研究發(fā)現(xiàn)miR-296可以通過減少高遷移率族蛋白A1(HMGA1)基因的表達來抑制前列腺癌細胞的增殖與侵襲。Gan等[14]研究證明miR-16-5p能夠調(diào)節(jié)相關通路導致細胞停滯在G0/G1期,從而提高前列腺癌細胞對放射治療的靈敏度。這些研究均表明,許多miRNA或許可以作為前列腺癌的診斷標志物或治療靶點。雖然已有研究證實了個別miRNA與前列腺癌預后之間的關系[15-17],但目前仍沒有研究能夠系統(tǒng)地闡明前列腺癌中的差異表達miRNA與預后之間的關聯(lián)。因此,本研究利用癌癥基因組圖譜數(shù)據(jù)庫(the cancer genome atlas,TCGA)中前列腺癌患者的miRNA和mRNA數(shù)據(jù)及臨床信息,構建由miRNA組成的預后風險評分模型,為后續(xù)研究提供理論基礎。
1.1 基因數(shù)據(jù)的提取 從TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)中下載了499例前列腺癌組織樣本和52例正常組織樣本的miRNA和mRNA數(shù)據(jù),并確立篩選標準:(1)錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.05;(2)表達差異>2 倍以上[log2差異倍數(shù)(fold change,F(xiàn)C)>1,F(xiàn)C>2]。最終篩選出131個差異表達miRNA及524個差異mRNA,利用R語言繪制了火山圖和熱圖。
1.2 Kaplan-Meier預后分析 分別利用R語言的survival包以及基因表達譜動態(tài)分析(gene expression profiling interactive analysis,GEPIA)(http://gepia2.cancerpku.cn)數(shù)據(jù)庫對前列腺癌患者的差異表達miRNA及mRNA進行預后分析。
1.3 構建miRNA-mRNA調(diào)控網(wǎng)絡 利用TargetScan(http://www.targetscan.org)、miRDB(http://mirdb.org/miRDB)和miRanda(http://www.microrna.org)數(shù)據(jù)庫對納入模型的miRNA進行靶基因預測。使用 Venny 2.1(http://bioinfogp.cnb.csic.es/tools/venny/index.html)來進一步確認這些靶基因的生物信息學可信度。使用Cytoscape軟件繪制miRNA-mRNA調(diào)控機制網(wǎng)絡。
1.4 基因功能富集分析 基因本體論(gene ontology,GO)的功能注釋由生物學過程(biological process,BP)、細胞組分(cellular component,CC)和分子功能(molecular function,MF)3部分組成,通過京都基因和基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)數(shù)據(jù)庫分析相關信號通路。
1.5 統(tǒng)計學處理 差異miRNA及mRNA表達比較采用兩獨立樣本t檢驗;不同臨床病理分期的基因表達水平比較采用單因素方差分析;基因表達與患者預后的關系分析采用Kaplan-Meier生存曲線,兩組生存率比較采用log-rank檢驗。P<0.05為差異有統(tǒng)計學意義。
2.1 前列腺癌差異表達miRNA篩選及預后鑒定 按照預先設定的篩選標準對所獲取的miRNA數(shù)據(jù)進行差異分析并進一步進行Kaplan-Meier生存分析探究預后相關的miRNA,結果提示miR-19a-3p、miR-144-3p、miR-223-5p和miR-483-3p與患者總生存期(overall survival,OS)密切相關,miR-144-3p、miR-223-5p、miR-483-3p高表達組OS均高于低表達組(均P<0.05),而miR-19a-3p高表達組OS低于低表達組(P<0.05)[圖1(見插頁)和圖2]。
圖1 差異表達miRNA(a:前列腺癌組織與正常組織之間的差異miRNA基因熱圖;b:差異miRNA火山圖,紅點代表上調(diào)的miRNA,綠點代表下調(diào)的miRNA)
圖2 差異表達miRNA與患者總生存期的關系
2.2 miRNA表達量與前列腺癌患者的臨床病理特征的關系 4個預后相關miRNA中,miR-483-3p表達量與T分期有關,在不同T分期患者中呈現(xiàn)為T4>T2>T3(P<0.05);miR-19a-3p表達量與患者年齡有關,>60歲以上患者miR-19a-3p表達量明顯高于≤60歲患者(P<0.05);miR-223-5p表達量與Gleason評分有關,在7分時表達量最高,而≤6分時表達量最低(P<0.05)(圖3)。
圖3 miRNA表達量與前列腺癌患者的臨床病理特征的關系(*P<0.05,**P<0.01)
2.3 預測相關靶基因 利用TargetScan、miRDB和mi-Randa數(shù)據(jù)庫預測4個miRNA作用的靶基因,結果顯示 miR-19a-3p、miR-144-3p、miR-223-5p 和 miR-483-3p潛在靶基因分別有713、521、420和49個(圖4)。隨后結合TCGA數(shù)據(jù)庫中mRNA差異分析結果,發(fā)現(xiàn)在前列腺癌中上述4個miRNA的潛在靶基因有41個(圖5,見插頁)。既往已有文獻報道,miRNA可以通過結合mRNA導致基因沉默[18],因此最終確定4個miR-NA的潛在靶基因有33個并構建miRNA-mRNA調(diào)控網(wǎng)絡顯示其關系(圖6)。
圖4 差異miRNA的靶基因預測
圖5 差異表達mRNA(a:前列腺癌組織與正常組織之間差異mRNA基因熱圖;b:差異mRNA火山圖,紅點代表上調(diào)的基因,綠點代表下調(diào)的基因;c:41個差異mRNA的表達量)
圖6 miRNA與靶基因調(diào)控網(wǎng)絡(深灰色三角形代表上調(diào)的miRNA,淺色三角形代表向下調(diào)節(jié)的miRNA;淺灰色橢圓代表下調(diào)的mRNA,而深灰色橢圓代表上調(diào)的mRNA)
2.4 差異表達基因的功能富集分析 對這33個潛在靶基因進行GO功能富集分析,表明其BP主要與肌肉細胞分化、發(fā)育以及上皮細胞發(fā)育有關;CC主要與肌原纖維、纖維的收縮和細胞-基質(zhì)黏附連接相關;MF主要與肌動蛋白結合和細胞黏附分子結合相關。此外,KEGG通路分析結果提示靶基因主要涉及到叉頭轉(zhuǎn)錄因子(forkhead box sub-group O,FoxO)和磷脂酰肌醇 3激酶/蛋白激酶B(phosphatidylinositol 3 kinase/AKT serine/threonine kinase 1,PI3K/Akt)信號通路(圖7,見插頁)。
圖7 差異表達基因的功能富集分析[a-b:生物學過程(BP);c-d:細胞組分(CC);e-f:分子功能(MF);g-h:京都基因和基因組百科全書(KEGG)通路分析]
2.5 差異表達基因與患者預后的關系 Kaplan-Meier生存分析顯示,前列腺癌患者心肌肌動蛋白α1(actin alpha cardiac muscle 1,ACTC1)、CD177、絲切蛋白 2(cofilin 2,CFL2)、肌蛋白修飾調(diào)節(jié)因子2(muscleblind like splicing regulator 2,MBNL2)、含鈀蛋白(palladin,PALLD)、磷酸二酯酶 5A(phosphodies terase 5A,PDE5A)、聯(lián)絲蛋白(synemin,SYNM)或突觸極蛋白 2(synaptopodin 2,SYNPO2)高表達組患者無病生存期均長于低表達組患者(均P<0.05)(圖 8)。
圖8 差異表達基因與患者預后的關系(ACTC1為心肌肌動蛋白α1;CFL2為絲切蛋白2;MBNL2為肌蛋白修飾調(diào)節(jié)因子2;PALLD為含鈀蛋白;PDE5A為磷酸二酯酶5A;SYNM為聯(lián)絲蛋白;SYNPO2為突觸極蛋白2)
隨著對前列腺癌研究的日益深入,患者的預后得到了極大的改善。然而,由于對前列腺癌的篩查指標仍有爭議,因此,進一步探索前列腺癌的相關機制,挖掘有效的基因靶點對前列腺癌的診斷治療及預后評估具有重要的臨床意義[19-20]。
越來越多的研究表明miRNA可以建立復雜的基因調(diào)控網(wǎng)絡,并參與多種生物途徑,從而影響癌癥的發(fā)病機制[21-22]。在腫瘤發(fā)生、發(fā)展中,miRNA是一把雙刃劍,腫瘤類型、臨床階段、遺傳背景,甚至治療方案都能影響到它在腫瘤中的作用[23]。
本研究所構建的預后模型共納入4個miRNA,分別為 miR-19a-3p、miR-144-3p、miR-223-5p 和 miR-483-3p。miR-19a-3p已被證實在乳腺癌、肝細胞癌及膠質(zhì)瘤等[24-25]多種癌癥中呈現(xiàn)為低表達狀態(tài),而其在前列癌細胞系中的表達量卻大不相同,如miR-19a-3p在原發(fā)性前列腺癌細胞22RV1中表達量上升,但在骨轉(zhuǎn)移前列腺癌細胞系(PC-3、C4-2B和VCAP)中明顯減少?,F(xiàn)有研究表明,miR-19a-3p可以通過調(diào)節(jié)TGF-β通路的下游SMAD家族成員2(SMAD2)和SMAD家族成員4(SMAD4),從而影響前列腺癌細胞的遷移和侵襲[26]。此外,miR-144-3p被證實參與了多種惡性腫瘤的發(fā)生、發(fā)展,相關研究顯示它可以作為腫瘤抑制因子,通過下調(diào)中心體蛋白55(CEP55)從而誘導前列腺癌細胞的凋亡,并通過調(diào)節(jié)細胞周期來抑制細胞增殖[27]。miR-483-3p與多種惡性腫瘤的發(fā)生、發(fā)展具有密切的關聯(lián)。研究表明,miR-483-3p可以通過與p53凋亡上調(diào)基因(PUMA)mRNA 3'UTR相互作用,從而抑制抗凋亡因子B細胞淋巴瘤因子3(BCL3)和B細胞淋巴瘤因子XL(BCLXL)來發(fā)揮抗凋亡作用[28]。此外,miR-223-5p與乳腺癌、胃癌和肝細胞肝癌等多種腫瘤細胞的侵襲和遷移相關。有研究表明,miR-223-5p在非小細胞肺癌組織中呈低表達趨勢,研究人員在體內(nèi)外實驗中上調(diào)了miR-223-5p的表達量后,發(fā)現(xiàn)E2F轉(zhuǎn)錄因子8(E2F8)作為miR-223-5p的功能靶點,出現(xiàn)了表達量的下降,并抑制非小細胞肺癌細胞的增殖、遷移和侵襲[29]。雖然已有研究證明miR-483-3p、miR-223-5p與腫瘤之間的相關性,但是暫時沒有研究能證明這兩種miRNA與前列腺癌患者預后的關聯(lián)。
為了探索 miR-19a-3p、miR-144-3p、miR-223-5p和miR-483-3p的潛在靶基因,本研究通過數(shù)據(jù)庫及基因功能富集分析,最終證實了ACTC1、CD177、CFL2、MBNL2、PALLD、PDE5A、SYNM、SYNPO2 均與前列腺癌患者預后相關。ACTC1作為肌動蛋白家族中的一員,早期研究發(fā)現(xiàn)其在心力衰竭、高血壓等心血管疾病中起到重要作用;而在后續(xù)的研究中,發(fā)現(xiàn)其在腫瘤的發(fā)生、發(fā)展中也發(fā)揮著關鍵作用;現(xiàn)有研究發(fā)現(xiàn),前列腺癌雄激素剝奪治療后患者中ACTC1基因表達量上調(diào)[30]。CD177作為一種糖磷脂素基醇-細胞外膜結合蛋白,屬于Ly-6家族[31]。研究表明CD177的下調(diào)與β-連環(huán)蛋白(β-catenin)信號傳導的增加有關,它能夠作為上皮細胞增殖的調(diào)節(jié)因子參與前列腺癌的進展[32]。CFL2基因是肌動蛋白結合蛋白家族的重要成員,主要在哺乳動物的骨骼肌和心肌中表達,對維持肌肉正常的生長發(fā)育和功能起著非常重要的作用。研究發(fā)現(xiàn)CFL2基因可通過miR-1299/CFL2、miR-369-3p/CFL2等多種途徑影響前列腺腫瘤的進展[33-34]。研究發(fā)現(xiàn)PDE5A的抑制劑可以通過放大有絲分裂阻滯信號,協(xié)同長春新堿在去勢抵抗性前列腺癌中起到治療作用[35]。SYNPO2作為一種肌動蛋白結合蛋白和侵襲性癌癥生物標志物,在細胞體內(nèi)誘導形成復雜的應激纖維網(wǎng)絡。已有研究表明SYNPO2可以通過誘導周圍肌動蛋白束的組裝從而促進PC-3前列腺癌細胞的遷移[36]。雖然已有研究證明了MBNL2、PALLD、SYNM與腫瘤之間的相關性,但是暫時未能證明這兩種miRNA與前列腺癌患者預后的關聯(lián)[37-39]。
綜上所述,本研究對miRNA數(shù)據(jù)進行了綜合分析,為探索差異表達miRNA在前列腺癌中的作用提供了有效的統(tǒng)計方法,然而本研究也存在一定的局限性。首先,本研究的數(shù)據(jù)僅來源于TCGA數(shù)據(jù)庫,應該結合更多數(shù)據(jù)庫來增加樣本量;其次,所篩選到的 mRNA表達與生存情況未在蛋白質(zhì)層面進行分析,未對有研究價值的調(diào)控關系進行功能實驗驗證,這些將在后續(xù)研究中進一步完善。