馬天明,王佳文,孟令峰,王笑男,劉曉東,張 威,賴世聰,張耀光
(1.北京醫(yī)院泌尿外科,國家老年醫(yī)學中心,中國醫(yī)學科學院老年醫(yī)學研究院,北京 100730;2.中國醫(yī)學科學院北京協(xié)和醫(yī)學院研究生院,北京 100730;3.北京醫(yī)院放射科,國家老年醫(yī)學中心,中國醫(yī)學科學院老年醫(yī)學研究院,北京 100730)
N6-甲基腺嘌呤(N6-methyladenosine,m6A)修飾是廣泛存在于信使RNA和長鏈非編碼RNA(long non-coding RNA, lncRNA)中的一種最豐富、可逆及動態(tài)的甲基化修飾方式,影響RNA的剪接、翻譯、代謝及穩(wěn)定性等,在包括腎透明細胞癌(clear cell renal cell carcinoma, ccRCC)在內的多種惡性腫瘤的發(fā)生進展中發(fā)揮重要作用[1-2]。同時lncRNA能夠積極調控多種生物過程,包括腫瘤發(fā)生、增值和免疫,已成為多種惡性腫瘤新的調控因子和預后標記物[3]。目前,單獨基于m6A或lncRNA構建的預測模型為ccRCC預后的預測提供了新的幫助[4-5],然而,尚無系統(tǒng)研究評估m(xù)6A對特定lncRNA的修飾與ccRCC患者預后的關系。本研究旨在通過癌癥基因組圖譜數(shù)據(jù)庫(the cancer genome atlas,TCGA)中的數(shù)據(jù),篩選與ccRCC患者預后相關的m6A相關的lncRNA,并建立預后模型,為ccRCC患者預后的預測及個體化治療提供新的參考依據(jù)。
1.1 數(shù)據(jù)資料數(shù)據(jù)來自美國癌癥研究所的TCGA計劃。我們從中獲取537例ccRCC患者的539例腫瘤組織和72例正常組織的轉錄組數(shù)據(jù)及相應的臨床數(shù)據(jù),包括總生存期(overall survival, OS)、年齡、性別、病理分級、臨床分期及T分期。其中白種人466例,黑種人56例,黃種人8例,不確定7例。之后以人基因組數(shù)據(jù)庫為參考,提取ccRCC的lncRNA數(shù)據(jù),再提取23種m6A相關基因(METTL3、METTL14、METTL16、WTAPI、VIRMA、ZC3H13、RBM15、RBM15B、YTHDC1、YTHDC2、YTHDF1、YTHDF2、YTHDF3、HNRNPC、FMR1、LRPPRC、HNRNPA2B1、IGFBP1、IGFBP2、IGFBP3、RBMX、FTO、ALKBH5)的表達量。從基因表達匯編(gene expression omnibus,GEO)數(shù)據(jù)庫中獲取GSE53757芯片數(shù)據(jù)(包括72例ccRCC組織及72例正常組織)。本文的所有下載數(shù)據(jù)截至2021年6月1日。
1.2 篩選m6A相關的預后lncRNA使用Pearson相關性分析構建m6A基因和lncRNA的共表達網(wǎng)絡,篩選出m6A相關的lncRNA,參照既往文獻報道,將篩選條件設置為|相關系數(shù)|>0.7,P<0.001[6-7]。對獲得的lncRNA行單因素Cox回歸分析,確定與OS相關的lncRNA(P<0.01)。
1.4 列線圖的建立與驗證采用多因素Cox回歸分析得到的獨立預后因素及重要臨床病理參數(shù)聯(lián)合構建列線圖預測ccRCC患者3年和5年OS的概率,以Bootstrap法進行內部驗證,計算C指數(shù)并繪制校準圖評估列線圖的效能。
1.5 預后模型與臨床特征及腫瘤浸潤免疫細胞的相關性分析通過Student’-t檢驗比較預后模型與不同臨床病理學特征之間的關系。使用CIBERSORT算法計算ccRCC腫瘤樣本中22種腫瘤浸潤免疫細胞的比例并分析其與風險模型的相關性。
2.1 確定m6A相關lncRNA并構建預后模型經m6A基因與lncRNA共表達分析,共篩選出239個m6A相關的lncRNA,通過單因素Cox回歸分析,進一步篩選出44個具有預后作用的lncRNA。我們將530例配有完整生存資料的患者隨機分為訓練集(266例)和驗證集(264例)。LASSO回歸最終確定12個關鍵lncRNA構建預后模,其中AC011752.1、AC018752.1、AL158071.5、COL18A1-AS1和RPL34-AS1為保護因子(HR<1),其余為風險因子(圖1A)。計算RS=(1.083 ×AC009948.2表達量)+(-0.303 × AC011752.1表達量)+(-0.148×AC018752.1 表達量)+(-0.002 × AF117829.1 表達量)+(0.616 × AL008718.3 表達量)+(0.334 × AL133243.3 表達量)+(-0.943× AL158071.5 表達量)+(-0.363 × COL18A1-AS1 表達量)+(0.141 × DLEU2 表達量)+(0.217 × LINC00115 表達量)+(-2.645 × RPL34-AS1 表達量)+(0.053 × SNHG10 表達量)。Wilcoxon秩和檢驗顯示12個lncRNA在腫瘤和正常組織中的表達水平差異顯著(圖1B),GSE53757芯片數(shù)據(jù)驗證了其中4個lncRNA的差異表達(圖1C)。
A:單因素Cox回歸分析模型中l(wèi)ncRNA的風險特征; B: TCGA數(shù)據(jù)庫中ccRCC及正常組織12個lncRNA的差異表達;C: GSE53757數(shù)據(jù)集中ccRCC及正常組織4個lncRNA的差異表達。*P<0.05,**P<0.001。圖1 篩選確定12個lncRNA
2.2 評估預后模型的有效性和穩(wěn)定性根據(jù)RS的中位值,將訓練集的患者分為高風險組(133例)和低風險組(133例),Kaplan-Meier生存曲線顯示高風險組患者的OS顯著低于低風險組(P<0.001),時間依賴性ROC曲線顯示模型的1、3、5年的AUC分別為0.735、0.760、0.779,提示模型具有較高的預測效能(圖2A、B)。 我們將驗證集患者同樣依據(jù)RS的中位值分為高風險組(109例)和低風險組(155例),與訓練集結果一致,兩組間的OS有明顯差異(P<0.001), 1、3、5年的AUC分別為0.718、0.684、0.753(圖2C、D)。這揭示了預后模型良好的有效性及穩(wěn)定性。
2.3 預后模型對OS的獨立預后作用對訓練集的單因素和多因素Cox回歸分析提示年齡、病理分級、臨床分期及RS是影響患者OS的獨立預測因素(圖3A、B)。在驗證集中同樣證實了預測模型的獨立預后作用(圖3C、D)。
2.4 列線圖的繪制與驗證基于RS及臨床病理參數(shù)(年齡、性別、病理分級、及臨床分期)構建列線圖,預測3年與5年OS的概率(圖4A),訓練集與驗證集的C指數(shù)分別為0.80(95%CI: 0.76~0.84)和0.76(95%CI: 0.70~0.82),校準圖中的校準預測曲線與理想曲線擬合良好(圖4B~E)。以上結果表明該列線圖的預測效能較佳。
A:列線圖預測ccRCC患者3年及5年總生存的概率;B、C:訓練集中3、5年的校準圖;D、E:驗證集中3、5年的校準圖。圖4 列線圖的構建與驗證
2.5 預后模型的臨床應用通過探究RS與腫瘤浸潤免疫細胞比例的相關性:我們構建了ccRCC樣本中22種免疫細胞譜,通過差異分析確定10種免疫細胞亞群比例在高、低風險組中存在顯著差異,分別是CD8 T細胞,調節(jié)T細胞,T細胞濾泡輔助因子,單核細胞,M0、M1、M2型巨噬細胞,靜息樹突狀細胞,活化樹突狀細胞,靜息肥大細胞(圖5),結果提示模型可能對腫瘤免疫微環(huán)境產生影響。 我們進一步發(fā)現(xiàn)RS在高病理分級(圖6C)、高臨床分期(圖6D)及T3~T4期(圖6E)組別中顯著提高(P<0.001),而在不同年齡(圖6A)與性別(圖6B)間的分布差異無統(tǒng)計學意義(P>0.05)。
A:年齡;B: 性別;C: 病理分級;D: 臨床分期;E:T分期。
由于ccRCC的復雜性和異質性,目前對其預后的預測仍存在不足。近來已有大量研究報道m(xù)6A甲基化調控因子和lncRNA在多種癌癥中發(fā)揮重要作用[1-3]。本研究通過對ccRCC中m6A相關的lncRNA進行分析,篩選出12個影響ccRCC患者預后的關鍵lncRNA,建立預后模型并證實了模型良好的預測效能。
既往研究表明m6A甲基化修飾可調控特定的lncRNA,從而參與腫瘤的發(fā)生和進展。在肝細胞癌中,METTL3介導的m6A修飾可以穩(wěn)定LINC00958的轉錄,進而提高肝癌衍生生長因子水平,促進腫瘤生長[8]。lncRNA GAS5-AS1中的ALKBH5修飾可提高GAS5的穩(wěn)定性來抑制宮頸癌的侵襲和轉移[9]。在ccRCC中,lncRNA XIST經METTL3和RBM15/15B修飾后,可通過miR-302c/SDC1軸調控腫瘤發(fā)生[10]。上述研究表明,m6A甲基化修飾lncRNA參與包括ccRCC在內的多種惡性腫瘤的發(fā)生、生長、侵襲和轉移,提示我們應該關注lncRNA和m6A修飾的相互作用和功能,以探索腫瘤的潛在預后標記物或治療靶點。
預后模型共納入12個m6A相關的lncRNA。lncRNA DLEU2的高表達與胰腺癌、腎癌、宮頸癌、肺癌等多種惡性腫瘤的不良預后密切相關[11]。CHEN等[12]研究發(fā)現(xiàn)DLEU2可能通過下調miR-30a-5p,從而導致ccRCC患者的不良預后。FENG等[13]研究發(fā)現(xiàn)lncRNA LINC00115可通過PI3K/AKT/mTOR通路作用于miR-489-3p,進而促進結直腸癌的進展。在膠質母細胞瘤中,轉化生長因子-β 可使LINC00115的表達上調,促進膠質母細胞瘤的發(fā)生[14]。ZHU等[15]研究發(fā)現(xiàn)lncRNA SNHG10可通過吸附miR-182-5p激活Wnt/β-Catenin信號通路,促進骨肉瘤的增殖和侵襲。YUAN等[16]發(fā)現(xiàn)SNHG10在胃癌組織中的表達上調,敲除SNHG10后通過分隔miR-495-3p而降低β-連環(huán)蛋白1(CTNNB1)的表達,故SNHG10可通過作用miR-495-3p/CTNNB1軸促進胃癌的增殖和遷移。然而,LINC00115和SNHG10在ccRCC中的確切作用目前仍無相關報道,且預后模型中其余的9個lncRNAs是否參與腫瘤的進程仍不明確,但在本研究中,我們發(fā)現(xiàn)這些m6A相關的lncRNA與ccRCC預后顯著相關,可作為ccRCC研究的新方向。
研究表明m6A修飾lncRNA參與調節(jié)腫瘤微環(huán)境,影響免疫細胞的激活及抗腫瘤免疫應答的發(fā)生,造成免疫逃逸、促成腫瘤發(fā)展[17],因此,我們比較了腫瘤免疫細胞在ccRCC高低風險組之間的浸潤情況。結果表明CD8 T細胞,調節(jié)T細胞,T細胞濾泡輔助因子,單核細胞, M0、M1、M2型巨噬細胞,靜息樹突狀細胞,活化樹突狀細胞和靜息肥大細胞在兩組間的浸潤水平存在顯著性統(tǒng)計學差異,而這些腫瘤浸潤免疫細胞與腫瘤發(fā)生、進展和轉移密切相關[18],提示我們所構建的預后模型可以從一定程度上反應ccRCC免疫浸潤情況,并可為免疫治療提供參考。
本研究在RS的計算中考慮了模型中每個lncRNA的影響,風險系數(shù)的正負代表了影響的方向,最終的RS值即為根據(jù)模型計算出來的每個患者的風險評分,根據(jù)評分的高低,可以評估預測ccRCC患者的OS及臨床病理特征情況。但本研究仍存在一些局限性。 首先研究對象為數(shù)據(jù)庫中的患者,雖然樣本量大,但群體多樣性較差。其次由于缺乏ccRCC樣本和大量獨立的臨床數(shù)據(jù),我們無法對預后模型進行獨立的驗證。最后,模型中的lncRNA在ccRCC發(fā)生發(fā)展中的確切機制仍需進一步研究。
綜上所述,本研究基于12個m6A相關的lncRNA構建的預后模型可幫助預測ccRCC患者的預后,為探索ccRCC發(fā)生的分子機制及制定個體化治療策略提供了新的見解。