潘輝,姚文霞,梁敏,周新科
510700 廣州,廣州醫(yī)科大學(xué)附屬第五醫(yī)院 前沿醫(yī)學(xué)交叉研究中心(潘輝、姚文霞),腫瘤科(梁敏、周新科)
胃癌每年估計(jì)有超過100 萬新發(fā)病例,是全球第五大惡性腫瘤。近期發(fā)布的2016 年中國惡性腫瘤流行情況分析顯示,胃癌居我國惡性腫瘤發(fā)病第三位[1]。由于診斷手段不足,胃癌被診斷時(shí),大部分患者處于晚期,患者治療效果不佳,死亡率較高,全球范圍看,胃癌排在癌癥相關(guān)死亡的第三位[2]。胃腺癌是最常見的胃癌類型,約占所有胃癌的90% ~ 95%。
N6-甲基腺苷(N6-methyladenosine,m6A)是真核細(xì)胞中最豐富的RNA 修飾,在RNA 加工、轉(zhuǎn)運(yùn)和穩(wěn)定性等各種生物過程和mRNA 代謝中起著至關(guān)重要的作用[3-5]。m6A 甲基化修飾調(diào)控因子包括甲基化轉(zhuǎn)移酶、甲基化閱讀蛋白和去甲基化酶,它們分別被稱為寫入器、讀取器和擦除器。此外,m6A 修飾是可逆的RNA 表觀遺傳過程[6]。RNA 結(jié)構(gòu)的改變可以影響各種細(xì)胞過程。因此,m6A 調(diào)控長鏈非編碼RNA 的作用可能對(duì)癌細(xì)胞的增殖和遷移至關(guān)重要[7-8]。
最近的研究表明m6A 修飾調(diào)控腫瘤發(fā)生和腫瘤發(fā)展。例如,受m6A 修飾影響的FEZF1-AS1調(diào)控ITGA11/miR-516b-5p 軸,最終在非小細(xì)胞肺癌中上調(diào)[9]。此外,m6A 甲基轉(zhuǎn)移酶樣3 誘導(dǎo)的lncRNA ABHD11-AS1 在非小細(xì)胞肺癌中表達(dá)上調(diào),其異位表達(dá)與非小細(xì)胞肺癌患者預(yù)后不良密切相關(guān)[10]。近年來,多項(xiàng)生物信息學(xué)研究表明,m6A調(diào)控因子的失調(diào)參與了胃腺癌的發(fā)生[11-13]。了解m6A 調(diào)控的長鏈非編碼RNA(long non-coding RNAs,lncRNAs)在胃腺癌發(fā)生中的機(jī)制可能有助于預(yù)測疾病的預(yù)后。本研究從15 901 個(gè)lncRNAs中篩選出12 個(gè)m6A 相關(guān)lncRNAs 構(gòu)建風(fēng)險(xiǎn)模型,這些lncRNAs 被確定為影響胃腺癌患者預(yù)后的獨(dú)立預(yù)測因子。此外,本研究還探討了風(fēng)險(xiǎn)評(píng)分因子與腫瘤微環(huán)境細(xì)胞浸潤的關(guān)系。最后,構(gòu)建了一個(gè)列線圖用來個(gè)體化預(yù)測胃腺癌患者的總生存期,研究思路如圖1 所示。
圖1 研究思路Figure 1.Study Design
本研究從TCGA(https://cancergenome.nih.gov/)數(shù)據(jù)庫中獲取了胃腺癌患者的RNA 序列轉(zhuǎn)錄組數(shù)據(jù)和相關(guān)臨床信息。為減少研究分析的統(tǒng)計(jì)偏倚,排除了總生存期缺失的部分胃腺癌患者。
基于TCGA 數(shù)據(jù)庫中獲得了lncRNAs 和m6A修飾調(diào)控因子的表達(dá)譜數(shù)據(jù)。根據(jù)以往的研究,從TCGA 中檢索了21 個(gè)m6A 修飾調(diào)控因子的表達(dá)矩陣[14-16],包括甲基化修飾轉(zhuǎn)移酶(METTL3、METTL14、METTL16、VIRMA、RBM15、RBM15B、ZC3H13、WTAP),甲基化修飾識(shí)別蛋白(IGF2BP1、YTHDC1、YTHDC2、YTHDF1、YTHDF2、YTHDF3、HNRNPA2B1、HNRNPC、ELAVL1、FMR1、LRPPRC)和去甲基化酶(ALKBH5、FTO)的表達(dá)數(shù)據(jù)。根據(jù)GENECODE 對(duì)TCGA 數(shù)據(jù)基因類型的定義,挑選出歸屬于lncRNAs 類。經(jīng)過篩選,研究數(shù)據(jù)中入選的lncRNAs 共15 901 個(gè)。使用R 語言的“l(fā)imma”包對(duì)15 901 個(gè)lncRNAs 按腫瘤組織和正常組織分組進(jìn)行差異表達(dá)分析。以logFC 絕對(duì)值的平均值±2 個(gè)標(biāo)準(zhǔn)差為“cutoff”值[mean(|logFC|)±2SD(|logFC|)],P值小于0.05 為閾值劃分表達(dá)量差異是否有統(tǒng)計(jì)學(xué)意義。
結(jié)合數(shù)據(jù)集中胃腺癌患者生存信息,采用單因素Cox 回歸分析,從TCGA 數(shù)據(jù)集中的347 個(gè)與m6A 相關(guān)lncRNAs 中篩選出與預(yù)后相關(guān)的基因67個(gè)(P< 0.05)。為進(jìn)一步確定影響患者的獨(dú)立預(yù)后因素,使用R 包“glmnet”對(duì)67 個(gè)入選lncRNAs 進(jìn)行LASSO Cox 回歸分析。我們發(fā)現(xiàn)TCGA 數(shù)據(jù)集中12 個(gè)m6A 相關(guān)的lncRNAs 與胃腺癌患者的總生存期明顯相關(guān)。采用多因素Cox 回歸分析12 個(gè)m6A相關(guān)的lncRNAs,最終建立起m6A 相關(guān)的lncRNAs風(fēng)險(xiǎn)評(píng)分模型。利用以下公式計(jì)算風(fēng)險(xiǎn)評(píng)分:
riskScores = coef (lncRNA1)×expr (lncRNA1)+ coef (lncRNA2)×expr (lncRNA2) +…+ coef (lncRNAn)×expr (lncRNAn)。
其中coef 表示風(fēng)險(xiǎn)系數(shù),coef (lncRNAn)為與生存相關(guān)的lncRNA 的系數(shù),expr (lncRNAn)為lncRNA 的表達(dá)量。使用“surv_cutpoint”包尋找危險(xiǎn)度評(píng)分的最佳截點(diǎn),將患者分為低危險(xiǎn)度組和高危險(xiǎn)度組。
整理出與腫瘤免疫相關(guān)的基因集,采用m6A相關(guān)lncRNAs 風(fēng)險(xiǎn)評(píng)分模型對(duì)基因進(jìn)行分組。對(duì)379 例胃腺癌腫瘤標(biāo)本中免疫細(xì)胞的富集水平和活性進(jìn)行分析,展示風(fēng)險(xiǎn)評(píng)分與免疫相關(guān)基因的相關(guān)性。接下來使用ESTIMATE 算法計(jì)算胃腺癌的腫瘤純度。通過風(fēng)險(xiǎn)評(píng)分分組,計(jì)算不同分組的“estimate score”,進(jìn)而反應(yīng)出不同分組的腫瘤純度狀況。
根據(jù)12 個(gè)m6A 相關(guān)lncRNAs 的表達(dá)模式,采用PCA 對(duì)整個(gè)基因表達(dá)譜、21 個(gè)m6A 調(diào)控因子、12 個(gè)m6A 相關(guān)lncRNAs 的高維數(shù)據(jù)進(jìn)行有效降維、模型識(shí)別和分組可視化。同時(shí)采用Kaplan-Meier 生存分析來評(píng)估高危組和低危組之間總生存期情況,使用“survMiner”和“survival”R 包繪制生存曲線。
綜合胃腺癌患者的其他臨床特征(性別、年齡、TNM 分期、T 分期、N 分期、M 分期、病理分化程度)進(jìn)行單因素Cox 回歸分析和多因素Cox 回歸分析,以檢驗(yàn)上述因素是否是影響預(yù)后的獨(dú)立因素。
基于獨(dú)立的預(yù)后影響因素建立列線圖,了解個(gè)性化預(yù)測患者1 年、3 年和5 年的生存概率。并檢測生存預(yù)測模型的預(yù)測能力,基于Hosmer-Lemeshow 檢驗(yàn)修正曲線來說明實(shí)際結(jié)果與模型預(yù)測結(jié)果的一致性。
本研究從TCGA 數(shù)據(jù)庫中提取了21 個(gè)m6A調(diào)控因子和15 901 個(gè)lncRNAs 基因的表達(dá)量數(shù)據(jù)。使用“l(fā)imma”包對(duì)lncRNAs 基因的表達(dá)量進(jìn)行差異分析。分析結(jié)果發(fā)現(xiàn)共有344 個(gè)lncRNAs 表達(dá)量下調(diào),414 個(gè)lncRNAs 表達(dá)量上調(diào),如圖2 和圖3 所示。
圖2 腫瘤組織與正常組織lncRNAs 表達(dá)量情況Figure 2.LncRNAs Expressions in Tumor and Normal Tissues
圖3 差異基因火山圖Figure 3. Volcano Plot of Differential Genes
將m6A 調(diào)控因子相關(guān)的lncRNAs 定義為兩者Pearson 相關(guān)系數(shù)大于0.3,且P值小于0.001(|Pearsonr| > 0.3,P< 0.001)。共鑒定出1 250 組m6a 相關(guān)lncRNAs,其中共包含347 個(gè)lncRNAs,使用圖4 中的Sankey 圖對(duì)m6A-lncRNAs 共表達(dá)網(wǎng)絡(luò)進(jìn)行可視化,圖5 展示相關(guān)系數(shù)前50 的m6A-lncRNAs 關(guān)系網(wǎng)絡(luò)。
圖4 21 個(gè)m6A 調(diào)控因子和m6A 相關(guān)lncRNAs 的Sankey 關(guān)系圖Figure 4.Sankey Diagram of the Relationship between m6A Regulators and m6A-Related LncRNAs
圖5 21 個(gè)m6A 調(diào)控因子和m6A 相關(guān)lncRNAs 的關(guān)系系數(shù)圖Figure 5.Relationship between m6A Regulators and m6A-Related LncRNAs
本研究使用單因素Cox 回歸分析,從TCGA訓(xùn)練集中的1 250 組m6A-lncRNAs 中篩選出與患者預(yù)后相關(guān)的lncRNAs。TCGA 數(shù)據(jù)集中67 個(gè)m6A 相關(guān)的lncRNAs 與患者的總生存期顯著相關(guān)(P< 0.05),用森林圖的形式隨機(jī)展示了30 個(gè)lncRNAs 的HR及95%CI(圖6)。
圖6 單因素Cox 回歸分析隨機(jī)展示30 個(gè)m6A 相關(guān)lncRNAs 與患者預(yù)后的關(guān)系Figure 6.Relationship between m6A-Associated LncRNAs and Prognosis by Univariate Cox Regression Analysis
進(jìn)一步采用LASSO Cox 回歸分析方法對(duì)上述67 個(gè)lncRNAs 進(jìn)行選擇。如圖7 和圖8 所示,虛線垂線表示具有最小分段似然偏差的lambda 值。因此,我們選擇12 個(gè)m6A 相關(guān)的lncRNAs(包括AL589743.3、AC007128.2、AC130324.2、AP001107.5、AC090809.1、AC109782.1、LINC01537、ADAMTS9-AS1、AL391095.1、AC084880.3、AC012055.1、AL359704.2)進(jìn)行后續(xù)的多因素分析。
圖7 LASSO 回歸分析挑選出合適的lambda 值Figure 7. Suitable Lambda Values Selected by LASSO Regression Analysis
圖8 LASSO 回歸分析篩選出12 個(gè)lncRNAsFigure 8.12 LncRNAs Screened by LASSO Regression Analysis
接下來,我們使用多因素Cox 危險(xiǎn)比回歸分析證實(shí)12 個(gè)m6A 相關(guān)lncRNAs 是影響胃腺癌患者預(yù)后獨(dú)立的因素。基于12 個(gè)lncRNAs 構(gòu)建風(fēng)險(xiǎn)評(píng)估模型,評(píng)估胃腺癌患者的預(yù)后風(fēng)險(xiǎn),使用ROC 曲線評(píng)價(jià)模型的預(yù)測精確性,模型預(yù)測能力的AUC 值為0.68,能較好地預(yù)測患者的生存狀況,具體如圖9 所示。
圖9 ROC 曲線評(píng)價(jià)模型的預(yù)測精確性,模型預(yù)測能力的AUC 值為0.68Figure 9.Accuracy of the Model Evaluated by ROC Curve with the AUC of 0.68
使用“survminer”包中的“surv_cutpoint”函數(shù)測算預(yù)后風(fēng)險(xiǎn)等級(jí)的截點(diǎn)(cutpoint = 1.2),將胃腺癌患者樣本分為低危風(fēng)險(xiǎn)組和高危風(fēng)險(xiǎn)組,其中低危組患者207 例,高危組患者145 例,如圖10 所示。低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組之間的風(fēng)險(xiǎn)等級(jí)分布,兩個(gè)不同風(fēng)險(xiǎn)組患者的生存狀態(tài)和生存時(shí)間,以及每位患者12 個(gè)lncRNA 的相對(duì)表達(dá)情況均在圖11 中展示。由圖可見,高風(fēng)險(xiǎn)組的風(fēng)險(xiǎn)評(píng)分等級(jí)較高,患者死亡人數(shù)占比較多,以及相關(guān)lncRNAs的表達(dá)量較高。生存分析表明,低危組的總生存期長于高危組(P< 0.001),如圖12。
圖10 顯示風(fēng)險(xiǎn)評(píng)分的分組截點(diǎn),截點(diǎn)值為1.2Figure 10.Distribution of Risk Scores with the Cutpoint Value of 1.2
圖11 不同分組患者的風(fēng)險(xiǎn)等級(jí)、生存狀況及l(fā)ncRNAs 的表達(dá)量Figure 11.Risk Scores, Survival and Expression Levels of LncRNAs in Different Groups
圖12 低風(fēng)險(xiǎn)組患者總生存期明顯優(yōu)于高風(fēng)險(xiǎn)組Figure 12.Overall Survival in the Low-Risk Group Was Significantly Better than That in the High-Risk Group
為進(jìn)一步評(píng)估風(fēng)險(xiǎn)評(píng)估模型對(duì)患者預(yù)后的預(yù)測作用,本研究將患者根據(jù)臨床病理特征分層,如按性別、年齡、分期、腫瘤分化程度劃分亞組,比較各亞組中低危組和高危組患者總生存期情況,結(jié)果顯示低危組總生存期依然優(yōu)于高危組(圖13) 。
圖13 不同亞組中低風(fēng)險(xiǎn)組患者總生存期明顯優(yōu)于高風(fēng)險(xiǎn)組Figure 13.Overall Survival in Low-Risk Groups Were Significantly Better than Those in High-Risk Groups
經(jīng)過初步的驗(yàn)證,多因素Cox 分析構(gòu)建12 個(gè)m6A 相關(guān)lncRNAs 風(fēng)險(xiǎn)評(píng)估模型可以評(píng)估胃腺癌患者的預(yù)后風(fēng)險(xiǎn)。
基于風(fēng)險(xiǎn)評(píng)估模型分類,分別對(duì)全基因表達(dá)譜、所有l(wèi)ncRNAs 基因集、21 個(gè)m6A 調(diào)控因子和12 個(gè)m6A 相關(guān)lncRNA 表達(dá)量進(jìn)行主成分分析以測試低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組之間的差異。圖14 顯示,高風(fēng)險(xiǎn)對(duì)于低風(fēng)險(xiǎn)人群的分布相對(duì)分散。同時(shí),低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組具有不同的分布。通過主成分分析進(jìn)一步驗(yàn)證了12 個(gè)m6A 相關(guān)lncRNA 風(fēng)險(xiǎn)模型可以有效區(qū)分胃腺癌患者分類。
圖14 基于不同風(fēng)險(xiǎn)分組對(duì)全轉(zhuǎn)錄組基因表達(dá)譜(A)、全lncRNAs 基因(B)、m6A 調(diào)控因子(C)和12 個(gè)m6A 相關(guān)lncRNAs(D)進(jìn)行主成分分析Figure 14.Principal Component Analysis was Performed for Transcriptome-Wide Gene Expression Profiles (A), the Whole LncRNAs (B), m6A Modulators (C) and 12 m6A-Related LncRNAs (D) in Different Groups
為了探索m6A 相關(guān)lncRNAs 模型與腫瘤免疫微環(huán)境(tumor immune microenvironment, TIME)免疫細(xì)胞浸潤中相互作用,本研究評(píng)估了不同風(fēng)險(xiǎn)分組中TIME 細(xì)胞浸潤的情況。Charoentong 等[17]2017 年發(fā)表于《Cell Reports》的研究論文中,匯總了28 種免疫細(xì)胞的基因集。本研究根據(jù)此基因集,整理出免疫細(xì)胞的表達(dá)譜數(shù)據(jù),進(jìn)而分析不同風(fēng)險(xiǎn)組免疫細(xì)胞富集情況。如圖15 所示, effector memory CD4 T cell、mast cell、activated CD4 T cell、immature dendritic cell、eosinophil、plasmacytoid dendritic cell、macrophage、activated B cell、T follicular helper cell、type 1 T helper cell、memory B cell、monocyte、CD56dim natural killer cell、 immature B cell、central memory CD8 T cell、activated CD8 t cell、type 17 T helper cell、central memory CD4 T cell 共18 個(gè)免疫細(xì)胞組免疫指標(biāo)表達(dá)水平低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)存在顯著差異。其中在低風(fēng)險(xiǎn)組中,activated CD4 T cell、CD56dim natural killer cell、activated CD8 T cell、type 17 T helper cell 4 種免疫細(xì)胞顯著富集,其余14 個(gè)免疫細(xì)胞組表達(dá)量高風(fēng)險(xiǎn)組顯著富集。
圖15 不同風(fēng)險(xiǎn)組中18 項(xiàng)免疫指標(biāo)的表達(dá)上存在顯著差異Figure 15.Significant Differences in the Expression Levels of 18 Immune Indicators in Different Risk Groups
為了進(jìn)一步確定低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組之間TIME 細(xì)胞浸潤模式是否存在差異,我們使用PCA算法對(duì)28 個(gè)TIME 浸潤細(xì)胞進(jìn)行降維。我們觀察到兩個(gè)獨(dú)立的TIME 細(xì)胞群(圖16),表明胃腺癌中TIME 細(xì)胞浸潤模式的變化可能介導(dǎo)胃腺癌轉(zhuǎn)移、免疫逃逸和對(duì)免疫療法的抵抗。
圖16 對(duì)兩個(gè)相對(duì)獨(dú)立的群體的28 個(gè)TIME 浸潤細(xì)胞的主成分分析顯示不同風(fēng)險(xiǎn)組之間的TIME 免疫細(xì)胞浸潤情況存在差異Figure 16.Principal Component Analysis of TIME Infiltrating Cells in Two Relatively Independent Populations Showed Differences in TIME Cell Infiltration between Different Risk Groups
我們使用估計(jì)算法來評(píng)估胃腺癌微環(huán)境中的免疫和基質(zhì)活性,發(fā)現(xiàn)高風(fēng)險(xiǎn)組中的基質(zhì)活性比低風(fēng)險(xiǎn)組的顯著增高。為了探討關(guān)鍵lncRNAs 與TIME浸潤細(xì)胞之間的關(guān)系,我們將關(guān)鍵分子與TIME 浸潤細(xì)胞進(jìn)行了關(guān)聯(lián)。Spearman 相關(guān)性分析顯示, 12個(gè)lncRNAs 分子與TIME 浸潤細(xì)胞之間存在顯著的相關(guān)性(圖17)。上述結(jié)果揭示,m6A 相關(guān)lncRNA風(fēng)險(xiǎn)模型可以用于評(píng)估TIME。
圖17 12 個(gè)lncRNAs 與每種TIME 浸潤細(xì)胞類型之間的相關(guān)性Figure 17.Correlations between 12 LncRNAs and TIME Infiltrating Cells
本研究進(jìn)行了單因素和多因素Cox 回歸分析,以評(píng)估12 個(gè)m6A 相關(guān)lncRNAs 構(gòu)建的風(fēng)險(xiǎn)評(píng)分模型是否具有影響胃腺癌預(yù)后的獨(dú)立特征。在單因素Cox 回歸分析中,風(fēng)險(xiǎn)評(píng)分的HR和95%CI分別為3 和2.2~4.3(P< 0.001)。在多因素Cox 回歸分析中,HR為3.5,95%CI為2.46~4.99(P< 0.001)(圖18),表明風(fēng)險(xiǎn)評(píng)分模型與患者預(yù)后密切相關(guān)。
圖18 單因素和多因素Cox 回歸分析均顯示出風(fēng)險(xiǎn)評(píng)分模型是影響患者預(yù)后的獨(dú)立因素(P < 0.001)Figure 18.Univariate and Multivariate Cox Regression Analyses Showed That the Risk Scoring Model Was an Independent Factor Affecting the Prognosis of Patients (P < 0.001)
本研究使用一致性指數(shù)和AUC 評(píng)估風(fēng)險(xiǎn)評(píng)分模型的效度和信度,風(fēng)險(xiǎn)等級(jí)預(yù)測1 年、3 年和5 年的AUC 值均高于0.70,表明風(fēng)險(xiǎn)評(píng)分模型對(duì)胃腺癌的預(yù)后預(yù)測結(jié)果的可靠性,如圖19所示。
圖19 風(fēng)險(xiǎn)評(píng)價(jià)模型預(yù)測患者預(yù)后能力的評(píng)價(jià),AUC 值均高于0.70,顯示出預(yù)測結(jié)果的可靠性Figure 19.AUC Values (> 0.70) Suggesting the Reliability of the Risk Scoring Model in Predicting Prognosis
構(gòu)建包括風(fēng)險(xiǎn)等級(jí)和臨床風(fēng)險(xiǎn)特征的列線圖,以圖形樣式預(yù)測個(gè)體患者1 年、3 年和5 年的整體存活率。與其它臨床因素相比,預(yù)后模型的風(fēng)險(xiǎn)等級(jí)在列線圖中顯示出主要的預(yù)測能力,具體見圖20。預(yù)后模型的C-index 值為0.73,表示預(yù)測結(jié)果與實(shí)際觀察到的結(jié)果相一致的概率較高,證明模型的預(yù)測能力可靠。通過判別能力和校準(zhǔn)能力來評(píng)價(jià)列線圖模型有效性,繪出胃腺癌1 年、3 年和5 年的標(biāo)準(zhǔn)曲線,標(biāo)準(zhǔn)曲線比較靠近對(duì)角線,表明列線圖模型預(yù)測結(jié)果與 Kaplan-Meier 法結(jié)果一致性高,具體見圖21。
圖20 納入風(fēng)險(xiǎn)評(píng)分的預(yù)測模型列線圖,風(fēng)險(xiǎn)等級(jí)在列線圖中顯示出突出的預(yù)測能力Figure 20.A Nomogram for Predicting Overall Survival Probability of Patients
圖21 預(yù)測模型1 年、3 年和5 年的標(biāo)準(zhǔn)曲線Figure 21.Calibration Plots of Model Predicting 1- (A), 3- (B), and 5-Year (C) Survival in the Complete Dataset
胃腺癌作為胃癌最常見的亞型,大量醫(yī)學(xué)研究者致力于胃腺癌的發(fā)生、發(fā)展和治療的研究。m6A 是一種轉(zhuǎn)錄后修飾,可以影響RNA 的表達(dá)和功能。多項(xiàng)研究表明在癌癥中m6A 的調(diào)節(jié)異常會(huì)導(dǎo)致體內(nèi)信號(hào)傳導(dǎo)通路的崩潰,加速腫瘤的發(fā)生和發(fā)展[18-21]。LncRNAs 是一種長度超過200 個(gè)核苷酸的非編碼RNA,它的調(diào)節(jié)異常能夠?qū)е掳┌Y的發(fā)生和進(jìn)展。最近的研究表明,m6A修飾也能夠影響lncRNAs 的表達(dá)和功能,進(jìn)而對(duì)癌癥的發(fā)生和發(fā)展產(chǎn)生影響[22-24]。LncRNAs可能將m6A 調(diào)控因子作為競爭性內(nèi)源性RNA,影響腫瘤侵襲性進(jìn)展。m6A 修飾可以通過向m6A 讀取器蛋白提供結(jié)合位點(diǎn)來調(diào)節(jié)lncRNA功能。它還可以調(diào)節(jié)局部RNA 結(jié)構(gòu),使具體的RNA 結(jié)合蛋白進(jìn)入周圍的m6A 殘基。再者m6A 可能影響lncRNA 和特異性DNA 之間的相互作用位點(diǎn)。如在胃癌中,一些lncRNA(如HOTAIR 和MALAT1)的m6A 修飾異常會(huì)導(dǎo)致它們?cè)谖赴┘?xì)胞中的過度表達(dá),從而促進(jìn)胃癌的發(fā)生和發(fā)展[25]。因此,m6A 甲基化修飾的調(diào)控是胃癌中調(diào)控lncRNA 的一個(gè)重要機(jī)制之一。
然而,關(guān)于胃腺癌涉及m6A 相關(guān)的lncRNA的生物學(xué)機(jī)制和預(yù)后生物標(biāo)志物的研究仍不夠充分。在本研究中,我們受到m6A 和lncRNAs 在胃腺癌中的作用的啟發(fā),試圖構(gòu)建一個(gè)基于m6A相關(guān)lncRNAs 的獨(dú)立風(fēng)險(xiǎn)評(píng)分模型。從TCGA數(shù)據(jù)庫的胃腺癌數(shù)據(jù)集中鑒定出差異基因,以此為基礎(chǔ),探索m6A 調(diào)控因子和差異lncRNAs 的相關(guān)性。發(fā)現(xiàn)347 個(gè)lncRNAs 與m6A 調(diào)控因子相關(guān),用以探索其影響患者的預(yù)后作用。在探索兩類基因的相關(guān)性時(shí),相關(guān)系數(shù)r值 > 0.3,且P值小于0.001 的組共有1 250 組;而相關(guān)系數(shù)r值小于-0.3,且P值小于0.001,卻沒有一組。可揭示兩類基因具有同向特點(diǎn),如果某個(gè)m6A 調(diào)控因子是腫瘤的危險(xiǎn)因素,那么與其相關(guān)的lncRNAs 也可能是該腫瘤的危險(xiǎn)因素。
基于上述m6A 相關(guān)的lncRNAs,TCGA 數(shù)據(jù)集證實(shí)了67 個(gè)m6A 相關(guān)lncRNAs 的預(yù)后價(jià)值,并將其中12 個(gè)應(yīng)用于構(gòu)建m6A 相關(guān)性lncRNAs 風(fēng)險(xiǎn)評(píng)分模型(riskScore),以預(yù)測胃腺癌患者的總生存期。按風(fēng)險(xiǎn)評(píng)分高低將研究隊(duì)列患者分為高危風(fēng)險(xiǎn)組(n= 145)和低危風(fēng)險(xiǎn)組(n= 207),并對(duì)此模型的預(yù)測患者預(yù)后的可靠性進(jìn)行了多方面的驗(yàn)證。首先,分析了風(fēng)險(xiǎn)評(píng)分分組中患者生存狀況分布的情況,可見高風(fēng)險(xiǎn)組患者死亡的比例遠(yuǎn)高于低風(fēng)險(xiǎn)組。其次,入選的12 個(gè)lncRNAs 的表達(dá)量在不同風(fēng)險(xiǎn)分組中存在顯著差異。最后,分析了風(fēng)險(xiǎn)評(píng)分與患者臨床信息的關(guān)系,在年齡、性別、病理分化程度和TNM臨床分期中,我們都可以看到無論是在哪個(gè)亞組中,低危風(fēng)險(xiǎn)組患者的總生存期都要較高危風(fēng)險(xiǎn)組患者的長。
此外,本研究從TIME 免疫細(xì)胞浸潤方面再次驗(yàn)證風(fēng)險(xiǎn)評(píng)分模型的區(qū)分能力。我們匯總了28 種免疫細(xì)胞的基因集,并整理出免疫細(xì)胞的表達(dá)譜數(shù)據(jù),進(jìn)而分析不同風(fēng)險(xiǎn)組免疫細(xì)胞富集情況[17]。18 種免疫細(xì)胞組免疫指標(biāo)表達(dá)低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)存在顯著差異。其中低風(fēng)險(xiǎn)組中,activated CD4 T cell、CD56dim natural killer cell、activated CD8 T cell、type 17 T helper cell 4 個(gè)免疫細(xì)胞顯著富集,其余14 個(gè)免疫細(xì)胞組表達(dá)量高風(fēng)險(xiǎn)組顯著富集。我們使用估計(jì)算法來評(píng)估胃腺癌微環(huán)境中的免疫和基質(zhì)活性,發(fā)現(xiàn)高風(fēng)險(xiǎn)組中的基質(zhì)活性比低風(fēng)險(xiǎn)組的顯著增高。為了探討關(guān)鍵lncRNAs 與TIME浸潤細(xì)胞之間的關(guān)系,我們將關(guān)鍵分子與TIME 浸潤細(xì)胞進(jìn)行了關(guān)聯(lián)。Spearman 相關(guān)性分析顯示,這些分子與TIME 浸潤細(xì)胞之間存在顯著的相關(guān)性。越來越多的證據(jù)表明,單個(gè)關(guān)鍵分子可以通過改變微環(huán)境免疫細(xì)胞浸潤特征來誘導(dǎo)免疫耐受,并通過重塑微環(huán)境結(jié)構(gòu)來避免免疫攻擊[26-28]。本研究進(jìn)一步探索lncRNAs 是否可以調(diào)節(jié)TIME 細(xì)胞的浸潤水平,結(jié)果揭示了關(guān)鍵分子的表達(dá)與18 個(gè)TIME 細(xì)胞浸潤之間的顯著負(fù)相關(guān),這證明風(fēng)險(xiǎn)評(píng)估模型與TIME 細(xì)胞浸潤存在相關(guān)性。
多元Cox 回歸分析表明,風(fēng)險(xiǎn)評(píng)分模型是胃腺癌患者關(guān)鍵危險(xiǎn)因素。ROC 分析表明,以風(fēng)險(xiǎn)評(píng)分作為其中一項(xiàng)變量的Cox 回歸模型在胃腺癌的生存預(yù)測方面表現(xiàn)出優(yōu)異的敏感性和特異性。本研究建立了一個(gè)列線圖用于個(gè)性化預(yù)測患者的總生存狀況。在臨床上,病理分化程度是胃腺癌預(yù)后的決定性因素。然而,同一分化階段的胃腺癌患者的臨床結(jié)果總是存在差異,這表明目前的分期系統(tǒng)在提供可靠的預(yù)測和反映胃腺癌異質(zhì)性方面是不準(zhǔn)確的。因此,應(yīng)探索潛在的預(yù)測和治療生物標(biāo)志物,豐富現(xiàn)有的分期系統(tǒng)。本研究所建立的m6A 相關(guān)lncRNAs 模型為胃腺癌患者的預(yù)后預(yù)測提供了一種新方法。該結(jié)果也為未來對(duì)lncRNA-m6A 修飾的過程和機(jī)制的研究提供了見解。我們也意識(shí)到這項(xiàng)研究中的一些不足和局限性,如缺乏外部數(shù)據(jù)驗(yàn)證,并且m6A 相關(guān)lncRNAs 的生物學(xué)機(jī)制尚未完全闡明。因此,我們將重新收集臨床樣本并擴(kuò)大樣本量。此外,我們將嘗試通過更多的外部實(shí)驗(yàn)來驗(yàn)證該模型的準(zhǔn)確性,以進(jìn)一步證實(shí)lncRNAs 的作用及其與m6A 相關(guān)基因的相互作用。
作者聲明:本文全部作者對(duì)于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;并承諾論文中涉及的原始圖片、數(shù)據(jù)資料等已按照有關(guān)規(guī)定保存,可接受核查。
學(xué)術(shù)不端:本文在初審、返修及出版前均通過中國知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)的學(xué)術(shù)不端檢測。
同行評(píng)議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。
利益沖突:所有作者均聲明不存在利益沖突。
文章版權(quán):本文出版前已與全體作者簽署了論文授權(quán)書等協(xié)議。