時 堅,劉雪昂,朱 巖,胡 冉,馬文靜,朱 毅*
1南京醫(yī)科大學(xué)第一附屬醫(yī)院胰腺中心,江蘇 南京 210029;2南京醫(yī)科大學(xué)胰腺研究所,江蘇 南京 210029;3南京醫(yī)科大學(xué)第一附屬醫(yī)院病理科,4公共實驗中心,江蘇 南京 210029
胰腺癌(pancreatic cancer,PC)是一種惡性程度極高的消化道惡性腫瘤,發(fā)病率和病死率不斷上升,已成為我國第六大致死原因。胰腺癌起病隱匿,易復(fù)發(fā)和轉(zhuǎn)移,由于缺乏有效的預(yù)測和治療策略,預(yù)后往往較差,即使是經(jīng)過根治性手術(shù)治療的胰腺癌患者仍會在5 年內(nèi)出現(xiàn)腫瘤復(fù)發(fā)[1]。因此,迫切需要開發(fā)新的預(yù)后評估方法來預(yù)測患者的臨床預(yù)后。
研究發(fā)現(xiàn),不同生物體的RNA中存在超過160種轉(zhuǎn)錄后RNA 修飾,其中包括非編碼RNA(如核糖體RNA、轉(zhuǎn)運RNA 和核內(nèi)小RNA 等)和mRNA[2]。這些修飾包括但不限于N6-甲基腺嘌呤(m6A)、N1-甲基腺嘌呤(m1A)和5-甲基胞嘧啶(m5C)等。m1A是一種動態(tài)可逆修飾過程,類似于m6A 修飾,由甲基轉(zhuǎn)移酶、脫甲基酶和結(jié)合蛋白調(diào)控[3]。最新研究報道,m6A、m5C、m1A 的RNA 修飾有助于癌癥的發(fā)生和發(fā)展,m6A/m5C/m1A調(diào)控基因的聚類亞組和風險模型與肝細胞癌的不良預(yù)后和免疫微環(huán)境相關(guān),有望成為評估肝細胞癌患者預(yù)后的新工具[4]。但是迄今未見m1A相關(guān)分子標志物來預(yù)測胰腺癌的預(yù)后,限制了m1A 相關(guān)基因在指導(dǎo)胰腺癌診斷和治療中的應(yīng)用。
本研究找到了2 個m1A 相關(guān)基因(CRLS1 與C7orf50)有獨立預(yù)測胰腺癌預(yù)后的能力,并建立了預(yù)測胰腺癌預(yù)后的風險評分模型,命名為PC-m1AScore。本研究系統(tǒng)驗證了PC-m1AScore、PC-m1AScore 聯(lián)合腫瘤突變負荷(tumor mutation burden,TMB)預(yù)測胰腺癌預(yù)后的效能,初步分析了PC-m1AScore 和免疫細胞浸潤之間的關(guān)系,旨在找到預(yù)測胰腺癌患者預(yù)后的新工具,有利于醫(yī)生選擇更合理的、個性化的手術(shù)范圍,制定術(shù)后隨訪策略,實現(xiàn)基于腫瘤生物學(xué)行為的個體化治療,有望改善患者的預(yù)后。
178例胰腺癌患者的癌組織、4例患者的癌旁組織的組織轉(zhuǎn)錄組測序數(shù)據(jù)信息、患者臨床病理參數(shù)信息(包括性別、年齡、存活時間、TNM分期等)來源于公共癌癥基因組圖譜數(shù)據(jù)庫(TCGA,https://portal.gdc.cancer.gov/)。165 例正常胰腺組織的轉(zhuǎn)錄組測序數(shù)據(jù)來源于基因型組織表達數(shù)據(jù)庫(GTEx,https://www.gtexportal.org/home/index.html)。m1A 相關(guān)基因集來自Gao等[2]的研究。
1.2.1 胰腺癌差異表達的m1A相關(guān)基因的篩選
通過“l(fā)imma”包,以P<0.05 和|log2差異倍數(shù)(fold change,F(xiàn)C)|>1 為條件篩選胰腺癌和正常組織之間的差異基因?;騁O 和KEGG通路分析在R 包“clusterProfiler”上完成。接著使用Pearson 檢驗計算差異表達基因之間的關(guān)聯(lián),并使用R 包“corrplot”顯示。
1.2.2 針對m1A 相關(guān)基因所構(gòu)建新的胰腺癌預(yù)后模型的建立與系統(tǒng)驗證
①通過單因素Cox分析篩選與胰腺癌患者生存相關(guān)的胰腺癌差異表達的m1A相關(guān)基因,并使用一致性指標(C-指數(shù))來驗證準確性。②將與預(yù)后相關(guān)的m1A 相關(guān)基因納入最小絕對收縮和選擇算子(LASSO)分析。通過多因素Cox分析確定與預(yù)后相關(guān)的獨立風險m1A相關(guān)基因。③通過線性組合Cox回歸系數(shù)乘以基因表達的方法,建立新的胰腺癌預(yù)后模型:風險評分(score)=β1×基因1 表達+β2×基因2 表達+...+βn×基因n表達。本文將新建的胰腺癌預(yù)后模型命名為PC-m1AScore。④根據(jù)PC-m1AScore的中位數(shù)將胰腺癌患者分為高風險組和低風險組。為了評估兩組的生存率,使用R 軟件包“survival”來繪制Kaplan-Meier 曲線?;谑茉囌吖ぷ魈卣鳎╮eceiver operating characteristic,ROC)曲線和隨時間變化的曲線下面積(area under curve,AUC),進行為期5 年的生存預(yù)測實驗,以評估PC-m1AScore 的預(yù)測效能。⑤運用單因素和多因素Cox 分析,代入PC-m1AScore、性別、年齡、病理分化程度和TNM 分期等多個變量指標,找到能定義公共數(shù)據(jù)庫中胰腺癌病例預(yù)后風險的獨立因素。結(jié)合ROC分析、臨床亞組分析等驗證手段,證明所建立的PC-m1AScore預(yù)測胰腺癌預(yù)后的效能。⑥在R 軟件包“rms”和“survival”上構(gòu)建了列線圖,以可視化Cox 回歸模型和評估預(yù)后預(yù)測的準確性。通過校準圖校準了柱線圖。⑦運用主成分分析(principal components analysis,PCA)方法,證明所建立的PC-m1AScore 預(yù)測胰腺癌預(yù)后的效能。
1.2.3 PC-m1AScore聯(lián)合TMB預(yù)測胰腺癌預(yù)后的效能
R 包“survival”用于繪制Kaplan-Meier 曲線,旨在評估TMB 對患者預(yù)后的影響。然后將TMB 數(shù)據(jù)與風險評分結(jié)合起來評估兩者對預(yù)后的綜合影響。使用R 包“maftools”分析TCGA 體細胞變異數(shù)據(jù)并可視化前10個突變基因。
1.2.4 PC-m1AScore及其組成基因的免疫相關(guān)分析
根據(jù)PC-m1AScore 的中位數(shù)將胰腺癌患者分為高風險組和低風險組,在R 包“Cibersort”上比較兩組之間22 種免疫相關(guān)細胞類型的浸潤差異。通過Pearson 檢驗分析免疫檢查點(LMTK3、TIGIT、CD274、CTLA4、PDCD1)的基因表達量與組成PC-m1AScore的m1A相關(guān)基因表達量之間的關(guān)系。
1.2.5 具有完整臨床信息數(shù)據(jù)的驗證樣本集的獲取
除了公共數(shù)據(jù)庫中的胰腺癌病例的測序與臨床數(shù)據(jù)外,本研究還向經(jīng)ISO90012015 質(zhì)量認證的南京醫(yī)科大學(xué)第一附屬醫(yī)院胰腺中心胰腺專病生物樣本庫申請了60 例胰腺癌患者手術(shù)切除的胰腺癌組織和配對的癌旁非腫瘤組織。本研究獲得醫(yī)院倫理委員會的批準(倫理號2020-SRFA-364),所用組織樣本都有對應(yīng)來源患者的書面知情同意書。所用組織樣本的患者術(shù)前均未接受化療或放療,均在2019—2022 年接受了胰十二指腸切除術(shù),經(jīng)病理證實為胰腺癌??偵嫫冢╫verall survival,OS)定義為手術(shù)至死亡或末次隨訪日期之間的時間。對手術(shù)切除標本的取材是規(guī)范統(tǒng)一的,將取材組織一分為二,一半組織使用液氮速凍,另一半組織甲醛固定后制作石蠟塊和HE 切片,組織形態(tài)由兩位病理醫(yī)生確認。
所有統(tǒng)計分析均在R4.3、SPSS 20.0和GraphPad Prism 5 中進行,所有統(tǒng)計檢驗均進行雙尾檢驗。Student’st檢驗、Wilcoxon rank-sum檢驗用于檢測腫瘤組織與正常胰腺組織基因表達差異,F(xiàn)isher 精確檢驗用于確定不同模式之間變量的差異,Benjamini-Hochberg(BH-FDR)用于調(diào)整多個變量多重比較的P值[5]。對于預(yù)后分析,采用log-rank 檢驗和Cox 回歸分析檢驗特殊變量的預(yù)后價值。P<0.05為差異有統(tǒng)計學(xué)意義。
將TCGA 數(shù)據(jù)庫中178 例胰腺癌患者表達情況和GTEx數(shù)據(jù)庫中169個正常胰腺樣本的數(shù)據(jù)整合,得到一個腫瘤與正常組織數(shù)據(jù)量基本接近的聯(lián)合表達數(shù)據(jù)庫。通過分析發(fā)現(xiàn)其中參與m1A 修飾的10 種修飾蛋白在腫瘤與正常組織中均存在明顯表達差異,除ALKBH3 與YTHDC1 在胰腺癌中表達明顯降低外,其余均明顯升高(圖1A)。71 個m1A相關(guān)基因來自于Gao 等[2]的研究,使用STRING6、BioGrid7、OmniPath8、InWeb_IM9 數(shù)據(jù)庫進行蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)富集分析,PPI結(jié)果提示其主要富集在DNA 合成、RNA 修飾、囊泡貨物裝載及嘧啶代謝領(lǐng)域(圖1B)。
圖1 胰腺癌差異表達m1A相關(guān)基因的篩選與鑒定Figure 1 Screening and identification of differential expression of m1A-related genes in pancreatic cancer
在GO 富集分析中得到了同樣的結(jié)果,生物過程中,m1A 相關(guān)基因主要富集在:①“貨物裝載到COPⅡ包被覆蓋的囊泡中”,此過程是細胞內(nèi)物質(zhì)轉(zhuǎn)運和分泌的重要步驟之一;②“核酸磷酸二酯鍵水解”,它是一種重要的生物化學(xué)反應(yīng),指的是通過水解反應(yīng)將核酸分子中的磷酸二酯鍵斷裂,從而釋放出相應(yīng)的核苷酸單元或碎片。這種反應(yīng)在許多生物過程中都具有重要的生物學(xué)功能,如DNA 復(fù)制、RNA 轉(zhuǎn)錄、RNA 降解等。在細胞組分中,m1A相關(guān)基因主要富集在“COPⅡ囊泡包被”,COPⅡ囊泡包被是細胞內(nèi)轉(zhuǎn)運和分泌蛋白質(zhì)的一種膜運輸體系,它由多種蛋白質(zhì)復(fù)合物組成,其中包括COPⅡ囊泡包被蛋白,它們的聚合可以促進細胞膜上的貨物進入囊泡內(nèi)。COPⅡ囊泡包被在細胞內(nèi)轉(zhuǎn)運和分泌過程中扮演著重要角色,其調(diào)控異??赡軐?dǎo)致一些疾病的發(fā)生[6]。
KEGG 通路富集分析結(jié)果進一步提示,m1A 相關(guān)基因主要富集在“錯配修復(fù)”通路(圖1C),它是細胞DNA復(fù)制過程中的一個重要機制,負責糾正在復(fù)制過程中可能出現(xiàn)的DNA 序列不一致的錯誤。這種修復(fù)機制在維護基因組穩(wěn)定性和避免突變方面具有重要作用,對于細胞的生存和繁殖都至關(guān)重要[7]。
考慮到如果將71 個基因的表達量都納入預(yù)測模型,基因數(shù)量過大會限制臨床轉(zhuǎn)化應(yīng)用,本研究嘗試對基因集進行降維:通過對71個m1A相關(guān)基因在胰腺癌與正常胰腺組織中的表達分析,篩選出顯著上調(diào)與下調(diào)基因各7 個(圖1D),并發(fā)現(xiàn)除CD200外,其余基因之間的相關(guān)性極高,Pearson 相關(guān)系數(shù)絕對值普遍超過0.7(圖1E)。
通過單因素Cox回歸分析篩選隊列中胰腺癌患者的生存數(shù)據(jù)和14個差異基因表達譜,其中8個基因與總生存期相關(guān),之前已報道多數(shù)基因與腫瘤發(fā)生發(fā)展密切相關(guān)(圖2A)。隨后利用LASSO 回歸分析和多因素Cox 分析,最終找到了2 個m1A 相關(guān)基因(CRLS1 與C7orf50)有獨立預(yù)測預(yù)后的能力(P<0.05,圖2B),用于構(gòu)建預(yù)后風險模型。通過線性組合Cox 回歸系數(shù)乘以基因表達的方法,建立新的胰腺癌預(yù)后模型并命名為PC-m1AScore:風險評分=(1.798 5×CRLS1)+(-1.718 6×C7orf50)(圖2B~D)。C-指數(shù)用于評估預(yù)后模型的預(yù)測準確性,其與患者預(yù)后的相關(guān)性優(yōu)于其他臨床參數(shù)(圖2E)。在TCGA數(shù)據(jù)中,模型基因的表達在高風險組和低風險組中都顯著不同(圖2F),在計算出TCGA 數(shù)據(jù)庫中每個患者的PC-m1AScore 風險評分后,根據(jù)中位數(shù)將他們分為高風險組和低風險組(圖2G)。Kaplan-Meier 分析表明,高風險組患者的預(yù)后明顯比低風險組患者的預(yù)后更差(P<0.05,圖2H、I)。在TCGA-GTEx 數(shù)據(jù)集中,1 年、3 年和5 年的生存期預(yù)測風險評分的AUC值分別為0.586、0.664 和0.755(圖2J),而由于本胰腺中心60 例患者取樣時間較晚,缺少5 年生存期預(yù)測風險評分,其1 年、3 年評分分別為0.735 和0.580(圖2K),綜合提示PC-m1AScore模型有預(yù)測胰腺癌患者預(yù)后的效能。
運用單因素和多因素Cox 分析,代入年齡、性別、病理分級、TNM分期和PC-m1AScore風險評分多個變量指標,如圖3A、B 所示,多因素Cox 分析結(jié)果顯示年齡:HR=1.025,95%CI:1.003~1.048,P=0.026,性別:HR=0.789,95%CI:0.508~1.224,P=0.290,病理分級:HR=1.243,95%CI:0.911~1.697,P=0.170,TNM分期:HR=0.460,95%CI:0.118~1.791,P=0.263,T 分期:HR=1.533,95%CI:0.629~3.736,P=0.347,N 分期:HR=2.169,95%CI:1.172~4.013,P=0.014,M 分期:HR=4.590,95%CI:0.210~100.398,P=0.333,風險評分:HR=2.022,95%CI:1.306~3.129,P=0.002,其中年齡、淋巴結(jié)轉(zhuǎn)移(N)分期、風險評分是3個獨立的胰腺癌風險因素。如圖3C 的ROC 分析結(jié)果顯示,8 個因素AUC 值從小到大依次為:TNM 分期(0.459)、M分期(0.467)、T分期(0.504)、N分期(0.518)、年齡(0.534)、性別(0.597)、病理分級(0.607)、風險評分(0.723),證明所建立的PC-m1AScore 有預(yù)測胰腺癌預(yù)后的顯著效能。此外,亞組分析結(jié)果顯示,在T1~2 期、G1~2 期、≤65 歲患者或性別為女性的細分亞組下,PC-m1AScore 風險評分能準確預(yù)測患者的生存期(P<0.05,圖3D~G)。
圖3 胰腺癌預(yù)后風險模型PC-m1AScore效能的驗證Figure 3 Validation of effectiveness of the prognostic risk model(PC-m1AScore)for pancreatic cancer
為了更準確預(yù)測胰腺癌患者的生存風險,本研究構(gòu)建了結(jié)合PC-m1AScore 模型和臨床病理學(xué)特征的預(yù)后列線圖,3~5 年存活率列線圖的校準曲線可視化地顯示預(yù)測值和實際值之間具有一致性(圖3H)。
在預(yù)后分析中,多個變量通常相互關(guān)聯(lián),運用PCA 主成分分析的方法在研究個體變量之間相關(guān)性的基礎(chǔ)上,通過將數(shù)據(jù)投影到低維主成分,能降低數(shù)據(jù)的復(fù)雜性,最大限度地保留信息。結(jié)果顯示:與71個m1A相關(guān)基因集和在胰腺癌顯著差異表達的14個m1A相關(guān)基因集相比,應(yīng)用本研究構(gòu)建的胰腺癌預(yù)后風險模型PC-m1AScore,即(1.798 5×CRLS1)+(-1.718 6×C7orf50),能夠顯著區(qū)分患者亞群(圖3I~K)。
TMB 定義為腫瘤基因組每個編碼區(qū)的突變總數(shù),對多種腫瘤的免疫治療具有良好的預(yù)測價值[8]。根據(jù)178 例胰腺癌患者的TMB 評分對其進行分組,log-rank 檢驗結(jié)果顯示TMB 水平與患者生存時間密切相關(guān)(圖4A),相比于低TMB 組,高TMB組具有更差的預(yù)后。Kaplan-Meier 曲線也顯示PC-m1AScore與TMB的聯(lián)合分析具有比兩者單獨分析更強的預(yù)測胰腺癌預(yù)后的效能(圖4B)。圖4C、D顯示患者的PC-m1AScore風險評分值與基因突變頻率沒有相關(guān)性,PC-m1AScore的高、低風險組基因突變的前10 名都是KRAS>TP53>SMAD4>CDKN2A>TTN>MUC16>RNF43>HECW2>TNXB>RYR1,其 中PC-m1AScore高風險組的突變頻率更高(90%)。
圖4 PC-m1AScore模型及其權(quán)重基因與基因突變和免疫細胞浸潤水平的關(guān)系Figure 4 The relation of PC-m1AScore model and the levels of gene mutation and immune cell infiltration
SCNA 模塊提供了對給定基因具有不同體細胞拷貝數(shù)改變腫瘤之間的免疫細胞浸潤水平比較。SCNA 由GISTIC2.0 定義,包括深度缺失(deep deletion)(-2)、臂級缺失(arm-level deletion)(-1)、二倍體/正常(0)、臂級增益(arm-level gain)(1)和高擴增(high amplication)(2)。以箱形圖顯示所選癌癥類型中每個拷貝數(shù)狀態(tài)下每個免疫子集的分布。使用雙側(cè)Wilcoxon 秩和檢驗將每個SCNA類別的滲透水平與正常水平進行比較。結(jié)果顯示CRLS1 的臂級缺失與增益均會帶來不同程度的B 細胞、T 細胞以及巨噬細胞浸潤程度的改變(P<0.05,圖4E、F)。C7orf50的體細胞拷貝數(shù)還存在高擴增改變,其臂級缺失會帶來不同程度的B 細胞、CD4+T 細胞浸潤的改變(P<0.05)。
根據(jù)PC-m1AScore風險評分的中位數(shù)將胰腺癌患者分為高風險組和低風險組,使用R 包“Cibersort”統(tǒng)計分析兩組之間22 種免疫相關(guān)細胞類型的浸潤差異,顯示4 種免疫細胞在兩組之間存在差異(P<0.05,圖5A),其中,中性粒細胞和CD4+記憶靜息T細胞浸潤在高風險組患者胰腺癌組織的比例更高,而濾泡輔助T細胞與活化的NK細胞浸潤在低風險組患者胰腺癌組織的比例更高。納入PC-m1AScore 預(yù)后模型的兩個基因中,CRLS1 的表達量與免疫檢查點PDCD1 的表達量呈負相關(guān)(P<0.05),同時與LMTK3 的表達量呈正相關(guān)(P<0.05,圖5B),而C7orf50的表達量分別與LMTK3的表達量呈正相關(guān)(P<0.05),與CD274 和TIGIT 的表達量呈負相關(guān),(P<0.05,圖5C)。
圖5 PC-m1AScore高低風險組的免疫細胞浸潤差異以及模型基因與免疫檢查點基因表達量的相關(guān)性Figure 5 Differences in immune infiltration between high and low risk groups and correlations between model genes and immune checkpoints
除了前述來源于TCGA 和GTEx 的測序和臨床數(shù)據(jù)以外,本研究還整理了基因表達數(shù)據(jù)庫(GEO)中65 例胰腺癌患者的測序和臨床數(shù)據(jù)集GSE62452,使用q-PCR技術(shù)建立了本中心60例胰腺癌患者胰腺癌與癌旁非瘤組織的基因表達數(shù)據(jù)和患者生存期在內(nèi)的臨床數(shù)據(jù)集。使用GEO 和本中心的驗證數(shù)據(jù)集,根據(jù)每例患者的PC-m1AScore風險評分將患者分為高風險組和低風險組,采用log-rank 檢驗,結(jié)果顯示與低風險組相比,高風險組生存期顯著縮短(P=0.020,P<0.001,圖6A、B),和前述在TCGA 數(shù)據(jù)庫中的分析結(jié)果趨勢一致,再次證明PC-m1AScore 模型預(yù)測胰腺癌預(yù)后的顯著效能。
圖6 使用GEO和本中心的數(shù)據(jù)集驗證PC-m1AScore預(yù)后模型的效能Figure 6 The efficacy of the PC-m1AScore prognostic model was validated using GEO and our data set
采用log-rank 檢驗,使用TCGA 的數(shù)據(jù)集,組成PC-m1AScore模型的兩個權(quán)重基因的表達量也都有預(yù)測胰腺癌預(yù)后的效能(P<0.01,圖6C、D),其中高表達C7orf50 基因的胰腺癌患者生存期顯著延長(P<0.001),而高表達CRLS1 基因的胰腺癌患者生存期顯著縮短(P=0.007)。60例癌與癌旁非瘤的配對組織檢測結(jié)果顯示CRLS1 與C7orf50 在胰腺癌組織中高表達(圖6E、F)。根據(jù)隨訪的統(tǒng)一截止時間點,將本中心來源的患者分為生存組與死亡組,分別統(tǒng)計兩個模型基因表達情況,結(jié)果顯示,CRLS1在死亡組中的表達量顯著升高,C7orf50 在死亡組中的表達量顯著降低(P<0.05,圖6G)。綜合圖6C~G的結(jié)果,均和PC-m1AScore預(yù)測胰腺癌預(yù)后的趨勢吻合,不僅再次證明PC-m1AScore 模型預(yù)測胰腺癌預(yù)后的顯著效能,而且提示組成PC-m1AScore模型的兩個權(quán)重基因可能與胰腺癌的惡性進展有關(guān)系。
本研究通過TCGA-GTEx 數(shù)據(jù)庫分析胰腺癌組織中差異表達的m1A 相關(guān)基因,利用Cox 分析與LASSO回歸構(gòu)建胰腺癌預(yù)后風險模型,并通過GEO數(shù)據(jù)庫和本中心胰腺癌病例的基因表達和臨床數(shù)據(jù)進行系統(tǒng)驗證,找到了能預(yù)測胰腺癌患者預(yù)后的新工具,期待能轉(zhuǎn)化應(yīng)用于臨床,助力于對胰腺癌患者的個性化監(jiān)測、治療和預(yù)后改善。
越來越多的證據(jù)表明RNA 化學(xué)修飾在基本細胞過程中具有重要功能,如細胞分化、蛋白質(zhì)產(chǎn)生、細胞信號轉(zhuǎn)導(dǎo)和晝夜節(jié)律的維持等[9]。已經(jīng)證實,m1A 失調(diào)影響多種細胞過程,包括RNA 結(jié)構(gòu)穩(wěn)定性、折疊、與蛋白質(zhì)的相互作用、細胞活力、自我更新能力受損、細胞增殖和細胞死亡[10]。最近研究表明,m1A 修飾廣泛參與許多疾病的發(fā)生和進展,例如去甲基化修飾酶ALKBH3 在許多人類癌癥中高度表達,與癌細胞中tRNA 的m1A 修飾和蛋白質(zhì)合成密切相關(guān)[11-12],甲基轉(zhuǎn)移酶TRMT6重復(fù)序列中的移碼突變已在結(jié)腸癌中得到證實。Gao 等[2]提出了由71個m1A相關(guān)基因組成的集群,在該集群基礎(chǔ)上建立的m1AScore 算法能預(yù)測結(jié)腸癌的預(yù)后。本研究也通過GO 功能富集分析發(fā)現(xiàn),這71個m1A 相關(guān)基因主要富集在細胞內(nèi)物質(zhì)轉(zhuǎn)運和分泌、DNA 復(fù)制、RNA轉(zhuǎn)錄、RNA降解等功能上,這些通路在許多生物過程中都至關(guān)重要,稍有調(diào)控異常便可能導(dǎo)致疾病的發(fā)生。KEGG通路富集提示m1A相關(guān)基因主要富集在錯配修復(fù)通路,是維持基因組穩(wěn)定和避免突變的重要組成部分。
考慮到如果將71 個基因的表達量都納入風險預(yù)測模型,基因數(shù)量過大會限制臨床轉(zhuǎn)化應(yīng)用,本研究嘗試對基因集進行降維:通過對71 個m1A 相關(guān)基因在胰腺癌與正常胰腺組織中的表達分析,篩選出顯著上調(diào)與下調(diào)的基因各7 個,本研究結(jié)果也顯示所篩選的14個基因彼此間相關(guān)性極高,提示14 個基因很可能彼此協(xié)同配合發(fā)揮功能。在此基礎(chǔ)上,通過單因素、LASSO、多因素Cox回歸分析,找到了2 個m1A 相關(guān)基因(CRLS1 與C7orf50)有獨立預(yù)測胰腺癌預(yù)后的能力,并用兩個基因的表達水平與其權(quán)重的乘積后求和建模,構(gòu)建了新的胰腺癌預(yù)后風險模型,命名為PC-m1AScore。PCA 主成分分析顯示,該風險模型可以精準區(qū)分患者人群為高、低風險兩個亞群,明顯優(yōu)于全面審視所有71個m1A相關(guān)基因。本研究通過包括log-rank檢驗、Cox回歸分析、ROC曲線、AUC面積、列線圖等在內(nèi)的多種統(tǒng)計方法,使用TCGA、GTEx、GEO、本中心多種來源的胰腺癌病例的基因表達數(shù)據(jù)和對應(yīng)的臨床數(shù)據(jù),系統(tǒng)證明了PC-m1AScore 模型預(yù)測胰腺癌預(yù)后的效能。值得注意的是,本研究證明了PC-m1AScore 與TMB 聯(lián)合分析具有比兩者單獨分析更強的區(qū)分胰腺癌預(yù)后的效能。
此外,本研究在用PC-m1AScore 進行生物信息學(xué)層面的免疫相關(guān)分析時發(fā)現(xiàn):中性粒細胞和CD4+記憶靜息T細胞浸潤在PC-m1AScore高風險組患者胰腺癌組織中的比例更高,而濾泡輔助T 細胞與活化的NK細胞浸潤在低風險組患者胰腺癌組織中的比例更高。第一,眾所周知,中性粒細胞的主要效應(yīng)機制是構(gòu)成抵御外來入侵者的第一道防線:吞噬作用、脫粒和中性粒細胞胞外陷阱形成。值得注意的是,最新的文獻綜述表明,中性粒細胞被募集到腫瘤微環(huán)境中并發(fā)揮炎癥和腫瘤促進作用[13-15]。作為腫瘤微環(huán)境的重要組成部分,中性粒細胞在胰腺癌中發(fā)揮著多種作用,如促進血管生成、惡性進展、轉(zhuǎn)移和免疫抑制。據(jù)此,結(jié)合本研究的結(jié)果,我們推測胰腺癌細胞招募更多的中性粒細胞,可能是PC-m1AScore 高風險組患者預(yù)后更差的原因之一。第二,本研究通過關(guān)鍵詞CD4+記憶靜息T 細胞(CD4+memory resting T cells)檢索文獻,迄今,國內(nèi)外未見CD4+記憶靜息T 細胞在胰腺癌中的功能研究報道,其在腫瘤中的研究報道也很少,主要集中在人類免疫缺陷病毒感染方面。雖然學(xué)術(shù)界認為由CD4+T細胞介導(dǎo)的長期免疫記憶針對先前遇到的病原體或抗原提供了快速保護,但是,記憶CD4+T細胞是如何產(chǎn)生和維持的仍然存在爭議[16],本研究利用生物信息學(xué)發(fā)現(xiàn)PC-m1AScore高風險組患者的胰腺癌組織中有更多的CD4+記憶靜息T細胞,也需要進一步設(shè)計生物學(xué)實驗,驗證和闡明觀察到的現(xiàn)象。第三,最新研究表明,濾泡輔助T(Tfh)細胞為B 細胞提供幫助,支持生發(fā)中心的形成,從而使抗體反應(yīng)的親和力成熟[17]。Tfh 盡管通常位于次級淋巴器官中,但具有Tfh 細胞特征的T 細胞也可以存在人體血液中,并且它們的頻率和表型在自身免疫性疾病患者中經(jīng)常發(fā)生改變,該群體可能是免疫失調(diào)的核心哨兵。已有文獻證實,Tfh 細胞的高浸潤預(yù)示著胰腺癌患者的預(yù)后較好[18]。Tfh 細胞通過分泌CXCL13 和IL-21 減輕胰腺癌的腫瘤生長并增強腫瘤微環(huán)境中CD8+T 細胞、B 細胞浸潤和B 細胞成熟。據(jù)此,結(jié)合本研究的結(jié)果,我們推測Tfh 浸潤更多,可能是PC-m1AScore 低風險組患者預(yù)后較好的原因之一。第四,NK 細胞是腫瘤免疫中重要的效應(yīng)細胞,在機體內(nèi)對腫瘤細胞起著免疫監(jiān)視作用。已有研究證實,NK 浸潤不僅是預(yù)后較好的標志,NK 也是對抗轉(zhuǎn)移的效應(yīng)群體[19],而且NK 細胞治療可協(xié)助吉西他濱化療抑制胰腺癌手術(shù)治療后的局部復(fù)發(fā),在PD-1 阻斷劑和吉西他濱均不能抑制遠處轉(zhuǎn)移的情況下,通過系統(tǒng)激活NK 細胞可有效抑制包括肝轉(zhuǎn)移在內(nèi)的胰腺癌的遠端轉(zhuǎn)移[20]。因此,結(jié)合本研究結(jié)果,推測NK 細胞浸潤更多,可能是PC-m1AScore 低風險組患者預(yù)后較好的原因之一。
PC-m1AScore 模型中包含兩個權(quán)重基因,分別是與風險正相關(guān)的CRLS1 和與風險負相關(guān)的C7orf50。CRLS1 編碼CDP-酒精磷脂酰轉(zhuǎn)移酶Ⅰ類蛋白質(zhì)家族的成員。編碼的酶催化心磷脂的合成,心磷脂是線粒體膜的磷脂成分,對線粒體功能至關(guān)重要[21]。此外,CRLS1 基因在癌癥、心血管疾病等多種疾病中也扮演著重要角色,因此,CRLS1 可能成為一種重要的治療靶點或生物標志物[22]。已有研究探討了CRLS1在三陰性乳腺癌中的作用,發(fā)現(xiàn)CRLS1 高表達促進了腫瘤進展,并賦予細胞對順鉑的耐藥性[23]。另有研究發(fā)現(xiàn),CRLS1 基因中的一些有害變異導(dǎo)致心磷脂嚴重缺乏,進而引起一種名為自身隱性多系統(tǒng)線粒體病的疾?。?4],患者表現(xiàn)出多個系統(tǒng)的癥狀,包括肌肉無力、眼肌麻痹、心臟問題和神經(jīng)系統(tǒng)障礙等[25]。C7orf50 基因產(chǎn)物也稱為PARK16(因其與帕金森病的關(guān)聯(lián)而命名),目前的研究較為有限,對其功能了解不多。C7orf50在大腦組織中高度表達,尤其是在帕金森病患者的腦組織中[26]。C7orf50的功能尚不完全清楚,有研究報道它可能與細胞凋亡、線粒體功能和氧化應(yīng)激有關(guān)[27]。C7orf50 蛋白可能與線粒體外膜上的磷脂酰肌醇磷酸相互作用,這可能與線粒體膜上的離子通道或其他蛋白質(zhì)的功能調(diào)節(jié)有關(guān)[28]。本研究結(jié)果提示CRLS1 與C7orf50 的功能可能與胰腺癌的惡性進展有關(guān),需要開展系統(tǒng)的體外、體內(nèi)實驗與深入的機制研究來進一步證實。