熊 黎,向 尹,楊 陽(yáng),陽(yáng)麗紅,黃 鑫,劉 楷△
1.樂(lè)山市人民醫(yī)院檢驗(yàn)科,四川樂(lè)山 614000;2.川北醫(yī)學(xué)院,四川南充 637000
胃癌是一種常見(jiàn)的惡性腫瘤,在全球范圍內(nèi)都具有較高的發(fā)病率和致死率[1],其發(fā)病率排名第三,僅次于肺癌和乳腺癌[2],而在中國(guó),胃癌也是一種常見(jiàn)的癌癥[3]。胃癌的發(fā)生和發(fā)展與多個(gè)基因異常有關(guān)[4],其中染色質(zhì)調(diào)節(jié)因子在細(xì)胞中起著重要的作用,可以影響基因的表達(dá)和功能[5]。研究表明,染色質(zhì)調(diào)節(jié)因子參與表觀修飾的重要過(guò)程,進(jìn)而促進(jìn)腫瘤的發(fā)生發(fā)展。它們能夠改變?nèi)旧|(zhì)結(jié)構(gòu)和組織化程度,從而影響基因的轉(zhuǎn)錄活性和DNA甲基化狀態(tài),進(jìn)而調(diào)控相關(guān)基因的表達(dá)[6-8]。因此,對(duì)于胃癌染色質(zhì)調(diào)節(jié)因子的研究具有重要意義。
長(zhǎng)鏈非編碼RNA(LncRNA)是一段長(zhǎng)度大于200核苷酸的不翻譯蛋白的RNA[9]。在人類(lèi)的基因組中只有不到2%的基因具有編碼蛋白的能力,但是超過(guò)90%的基因會(huì)被轉(zhuǎn)錄為RNA,而LncRNA曾經(jīng)被認(rèn)為是無(wú)作用、無(wú)意義的基因組轉(zhuǎn)錄“噪音”[10],但是越來(lái)越多的研究表明,LncRNA參與表觀修飾和基因的轉(zhuǎn)錄調(diào)控等腫瘤發(fā)生發(fā)展的分子機(jī)制[11-12]。近期研究表明,LncRNA可以構(gòu)建腫瘤的預(yù)后風(fēng)險(xiǎn)模型[13-14]。因此,為了探尋胃癌染色質(zhì)調(diào)節(jié)因子相關(guān)的LncRNA,提供新的具有預(yù)后價(jià)值的生物標(biāo)志物,本研究構(gòu)建胃癌染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA的預(yù)后模型,以為胃癌患者的風(fēng)險(xiǎn)及預(yù)后評(píng)估提供新的參考指標(biāo)。
1.1TCGA數(shù)據(jù)下載 從TCGA數(shù)據(jù)庫(kù)下載胃癌的轉(zhuǎn)錄組數(shù)據(jù)及相關(guān)的臨床數(shù)據(jù),并通過(guò)文獻(xiàn)[15]獲得870個(gè)染色質(zhì)調(diào)節(jié)因子。
1.2胃癌差異表達(dá)染色質(zhì)調(diào)節(jié)基因 從TCGA下載胃癌的轉(zhuǎn)錄組測(cè)序數(shù)據(jù)后利用R軟件進(jìn)行數(shù)據(jù)整理和基因ID轉(zhuǎn)化為基因名,得到胃癌基因的表達(dá)矩陣。通過(guò)染色質(zhì)調(diào)節(jié)因子列表,利用R軟件提取在胃癌中顯著差異表達(dá)的染色質(zhì)調(diào)節(jié)因子。
1.3COX回歸分析篩選具有預(yù)后價(jià)值的染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA 將臨床生存數(shù)據(jù)和染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA的表達(dá)矩陣通過(guò)R軟件的“survival”包進(jìn)行Kaplan-Meier(K-M)生存分析、單因素和多因素COX回歸分析,篩選出具有預(yù)后價(jià)值的染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA(P<0.03),進(jìn)而構(gòu)建胃癌染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA的預(yù)后風(fēng)險(xiǎn)模型。
1.4染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA的共表達(dá)網(wǎng)絡(luò) 提取染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA表達(dá)矩陣中多因素COX回歸分析得到的具有預(yù)后價(jià)值的LncRNA,通過(guò)Cytoscape軟件構(gòu)建染色質(zhì)調(diào)節(jié)因子相關(guān)mRNA和LncRNA共表達(dá)網(wǎng)絡(luò),并采用R軟件繪制桑基圖和預(yù)后相關(guān)的LncRNA生存曲線。
1.5風(fēng)險(xiǎn)模型的構(gòu)建及生存分析 利用風(fēng)險(xiǎn)值計(jì)算公式得出患者的風(fēng)險(xiǎn)值,按照風(fēng)險(xiǎn)值的中位數(shù)將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,利用R軟件的“survival”包和“survminer”包繪制高低風(fēng)險(xiǎn)組的生存曲線,并采用R軟件的“survival ROC”包繪制受試者工作特征(ROC)曲線圖評(píng)估風(fēng)險(xiǎn)模型準(zhǔn)確性。根據(jù)患者的風(fēng)險(xiǎn)評(píng)分繪制熱圖、生存曲線及生存狀態(tài)圖。
1.6統(tǒng)計(jì)學(xué)處理 胃癌染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA相關(guān)性檢驗(yàn),閾值過(guò)濾條件為相關(guān)系數(shù)>0.3且P<0.001。采用K-M法進(jìn)行不同組的生存差異比較。使用單因素和多因素COX回歸分析來(lái)確定獨(dú)立預(yù)后因子。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。所有數(shù)據(jù)分析基于R軟件4.31版、perl軟件5.32版。
2.1胃癌差異表達(dá)的染色質(zhì)調(diào)節(jié)因子 從TCGA下載胃癌的轉(zhuǎn)錄組測(cè)序數(shù)據(jù)后利用R軟件進(jìn)行數(shù)據(jù)整理和基因ID轉(zhuǎn)化為基因名,得到胃癌基因的表達(dá)矩陣。利用R軟件提取在胃癌中顯著差異表達(dá)的染色質(zhì)調(diào)節(jié)因子(|log2FC|>1,P<0.05)148個(gè),其中高表達(dá)129個(gè),低表達(dá)19個(gè)(圖1A~C)。
注:A為染色質(zhì)調(diào)節(jié)因子表達(dá)熱圖;B為染色質(zhì)調(diào)節(jié)因子表達(dá)火山圖,FDR為錯(cuò)誤發(fā)現(xiàn)率;C為染色質(zhì)調(diào)節(jié)因子表達(dá)箱圖。
2.2染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA 通過(guò)Sperman相關(guān)性分析得到1 243個(gè)與染色質(zhì)調(diào)節(jié)因子相關(guān)的LncRNA,進(jìn)一步通過(guò)COX單因素和多因素回歸分析篩選出12個(gè)具有預(yù)后價(jià)值的LncRNA。采用Cytoscape軟件進(jìn)行染色質(zhì)調(diào)節(jié)因子與LncRNA的共表達(dá)網(wǎng)絡(luò)的構(gòu)建并利用R語(yǔ)言軟件進(jìn)行?;鶊D分析。?;鶊D結(jié)果顯示,AC010768.2、AL353804.1、AL355574.1、AC127521.1、LINC01315、AC005586.1、AC010719.1和AL590666.2是保護(hù)性LncRNA,而AL161785.1、HAGLR、AP001033.2和AL359182.1則為風(fēng)險(xiǎn)性LncRNA(圖2)。
注:A為染色質(zhì)調(diào)節(jié)因子與相關(guān)LncRNA共表達(dá)網(wǎng)絡(luò);B為染色質(zhì)調(diào)節(jié)因子與相關(guān)LncRNA?;鶊D。
2.3染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA的生存分析 利用R語(yǔ)言進(jìn)行具有預(yù)后價(jià)值的染色質(zhì)相關(guān)LncRNA的生存分析,結(jié)果顯示4個(gè)LncRNA在高表達(dá)時(shí)生存期顯著降低,提示AL161785.1、HAGLR、AP001033.2和AL359182.1可能為致癌因素(圖3A~D);8個(gè)LncRNA在高表達(dá)時(shí)患者生存期顯著升高,提示AC010768.2、AL353804.1、AL355574.1、AC127521.1、LINC01315、AC005586.1、AC010719.1和AL590666.2(圖3E~L)可能為抑癌因素。
2.4染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA風(fēng)險(xiǎn)預(yù)測(cè)模型的構(gòu)建 以風(fēng)險(xiǎn)值的中位數(shù)作為分界點(diǎn)將胃癌患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,利用R語(yǔ)言進(jìn)行生存分析發(fā)現(xiàn),與低風(fēng)險(xiǎn)組的胃癌患者相比,高風(fēng)險(xiǎn)組的總生存期(OS)顯著降低(圖4A)。熱圖結(jié)果顯示,AL161785.1、HAGLR、AP001033.2和AL359182.1在高風(fēng)險(xiǎn)組中表達(dá)高于低風(fēng)險(xiǎn)組,而AC010768.2、AL353804.1、AL355574.1、AC127521.1、LINC01315、AC005586.1、AC010719.1和AL590666.2在低風(fēng)險(xiǎn)組中的表達(dá)高于高風(fēng)險(xiǎn)組(圖4B)。此外,生存狀態(tài)散點(diǎn)圖顯示高風(fēng)險(xiǎn)組患者的生存時(shí)間低于低風(fēng)險(xiǎn)組(圖4C~D)。
注:A為風(fēng)險(xiǎn)生存曲線;B為12個(gè)染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA表達(dá)熱圖;C為風(fēng)險(xiǎn)評(píng)分曲線;D為生存狀態(tài)圖。
2.5獨(dú)立預(yù)后分析與ROC曲線驗(yàn)證 根據(jù)胃癌患者的年齡、腫瘤分期等臨床信息,利用R語(yǔ)言進(jìn)行單因素及多因素的COX回歸分析,結(jié)果顯示風(fēng)險(xiǎn)預(yù)測(cè)模型的單因素和多因素分析差異均有統(tǒng)計(jì)學(xué)意義(圖5A~B)。為了驗(yàn)證風(fēng)險(xiǎn)模型的預(yù)測(cè)能力進(jìn)行ROC曲線分析,結(jié)果顯示風(fēng)險(xiǎn)模型的曲線下面積(AUC)為0.729,提示其具有較好的預(yù)測(cè)能力(圖5C)。
注:A為單因素COX分析結(jié)果;B為多因素COX分析結(jié)果;C為ROC曲線。
胃癌是一種常見(jiàn)的惡性腫瘤,其發(fā)生發(fā)展常與基因的異常表達(dá)密切相關(guān)[16]。染色質(zhì)調(diào)節(jié)因子在胃癌中發(fā)揮重要,例如,在胃癌細(xì)胞中染色質(zhì)調(diào)節(jié)因子BMI1通過(guò)調(diào)節(jié)細(xì)胞周期和干細(xì)胞標(biāo)志物表達(dá),促進(jìn)了胃癌的增殖和轉(zhuǎn)移[17]。已有一些研究指出,LncRNA與染色質(zhì)調(diào)節(jié)因子具有相關(guān)性,如SUN等[18]發(fā)現(xiàn)LncRNA HOXA11-AS通過(guò)與染色質(zhì)調(diào)節(jié)因子DNMT1相互作用,進(jìn)而調(diào)節(jié)了胃癌中多個(gè)關(guān)鍵基因的表達(dá),促進(jìn)了胃癌細(xì)胞的增殖和侵襲,而FANG等[19]發(fā)現(xiàn)LncRAN UCA1通過(guò)增加染色質(zhì)調(diào)節(jié)因子EZH2的表達(dá),促進(jìn)了腫瘤細(xì)胞的增殖和耐藥性產(chǎn)生。
本研究基于TCGA數(shù)據(jù)庫(kù)下載的數(shù)據(jù),整理及分析發(fā)現(xiàn)了148個(gè)在胃癌中差異表達(dá)的染色質(zhì)調(diào)節(jié)因子,然后進(jìn)行染色質(zhì)調(diào)節(jié)因子與LncRNA的共表達(dá)分析得到1 243個(gè)與染色質(zhì)共表達(dá)的LncRNA,進(jìn)一步通過(guò)單因素及多因素COX回歸分析篩選出具有預(yù)后價(jià)值的12個(gè)LncRNA并構(gòu)建預(yù)后模型。某些LncRNA在構(gòu)建預(yù)后模型中扮演著重要角色,并與多種疾病和腫瘤密切相關(guān)。AC010768.2被確定為胃癌患者潛在的自噬相關(guān)LncRNA預(yù)后信號(hào)[20],而AL590666.2則有望成為青光眼的潛在生物標(biāo)志物[21]。LIAO等[22]研究還發(fā)現(xiàn)AL161785.1、AL353804.1、AL355574.1、AC005586.1和AC010719.1這5個(gè)LncRNA也適用于糖酵解相關(guān)LncRNA的胃癌預(yù)后模型的構(gòu)建,這項(xiàng)研究進(jìn)一步突顯了它們?cè)陬A(yù)后評(píng)估中的重要性。此外,LINC01315被證明可以通過(guò)激活Wnt/β-catenin信號(hào)通路促進(jìn)結(jié)直腸癌細(xì)胞的發(fā)生和發(fā)展[23]。在12個(gè)LncRNA中HAGLR是差異最為顯著的高風(fēng)險(xiǎn)LncRNA,該LncRNA在人癌癥進(jìn)展過(guò)程中起著重要的調(diào)控作用。ZHAI等[24]發(fā)現(xiàn),HAGLR海綿吸附miR-4644,增加 ASB11 的表達(dá)水平,進(jìn)一步促進(jìn)黑色素瘤的發(fā)生發(fā)展;在三陰性乳腺癌中,HAGLR也可以通過(guò)海綿吸附 miR-335-3p 調(diào)節(jié) WNT2 促進(jìn)三陰性乳腺癌進(jìn)展[25];在肺腺癌中,HAGLR可以招募染色質(zhì)調(diào)節(jié)因子DNMT1調(diào)節(jié)作用于E2F1的啟動(dòng)子甲基化進(jìn)而影響E2F1的表達(dá)促進(jìn)肺腺癌的發(fā)生發(fā)展[26]。這些研究都表明HAGLR在腫瘤的發(fā)生發(fā)展中發(fā)揮重要的作用,具有作為胃癌靶向治療研究的潛在價(jià)值。未來(lái)的研究將進(jìn)一步揭示這些LncRNA的作用機(jī)制,并為開(kāi)發(fā)更有效的治療方案提供支持。
綜上所述,本研究結(jié)果表明高分值的染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA胃癌患者預(yù)后更差,并通過(guò)對(duì)生存、獨(dú)立預(yù)后和ROC曲線等分析,進(jìn)一步驗(yàn)證了該預(yù)測(cè)模型的準(zhǔn)確性和可靠性。因此,染色質(zhì)調(diào)節(jié)因子相關(guān)LncRNA的風(fēng)險(xiǎn)模型對(duì)指導(dǎo)胃癌患者治療及預(yù)后具有一定臨床價(jià)值和意義。
國(guó)際檢驗(yàn)醫(yī)學(xué)雜志2024年7期