趙小樂,錢波,邵泉,
肝癌是全球最常見的惡性腫瘤之一,發(fā)病率全球排名第五,男性死亡率排名第二[1]。盡管早期肝癌患者可行腫瘤切除、肝移植等手術治療,但由于供體短缺等原因,大多數(shù)患者仍不適用。很多患者被診斷為疾病晚期,因此錯過了接受外科手術等根治性治療的機會。此外,對于接受手術切除的患者,復發(fā)仍然是一個主要問題,而且50%復發(fā)的患者在一年內(nèi)死亡[2-3]。由于復雜的病因及高復發(fā)性使肝癌預后預測具有挑戰(zhàn)性,考慮到肝癌治療策略有限,因此還需要開發(fā)新的預后模型。
隨著微陣列技術和高通量測序技術的發(fā)展,人們現(xiàn)在能夠通過生物信息學分析來識別與腫瘤預后和進展相關的關鍵基因,并在此基礎上發(fā)現(xiàn)了許多預后標志物,建立了各種預后模型[4-5]。銅離子參與體內(nèi)眾多生化反應,當體內(nèi)銅離子過高時,會對細胞產(chǎn)生毒性,改變氧化還原狀態(tài)。有研究表明,與健康人群相比,癌癥患者的血清銅水平升高,并與疾病的嚴重程度和對治療的反應相關[6]。最近,一種不同于已知細胞死亡機制的新型細胞死亡方式引起人們廣泛關注,它主要通過銅離子與線粒體中的三羧酸循環(huán)中的脂?;煞种苯咏Y合,從而導致脂酰化蛋白質(zhì)聚集和隨后的鐵硫簇蛋白下調(diào),最終使得蛋白質(zhì)毒性應激并導致細胞死亡[7-8],并且從中發(fā)現(xiàn)了幾個與銅死亡相關的基因,這可能為預測肝癌患者的預后提供新的策略。
本研究采用生物信息學的方法分析銅死亡相關基因在肝癌與正常組織中的差異表達,利用聚類分析和LASSO回歸分析篩選出與預后相關的基因并構建風險預測模型,以期為肝癌患者早期診斷和預后評估提供參考依據(jù)。
從腫瘤基因組圖譜(TCGA)數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)下載了371例肝癌患者腫瘤組織和50例正常肝組織的RNA測序(RNA-seq)數(shù)據(jù)集和臨床資料。采用R軟件“Limma”包對轉錄組基因表達譜進行預處理。臨床資料主要包括患者的年齡、性別、腫瘤分級、腫瘤分期、生存時間和生存狀態(tài)等信息。此外,為了減少該分析中潛在的統(tǒng)計偏差,排除了生存時間未知且無生存狀態(tài)的患者。
選擇目前已知的10個銅死亡相關基因,提取這10個基因的表達矩陣,并使用Wilcoxon秩和檢驗進行組間差異表達分析。利用“corrplot”軟件包進行相關性分析,基于“pheatmap”軟件包繪制熱圖。
移除50例正常組織樣本,使用“Consensus-ClusterPlus”軟件包對肝癌患者進行一致性聚類分析,將其分成Cluster1和Cluster2組,分析不同的臨床特征和總體生存率在兩組聚類中是否存在差異。
使用“survival”軟件包進行單因素Cox回歸分析篩選預后相關基因,使用LASSO回歸分析以消除假陽性預后相關銅死亡基因,使用“glmnet”和“survival”軟件包,計算基因之間的相關回歸系數(shù),根據(jù)回歸系數(shù)加權建立肝癌預后風險評估公式:
公式中n指基因數(shù)量,Expi表示每個基因的表達量,Coei表示回歸系數(shù)。根據(jù)不同樣品中特征基因的表達,為每例患者分配風險評分,根據(jù)評分中位值將患者分為高風險組和低風險組,通過Kaplan-Meier曲線和計算ROC曲線下的面積(AUC)評估風險評分的預后意義和診斷效能。將性別、年齡、TNM分期、組織學分級和風險評分納入單因素和多因素Cox回歸中,分析多種臨床特征干擾下風險評分的預后獨立性,并通過“forestplot”軟件包的森林圖可視化每個變量的P值、風險比(HR)和95%CI。
為了獲得與疾病發(fā)生發(fā)展所涉及的生物學功能和信號通路,使用仙桃學術平臺(https://www.xiantao.love/)進行注釋和可視化,對5個銅死亡相關基因進行基因本體(GO)分析和京都基因組百科全書(KEGG)通路分析。
采用R語言(4.1.3)軟件進行統(tǒng)計分析。采用Wilcoxon秩和檢驗進行兩組之間基因差異分析。Spearman相關檢驗分析基因表達間的相關性。Kaplan-Meier法繪制生存曲線。ROC曲線評估預后模型的敏感度和特異性。P<0.05為差異有統(tǒng)計學意義。
在TCGA隊列中,肝癌組織和正常組織樣本之間10個銅死亡相關基因的表達差異均有統(tǒng)計學意義(P<0.05),其中FDX1在肝癌組織中下調(diào),其余9個基因表達上調(diào),見圖1A~B。相關性分析顯示,大部分銅死亡相關基因都呈正相關,其中LIPT1與MTF1呈現(xiàn)最強正相關(r=0.46);而FDX1與CDKN2A(r=-0.24),F(xiàn)DX1與LIPT1(r=-0.2)呈顯著負相關,見圖1C。
圖1 銅死亡相關基因在肝癌中的表達水平及其相關性Figure 1 Expression level and correlation of cuprotosis-related genes in liver cancer
根據(jù)銅死亡相關基因的表達譜,對TCGA數(shù)據(jù)庫中371例肝癌樣本進行聚類分析。當k=2時,肝癌樣本組內(nèi)相關性最高,組間相關性較低,聚類效果穩(wěn)定,確定了2個肝癌亞型,見圖2A~C。Cluster1的生存時間明顯短于Cluster2(P<0.05),見圖2D。此外,Cluster1與診斷時較高的分期(P<0.01)和較高的死亡狀態(tài)(P<0.05)顯著相關,而與腫瘤分級、年齡、性別無關(P>0.05),見圖2E。
圖2 一致性聚類分析銅死亡相關基因Figure 2 Consistent cluster analysis of cuprotosis-related genes
移除所有生存時間未知且無生存狀態(tài)的樣本后,共有365例肝癌樣本與具有完整生存信息的相應患者匹配。將所有銅死亡相關基因納入單因素Cox回歸模型中,篩選得到5個基因(LIPT1、DLAT、MTF1、GLS、CDKN2A)均為HR>1(且P<0.05)的危險基因,見圖3A。通過LASSO回歸分析進一步減少風險模型中包含的基因數(shù)量,最終5個基因全部被納入風險模型中,見圖3B~C。風險評分計算如下:風險評分=(0.293×LIPT1exp)+(0.064×DLATexp)+(0.031×MTF1exp)+(0.013×GLSexp)+(0.041×CDKN2Aexp)。根據(jù)風險評分公式計算的中位值將患者分為高危組和低危組。Kaplan-Meier生存曲線結果表明高危組在肝癌患者中的生存率較差,見圖3D,隨著風險評分的上升,死亡的患者例數(shù)明顯上升(P<0.05),這表明風險評分和生存時間顯著相關,見圖3E。ROC曲線分析顯示該模型預測肝癌患者術后1、3、5年生存率的AUC值分別為 0.733、0.646、0.635,見圖3F。
圖3 篩選獨立預后因素Figure 3 Screening of independent prognostic factors
單因素Cox回歸分析結果表明,風險評分(HR=1.146,P<0.001)和分期(HR=1.680,P<0.001)是肝癌惡化的危險因素,見圖4A。多因素Cox分析結果表明,在調(diào)整其他混雜因素后,風險評分(HR=1.117,P<0.001)仍是一個獨立的預后因素,見圖4B。計算風險評分的AUC值為0.727,明顯高于其他臨床特征的AUC值,見圖4C,表明5個銅死亡相關基因?qū)Ω伟┑念A后風險預測模型可靠。高危組和低危組患者中的5個銅死亡相關基因在肝癌的分級和分期之間存在統(tǒng)計學差異(P<0.01),見圖4D。
圖4 風險預測模型的獨立預后價值Figure 4 Independent prognostic value of risk prediction models
在生物學過程(BP)方面,5個銅死亡基因主要在巨噬細胞凋亡過程及其調(diào)控、異染色質(zhì)組裝等方面富集,見圖5A。對于分子功能(MF),銅死亡基因在轉移酶活性、?;D移酶活性等方面富集,見圖5B。對于細胞成分(CC),銅死亡基因在線粒體基質(zhì)、線粒體蛋白復合物以及氧化還原酶復合物等方面富集,見圖5C。在KEGG途徑富集分析中,銅死亡基因主要與丙氨酸、天冬氨酸和谷氨酸的代謝以及檸檬酸循環(huán)(TCA循環(huán))有關,見圖5D。
圖5 銅死亡相關基因的GO和KEGG富集分析Figure 5 GO and KEGG functional enrichment analysis of cuprotosis-related genes
本研究擬探討銅死亡相關基因在肝癌中的作用,發(fā)現(xiàn)其與肝癌的臨床特征密切相關。首先,我們分析了10個目前已知的銅死亡相關基因的mRNA水平在肝癌組織和正常組織中的表達量,發(fā)現(xiàn)全部基因的表達量都存在差異。然后,基于這些差異表達的基因進行一致性聚類分析,確定了肝癌的兩個亞組,第1亞組的預后較差。為了進一步評估這些銅死亡相關基因的預后價值,通過單因素Cox回歸分析和LASSO回歸分析構建了5個與銅死亡相關基因(LIPT1、DLAT、MTF1、GLS和CDKN2A)的風險特征模型,研究表明風險評分不僅是一個獨立的預后指標,而且可以預測肝癌的臨床特征。此外,功能分析顯示,與TCA循環(huán)相關的通路被富集。因此,利用5個銅死亡相關基因建立的肝癌預后模型是有意義的。
DLAT、MTF1、GLS、CDKN2A屬于丙酮酸脫氫酶復合體(PDC)中編碼蛋白的基因,該復合體是丙酮酸進入線粒體后轉化為乙酰-CoA的唯一途徑。而二氫硫辛酰胺轉乙?;富颍―LAT)屬于PDC E2亞單位,Goh等[9]發(fā)現(xiàn)DLAT在胃癌細胞中表達顯著上調(diào),Shan等[10]發(fā)現(xiàn)DLAT通過促進戊糖磷酸途徑的激活進而促進腫瘤細胞生長。金屬調(diào)控轉錄因子1基因(MTF1)是一種鋅指轉錄因子,通過激活下游靶基因促進細胞存活。Ji等[11]研究表明,MTF1具有致癌作用,并通過促進上皮—間充質(zhì)轉化從而促進卵巢腫瘤轉移。在p53存在的乳腺癌細胞中,MTF1可被鋅和銅激活。MTF1可能是一種新的早期診斷生物標志物,也是臨床治療的藥物靶點。谷氨酰胺酶基因(GLS)轉化為三羧酸循環(huán)代謝產(chǎn)物是促進癌細胞增殖的關鍵代謝過程,已被確定為癌癥代謝的標志[12]。Guo等[13]發(fā)現(xiàn)GLS的表達在子宮內(nèi)膜癌進展過程中升高,并與不良預后相關。Zhang等[14]發(fā)現(xiàn)線粒體GCN5L1通過調(diào)節(jié)GLS乙酰化和活性在肝癌發(fā)展過程中發(fā)揮腫瘤調(diào)節(jié)器的作用。細胞周期依賴性激酶抑制基因(CDKN2A)又稱為P16基因,是一種多腫瘤抑制基因,能夠參與細胞周期的調(diào)控,抑制細胞增殖和分裂,而腫瘤細胞增殖速度較正常細胞快,這可能是因為腫瘤細胞CDKN2A基因突變或失活,從而使其增殖分化速度增加。而關于脂酰轉移酶1基因(LIPT1)的相關報道較少,其突變可引起丙酮酸和α-酮戊二酸脫氫酶繼發(fā)缺乏的Leigh病,這是一種是由于呼吸鏈亞單位缺失造成的先天性代謝紊亂性疾病,是一種線粒體腦肌病[15]。銅死亡觀點的提出及進一步揭示的具體機制,將為銅失調(diào)疾病、部分大量表達脂?;€粒體蛋白及具有高度呼吸作用的癌癥等疾病提供新的治療策略。
本研究有一定局限性:首先,使用的是公共數(shù)據(jù)庫的回顧性數(shù)據(jù),缺乏前瞻性臨床數(shù)據(jù)來驗證其預后意義;其次,考慮到肝癌是一種典型的多基因疾病,本文僅用5個銅死亡相關基因來建立預后模型,可能缺少其他能更精準預測肝癌預后的基因。
綜上所述,本研究使用5個銅死亡相關基因構建了一個新的風險評分模型,并且與生存時間獨立相關,為預測肝癌預后提供了新的見解。