石青春,潘立民,布 凡,王永強,關睿騫
肝癌屬于人類高發(fā)性惡性腫瘤,為全球第六大多發(fā)性癌癥和第四大癌癥死亡原因。在全球癌癥病例中肝癌占第五位,約為8.1%,占男性癌癥致死原因的第二位[1]。肝細胞癌(hepatocellular carcinoma,HCC)是常見肝癌中占比和發(fā)病率最高的類型。HCC主要致病因素是乙型肝炎病毒、丙型肝炎病毒感染和酗酒等[2],近些年發(fā)現(xiàn)非酒精性脂肪性肝病和代謝綜合征相繼成為HCC相關的致病風險[3]。細胞壞死(cell necrosis)是一種由外部損傷誘導的、不受控制的、與細胞凋亡迥異的細胞死亡形式。在癌癥缺血損傷模型觀察到細胞死亡的主要形式是癌性壞死。癌細胞從細胞凋亡向繼發(fā)性壞死的轉變表明,細胞凋亡與癌性壞死是密切相關的現(xiàn)象。細胞壞死可見于HCC和其他大部分腫瘤,往往可以借此判斷預后[4]。細胞壞死還被認為在腫瘤發(fā)生、癌癥轉移、癌癥免疫等癌癥生物學調(diào)控方面扮演關鍵角色。細胞壞死也被認為是一種“失效安全”機制,即當出現(xiàn)凋亡損害時,腫瘤細胞則停止進展[5]。我們從癌癥基因圖譜(TCGA)數(shù)據(jù)庫篩選并下載了HCC患者mRNA基因水平譜及其相對應的臨床資料數(shù)據(jù),在TCGA隊列中構建了細胞壞死相關基因預后模型,同時進行了功能富集分析,目的是探討其潛在的生物學機制。
1.1 數(shù)據(jù)下載 本研究在TCGA-HCC數(shù)據(jù)庫下載了370例HCC患者基因水平譜及臨床和病理學資料信息,采用標準化每千個堿基的轉錄每百萬映射讀取的fragments(fragments per kilobase of exon model per million mapped fragments,F(xiàn)PKM)格式。本研究絕對遵循TCGA數(shù)據(jù)庫相關的訪問政策和出版準則。與細胞壞死相關的基因來自京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)數(shù)據(jù)庫的標志物,最終納入了126個細胞壞死相關基因。
1.2 細胞壞死相關基因預后模型的構建與驗證 在126個細胞壞死相關基因中,通過R語言“l(fā)imma”包對HCC患者相應組織作基因差異水平分析,篩選出與細胞壞死相關的具有差異性的基因。篩選基因的閾值為差異倍數(shù)(fold change,F(xiàn)C)取以2為底的對數(shù)|log2FC|>1,錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.05,同步得出對總生存期(overall survival,OS)的單因素Cox 回歸分析,以確定具有預后價值的細胞壞死相關基因。為了最大化降低過度擬合風險,我們采用R語言“glmnet”包結合LASSO Cox 回歸分析構建預后分析模型[6、7]。在回歸分析中設定的自變量為與預后相關的細胞壞死相關基因水平,因變量為TCGA隊列中HCC患者總生存期和健康狀態(tài),得到最優(yōu)化模型的差異基因及對應預后狀態(tài)的回歸系數(shù)。根據(jù)每個基因的FPKM標準化水平及其相應的回歸系數(shù)計算患者的風險評分[危險得分=e(基因1的FPKM標準化水平量×相應的回歸系數(shù))+…+基因n的FPKM標準化水平×相應的回歸系數(shù)]。根據(jù)得到計算隊列中的風險評分求其中的位數(shù)。根據(jù)中位數(shù)將患者分為高風險組和低風險組。應用 R語言“survival ROC”繪制高和低風險組生存曲線。同時,應用R語言的“timeROCR”進行ROC曲線分析,評估壞死特異基因預后模型的預測能力。
1.3 功能富集分析 運用R包“l(fā)imma ”對高風險組和低風險組相關基因差異水平分析,選擇出風險差異基因,選擇閾值為|log2FC|>1,F(xiàn)DR<0.05。應用R語言“clusterprofiler”對不同風險值的兩組細胞壞死差異基因進行基因本體(gene ontology,GO)分析和KEGG分析?;赗語言“GSVA”對免疫相關的通路進行單樣本基因集富集分析(single sample gene set enrichment analysis,ssGSEA)。
1.4 統(tǒng)計學分析 應用Log-Rank 檢驗和 Kaplan-Meier生存曲線比較高低風險組之間的總體生存期。應用單因素和多因素Cox回歸分析確定該模型對HCC患者總體生存期的獨立預測價值。所有數(shù)據(jù)統(tǒng)計學分析均基于R平臺(Version 4.0.2)。如果以上分析方法中未提出特殊說明,則認為P<0.05具有統(tǒng)計學意義。
2.1 確定與細胞壞死相關的差異預后基因 本研究納入了TCGA數(shù)據(jù)庫中374個腫瘤組織和50個非腫瘤組織,共納入370例HCC患者,治療后隨訪時間均大于1個月。在與TCGA作差異水平時,得到腫瘤組織和非腫瘤組織間與細胞壞死相關的基因水平大部分都有差異(圖1)。由于這些相關基因水平的臨床意義不同,突變率≥3%為11個基因(圖2)。進行單因素Cox 回歸分析,選出23個差異水平基因與總體生存期獨立相關(P<0.05,圖3)。
圖1 細胞壞死差異水平基因的箱線圖
圖2 細胞壞死差異水平基因突變圖
圖3 細胞壞死差異水平基因單因素回歸分析的森林圖
2.2 構建預后風險模型 提取23個相關基因水平譜,構建HCC患者預后生存模型。經(jīng)過回歸分析,得到6個顯著相關的基因,即USP21、SQSTM1、HSP90AA1、PARP1、H2A.Z.1和PPIA。利用風險評分計算公式構建預后風險模型,風險評分=(USP21水平量×0.456+SQSTM1水平量×0.266+HSP90AA1水平量×0.360-PARP1水平量×0.325+H2A.Z.1水平量×0.247+PPIA水平量×0.301)。以中位風險評分為閾值,將TCGA隊列中HCC患者小于閾值者劃為低風險組(n=185)和大于閾值者劃為高風險組(n=185),繪制6個風險基因水平熱圖。經(jīng)Kaplan-Meier生存曲線分析顯示,高風險組HCC患者生存率顯著低于低風險組(圖4)?;谑茉囌吖ぷ魈卣髑€ (receiver operating characteristic curve,ROC)評估HCC患者預后危險因素,其風險評分的ROC曲線下面積(AUC)=0.774,顯著高于其他臨床因素的AUC,進一步說明該模型在預測HCC患者預后風險的可信度[8]。
圖4 TCGA隊列中高危組與低危組OS比較
2.3差異水平基因的功能富集 GO功能富集分析生物學功能條目457個,其中分子功能(molecular function,MF)48個,細胞組成(cellular component,CC)44個,生物過程(biological process,BP)365個。在這些條目中,最突出的生物學功能為腫瘤壞死因子-介導的信號通路、I-kappaB激酶/NF-kappaB信號通路控、程序性細胞凋亡和細胞壞死(圖5)。在BP中是對I-kappaB激酶/NF-kappaB信號通路的調(diào)控,它們能夠調(diào)控一系列參與細胞生理活動的基因。這些基因參與免疫、炎癥、應激和淋巴形成等生理活動。在細胞組成中的是蛋白-DNA復合物、核小體、核染色質和DNA包裝復合物。在分子功能方面,基因泛素連接酶大多富集。據(jù)馬克斯-普朗克研究所報道稱,人體細胞中存在一種“SCF-RBR E3-E3”泛素連接酶超級組裝,可以抵抗腫瘤的發(fā)生[9]。在KEGG通路富集分析中,這些基因與細胞壞死凋亡的通路顯著相關,其中涉及免疫相關通路和NOD樣受體信號通路。大多數(shù)富集通路的Z值得分都大于零(Z值越高,富集途徑的水平量越高),表明HCC患者所有通路活動增強。為了驗證上述得出的高、低風險組免疫相關通路是否存在差異,經(jīng)ssGSEA分析評價相關免疫通路的評分,結果ssGSEA分析顯著富集在高風險組相關通路,包括NOD樣受體信號通路、癌癥通路、Fcγ-R介導的吞噬機制和細胞凋亡。與KEGG富集中的細胞壞死凋亡、NOD樣受體信號通路和炎癥相關通路相印證,說明這些通路具有同一性。
圖5 差異水平細胞壞死基因logFC散點圖GO富集分析
細胞壞死指的是一種不可控的細胞死亡形式,與細胞凋亡和細胞自噬等可控的細胞死亡形式差別巨大。近幾年基于遺傳基因、生化功能證據(jù)和抑制細胞壞死的特定化學制劑的發(fā)現(xiàn),將細胞壞死重新定義為一種可調(diào)節(jié)的細胞死亡形式[10]。細胞壞死是由絲氨酸/蘇氨酸激酶(RIPK)及混交激酶域蛋白(MLKL)介導的最具特征的調(diào)節(jié)性細胞壞死形式。目前,研究控制細胞壞死機制及與人體內(nèi)部結構的相關性,揭示出細胞壞死在人類疾病的發(fā)病機制中具有重要作用[5,11]。有研究者在酒精性肝病和非酒精性脂肪性肝炎患者肝細胞中檢測到RIPK3上調(diào),提示可能導致肝細胞死亡和炎癥反應為依賴RIPK3的細胞壞死[12、13]。越來越多的證據(jù)表明,細胞壞死在癌癥患者的預后、癌癥的進展和轉移、癌癥的免疫監(jiān)測和癌癥亞型中起著至關重要的作用。通過各種藥物、化合物和藥物誘導或操縱壞死途徑來靶向壞死也已成為一種在癌癥治療中繞過凋亡耐藥性和支持抗腫瘤免疫的新方法[14]。
本研究通過TCGA數(shù)據(jù)庫篩選出6個與細胞壞死高度相關的基因。同時,在GO、KEGG和ssGSEA功能富集中分析細胞壞死與免疫相關通路的潛在聯(lián)系。其中USP21水平可影響HCC細胞增殖和侵襲,對HCC進展有抑制作用,為HCC治療提供了生物標志物和可能的靶點,而且USP21作為RIPK1的負調(diào)控因子,可抑制RIPK介導調(diào)節(jié)性細胞壞死[15、16]。SQSTM1是一種重要的選擇性自噬接頭蛋白,其含有泛素相關結構域和腫瘤壞死因子受體相關因子,可將壞死體組裝到自噬體上觸發(fā)細胞壞死[17]。HSP90AA1是一種癌蛋白,其功能為調(diào)節(jié)特定靶蛋白的組裝、操作、折疊、降解和c-MYC基因水平。許多受HSP90AA1調(diào)控的特定靶蛋白都是原癌基因產(chǎn)物,如c-MYC或腫瘤發(fā)病過程中重要的信號轉導因子,所以抑制HSP90AA1可能會通過多種途徑影響癌細胞的生長和存活,使HSP90AA1成為一個很有前途的抗腫瘤藥物靶點[18]。PARP的過度激活也被證明會導致特定的程序性細胞死亡途徑,包括細胞壞死誘導因子和凋亡誘導因子的釋放,其下屬亞型PARP1的激活對HCC在體外和體內(nèi)的存活都至關重要[19、20]。H2A.Z是一種致癌的組蛋白變體,H2A.Z.1為H2A.Z的一個亞型,其通過選擇性調(diào)節(jié)細胞周期和EMT-調(diào)節(jié)蛋白在肝癌發(fā)生過程中起作用。HCC組織PPIA水平明顯高于對應的瘤周組織,PPIA水平與這些組織中的腫瘤大小顯著相關。健康人血清PPIA(sPPIA)水平顯著高于HCC患者。敲除或過高水平的PPIA分別可下調(diào)和上調(diào)細胞生長,PPIA可能通過調(diào)節(jié)細胞生長在HCC發(fā)生過程中發(fā)揮關鍵作用,并可作為HCC患者的一種新的標志物和治療分子靶點。
細胞壞死作為獨特的細胞死亡形式有可能成為治療腫瘤的新靶點。本研究有一定局限性,首先,本文所建立的預后模型只是通過TCGA數(shù)據(jù)庫構建的,需要其他獨立外部數(shù)據(jù)庫驗證該模型的有效性。因此,該模型的實用性需進一步評估。