梁 宇,陳 穎,王豪杰,任銘心,劉高峰,劉長青
(1.蚌埠醫(yī)學院臨床醫(yī)學院,安徽 蚌埠 233000;2.蚌埠醫(yī)學院生命科學學院,安徽 蚌埠 233000)
肝細胞癌(hepatocellular carcinoma,HCC)是最常見的原發(fā)性肝癌,其發(fā)病率呈不斷上升趨勢,根據(jù)世界衛(wèi)生組織國際癌癥研究機構發(fā)布的2020 年最新癌癥負擔數(shù)據(jù)。HCC 是世界范圍內(nèi)第六大癌癥,且死亡率居世界第三[1]。HCC 具有起病隱匿、惡性度高、進展快、預后差和死亡率高等特點。使得HCC 患者的5 年生存率僅為10.1%,但患者若早期及時發(fā)現(xiàn)且經(jīng)手術治療,5 年生存率可提高至50%左右[2]。然而,絕大多數(shù)HCC 患者就診時已處于晚期,此時手術治療的效果不好[3]。因此,探索新的預后預測和個體化治療的潛在標志物具有重要的臨床意義。
谷氨酰胺在細胞存活和生長中具有關鍵作用。谷氨酰胺可通過不同酶和基因通過不同細胞信號通路的多種作用機制來合成細胞生長所需的核酸、脂質和蛋白質[4]。谷氨酰胺不是必需氨基酸,但卻被認為是條件必需氨基酸,尤其是在分解代謝應激條件下,如手術后和創(chuàng)傷等,胃腸道、腎臟和免疫系統(tǒng)等對谷氨酰胺的需求急劇增加[4]。此外,谷氨酰胺與腫瘤惡性進展亦密切相關[5]。由于腫瘤細胞快速增殖,谷氨酰胺作為腫瘤細胞供能的養(yǎng)料,以及合成核苷酸、蛋白質和GSH 合成等重要前體,致使谷氨酰胺的合成不能滿足腫瘤增殖的需求,此時谷氨酰胺轉變?yōu)闂l件性必需氨基酸[6]。有研究表明,腫瘤細胞通過谷氨酰胺轉運蛋白攝取利用谷氨酰胺,為腫瘤細胞提供能量和生物合成,從而促進腫瘤的惡性進展[7]。近期研究表面,谷氨酰胺代謝廣泛參與肝癌的增殖和侵襲轉移等環(huán)節(jié),表明谷氨酰胺代謝是肝癌的潛在預后和治療靶標。
免疫療法與手術、化療和放療一起成為癌癥治療的新的可選方案[8]。谷氨酰胺代謝通過影響腫瘤微環(huán)境(TME),來調(diào)控腫瘤的發(fā)生發(fā)展[9]。在三陰性乳腺癌中,腫瘤細胞會競爭性地捕食TME 中的谷氨酰胺,導致谷氨酰胺對腫瘤浸潤性T 淋巴細胞的可用性有限,從而影響其抗腫瘤免疫反應[10]。在谷氨酰胺成癮的透明細胞腎細胞癌中,腫瘤細胞對谷氨酰胺的競爭性消耗導致細胞外谷氨酰胺的局部剝奪,導致Treg 細胞的增殖和活化,從而抑制Teff 細胞的抗腫瘤活性[11]。因此,免疫細胞和癌細胞中的谷氨酰胺代謝基因組特征是免疫療法和臨床結果有希望的預測指標。
本研究系統(tǒng)分析了GMRGs 的表達及其對HCC 患者臨床特征、預后和治療反應的影響。對TCGA 數(shù)據(jù)庫進行差異分析,篩選出23 個差異表達的GMRGs 基因,并表明其具有較強的相關性。然后通過單因素cox 篩選出與患者生存狀態(tài)相關的14個基因。進而通過lasso 回歸和step 多因素cox 篩選出4 個基因構建評分模型,準確預測HCC 患者的臨床結果和免疫和藥物治療效果。本研究以期開發(fā)可行的HCC 免疫和藥物治療方法提供參考。
從TCGA-LIHC 數(shù) 據(jù) 庫(https://portal.gdc.cancer.gov/)中檢索HCC 的RNA 表達數(shù)據(jù)、體細胞突變數(shù)據(jù)、CNV 文件和相應的臨床病理信息,并利用GEO 數(shù) 據(jù) 庫 (https://www.ncbi.nlm.nih.gov/geo/)獲取GSE14520 臨床參數(shù)和標準化基因表達數(shù)據(jù)[12]。從MSigDB 數(shù)據(jù)庫(Hallmark 基因集)獲得了6 個谷氨酰胺代謝相關的基因集,去除重復后共80 個GMRGs。
在單變量Cox 回歸分析中發(fā)現(xiàn)的與HCC 相關的14 個GMRGs,隨后使用R 包“glmnet”進行最小絕對收縮和選擇運算符(LASSO)回歸分析。為了防止模型的過擬合效應,通過十倍交叉驗證確定了懲罰參數(shù)λ,最終篩出7 個基因進行下一步使用“rms”包的Step 多因素cox。最后選擇4 個GMRGs基于相應系數(shù)和基因表達量構建風險評分模型。每位患者的GMRGs 特征風險評分計算如下:
Coef(i)和 X(i)表示 GMRGs 相關的回歸系數(shù)和基因表達值。采用R 編程語言的套索回歸算法計算風險評分。通過多個基因的線性組合計算的回歸系數(shù)按中位風險評分將受試者分為高風險和低風險兩組。使用“time-ROC”(0.4 版)R 包進行1年、3 年和5 年的ROC 曲線分析。
列線圖旨在為肝癌患者提供有價值的臨床預測,包括其風險評分和其他臨床病理學特征,特別是關于1 年、3 年和5 年的OS。使用“rms”和“regplot”R 包開發(fā)了GMRGs 相關的臨床病理學列線圖。然后進行了校準曲線分析和決策曲線分析(DCA),以驗證已建立的列線圖的臨床可靠性。
腫瘤免疫功能障礙和排斥(TIDE)算法用于推斷患者對免疫治療的臨床反應[13]。IMvigor210 隊列聯(lián)合抗PD-L1 治療在GMRGs 評分模型與免疫治療反應的相關性研究中進行了分析[14]。Mvigor210隊列的完整數(shù)據(jù)集,包括基因表達數(shù)據(jù)和臨床信息,均 來 自http://research-pub.gene.com/IMvigor210CoreBiologies。
使用癌癥藥物敏感性基因組學(GDSC)數(shù)據(jù)集(https://www.cancerrxgene.org/)來評估每個樣本的化療反應。根據(jù)GDSC 數(shù)據(jù),采用半最大抑制濃度(IC50)來估計藥物反應。預測程序由R 語言中的 "pRRophetic "包承擔[15]。
與預后相關的臨床病理學因素由單因素cox 和Step Cox 分析確定。分類數(shù)P<0.05 為差異具有統(tǒng)計學意義。所有統(tǒng)計分析均由R(版本4.2.1)執(zhí)行。
首先使用TCGA-LIHC 數(shù)據(jù)集鑒定了腫瘤標本和正常標本中80 個GMRGs 的表達水平。共發(fā)現(xiàn)23 個差異基因(DEGs)(均|logFC|>1,adjustedPvalue<0.05),大部分DEGs 在腫瘤樣本中含量豐富。除了AADAT、GLYATL1、ASS1 和UROC1表達低于正常組織外,其余基因在HCC 中的表達均高于正常組織 (圖1A)。同樣,基于TCGA-LIHC中mRNA 表達水平構建的相關網(wǎng)絡在這些DEGs之間可以觀察到很強的正相關(圖1B)。通過String網(wǎng)站建立蛋白質-蛋白質相互作用(PPI)分析,揭示DEGs 具有很強的交互性(圖1C)。下一步確定了HCC 中23 個GMRGs 的拷貝數(shù)變異(CNV)和體細胞突變的發(fā)生率。371 個HCC 樣本中有40 個(10.78%)出現(xiàn)了基因突變,SLC25A12 基因突變率最高為2%,其余9 個基因的突變率均為1%(圖1D)。圖1E 顯示染色體上23 個GMRGs 的CNV 改變位點。上述分析表明,GMRGs 在HCC 中的遺傳和表達變化具有高度異質性,揭示了GMRGs 表達的不平衡在HCC 的發(fā)生發(fā)展中起著關鍵作用。
圖1 HCC 中GMRGs 的基因突變和互作情況Fig 1 Mutations and interactions of GMRGs in HCC
基于GMRGs 構建了風險預后模型。單因素COX 分析發(fā) 現(xiàn),在23 個DEGs 中,只有14 個預后相關基因與患者的OS 相關(P<0.05)(圖2A)。接下來,將14 個GMRGs 納入下面的lasso 回歸分析。圖2B-C 進行了lasso 回歸和lasso 回歸的十倍交叉驗證,結果保留了7 個基因進行下一步step cox 回歸分析,最終結果保留4 個基因用于最終的預后模型的構建。風險評分計算如下:風險評分=(0.3530 *CAD 表達)+(0.5985 * PPAT 表達)+(0.1797 *PYCR3 表達)+(0.2609 * SLC7A11 表達)。
圖2 風險模型的構建Fig 2 Construction of the risk model
進一步分析了風險特征的整體分布情況。圖3A、B 表明風險相關的4 個基因在訓練集和驗證集中具有一致的表達趨勢,即都在高風險組中高表達。對兩個樣本患者的風險評分從低到高排序,結果顯示在圖3C、D?;颊吒叩徒M評分和總生存時間的分布表現(xiàn)在圖3E、F 圖,結果表明高風險評分的患者生存時間更短。然后比較了不同臨床信息(生存狀態(tài)、腫瘤臨床分期,腫瘤組織學分期)中風險評分,可以看出,死亡狀態(tài)、3-4 期的分期都具有更高的風險評分,證明預后風險模型對臨床信息也有一定的指導作用。
圖3 TCGA 隊列和GEO 隊列中風險分數(shù)的生存分析Fig 3 Survival analysis of risk scores in the TCGA cohort and GEO cohort
由于風險評分與患者預后之間的高度相關性,我們納入了臨床參數(shù)(年齡、性別和腫瘤臨床分期)來建立列線圖。列線圖用于估計HCC 患者的1 年、3 年和5 年 OS(圖4A)。該已建立的列線圖的校準曲線在實際觀測值和預測值之間表現(xiàn)出很高的準確性(圖4C)。此外,估計了這些臨床因素的AUC值,分別用于預測1 年,3 年和5 年的OS。如圖D,AUC 值符合預期,這意味著該列線圖對預后具有出色的預測能力。Kaplan-Meier 生存分析顯示,高危組患者的總生存期顯著縮短(圖4B)。同時,在GEO 隊列中的分析結果與TCGA 隊列一致,表面構建的列線圖具有較高的準確性。(圖4E-G)。
圖4 列線圖的構建和驗證Fig 4 Construction and validation of column line diagrams
低風險組具有較高的TIDE 評分,證明其對免疫治療更不敏感(圖5A)。Dysfunction 評分和Exclusion 評分可以用來解釋這種現(xiàn)象。低風險組具有較高的Dysfunction 評分(圖5B),證明其免疫細胞功能低下;高風險組Exclusion 評分更高(圖5C),證明其免疫細胞遭到排斥。然后,為了進一步探索GMRGs 在預測免疫治療反應方面的價值,我們IMvigor210 隊列分析高危組和低危組接受抗PD-L1 免疫治療效果的差異。免疫治療完全緩解和部分緩解的患者比疾病穩(wěn)定和疾病進展的患者風險評分更高(圖5D),意味著高風險人群更可能獲益于免疫治療。E 圖說明了再高風險組患者中,完全緩解和部分緩解的患者占比更高,卡方檢驗表明這種差異具有顯著性(P=0.01)。然后比較了高低風險組中腫瘤突變負荷的差異,結果不具有顯著性,表明基于GMRGs 的風險模型中TMB 預測免疫治療不合適。最后比較了免疫檢查點分子在高低風險組中的表達差異(圖5G),可見大部分免疫檢查點分子都在高風險組高表達,表明高風險組更可能獲益于免疫檢查點抑制劑。
圖5 GMRGs 風險評分模型的免疫治療效果和免疫檢查點差異Fig 5 Immunotherapy effects and immune checkpoint differences in the GMRGs risk score model
使用pRRophetic 算法探討了HCC 患者基于GMRGs 的風險評分與他們對6 種常見抗癌藥物(順鉑、甲胺喋呤、多柔比星、拉帕替尼、尼羅替尼、帕唑帕尼、雷帕霉素、索拉非尼和替吡法尼)的反應之間的關聯(lián)(圖6)??梢钥闯?,除了高風險組拉帕替尼治療效果比較好外,低風險組的化療藥和靶向藥治療情況都要優(yōu)于高危組。
圖6 通過GMRGs 風險模型評估治療反應Fig 6 Assessing treatment response through the GMRGs risk model
谷氨酰胺是腫瘤增殖侵襲的重要支撐原料。早有研究表明,肝癌細胞在缺乏谷氨酰胺的培養(yǎng)基中不能生長,培養(yǎng)基中加入谷氨酰胺越多,細胞增殖越快,侵襲遷移能力越強[16]。腫瘤細胞可以通過特異性轉運蛋白(如溶質載體家族1 中性氨基酸轉運體成員5,SLC1A5)將谷氨酰胺轉運到細胞中,然后在谷氨酰胺酶的作用下轉化為谷氨酸,再轉化為α-酮戊二酸,進入三羧酸循環(huán),參與腫瘤的發(fā)生、發(fā)展和遷移[17,18]。例如,腫瘤細胞中的谷氨酰胺代謝產(chǎn)物在進入三羧酸循環(huán)后為腫瘤進展提供能量[19]。谷氨酰胺分解作用產(chǎn)生合成大分子物質的原料,如腫瘤細胞所需的氨基酸、核苷酸、脂肪酸和己糖胺[20]。
免疫細胞想要增殖并發(fā)揮功能,谷氨酰胺必不可少[21]。如T 細胞在激活狀態(tài)下需要增加谷氨酰胺的攝入,從而快速增殖,同時促進細胞因子的分泌[22];谷氨酰胺也可以B 細胞的增殖和存活[23],并且還促進B 細胞分化為漿細胞和淋巴細胞[24]。中性粒細胞相對于其他白細胞(如巨噬細胞和淋巴細胞)消耗谷氨酰胺的速率最高[25,26]。并且谷氨酰胺通過產(chǎn)生ATP 增強中性粒細胞中超氧化物的產(chǎn)生,并調(diào)節(jié)NADPH 氧化酶復合物成分的表達[27]。
然而TME 中腫瘤細胞和免疫細胞對谷氨酰胺的競爭攝取導致谷氨酰胺缺乏,而且腫瘤細胞對谷氨酰胺的消耗最高,從而影響免疫細胞的功能[9]。選擇性地阻斷腫瘤細胞中的谷氨酰胺代謝可以消除TME 中對谷氨酰胺的代謝競爭,同時釋放谷氨酰胺供免疫細胞使用,從而增強抗腫瘤免疫反應[10,28]。因此谷氨酰胺代謝在腫瘤發(fā)生發(fā)展和免疫功能是否良好,起著重要的調(diào)節(jié)和預示功能,也是選用免疫治療的一個可行指標。
在本研究中,首先根據(jù)TCGA-LIHC 隊列確定了差異表達GMRGs 的轉錄改變和表達水平,并檢測了這些GMRGs 的基因突變情況。盡管這些基因的突變強度較低,但其中大多數(shù)在HCC 患者中上調(diào)并與預后有關。然后進一步篩選了與HCC 生存有關的23 個GMRGs,最后通過lasso 回歸和step cox分 析 保 留4 個 基 因(CAD、PPAT、PYCR3 和SLC7A11),建立了能夠量化個體患者特征的評分機制。不僅有助于建立準確的預后模型,而且通過GMRGs 評分分析了免疫和藥物治療效果,能幫助臨床醫(yī)生有效地評估免疫和藥物治療作為治療方案的合理性。
本文篩選出的4 個GMRGs 差異表達基因(CAD、PPAT、PYCR3 和SLC7A11)與肝癌的預后有關。CAD 是氨甲酰磷酸合成酶2,催化新生嘧啶合成[9]。肝癌中CAD 的酶活性比在正常肝組織中增加了1.3~5.9 倍,與腫瘤生長速率呈正相關[29]。另有研究表明,精氨酸琥珀酸合酶在癌癥中的活性降低通過激活CAD 和促進嘧啶合成來支持增殖[30]。PPAT 是磷酰焦磷酸酰胺轉移酶,催化輔酶A 的生物合成[31]。PPAT 在肺腺癌中的表達被證明增加,并且與患者的疾病預后有關[32]。PPAT 抑制表達影響了神經(jīng)內(nèi)分泌癌3 種細胞系的生長,與患者的預后不良有強相關性[33]。PYCR3 是吡咯啉-5-甲酸酯還原酶3,它是一種參與從鳥氨酸生物合成脯氨酸的細胞質酶,在結直腸癌中表達上調(diào),是癌細胞存活和增殖所必須的[34]。溶質載體家族7 成員11(SLC7A11)是一種氨基酸轉運蛋白,經(jīng)常在人惡性腫瘤中過度表達[35]。SLC7A11 的表達和活性通過多種機制受到腫瘤細胞中癌基因和腫瘤抑制因子的精細調(diào)控,對胱氨酸和谷氨酸具有高度特異性[36]。在胰腺導管腺癌中,敲低SLC7A11 會抑制腫瘤生長和轉移擴散[37]。上述4 個基因高表達均會提高腫瘤的增殖速率,與肝癌高危組中風險四基因高表達相關,提示患者的不良預后。
然后根據(jù)篩選出的4 個GMRGs 構建肝癌風險評分模型,并將患者群體分成高危和低危兩個亞群。KM 曲線表明兩組具有顯著的生存差異,并通過ROC 曲線驗證其對1 年、3 年和5 年OS 的預測穩(wěn)健性。因此GMRGs 評分模型對患者的預后具有可靠的預測能力。最后發(fā)現(xiàn),與風險評分相關的4 個基因在高風險組中均高表達,與高風險組的預后較差有關。同時比較了不同臨床信息的風險評分,結果表明生存狀態(tài)、臨床分期和組織學分級都具有更高的風險評分,說明構建的風險預后模型其對臨床信息仍有一定的指導作用。通過TIDE 算法和IMvigor210 隊列評估了高低危險組的免疫治療情況差異。發(fā)現(xiàn)低風險組的免疫治療沒有高風險組效果好,低風險組的免疫細胞功能低下,高風險組的免疫細胞遭到排斥。筆者猜測功能低下的免疫細胞常常很難逆轉為功能正常,所以免疫治療效果常不好,免疫排斥的腫瘤只要解除了排斥狀態(tài),細胞功能正常即可發(fā)揮免疫作用,所以常對免疫治療效果更好,這需要后續(xù)進一步的實驗驗證。IMvigor210隊列分析同樣表明高危組的免疫治療效果要好于低危組。同時,對兩組的免疫檢查點表達情況做了比較,發(fā)現(xiàn)高危組表達大部分的免疫檢查點分子,表明高風險組更能獲益于免疫檢查點抑制劑。最后,比較了高低危兩組的抗癌藥物治療情況,結果表明低危組可能更適宜藥物治療。因此,高危組更適合免疫療法,而低危組更適合藥物治療。
總之,研究表明了谷氨酰胺代謝對HCC 的影響和GMRGs 相關療法的新見解,但還有很多局限性。這些數(shù)據(jù)是從公共數(shù)據(jù)庫獲得的回顧性數(shù)據(jù),開展前瞻性研究和完整的體內(nèi)體外實驗以驗證和優(yōu)化GMRGs 相關的風險評分模型非常重要。研究結果為HCC 患者選擇合適的治療方法和預后預測提供新的思路和方向。
作者貢獻度說明:
梁宇:文章設計、數(shù)據(jù)分析及手稿撰寫;陳穎、王豪杰和任銘心:相關文獻搜集與整理,數(shù)據(jù)分析;劉長青、劉高峰:提供整體思路和修改意見。
所有作者聲明不存在利益沖突關系。