羅輝,孫恒昌(中山大學附屬第三醫(yī)院,廣東 廣州 510630)
骨肉瘤(Osteosarcoma)是兒童和青少年最常見的原發(fā)性的惡性骨腫瘤[1-2]。盡管骨肉瘤的治療方法如化療、新輔助化療、放療及免疫治療等取得長足的進步,但是骨肉瘤患者的5年生存率依然處在較低水平。主要是由于大部分骨肉瘤會發(fā)生轉移[3],有隨訪數(shù)據(jù)顯示,未發(fā)生肺轉移的骨肉瘤患者5年生存率約為70%,而發(fā)生肺部轉移的骨肉瘤患者5年生存率僅有30%[4]。骨肉瘤發(fā)生轉移的機制并不十分明確,且缺乏早期診斷和預后評估的生物標志。目前,其依然是青少年發(fā)生癌癥相關死亡的第二大因素。因此,對骨肉瘤患者預后進行早期評估對骨肉瘤患者的預后以及治療顯得尤為重要。
鐵死亡(Ferroptosis)是新發(fā)現(xiàn)的細胞程序性死亡形式之一,主要特點是鐵依賴的脂質過氧化物損傷誘導細胞的死亡[5]。研究證實鐵死亡參與了腫瘤的發(fā)生發(fā)展、侵襲、轉移、耐藥性與腫瘤免疫等各個方面。Harris[6]等學者研究表明通過鐵死亡激活劑能夠促進小細胞肺癌、結腸癌、乳腺癌、淋巴瘤等腫瘤細胞的死亡。此外,也有越來越多的研究利用公共數(shù)據(jù)庫中的數(shù)據(jù)結合生物信息分析構建基于鐵死亡相關基因預后評估模型[7-10]。例如Huang X[10]等學者基于12個鐵死亡相關基因構建了急性髓細胞白血病的預后評估模型,其1年、3年、5年總體生存率ROC曲線下面積(AUC)均可達到0.8以上。然而,目前鐵死亡相關基因在骨肉瘤預后評估中的作用并不明確。
本文從公共數(shù)據(jù)庫中獲取了骨肉瘤患者的組織基因表達數(shù)據(jù),探討鐵死亡相關基因對于骨肉瘤患者預后評估的潛在價值。
1.1 數(shù)據(jù)來源和處理 從公共數(shù)據(jù)庫(https://xenabrowser.net/datapages/)中下載88例骨肉瘤患者高通量測序基因表達數(shù)據(jù)(GDC-TARGET-OS,HTSeq-FPKM(n=88)),同時下載相關的臨床信息數(shù)據(jù)。用R語言軟件進行表達基因名轉換以及整合臨床信息,刪除生存時間小于30天的樣本,最終獲得84例骨肉瘤患者數(shù)據(jù)。從數(shù)據(jù)庫(http://www.datjar.com:40013/bt2104/)中獲取鐵死亡相關的基因(Ferroptosis-related genes,F(xiàn)RGs,共259個基因),并提取骨肉瘤患者鐵死亡相關基因的表達信息。
1.2 獲取預后相關的鐵死亡基因 結合骨肉瘤患者鐵死亡相關基因表達數(shù)據(jù)和生存數(shù)據(jù),用“survival”包對FRGs進行單因素COX生存分析,以P<0.05為條件篩選與骨肉瘤患者預后相關的FRGs。
1.3 預后模型構建 將骨肉瘤患者的基因表達數(shù)據(jù)隨機抽取80%(n=67)為模型訓練集,剩余的20%(n=17)為避免單因素COX分析篩選的預后相關FRG出現(xiàn)過度擬合,采用R軟件“glmet”包進行進一步的LASSO回歸分析,進一步篩選預后基因。LASSO回歸中采用十則交叉驗證確定λ值,選擇偏似然偏差最小的λ(Lamda.min)為最佳λ。用最終篩選的基因構建預后模型,預后風險評分計算公式如下:Riskscore=C1*Expr1+C2* Expr2+……Cn*Exprn(n代表基因個數(shù),C表示LASSO回歸系數(shù),Expr表示基因表達量)。根據(jù)上述公式計算出骨肉瘤患者的風險評分,風險評分大于中位數(shù)的骨肉瘤患者為高風險組,小于中位數(shù)為低風險組。繪制患者風險評分的分布圖以及風險評分與生存時間的關系圖。同時比較納入模型的幾個鐵死亡相關基因在高低風險兩組間的表達水平。
1.4 預后模型的預測效果驗證 分別采用R軟件的“survival”包和“survivalROC”包對高低風險兩組進行K-M生存分析以及ROC曲線分析,計算1年、3年、5年總體生存率,對模型的預測效果進行評估。同時采用驗證集數(shù)據(jù)做K-M生存分析和ROC曲線分析,評估預后模型效果。
1.5 統(tǒng)計學處理方法 采用R3.5.1進行數(shù)據(jù)處理和統(tǒng)計分析。組間比較用獨立樣本t檢驗;采用單因素COX分析篩選預后因子;分別采用“glmnet”“survival”“survivalROC”等R包進行LASSO回歸分析、生存分析、及時間依賴的ROC曲線繪制。生存資料單因素及多因素分析采用COX比例風險模型。當P<0.05時,表示差異具有統(tǒng)計學意義。
2.1 與骨肉瘤預后相關的關鍵鐵死亡相關基因的篩選 經過單因素COX生存分析篩選,共有11個基因與骨肉瘤的總體生存率相關(P<0.05)(見表1)。他們分別是MUC1、VEGFA、MAP3K5、HILPDA、G6PD、ARNTL、SCD、BNIP3、PML、SOCS1、CBS。
表1 單因素COX生存分析篩選出的與骨肉瘤預后相關的鐵死亡相關基因
2.2 LASSO回歸分析進一步篩選預后相關關鍵基因 根據(jù)上述單因素COX分析篩選P<0.05的11個基因(見表1)及訓練集樣本數(shù)據(jù)進一步進行LASSO回歸分析,采用交叉驗證迭代分析,結果顯示當變量個數(shù)為9時,模型的均方誤差最?。é?0.032)(見圖1AB)。構建基于9個鐵死亡相關基因的骨肉瘤預后評估模型:Risk score=(1.496)*CBS表達量+(0.456)*MUC1表達量+(0.096)*VEGFA表達量+(0.483)*HILPDA表達量+(-0.226)*SOCS1表達量+(-0.263)*PML表達量+(-0.504)*MAP3K5表達量+(-1.288)*G6PD表達量+(-2.40)*ARNTL表達量。
2.3 預后模型的預測效果 根據(jù)上一步得到的模型計算訓練數(shù)據(jù)集中的每個樣本的風險值(Risk score),按風險值的中位數(shù)(-5.51)為界,將訓練集數(shù)據(jù)分為高風險組和低風險組,同時繪制兩組患者的生存狀態(tài)分布圖、基因表達熱圖(見圖2A)。訓練數(shù)據(jù)集中,1年、3年、5年總體生存率的ROC曲線下面積AUC分別為0.928、0.964、0.947(見圖2B)。生存分析顯示高風險組(risk score>-5.51)骨肉瘤患者總體生存率顯著低于低風險組(risk score<-5.51)(P<0.01)(圖2C)。而在驗證數(shù)據(jù)集中,預后模型1年、3年、5年總體生存率的ROC曲線下面積(AUC)比訓練數(shù)據(jù)集中要低,但是AUC也都分別達到0.937、0.855、0.896(見圖3A-C)。且在驗證數(shù)據(jù)集中生存分析也顯示高風險組的生存率明顯低于低風險組(P<0.01)。說明鐵死亡相關的預后模型對骨肉瘤患者預后的預測效果較好。
2.4 預后基因在高低風險兩組間的差異表達分析 根據(jù)模型計算的風險值,將骨肉瘤患者分為高風險組和低風險組,分別計算兩組患者之間9個預后因子的基因表達量差異。結果高風險組中CBS、HILPDA、VEGFA、MUC1基因的表達量顯著高于低風險組(P<0.05)。而SOCS1、PML、ARNTL、G6PD、MAP3K5在高風險組的表達量則顯著降低(P<0.05)(見圖4)。
惡性骨腫瘤具有病情變化快、病死率高等特點[11]。骨肉瘤的發(fā)病機制是一個復雜的多步驟和多因素的過程,其中涉及廣泛的分子異常和腫瘤異質性[12]。由于惡性程度高、轉移早、耐藥,致殘率高、死亡率高,骨肉瘤的預后極差。盡管人們已經嘗試了很多新的治療藥物和方法,但骨肉瘤的治療效果并不理想,患者5年生存率仍然較低[13]。目前骨肉瘤的治療前景并不樂觀,而預后情況的預測,能有效地掌握疾病的發(fā)展趨勢,對臨床用藥具有一定的指導作用。自從2012年鐵死亡的概念被提出以來,其在腫瘤及非腫瘤疾病中的作用越來越受到關注,其在骨肉瘤的發(fā)生發(fā)展及治療等方面也有報道。
本文從公共數(shù)據(jù)庫中下載了骨肉瘤患者的基因表達數(shù)據(jù),并且提取出259個FRGs的表達數(shù)據(jù)。采用單因素COX對現(xiàn)有患者的生存數(shù)據(jù)分析,篩選出11個與骨肉瘤預后相關的FRGs。進一步用LASSO回歸篩選,最終獲得9個FRGs用于骨肉瘤患者預后模型構建。該預測模型經過訓練集和驗證集的驗證,發(fā)現(xiàn)在預測骨肉瘤患者1年、3年、5年生存率中具有較高的AUC值,與Liu[13]等學者構建的基于5個缺氧相關基因的骨肉瘤預后模型的AUC相當,而與Huang[14]等學者基于m6A相關基因構建的預后模型相比,本模型AUC明顯更大,提示本模型具有比其他模型更好的預后預測能力。
本研究中建立的預后模型主要是由9個(PML、MAP3K5、ARNTL、CBS、HILPDA、VEGFA、MUC1、SOCS1、G6PD)鐵死亡相關基因構成。其中PML(promyelocytic leukemia protein)是一種鋅指轉錄因子,最早發(fā)現(xiàn)于急性早幼粒細胞白血病(APL),在維持基因組穩(wěn)定性中發(fā)揮重要作用[15]。研究發(fā)現(xiàn),PML的缺失會導致ROS水平增加[16]。PML還是一種促凋亡的基因,在非小細胞肺癌中,可被基于順鉑的全身化療間接抑制[17]。此外,PML在骨肉瘤細胞株中是抑制基因,已被證明與癌蛋白MDM2相互作用,從而調控腫瘤細胞的生物學行為[18]。MAP3K5(又稱為ASK1)是絲裂原活化蛋白激酶,屬于激酶(MAP3K)家族的成員之一,參與癌癥、神經退行性變、炎癥和糖尿病的發(fā)病機制[19]。據(jù)報道[20-21],在MAP3K5通路激活后能夠促進骨肉瘤細胞的死亡。ARNTL是細胞晝夜節(jié)律的調控分子,作為生物鐘基因調節(jié)著癌癥的發(fā)生發(fā)展和化療的耐受性。晝夜節(jié)律的失調讓心血管疾病、免疫系統(tǒng)疾病和腫瘤細胞發(fā)生的風險增加[22]。據(jù)報道[23],在乳腺癌和惡性血液病中檢測到AENTL啟動子的高甲基化,進一步加強了惡性細胞晝夜節(jié)律的紊亂。而本文研究結果中,低風險組患者的PML、MAP3K5、ARNTL幾個基因的表達量均顯著高于高風險組患者,這與前人的研究結果相符合。上述基因的表達上調,提示骨肉瘤患者預后較好。
胱硫醚β合酶基因(cystathionine-beta-synthase,CBS)是編碼胱硫醚-β-合成酶的基因,它參與同型半胱氨酸的轉硫途徑的第一步反應,將同型半胱氨酸不可逆的轉化為半胱氨酸和α酮丁酸。有研究顯示抑制CBS能夠誘導腫瘤細胞發(fā)生鐵死亡,從而影響腫瘤的預后及治療效果[24]。MUC1是一種Ⅰ型跨膜糖蛋白,一般情況下在胰腺、乳腺、肺和胃腸道等上皮細胞的頂端表面低水平表達[25]。MUC1表達量上調,除了影響腫瘤侵襲以及不良預后外,還與腫瘤血管生成和化療藥物的耐藥性相關[26]。研究發(fā)現(xiàn)[25],MUC1/xCT信號通路可抑制鐵死亡,從而促進腫瘤細胞存活。VEGFA是一種介導血管生成的因子,黏附于血管內皮上,能夠促進細胞增殖以及增加血管通透性,在腫瘤血管生成中發(fā)揮重要作用[27]。VEGFA基因上調,影響著骨肉瘤的發(fā)展與轉移,測量VEGFA的循環(huán)水平對于評估預后有一定的價值意義[26]。HILPDA(hypoxia-inducible lipid droplet-associated)在細胞限制氧氣供應時,通過代謝重編程調節(jié)脂解,使每個消耗氧氣的分子產生三磷酸腺苷(ATP)的比例更高,以減少活性氧的生成[28-29]。在腫瘤細胞中,HILPDA基因的過表達,通常預示患者預后不良[30]。本研究中,上述基因的過量表達均提示著患者的預后質量極差,治療后的總體生存率也顯著降低。
細胞因子信號抑制因子1(Suppressor Of Cytokine Signaling-1,SOCS1)是SOCS家族的一員,在DNA損傷部位中連接P53,通過介導P53信號通路促進細胞凋亡。SOCS1基因隨著DNA甲基化介導的沉默,在人類癌癥中的表達量減少[31]。葡萄糖-6-磷酸脫氫酶(Glucose-6-phosphate dehydrogenase,G6PD)是磷酸戊糖途徑的限速酶,生成的NADPH對維持細胞氧化還原穩(wěn)態(tài)和還原生物合成至關重要,癌細胞NADPH的生成和糖酵解都依賴于G6PD,在腎細胞癌[32]、膀胱癌[33]、胃癌[34]等多種人類癌癥中都觀察到G6PD活性的升高。除此之外,異常激活G6PD還可引起ROS升高,導致細胞過度生長和分化失控[35]。G6PD基因的過表達,密切聯(lián)系著惡性腫瘤患者的病情進展,已經作為患者預后不良的指標[34]。本研究發(fā)現(xiàn)高風險組中SOCS1和G6PD的表達量顯著降低,根據(jù)前人研究提示前者與預后差相關,后者反而提示良好的預后,可能不同腫瘤中G6PD發(fā)揮的作用并不相同,值得進一步研究。
本文也存在一些局限:構建的預后評估模型訓練數(shù)據(jù)病例數(shù)較少。其次,該模型缺乏其他患者人群數(shù)據(jù)的外部驗證。因此,模型的外推性還有待進一步驗證。
綜上所述,本研究建立了基于9個鐵死亡相關基因的骨肉瘤預后評估模型,為骨肉瘤患者的個性化治療提供預測因子,研究的結果可能有助于骨肉瘤患者的預后評估,同時有助于發(fā)現(xiàn)骨肉瘤潛在的治療靶點。