賀 晴 曹曉林 韓弈垣 劉翰林
頭頸部鱗狀細(xì)胞癌(head and neck squamous cell carcinoma,HNSCC)起源于口腔、咽腔、喉腔等的黏膜上皮細(xì)胞,其發(fā)生率位居惡性腫瘤第6位。2018年的全球數(shù)據(jù)統(tǒng)計顯示,當(dāng)年有89萬新增HNSCC病例,其中有46萬病例死亡[1,2]。由于HNSCC發(fā)病隱匿性及高度侵襲性,盡管采用了包括手術(shù)在內(nèi)的綜合治療,如放化療、免疫治療,該腫瘤的預(yù)后仍不理想,5年生存率僅為25%~60%[3]。因此,尋找HNSCC預(yù)后相關(guān)的生物學(xué)標(biāo)志物對HNSCC患者的預(yù)后進(jìn)行早期評估,進(jìn)而明確影響HNSCC預(yù)后的相關(guān)因素探討新的腫瘤研究目標(biāo),成為了必然。
鐵死亡是一種新的細(xì)胞程序性死亡方式[4]。它的發(fā)生可通過谷胱甘肽途徑、泛醌途徑、四氫生物蝶呤途徑的任意途徑截斷從而使細(xì)胞內(nèi)脂質(zhì)過氧化,最終導(dǎo)致細(xì)胞死亡[5]。目前在FerrDb網(wǎng)站上共有259種鐵死亡相關(guān)基因(ferroptosis-relate genes, FRGs),分為基因調(diào)控因子及化學(xué)物質(zhì)調(diào)控因子兩類。根據(jù)功能的不同,基因調(diào)控因子又分為驅(qū)動因子、抑制因子、標(biāo)記因子,化學(xué)物質(zhì)調(diào)控因子分為誘導(dǎo)劑、抑制劑。本研究旨在探討FRGs在HNSCC中的表達(dá),并構(gòu)建出有意義的FRGs相關(guān)的HNSCC預(yù)后預(yù)測模型。
1.數(shù)據(jù)收集與預(yù)處理:從TCGA數(shù)據(jù)庫UCSC網(wǎng)站下載528例頭頸部鱗狀細(xì)胞癌患者的RNA-seq數(shù)據(jù)和相應(yīng)的臨床信息,去除沒有總體生存(overall survical, OS)信息或者OS為0的樣本作為訓(xùn)練隊列(n=494)。使用R包“GEOquery”從GEO數(shù)據(jù)庫下載微陣列數(shù)據(jù)集(GSE41613)的RNA-seq數(shù)據(jù)和臨床信息,去除OS為0及死亡原因不詳或非原發(fā)腫瘤死亡的樣本作為驗證隊列(n=76)。使用GPL570平臺的注釋信息將探針替換為基因ID。上述兩個隊列樣本的主要人口統(tǒng)計學(xué)和臨床特征詳見表1。為了后續(xù)分析獨立臨床變量與預(yù)后的關(guān)系,將缺失部分臨床變量或變量不詳?shù)臉颖咎蕹?共納入TCGA訓(xùn)練隊列(n=460)及GSE41613驗證隊列(n=76)用作分析。
表1 訓(xùn)練隊列及驗證隊列的臨床資料
2.建立FRG的預(yù)后特征:從在線FerrDb數(shù)據(jù)庫得到259個鐵死亡相關(guān)基因,在TCGA訓(xùn)練隊列中所有樣本中共檢測到239個基因表達(dá),隨后將239個FRGs的表達(dá)水平與494例HNSC患者的OS相關(guān)聯(lián),通過單變量COX回歸分析獲得12個具有預(yù)后意義的基因(P<0.01)作為OS的獨立預(yù)測因子。
3.預(yù)后預(yù)測模型的構(gòu)建和驗證:使用R包“glmnet”進(jìn)行最小絕對收縮和選擇算子(Lasso)COX回歸分析找到了與預(yù)后相關(guān)的最顯著的11個FRGs,并根據(jù)其對應(yīng)的COX回歸系數(shù)來構(gòu)建預(yù)后預(yù)測模型。該模型提供了一個計算每個樣本風(fēng)險評分的公式:Risk score=β1×expG1+β2×expG2+…+βn×expGn。根據(jù)訓(xùn)練隊列中風(fēng)險評分的中位數(shù)將訓(xùn)練隊列中的患者分為高風(fēng)險組(n=247)和低風(fēng)險組(n=247)。使用R包“ggpubr”根據(jù)高低風(fēng)險組的生存情況繪制散點圖。分別使用R包“survival”“time ROC”采用Kaplan-Meier生存曲線和時間依賴性受試者工作特征曲線(time ROC)分析,評估預(yù)后預(yù)測模型對預(yù)后的預(yù)測能力。同理,驗證該模型在驗證隊列的可行性和可重復(fù)性。
4.獨立預(yù)后分析:使用R包“survival”“forestplot”進(jìn)行單因素及多因素COX回歸分析評估訓(xùn)練隊列及驗證隊列中各臨床特征(包括年齡、性別、腫瘤TNM分期、臨床分期)及該模型風(fēng)險評分與患者預(yù)后的關(guān)系,并繪制森林圖,判斷該模型是否能作為獨立的預(yù)后指標(biāo)。
5.統(tǒng)計學(xué)方法:使用R 3.6.3軟件對數(shù)據(jù)進(jìn)行統(tǒng)計分析與繪圖。兩組間的比較采用Wilcoxon秩和檢驗進(jìn)行統(tǒng)計分析,生存曲線的組間差異采用Log-rank檢驗。采用COX回歸分析計算風(fēng)險比(hazard ratio, HR),以P<0.05為差異有統(tǒng)計學(xué)意義。
1.與預(yù)后顯著相關(guān)FRGs的鑒定:單因素COX分析顯示,12個FRGs基因可以用作HNSCC患者OS的獨立預(yù)測因素,其中3個為保護(hù)因素(HR<1),9個為風(fēng)險因素(HR>1),詳見圖1。
圖1 12個與HNSCC患者OS相關(guān)的FRGs的單因素COX回歸分析森林圖
2.訓(xùn)練隊列中的預(yù)后預(yù)測模型構(gòu)建:根據(jù)單因素COX回歸分析得到的12個FRGs,進(jìn)行LassoCOX回歸分析得到了11個對HNSCC患者OS有重要影響的FRGs,并進(jìn)行10倍交叉驗證,避免過度擬合,最終根據(jù)LassoCOX回歸分析中最小lambda值,構(gòu)建了11個鐵死亡相關(guān)因子的預(yù)后預(yù)測模型。風(fēng)險評分計算公式為:HSPA5的表達(dá)值×0.0419-FLT3的表達(dá)值×1.1826+ SLC2A3的表達(dá)值×0.1758+ASNS的表達(dá)值×0.0152+ TRIB3的表達(dá)值×0.1011+FTH1的表達(dá)值×0.0783+NQO1的表達(dá)值×0.0526+PRDX6的表達(dá)值×0.1278+ATG5的表達(dá)值×0.2813-CDKN2A的表達(dá)值×0.0709-BAP1的表達(dá)值×0.4057。Kaplan-Meier生存曲線圖顯示高風(fēng)險組的生存率明顯較低風(fēng)險組低(圖2A)。時間依賴性ROC曲線圖顯示第1、3、5年AUC分別為0.649、0.729、0.688(圖2B)。高低風(fēng)險組之間的生存情況比較差異有統(tǒng)計學(xué)意義(圖2C)。
圖2 訓(xùn)練隊列的預(yù)后預(yù)測模型評估
3.驗證隊列中的預(yù)后預(yù)測模型驗證:根據(jù)上面得到的風(fēng)險評分公式計算驗證隊列中每位患者的風(fēng)險評分來驗證模型的準(zhǔn)確性及可重復(fù)性。使用上述方法,根據(jù)風(fēng)險評風(fēng)的中位數(shù)將患者分為高風(fēng)險(n=38)和低風(fēng)險組圖(n=38)。很顯然,Kaplan-Meier生存曲線圖顯示高風(fēng)險組的生存率明顯較低風(fēng)險組的低(圖3A)。時間依賴性ROC曲線圖顯示第3、5年的AUC值分別為0.747、0.824(圖3B)。高低風(fēng)險組之間的生存情況比較,差異有統(tǒng)計學(xué)意義(圖3C)。
圖3 驗證隊列的預(yù)后預(yù)測模型驗證
4.風(fēng)險評分的獨立預(yù)后價值:在訓(xùn)練(TCGA)隊列中,單因素COX回歸分析顯示,性別(P=0.043)、M分期(P=0.002)、風(fēng)險評分(P<0.001)與OS顯著相關(guān)(圖4A),其中風(fēng)險評分越高的患者預(yù)后較差,男性患者及有遠(yuǎn)處轉(zhuǎn)移的患者提示預(yù)后較差。對單因素COX分析中與OS顯著相關(guān)的3個變量進(jìn)行多變量COX分析,顯示性別(P=0.033)、M分期(P=0.003)、風(fēng)險評分(P<0.001)可作為獨立預(yù)后因子(圖4B)。在驗證(GSE41613)隊列中,單因素COX回歸分析顯示,臨床分級(P<0.001)、風(fēng)險評分(P=0.004)與OS顯著相關(guān)(圖4C),其中風(fēng)險評分及臨床分級越高的患者預(yù)后較差。對單因素COX分析中與OS顯著相關(guān)的2個變量進(jìn)行多變量COX分析,顯示臨床分級(P<0.001)、風(fēng)險評分(P=0.007)可作為獨立預(yù)后因子(圖4D)。
圖4 訓(xùn)練及驗證隊列各臨床特征及風(fēng)險評分的單因素及多因素COX回歸分析森林圖
近10年來,得益于不同類型的高通量組學(xué)(基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)、放射組學(xué))分析的發(fā)展及公共數(shù)據(jù)庫的豐盈,研究者們通過生物信息學(xué)方式篩選出了許多HNSCC診斷及預(yù)后相關(guān)的生物學(xué)標(biāo)志物,給未來提高臨床診斷率及開發(fā)新的治療方法帶來了希望[3]。
鐵死亡作為一種新型的細(xì)胞死亡方式,成為了近年來的研究熱點。隨著鐵死亡的認(rèn)識不斷加深,已經(jīng)發(fā)現(xiàn)鐵死亡與各種人類疾病密切相關(guān),例如動脈粥樣硬化、神經(jīng)退行性疾病、急性肝腎損傷等[6~8]。此外,有研究證實,鐵死亡與腫瘤發(fā)生、發(fā)展存在密切關(guān)聯(lián),研究人員發(fā)現(xiàn)了FRGs在20種腫瘤中存在異常表達(dá)[9]。
本研究通過公共數(shù)據(jù)庫的挖掘,系統(tǒng)分析了259個FRGs在HNSCC組織中的表達(dá)與其生存率之間的關(guān)系,并最終建立了11個FRGs(包括HSPA5、FLT3、SLC2A3、ASNS、TRIB3、FTH1、NQO1、PRDX6、ATG5、CDKN2A、BAP1)構(gòu)成的預(yù)后預(yù)測模型。
本研究發(fā)現(xiàn),FLT3、CDKN2A、BAP1與HNSCC良好預(yù)后相關(guān),HSPA5、SLC2A3、ASNS、TRIB3、FTH1、NQO1、PRDX6、ATG5與預(yù)后不良有關(guān)。HSPA5屬于熱休克蛋白家族的一員,通過與GPX4結(jié)合,可以負(fù)調(diào)節(jié)人類胰腺導(dǎo)管癌細(xì)胞的鐵死亡[10]。在對膠質(zhì)瘤細(xì)胞的研究中也發(fā)現(xiàn),HSPA5可能是二十二碳六烯酸(docosahexaenoic acid,DHA)誘導(dǎo)的鐵死亡中的負(fù)調(diào)節(jié)因子[11]。FLT3是一種受體型酪氨酸激酶,FLT3抑制劑是防止脂質(zhì)過氧化抵抗谷氨酸毒性的有效保護(hù)劑,而谷氨酸毒性與細(xì)胞凋亡、壞死、鐵死亡有關(guān)。FLT3抑制劑可以阻斷神經(jīng)元中的鐵死亡細(xì)胞的死亡[12]。SLC2A3、ASNS、TRIB3是鐵死亡的生物學(xué)標(biāo)志物。
在眾多鐵死亡相關(guān)研究中,可以觀察到隨著鐵死亡的發(fā)生,在mRNA水平上觀察到這些基因的表達(dá)增多。然而,這些基因在鐵死亡的具體分子調(diào)控機(jī)制還未知[13,14]。FTH1是一種鐵蛋白重鏈,在帕金森病的6-OHDA模型中,FTH1通過噬鐵抑制鐵死亡。NQO1是一種NADPH脫氫酶,敲除肝癌細(xì)胞中的FTH1、NQO1,可以促進(jìn)erastin和sorafenib誘導(dǎo)的鐵死亡[15,16]。PRDX6是鐵死亡的負(fù)調(diào)節(jié)因子,PRDX6通過其 iPLA2 活性去除脂質(zhì)活性氧,從而保護(hù)細(xì)胞免受鐵死亡[17]。ATG5是一種自噬蛋白,ATG5可通過自噬調(diào)節(jié) HNSCC 的遷移、侵襲和凋亡[18]。兩項獨立的研究表明,通過敲除ATG5,細(xì)胞的鐵死亡水平顯著降低[19,20]。
BAP1是一種腫瘤抑制因子 BRCA1 相關(guān)蛋白,BAP1 通過抑制 SLC7A11的表達(dá)來抑制胱氨酸攝取,導(dǎo)致脂質(zhì)過氧化和鐵死亡[21,22]。而SLC7A11 被證實是HPV陽性 HNSCC的生物學(xué)標(biāo)志物和治療靶點[23]。既往研究表明,這些基因可能在不同的水平,通過不同的方式調(diào)節(jié)鐵死亡,從而影響相關(guān)疾病的發(fā)生和發(fā)展。
本研究也分析了Kaplan-Meier生存曲線及時間依賴的ROC曲線,結(jié)果顯示該模型在預(yù)測HNSCC患者預(yù)后生存方面具有良好的效果。并且通過單因素及多因素COX回歸分析證明該模型可作為獨立的預(yù)后因子。此外,本研究還發(fā)現(xiàn)性別、遠(yuǎn)處轉(zhuǎn)移、臨床分級也可作為獨立的預(yù)后因子,提示男性患者、有遠(yuǎn)處轉(zhuǎn)移及臨床分級越高的患者預(yù)后欠佳。這些結(jié)果與臨床和既往的研究結(jié)果相符,筆者篩選出的FRGs和以此基礎(chǔ)上初步建立的預(yù)測模型可能提高HNSCC的評估預(yù)后的水平。
本研究確認(rèn)并驗證了基于11個鐵死亡相關(guān)基因?qū)︻^頸部鱗狀細(xì)胞癌患者的臨床預(yù)后模型,并證明了該模型可作為獨立預(yù)后因素。然而,這11個鐵死亡相關(guān)基因在HNSCC中的具體作用和調(diào)控機(jī)制仍需要開展進(jìn)一步的實驗驗證,并且還需要開展前瞻性臨床研究來驗證預(yù)后預(yù)測模型的臨床應(yīng)用價值。