呂浩東 梁青青 張遠(yuǎn) 趙慶 金玉琴 王天叢 竇昭婧 季駿
口腔癌作為最常見(jiàn)的頭頸部惡性腫瘤,2020 年全球診斷超過(guò)35 萬(wàn)例,死亡人數(shù)超過(guò)17.5 萬(wàn)[1],其中口腔鱗狀細(xì)胞癌(oral squamous cell carcinoma,OSCC)占比超過(guò)90%[2]。盡管OSCC的診斷和治療有所改善,但5年生存率僅為60%左右[3],因此有必要尋找新的生存預(yù)測(cè)指標(biāo)以便更好的進(jìn)行臨床決策。鐵死亡是一種新型的鐵依賴性細(xì)胞死亡方式,盡管2012 年才被發(fā)現(xiàn)并命名[4],但學(xué)者們逐漸發(fā)現(xiàn)它與腫瘤有著密不可分的關(guān)系。研究表明,鐵死亡與包括結(jié)直腸癌[5]、乳腺癌[6]等在內(nèi)的多種癌癥預(yù)后相關(guān),然而目前鐵死亡及其相關(guān)基因在OSCC預(yù)后中的作用尚不完全清楚。本研究通過(guò)生物信息學(xué)的方法建立一個(gè)新的鐵死亡相關(guān)基因(ferroptosis-related genes,F(xiàn)RGs)模型并驗(yàn)證其預(yù)測(cè)能力。
從癌癥基因組圖譜(TCGA)數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)及GEO數(shù)據(jù)庫(kù)(數(shù)據(jù)集:GSE27020)中收集OSCC患者的RNA-seq和臨床資料;基于鐵死亡數(shù)據(jù)庫(kù)(http://www.zhounan.org/ferrdb/)共得到382 個(gè)FRGs。
對(duì)OSCC患者的RNA-seq進(jìn)行LOG2轉(zhuǎn)換分析,使用R軟件(4.1.2版)LIMMA包篩選差異表達(dá)的FRGs 并聚類分析。使用單因素和多因素COX回歸分析確定與OSCC患者預(yù)后相關(guān)的FRGs,用于后續(xù)預(yù)后模型構(gòu)建。
根據(jù)回歸分析結(jié)果,合并每個(gè)FRGs的風(fēng)險(xiǎn)回歸系數(shù)和風(fēng)險(xiǎn)比,建立風(fēng)險(xiǎn)評(píng)分公式,從而得到預(yù)后模型,計(jì)算公式如下:
Coef代表FRGs的風(fēng)險(xiǎn)回歸系數(shù),X代表FRGs表達(dá)水平?;谠摴接?jì)算每位患者的風(fēng)險(xiǎn)評(píng)分,并根據(jù)風(fēng)險(xiǎn)評(píng)分的中位數(shù)將OSCC患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。緊接著使用生存分析比較高低風(fēng)險(xiǎn)組OSCC患者的總生存率(overall survival,OS),受試者工作特征曲線(receiver operating characteristic,ROC)用于研究模型預(yù)測(cè)的準(zhǔn)確性。通過(guò)單因素和多因素COX回歸分析,探究風(fēng)險(xiǎn)評(píng)分在預(yù)測(cè)患者預(yù)后中的作用。
對(duì)于符合正態(tài)分布的基因表達(dá)數(shù)據(jù)使用非配對(duì)的學(xué)生t檢驗(yàn),而非正態(tài)分布的則使用Wilcox秩和檢驗(yàn)。所有統(tǒng)計(jì)分析均使用R軟件(版本4.1.2),P<0.05被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
從TCGA下載OSCC患者的RNA-seq中,共提取了245 個(gè)FRGs的表達(dá)值。按照FDR<0.05以及|log2(fold change)|>1/2的標(biāo)準(zhǔn)進(jìn)行篩選,與非腫瘤組織對(duì)比,在OSCC組織中表達(dá)量下調(diào)基因有17 個(gè),上調(diào)基因有44 個(gè)(圖1)。
圖1 差異表達(dá)的FRGs
使用單因素和多因素COX回歸分析61 個(gè)差異表達(dá)的FRGs,共得到3 個(gè)與預(yù)后顯著相關(guān)的FRGs(圖2A),然后構(gòu)建預(yù)后模型。根據(jù)FRGs表達(dá)水平和風(fēng)險(xiǎn)回歸系數(shù),計(jì)算每位OSCC患者的風(fēng)險(xiǎn)評(píng)分。
風(fēng)險(xiǎn)評(píng)分=DDIT4表達(dá)量×0.002 725+AURKA表達(dá)量×0.027 942+GOT1表達(dá)量×0.020 395。
隨后的生存分析結(jié)果表明,高風(fēng)險(xiǎn)組OS顯著低于低風(fēng)險(xiǎn)組(P<0.001)(圖2B)。ROC曲線顯示1、3、5 年OS的AUC(areas under the curve)值分別是0.737、0.717和0.733(圖2C),說(shuō)明預(yù)后模型對(duì)于OSCC患者預(yù)后具有比較準(zhǔn)確的預(yù)測(cè)能力。
圖2 預(yù)后模型的構(gòu)建及驗(yàn)證
根據(jù)風(fēng)險(xiǎn)評(píng)分對(duì)OSCC患者進(jìn)行排序, 用熱圖顯示3 個(gè)FRGs在高低風(fēng)險(xiǎn)組之間的表達(dá)差異(圖3A),結(jié)果表明DDIT4、AURKA、GOT1在高風(fēng)險(xiǎn)組中表達(dá)量均顯著上升。進(jìn)一步分析患者的生存狀態(tài),結(jié)果可見(jiàn)高風(fēng)險(xiǎn)組患者生存狀態(tài)較差,死亡可能性比低風(fēng)險(xiǎn)組患者大(圖3B~C)。結(jié)合患者臨床參數(shù),采用單因素COX回歸分析可見(jiàn)年齡、性別、分級(jí)、腫瘤分期和風(fēng)險(xiǎn)評(píng)分均有顯著差異(圖3D),進(jìn)一步多因素COX回歸分析表明風(fēng)險(xiǎn)評(píng)分可以作為OSCC獨(dú)立預(yù)后因素(圖3E)(HR=2.134,95%CI=1.524-2.988)??傊A(yù)后模型對(duì)預(yù)測(cè)OSCC患者預(yù)后的準(zhǔn)確性已得到證實(shí)。
圖3 風(fēng)險(xiǎn)評(píng)分是OSCC患者的獨(dú)立預(yù)后因素
接著,進(jìn)行臨床病理分析以探討臨床參數(shù)與風(fēng)險(xiǎn)評(píng)分之間的關(guān)系(圖4A~G)。結(jié)果顯示,風(fēng)險(xiǎn)評(píng)分與生存狀態(tài)(P<0.001)、分級(jí)(P<0.01)、腫瘤分期(P<0.001)和T分期(P<0.001)顯著有關(guān),而與N分期、性別和年齡無(wú)關(guān)。通過(guò)繪制多因素獨(dú)立ROC曲線來(lái)評(píng)估風(fēng)險(xiǎn)評(píng)分與其他臨床參數(shù)預(yù)測(cè)能力的差異,如圖4H,風(fēng)險(xiǎn)評(píng)分的AUC值為0.737,明顯高于年齡、性別、分級(jí)、腫瘤分期、T分期、N分期的AUC值。隨后,繪制T、N分期和風(fēng)險(xiǎn)評(píng)分聯(lián)合ROC曲線(圖4I),聯(lián)合曲線AUC值為0.781,明顯高于單獨(dú)的風(fēng)險(xiǎn)評(píng)分以及任何一種臨床參數(shù)的AUC值。這些結(jié)果表明,風(fēng)險(xiǎn)評(píng)分不僅比其他臨床參數(shù)更能準(zhǔn)確預(yù)測(cè)OSCC患者預(yù)后,還是TNM分期的有益補(bǔ)充手段。
使用相同的風(fēng)險(xiǎn)評(píng)分公式計(jì)算GEO數(shù)據(jù)庫(kù)中GSE27020數(shù)據(jù)集每個(gè)患者的風(fēng)險(xiǎn)評(píng)分,作為預(yù)后模型的外部驗(yàn)證。如前所述,根據(jù)風(fēng)險(xiǎn)評(píng)分的中位數(shù)將數(shù)據(jù)集中所有患者分為高低風(fēng)險(xiǎn)兩組。生存曲線確如預(yù)期,高風(fēng)險(xiǎn)組OS顯著低于低風(fēng)險(xiǎn)組(P<0.05),這一結(jié)果再次證實(shí)了預(yù)后模型的預(yù)測(cè)能力(圖5A)。ROC曲線顯示1、3、5 年OS的AUC值分別是0.719、0.697和0.671,也證明了該模型具有良好的預(yù)測(cè)預(yù)后能力(圖5B)。遺憾的是由于缺乏性別、腫瘤T、N分期等臨床資料,無(wú)法對(duì)其他臨床參數(shù)進(jìn)行ROC分析。這些驗(yàn)證性實(shí)驗(yàn)證實(shí)了本研究構(gòu)建的預(yù)后模型在預(yù)測(cè)OSCC患者預(yù)后方面的突出能力。
圖5 FRGs預(yù)后模型在GEO數(shù)據(jù)集的驗(yàn)證
作為細(xì)胞死亡的一種新類型,鐵死亡的生化標(biāo)志物和形態(tài)學(xué)特征與凋亡、壞死和自噬有著顯著的不同[7],因此探究鐵死亡在腫瘤中的作用也逐漸成為研究熱點(diǎn)。據(jù)報(bào)道,在OSCC中一些鐵死亡相關(guān)基因如SLC7A11[8], GPX4[9]影響著疾病的進(jìn)展。但在OSCC中的研究也僅限于此,鐵死亡在OSCC進(jìn)展及預(yù)后中的作用尚不清楚。TCGA和GEO等大型數(shù)據(jù)庫(kù)為學(xué)者們探索疾病發(fā)生發(fā)展提供了有效途徑,二者目前在OSCC研究中已廣泛應(yīng)用[10-11]。在本研究中,利用TCGA和GEO數(shù)據(jù)庫(kù)通過(guò)生物信息學(xué)方法探討了鐵死亡相關(guān)基因在OSCC預(yù)后中的作用。構(gòu)建預(yù)后風(fēng)險(xiǎn)模型,并對(duì)模型的準(zhǔn)確性進(jìn)行驗(yàn)證。一系列結(jié)果表明根據(jù)預(yù)后模型得到的風(fēng)險(xiǎn)評(píng)分是一項(xiàng)有效的OSCC發(fā)生發(fā)展評(píng)價(jià)指標(biāo),對(duì)于預(yù)測(cè)OSCC患者預(yù)后具有較高準(zhǔn)確性。
本文構(gòu)建的預(yù)后模型包括3 個(gè)FRGs(DDIT4、AURKA、GOT1)。其中DDIT4(DNA損傷誘導(dǎo)轉(zhuǎn)錄物4),是在2002年第一次被發(fā)現(xiàn)[12]。近年來(lái),學(xué)者們逐漸發(fā)現(xiàn)DDIT4可能作為癌基因在包括卵巢癌[13]、胃癌[14]、急性白血病[15]等在內(nèi)的多種癌癥中起到關(guān)鍵作用。AURKA在預(yù)后模型中具有最高正風(fēng)險(xiǎn)回歸系數(shù),全稱為Aurora 激酶 A,屬于絲氨酸/蘇氨酸激酶家族。據(jù)報(bào)道在非小細(xì)胞肺癌、結(jié)直腸癌、卵巢癌、膀胱癌、胃癌等其他實(shí)體瘤[16-17]中具有重要的預(yù)后價(jià)值。除此之外,也有研究表明AURKA與放化療敏感性有關(guān)[18-19]。GOT1(谷氨酸草酰乙酸轉(zhuǎn)氨酶 1)于1950年首次發(fā)現(xiàn)[20],其大量存在于肝臟中并作為診斷肝臟疾病的重要生化指標(biāo)應(yīng)用于臨床,同時(shí)還參與了對(duì)大腦神經(jīng)元的保護(hù)[21]。此外,它在促進(jìn)腫瘤細(xì)胞增殖和維持細(xì)胞氧化還原平衡方面也發(fā)揮著重要作用。鑒于 GOT1 是癌細(xì)胞中谷氨酰胺代謝的關(guān)鍵點(diǎn),學(xué)者們開始探索GOT1在腫瘤中的作用并且發(fā)現(xiàn)其表達(dá)量在多種惡性腫瘤中上調(diào)[22-23]。可見(jiàn),DDIT4、AURKA和GOT1是癌癥治療的潛在靶點(diǎn),可提供重要的預(yù)后價(jià)值。但遺憾的是,目前僅有DDIT4在OSCC中有相應(yīng)的研究[24],其余的FRGs在OSCC中尚沒(méi)有很好的研究,有關(guān)它們?cè)贠SCC中的生物學(xué)功能也尚未見(jiàn)報(bào)道。
綜上所述,本研究基于鐵死亡相關(guān)基因構(gòu)建了一個(gè)新的預(yù)后模型,可用于預(yù)測(cè)OSCC患者預(yù)后,并通過(guò)GEO數(shù)據(jù)庫(kù)的獨(dú)立隊(duì)列進(jìn)行了驗(yàn)證。為鐵死亡在OSCC臨床預(yù)后中的研究提供了一個(gè)新的見(jiàn)解,還應(yīng)進(jìn)一步探索該模型在臨床決策中的應(yīng)用,以驗(yàn)證本研究結(jié)果的有效性。