周熒,張志存
南京醫(yī)科大學(xué)附屬淮安第一醫(yī)院耳鼻咽喉頭頸外科,江蘇淮安223300
據(jù)估算,2021年美國喉癌新增病例14 250 例,死亡4 113 例[1]。新發(fā)喉癌病例約占所有新發(fā)癌癥病例的0.8%,其死亡率約占所有癌癥死亡率的0.6%[2]。隨著煙草使用的減少,過去10年中,喉癌的發(fā)病率每年下降2.4%[2-3]。但值得注意的是,喉癌的5年生存率約為60.9%,在過去數(shù)年中幾乎沒有變化[2,4]。早期T1 和T2 腫瘤的治愈率高達(dá)80%~90%。相反,在出現(xiàn)晚期喉癌的患者中,生存率降低至40%。喉癌需要復(fù)雜的治療策略和長期的隨訪,給患者帶來嚴(yán)重的經(jīng)濟(jì)負(fù)擔(dān),顯著降低患者生活質(zhì)量[5-6]。目前對喉癌患者的預(yù)后相關(guān)因素的研究多集中于性別、年齡、腫瘤分期分級和治療方案等。研究[7]表明,淋巴結(jié)轉(zhuǎn)移和治療方案是喉癌患者預(yù)后的獨立危險因素。也有研究[8]指出,術(shù)前血小板淋巴細(xì)胞的比值可用于判斷喉癌患者預(yù)后。近年來的一些研究[9-10]發(fā)現(xiàn)了一些與喉癌預(yù)后相關(guān)的基因,包括等。但是基于基因表達(dá)量精準(zhǔn)評估患者生存率的研究相對較少。本研究旨在針對老年喉癌患者,篩選喉癌中差異表達(dá)的mRNA 以及預(yù)后相關(guān)mRNA,并構(gòu)建預(yù)后風(fēng)險評估模型,從而將喉癌患者預(yù)后評估量化,更加直觀的判斷患者預(yù)后。
1.1 一般資料 從 TCGA 數(shù)據(jù)庫和 GEO 下載(GSE142083, GSE117007 和GSE127165)喉癌RNASeq 和臨床信息數(shù)據(jù)集,臨床數(shù)據(jù)信息包括患者年齡、性別、腫瘤分級、腫瘤分期、生存時間和生存狀態(tài)等。本研究針對老年喉癌患者,因此篩選年齡>60 歲的樣本,其中喉癌組織163 例,正常喉組織43 例。163例喉癌患者臨床資料如表1 所示。
表1 喉癌患者一般資料
1.2 方法
1.2.1 矩陣整理 將下載的TCGA 數(shù)據(jù)集和GEO 數(shù)據(jù)集整理為行名為基因代碼,列名為樣本信息,內(nèi)容為基因相對表達(dá)量的數(shù)據(jù)矩陣。將數(shù)據(jù)矩陣進(jìn)行對數(shù)轉(zhuǎn)換。合并TCGA 矩陣和GEO 矩陣,并進(jìn)行批次校準(zhǔn),去除實驗條件對基因表達(dá)量的影響。
1.2.2 差異表達(dá)基因篩選 根據(jù)Ensemble 數(shù)據(jù)庫中人源性基因信息篩選指導(dǎo)蛋白質(zhì)合成的mRNA。使用R軟件和edge R包對喉癌組織和正常喉組織進(jìn)行差異分析,計算mRNA 差異表達(dá)倍數(shù)(fold change, FC)。計算公式為FC=喉癌平均表達(dá)量/正常喉組織表達(dá)量。計算結(jié)果進(jìn)行對數(shù)運算,最終以log2FC 的形式表達(dá)。本研究喉癌組織差異表達(dá)mRNA 篩選的2 個條件為(1)log2FC 絕對值>2;(2)錯誤發(fā)現(xiàn)率(false discovery rates,F(xiàn)DR)<0.05。
1.2.3 預(yù)后相關(guān)基因篩選 整理喉癌患者臨床資料中的生存狀態(tài)和生存時間。通過單因素COX 分析篩選與預(yù)后相關(guān)的差異表達(dá)mRNA。篩選標(biāo)準(zhǔn)為0.001。根據(jù)基因表達(dá)量中位數(shù)將患者分為表達(dá)組和低表達(dá)組。使用Kaplan-Meier Plotter 曲線進(jìn)行生存分析,并使用Log-Rank 檢驗。
1.2.4 預(yù)后評估模型建立與評價 通過多因素COX 分析,構(gòu)建預(yù)后評估模型,根據(jù)預(yù)后模型評分將喉癌患者分為高危組與低危組,使用Kaplan-Meier Plotter 曲線進(jìn)行生存分析,并使用Log-Rank 檢驗。使用ROC曲線對預(yù)后評估模型進(jìn)行評價。
1.2.5 統(tǒng)計學(xué)分析 本研究使用R 軟件(V3.5.1)和相關(guān)R 包對數(shù)據(jù)進(jìn)行統(tǒng)計學(xué)分析0.05 為差異有統(tǒng)計學(xué)意義。
2.1 差異表達(dá)的mRNA篩選 共篩選出1 796 個mRNA在喉癌患者腫瘤組織和正常喉組織中的表達(dá)量存在明顯差異(|log2FC|>2, FDR<0.05),其中835 個mRNA表達(dá)上調(diào),961 個mRNA 表達(dá)下調(diào)。以下是差異表達(dá)最顯著的前20 個mRNA。見表2。
表2 差異表達(dá)最顯著的前20 個基因
2.2 差異表達(dá)mRNA 預(yù)后相關(guān)性分析 基于喉癌組織和正常組織中差異表達(dá)的mRNA,同時結(jié)合樣本的生存時間和生存狀態(tài),本研究進(jìn)行單因素COX 分析。以<0.001 為篩選條件,共有16 個mRNA 與患者預(yù)后相關(guān)。其中,13 個mRNA 為影響預(yù)后的危險因素,表達(dá)量越高,患者預(yù)后越差(Hazard ratio>1,<0.001);3 個mRNA 為影響預(yù)后的保護(hù)因素,表達(dá)量越高,預(yù)后越好(Hazard ratio>1,0.001)。見表3。
表3 差異免疫基因預(yù)后相關(guān)性分析
2.3 預(yù)后評估模型建立 基于單因素COX 篩選結(jié)果,進(jìn)一步通過多因素COX 分析構(gòu)建預(yù)后評估模型。預(yù)后評估模型計算公式為危險評分=CCR8×0.129+CDC20×0.086+TFPI-2×0.096。構(gòu)建預(yù)后風(fēng)險評估模型的mRNA 森林圖。見圖1。
圖1 構(gòu)建預(yù)后風(fēng)險評估模型的mRNA 森林圖
2.4 高風(fēng)險患者與低風(fēng)險患者生存分析 根據(jù)預(yù)后風(fēng)險值計算公式計算所有樣本風(fēng)險值。以中位值為界限,高于中位值的為高風(fēng)險患者,低于中位值的為低風(fēng)險患者。對高風(fēng)險患者和低風(fēng)險患者進(jìn)行生存分析,低風(fēng)險患者預(yù)后顯著優(yōu)于高風(fēng)險患者<0.001)。見圖2。
圖2 高風(fēng)險患者與低風(fēng)險患者生存分析
2.5 預(yù)后風(fēng)險評估模型評價使用ROC曲線評價預(yù)后風(fēng)險評估模型。曲線下面積為0.797,大于0.6,表明預(yù)后風(fēng)險評估模型效能較好。
圖3 預(yù)后風(fēng)險評估模型ROC 曲線
淋巴結(jié)受累是影響生存最重要的預(yù)后因素[11-12]。淋巴結(jié)受累的喉癌患者5年存活率僅有未累及淋巴結(jié)患者生存率的一半。喉癌累及部位對患者預(yù)后也存在一定影響。聲門腫瘤比聲門上或聲門下腫瘤預(yù)后更好。原發(fā)腫瘤體積與放療獲得的局部控制率密切相關(guān)。放療時間與局部控制率和存活率均相關(guān)。氣管切開被證明降低患者存活率,可能與增加了造口復(fù)發(fā)的風(fēng)險相關(guān)[11-12]。此外,一些基因(如和在喉癌中的表達(dá)量增加,BCL2 可能對喉癌的預(yù)后有影響[13-14]。TNM 分類不足以區(qū)分喉癌患者預(yù)后類別,往往忽略了一些高度惡性的因素[11-12]。本研究旨在針對老年喉癌患者,篩選喉癌差異表達(dá)的mRNA 以及預(yù)后相關(guān)的mRNA,并構(gòu)建預(yù)后風(fēng)險評估模型,以期為臨床決策提供依據(jù)。
本研究通過公共數(shù)據(jù)庫對喉癌組織和喉正常組織全轉(zhuǎn)錄組測序結(jié)果,相較正常組織篩選出喉癌組織中差異表達(dá)的mRNA。本研究共篩選出1 796 個mRNA在喉癌患者腫瘤組織和正常喉組織中的表達(dá)量存在明顯差異,其中表達(dá)上調(diào)的mRNA 有835 個,表達(dá)下調(diào)的mRNA 有961 個。進(jìn)一步結(jié)合差異表達(dá)mRNA表達(dá)量和樣本生存信息進(jìn)行了單因素COX 分析,篩選出與預(yù)后相關(guān)的16 個mRNA。值得注意的是,其中部分基因在喉癌中的作用已經(jīng)得到了研究或證實。郭星等[15]通過喉癌組織和癌旁正常黏膜組織標(biāo)本采用免疫組化實驗證實,BRMS1 在癌旁正常黏膜組織中高表達(dá),而CD44v 在喉癌組織中高表達(dá)。且2 種蛋白表達(dá)量負(fù)相關(guān)。該研究還進(jìn)一步發(fā)現(xiàn)CD44v 高表達(dá)患者預(yù)后差于CD44v 低表達(dá)患者。胡俊蘭等[16]通過20 例癌旁組織和12 例正常喉黏膜組織,采用流式細(xì)胞術(shù)同樣證實CD44v 在喉癌組織中高表達(dá)。鄭剛等[17]通過分析TCGA公共數(shù)據(jù)庫分析發(fā)現(xiàn)HOXA13在喉癌組織中高表達(dá),其表達(dá)量越高,患者生存率越低。其研究還證實HOXA13 是喉癌預(yù)后獨立危險因素。何時知等[18]通過基因表達(dá)譜芯片篩選發(fā)現(xiàn)BMP1在喉癌組織中高表達(dá),并認(rèn)為是關(guān)鍵致病基因,且其表達(dá)量與腫瘤分期正相關(guān)。
預(yù)后評估模型計算公式為危險評分=CCR8×0.129+CDC20×0.086+TFPI-2×0.096。本研究采用的危險評分公式是基于COX 比例風(fēng)險模型構(gòu)建的。這是一種半?yún)?shù)回歸模型,可以用于分析一個或多個前定變量對患者生存時間的影響。使用這一模型建立了積累生存函數(shù),即本研究的危險評分公式。在構(gòu)建模型的3 個基因中,早期研究[19]認(rèn)為,CDC20 可以介導(dǎo)腫瘤細(xì)胞APC/C 檢查抑制。近年來的研究[20]證實,CDC20 在肺腺癌和食管癌中均起到促癌作用,并且與預(yù)后不良密切相關(guān)。研究[21]證實,CCR8 可以介導(dǎo)Akt/PRAS40/mTOR 通路參與食管鱗癌進(jìn)展;CCR8 重編程乳酸脫氫酶亞型表達(dá)與腫瘤的不良臨床結(jié)局相關(guān)。還有研究發(fā)現(xiàn),在肌肉浸潤性膀胱癌中CCR8 通過腫瘤內(nèi)調(diào)節(jié)性T 細(xì)胞的不穩(wěn)定引發(fā)抗腫瘤免疫。由此可見CCR8 在多種腫瘤的發(fā)生和進(jìn)展中發(fā)揮重要作用[22]。有研究證實,TFPI-2 的表觀遺傳失活是與胰腺導(dǎo)管腺癌的生長和侵襲相關(guān)的常見機(jī)制[23]。TFPI-2 在宮頸癌、非小細(xì)胞肺癌中均發(fā)揮重要的致病作用[24-25]。近年來的一些研究發(fā)現(xiàn)了一些與喉癌預(yù)后相關(guān)的基因,包括等。但是這些研究也僅僅明確了基因表達(dá)量高低與預(yù)后的相關(guān)性,并沒有依據(jù)嚴(yán)格的統(tǒng)計學(xué)方法建立直觀預(yù)測患者生存率的模型。另外,也有研究證實臨床變量,包括淋巴結(jié)轉(zhuǎn)移、腫瘤原發(fā)灶大小、治療方案選擇等,可用于判斷患者預(yù)后。本研究構(gòu)建的模型具有獨特的優(yōu)勢,一是可以基于基因表達(dá)進(jìn)行計算,精準(zhǔn)預(yù)測患者生存率;二是ROC 曲線證實模型效能較好;三是模型公式納入變量少,臨床應(yīng)用便捷。
本研究發(fā)現(xiàn)通過該模型區(qū)分患者高風(fēng)險與低風(fēng)險,低風(fēng)險患者預(yù)后較高風(fēng)險患者預(yù)后好。ROC 曲線評價預(yù)后風(fēng)險評估模型,曲線下面積為0.797,大于0.6,表明預(yù)后風(fēng)險評估模型效能較好。
本研究篩選出了喉癌中差異表達(dá)的mRNA,并確定了與預(yù)后相關(guān)的差異表達(dá)mRNA,據(jù)此構(gòu)建了預(yù)后風(fēng)險評估模型,可以準(zhǔn)確評估喉癌患者生存率,將患者預(yù)后和基因表達(dá)量進(jìn)行結(jié)合,以期為臨床決策提供依據(jù)。本研究存在一些缺陷:一是缺乏外部數(shù)據(jù)對模型進(jìn)行驗證;二是缺乏體內(nèi)和體外實驗進(jìn)行驗證,這些基因在喉癌中的致病機(jī)制尚不清楚,需要進(jìn)一步的研究明確。
綜上所述,CDC20、CCR8 和TFPI-2 在喉癌組織中高表達(dá),與預(yù)后不良相關(guān),可能是喉癌關(guān)鍵致病基因和潛在指標(biāo)靶點。本研究構(gòu)建的預(yù)后風(fēng)險評估模型,效能較好,可以準(zhǔn)確預(yù)測喉癌患者預(yù)后情況。