胡文龍 梁惠芳 李明
肺癌是最常見(jiàn)的惡性腫瘤之一,其發(fā)病率和死亡率居于全球所有癌癥的首位,并且嚴(yán)重程度呈逐年上升趨勢(shì),給人類生命健康帶來(lái)沉重的危害[1]。肺癌按照病理分型可劃分為小細(xì)胞肺癌和非小細(xì)胞肺癌,非小細(xì)胞肺癌約占肺癌發(fā)病率的2/3[2]。肺鱗狀細(xì)胞癌,簡(jiǎn)稱肺鱗癌,是非小細(xì)胞肺癌的主要類型之一。據(jù)報(bào)道,全球每年超過(guò)40萬(wàn)人死于肺鱗癌和其并發(fā)癥[3]。由于肺鱗癌容易發(fā)生局部浸潤(rùn)和轉(zhuǎn)移,且尚缺乏有效的預(yù)后生物學(xué)標(biāo)志物,晚期肺鱗癌患者的5年生存率不足17%。改善肺鱗癌病人的預(yù)后情況可以提高病人的生存率。因此,尋找一組與肺鱗癌預(yù)后密切相關(guān)的生物標(biāo)志物,通過(guò)生物標(biāo)志物對(duì)肺鱗癌患者的預(yù)后進(jìn)行早期評(píng)估,對(duì)提高肺鱗癌患者的預(yù)后顯得尤為重要。
近年來(lái),許多研究表明,細(xì)胞代謝的改變是腫瘤細(xì)胞的一個(gè)重要生物學(xué)特征,且代謝異常與腫瘤的發(fā)生發(fā)展互為因果關(guān)系[4]。腫瘤細(xì)胞代謝異常的主要表現(xiàn)有:葡萄糖主要以有氧酵解為主,氧化磷酸化明顯減弱,磷酸戊糖代謝途徑的增強(qiáng);氨基酸分解代謝活躍,β-氧化反應(yīng)的激活及脂肪酸從頭合成等[5]。有研究表明,肺鱗癌的膽堿顯像有異常增高,其增高的原因可能與腫瘤細(xì)胞中膽堿代謝的磷酸化途徑及乙?;緩疆惓T龈哂嘘P(guān)。Momcilovic M等[6]研究者對(duì)肺鱗癌動(dòng)物模型進(jìn)行了體內(nèi)代謝譜分析后發(fā)現(xiàn),肺鱗癌細(xì)胞可以通過(guò)上調(diào)谷氨酰胺分解的GSK3α/β信號(hào)通路來(lái)適應(yīng)糖酵解的抑制。由于代謝相關(guān)基因在肺鱗癌的發(fā)生發(fā)展中起著重要的作用,我們推測(cè)代謝相關(guān)基因可能作為肺鱗癌的預(yù)后標(biāo)志物。
分子預(yù)后模型(prognostic signature),是指將一定數(shù)目的分子標(biāo)記物(轉(zhuǎn)錄因子, miRNA, lncRNA等)進(jìn)行組合,形成一個(gè)新的變量,并用此變量來(lái)評(píng)估某些生物學(xué)特性。分子預(yù)后模型并不是以某一個(gè)單基因功能為研究基礎(chǔ),而是注重多個(gè)基因或者因子之間的共同協(xié)調(diào)作用,從整體全面的水平對(duì)某種特定的生物學(xué)特性進(jìn)行系統(tǒng)定量的描述[7]。因此,在預(yù)后評(píng)估方面,分子預(yù)后模型的準(zhǔn)確性高于單個(gè)分子標(biāo)記物。本研究通過(guò)對(duì)腫瘤基因組圖譜數(shù)據(jù)庫(kù)(The Cancer Genome Atals,TCGA)獲取代謝相關(guān)基因的表達(dá)譜數(shù)據(jù),并建立分子預(yù)后模型,評(píng)估代謝相關(guān)基因組成的預(yù)后模型對(duì)肺鱗癌患者預(yù)后的預(yù)測(cè)價(jià)值。
2020年1月從癌癥基因組圖譜(The Cancer Genome Atals,TCGA)官方網(wǎng)站下載(https://gdc-portal.nci.nih.gov/)肺鱗癌患者腫瘤組織和癌旁組織的mRNA測(cè)序數(shù)據(jù)及臨床信息。通過(guò)Illumina高通量測(cè)序平臺(tái)獲得mRNA測(cè)序數(shù)據(jù)。下載的數(shù)據(jù)內(nèi)容包含肺鱗癌患者502例腫瘤組織的mRNA表達(dá)數(shù)據(jù)和49例癌旁組織的mRNA表達(dá)數(shù)據(jù)。臨床數(shù)據(jù)包含了504例肺鱗癌患者的相關(guān)臨床信息,如ID號(hào)、年齡、性別、病理分期、生存時(shí)間、生存狀態(tài)等,為了減少統(tǒng)計(jì)學(xué)誤差,剔除生存時(shí)間少于30天的患者信息,最終納入482名肺鱗癌患者(見(jiàn)表1)。
1 代謝相關(guān)基因提取和處理
將關(guān)鍵字“metabolism”輸入GENECARDS網(wǎng)站(https://www.genecards.org/),檢索代謝相關(guān)基因。相關(guān)性分?jǐn)?shù)被用來(lái)指示基因和代謝之間的相關(guān)性的強(qiáng)度,范圍從0到100。分?jǐn)?shù)越高,代表聯(lián)系越緊密。將關(guān)聯(lián)分?jǐn)?shù)大于10的基因作為候選的代謝相關(guān)基因,共獲得1062個(gè)代謝相關(guān)基因。通過(guò)ActivePerl軟件(版本號(hào)5.26)提取1062個(gè)代謝基因在TCGA的表達(dá)譜。接下來(lái),使用R軟件中的“Limma”包(https://www.R-project.org)對(duì)mRNA測(cè)序表達(dá)值進(jìn)行l(wèi)og2變換,以log2(fold change)的絕對(duì)值>1.5和偽發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.05為閾值[8],對(duì)數(shù)據(jù)進(jìn)行歸一化和差異基因表達(dá)分析。對(duì)篩選出的差異表達(dá)的代謝基因進(jìn)行聚類分析,并繪制熱圖。
2 單因素Cox回歸分析及LASSO回歸分析
為了初步篩選出與肺鱗癌預(yù)后相關(guān)的代謝基因,首先通過(guò)R包“survival”對(duì)差異表達(dá)的代謝相關(guān)基因進(jìn)行單因素Cox回歸分析,計(jì)算候選代謝相關(guān)基因的風(fēng)險(xiǎn)比(hazard ratio,HR)及95%可信區(qū)間,P<0.01被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。為了進(jìn)一步進(jìn)行變量的選擇,避免單因素Cox回歸分析所得的基因有過(guò)度擬合的問(wèn)題,通過(guò)R包“glmet”對(duì)單因素Cox回歸篩選出的差異基因進(jìn)行LASSO回歸分析。在這個(gè)研究中,模型構(gòu)建過(guò)程使用10折交叉驗(yàn)證來(lái)確定λ的值,并且選擇偏似然偏差最小的λ作為最優(yōu)λ。一旦確定了預(yù)測(cè)基因,即用于預(yù)后模型的構(gòu)建,預(yù)后模型的表達(dá)式如下所示:
其中N是基因數(shù),Expi是基因的表達(dá)水平,Ci是lasso回歸分析得到的回歸相關(guān)系數(shù)。根據(jù)預(yù)后模型可以計(jì)算出每一個(gè)肺鱗癌的風(fēng)險(xiǎn)評(píng)分大小,通過(guò)風(fēng)險(xiǎn)評(píng)分的中位數(shù)值,模型可將將納入的肺鱗癌患者劃分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。
3 預(yù)后模型評(píng)價(jià)和K-M生存分析
為了評(píng)估預(yù)后模型的預(yù)測(cè)能力,本研究首先對(duì)高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組采用K-M生存分析;其次,對(duì)肺鱗癌患者進(jìn)行了3年和5年總生存率的受試者接受特征(receiver operating characteristic,ROC)曲線繪制,利用R包“survival”和“timeROC”計(jì)算3年及5年總生存率的ROC曲線下面積-AUC(area under the curve)值,并計(jì)算該模型的C指數(shù)值。當(dāng)C指數(shù)的值<0.5時(shí),說(shuō)明模型準(zhǔn)確率不顯著,當(dāng)C指數(shù)的值>0.7時(shí),說(shuō)明模型的準(zhǔn)確率中等,當(dāng)C指數(shù)的值>0.9時(shí),說(shuō)明模型具有相當(dāng)高的準(zhǔn)確率[9]。除此之外,我們結(jié)合臨床相關(guān)信息,如年齡、性別、病理分期等,對(duì)預(yù)后模型進(jìn)行多因素Cox回歸分析,以驗(yàn)證構(gòu)建的模型的預(yù)測(cè)能力是否獨(dú)立于其他臨床因素,可以成為獨(dú)立的預(yù)測(cè)因子。
4 決策曲線分析及構(gòu)建諾莫列線圖
為了進(jìn)一步評(píng)估該模型是否比其他常用的臨床參數(shù)更有優(yōu)勢(shì),是否值得在臨床實(shí)踐中使用,本研究采用決策曲線分析(Decision Curve analysis,DCA)對(duì)預(yù)后模型進(jìn)行評(píng)估,通過(guò)曲線下所形成的面積評(píng)估凈收益的大小。決策曲線的繪制由R軟件“Decision Curve”包完成。接下來(lái),根據(jù)多因素回歸分析所得的回歸系數(shù)構(gòu)建了諾莫列線圖。通過(guò)計(jì)算C指數(shù)評(píng)估諾莫列線圖的性能,并繪制校準(zhǔn)曲線圖對(duì)諾莫列線圖的性能高低進(jìn)行可視化。
使用SPSS 20.0和R軟件進(jìn)行統(tǒng)計(jì)學(xué)分析和相關(guān)圖像的繪制。計(jì)量資料基因表達(dá)量為非正態(tài)分布數(shù)據(jù),采用中位數(shù)(25%百分位數(shù)-75%百分位數(shù))進(jìn)行表示,運(yùn)用Wilcoxon非參數(shù)秩和檢驗(yàn)的方法對(duì)腫瘤組織和癌旁組織之間基因表達(dá)量的差異進(jìn)行分析;計(jì)量資料患者年齡和生存時(shí)間符合正態(tài)分布,表示為均數(shù)±標(biāo)準(zhǔn)差的格式,采用獨(dú)立樣本t檢驗(yàn)進(jìn)行分析。計(jì)數(shù)資料用百分?jǐn)?shù)表示,差異性分析使用χ2檢驗(yàn)的方法。檢驗(yàn)水準(zhǔn)α=0.05。
符合納入標(biāo)準(zhǔn)的肺鱗癌患者482人,其中男性患者死亡235人(71.43%),未死亡112人(73.20%);女性患者死亡94人(28.57%),未死亡41人(26.80%);肺鱗癌死亡患者平均年齡(68.7±6.9)歲,未死亡患者平均年齡(65.4±8.5)歲,種族、吸煙、化療、放療、生存時(shí)間等情況見(jiàn)表1。
表1 從TCGA數(shù)據(jù)庫(kù)中納入分析的肺鱗狀細(xì)胞癌患者的基本特征(n=482)
對(duì)482例肺鱗癌患者腫瘤組織和49例癌旁正常肺組織的代謝基因進(jìn)行Wilcoxon非參數(shù)秩和檢驗(yàn),經(jīng)分析滿足條件log2(fold change)的絕對(duì)值>1.5和FDR<0.05的代謝基因共有239個(gè)。對(duì)這些基因進(jìn)行聚類分析,并以熱圖的方式呈現(xiàn)出來(lái)(見(jiàn)圖1)。
圖1 49例癌旁正常肺組織和482例肺鱗癌組織中239個(gè)差異表達(dá)的代謝基因的熱圖
針對(duì)上述的差異表達(dá)的代謝基因,結(jié)合TCGA來(lái)源的對(duì)應(yīng)的臨床信息,通過(guò)單因素Cox回歸分析,初步篩選出8個(gè)和肺鱗癌預(yù)后相關(guān)的代謝基因,它們分別是CYP4F2,ALDH3B2,CA6,DDO,AGMAT,OPLAH,CPT1B,UGT2B4(見(jiàn)圖2),它們的HR值均大于1,說(shuō)明這些代謝相關(guān)基因?yàn)槲kU(xiǎn)基因;通過(guò)LASSO回歸分析進(jìn)一步確定了這8個(gè)代謝基因均是關(guān)鍵基因,見(jiàn)圖3A、圖3B。8個(gè)關(guān)鍵基因的詳細(xì)信息(見(jiàn)表2)。
圖3 LASSO回歸分析
表2 8個(gè)關(guān)鍵基因的詳細(xì)信息
圖2 單因素Cox回歸初步篩選出的8個(gè)代謝基因與生存預(yù)后關(guān)系的森林圖
基于LASSO回歸分析確定的8個(gè)代謝基因,通過(guò)前文所描述的風(fēng)險(xiǎn)評(píng)分表達(dá)式計(jì)算每一個(gè)肺鱗癌患者的預(yù)后風(fēng)險(xiǎn)評(píng)分,并根據(jù)中位值將所有患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組并構(gòu)建預(yù)后模型。為了進(jìn)一步評(píng)估該預(yù)后模型的預(yù)測(cè)能力,K-M生存分析顯示,高風(fēng)險(xiǎn)組中位生存期1.6年,3年生存概率39%,5年生存概率26%,低風(fēng)險(xiǎn)組中位生存期是2.2年,3年生存概率是62%,5年生存概率是43%,低風(fēng)險(xiǎn)組OS較高風(fēng)險(xiǎn)組長(zhǎng)(P<0.05)(見(jiàn)圖4A);3年總生存率的ROC曲線下面積AUC=0.765,5年總生存率的ROC曲線下面積AUC=0.758(見(jiàn)圖4B);該預(yù)后模型的C指數(shù)為0.781。同時(shí),高風(fēng)險(xiǎn)組的患者ALDH3B2和OPLAH呈現(xiàn)更高的表達(dá)水平(見(jiàn)圖5A);所有患者的風(fēng)險(xiǎn)評(píng)分分布及風(fēng)險(xiǎn)評(píng)分與生存時(shí)間的關(guān)系也提示高風(fēng)險(xiǎn)組的患者總生存時(shí)間更短(見(jiàn)圖5B、5C)。以總生存時(shí)間為因變量,預(yù)后模型所計(jì)算的風(fēng)險(xiǎn)評(píng)分、年齡、性別、病理分期作為協(xié)變量進(jìn)行多因素Cox回歸分析,其結(jié)果表明該預(yù)后模型可以作為一個(gè)獨(dú)立的預(yù)測(cè)預(yù)后的因子(HR=1.139,95%CI=1.101-1.179,P<0.05)(見(jiàn)圖6)。
圖4A 肺鱗癌患者的生存曲線,藍(lán)色代表低風(fēng)險(xiǎn)人群,紅色代表高風(fēng)險(xiǎn)人群;圖4B 預(yù)后模型的ROC曲線,藍(lán)色線代表3年生存時(shí)間,紅色線代表5年生存時(shí)間
圖5 8個(gè)代謝基因的熱圖和預(yù)后模型與生存狀態(tài)圖
圖6 多因素Cox回歸分析風(fēng)險(xiǎn)評(píng)分與生存時(shí)間關(guān)系的森林圖
決策曲線分析提示,模型與年齡,性別和病理分期相結(jié)合起來(lái)預(yù)測(cè)形成的曲線面積最大,患者將會(huì)獲得更多的益處(見(jiàn)圖7);根據(jù)多因素Cox回歸系數(shù)構(gòu)建諾莫列線圖(見(jiàn)圖8);校正曲線提示模型對(duì)3年和5年的生存率預(yù)測(cè)能力良好(3年的C指數(shù)為0.712,5年的C指數(shù)為0.705)(見(jiàn)圖8)。
圖7 決策曲線,綠線代表預(yù)后模型和臨床因素相結(jié)合進(jìn)行預(yù)測(cè)
無(wú)限迅速增殖是肺癌細(xì)胞最重要的生物學(xué)特征之一,為了滿足自身快速增殖的需要,腫瘤細(xì)胞通常表現(xiàn)出與正常細(xì)胞不同的代謝特征:⑴無(wú)論在富氧或是乏氧條件下均以糖酵解為主要產(chǎn)能方式;⑵大量脂類合成以滿足腫瘤細(xì)胞內(nèi)細(xì)胞器生物膜的形成及自身特殊生物學(xué)的需要;⑶大量蛋白質(zhì)物質(zhì)生產(chǎn)來(lái)維持細(xì)胞結(jié)構(gòu)和功能的運(yùn)行[10-12]。近年來(lái),隨著腫瘤生物學(xué)研究技術(shù)的高速發(fā)展,代謝異常先于腫瘤發(fā)生發(fā)展的理論已經(jīng)在生物實(shí)驗(yàn)中逐步得到證實(shí)。Yun J等[13]發(fā)現(xiàn)葡萄糖缺乏可以促進(jìn)KRAS野生型的支氣管黏膜上皮細(xì)胞獲得KRAS及其信號(hào)通路分子的突變,進(jìn)一步證明了細(xì)胞代謝的異??梢哉T導(dǎo)原癌基因突變。有研究報(bào)道經(jīng)過(guò)對(duì)肺癌患者血液和病理組織樣本高通量測(cè)序發(fā)現(xiàn),肺癌細(xì)胞中大量代謝相關(guān)基因存在突變,這些基因包括代謝物轉(zhuǎn)運(yùn)基因CD98,MCTs,三羧酸循環(huán)通路關(guān)鍵基因SDH、IDH、FH,糖酵解關(guān)鍵基因GLUT1,GPI,以及核苷酸合成代謝基因TYMS,RRM2B等,且這些代謝相關(guān)基因的突變與非小細(xì)胞肺癌的進(jìn)展密切相關(guān)。Pérez-Ramírez C等[14]研究也表明葉酸代謝基因MDM2突變的非小細(xì)胞肺癌患者的OS更短。到目前為止,已經(jīng)有上百個(gè)蛋白質(zhì)被認(rèn)為參與了代謝過(guò)程,因此,代謝相關(guān)基因可能作為肺癌的預(yù)后標(biāo)志物。
圖8A為諾莫列線圖,圖8B為校正曲線圖
本研究通過(guò)權(quán)威數(shù)據(jù)庫(kù)TCGA和GENECARDS網(wǎng)站,下載了肺鱗癌患者的代謝相關(guān)基因表達(dá)數(shù)據(jù)和相應(yīng)的臨床信息,通過(guò)具體分析發(fā)現(xiàn),在肺鱗癌的發(fā)生和發(fā)展中,多個(gè)代謝相關(guān)基因的表達(dá)發(fā)生了改變,這些表達(dá)改變的代謝基因有可能在肺鱗癌的發(fā)生、進(jìn)展和預(yù)后中起著重要作用。針對(duì)代謝相關(guān)基因的表達(dá)改變,初步篩選出239個(gè)差異表達(dá)的代謝基因。為了探究這些差異基因的表達(dá)水平和臨床預(yù)后的關(guān)系,本研究在構(gòu)建Cox回歸模型時(shí),先分別只納入一個(gè)因素進(jìn)入到回歸模型中進(jìn)行擬合,即單因素Cox回歸分析,并且為了篩選出和預(yù)后密切相關(guān)的基因,P值設(shè)定為小于0.01,結(jié)果初步篩選出8個(gè)和肺鱗癌預(yù)后相關(guān)的代謝基因。由于單因素Cox回歸分析每一次只納入一個(gè)變量,可能存在過(guò)度擬合的現(xiàn)象,因此在單因素Cox回歸分析的基礎(chǔ)上又引入了LASSO回歸分析,LASSO回歸的優(yōu)點(diǎn)是擬合廣義線性模型的同事進(jìn)行變量篩選和復(fù)雜度的調(diào)整,有選擇性地把每一個(gè)相關(guān)變量放入模型中從而得到更好的參數(shù),并且通過(guò)一系列的參數(shù)來(lái)控制模型的復(fù)雜度,從而最大程度上減少過(guò)度擬合[15],這也能彌補(bǔ)單因素Cox回歸分析的不足,可能由于單因素Cox回歸分析設(shè)定的閾值較高,此次LASSO回歸分析得出的也是這8個(gè)代謝相關(guān)基因。值得注意的是,從熱圖可以看出,ALDH3B2和OPLAH在高風(fēng)險(xiǎn)組呈現(xiàn)更高的表達(dá)水平。ALDH3B2是乙醛脫氫酶家族成員之一,它是一個(gè)蛋白質(zhì)編碼基因,主要參與細(xì)胞色素P450相關(guān)的藥物代謝和組氨酸代謝。Michorowska S 等[16]研究表明,能耐受環(huán)磷酰胺為主的聯(lián)合化療作用的轉(zhuǎn)移腫瘤細(xì)胞的ALDH3B2表達(dá)水平明顯高于那些對(duì)環(huán)磷酰胺聯(lián)合化療有反應(yīng)的腫瘤細(xì)胞,提示ALDH3B2的高表達(dá)可能與腫瘤的耐藥性有一定關(guān)系。OPLAH是γ-谷氨酰循環(huán)中的一種酶,參與谷胱甘肽的合成和代謝,具有調(diào)節(jié)化療和放療的細(xì)胞毒作用,可以使腫瘤細(xì)胞中谷胱甘肽含量明顯下降,這一特征使得化療藥物對(duì)細(xì)胞的毒性增加。上述研究結(jié)果提示可能由于ALDH3B2和OPLAH這兩個(gè)基因與化療藥物代謝和耐藥有關(guān),因此這兩個(gè)基因呈現(xiàn)高表達(dá)的肺鱗癌的患者多存在化療藥物的耐藥和細(xì)胞毒性的增加,故在模型所預(yù)測(cè)的預(yù)后更差,但上述結(jié)論仍需進(jìn)一步的基礎(chǔ)實(shí)驗(yàn)進(jìn)行驗(yàn)證。
LASSO回歸分析可以對(duì)每一個(gè)肺鱗癌患者計(jì)算預(yù)后危險(xiǎn)評(píng)分,根據(jù)預(yù)后危險(xiǎn)評(píng)分的中位數(shù)值,模型將納入的肺鱗癌患者分為了高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,兩組間進(jìn)行了K-M生存分析,繪制ROC曲線并計(jì)算AUC值以評(píng)估該代謝基因預(yù)后模型的預(yù)測(cè)能力,其結(jié)果均提示高風(fēng)險(xiǎn)組總生存率較低風(fēng)險(xiǎn)組低,且3年和5年的AUC值均大于0.7,說(shuō)明該模型有一定的預(yù)測(cè)能力,然而,AUC僅關(guān)注于模型的預(yù)測(cè)準(zhǔn)確性,因此它并不能提示該模型是否值得使用,DCA曲線是一種包含結(jié)果的統(tǒng)計(jì)學(xué)方法,因此可以為是否使用該模型的決策提供參考信息。通過(guò)該方法與TCGA患者的臨床特征一起應(yīng)用于預(yù)后模型,我們發(fā)現(xiàn)當(dāng)預(yù)后模型與年齡,性別,分期這些因素相結(jié)合預(yù)測(cè)時(shí),肺鱗癌患者將受益更多。此外,多因素Cox回歸分析結(jié)果也驗(yàn)證了該模型計(jì)算的危險(xiǎn)評(píng)分與預(yù)后密切相關(guān),可以作為獨(dú)立的一個(gè)預(yù)后因子(HR=1.139,95%CI=1.101-1.179,P<0.05)。
最后,預(yù)后模型經(jīng)諾莫列線圖來(lái)評(píng)估其預(yù)測(cè)的能力。諾莫列線圖是一種穩(wěn)定和可靠的工具,通過(guò)組合和描繪危險(xiǎn)因素來(lái)進(jìn)行定量分析,現(xiàn)已經(jīng)廣泛應(yīng)用于評(píng)估各種疾病的預(yù)后,包括肺癌。諾莫列線圖生成一個(gè)以圖表呈現(xiàn)的統(tǒng)計(jì)預(yù)測(cè)模型,為臨床特征中的特定因素(如年齡、性別、分期)賦值。通過(guò)總結(jié)所有列線中的點(diǎn),諾莫列線圖可以為個(gè)體患者提供關(guān)于預(yù)后的數(shù)字化展示,例如總生存期,復(fù)發(fā)的時(shí)間,急性加重的間隔時(shí)間等[17]。除了傳統(tǒng)的臨床特征(TNM分期,腫瘤大小,靶基因突變)外,根據(jù)預(yù)后模型得出的風(fēng)險(xiǎn)評(píng)分也可以納入預(yù)測(cè)性諾莫列線圖中,以更好地預(yù)測(cè)預(yù)后結(jié)果。Li Y[10]報(bào)道了一個(gè)預(yù)測(cè)肺腺癌1年,3年,5年的OS生存概率的諾莫列線圖,并根據(jù)模型中的基因表達(dá)計(jì)算風(fēng)險(xiǎn)評(píng)分,結(jié)果提示風(fēng)險(xiǎn)評(píng)分和傳統(tǒng)預(yù)后因素相結(jié)合的評(píng)價(jià)方法比單獨(dú)使用傳統(tǒng)預(yù)后因素的評(píng)價(jià)方法更好,準(zhǔn)確性更高,其目的與本研究相同。正如校準(zhǔn)曲線所示,同時(shí)采用代謝相關(guān)基因模型和常規(guī)預(yù)后因子(年齡,性別,病理分期)的諾莫列線圖可以準(zhǔn)確地預(yù)測(cè)3年和5年的生存概率。
本研究采用多種生物信息學(xué)方法處理了大量的數(shù)據(jù)并進(jìn)行了分析,但仍有一些不足之處:⑴所有數(shù)據(jù)均來(lái)源于TCGA數(shù)據(jù)庫(kù),納入病例組482例,正常對(duì)照組49例,病例組明顯多于對(duì)照組,可能導(dǎo)致差異基因結(jié)果出現(xiàn)選擇性偏倚,在將來(lái)的進(jìn)一步研究中,本研究將繼續(xù)結(jié)合自己的臨床數(shù)據(jù)進(jìn)行驗(yàn)證;⑵預(yù)后模型僅納入了代謝相關(guān)基因的表達(dá)水平,未考慮其他重要基因如自噬相關(guān)基因,甲基化相關(guān)基因等重要基因的表達(dá)水平對(duì)預(yù)后的影響,因此該模型的應(yīng)用價(jià)值還需要進(jìn)一步進(jìn)行完善和研究。
綜上所述,經(jīng)TCGA轉(zhuǎn)錄組測(cè)序數(shù)據(jù)庫(kù)的挖掘和分析,篩選出的8個(gè)代謝相關(guān)基因組成的預(yù)后模型對(duì)肺鱗癌預(yù)后有較好的預(yù)測(cè)價(jià)值,可能對(duì)肺癌病人的個(gè)體化治療和個(gè)體化預(yù)后早期評(píng)估提供一定幫助。