路麗禎 溫菲菲 許曉陽 郭寧杰 賈真真 吳淑華
濱州醫(yī)學院附屬醫(yī)院病理科 山東 濱州 256603
近年來結直腸癌平均發(fā)病率已連續(xù)高居世界第三位,僅次于乳腺癌和肺癌,也是我國常見的癌癥之一[1]。同時,由于人們生活環(huán)境和飲食習慣不斷發(fā)生變化,結直腸癌發(fā)病率更是逐年上升,且呈低齡化趨勢[2],值得引起大家的重視。在目前所有對結直腸癌的發(fā)生機制的研究中,主要有兩種類型的分子缺陷,一種是癌基因的功能被改變而增強,另一種是抑癌基因的功能被改變所抑制[3];多種基因在大多數結直腸癌突變中起重要作用,如APC、KRAS、BRAF和p53基因等[4]。隨著現(xiàn)代醫(yī)學的發(fā)展,各種生物標志物可用于預測該病的發(fā)生和預后,并為臨床提供治療指導[5]。在臨床工作中,CEA、MSI和KRAS突變等是結直腸癌中最常用的腫瘤標志物[6]。隨著研究的進展,更多生物標志物將被發(fā)現(xiàn)并用于結直腸癌的發(fā)生、發(fā)展,預后與治療。結直腸癌嚴重威脅著廣大人民的健康,影響著許多患者的日常生活和工作。分析結直腸癌的早期發(fā)生、發(fā)展機制,對開展結直腸癌的早期防治工作具有重要指導意義。
分子預后模型是指將一系列分子標記重組,作為評估疾病生物學特性的新變量。與單分子功能研究相比,分子預后模型更加關注分子之間的相互作用,從整體水平上系統(tǒng)地、定量地描述了一些特定的生物學特性,其準確性通常高于單分子檢測的準確性[7]。本研究利用TCPA數據庫獲取結直腸癌預后相關蛋白的表達譜數據,并建立分子預后模型,評估結直腸癌預后相關蛋白組成的預后模型對結直腸癌患者預后的預測價值,并在總體結直腸癌患者中驗證其應用價值。
1.1 數據資料 從TCPA(The Cancer Proteome Atlas)數據庫中選擇結直腸癌患者的蛋白表達數據,并從TCGA數據庫中下載與患者相關的臨床數據。提取的臨床數據包括總生存期(OS)、年齡、性別、病理分期、TNM分期。
1.2 研究方法 從TCPA數據庫中篩選結直腸癌和正常組織中預后相關蛋白的表達數據。所有統(tǒng)計分析和圖表均使用R(V3.6.2)進行。生存軟件包用于篩選影響患者總體生存的預后相關蛋白。先使用單因素COX篩選差異表達蛋白,再使用多元COX回歸分析建立預測模型并計算風險評分(RS)。然后根據中位數將患者分為高危組和低危組。用Kaplan Meier生存曲線分析高危組與低危組之間的生存差異。在單因素和多因素COX回歸模型中納入預后評分和臨床病理因素,例如TNM分期、病理分期、年齡(≤65歲,> 65歲)和性別,以分析影響結直腸癌患者生存的因素。最后使用ROC曲線評估預后預測模型的準確性。
1.3 統(tǒng)計學方法 使用WilCOX測試分析和篩選差異蛋白和倍數變化(FC)。 篩選標準為:logfc> 1或logfc <-1,P<0.05。 使用單因素COX回歸模型篩選預后相關的蛋白質狀況(P<0.05)。 在其余單變量COX分析,多元COX分析和Kaplan Meier曲線中,P<0.05具有統(tǒng)計學意義。曲線下面積(AUC)>0.60被認為是可以接受的預測,而AUC> 0.75被認為具有良好的預測價值。在臨床相關性分析中,WilCOX檢驗用于比較兩組,Kruskal檢驗用于比較多個組。以P<0.05為差異具有統(tǒng)計學意義。
2.1 結直腸癌預后相關差異蛋白的篩選 TCPA數據庫中共下載了398例結直腸癌組織樣本和39例正常組織樣本的表達信息,同時在TCGA數據庫中下載384例結直腸癌患者的臨床信息,其中有完整臨床信息的共有337例。單因素COX檢驗篩選出其中24個預后相關差異蛋白表達有統(tǒng)計學意義,其中INPP4B、IGFBP2、BIM、GATA6、EGFR、EEF2K等17個基因上調,BID、SRC、CYCLIND1、等7個基因(見圖1A),其中紅點代表17個上調的差異蛋白,綠點代表7個下調的差異蛋白,黑點表示在結直腸癌組織樣本中未差異表達的蛋白。
2.2 預后相關蛋白模型的建立 將上述24個蛋白進行單因素COX分析和KM分析(P<0.05),共有BIM、SRC、BID、CYCLIND1、SRC_pY527、IGFBP2、INPP4B、GATA6、BECLIN、EGFR、EIF4G等11個差異蛋白可能影響患者的總體生存期(圖1B)。再將上述篩選后的11個蛋白進行多因素COX分析(P<0.05),進一步篩選出BIM、SRC、BID、CYCLIND1、SRC_pY527、IGFBP2、INPP4B共7個蛋白,并建立預后預測模型(見表1),其中高表達BIM、IGFBP2、INPP4B患者預后較差(P<0.05),低表達SRC、BID、CYCLIND1、SRC_pY527的患者預后不良(P<0.05)。預后評分公式為:PI=1.22×BIM的表達量 -1.82×BID的表達量-1.64×CYCLIND1的表達量+0.44×IGFBP2的表達量+0.83×INPP4B的表達量-0.75×SRC的表達量-0.35×SRC_pY527的表達量。根據預后評分公式計算的中位RS值將337例患者納入低風險組及高風險組。結果顯示低風險組的5年生存率約為85%,高風險組5年生存率約為50%(P<0.01)。低風險組75%OS(8.3年)較高風險組(2.52年)明顯延長,總生存率優(yōu)于高風險組(圖2B)。預后評分越高(圖2C),死亡的患者就越多(圖2D),也就是說,風險評分越高,預后越差。 圖2A顯示結直腸癌預后相關蛋白預后模型各蛋白在低風險組及高風險組的表達量。
表1 多因素COX分析建立結直腸癌預后相關蛋白預后預測模型表
A. 火山圖;B. 森林圖。
A.模型中高風險(藍色)和低風險(粉色)組結直腸癌患者中風險蛋白的表達;B.高風險和低風險組結直腸癌患者的預后;C.結直腸癌預后相關蛋白預后模型中高風險(紅色)和低風險(綠色)結直腸癌患者的風險評分分布;D.散點圖顯示了本模型中結直腸癌患者的生存狀況。紅點表示死亡的患者,綠點則表示活著的患者。
2.3 TCGA數據庫中選取的結直腸癌患者的臨床特征 從上述所得TCGA數據庫數據中,對可以提取到完整臨床數據的337例結直腸癌患者的相關數據進行整理并分析,納入患者的臨床特征見表2。
表2 TCGA數據庫中337例結直腸癌患者的臨床特征
2.4 結直腸癌患者生存影響因素的COX回歸分析及多指標ROC曲線 納入COX回歸分析的自變量中的連續(xù)變量為結直腸癌預后相關蛋白模型評分,余為分類變量。單因素COX回歸模型分析結果顯示年齡、性別、分級、TMN分期及結直腸癌預后相關蛋白預后模型評分是影響結直腸癌總體生存期的危險因素(P<0.05,圖3B)。多因素COX回歸模型分析,結果顯示年齡、結直腸癌預后相關蛋白預后模型是結直腸癌患者預后的獨立影響因素(P<0.05,圖3A)。多指標ROC曲線分析患者5年的生存情況,結直腸癌預后相關蛋白模型的ROC曲線的AUC值最大,為0.727(零假設:實面積=0.5,P<0.001),提示結直腸癌預后相關蛋白模型可以接受預測,見圖4。
A.多因素分析;B.單因素分析。
圖4 5年生存多指標的ROC曲線
結直腸癌是我國一種常見的消化系統(tǒng)腫瘤,在惡性腫瘤中居第三位,在癌癥致死原因中居第四位[8]。目前,根治性切除聯(lián)合合理的放化療是治療結直腸癌的主要方法,但療效并不理想。30%~50%的患者術后復發(fā)[9],生存率不高。發(fā)生轉移的患者5年生存率僅為10%~15%[10]。由此可見,結直腸癌的發(fā)病率在各類癌癥中很高,但其具體的發(fā)病機制和轉移的分子病理機制尚不清楚,已成為結直腸癌診治的主要難題之一。目前判斷結直腸癌預后的主要因素依舊是臨床與病理等觀察指標,而且隨著分子生物學的進步,許多能夠影響結直腸癌預后的分子標志物被發(fā)現(xiàn)而越來越受到重視,如這些分子標志物被引入結直腸癌預后分析系統(tǒng),有助提高預測的準確性。因此,尋找敏感性、準確性和特異性高的新的預后標志物將有助于結直腸癌早期診斷和治療。
BIM(Bcl-2 Interacting Mediator of cell death)是BH3-only蛋白的重要成員,具有高度的促凋亡性,在生理和病理生理條件下啟動內源性凋亡途徑。多位學者的研究證明,當BIM高表達時,可以抑制腫瘤的增殖與轉移從而改善預后[11-14]。BID(BH3-interacting domain death agonist)也是BH3-only蛋白的成員,過度表達時使某些癌癥細胞對抗癌藥物誘導的凋亡敏感,特別是通過死亡受體(例如TRAIL)作用的那些藥物誘導的凋亡非常敏感[15],但是同時,Yin等的研究表明,BID的缺失一方面可以抑制肝細胞癌變,但是卻增加了患白血病的風險[16]。SRC是一種非受體胞質酪氨酸激酶,是多種生理穩(wěn)態(tài)途徑中不可缺少的一員。在腫瘤中常有SRC的活性增加,并且在侵襲、轉移的發(fā)展中具有顯著的作用[17],還有研究表明,結直腸癌中SRC過表達還可以通過多個下游信號通路如PI3K-AKT、MAPK、VEGF等產生化療耐藥性,影響化療藥物的療效[18]。CyclinD1介導各種癌癥中G1至S期發(fā)育,在包括結直腸癌在內的許多癌癥的發(fā)展過程中都觀察到了CyclinD1表達增高[19]。并且有研究證明,PTEN介導的自噬可以抑制CyclinD1的表達,從而導致G0-G1期停滯[20]。INPP4B(II型肌醇多磷酸4-磷酸酶)是一種磷酸肌醇磷酸酶,是PI3K / AKT途徑的負調控因子之一[21],在前列腺癌、宮頸癌等癌癥中起著抑癌作用[21-22],同時有學者研究表明,INPP4B在結直腸癌中過表達,通過增加mTORC1活性來促進結直腸癌細胞的增殖[23]。IGFBP2(胰島素樣生長因子(IGF)結合蛋白2)被認為是一種致癌因子,在多種癌癥、多種信號通路中發(fā)揮作用導致腫瘤發(fā)生發(fā)展[24],ZHU等的研究顯示,IGFBP2通過抑制E-鈣黏著蛋白的表達促進結直腸癌細胞的增殖和遷移[25]。而對于SRC_pY527的研究尚未見報道。
在這項研究中,我們分析了來自TCPA數據庫的結直腸癌預后相關蛋白的數據,并進行了篩選。然后,我們使用單變量COX回歸分析和多元COX回歸分析來確定與OS相關的7個風險差異相關蛋白。我們進一步構建了結直腸癌預后相關蛋白的預后風險模型(OS模型),并分析了該模型與臨床指標之間的相關性,證明了它們可以為結直腸癌患者提供準確的預后。這項研究可能為結直腸癌的分子機制和預后預測提供新的見解,為臨床醫(yī)生提供一種選擇來更準確地分析每個患者的預后,并有助于定制治療方案。同時,建立多基因預后模型可以提供比臨床病理指標更準確的預后評估指導,減少醫(yī)療資源的浪費,指導個體化治療方案的選擇,使患者受益于臨床。