侯松林,謝興江,彭強(qiáng),周國俊,李利發(fā),周何,張廣軍,周彤
(1.川北醫(yī)學(xué)院附屬醫(yī)院 胃腸外二科,四川 南充 637000;2.川北醫(yī)學(xué)院肝膽胰腸研究所,四川 南充 637000)
胃癌作為最常見的消化系統(tǒng)惡性腫瘤之一,嚴(yán)重威脅著人類健康安全。據(jù)GLOBOCAN 2018[1]數(shù)據(jù)表明,其發(fā)病率和病死率分別高居世界惡性腫瘤的第5位和第2位,這表明胃癌的治療仍具有巨大的挑戰(zhàn)性。晚期胃癌患者通常表現(xiàn)出較差的預(yù)后,肝臟是最常見的遠(yuǎn)處轉(zhuǎn)移器官,約5%~14%的將會(huì)出現(xiàn)肝轉(zhuǎn)移,即使在接受胃癌根治術(shù)后也有大約13.5%~30%的患者最終發(fā)生肝轉(zhuǎn)移,這也使得肝轉(zhuǎn)移成為胃癌患者最主要的死亡原因[2-4]。目前,盡管腫瘤的綜合治療技術(shù)獲得了一定的進(jìn)步,但是胃癌伴肝轉(zhuǎn)移(gastric cancer with liver metastasis,GCLM)患者的預(yù)后仍然不甚理想[5]。因此,采取針對(duì)GCLM患者有效的個(gè)體化治療和預(yù)后綜合評(píng)估對(duì)臨床策略的實(shí)施具有非常重要的意義。
目前,臨床上常見的預(yù)后評(píng)價(jià)主要根據(jù)美國聯(lián)合委員會(huì)癌癥(American Joint Committee on Cancer,AJCC)分期指南[6],其內(nèi)容主要包含腫瘤浸潤深度、淋巴結(jié)轉(zhuǎn)移數(shù)目、血行轉(zhuǎn)移情況等病理指標(biāo),但未能充分考慮如年齡、性別、腫瘤分化程度、原發(fā)腫瘤數(shù)目以及其他治療措施等多種被認(rèn)為可能對(duì)個(gè)體化生存預(yù)測有重要意義的因素,因而其對(duì)于患者個(gè)體化預(yù)后的指導(dǎo)價(jià)值受到一定的局限。列線圖預(yù)測模型[7]基于大量臨床數(shù)據(jù),利用多個(gè)獨(dú)立預(yù)后評(píng)價(jià)因子結(jié)合后來量化個(gè)體的生存風(fēng)險(xiǎn),而被認(rèn)為對(duì)患者的生存預(yù)后評(píng)價(jià)具有重要價(jià)值。目前,國內(nèi)外學(xué)者[8-9]對(duì)GCLM患者的臨床預(yù)后因素進(jìn)行了一定的探索,但是由于以往的研究存在病例量較小、研究內(nèi)容不全面的缺陷,使得對(duì)患者的預(yù)后影響分析受到局限,同時(shí)也未能建立起一種綜合多種獨(dú)立預(yù)后因素以高效、簡潔的評(píng)估GCLM患者生存預(yù)后的評(píng)價(jià)預(yù)測模型。
因此,本研究基于SEER(Surveillance,Epidemiology,and End Results)數(shù)據(jù)庫臨床病例樣本量大、資料豐富的特點(diǎn),系統(tǒng)分析GCLM患者的臨床特征并探討其預(yù)后相關(guān)因素,構(gòu)建GCLM患者的列線圖預(yù)后評(píng)價(jià)模型,以期為患者的個(gè)體化預(yù)后評(píng)估提供更多重要參考。
SEER數(shù)據(jù)庫[10]全稱為美國國立癌癥研究所監(jiān)測、流行病學(xué)和結(jié)果數(shù)據(jù)庫,該數(shù)據(jù)庫詳細(xì)記錄了1973年以來美國部分州縣大量患者的發(fā)病、病理、治療及預(yù)后等信息,其具有數(shù)量大、臨床資料相對(duì)全面的特點(diǎn)。本研究采用SEER*Stat 8.3.6軟件,提取2010—2015年經(jīng)影像學(xué)或病理診斷為GCLM患者的病例資料。
納入標(biāo)準(zhǔn):⑴ 患者初診時(shí)原發(fā)腫瘤位于胃部;⑵ 影像學(xué)或病理檢查證實(shí)伴肝臟轉(zhuǎn)移;⑶ 病理組織學(xué)類型為腺癌;⑷ 僅基于ICD-O-3的惡性行為;⑸ 有完整的臨床、病理及隨訪資料。排除標(biāo)準(zhǔn):⑴ 多源性的原發(fā)性腫瘤;⑵ 轉(zhuǎn)移性胃癌;⑶ 不伴肝臟轉(zhuǎn)移的胃癌;⑷ 伴肝外其他部位轉(zhuǎn)移的胃癌;⑸ 經(jīng)過尸檢或死亡證明確診的病例;⑹ 大量數(shù)據(jù)指標(biāo)缺失的病例。
納入分析的SEER數(shù)據(jù)編碼名稱包括:Sex、Age at Diagnosis、Primary Site、Histologic Type ICD-O-3、Grade、Stage-7th Edition、Derived AJCC 7th、RX Summ-Surg Prim Site、RX Summ-Surg Oth Reg/Dis、Radiation Recode、Chemotherapy Recode、Regional Nodes Examined、SEER Combined Mets at DX-liver、CS Tumor Size、SEER Cause-Specific Death Classification、SEER Other Cause of Death Classification、Survival Months、Vital Status Recode、First Malignant Primary Indicator、Total Number of in Situ/Malignant Tumors for Patient、Race Recode、Marital Status at Diagnosis、Insurance Recode、CS Site-Specific Factor 1。
納入研究的變量包括:性別、年齡、種族、腫瘤部位、腫瘤T分期、腫瘤N分期、分化程度、是否放療、是否化療、是否原發(fā)灶手術(shù)、是否轉(zhuǎn)移灶手術(shù)、檢出淋巴結(jié)數(shù)目、原發(fā)腫瘤數(shù)目、婚姻狀態(tài)、保險(xiǎn)狀態(tài)、生存狀態(tài)、死亡原因和生存時(shí)間等18個(gè)指標(biāo)。腫瘤分期采用第7版美國癌癥聯(lián)合委員會(huì)(American Joint Committee of Cancer,AJCC)TNM分期標(biāo)準(zhǔn)。
采用R 3.6.3和SPSS 26軟件進(jìn)行數(shù)據(jù)分析。采用χ2檢驗(yàn)比較各組間變量構(gòu)成比差異。利用Cox等比例回歸模型進(jìn)行單因素、多因素分析各變量對(duì)GCLM患者總體生存期(overall survival,OS)的影響,并基于Kaplan-Meier和Log-rank檢驗(yàn)方法采用R軟件繪制各變量的生存曲線;利用Fine-Gray競爭風(fēng)險(xiǎn)模型分析各變量對(duì)GCLM患者癌癥特異性生存期(cancer-specific survival,CSS)的影響,其中癌癥相關(guān)死亡概率和競爭風(fēng)險(xiǎn)死亡概率用累積發(fā)生率(cumulative incidence function,CIF)表示。R軟件建立GCLM患者OS和CSS的列線圖預(yù)測模型,最后利用一致性指數(shù)(C-index)、ROC曲線和校正曲線驗(yàn)證模型的可靠性。以α=0.05作為檢驗(yàn)水準(zhǔn)。
根據(jù)研究指標(biāo)的納入情況,逐步篩選符合要求的病例(圖1),最終納入伴肝轉(zhuǎn)移的胃癌患者 2 554例,其中男性1 739例,女性815例,按7:3比例隨機(jī)分成建模集(1790例)和驗(yàn)證集(764例),患者基本特征見表1。結(jié)果顯示:建模集和驗(yàn)證集在性別、年齡、種族、腫瘤T分期、腫瘤N分期、腫瘤分級(jí)、腫瘤部位、檢出淋巴結(jié)數(shù)目、原發(fā)腫瘤數(shù)目、原發(fā)灶手術(shù)、轉(zhuǎn)移灶手術(shù)、放療、化療、婚姻狀態(tài)和保險(xiǎn)狀態(tài)等方面均無統(tǒng)計(jì)學(xué)差異(均P>0.05)(表1)。
圖1 病例篩選流程圖Figure1 The case selection process
表1 建模集和驗(yàn)證集中GCLM患者的基本特征情況Table1 The basic characteristics of GCLM patients in modeling set and validation set
Cox單因素生存分析顯示,年齡、腫瘤分化程度、T分期、原發(fā)灶手術(shù)、轉(zhuǎn)移灶手術(shù)、化療、原發(fā)腫瘤數(shù)目、檢出淋巴結(jié)數(shù)目和婚姻狀態(tài)等9個(gè)指標(biāo)與GCLM患者的OS預(yù)后有關(guān)(均P<0.05),經(jīng)多因素Cox回歸分析及AIC優(yōu)化分析后顯示,年齡、腫瘤分化程度、原發(fā)灶手術(shù)、原發(fā)腫瘤數(shù)目、化療等5個(gè)指標(biāo)是影響GCLM患者OS預(yù)后的獨(dú)立影響因素(均P<0.05)(表2)?;贙aplan-Meier和Log-rank檢驗(yàn)方法,利用Cox風(fēng)險(xiǎn)模型繪制出各主要變量的生存曲線,結(jié)果顯示:年齡越大、腫瘤分化程度越低的GCLM患者總的生存風(fēng)險(xiǎn)越高,而明確采取化療或原發(fā)病灶手術(shù)切除措施的患者則具有更低的生存風(fēng)險(xiǎn),并且患者的總生存風(fēng)險(xiǎn)亦隨著原發(fā)腫瘤數(shù)目的減少而增大(圖2)。
本研究利用Fine-Gray競爭風(fēng)險(xiǎn)模型對(duì)CRLM患者CSS進(jìn)行分析,競爭風(fēng)險(xiǎn)是指研究對(duì)象除了會(huì)出現(xiàn)研究者感興趣的結(jié)局之外,還會(huì)出現(xiàn)其他意外結(jié)局,它的出現(xiàn)會(huì)導(dǎo)致感興趣事件永遠(yuǎn)不會(huì)發(fā)生,兩者相互競爭,從而易導(dǎo)致生存函數(shù)的錯(cuò)估。經(jīng)過逐步篩選及多因素分析后最終結(jié)果顯示,腫瘤分化程度、原發(fā)灶手術(shù)、原發(fā)腫瘤數(shù)目、化療等4個(gè)因素是GCLM患者CSS的獨(dú)立危險(xiǎn)因素(表3)。繪制出各主要變量的累積發(fā)生率曲線,結(jié)果顯示:GCLM患者腫瘤特異性死亡的發(fā)生,隨著腫瘤分化程度的升高而降低,隨著采取積極治療措施如原發(fā)灶手術(shù)切除和化療等方案而明顯降低,而隨著原發(fā)腫瘤數(shù)目減少死亡風(fēng)險(xiǎn)增大(圖3)。
表2 影響GCLM患者OS的單因素和多因素分析Table2 Univariate and multivariate analysis of factors for OS in patients with GCLM
圖2 主要變量對(duì)GCLM患者OS的影響生存曲線分析Figure2 Survival curve analysis of influences of the main variables on the OS of GCLM patients
表3 影響GCLM患者特異生存期的多因素分析Table3 Multivariate analysis of factors for CSS in patients with GCLM
圖3 主要變量對(duì)GCLM患者CSS的影響生存曲線分析(1表示死亡為該腫瘤導(dǎo)致,2表示死亡為其他原因?qū)е拢〧igure3 Survival curve analysis of influences of the main variables on the CSS of GCLM patients (1 standing for death caused by the tumor,2 standing for death caused by other reasons)
基于建模集中的Cox分析模型和Fine-Gray分析模型的結(jié)果(圖4),將多因素Cox回歸分析中顯示有統(tǒng)計(jì)學(xué)意義的5個(gè)變量納入GCLM患者OS預(yù)后的列線圖模型,將競爭風(fēng)險(xiǎn)模型中分析顯示有統(tǒng)計(jì)學(xué)意義的4個(gè)變量納入GCLM患者CSS預(yù)后的列線圖模型。整合所有的獨(dú)立預(yù)測因子,構(gòu)建列線圖模型預(yù)測GCLM患者1、3、5年的預(yù)后生存期(圖5)。
圖4 GCLM患者OS和CSS的比例危害模型森林圖 A:OS;B:CSS Figure4 The proportional hazard model forest map of OS and CSS in GCLM patients A:OS;B:CSS
圖5 GCLM患者預(yù)后列線圖預(yù)測模型 A:OS;B:CSSFigure5 Nomogram prediction model for prognosis of GCLM patients A:OS;B:CSS
依據(jù)確立的建模集和驗(yàn)證集,將構(gòu)建好的模型進(jìn)行內(nèi)部驗(yàn)證,結(jié)果顯示GCLM患者OS和CSS預(yù)后的列線圖模型均有較高的預(yù)測準(zhǔn)確性。建模集和驗(yàn)證集中患者OS的列線圖模型的一致性指數(shù)明顯高于TNM分期評(píng)價(jià)系統(tǒng)(0.706 vs.0.560;0.670 vs.0.554),而建模集和驗(yàn)證集中患者CSS的列線圖模型的一致性指數(shù)與T N M分期評(píng)價(jià)系統(tǒng)相比亦明顯提高(0.769 vs.0.534;0.744 vs.0.518)(表4)。同時(shí),進(jìn)行ROC曲線分析,結(jié)果顯示評(píng)估患者OS和CSS的兩組列線圖模型均具有更大的曲線下面積,提示新模型具有更好的準(zhǔn)確性(圖6)。為了減少一致性指數(shù)出現(xiàn)過度擬合現(xiàn)象,對(duì)其一致性指數(shù)進(jìn)行校正,本研究擇取患者1年的生存狀況用以構(gòu)建校正曲線,結(jié)果顯示出列線圖預(yù)測模型的OS和CSS的1年生存率預(yù)測曲線與對(duì)角線具有較高的吻合度,提示實(shí)際觀察和列線圖模型預(yù)測的1年生存概率具有較好的一致性,說明構(gòu)建的模型具有良好的辨別能力與準(zhǔn)確性(圖7)。
表4 列線圖評(píng)價(jià)模型和AJCC-TNM 評(píng)價(jià)系統(tǒng)的一致性指數(shù)Table4 The C-indexes of nomogram evaluation models and AJCC-TNM evaluation system
圖6 評(píng)價(jià)預(yù)測模型可靠性的ROC曲線 A:OS;B:CSSFigure6 ROC curves for evaluating the reliability of the prediction models A:OS;B:CSS
圖7 建模集和驗(yàn)證集中GCLM患者OS和CSS的列線圖預(yù)測模型1年生存率的校正曲線(圖中橫坐標(biāo)表示列線圖模型預(yù)測生存率,縱坐標(biāo)表示Kaplan-Meier 法計(jì)算的實(shí)際生存率,對(duì)角線表示兩者匹配完全一致性)A:OS;B:CSSFigure7 The calibration curves of nomogram prediction model of 1-year survival for OS and CSS in GCLM patients in modeling set and validation set (the horizontal axis showing the predicted survival rates by the nomogram prediction model,and the vertical axis showing the actual survival rates obtained by Kaplan-Meier method) A:OS;B:CSS
GCLM是一種具有嚴(yán)重不良結(jié)局的惡性疾病,近年來隨著各種手術(shù)和輔助治療技術(shù)的進(jìn)步,多學(xué)科的綜合治療現(xiàn)已成為GCLM的主要治療模式,并使得患者明顯獲益[11-12]。既往研究表明,患者的預(yù)后與臨床、病理參數(shù)以及腫瘤的生物學(xué)特性關(guān)系密切[13-14]。因此,在優(yōu)化綜合治療模式和預(yù)后評(píng)估手段時(shí),應(yīng)該充分考慮并結(jié)合各種相關(guān)的重要指標(biāo)。本研究以大樣本臨床資料為依據(jù),構(gòu)建良好的腫瘤預(yù)后評(píng)估模型,以為患者的個(gè)體化綜合治療提供參考。
列線圖作為一種新型的統(tǒng)計(jì)預(yù)測模型[15],相較于傳統(tǒng)的預(yù)后分析模式具有準(zhǔn)確性高、使用靈活、易于推廣等眾多優(yōu)點(diǎn),目前已被廣泛應(yīng)用于肝癌、膀胱癌、前列腺癌、宮頸癌以及胃癌等多種腫瘤類型中[16-20]。本研究構(gòu)建了列線圖模型用以預(yù)測GCLM患者的OS和CSS,并利用驗(yàn)證集數(shù)據(jù)對(duì)該模型進(jìn)行驗(yàn)證,采用一致性指數(shù)、ROC曲線和校正曲線分析評(píng)估了該模型的準(zhǔn)確性和可靠性。結(jié)果顯示,建立的兩組列線圖模型能夠有效地預(yù)測GCLM患者的OS和CSS,其具備良好的辨別和校準(zhǔn)能力,并且均較AJCC-TNM分期系統(tǒng)具有更好的預(yù)測能力。因此,本研究認(rèn)為構(gòu)建的生存評(píng)價(jià)模型是可靠的,其預(yù)測能力是穩(wěn)健的。
本研究結(jié)果顯示,年齡、腫瘤病理分級(jí)、原發(fā)灶數(shù)目、原發(fā)灶切除和化療等5個(gè)指標(biāo)是影響GCLM患者生存預(yù)后的獨(dú)立危險(xiǎn)因素,并最終被納入列線圖評(píng)價(jià)模型。通過對(duì)比GCLM患者OS和CSS的列線圖模型發(fā)現(xiàn),其納入評(píng)價(jià)的指標(biāo)具有相當(dāng)?shù)墓餐裕瑑H有年齡指標(biāo)被單獨(dú)納入OS評(píng)價(jià)模型中,這突顯了年齡因素對(duì)評(píng)估患者OS預(yù)后的重要性。目前認(rèn)為,大多數(shù)腫瘤性疾病的臨床預(yù)后情況與年齡具有緊密的聯(lián)系,而本研究結(jié)果顯示出年齡越大將越不利于患者的OS預(yù)后,這與大部分學(xué)者的研究結(jié)果具有一致性[21-23],而導(dǎo)致這一結(jié)果的原因可能與高齡患者未及時(shí)的早期發(fā)現(xiàn)和診治、接受姑息治療的比例較高、機(jī)體免疫能力衰退以及較差的經(jīng)濟(jì)實(shí)力有關(guān)。目前,針對(duì)GCLM的治療方法主要包括了手術(shù)切除、全身化療、消融治療、放射治療以及最佳支持治療等,但這些治療的適應(yīng)癥和禁忌癥仍存在較大爭議,但多臨床指南將系統(tǒng)性全身化療認(rèn)為是GCLM的主要輔助治療措施,并獲得了廣泛的認(rèn)可[24-26]。在本研究中發(fā)現(xiàn),兩種預(yù)后的評(píng)價(jià)模型均顯示出患者的生存預(yù)期與全身化療顯著相關(guān),明確采取化療措施的患者無論是OS還是CSS均顯著提高,這進(jìn)一步地肯定了化療對(duì)GCLM患者的重要性和必要性。胃癌原發(fā)灶聯(lián)合肝轉(zhuǎn)移灶切除被認(rèn)為是治愈GCLM潛在可能的唯一方案,但由于該疾病常起病隱匿、多伴有肝內(nèi)微小轉(zhuǎn)移、腹膜轉(zhuǎn)移、淋巴結(jié)轉(zhuǎn)移以及肝外遠(yuǎn)處轉(zhuǎn)移等,大多不宜進(jìn)行肝病灶切除手術(shù)治療[27-28]。為此,近年來臨床研究開始積極討論原發(fā)灶根治性手術(shù)切除等姑息治療方案的可靠性,但是缺乏更多的循證醫(yī)學(xué)證據(jù)。本研究結(jié)果顯示,胃癌原發(fā)病灶的切除可以使得GCLM患者的OS和CSS的預(yù)后均顯著獲益,這充實(shí)了必要的循證醫(yī)學(xué)證據(jù)。其可能的原因:一方面,有研究認(rèn)為原發(fā)病灶的存在可能具有誘導(dǎo)轉(zhuǎn)移灶癌旁組織產(chǎn)生有利于腫瘤細(xì)胞侵襲、轉(zhuǎn)移和生長繁殖等所需要的腫瘤微環(huán)境的作用,并且原發(fā)灶中腫瘤干細(xì)胞的存在也可能增加了VEGF的表達(dá),從而誘導(dǎo)血管的新生,共同促進(jìn)腫瘤的發(fā)展[29-30]。另一方面,腫瘤原發(fā)灶中炎癥因子的持續(xù)存在也可影響腫瘤的發(fā)展,其中以IFN-γ、IL-10等為代表的炎癥因子,可通過發(fā)揮抗腫瘤免疫或誘導(dǎo)腫瘤免疫耐受等過程調(diào)節(jié)腫瘤的發(fā)展[31]。因此,腫瘤原發(fā)灶的切除可能轉(zhuǎn)變了上述各種不利影響因素,從而改善了GCLM患者的生存預(yù)后。腫瘤分化程度反映了腫瘤的侵襲能力和惡性度,本研究結(jié)果顯示原發(fā)腫瘤的分化程度越低,患者的生存預(yù)后風(fēng)險(xiǎn)越大,這一結(jié)論與多數(shù)研究報(bào)道一致[9,32]。近年來,有學(xué)者[33]對(duì)患者預(yù)后與腫瘤原發(fā)灶數(shù)目的關(guān)系進(jìn)行了探索,并認(rèn)為腫瘤病灶數(shù)目的增多和腫瘤侵襲性特征成正相關(guān),這引起了學(xué)界對(duì)腫瘤原發(fā)灶數(shù)目特征的關(guān)注。本研究結(jié)果發(fā)現(xiàn),較于原發(fā)灶數(shù)目為1的GCLM患者而言,原發(fā)灶數(shù)目為2的患者OS和CSS預(yù)后風(fēng)險(xiǎn)評(píng)分更低,展示出原發(fā)灶數(shù)目對(duì)于GCLM患者的預(yù)后而言可能是保護(hù)因子。黃彩平等[33]研究也發(fā)現(xiàn)原發(fā)腫瘤數(shù)目較多組比較少組具有更低的乳腺癌特異病死率,這與本研究結(jié)果相一致。不過這一結(jié)論仍值得進(jìn)一步的商榷和驗(yàn)證,該結(jié)果初次在本研究中得出,還缺乏更多的參考資料支持,因此未來仍需進(jìn)一步加大對(duì)此方面的研究探索,以證實(shí)該指標(biāo)的可靠性。
綜上所述,本研究利用SEER數(shù)據(jù)庫中臨床病理資料涵蓋面廣、數(shù)據(jù)量大的優(yōu)勢,在有效地確保了預(yù)測模型準(zhǔn)確性和可靠性的前提下,構(gòu)建的兩組列線圖預(yù)測模型均具有重要的臨床實(shí)際應(yīng)用價(jià)值,能夠?qū)CLM患者OS和CSS生存預(yù)后進(jìn)行有效的評(píng)估,因此建立的模型可作為咨詢和指導(dǎo)GCLM患者臨床治療決策的重要工具。但是,需要提及的是SEER數(shù)據(jù)庫也存在著一定的不足,比如某些重要信息的缺乏、部分信息不詳細(xì)等,使得不能對(duì)某些重要內(nèi)容進(jìn)行研究,而且亦可能存在導(dǎo)致不同程度偏倚的風(fēng)險(xiǎn)。在本研究中不可否認(rèn)的是也存在著一定的不足之處,如存在一些重要指標(biāo)未能納入研究、手術(shù)和化療具體方案不詳?shù)炔蛔悖虼?,未來仍需要更多的臨床研究作進(jìn)一步的驗(yàn)證支持。