章銳,阮劍,趙建國(guó)
乳腺癌是全世界女性中最常見(jiàn)的惡性腫瘤,也是導(dǎo)致癌癥死亡的第2 大原因[1],從1976 年至2009年,50 歲以下女性乳腺癌的發(fā)病率以每年0.2%的速度增長(zhǎng),而在被確診為乳腺癌的病人中,遠(yuǎn)處轉(zhuǎn)移的發(fā)病率則以每年約2%的速度增長(zhǎng)[2]。各期乳腺癌的5 年相對(duì)生存率為89.7%,而晚期乳腺癌的預(yù)后較差,5 年生存率僅為26.9%[3]。晚期乳腺癌包括遠(yuǎn)處轉(zhuǎn)移和局部晚期乳腺癌,目前遠(yuǎn)處轉(zhuǎn)移性乳腺癌仍然是無(wú)法治愈的疾病,激素受體陽(yáng)性并且人表皮生長(zhǎng)因子受體2(Her-2)陰性的晚期乳腺癌比其他類別的晚期乳腺癌具有更好的生存率[3-4],但是晚期乳腺癌(遠(yuǎn)處轉(zhuǎn)移性乳腺癌)個(gè)體化的預(yù)后并不明確。
列線圖是一個(gè)能綜合分析預(yù)后危險(xiǎn)因素,從而進(jìn)行可視化、個(gè)體化評(píng)估的方法,目前被廣泛用于各種類型的癌癥[5-6],但是在遠(yuǎn)處轉(zhuǎn)移性乳腺癌方面,僅發(fā)現(xiàn)極少量的研究。本研究基于SEER(The Surveillance,Epidemiology,and End Results)數(shù)據(jù)庫(kù)首次較好地建立遠(yuǎn)處轉(zhuǎn)移性乳腺癌的預(yù)后列線圖,根據(jù)SEER 數(shù)據(jù)庫(kù)中遠(yuǎn)處轉(zhuǎn)移性乳腺癌病人的臨床病理資料,以確定該模型可以較為準(zhǔn)確地預(yù)測(cè)病人的存活率,從而為臨床醫(yī)師對(duì)遠(yuǎn)處轉(zhuǎn)移性乳腺癌預(yù)后判斷及治療提供參考。
1.1 數(shù)據(jù)資料獲取使用SEER*stat 軟件從數(shù)據(jù)庫(kù)中提取數(shù)據(jù),提取條件為“(1)發(fā)病部位:乳腺;(2)性別:女性;(3)診斷年份:2010—2012 年;(4)既往無(wú)腫瘤病史”,提取變量為“病人ID、生存時(shí)間、生存狀態(tài)、年齡、種族、婚姻狀態(tài)、組織學(xué)分級(jí)、原發(fā)灶是否手術(shù)、雌激素受體(ER)狀態(tài)、孕激素受體(PR)狀態(tài)、Her-2狀態(tài)、第七版美國(guó)癌癥聯(lián)合委員會(huì)(AJCC)T 分期、第七版AJCC N 分期、有無(wú)骨轉(zhuǎn)移、有無(wú)腦轉(zhuǎn)移、有無(wú)肝轉(zhuǎn)移、有無(wú)肺轉(zhuǎn)移”。本研究符合《世界醫(yī)學(xué)協(xié)會(huì)赫爾辛基宣言》相關(guān)要求。
1.2 納入、排除標(biāo)準(zhǔn)納入標(biāo)準(zhǔn):為保證所有病人均隨訪5 年以上,選擇診斷年份為2012 年前的乳腺癌;遠(yuǎn)處轉(zhuǎn)移數(shù)據(jù)庫(kù)中SEER combined mets at DXbone/brain/liver/lung(2010+)為2010年后的乳腺癌。共獲得臨床資料完整的139 584 例女性乳腺癌病人。排除標(biāo)準(zhǔn):生存時(shí)間為0,無(wú)遠(yuǎn)處轉(zhuǎn)移。獲得2010 年1 月至2012 年12 月具有完整臨床信息的有效數(shù)據(jù)3 989例。
1.3 數(shù)據(jù)分組通過(guò)整群隨機(jī)抽樣法[7],以3∶1 分組,從3 989 例病人選2 993 例為建模組,996 例為驗(yàn)證組。
1.4 統(tǒng)計(jì)學(xué)方法采用SPSS 25.0 統(tǒng)計(jì)分析危險(xiǎn)因素,變量分組計(jì)數(shù)后采用χ2檢驗(yàn),多變量分析采用Cox 比例風(fēng)險(xiǎn)回歸模型篩選影響預(yù)后的獨(dú)立危險(xiǎn)因素,按照文獻(xiàn)[5-6]中的方法基于多變量分析的結(jié)果使 用R 版 本3.6.2(https://www.r-project.org/)中 的“rms”包和“survival”包繪制列線圖。列線圖的準(zhǔn)確性通過(guò)C 指數(shù)和校準(zhǔn)曲線進(jìn)行衡量,C 指數(shù)越大(接近1),預(yù)后預(yù)測(cè)越準(zhǔn)確。內(nèi)部驗(yàn)證通過(guò)Bootstrap 法重復(fù)取樣1 000 次自檢完成,對(duì)列線圖的外部驗(yàn)證通過(guò)驗(yàn)證組進(jìn)行驗(yàn)證。受試者工作特征曲線(ROC曲線)下面積用于評(píng)估模型預(yù)測(cè)遠(yuǎn)處轉(zhuǎn)移性乳腺癌預(yù)后的準(zhǔn)確性。P<0.05被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
2.1 兩組的臨床病理資料兩組臨床病理資料差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見(jiàn)表1。
2.2 Cox 比例風(fēng)險(xiǎn)回歸分析分析提示年齡、婚姻狀態(tài)、種族、組織學(xué)分級(jí)、ER 狀態(tài)、PR 狀態(tài)、Her-2狀態(tài)、T 分期、原發(fā)灶是否手術(shù)、骨轉(zhuǎn)移、腦轉(zhuǎn)移、肝轉(zhuǎn)移、肺轉(zhuǎn)移是影響預(yù)后的獨(dú)立危險(xiǎn)因素(P<0.05),其中相對(duì)于年輕(<35歲),年老(>49歲)是遠(yuǎn)處轉(zhuǎn)移性乳腺癌病人預(yù)后的危險(xiǎn)因素(P<0.05);Her-2陰性相對(duì)于Her-2 陽(yáng)性是預(yù)后的危險(xiǎn)因素(P<0.05);原發(fā)灶手術(shù)相對(duì)于原發(fā)灶不手術(shù)具有更低的風(fēng)險(xiǎn)比(P<0.05);N 分期與預(yù)后相關(guān)性差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。Cox單因素和多因素回歸分析見(jiàn)表2。
2.3 遠(yuǎn)處轉(zhuǎn)移性乳腺癌生存預(yù)后列線圖及其內(nèi)/外部驗(yàn)證基于Cox 比例風(fēng)險(xiǎn)回歸分析繪制列線圖,見(jiàn)圖1。內(nèi)部驗(yàn)證的C指數(shù)為0.702[95%CI:(0.696,0.708)],遠(yuǎn)處轉(zhuǎn)移性乳腺癌校準(zhǔn)曲線提示在觀察值與預(yù)測(cè)值之間的一致性:1年和3年生存率一致性良好,5年生存率一致性較好,見(jiàn)圖2。外部驗(yàn)證C指數(shù)為0.707[95%CI:(0.706,0.708)],1年和3年生存率外部驗(yàn)證一致性良好,5年生存率一致性較好,見(jiàn)圖3。
2.4 遠(yuǎn)處轉(zhuǎn)移性乳腺癌建模組和驗(yàn)證組的ROC 曲線建模組和驗(yàn)證組的校準(zhǔn)圖提示該臨床預(yù)測(cè)模型在1 年和3 年的預(yù)測(cè)結(jié)果與實(shí)際觀測(cè)數(shù)據(jù)具有良好的一致性。建模組1 年、3 年、5 年的ROC 曲線下面積分別為0.8、0.7、0.7,驗(yàn)證組的1 年、3 年、5 年的ROC 曲線下面積分別為0.8、0.8、0.695,也證實(shí)了該模型能夠準(zhǔn)確預(yù)測(cè)遠(yuǎn)處轉(zhuǎn)移性乳腺癌的預(yù)后,尤其是1年和3年預(yù)后。
隨著乳腺癌藥物治療的研究發(fā)展及相關(guān)臨床試驗(yàn)的開(kāi)展,乳腺癌的遠(yuǎn)處轉(zhuǎn)移率及死亡率顯著下降,但是遠(yuǎn)處轉(zhuǎn)移仍然是乳腺癌病人致死的主要原因[8-9],遠(yuǎn)處轉(zhuǎn)移的預(yù)后不良,其5 年生存率約為27%,腦轉(zhuǎn)移乳腺癌病人預(yù)后最差,中位總生存時(shí)間為10 個(gè)月[95%CI:(9,12)個(gè)月][10]。乳腺癌的隨訪研究不僅能及早發(fā)現(xiàn)復(fù)發(fā)及轉(zhuǎn)移,并且能從中不斷總結(jié)經(jīng)驗(yàn),完善診治。SEER 數(shù)據(jù)庫(kù)涵蓋了大約28%的美國(guó)人口的癌癥治療隨訪數(shù)據(jù)[11],該數(shù)據(jù)庫(kù)中獲得的研究數(shù)據(jù)代表了該人群的流行病學(xué)狀況,在癌癥監(jiān)測(cè)科學(xué)以及收集、分析、解釋和傳播可靠的基于人口的統(tǒng)計(jì)數(shù)據(jù)方面處于國(guó)家領(lǐng)導(dǎo)地位。SEER 數(shù)據(jù)庫(kù)收集的癌癥數(shù)據(jù)中免疫組化從2010年開(kāi)始錄入,癌癥結(jié)局包括死亡與否以及死亡原因,對(duì)研究復(fù)發(fā)、轉(zhuǎn)移或進(jìn)展有限制,但該數(shù)據(jù)庫(kù)對(duì)預(yù)后研究具有較大的指導(dǎo)意義。
據(jù)文獻(xiàn)報(bào)道,晚期乳腺癌的預(yù)后與以下變量有關(guān):腫瘤的分型、年齡[12]、生理機(jī)能、轉(zhuǎn)移的器官、全身化療、原發(fā)灶手術(shù)切除、原發(fā)灶的大小、孤立轉(zhuǎn)移/多發(fā)轉(zhuǎn)移,因此此次模型建立時(shí)納入了在晚期乳腺癌的生存方面存在差異的因素。在文獻(xiàn)中,年齡<50 歲較>50 歲,局部無(wú)復(fù)發(fā)生存更高,>65 歲是晚期乳腺癌生存的不利因素[12]。在本研究中證實(shí)年齡同樣是晚期乳腺癌預(yù)后的重要因素,較大年齡(>49歲)是轉(zhuǎn)移性乳腺癌的危險(xiǎn)因素,而在早期乳腺癌
復(fù)發(fā)風(fēng)險(xiǎn)分層中,<35 歲作為復(fù)發(fā)的危險(xiǎn)因素之一,此次研究側(cè)重于轉(zhuǎn)移性乳腺癌的預(yù)后分析,雖然年輕病人復(fù)發(fā)轉(zhuǎn)移概率較高,但其對(duì)后期治療的耐受性更好,年齡越大(>49 歲)出現(xiàn)治療不能耐受的可能越大,所以其預(yù)后更差。Her-2 陽(yáng)性乳腺癌的預(yù)后優(yōu)于三陰性乳腺癌[4,13],Her-2 陽(yáng)性晚期乳腺癌的4 年總生存為31%~70%[14],三陰性晚期乳腺癌的中位生存時(shí)間僅為18~25個(gè)月[15],我們分析發(fā)現(xiàn)Her-2陽(yáng)性遠(yuǎn)處轉(zhuǎn)移性乳腺癌病人預(yù)后優(yōu)于Her-2 陰性遠(yuǎn)處轉(zhuǎn)移性乳腺癌[16],可能得益于Her-2 陽(yáng)性乳腺癌靶向治療的多樣性、有效性、安全性[17-19]。我們構(gòu)建了預(yù)測(cè)遠(yuǎn)處轉(zhuǎn)移性乳腺癌生存預(yù)后的列線圖,列線圖通過(guò)建模組的內(nèi)部驗(yàn)證和驗(yàn)證組的外部驗(yàn)證,并且通過(guò)校準(zhǔn)和判別評(píng)估性能。校準(zhǔn)曲線是用于評(píng)估列線圖的估計(jì)風(fēng)險(xiǎn)和觀察風(fēng)險(xiǎn)之間的一致性,保證所建立的列線圖的可靠性。在遠(yuǎn)處轉(zhuǎn)移性乳腺癌預(yù)后列線圖的部分文獻(xiàn)中報(bào)道其C 指數(shù)<0.700[13],而本研究列線圖的內(nèi)部驗(yàn)證和外部驗(yàn)證的C 指數(shù)分別是0.702 和0.707,高于之前的研究,并且3 年生存率的校準(zhǔn)曲線顯示生存一致性良好,表明列線圖對(duì)轉(zhuǎn)移性乳腺癌具有很高的預(yù)測(cè)能力,而5年生存率的校準(zhǔn)曲線一般的主要原因在于遠(yuǎn)處轉(zhuǎn)移性乳腺癌病人(肝、肺、腦轉(zhuǎn)移)5年生存率極低。
表2 建模組2 993例遠(yuǎn)處轉(zhuǎn)移性乳腺癌病人預(yù)后影響因素Cox單因素和多因素回歸分析
圖1 遠(yuǎn)處轉(zhuǎn)移性乳腺癌預(yù)后列線圖
圖2 建模組遠(yuǎn)處轉(zhuǎn)移性乳腺癌1年(A)、3年(B)、5年(C)預(yù)測(cè)生存的校準(zhǔn)曲線
圖3 驗(yàn)證組遠(yuǎn)處轉(zhuǎn)移性乳腺癌1年(A)、3年(B)、5年(C)預(yù)測(cè)生存的校準(zhǔn)曲線
盡管我們提供了一個(gè)準(zhǔn)確性較高的列線圖模型,但是該模型仍有較多不足。因臨床資料來(lái)源于SEER 數(shù)據(jù)庫(kù),而針對(duì)乳腺癌的化療、靶向治療、放療等關(guān)鍵性的治療方案并不能從該數(shù)據(jù)庫(kù)中獲得,所以在一致性上只能達(dá)到0.7 左右,如果能夠?qū)⑷橄侔┑南嚓P(guān)治療納入其中,可能預(yù)測(cè)效果更好。
綜上所述,年齡、種族、婚姻狀態(tài)、組織學(xué)分級(jí)、原發(fā)灶是否手術(shù)、ER狀態(tài)、PR狀態(tài)、Her-2狀態(tài)、T分期、骨/腦/肝/肺轉(zhuǎn)移是影響預(yù)后的獨(dú)立危險(xiǎn)因素,基于以上因素建立的列線圖能較為準(zhǔn)確、直觀地個(gè)體化預(yù)測(cè)遠(yuǎn)處轉(zhuǎn)移性乳腺癌病人的生存率。