【摘要】背景乳腺癌是一種性激素受體依賴(lài)的惡性腫瘤,雌二醇(E2)的動(dòng)態(tài)變化在乳腺癌發(fā)展過(guò)程中起著非常重要的作用;經(jīng)典病例隊(duì)列設(shè)計(jì)完全忽略未選入樣本的信息,容易產(chǎn)生估計(jì)偏倚。目的探究乳腺癌患者E2水平動(dòng)態(tài)變化對(duì)其生存預(yù)后的影響,評(píng)估改良病例隊(duì)列設(shè)計(jì)的優(yōu)良性。方法對(duì)2015—2019年于新疆醫(yī)科大學(xué)附屬腫瘤醫(yī)院經(jīng)病理學(xué)檢查確診為乳腺癌的8226例患者進(jìn)行隨訪(fǎng),以患者確診時(shí)間作為隨訪(fǎng)時(shí)間起點(diǎn)、患者因乳腺癌死亡為結(jié)局事件,隨訪(fǎng)截止日期為2021-12-31。收集患者的人口學(xué)特征、免疫組化指標(biāo)、臨床病理特征以及生存狀態(tài)等,并對(duì)患者的血清 E2水平進(jìn)行縱向測(cè)量?;诮?jīng)典病例隊(duì)列設(shè)計(jì),通過(guò)納入病例隊(duì)列樣本外患者的生存數(shù)據(jù)改良病例隊(duì)列設(shè)計(jì)。在經(jīng)典及改良病例隊(duì)列設(shè)計(jì)下采用線(xiàn)性混合效應(yīng)模型和 Cox 比例風(fēng)險(xiǎn)模型分別擬合乳腺癌患者的縱向數(shù)據(jù)(縱向子模型)和生存數(shù)據(jù)(生存子模型),并建立縱向與時(shí)間-事件數(shù)據(jù)的聯(lián)合模型;進(jìn)一步采用馬爾可夫鏈蒙特卡羅算法對(duì)聯(lián)合模型參數(shù)進(jìn)行估計(jì);此外,通過(guò)受試者工作特征曲線(xiàn)下面積(AUC)以及預(yù)測(cè)誤差(PE)比較經(jīng)典及改良病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的區(qū)分度與校準(zhǔn)度。結(jié)果基于納入與排除標(biāo)準(zhǔn),本研究全隊(duì)列中共納入895例乳腺癌患者作為研究對(duì)象,其中53例患者因乳腺癌死亡?;颊咧形浑S訪(fǎng)時(shí)間約為28個(gè)月。從全隊(duì)列中抽取1/4的患者作為隨機(jī)子隊(duì)列,與隨機(jī)子隊(duì)列外在隨訪(fǎng)期間死亡的患者合并作為經(jīng)典病例隊(duì)列設(shè)計(jì)的樣本,其中,包含236例患者的生存數(shù)據(jù)、1062人次E2水平的測(cè)量值。此外,在經(jīng)典病例隊(duì)列設(shè)計(jì)的基礎(chǔ)上,納入經(jīng)典病例隊(duì)列樣本之外在隨訪(fǎng)期間存活的乳腺癌患者( G4 )的生存數(shù)據(jù),作為改良病例隊(duì)列設(shè)計(jì)的樣本(共包含895例患者的生存數(shù)據(jù)、236例患者1062人次的E2水平測(cè)量值,其中認(rèn)為存在2958人次E2水平測(cè)量的縱向缺失值)。經(jīng)典和改良病例隊(duì)列設(shè)計(jì)下的聯(lián)合模型結(jié)果均顯示E2水平動(dòng)態(tài)變化是乳腺癌患者預(yù)后的影響因素,且lg(E2)縱向每增加1個(gè)單位,患者的死亡風(fēng)險(xiǎn)將分別增加 23% ( HR=1.23 , )和 8% ( HR=1.08 ,
)。此外,改良病例隊(duì)列設(shè)計(jì)下的聯(lián)合模型展現(xiàn)出更好的區(qū)分度與校準(zhǔn)度( AUC=0.706~0.962 ,PE=0.0012~0.0108)。結(jié)論乳腺癌患者E2水平縱向升高可能會(huì)導(dǎo)致患者生存概率降低。病例隊(duì)列設(shè)計(jì)下聯(lián)合模型能夠?qū)v向與生存數(shù)據(jù)同時(shí)進(jìn)行分析,且改良病例隊(duì)列設(shè)計(jì)優(yōu)于經(jīng)典病例隊(duì)列設(shè)計(jì)。
【中圖分類(lèi)號(hào)】R737.9【文獻(xiàn)標(biāo)識(shí)碼】A DOI:10.12114/j.issn.1007-9572.2023.0918
【Abstract】BackgroundBreast cancer is a hormone receptor-dependent malignant tumor,and the dynamical changesof estradiol(E2)playacriticalroleinthedevelopmentofbreastcancer.Theclasicalcase-cohortdesigncompletely ignorestheinformationofnon-selectedsamples,whichcouldeasilylead tobiased estimating.ObjectiveToexploretheefect of dynamical changesofE2 levelsonthesurvival prognosis inbreastcancer patients,andevaluatethe superiorityofimproved case-cohort design.MethodsInthis study,we selected8226 patients who were diagnosedasbreastcancerbypathological examinationattheAfiliated Cancer HospitalofXinjiang Medical Universityfrom2O15to2O19,byusingthetimeof patient diagnosisasthefolow-upstartdate,anddefiningthedeathofpatientsduetobreastcancerastheoutcomeevent.The followupenddate was December31,2021.Thedemographiccharacteristics,immunohistochemicalindicators,clinicopathological characteristicsandsurvival statusofpatients were gathered,andtheirserum E2levels werelongitudinaly monitored.Basednthe classicalcase-cohortdesign,theimprovedcase-cohortdesign wasachievedby incorporatingsurvivaldatafrompatientsoutside ofthecase-cohortsample.Undertheclasscalandimprovedcasecohortdesigns,linearmixedefectsmodelandCoxproportional risk modelwereused tofitthelongitudinaldata(longitudinal submodel)andsurvivaldata(survivalsubmodel)of breast cancerpatients,respectively,andtwojointmodelsforlongitudinalandtime-to-eventdatawerefurtherestablished.Moreover, Markov Chain Monte Carlo algorithm was used to estimate theparametersoftojoint models.The areaunderthereceiverperating characteristiccurves(AUC)and prediction erors(PE)were furtherapplied tocompare thediscriminationandcalibrationof two jointmodelsundertheclassicalandimprovedcase-cohortdesigns.ResultsBasedontheinclusionandexclusioncriteria,a totalof95 breastcancerpatients wereincludedinthefullcohort,ofwhich53patientsdiedofbreastcancer.Themedian followuptimefor patients was approximately28 months.Thesamplesof classicalcase-cohort design wereconcluded two parts:one wasone quarterof thepatientsselected fromthefullcohortasarandomsubcohort,theother was patients whodiedduring the follow-upperiodoutsidetherandomsubcohort,ofwhichincludedsurvivaldatafrom236patientsand1O62measurementsofE2 levels.Moreover,onthebasisoftheclassicalcase-cohortdesign,thesurvivaldataofbreastcancerpatientswhowereoutsideof the classical case-cohort samples and survived during the follow-up period( )were included as the samples of the improved case-cohortdesignthat included survival datafrom895patients,1O62 measurementsofE2levels from236patients(in which it wasassumedthattherewere2958longitudinallymising measurementsofE2levels).Theresultsof twojointmodelsunder clasicalandimprovedcase-cohortdesignsbothrevealedthatdynamical changeofE2levelswasidentifiedastheinfluencing prognostic factorsforbreastcancerpatients.Forone-unitlongitudinalincrementoflg(E2),the mortalityrisksforpatients would increase by about 23% ( HR =1.23,
=1.015)and 8% (HR=1.08,
=1.020),respectively.Moreover,the joint model undertheimprovedcase-cohortdesignshowedbetterdiscriminationandcalibration(AUC=0.706-0.962,PE=0.O012-0.0108). ConclusionThelongitudinal incrementofE2levelscouldcauseadecreaseofthe survivalprobabilityforbreastcancerpatients.
Thejointmodelundercase-cohortdesigncouldbothanalyzelongitudinalandsurvivaldataandtheimprovedcase-cohortdesign would be superior to that of the classical case-cohort design.
【Key words】 Breast cancer;Estradiol;Case-cohort design;Joint model;Survival dat
乳腺癌是常見(jiàn)的惡性腫瘤之一,其發(fā)病率位居女性惡性腫瘤首位,據(jù)估計(jì)2020年全球女性乳腺癌新發(fā)病例約達(dá)230萬(wàn)例[1]。近年來(lái),中國(guó)女性乳腺癌發(fā)病率和死亡率持續(xù)上升[2],嚴(yán)重威脅女性的身心健康。乳腺癌是激素依賴(lài)性腫瘤,研究表明,雌激素主要通過(guò)刺激乳腺上皮細(xì)胞的增殖來(lái)誘發(fā)乳腺癌的產(chǎn)生,進(jìn)一步與雌激素受體結(jié)合,促使腫瘤細(xì)胞快速生長(zhǎng)并抑制其凋亡,從而促進(jìn)乳腺癌的發(fā)生發(fā)展[3-5]。雌激素主要包括雌二醇(estradiol,E2)、雌酮等,E2的生物活性較強(qiáng),被廣泛應(yīng)用于臨床研究[3.6] 。
目前,臨床通常對(duì)隨訪(fǎng)患者的生物標(biāo)志物進(jìn)行縱向測(cè)量,分析其動(dòng)態(tài)變化對(duì)疾病的影響,以便估計(jì)疾病進(jìn)展的時(shí)間趨勢(shì);生存數(shù)據(jù)主要包含患者的生存時(shí)間、感興趣事件是否發(fā)生以及相關(guān)影響因素,也是臨床研究中的常見(jiàn)資料[7]。為了同時(shí)分析縱向數(shù)據(jù)、生存數(shù)據(jù)以及兩者間的潛在關(guān)聯(lián),縱向與生存數(shù)據(jù)的聯(lián)合模型被廣泛應(yīng)用于臨床研究[8-11]。MCHUNU等[8]基于聯(lián)合模型探討結(jié)核病合并艾滋病患者縱向 CD4 細(xì)胞計(jì)數(shù)與死亡風(fēng)險(xiǎn)之間的關(guān)聯(lián);王曉蓉等[10]利用聯(lián)合模型對(duì)高密度脂蛋白膽固醇和低密度脂蛋白膽固醇動(dòng)態(tài)變化與代謝綜合征的關(guān)聯(lián)進(jìn)行探討。當(dāng)感興趣事件的發(fā)生率較低時(shí),醫(yī)院或癌癥中心隨訪(fǎng)的患者在一定程度上可能無(wú)法完全代表總?cè)巳旱幕咎卣鳌=?jīng)典病例隊(duì)列設(shè)計(jì)是在簡(jiǎn)單隨機(jī)抽樣的基礎(chǔ)上對(duì)全隊(duì)列中所有發(fā)生結(jié)局事件的患者進(jìn)行分析,適用于大隊(duì)列低發(fā)病率的研究[11-14]。FENG等[13]基于前瞻性病例隊(duì)列研究闡明了全氟烷基物質(zhì)與乳腺癌發(fā)病風(fēng)險(xiǎn)的潛在關(guān)聯(lián);YAO等[14]基于病例隊(duì)列設(shè)計(jì)證實(shí)乳腺癌患者確診時(shí)維生素D水平是其生存預(yù)后的獨(dú)立影響因素。然而,經(jīng)典病例隊(duì)列設(shè)計(jì)中完全忽略了病例隊(duì)列樣本之外患者的全部信息,使得全隊(duì)列樣本與病例隊(duì)列樣本之間的感興趣事件發(fā)生率不同,從而導(dǎo)致對(duì)模型參數(shù)和患者生存概率的估計(jì)產(chǎn)生選擇偏倚。BAART等[]在模擬數(shù)據(jù)集中評(píng)估了經(jīng)典與改良病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的預(yù)測(cè)精度,并進(jìn)一步應(yīng)用改良病例隊(duì)列設(shè)計(jì)下聯(lián)合模型探究急性冠狀動(dòng)脈綜合征患病的危險(xiǎn)因素。
基于以上討論,本研究基于2015—2019年新疆醫(yī)科大學(xué)附屬腫瘤醫(yī)院乳腺癌患者的數(shù)據(jù),通過(guò)納入經(jīng)典病例隊(duì)列設(shè)計(jì)樣本之外患者的生存信息改進(jìn)病例隊(duì)列設(shè)計(jì),在經(jīng)典和改良病例隊(duì)列設(shè)計(jì)下,通過(guò)線(xiàn)性混合效應(yīng)模型與 Cox 比例風(fēng)險(xiǎn)模型分別擬合乳腺癌患者的縱向數(shù)據(jù)和生存數(shù)據(jù),進(jìn)而建立聯(lián)合模型;采用馬爾可夫鏈蒙特卡羅(MarkovChainMonteCarlo,MCMC)算法估計(jì)聯(lián)合模型中的未知參數(shù),以探討E2水平動(dòng)態(tài)變化對(duì)乳腺癌患者生存預(yù)后的影響;通過(guò)受試者工作特征(receiveroperatingcharacteristiccurve,ROC)曲線(xiàn)下面積(areaunderthecurve,AUC)以及預(yù)測(cè)誤差(prediction error,PE)進(jìn)一步比較經(jīng)典和改良的病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的預(yù)測(cè)精度,進(jìn)而評(píng)估改良病例隊(duì)列設(shè)計(jì)的優(yōu)良性,為乳腺癌科學(xué)防控提供一定的理論依據(jù)。
1資料與方法
1.1一般資料
對(duì)2015—2019年于新疆醫(yī)科大學(xué)附屬腫瘤醫(yī)院經(jīng)病理學(xué)檢查確診為乳腺癌的8226例患者進(jìn)行隨訪(fǎng),以患者確診時(shí)間作為隨訪(fǎng)時(shí)間起點(diǎn)、患者因乳腺癌死亡為結(jié)局事件,隨訪(fǎng)時(shí)間以月為單位,隨訪(fǎng)截止日期為2021-12-31,利用醫(yī)院的電子病歷系統(tǒng)和隨訪(fǎng)系統(tǒng)收集患者的病案資料和隨訪(fǎng)資料。收集患者的人口學(xué)特征、免疫組化指標(biāo)、臨床病理特征以及生存狀態(tài)等,并對(duì)患者的血清E2水平(單位:pmol/L)進(jìn)行縱向測(cè)量。本研究經(jīng)新疆醫(yī)科大學(xué)附屬腫瘤醫(yī)院醫(yī)學(xué)倫理委員會(huì)批準(zhǔn)同意(K-2023001)。
研究對(duì)象納入標(biāo)準(zhǔn):(1)年齡 gt;18 周歲;(2)原發(fā)腫瘤病理診斷為乳腺癌;(3)入院時(shí)簽署知情同意書(shū)及患者須知等醫(yī)療文書(shū);(4)隨訪(fǎng)的重復(fù)測(cè)量次數(shù)?2 次。排除標(biāo)準(zhǔn):(1)合并其他惡性腫瘤;(2)重復(fù)測(cè)量次數(shù) lt;2 次;(3)重要病理信息缺失的患者。根據(jù)納入、排除標(biāo)準(zhǔn),篩選出符合標(biāo)準(zhǔn)的病例,最終共納人895例患者。
1.2 統(tǒng)計(jì)學(xué)方法
1.2.1病例隊(duì)列設(shè)計(jì):考慮研究共包含 n 個(gè)獨(dú)立個(gè)體( G1∪G2∪G3∪G4 ),若研究對(duì)象經(jīng)歷結(jié)局事件則稱(chēng)為病例(即圖1中虛線(xiàn)圓圈中 G2∪G3 ),若未經(jīng)歷結(jié)局事件則為非病例(即圖1中 G1∪G4 )。假設(shè) Ti* 和 CTi* 分別表示第 i ( i=1 ,…, )個(gè)個(gè)體結(jié)局事件發(fā)生的時(shí)間和刪失時(shí)間,則其相應(yīng)的真實(shí)觀(guān)測(cè)時(shí)間為
。第 i 個(gè)個(gè)體結(jié)局事件是否發(fā)生由 δi=I ( Ti*?CTi* )給出,其中 I(?) 為示性函數(shù)。經(jīng)典病例隊(duì)列設(shè)計(jì)是通過(guò)簡(jiǎn)單隨機(jī)抽樣從全隊(duì)列中按照一定比例抽取一個(gè)隨機(jī)子隊(duì)列(即圖1中G1∪G2 ),隨機(jī)子隊(duì)列樣本與子隊(duì)列之外所有的病例(即圖1中 G3 , δi=1 )共同組成病例隊(duì)列樣本(即圖1中G1∪G2∪G3 ),定義示性變量 Si 和
分別表示第 i 個(gè)個(gè)體是否被選入隨機(jī)子隊(duì)列和病例隊(duì)列樣本,則:
此外,本研究基于經(jīng)典病例隊(duì)列設(shè)計(jì),進(jìn)一步僅納入病例隊(duì)列樣本外個(gè)體(即圖1中 G4 )的生存信息,并不考慮 G4 的縱向數(shù)據(jù),定義為改良病例隊(duì)列設(shè)計(jì)[]。假設(shè) mi (t)表示第i個(gè)個(gè)體在 χt 時(shí)刻縱向響應(yīng)變量的真實(shí)值,其相應(yīng)的測(cè)量值為 yi(Λt) ,假設(shè)病例隊(duì)列樣本之外個(gè)體( G4 )的縱向數(shù)據(jù)是缺失數(shù)據(jù)[11],定義為 yim Ξ(Λt) ,則所有個(gè)體的觀(guān)測(cè)集為:
, Ti ,
, Si=1 , CCi=1 ; i=1 ,…,
, Ti , δi=1 , Si=1 , CCi=1 ; i=1 ,…,
, Ti , δi=1 , Si=0 , CCi=1 ; i=1 ,…,n}
, Ti ,δ;=0, Si=0 , CCi=0 ; i=1 ,…,n}
1.2.2縱向和生存數(shù)據(jù)聯(lián)合模型:通過(guò)線(xiàn)性混合效應(yīng)模型對(duì)縱向子模型進(jìn)行建模:
其中, yi(σt) 為在 χt 時(shí)刻上觀(guān)測(cè)到的縱向數(shù)據(jù)水平,
mi(σt) 為在 Φt 時(shí)刻上縱向數(shù)據(jù)的真實(shí)值, xi(ξt) 和
分別為固定效應(yīng)和隨機(jī)效應(yīng)的設(shè)計(jì)矩陣; β 是固定效
應(yīng)的參數(shù)向量; 是隨機(jī)效應(yīng)的參數(shù)向量,服從均值為0,方差-協(xié)方差矩陣為 D 的正態(tài)分布;
為測(cè)量誤差,且
。本文采用包含時(shí)間的自然三次樣條函數(shù)的線(xiàn)性混合效應(yīng)模型對(duì)患者的縱向數(shù)據(jù)進(jìn)行擬合,以呈現(xiàn)縱向數(shù)據(jù)隨時(shí)間變化的非線(xiàn)性關(guān)系。為了建立縱向數(shù)據(jù)動(dòng)態(tài)變化與患者生存風(fēng)險(xiǎn)之間的潛在聯(lián)系,采用關(guān)聯(lián)系數(shù) α 來(lái)量化縱向數(shù)據(jù)的動(dòng)態(tài)變化 mi(Ωt) 對(duì)患者生存風(fēng)險(xiǎn)的潛在影響。生存子模型由擴(kuò)展的 Cox 比例風(fēng)險(xiǎn)模型進(jìn)行建模:
,
其中, (s), 00 (t)是基線(xiàn)風(fēng)險(xiǎn)函數(shù);
表示時(shí)間獨(dú)立的協(xié)變量的設(shè)計(jì)矩陣, γ 為未知參數(shù); α 為縱向子模型與生存子模型的關(guān)聯(lián)參數(shù)。假設(shè)縱向和生存子模型共享隨機(jī)效應(yīng)
,則縱向與時(shí)間-事件數(shù)據(jù)聯(lián)合模型為:
本研究在貝葉斯框架下采用MCMC算法對(duì)模型參數(shù)進(jìn)行估計(jì),對(duì)于樣本中所有患者而言,第 i 個(gè)個(gè)體對(duì)生存子模型的似然函數(shù)的貢獻(xiàn)為:
其中, , γs 為基線(xiàn)風(fēng)險(xiǎn)中 B 樣條函數(shù)的參數(shù)。
經(jīng)典病例隊(duì)列設(shè)計(jì)中 G1∪G2∪G3 的患者縱向信息完整,其中第 i 個(gè)個(gè)體對(duì)縱向子模型的似然函數(shù)的貢獻(xiàn)為,p(yi|bi,θ,)=√2πσ2exp 其中,
。然而,改良病例隊(duì)列設(shè)計(jì)中 G4 的患者縱向數(shù)據(jù)缺失,則基于缺失數(shù)據(jù)的第 Φi 個(gè)個(gè)體縱向子模型的后驗(yàn)分布為, p
此外,本研究通過(guò)AUC以及PE評(píng)價(jià)不同病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的區(qū)分度與校準(zhǔn)度,其中AUC越高越接近1,表明聯(lián)合模型的區(qū)分度越好;PE值越小,患者實(shí)際生存率與聯(lián)合模型預(yù)測(cè)的生存率之間的差異越小,表明聯(lián)合模型的校準(zhǔn)度越好[11]
本研究采用R4.1.3軟件進(jìn)行統(tǒng)計(jì)學(xué)分析,并實(shí)現(xiàn)結(jié)果的可視化。服從正態(tài)分布的連續(xù)變量采用 表示,非正態(tài)分布的連續(xù)變量采用 M ( P25 , P75 )表示;計(jì)數(shù)資料采用相對(duì)數(shù)表示。以 Plt;0.05 為差異有統(tǒng)計(jì)學(xué)意義(雙側(cè)),
時(shí)認(rèn)為MCMC算法達(dá)到收斂。
2結(jié)果
2.1 數(shù)據(jù)處理
本研究全隊(duì)列中共納入895例乳腺癌患者作為研究對(duì)象,其中53例患者因乳腺癌死亡?;颊咧形浑S訪(fǎng)時(shí)間約為28個(gè)月,隨訪(fǎng)期間,收集患者E2水平的測(cè)量值,共測(cè)量4020人次,平均每例患者被測(cè)量4.49次。從全隊(duì)列中抽取1/4的患者作為隨機(jī)子隊(duì)列,與隨機(jī)子隊(duì)列外在隨訪(fǎng)期間死亡的患者合并作為經(jīng)典病例隊(duì)列設(shè)計(jì)的樣本,其中,包含236例患者、1062人次E2水平的測(cè)量值。此外,在經(jīng)典病例隊(duì)列設(shè)計(jì)的基礎(chǔ)上,納入經(jīng)典病例隊(duì)列樣本之外在隨訪(fǎng)期間存活的乳腺癌患者( G4 )的生存數(shù)據(jù),作為改良病例隊(duì)列設(shè)計(jì)的樣本(共包含895例患者的生存數(shù)據(jù)、236例患者1062人次的E2水平測(cè)量值,其中認(rèn)為存在2958人次E2水平測(cè)量的縱向缺失值)。患者的基線(xiàn)特征見(jiàn)表1。正態(tài)性檢驗(yàn)結(jié)果顯示患者的E2水平呈偏態(tài)分布。線(xiàn)性混合效應(yīng)模型中要求數(shù)據(jù)服從正態(tài)分布,因此采用以10為底的對(duì)數(shù)變換對(duì)原始E2水平進(jìn)行處理,得到 lg (E2)近似服從正態(tài)分布。
2.2縱向子模型與生存子模型
本文采用包含時(shí)間的自然三次樣條函數(shù)的線(xiàn)性混合效應(yīng)模型對(duì)全部患者的 lg (E2)水平進(jìn)行擬合,最終確定的縱向子模型為:
t+βσ3t2+βε4t3+b1+b2t+b3t2+b4εt3+εεiε(t) (20號(hào)
此外,本研究隨機(jī)選擇6例患者,進(jìn)一步詳細(xì)繪制6例患者的 lg (E2)動(dòng)態(tài)變化軌跡,如圖2,結(jié)果顯示患者 lg (E2)的動(dòng)態(tài)變化具有一定的非線(xiàn)性特征(即圖2中藍(lán)色虛線(xiàn))。
單因素、多因素 Cox 回歸分析結(jié)果顯示,TNM分期為Ⅱ期( HR=3.59 , 95%CI=1.05~12.20 、Ⅲ期( HR=14.00 95%CI=4.18~46.70 、V期( HR=29.90 ,95%CI=7.58~118.00 )以及人表皮生長(zhǎng)因子受體2(human epidermal growth factor receptor 2,HER-2)表達(dá)呈陽(yáng)性( HR=2.11 , 95%CI=1.19~3.76 )的患者死亡風(fēng)險(xiǎn)較高;與未手術(shù)相比,接受保乳術(shù)( HR=0.12 ,95%CI=0.01~0.95 )是患者預(yù)后的保護(hù)因素(表2),則最優(yōu)生存子模型為:
注:紅色實(shí)線(xiàn)代表線(xiàn)性演化,藍(lán)色虛線(xiàn)代表非線(xiàn)性演化,黑色實(shí) 心點(diǎn)代表觀(guān)測(cè)到的實(shí)際1g(E2)水平; E2= 雌二醇。
2.3聯(lián)合模型結(jié)果
此外,通過(guò)比較經(jīng)典及改良病例隊(duì)列設(shè)計(jì)下聯(lián)合模型在不同時(shí)間點(diǎn)以及時(shí)間間隔(即 Φt+Δt )下的預(yù)測(cè)精度結(jié)果顯示,經(jīng)典病例隊(duì)列設(shè)計(jì)下的聯(lián)合模型AUC為0.693~0.930、PE值為 0.0013~0.0120 ,改良病例隊(duì)列設(shè)計(jì)下的聯(lián)合模型AUC為 0.706~0.962 、PE值為 0.001 2~0.010 8 (表4),說(shuō)明改良病例隊(duì)列設(shè)計(jì)下的聯(lián)合模型的預(yù)測(cè)精度較優(yōu)于經(jīng)典病例隊(duì)列設(shè)計(jì)。例如,當(dāng) Δt=5 , t=9 時(shí),經(jīng)典病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的AUC=0.797 、 PE=0.005 9 ,改良病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的AU C=0.823 PE=0.0055 (AUC值更大、PE值更?。?。
3討論
經(jīng)典病例隊(duì)列設(shè)計(jì)能夠降低由于缺乏重復(fù)性產(chǎn)生的偏倚,改良病例隊(duì)列設(shè)計(jì)能夠在保證樣本量的同時(shí)通過(guò)納入所有患者的生存信息有效地避免選擇偏倚[1]。此外,聯(lián)合模型可以有效地監(jiān)測(cè)縱向數(shù)據(jù)的動(dòng)態(tài)變化軌跡[7,15]。研究顯示,E2水平的動(dòng)態(tài)變化與乳腺癌患者生存預(yù)后存在顯著關(guān)聯(lián)[16]。因此,本研究分別在經(jīng)典和改良病例隊(duì)列設(shè)計(jì)下,通過(guò)共享隨機(jī)效應(yīng)將線(xiàn)性混合效應(yīng)模型和 Cox 比例風(fēng)險(xiǎn)模型進(jìn)行聯(lián)合建模,以探究新疆地區(qū)乳腺癌患者E2水平動(dòng)態(tài)變化與其生存預(yù)后之間的關(guān)系。
Cox比例風(fēng)險(xiǎn)模型結(jié)果顯示,高TNM分期是乳腺癌患者的獨(dú)立危險(xiǎn)預(yù)后因素,患者的TNM分期越晚、腫瘤越大,發(fā)生淋巴結(jié)轉(zhuǎn)移和遠(yuǎn)處轉(zhuǎn)移的概率更高,死亡風(fēng)險(xiǎn)越高[17]。此外,結(jié)果顯示接受保乳術(shù)( HR=0.12 ,95%CI=0.01~0.95 )能夠極大提高乳腺癌患者的生存預(yù)后效果,這與LAGENDIJK等[18]以及VERONESI等[19]研究結(jié)果一致,通過(guò)手術(shù)治療可以有效地縮小腫瘤體積、減少腫瘤的數(shù)自并控制病情的擴(kuò)散。因此,女性應(yīng)加強(qiáng)對(duì)乳腺癌防控的重視,進(jìn)行規(guī)律性篩檢,做到早發(fā)現(xiàn)、早診斷、早治療,以降低發(fā)病率、提高生存概率。經(jīng)典和改良病例隊(duì)列設(shè)計(jì)下的聯(lián)合模型結(jié)果均表明E2水平升高是乳腺癌患者生存預(yù)后的危險(xiǎn)因素,研究結(jié)果與國(guó)內(nèi)外的部分研究結(jié)果相似[4,20-22]。例如,KENSLER等[20]在基于大型護(hù)士健康研究隊(duì)列中發(fā)現(xiàn)E2水平升高是乳腺癌患者生存的危險(xiǎn)因素,且具有較高E2水平的女性總死亡率更高。特別地,本研究結(jié)果顯示,在假設(shè)所有其他基線(xiàn)變量保持不變時(shí),lg(E2)縱向每增加1個(gè)單位,患者的死亡風(fēng)險(xiǎn)將分別升高約 23% ( HR=1.23 , )和 8% ( HR=1.08 ,
)。這可能是由于E2水平升高會(huì)導(dǎo)致乳腺細(xì)胞增殖率增加,從而促進(jìn)乳腺細(xì)胞的癌變和腫瘤進(jìn)展[22];另一方面,乳腺癌常采用內(nèi)分泌治療,當(dāng)E2水平升高時(shí),可能會(huì)降低內(nèi)分泌治療的效果,從而影響治療的有效性[23]。因此,臨床上監(jiān)測(cè)到患者E2水平升高時(shí)應(yīng)及時(shí)對(duì)患者進(jìn)行全面的病情評(píng)估、調(diào)整患者治療方案,以阻止患者病情惡化,提高患者生存率。此外,通過(guò)比較經(jīng)典和改良病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的動(dòng)態(tài)預(yù)測(cè)精度顯示,在不同時(shí)間點(diǎn)以及時(shí)間間隔(即 Φt+Δt )下,改良病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的AUC值更大( AUC=0.706~0.962 )、PE值更?。?PE=0.0012~0.0108, ),進(jìn)而表明改良病例隊(duì)列設(shè)計(jì)下聯(lián)合模型的預(yù)測(cè)精度較優(yōu)于經(jīng)典病例隊(duì)列設(shè)計(jì)。這意味著通過(guò)納入整個(gè)隊(duì)列患者的生存信息對(duì)經(jīng)典病例隊(duì)列樣本進(jìn)行擴(kuò)展能夠更好地對(duì)聯(lián)合模型進(jìn)行估計(jì),改良病例隊(duì)列設(shè)計(jì)能夠在節(jié)約成本的基礎(chǔ)上更好地減少選擇偏倚,提高模型的預(yù)測(cè)精度,是一種更具成本效益的統(tǒng)計(jì)方法。
本研究存在一定的局限性:聯(lián)合模型中關(guān)聯(lián)系數(shù)的95%CI 范圍較寬,且參數(shù)屬于區(qū)間的概率較低,這可能是由于小樣本量導(dǎo)致的統(tǒng)計(jì)差異性不顯著[24-25],尚需擴(kuò)大樣本量進(jìn)行更大規(guī)模的研究。此外,E2、孕酮等激素對(duì)乳腺癌的發(fā)生發(fā)展存在相互作用[21],本研究?jī)H使用E2水平作為縱向數(shù)據(jù),未考慮混雜因素的影響,可能導(dǎo)致模型擬合存在偏差,因此,后續(xù)研究中可以考慮將孕酮作為E2的時(shí)變協(xié)變量,建立多元縱向與生存數(shù)據(jù)的聯(lián)合模型[26-27],解釋多個(gè)縱向結(jié)果間的關(guān)聯(lián)性,優(yōu)化模型預(yù)測(cè)精度。
4小結(jié)
E2水平升高是導(dǎo)致乳腺癌患者死亡的危險(xiǎn)因素,臨床上應(yīng)密切監(jiān)測(cè)患者E2水平的動(dòng)態(tài)變化軌跡,及時(shí)采取針對(duì)性的治療手段,提高患者的生存率。此外,本研究結(jié)果提示,病例隊(duì)列設(shè)計(jì)下聯(lián)合模型能夠用于對(duì)乳腺癌患者的縱向與生存數(shù)據(jù)進(jìn)行分析,且改良病例隊(duì)列設(shè)計(jì)的預(yù)測(cè)效能更好。
作者貢獻(xiàn):吳夢(mèng)娟負(fù)責(zé)選題、處理研究數(shù)據(jù)、模型構(gòu)建、計(jì)算機(jī)代碼的實(shí)現(xiàn)、數(shù)據(jù)可視化展示、論文原稿寫(xiě)作;張濤負(fù)責(zé)處理研究數(shù)據(jù)、數(shù)據(jù)可視化展示;高春潔負(fù)責(zé)計(jì)算機(jī)代碼的實(shí)現(xiàn)、論文修訂;趙婷負(fù)責(zé)收集和提供研究數(shù)據(jù)、資金支持;王蕾對(duì)選題進(jìn)行指導(dǎo),對(duì)文章涉及觀(guān)點(diǎn)及立論依據(jù)進(jìn)行審閱和最終版本修訂以及資金支持;所有作者確認(rèn)了論文的最終稿。
本文無(wú)利益沖突。
吳夢(mèng)娟D https://orcid.org/0009-0006-4546-410X 王蕾D https://orcid.org/0000-0003-4635-8879
參考文獻(xiàn)
[1]SUNG H,F(xiàn)ERLAYJ,SIEGEL RL,et al.Global cancer statistics2020:GLOBOCAN estimates of incidence and mortality worldwidefor 36 cancers in 185 countries[J].CA Cancer JClin,2021,71(3):209-249.D0I:10.3322/caac.21660.
[2]LEISY,ZHENGRS,ZHANGSW,etal.Breastcancer incidenceand mortality inwomen in China:temporal trends and projections to2030[J].Cancer Biol Med,2021,18(3):900-909.
[3]陳顯榮,肖兵容,成浩.乳腺癌患者B超與甲狀腺激素和雌二醇水平聯(lián)檢的臨床分析[J].中國(guó)衛(wèi)生檢驗(yàn)雜志,2019,29(10):1230-1232.
[4]王娟娟,古雨濃,李建,等.性激素水平與女性乳腺癌的相關(guān)性研究[J].臨床與病理雜志,2015,35(6):1096-1102.
[5]ZHUD T,ZHAO Z,CUIGM,et al.Single-cell transcriptomeanalysis reveals estrogen signaling coordinately augments one-carbon,polyamine,and purine synthesis in breast cancer[J].CellRep,2019,27(9):2798.D0I:10.1016/j.celrep.2019.05.047.
[6]毛煦.CYP1介導(dǎo)的雌二醇生物活化對(duì)女性乳腺癌發(fā)展影響的研究進(jìn)展[J].中國(guó)藥理學(xué)與毒理學(xué)雜志,2023,37(8):640-644.DOI: 10.3867/j.issn.1000-3002.2023.08.009.
[7]翟映紅,陳琪,韓賀東,等.聯(lián)合模型介紹及在醫(yī)學(xué)研究中的應(yīng)用[J].中華流行病學(xué)雜志,2019,40(11):1456-1460.
[8]MCHUNUNN,MWAMBI HG,RIZOPOULOS D,et al.Usingjoint models to study the association between CD4 count and the riskofdeathinTB/HIVdata[J].BMCMedResMethodol,2022,22(1): 295.D0I: 10.1186/s12874-022-01775-7.
[9]謝緯華,余小金,戴品遠(yuǎn),等.老年人脈壓變化與全因死亡關(guān)聯(lián)的貝葉斯聯(lián)合模型應(yīng)用研究[J].中華疾病控制雜志,2021,25(1):72-77.DOI:10.16462/j.cnki.zhjbkz.2021.01.014.
[10]王曉蓉,劉穎,李孟,等.脂蛋白膽固醇的動(dòng)態(tài)變化與代謝綜
合征相關(guān)性研究[J].中國(guó)預(yù)防醫(yī)學(xué)雜志,2018,19(6):443-447. D01: 10.16506/j.1009-6639.2018.06.009.
[11]BAARTSJ,BOERSMAE,RIZOPOULOSD.Joint modelsforlongitudinal and time-to-event data in a case-cohort design[J].StatMed,2019,38(12):2269-2281.
[12]PRENTICE R L.A case-cohort design for epidemiologic cohortstudies and disease prevention trials[J].Biometrika,1986,73(1):1-11.D0I:10.1093/biomet/73.1.1.
[13]FENGY,BAI Y S,LUYJ,et al.Plasma perfluoroalkyl substanceexposure and incidence risk of breast cancer:acase-cohort studyin the Dongfeng-Tongji cohort[J].Environ Pollut,2022,306:119345. DOI: 10.1016/j.envpol.2022.119345.
[14]YAO S,KWAN ML,ERGASIJ,et al. Association of serum levelof vitaminD at diagnosis with breast cancer survival:acase-cohortanalysis in the pathways study[J].JAMA Oncol,2017,3(3):351-357.DOI: 10.1001/jamaoncol.2016.4188.
[15]ANDRINOPOULOUER,HARHAYMO,RATCLIFFESJ,et al.Reflection on modern methods:dynamic prediction usingjointmodels of longitudinal and time-to-event data[J].Int JEpidemiol,2021,50(5):1731-1743.
[16]LUO Y,LI HB,ZHANG Y,et al. Combination of endogenousestradiol and adipokineleptin inbreast cancerrisk and prognosisassessment in postmenopausal Chinese women[J].FrontEndocrinol,2021,12:766463.
[17]SAVAGE P,YUN,DUMITRA S,et al. The effect of theAmericanJoint Committee on Cancer eighth editiononbreast cancerstaging and prognostication[J].EurJSurg Oncol,2019,45(10): 1817-1820.D0I:10.1016/j.ejso.2019.03.027.
[18]LAGENDIJKM,VANMAARENMC,SAADATMANDS,etal.Breast conserving therapy and mastectomy revisited:breast cancer-specific survival and the influence of prognostic factors in 129,692patients[J].IntJCancer,2018,142(1):165-175.
[19]VERONESI U,CASCINELLI N,MARIANI L,et al. Twenty-year follow-up of a randomized study comparing breast-conservingsurgery with radical mastectomy for earlybreast cancer[J].NEnglJMed,2002,347(16):1227-1232.
[20]KENSLERKH,ELIASSENAH,ROSNERBA,et al.Pre-diagnostic sex hormone levels and survival amongbreast cancerpatients[J].Breast CancerRes Treat,2019,174(3):749-758.DOI: 10.1007/s10549-018-05121-8.
[21]ARTHUR RS,XUE X N,ROHAN TE.Prediagnostic circulatinglevels of sex steroid hormones and SHBG in relation to risk of ductalcarcinomaInsitu of thebreast amongUKwomen[J].CancerEpidemiol Biomarkers Prev,2020,29(5):1058-1066.DOI:10.1158/1055-9965.EPI-19-1302.
[22]LIJX,LICY,F(xiàn)ENGZW,etal.Effectofestradiol asacontinuous variable on breast cancer survival by menopausal status:a cohort study in China[J].Breast CancerRes Treat,2O22,194(1):103-111.D0I:10.1007/s10549-022-06593-5.
[23]EL-ATTARAA,IBRAHIMOM,ALHASSANINSA,et al.Effect of metformin as anadjuvant therapy to letrozole on estradioland other biomarkers involved in the pathogenesis of breast cancerinoverweight and obese postmenopausal women:a pilot study[J].EurJClinPharmacol,2023,79(2):299-309.DOI:10.1007/s00228-022-03444-6.
[24]黨紅.置信區(qū)間與可信區(qū)間問(wèn)題研究[J].高等數(shù)學(xué)研究,2023,26(1): 47-50.DOI: 10.3969/j.issn.1008-1399.2023.01.017.
[25]黃申,蔣青青,王世琦,等.P值和置信區(qū)間:聯(lián)系與區(qū)別、誤用與爭(zhēng)論[J].數(shù)理醫(yī)藥學(xué)雜志,2023,36(1):3-8.DOI:10.12173/j.issn.1004-4337.202212021.
[26]VAN OUDENHOVEN FM,SWINKELS SHN,HARTMANN T,etal.Modeling the underlyingbiological processes in Alzheimer'sdisease using a multivariate competing risk joint model[J].StatMed,2022,41(17):3421-3433.D0I:10.1002/sim.9425.
[27]TANG A M, ZHAO XQ,TANG N S. Bayesian variable selectionandestimationin semiparametricjoint modelsofmultivariatelongitudinal and survival data[J].BiomJ,2017,59(1):57-78.DOI: 10.1002/bimj.201500070.
(收稿日期:2023-12-10;修回日期:2024-07-13)(本文編輯:賈萌萌)