秦田田 沈徐寧
結直腸癌是目前美國癌癥死亡的第二大常見原因[1],近年來在我國的發(fā)病率呈逐級躍升之勢,在所有腫瘤中已經(jīng)排第三位,嚴重威脅著人類的健康。目前,美國癌癥聯(lián)合委員會(american joint committee on cancer,AJCC)TNM 分期系統(tǒng)是預測結直腸癌患者生存結局的基礎[2],TNM 最大的優(yōu)點是簡單方便,是區(qū)分不同預后的唯一依據(jù),但是在預測準確性方面不足[3]。精準醫(yī)療時代,臨床預測模型作為一種預估風險和收益的工具在醫(yī)療決策和預后等方面具有重要的科研意義和臨床價值[4],適合解決疾病的診斷或預后相關問題[5]。臨床預測模型的應用可以有效促進臨床研究轉化為臨床實踐,成為當前研究熱點[6]。臨床預測模型常以列線圖、APP、評分系統(tǒng)、網(wǎng)頁的形式展示。然而,以往的一些研究表明,雖然列線圖具有良好的預測能力,但是臨床醫(yī)生使用的頻率較低。
列線圖又名為諾謨圖(Nomogram),醫(yī)學列線圖使用生物學和臨床變量來確定統(tǒng)計預測模型,生成臨床事件的概率[7],被廣泛用于腫瘤學。原理是通過構建多因素回歸模型(如Cox回歸、Logistic 回歸),根據(jù)模型中每個變量對結局事件的影響程度比重,給每個變量賦分,然后所有變量的分數(shù)相加之和與結果量表相匹配得出結局事件的預測概率,從而將復雜數(shù)學公式可視化[8]。
構建列線圖首先是確定一個好的臨床問題。其構建步驟包括:確定結局變量和研究人群、選擇納入變量、構建模型、驗證和評價模型。
2.1 確定結局變量和研究人群 結局變量一般是疾病的復發(fā)(局部、遠處或者兩者皆有)或死亡,結局變量的特點是定義明確和容易重復測量;研究人群應該代表一般人群,并且易于鑒別。
2.2 選擇納入變量 根據(jù)試驗中確定的臨床結局,選擇與結果有關的變量[9],包括臨床病理特征(組織分級、淋巴結陽性數(shù)、遠處轉移、血管神經(jīng)侵犯等)以及人口統(tǒng)計學特征(年齡、種族、婚姻狀況和性別)。如果驗證數(shù)據(jù)不是由隨機臨床試驗得出,治療方式一般避免作為變量選擇。
2.3 構建模型 變量選擇后,需要選擇一個合適的統(tǒng)計模型。最常見的是采用多因素回歸分析以確定因變量和結局之間的關系并建立模型:Cox 比例風險模型通常用于生存分析,logistic 回歸通常用于預測腫瘤發(fā)生風險的概率[10]。
2.4 驗證和評價模型 列線圖需要在不同數(shù)據(jù)集進行反復驗證來評估預測能力。驗證分為內(nèi)部驗證和外部驗證,其中外部驗證是評價模型性能的金標準[9],內(nèi)部驗證則是原始數(shù)據(jù)集中按比例隨機獲取的子數(shù)據(jù)集進行交叉驗證,因此難以避免偏差,使得驗證結果的準確度具有一定的局限性[11]。模型的區(qū)分能力是判斷目標人群發(fā)生或不發(fā)生結局事件的能力,主要通過一致性指數(shù)(the concordance index,C 指數(shù))或者受試者工作特征曲線的曲線下面積(areaunder curve,AUC)表示。C 指數(shù)或AUC<0.65 代表模型區(qū)分能力較差,0.65~0.75 表示模型有一定的區(qū)分能力,>0.75 則表示模型區(qū)分能力較好[11-12]。
3.1 預測結直腸癌的診斷 結直腸癌的早期5 年生存率達90%[13],早發(fā)現(xiàn)、早診斷、早治療能夠有效降低癌癥死亡率,我國結直腸癌篩查的主要方法為直腸指檢和直腸鏡檢查。目前發(fā)現(xiàn)結直腸癌的發(fā)病率與各地經(jīng)濟水平呈正相關[14],同時死亡率與發(fā)展水平呈負相關。經(jīng)濟發(fā)展水平是衡量一個地區(qū)社會發(fā)展最直觀的指標[15],包括飲食、環(huán)境、文化水平、環(huán)境等。2015 年中國地區(qū)惡性腫瘤發(fā)病和死亡分析顯示:年齡、肥胖、飲食結構、久坐、運動方式等是結直腸癌發(fā)病的重要危險因素。針對這些因素,鄒夏慧等[16]于2022 年針對當?shù)厝巳哼M行結直腸癌及癌前病變的篩查,了解結直腸癌及進展期腺瘤的發(fā)病率,采用多因素Logistic 回歸的方法,篩選進展期腺瘤相關危險因素,將年齡、性別、腺瘤大體形態(tài)、吸煙、結腸癌家族史、肥胖、飲酒、喜食紅肉等8 個指標納入列線圖,繪制了進展期結直腸腺瘤預測模型,結果顯示高齡、男性、肥胖、飲酒、吸煙、有結直腸腫瘤家族史對出現(xiàn)進展期結直腸腺瘤的風險明顯升高,同時評價模型顯示上述因素構建的列線圖模型預測價值較好。
3.2 預測結直腸癌術后并發(fā)癥 吻合口瘺是結直腸癌術后最可怕的并發(fā)癥之一[17-18],發(fā)病率和死亡率分別為12%[19]、30%[20],一旦發(fā)生,將會導致結直腸癌患者更長的住院時間和更多的費用。此前已有研究表明,外科醫(yī)生在腸道手術中缺乏對吻合口瘺的準確預測,從而無法篩選出高危吻合口瘺患者。吻合口瘺的發(fā)生受多種因素的影響,2015 年Matteo等[21]基于52 家醫(yī)院第一次設計了一項關于吻合口瘺的前瞻性研究,納入3,193 例患者,單因素及多因素分析確定結直腸癌術后吻合口瘺的術前或術中危險因素,納入口服抗凝藥、術中并發(fā)癥、體重指數(shù)、術前血清總蛋白濃度、性別創(chuàng)建列線圖預測給定患者術后吻合口瘺的風險,結果顯示肥胖、男性、抗凝治療、蛋白濃度低、手術技術和醫(yī)院都是術后吻合口瘺的重要決定因素。充分了解術后吻合口瘺的危險因素,術前及時做出處理,對避免吻合口瘺的發(fā)生具有重要作用。術后早期腸梗阻是腹部手術后常見并發(fā)癥[22],尤其以結直腸癌術后多見,結腸癌術后發(fā)生腸梗阻的概率為2%~15%[23],影響結直腸癌術后發(fā)生腸梗阻的因素較多,熟悉并掌握結腸癌患者切除術后發(fā)生腸梗阻的高危因素,可以早期預測腸梗阻的發(fā)生[24]。盡管一些預防術后腸梗阻的措施研究較多,但是效果一般[25-28]。李明東等[29]2021 年回顧性分析283 例行結直腸癌根治術患者,基于Logistic 回歸分析,結果顯示腫瘤TNM Ⅲ期、中轉開腹、右半結腸切除術、手術時間、既往結腸腫瘤手術史是結直腸癌患者術后腸梗阻發(fā)生的獨立危險因素(P<0.05);研究者將這些獨立危險因素構建了結腸癌術后發(fā)生腸梗阻的列線圖模型,結果顯示手術時間長、TNM 分期晚、右半結腸切除術、開腹手術這些因素導致術后發(fā)生腸梗阻概率越高,模型校準AUC 為0.919(95%CI:0.862~0.975),校準曲線斜率接近1。
3.3 預測結直腸癌患者術后復發(fā) 根治性切除術仍是結直腸癌首要治療手段,術后復發(fā)一直是治療上的重點和難點。研究發(fā)現(xiàn),20%~30%的Ⅱ~Ⅲ期結腸癌患者行根治術后會出現(xiàn)復發(fā)[30-31],對于復發(fā)患者,術后是否進一步治療目前仍存在爭議[32]。目前臨床上主要根據(jù)影像學檢查和隨訪評估術后復發(fā),WEISER[33]設計了一項前瞻性研究,收集了2007~2014年1,095 例行根治性切除術治療的Ⅰ~Ⅲ期結腸癌患者的臨床病理資料,采用Logistic 逐步回歸分析,納入基因組表型、T 分期、總淋巴結數(shù)目、淋巴結陽性數(shù)目、是否化療,構建了結腸癌根治術后復發(fā)的列線圖預測模型。同時,該模型聯(lián)合臨床計算器,這種用于預測治愈性結腸切除術后癌癥復發(fā)的第三代臨床計算器成功地結合了微衛(wèi)星基因組表型和腫瘤浸潤淋巴細胞的存在,從而提高了鑒別和預測準確性。模型AUC 為0.792(95%CI:0.749~0.837,P<0.05),外部驗證一致性指數(shù)為0.738(95%CI:0.703~0.811,P<0.05),顯示該模型有較好的能力預測復發(fā)概率。
3.4 預測結直腸癌患者術后生存 預測術后生存模型的研究相比于術后復發(fā)和術前預測模型較多。由最初的納入臨床病理特征到現(xiàn)在與基因結合,XU 等[34]通過機器學習的方法,對結腸癌患者樣本的分析,通過差異表達分析,識別與結腸癌預后相關的自噬基因,納入年齡、性別、TNM 分期、風險評分和自噬基因,構建自噬基因模型,以預測結腸癌患者的預后。該模型包含8 個自噬基因,包括CTSD、ULK3、CDKN2A、NRG1、ATG4B、ULK1、DAPK1 和SERPINA1,能較好地預測結腸癌患者的預后。同時這8 個基因可能成為調(diào)節(jié)細胞自噬和治療結腸癌患者的生物靶點。
列線圖在腫瘤的發(fā)病風險預測與預后評估應用越來越廣泛,近年來臨床預測模型的研究幫助臨床醫(yī)生與患者在決策上起到正向作用,在臨床工作中,醫(yī)生與患者由于對疾病的認識不同,在與患者溝通時,患者常無法直觀理解醫(yī)生選擇治療方案的原因,列線圖的直觀可視化具有重大價值。
列線圖應該同時具有準確和簡單易于使用的特點,如果模型對預測事件的發(fā)生預估不準確,就會誤導醫(yī)生和患者對疾病的判斷,嚴重時進行錯誤的治療。另一方面,如果模型不夠簡單,例如進行復雜的運算,就無法被更多人接受和使用,如果列線圖過于簡單,可能會降低準確性,因此列線圖應該在準確和簡單中取得最優(yōu)解。
目前,列線圖仍存在一定的局限性,部分列線圖基于國外多中心數(shù)據(jù)庫如腫瘤基因組圖譜或者美國國立癌癥研究所數(shù)據(jù)庫[35],由于種族差異與當?shù)蒯t(yī)療水平的差異,列線圖無法直接應用于國人身上。另一方面,國內(nèi)的列線圖多局限于單一數(shù)據(jù)庫,無法準確驗證列線圖準確性和特異性,多數(shù)據(jù)庫多樣本納入列線圖顯得極為重要。理解和應用經(jīng)過多數(shù)據(jù)庫驗證有效的列線圖,未來有希望成為臨床決策診療中重要的部分。