吳文涌 陳瑞敏 袁 欣
中樞性性早熟(CPP)是由于下丘腦-垂體-性腺軸(HPGA)功能提前啟動而導(dǎo)致女孩8歲前、男孩9歲前出現(xiàn)第二性征的一種常見兒科內(nèi)分泌疾病,發(fā)病率1/5 000~1/10 000,女孩發(fā)病率為男孩的5~10倍[1]。CPP可導(dǎo)致骨骼成熟速度加快,骨齡(BA)提前,骨骺提前閉合,影響患兒終身高;也可導(dǎo)致心理問題或社會行為異常。因此,如何從性早熟的患兒中早期識別出CPP并及時干預(yù),已是臨床亟待解決的問題。
促性腺激素釋放激素(GnRH)激發(fā)試驗是目前診斷CPP的金標(biāo)準(zhǔn),需在2 h內(nèi)多次采血,且可能引起不良反應(yīng)。如何不依賴于GnRH激發(fā)試驗診斷CPP?目前已有許多學(xué)者就此進行了研究[2-3],其中大多數(shù)集中于探討激素等實驗室指標(biāo),如黃體生成素(LH)和/或卵泡刺激素(FSH)的基礎(chǔ)值及其比值,或者子宮大小、卵巢大小、垂體體積等彩超或影像學(xué)指標(biāo),以LH基礎(chǔ)值診斷CPP有較高的特異性,但不同研究中的截斷值差異較大[4-10]。由于往往無法同時獲得較好的檢測敏感度和特異度,單一指標(biāo)用于診斷的局限性較大。近年來,Yuan等[11]以經(jīng)直腸盆腔超聲為基礎(chǔ)構(gòu)建了特發(fā)性CPP診斷預(yù)測模型,但有在操作不便;Calcaterra等[12]以盆腔彩超為基礎(chǔ)構(gòu)建了快進展型CPP診斷模型,但其診斷效能不滿意;Pan等[13]以機器學(xué)習(xí)算法構(gòu)建CPP診斷預(yù)測模型,極端梯度提升(XGBoost)模型和隨機森林(random forest)模型的診斷效能尚可,但預(yù)測因子數(shù)多達(dá)19個,臨床應(yīng)用有困難。本研究旨在盡可能納入較少檢測項目的情況下,基于Lasso回歸,應(yīng)用Logistic回歸方法開發(fā)新的女孩CPP多因素預(yù)測模型并評價其診斷效能。
1.1 研究設(shè)計 收集完成GnRH激發(fā)試驗的性早熟(PP)女孩的臨床資料及實驗室檢查數(shù)據(jù),使用R軟件(4.0.2版本),應(yīng)用Lasso回歸分析篩選CPP的預(yù)測因子,Logistic回歸建立預(yù)測模型,并對模型進行診斷和內(nèi)部驗證。
1.2 診斷標(biāo)準(zhǔn) 參照中華醫(yī)學(xué)會兒科學(xué)分會內(nèi)分泌遺傳代謝學(xué)組2015年修訂的CPP診斷與治療共識[1],女孩8歲前出現(xiàn)第二性征發(fā)育即診斷為PP,在此基礎(chǔ)上,GnRH激發(fā)試驗LH峰值≥5.0 IU·L-1或LH峰值/FSH峰值≥0.6,診斷為CPP,否則,診斷為非CPP,包括外周性性早熟和部分性性早熟。
1.3 病例納入標(biāo)準(zhǔn) ①2014年1月至2020年4月在福建醫(yī)科大學(xué)附屬福州兒童醫(yī)院(我院)就診且有門診病歷留檔的PP女孩;②開始出現(xiàn)乳房發(fā)育的年齡≥4歲且<8歲;③完成GnRH激發(fā)試驗。
1.4 病例排除標(biāo)準(zhǔn) ①根據(jù)門診病歷中的輔助檢查結(jié)果,提示合并肝、腎等其他器官或系統(tǒng)的慢性疾病者;②行頭顱MR檢查者顯示顱內(nèi)占位;③門診病歷中缺失BA、盆腔彩超、LH基礎(chǔ)值,F(xiàn)SH基礎(chǔ)值、GnRH激發(fā)試驗檢查結(jié)果。
1.5 資料截取 由我院3名內(nèi)分泌科醫(yī)生通過查閱門診紙質(zhì)病歷、留檔檢查報告及檢索檢驗科信息系統(tǒng)的方式收集納入患兒的臨床資料和輔助檢查結(jié)果,并統(tǒng)一規(guī)范記錄。截取以下資料:①發(fā)病年齡,就診年齡,病程;②首次就診體格檢查,包括身高、體重, 乳房Tanner分期;③LH和FSH基礎(chǔ)值,LH/FSH比值,GnRH激發(fā)試驗(LH和FSH峰值、LH峰值/FSH峰值);④BA,截取病歷中的報告記錄(左側(cè)腕骨指骨X線片TW3法評估);⑤子宮和卵巢大小根據(jù)盆腔彩超報告重新計算。
需要說明的是:①就診年齡根據(jù)門診病歷中的就診日期和出生日期計算,發(fā)病年齡通過就診年齡和病程計算。②身高、體重為就診當(dāng)日由內(nèi)分泌??谱o士測量記錄;乳房Tanner分期為就診當(dāng)天接診醫(yī)師評估并記錄;BMI=體重(kg)/身高(m)2。③實驗室檢查結(jié)果取首次就診時檢測結(jié)果。④LH、FSH通過化學(xué)發(fā)光法測定;GnRH激發(fā)試驗使用簡易戈那瑞林激發(fā)試驗,戈那瑞林2.5 μg·kg-1靜脈注射,注射前(0 min)及注射后30 min、60 min測定LH、FSH。
1.6 預(yù)測因子的選取及賦值 基于Lasso回歸分析篩選預(yù)測因子以構(gòu)建女孩CPP預(yù)測模型,研究采用R軟件(4.0.2版本)完成統(tǒng)計分析。通過檢索既往報道的CPP單因素及多因素預(yù)測模型文獻,進行文獻復(fù)習(xí),并咨詢內(nèi)分泌專業(yè)臨床專家意見,初步篩選出相互獨立的預(yù)測因子。根據(jù)各預(yù)測因子數(shù)據(jù)的分布特點及其與結(jié)局事件的線性關(guān)系進行變量轉(zhuǎn)換。如連續(xù)變量與結(jié)局符合或近似線性關(guān)系,則不進行轉(zhuǎn)換;連續(xù)變量不符合線性關(guān)系時,轉(zhuǎn)換為分類變量;分類變量若存在某分組病例數(shù)遠(yuǎn)低于其他組的情況,則進行重新分組。為保證不對變量的臨床意義產(chǎn)生影響,僅進行一步簡單轉(zhuǎn)換。運用Lasso回歸分析對初步篩選的預(yù)測因子進一步篩選,確定最終預(yù)測因子。Lasso回歸通過構(gòu)建懲罰系數(shù)λ對預(yù)測因子進行篩選,λ越大,篩選越嚴(yán)格,進入最終模型的預(yù)測因子越少。λ處于1個標(biāo)準(zhǔn)誤時,模型表現(xiàn)良好,預(yù)測因子數(shù)較少。
1.7 模型的構(gòu)建 使用Lasso回歸納入的預(yù)測因子重新擬合Logistic模型,確定每個預(yù)測因子的回歸系數(shù),建立女孩CPP診斷預(yù)測模型:LN [P/(1 -P)]=β0+β1×預(yù)測因子1+β2×預(yù)測因子2+……+βn×預(yù)測因子n,其中β為各預(yù)測因子的回歸系數(shù),P為預(yù)測概率。使用Cook距離(cook’s distance)檢驗最終擬合模型是否存在強影響點,樣條函數(shù)檢驗預(yù)測因子與結(jié)局的線性關(guān)系,方差膨脹因子(VIF)驗證多重共線性。通過繪制預(yù)測結(jié)果與實際結(jié)果的校正曲線,進行一致性測試。繪制模型的受試者工作特征(ROC)曲線,AUC>0.75說明模型具備較好的預(yù)測能力。通過計算ROC曲線的最大約登指數(shù),得到預(yù)測模型的最佳診斷截點。
1.8 模型的驗證 使用k折交叉驗證法(k=10)對最終擬合模型行內(nèi)部驗證,評估模型的平均一致性指數(shù)(C-index)及Brier評分。k折交叉驗證法是將數(shù)據(jù)規(guī)模為n的數(shù)據(jù)集劃分為大小(約為n/k)大致相等的k個子集,每次選擇1個子集作為驗證集,其余k-1個子集作為訓(xùn)練集,記錄驗證集上模型的診斷結(jié)果。將k次循環(huán)后得到的k個驗證子集的診斷結(jié)果合并后,計算模型的性能評價指標(biāo)。C-index范圍為0.5~1.0,數(shù)值越高,表明模型區(qū)分度越高。Brier評分為0~1,越接近于0,模型越精準(zhǔn),校準(zhǔn)度越高。
2.1 一般情況 研究期間在我院就診且有門診病歷留檔的PP女孩1 232例,其中104例缺失盆腔彩超檢查報告,18例缺失BA檢查報告,3例盆腔彩超及BA檢查報告均缺失,1 107例進入本文分析,年齡5.8~10.3歲,平均年齡7.6歲;CPP 537例(48.5%),非CPP 570例。
2.2 預(yù)測因子的篩選 通過文獻復(fù)習(xí)[6,8,12-16]、咨詢專家意見,共得到10個初步預(yù)測因子:就診年齡,病程,BMI,乳房Tanner分期,LH基礎(chǔ)值,F(xiàn)SH基礎(chǔ)值,BA、子宮、左卵巢、右卵巢大小。
根據(jù)各預(yù)測因子的數(shù)據(jù)分布特點及與結(jié)局事件的線性關(guān)系,①連續(xù)變量就診年齡、BMI、FSH基礎(chǔ)值、BA、子宮大小、左卵巢大小、右卵巢大小不進行任何轉(zhuǎn)換。②連續(xù)變量LH基礎(chǔ)值、病程與結(jié)局之間不符合線性關(guān)系,根據(jù)文獻復(fù)習(xí)及線性關(guān)系圖選擇截點,轉(zhuǎn)換為分類變量,LH基礎(chǔ)值<0.3分組為“Low”,~0.83分組為“Middle”,≥0.83分組為“High”;病程<0.5分組為“Short”,~1.0分組為“Middle”,≥1.0分組為“Long”。③分類變量乳房Tanner分期由于B4期分組人數(shù)僅2例,將其重新分組,B2期進入“B2”組,B3期與B4期進入“B>2”組。
轉(zhuǎn)換的初步篩選預(yù)測因子納入Lasso回歸分析進一步篩選,λ=0.007時模型表現(xiàn)最佳,共納入7個預(yù)測因子:病程(“Middle”、“Long”)、BMI、乳房Tanner分期(“B>2”)、LH基礎(chǔ)值(“Middle”、High”)、BA、子宮大小、右卵巢大小。為便于臨床使用,增大懲罰系數(shù)λ,當(dāng)λ處于1個標(biāo)準(zhǔn)誤即λ=0.033時,剩余6個預(yù)測因子:病程(“Long”)、乳房Tanner分期(“B>2”)、LH基礎(chǔ)值(“Middle”、High”),BA、子宮大小、右卵巢大小(圖1)。鑒于臨床上左、右卵巢預(yù)測能力相近,另外,卵巢大小的數(shù)據(jù)可能因人為測量因素干擾而誤差較大,故排除卵巢大小這個預(yù)測因子,最終納入的預(yù)測因子包括:病程、乳房Tanner分期、LH基礎(chǔ)值、BA、子宮大小。
圖1 基于Lasso回歸的特征性變量篩選
2.3 模型擬合與模型驗證 將最終納入的預(yù)測因子重新擬合Logistic模型:LN[P/(1-P)]=-5.508+1.579×LH基礎(chǔ)值(“Middle”)+2.861×LH基礎(chǔ)值(“High”)+1.191×子宮大小+0.316×BA+0.371×病程(“Middle”)+0.430×病程(“Long”)+0.285×乳房Tanner分期(“B>2”)。Cook距離最大約0.04,遠(yuǎn)低于1,模型不存在強影響點(圖2);連續(xù)變量BA與結(jié)局呈線性關(guān)系,子宮大小與結(jié)局呈接近線性的單調(diào)關(guān)系(圖3);LH基礎(chǔ)值、子宮大小、BA、病程、乳房Tanner分期的VIF值分別為1.040、1.039、1.218、1.199、1.188,預(yù)測因子間不存在多重共線性。繪制ROC曲線(圖4),AUC=0.858(95%CI:0.836~0.880),模型具備較好的預(yù)測能力。當(dāng)預(yù)測概率的診斷截點為0.476時,約登指數(shù)最大,為0.593,此時模型敏感度為72.6%(95%CI:68.6%~76.3%),特異度為86.7%(95%CI:83.5%~89.3%)。不同的診斷截點下模型的診斷性能見圖5。圖6校正曲線顯示,該模型的預(yù)測結(jié)果和實際結(jié)果之間一致性較好。k折交叉驗證法(k=10)對最終擬合模型行內(nèi)部驗證,10次建模驗證的C-index均值為0.859,Brier評分均值0.158,模型具備較好的區(qū)分度和校準(zhǔn)度。
圖2 CPP診斷預(yù)測模型強影響點分析
2.4 模型展示 使用“DynNom”R包繪制動態(tài)列線圖,構(gòu)建網(wǎng)頁計算器對模型進行展示,可通過網(wǎng)址:https://wuwenyong.shinyapps.io/dynnomapp訪問使用。
長期以來,GnRH激發(fā)試驗都是作為診斷CPP的金標(biāo)準(zhǔn),但需反復(fù)采血,操作繁瑣,甚至?xí)鸩涣挤磻?yīng)。2019年,Pan等[13]以機器學(xué)習(xí)算法構(gòu)建了CPP診斷預(yù)測的XGBoost模型和random forest模型,模型主要納入了年齡、LH基礎(chǔ)值、FSH基礎(chǔ)值、胰島素樣生長因子-1(IGF-1)、生長激素(GH)等19個預(yù)測因子,AUC為0.88~0.90,敏感度為77.91%~77.94%,特異度為84.32%~87.66%。雖然較多的預(yù)測因子為模型的預(yù)測能力提供了保障,模型具備較高的預(yù)測敏感度與特異度;但同時為臨床工作帶來了不便,不利于臨床應(yīng)用,其他研究者也很難對其模型進行驗證。利用傳統(tǒng)Logistic統(tǒng)計方法結(jié)合臨床實際構(gòu)建的多因素預(yù)測模型,可能更有利于臨床實際應(yīng)用。Calcaterra等[12]構(gòu)建的快進展型CPP多因素Logistic診斷模型,以LH基礎(chǔ)值≥0.2 U·L-1、雌二醇(E2)≥50 pmol·L-1、縱向子宮直徑≥3.5 cm、橫向子宮直徑≥1.5 cm、卵巢體積≥2 cm3和有無子宮內(nèi)膜回聲為預(yù)測因子,敏感度為58%,特異度為85%,AUC為0.71,診斷效能不甚理想。
本研究首次基于Lasso回歸,應(yīng)用Logistic回歸方法,在較大樣本中建立了女孩CPP診斷預(yù)測模型。建立的模型中,LH基礎(chǔ)值和子宮大小對模型的影響最大。LH基礎(chǔ)值的預(yù)測作用已得到廣泛驗證,而子宮大小常作為CPP診斷的輔助指標(biāo)。既往研究以1.8~5.0 mL不同子宮大小作為診斷截點時,診斷敏感度為52%~100%,特異度為64%~100%[14-18],波動較大,且測量者水平不同也會對測量結(jié)果造成一定誤差,建議在保證測量質(zhì)量的前提下使用該預(yù)測因子。本模型的AUC為0.858,通過本文開發(fā)的網(wǎng)頁計算器可得到預(yù)測概率,0.476為預(yù)測截點時,約登指數(shù)最大,模型敏感度為72.6%(95%CI:68.6%~76.3%)、特異度為86.7%(95%CI:83.5%~89.3%)。為提高臨床實用價值,將預(yù)測截點調(diào)整為0.75時,模型特異度可達(dá)95.1%(95%CI:92.9%~96.7%),敏感度為50.5%(95%CI:46.2%~54.8%),可用于臨床診斷;當(dāng)預(yù)測截點調(diào)整為0.25時,模型敏感度可達(dá)90.9%(95%CI:88.0%~93.1%),特異度為51.9%(95%CI:47.7%~56.1%),可指導(dǎo)臨床篩查。相比于既往單個基礎(chǔ)值的診斷預(yù)測,本模型具備了更好的預(yù)測能力和更廣的預(yù)測范圍。10折交叉內(nèi)部驗證顯示,模型穩(wěn)定性較好。模型最大程度減少了采血的次數(shù)與時間,僅需獲得必要的LH基礎(chǔ)值結(jié)果,其余預(yù)測因子均采取無創(chuàng)的檢測方式獲得。此外,網(wǎng)頁計算器可快速訪問并得出預(yù)測概率,在臨床上簡便易行。
本模型的局限性:研究數(shù)據(jù)來源于單個研究中心,研究對象主要為福建省內(nèi)以PP就診的女孩,模型是否對于其他省市的研究中心有穩(wěn)定的診斷效能,仍有待進一步外部驗證;由于部分臨床病史,如身高增長速率、體重增長速率等采集困難,這些潛在的預(yù)測因子未納入進一步分析,后續(xù)工作中有待完善兒童保健記錄,進一步優(yōu)化診斷模型。