張少偉,曹淑卿
1.天津中醫(yī)藥大學(xué),天津 301600;2.天津市眼科醫(yī)院
早產(chǎn)兒視網(wǎng)膜病變(retinopathy of prematurity,ROP)是一種因視網(wǎng)膜未成熟引起異常增殖性血管形成的疾病[1]。有研究報道,接受早產(chǎn)兒視網(wǎng)膜病變篩查的早產(chǎn)兒中視網(wǎng)膜病變的發(fā)病率為15.9%~43.0%[2-3]。早產(chǎn)兒視網(wǎng)膜病變是全球范圍內(nèi)導(dǎo)致兒童失明和視力障礙的主要原因,高收入國家兒童失明可歸因于早產(chǎn)兒視網(wǎng)膜病變的比例不足10%,而我國屬于發(fā)展中國家,這一比例高達(dá)40%[4]。早期篩查和及時治療可以預(yù)防早產(chǎn)兒視網(wǎng)膜病變所致的視力損失,因此,有必要對具有視網(wǎng)膜病變高危因素的早產(chǎn)兒實施篩查和治療來控制早產(chǎn)兒視網(wǎng)膜病變[5]。由于現(xiàn)行篩查標(biāo)準(zhǔn)存在資源浪費和加重家庭經(jīng)濟(jì)負(fù)擔(dān)等方面的不足,學(xué)者們致力于風(fēng)險預(yù)測模型的開發(fā)及驗證。風(fēng)險預(yù)測模型是用多變量風(fēng)險因子來預(yù)測不良事件發(fā)生的概率,評估疾病發(fā)生可能性的工具[6],具有較好的預(yù)測能力,在早產(chǎn)兒視網(wǎng)膜病變預(yù)防方面起著重要作用。因此,現(xiàn)從早產(chǎn)兒視網(wǎng)膜病變危險因素和風(fēng)險預(yù)測模型開發(fā)及預(yù)測能力方面對早產(chǎn)兒視網(wǎng)膜病變風(fēng)險預(yù)測模型相關(guān)研究進(jìn)行綜述,為構(gòu)建適合我國早產(chǎn)兒視網(wǎng)膜病變風(fēng)險的預(yù)測模型提供參考。
早產(chǎn)兒出生時胎齡和出生體重是公認(rèn)的早產(chǎn)兒視網(wǎng)膜病變的主要危險因素。有研究表明,胎齡小及出生體重低的患兒,其視網(wǎng)膜神經(jīng)和血管發(fā)育不成熟,易致視網(wǎng)膜損傷[7-8]。此外,早期胰島素樣生長因子1(insulin-like growth factor 1,IGF-1)長時間缺乏往往會引起嚴(yán)重早產(chǎn)兒視網(wǎng)膜病變。IGF-1 是一種具有較強促生長作用的多肽類物質(zhì),是兒童期的重要生長因子。血清IGF-1 水平低下會抑制其對視網(wǎng)膜血管內(nèi)皮生長因子的激活,使新生兒出生后早期視網(wǎng)膜血管生長不良,外在表現(xiàn)為體重增加緩慢。其他危險因素還包括輸血、機械通氣、貧血、呼吸窘迫、呼吸困難和健康狀況不佳[9-10]。
目前,早產(chǎn)兒視網(wǎng)膜病變指南的篩查標(biāo)準(zhǔn)包括出生體重和出生時胎齡,比如美國標(biāo)準(zhǔn)為出生體重<1 501 g或出生時胎齡≤30 周的早產(chǎn)兒需要接受篩查,使用篩查標(biāo)準(zhǔn)雖具有較高的敏感性,但特異性低[11]。敏感性反映模型識別真陽性病人的能力,特異性指模型識別不需要接受篩查的早產(chǎn)兒的能力,兩者均為評價風(fēng)險預(yù)測模型性能的常用指標(biāo)。另外,加拿大[12]、美國[13]和英國[14]等國家的大型研究結(jié)果顯示,接受篩查的早產(chǎn)兒中需進(jìn)行激光手術(shù)治療的不到5%。上述研究結(jié)果提示現(xiàn)行篩查標(biāo)準(zhǔn)會產(chǎn)生許多不必要的篩查,造成資源浪費。高收入國家平均每次早產(chǎn)兒視網(wǎng)膜病變篩查成本為106~250 美元[15],會加重家庭經(jīng)濟(jì)負(fù)擔(dān)。研究表明,視網(wǎng)膜篩查相對耗時,導(dǎo)致早產(chǎn)兒在新生兒重癥監(jiān)護(hù)病房的住院時間延長和早產(chǎn)兒的父母焦慮[16-17]。因此,開發(fā)預(yù)測性能良好的風(fēng)險預(yù)測模型具有重要的臨床意義,可以提高早產(chǎn)兒視網(wǎng)膜病變篩查的敏感性,改善篩查特異性以減少接受篩查的早產(chǎn)兒數(shù)量,使醫(yī)療資源得到合理分配。
目前常用的早產(chǎn)兒視網(wǎng)膜病變風(fēng)險預(yù)測模型分別為體重胰島素樣生長因子新生兒早產(chǎn)兒視網(wǎng)膜病變(WINROP)模型、費城兒童醫(yī)院早產(chǎn)兒視網(wǎng)膜病變(Children's Hospital of Philadelphia ROP,CHOPROP)模型、出生后生長早產(chǎn)兒視網(wǎng)膜病變(Postnatal Growth ROP,G- ROP)模型、科羅拉多早產(chǎn)兒視網(wǎng)膜病變(Colorado ROP,CO-ROP)模型和數(shù)字早產(chǎn)兒視網(wǎng)膜病變(Digital ROP-Birth,DIGI ROP-Birth)模型,各模型均具有各自的特點。從模型預(yù)測性能和研究設(shè)計中篩查標(biāo)準(zhǔn)操作的難易程度、樣本量大小等多方面分析其優(yōu)勢和局限性。一般認(rèn)為,良好的預(yù)測模型預(yù)測嚴(yán)重早產(chǎn)兒視網(wǎng)膜病變的敏感性較強并可大幅減少早產(chǎn)兒篩查次數(shù)。
L?fqvist 等[18]基于對IGF-1 和早產(chǎn)兒視網(wǎng)膜病變的研究開發(fā)了一種名為WINROP 的累計偏差模型,可根據(jù)早產(chǎn)兒出生體重、出生時胎齡和出生后體重增加率來預(yù)測嚴(yán)重早產(chǎn)兒視網(wǎng)膜病變,并能極大地減少需要篩查的早產(chǎn)兒數(shù)量。WINROP 模型最初在開發(fā)研究中識別嚴(yán)重早產(chǎn)兒視網(wǎng)膜病變患兒的敏感性為100%,但在美國一項多中心驗證研究中敏感性降低[19],在中國一項納入432 例早產(chǎn)兒的研究中敏感性只有56%[20]。臨床使用WINROP 模型需要每周測量體重和血清IGF-1 水平,模型計算復(fù)雜導(dǎo)致信息不透明,為改善這一不足,研究人員開發(fā)了線上程序,允許用戶在線訪問,使臨床實用性得到了提高。目前,WINROP 模型已在多個國家進(jìn)行了外部驗證,敏感性不一,預(yù)測性能不穩(wěn)定,因此沒有取代傳統(tǒng)篩查,該模型是第一個將出生后體重增加納入早產(chǎn)兒視網(wǎng)膜病變的預(yù)測模型,為減少早產(chǎn)兒篩查數(shù)量提供了一種新可能。
2011 年,Gil 等[21]開發(fā)了需要輸血的早產(chǎn)兒視網(wǎng)膜病變(Premature Infants in Need of Transfusion ROP,PINTROP)模型,這是一種基于Logistic 回歸的預(yù)測模型,篩查標(biāo)準(zhǔn)包括出生體重、出生時胎齡和體重增加率。該模型是使用369 例體重<1 kg 的早產(chǎn)兒隨機輸血試驗數(shù)據(jù)建立的,每周評估,以預(yù)測早產(chǎn)兒視網(wǎng)膜病變的風(fēng)險,在風(fēng)險大于預(yù)定的警報水平時提示篩查。PINTROP 模型正確預(yù)測了所有需要激光治療的早產(chǎn)兒,同時將需要篩查的早產(chǎn)兒數(shù)量減少了30%。但由于PINTROP 模型篩查對象為需要輸血的早產(chǎn)兒,不具有普適性,因此,Gil 等[22]在2012 年用與PINTROP模型相同的建模方法在PINTROP 模型基礎(chǔ)上開發(fā)了CHOPROP 模型。該模型用于預(yù)測1 型或2 型早產(chǎn)兒視網(wǎng)膜病變,使用出生體重、出生時胎齡和每日體重增加率這3 個指標(biāo)預(yù)測,修正了模型系數(shù)和警報風(fēng)險級別,CHOPROP 模型預(yù)測1 型早產(chǎn)兒視網(wǎng)膜病變的敏感性為100%,同時將需要篩查的早產(chǎn)兒數(shù)量減少了49%。之后,CHOPROP 模型正確地預(yù)測了445 例意大利隊列中所有患有1 型早產(chǎn)兒視網(wǎng)膜病變的早產(chǎn)兒[23],研究不足在于樣本量小。還有學(xué)者分別于2019年和2021 年進(jìn)行了外部驗證,使用不同的截斷值均得到了100%的敏感性,使接受篩查的早產(chǎn)兒分別減少了1/2 和1/3[10,18]。CHOPROP 模型可用于篩查極低體重早產(chǎn)兒,因為此因素在模型中權(quán)重很大,局限性在于樣本量太小,使研究結(jié)果可信度降低。外部驗證結(jié)果顯示了模型在發(fā)展中國家有良好的預(yù)測潛能,但由于驗證隊列樣本量較小,在臨床推廣應(yīng)用之前仍需開展多中心研究去檢驗?zāi)P偷目尚行浴?/p>
Gil 等[19]采用回顧性研究方法對在美國和加拿大的30 家醫(yī)院接受早產(chǎn)兒視網(wǎng)膜病變篩查的7 483 例早產(chǎn)兒進(jìn)行隊列研究,以期在這個多樣化的多中心隊列中驗證CHOPROP 模型,結(jié)果顯示模型預(yù)測1 型早產(chǎn)兒視網(wǎng)膜病變早產(chǎn)兒的敏感性為98.5%,將需要篩查的早產(chǎn)兒數(shù)量減少了34.3%。如果為了涵蓋所有1 型早產(chǎn)兒視網(wǎng)膜病變病例而降低臨界點,那么只有6.8%的早產(chǎn)兒不需要篩查。由于模型敏感性沒達(dá)到預(yù)期且高達(dá)2.5%的1 型或2 型早產(chǎn)兒視網(wǎng)膜病變早產(chǎn)兒可能被遺漏,Gil 等[2]于2018 年將CHOPROP 模型更新為G-ROP,新模型包括6 個篩查標(biāo)準(zhǔn):體重<1 051 g;出生時胎齡<28 周;出生后第2 個10 d(10~19 d)體重增加<120 g;第3 個10 d(20~29 d)體重增加<180 g;第4個10 d(30~39 d)體重增加<170 g;或腦影像篩查(B超、計算機斷層掃描或磁共振成像)診斷為腦積水。更新標(biāo)準(zhǔn)后模型預(yù)測1 型早產(chǎn)兒視網(wǎng)膜病變早產(chǎn)兒的敏感性為100%,同時將需要篩查的早產(chǎn)兒數(shù)量減少了30.3%。此模型開發(fā)樣本量較大,有助于解決數(shù)據(jù)過度擬合所致的預(yù)測能力偏高問題,可提供較準(zhǔn)確的敏感性估計。因G-ROP 模型的開發(fā)采用多中心研究且模型顯示出了良好的預(yù)測能力,之后多個國家學(xué)者對其進(jìn)行了外部驗證,見表1。使用原篩查標(biāo)準(zhǔn)或調(diào)整后標(biāo)準(zhǔn)均可達(dá)到100%的敏感性并使接受篩查的早產(chǎn)兒數(shù)量顯著減少,模型在外部驗證隊列中表現(xiàn)良好,未來可考慮對模型進(jìn)行本土化驗證后在臨床推廣。
表1 G-ROP 模型外部驗證
Cao 等[28]于科羅拉多州對499 名新生兒進(jìn)行了一項回顧性隊列研究,構(gòu)建了CO-ROP 模型。學(xué)者將新生兒細(xì)分為3類:高級別(1型或2型早產(chǎn)兒視網(wǎng)膜病變)、低級別(早產(chǎn)兒視網(wǎng)膜病變不符合1 型或2 型標(biāo)準(zhǔn))和無早產(chǎn)兒視網(wǎng)膜病變,使用標(biāo)準(zhǔn)Logistic 回歸分析每周體重,確定最能預(yù)測早產(chǎn)兒視網(wǎng)膜病變發(fā)展的年齡,最終研究建議對出生時胎齡≤30 周、出生體重≤1 500 g、出生至1 月齡凈增重≤650 g 的早產(chǎn)兒進(jìn)行早產(chǎn)兒視網(wǎng)膜病變篩查。與2013 年的篩查指南相比,CO-ROP模型將篩查的早產(chǎn)兒總數(shù)減少了23.7%,對高級別早產(chǎn)兒視網(wǎng)膜病變的敏感性為100%。2016 年,Cao 等[29]對該模型進(jìn)行了外部驗證,納入了858 例早產(chǎn)兒,結(jié)果顯示,模型對所有分級的早產(chǎn)兒視網(wǎng)膜病變的敏感性為95.0%,使接受篩查的早產(chǎn)兒總數(shù)減少了23.9%。在驗證隊列中,敏感性降低。Emily 等[30]于2018 年在一項更大的隊列中對CO-ROP 模型做了外部驗證,隊列含6 351 例早產(chǎn)兒,驗證結(jié)果為模型檢測重度早產(chǎn)兒視網(wǎng)膜病變的敏感性為96.9%,特異性為40.9%,可以減少26.1%需要進(jìn)行早產(chǎn)兒視網(wǎng)膜病變篩查的早產(chǎn)兒。如前所述的任一模型均需計算體重增加率,意味著醫(yī)護(hù)人員需要對新生兒連續(xù)監(jiān)測,時間跨度為10周甚至更長,每周計算也會加重醫(yī)護(hù)人員工作負(fù)擔(dān)。CO-ROP模型將早產(chǎn)兒在特定時間點的體重增加量作為篩查標(biāo)準(zhǔn)納入風(fēng)險預(yù)測模型,操作省時,但使用該預(yù)測模型會漏掉3.1%重度早產(chǎn)兒視網(wǎng)膜病變的早產(chǎn)兒。從以上兩項外部驗證結(jié)果來看,模型敏感性有待提高,在臨床使用之前有必要進(jìn)行額外的驗證,進(jìn)一步探索其對臨床結(jié)局的預(yù)測能力。
前4 種模型預(yù)測需使用出生以后的指標(biāo),不能及時預(yù)測。2019 年,Aldina 等[31]在瑞典進(jìn)行了一項大型回顧性隊列研究開發(fā)了DIGIROP-Birth 模型,學(xué)者對6 947 例出生時胎齡在24~30 周早產(chǎn)兒的時變數(shù)據(jù)(產(chǎn)后年齡、胎齡、性別、出生體重和重要交互作用)進(jìn)行了泊松回歸分析,納入了出生時胎齡、性別和出生體重這3 個度量標(biāo)準(zhǔn)。該模型增加了受試者工作特征(ROC)曲線下面積這一評價模型預(yù)測性能的綜合性指標(biāo)。ROC 曲線下面積為0.50~1.00,模型所得數(shù)值越大,表示預(yù)測性能越好[32]。模型已做了內(nèi)部和外部(美國和歐洲隊列)驗證,內(nèi)部驗證的ROC 曲線下面積為0.90,美國和歐洲外部驗證ROC 曲線下面積分別為0.87 和0.90。DIGIROP-Birth 模型顯示出了100%的敏感性和19.0%的特異性,調(diào)整截斷值后敏感性為99.0%,特異性為53.8%,與更新的G-ROP 模型的預(yù)測能力相似。由于該模型可以作為風(fēng)險計算器在線訪問并在大型多中心的隊列中顯示出良好的預(yù)測性能。廣州南方醫(yī)科大學(xué)珠江醫(yī)院Chen 等[33]采用回顧性研究方法在接受早產(chǎn)兒視網(wǎng)膜病變篩查的732 例早產(chǎn)兒中獲取了442 例符合條件的早產(chǎn)兒數(shù)據(jù)對DIGIROP-Birth 進(jìn)行外部驗證,結(jié)果顯示ROC 曲線下面積為0.63,敏感性51.6%,特異性85.4%,將呼吸暫停和腦室出血作為危險因素修正模型后,敏感性和特異性分別提高到95.7%、98.5%。之后Aldina 等[15]在瑞典又對模型做了外部驗證,模型的敏感性、特異性、ROC 曲線下面積分別為96.5%、49.9%和0.93。DIGIROP-Birth 模型僅使用出生特征預(yù)測早產(chǎn)兒視網(wǎng)膜病變風(fēng)險并可在線訪問,方便實用,但受缺乏出生體重參考算法的限制,不能預(yù)測胎齡小于24 周的早產(chǎn)兒。該模型預(yù)測性能及臨床實用性均較好,但我國進(jìn)行的外部驗證結(jié)果顯示納入出生后風(fēng)險因素會提高其適用性。
從預(yù)測對象分析,盡管G-ROP 模型被開發(fā)出來時,多個國家修正其模型系數(shù)后敏感性均能達(dá)到100%并能大幅減少接受篩查的早產(chǎn)兒數(shù)量,但WINROP 模型、CHOP-ROP 模型和G-ROP 模型都被設(shè)計為僅識別高等級早產(chǎn)兒視網(wǎng)膜病變,而對低等級早產(chǎn)兒視網(wǎng)膜病變的敏感性分析有限,CO-ROP 模型則納入了低級別視網(wǎng)膜病變的早產(chǎn)兒。研究表明,患有低度視網(wǎng)膜病變的早產(chǎn)兒雖然不需要激光光凝治療,但屈光不正(特別是近視)、斜視和弱視的風(fēng)險增加,CO-ROP 模型通過劃分早產(chǎn)兒等級解決了這一問題[28]。DIGIROP-Birth模型預(yù)測對象為出生時胎齡在24~30 周的早產(chǎn)兒,使用具有一定的局限性。
從研究設(shè)計分析,在當(dāng)前大數(shù)據(jù)時代背景下,WINROP 模型和DIGIROP-Birth 模型可在線訪問,使用便捷,線上程序在未來有更廣闊的開發(fā)空間。僅有一項外部驗證研究[30]為前瞻性研究,其余均為回顧性隊列研究?;仡櫺匝芯侩m資料易獲取、耗時少,但會出現(xiàn)相關(guān)資料缺失情況,若處理不當(dāng),會影響模型預(yù)測性能;前瞻性研究可以明確因在前果在后,使用統(tǒng)一的診斷和評判標(biāo)準(zhǔn),獲得較為全面的臨床資料,但研究耗時且樣本失訪率高。
從納入標(biāo)準(zhǔn)分析,WINROP 模型和CHOP-ROP模型篩查標(biāo)準(zhǔn)為出生時胎齡、出生體重和出生后體重增加率,G-ROP 模型在這3 個指標(biāo)基礎(chǔ)上加了腦影像篩查(B 超、計算機斷層掃描或磁共振成像)診斷為腦積水,這3 個模型需連續(xù)監(jiān)測,每周測量,相對耗時;而CO-ROP 模型使用出生時胎齡、出生體重和出生至1 個月齡體重增加量,DIGIROP-Birth 模型使用出生時胎齡、出生體重和性別預(yù)測早產(chǎn)兒視網(wǎng)膜病變,因此,僅使用出生特征的DIGIROP-Birth 模型和不需動態(tài)監(jiān)測的CO-ROP 模型在易操作性方面較好,使用簡便,節(jié)省人力資源。
綜上所述,風(fēng)險預(yù)測模型已成為早產(chǎn)兒視網(wǎng)膜病變預(yù)防測重要篩查工具,早產(chǎn)兒視網(wǎng)膜病變風(fēng)險預(yù)測模型指標(biāo)一般包含出生體重、出生時胎齡和增重率等,建模方法大多數(shù)采用傳統(tǒng)數(shù)學(xué)模型,當(dāng)前機器算法在風(fēng)險預(yù)測模型領(lǐng)域已成為研究熱點,但早產(chǎn)兒視網(wǎng)膜病變風(fēng)險預(yù)測模型在此方面仍處于起步階段,因此本研究沒有做過多闡述。學(xué)者們致力于模型開發(fā)和外部驗證,修正模型系數(shù)或增加新變量以提高模型預(yù)測性能和減少需要接受篩查的早產(chǎn)兒。使用預(yù)測模型可提高傳統(tǒng)篩查的特異性,盡可能保護(hù)早產(chǎn)兒身心健康,同時也可一定程度上減輕家庭經(jīng)濟(jì)負(fù)擔(dān)。由于不同模型的樣本人群、樣本量和研究設(shè)計差異較大,在模型可以安全地應(yīng)用于臨床實踐之前,需要本土、大規(guī)模的樣本去驗證其預(yù)測能力,若模型敏感性未能達(dá)到100%,或未進(jìn)行大規(guī)模、多中心外部驗證,建議模型僅可作為當(dāng)前篩查指南的輔助方法。