王美芝,杜真,張猛,趙冰,陳露,孫利環(huán),吳雪柯,胡孟彩
出生缺陷也稱先天異常,是出生前胚胎發(fā)育紊亂引起的異常,出生時或出生后可見的先天畸形、功能障礙和代謝紊亂的總稱[1],出生缺陷發(fā)生的病因眾多,遺傳變異和環(huán)境影響是主要因素。出生缺陷是導(dǎo)致圍產(chǎn)兒死亡的主要原因,嚴重影響兒童的身心健康,已成為世界共同關(guān)注的重大公共衛(wèi)生問題。根據(jù)《全國出生缺陷綜合防治方案》[2]統(tǒng)計,目前我國出生缺陷發(fā)生率在5.6%左右。預(yù)防出生缺陷是我國婦幼保健工作面臨的嚴峻挑戰(zhàn),構(gòu)建適當?shù)哪P筒⑦M行預(yù)測,可為出生缺陷防控工作提供數(shù)據(jù)支持,并為制定合理的防控措施提供科學(xué)依據(jù)。
時間序列是對相同統(tǒng)計指標的數(shù)值按時間順序排列而成的數(shù)列進行分析,主要目的是挖掘歷史數(shù)據(jù)規(guī)律實現(xiàn)對未來的預(yù)測。自回歸求和滑動平均模型(autoregressive integrated moving average,ARIMA)是常見的時間序列模型,它可以結(jié)合出生缺陷時間序列數(shù)據(jù)的分布特征進行動態(tài)預(yù)測,將時間因素作為一個綜合影響因子,而不依賴于危險因素。目前,國外針對出生缺陷的研究主要集中在危險因素及流行特征分析方面[3-5],我國已有學(xué)者利用ARIMA模型對上海市閔行區(qū)和西安等地出生缺陷發(fā)生率進行了預(yù)測,并得到了可靠的結(jié)果[6-7]。河南省出生缺陷監(jiān)測項目已實施多年,但基于監(jiān)測數(shù)據(jù)構(gòu)建預(yù)測模型的研究較少,為充分評價其預(yù)防效果,本研究基于ARIMA乘積季節(jié)模型對河南省月度出生缺陷發(fā)生率進行預(yù)測,以了解河南省出生缺陷發(fā)生率發(fā)展趨勢,為制定科學(xué)的出生缺陷防控措施提供參考。
收集2011年1月至2020年12月河南省37所國家級出生缺陷監(jiān)測點所有圍產(chǎn)兒的出生缺陷監(jiān)測數(shù)據(jù),監(jiān)測期限為妊娠滿28周至產(chǎn)后7 d,出生缺陷主要包括先天性心臟病、多指/趾、外耳其他畸形、尿道下裂、馬蹄內(nèi)翻足、并指/趾、總唇裂、小耳、腭裂、直腸肛門閉鎖或狹窄等23類。
各監(jiān)測點按《中國出生缺陷監(jiān)測方案》要求及國家缺陷監(jiān)測中心《中國出生缺陷工作手冊》中的23類出生缺陷診斷標準進行臨床監(jiān)測。監(jiān)測人員每年進行統(tǒng)一培訓(xùn)。對每一例分娩的缺陷兒填寫《出生缺陷兒登記卡》,疑難疾病診斷不明者請新生兒及相關(guān)專家會診,以保證監(jiān)測質(zhì)量,避免誤診、漏診。匯總填寫《圍產(chǎn)兒季報表》,表卡資料經(jīng)醫(yī)院審核后每季度上報1次。
1.3.1 ARIAM模型基本思想 將預(yù)測值隨時間遷移而形成的數(shù)據(jù)序列視為一個隨機序列,用相對應(yīng)的數(shù)學(xué)模型來近似描述該序列。當模型被識別后,就可從該時間序列的過去值及現(xiàn)在值實現(xiàn)未來值的預(yù)測。本研究應(yīng)用ARIMA乘積季節(jié)模型(p,d,q)(P,D,Q)S分析河南省出生缺陷發(fā)生率的趨勢性和季節(jié)性,其中p、d、q分別為自回歸階數(shù)、差分階數(shù)、移動平均階數(shù),P、D、Q分別為季節(jié)自回歸階數(shù)、季節(jié)差分階數(shù)、季節(jié)移動平均階數(shù),s為季節(jié)周期。
1.3.2 建模及預(yù)測步驟 ① 繪制時序圖:初步判斷原始數(shù)據(jù)隨時間的變化特點。② 平穩(wěn)化處理與白噪聲檢測:對非平穩(wěn)時序數(shù)據(jù)進行差分處理,得到d和D的取值。③ 模型識別和定階:根據(jù)自相關(guān)函數(shù)(auto correlation function,ACF)圖和偏自相關(guān)函數(shù)(partial auto correlation function,PACF)圖的圖形特征初步確定p和q的取值,構(gòu)建備選模型。④ 參數(shù)估計與模型診斷:所有備選模型均滿足殘差序列白噪聲要求[8](P>0.05),進一步比較,采用貝葉斯準則(bayesian information criterion,BIC)確定最佳模型。⑤ 模型預(yù)測及預(yù)測效果評價:計算出生缺陷發(fā)生率預(yù)測值和真實值的平均絕對百分比誤差(mean absolute percentage error,MAPE)比較模型的預(yù)測性能[9-10]。
本研究采用Excel 2022軟件進行數(shù)據(jù)分析,計算2011~2020年河南省月度出生缺陷發(fā)病率(1/萬),公式如下:出生缺陷發(fā)生率=出生缺陷發(fā)生數(shù)/同期活產(chǎn)數(shù)×10 000(1/萬)。采用SPSS 26.0軟件進行ARIMA乘積季節(jié)模型建模,并對模型的擬合效果進行檢驗,檢驗水準α=0.05;回代2020年數(shù)據(jù)計算模型預(yù)測平均相對誤差,并利用最優(yōu)模型預(yù)測2021~2022年河南省出生缺陷發(fā)生率。
2011~2019年河南省37所國家級出生缺陷監(jiān)測點總體、城鎮(zhèn)和鄉(xiāng)村圍產(chǎn)兒月度出生缺陷發(fā)生率均呈現(xiàn)上升趨勢,見圖1。
圖1 2011~2019年河南省月度出生缺陷發(fā)生率
2.2.1 模型識別 河南省出生缺陷發(fā)生率隨時間變化呈波動上升趨勢,序列取值以12個月為周期上下波動。由時序圖可知序列不平穩(wěn),見下頁圖2 Aa-Ac,存在周期性,再對該序列作差分處理,充分提取序列的趨勢性和季節(jié)周期性,時序圖基本平穩(wěn),見圖2 Ba~Bc。
2.2.2 模型擬合和比較 河南省出生缺陷發(fā)生率序列具有長期趨勢性和季節(jié)周期性,說明適合ARIMA乘積季節(jié)模型(p,d,q)(P,D,Q)S。經(jīng)差分處理后,序列的趨勢性和季節(jié)周期性被消除,故判斷d=1,D=1,s=12。根據(jù)差分后的ACF圖(見圖2 Ca~Cc)和PACF圖(見圖2 Da~Dc)判斷P、Q的取值,通常小于2,接著對所有可能的模型進行擬合,選出備選模型。經(jīng)過比較,選取BIC為6.997最小的相對最優(yōu)模型ARIMA(0,1,1)(0,1,1)12,參數(shù)估計均具有統(tǒng)計學(xué)意義,對殘差進行Ljung-Box Q檢驗,檢驗結(jié)果無統(tǒng)計學(xué)意義(P=0.854)。同理分別構(gòu)建城鎮(zhèn)和鄉(xiāng)村ARIMA乘積季節(jié)模型,得到相對最優(yōu)模型分別為ARIMA(2,1,2)(2,1,0)12、ARIMA(0,1,1)(0,1,1)12,均符合建模要求(P值分別為0.292、0.785)。
2.2.3 模型檢驗 本研究所構(gòu)建總體、城鎮(zhèn)和鄉(xiāng)村出生缺陷率ARIMA(0,1,1)(0,1,1)12、ARIMA(2,1,2)(2,1,0)12、ARIMA(0,1,1)(0,1,1)12模型通過擬合優(yōu)度檢驗且殘差均為白噪聲(P>0.05),見下頁圖3。
2.2.4 模型預(yù)測與評價 分別利用最優(yōu)模型對2020年1~12月河南省總體、城鎮(zhèn)和鄉(xiāng)村月度出生缺陷發(fā)生率進行預(yù)測并評價擬合效果。結(jié)果顯示,預(yù)測2020年1~12月河南省總體、城鎮(zhèn)和鄉(xiāng)村月度出生缺陷發(fā)生率呈繼續(xù)上升趨勢,且真實值和預(yù)測值變化趨勢一致,實際出生缺陷發(fā)生率均落在95%置信區(qū)間內(nèi),詳見下頁表1。
表1 2020年1~12月河南省總體、城鎮(zhèn)和鄉(xiāng)村月度出生缺陷發(fā)生率回代驗證結(jié)果
2.2.5 模型應(yīng)用 使用上述最優(yōu)模型對2021年1月至2022年12月河南省月度出生缺陷發(fā)生率進行預(yù)測,并給出上下限(見下頁表2),出生缺陷發(fā)生率呈現(xiàn)繼續(xù)上升趨勢(圖4,見封3)。這一部分結(jié)果待后期真實結(jié)果出來后進一步驗證。
表2 2021年1月至2022年12月河南省出生缺陷發(fā)生率預(yù)測結(jié)果
本研究顯示,河南省近十年出生缺陷發(fā)生率呈現(xiàn)上升趨勢,利用最優(yōu)模型計算2020年預(yù)測值和真實值的平均相對誤差均小于15%,模型預(yù)測精度較高[11],可以對未來河南省月度出生缺陷發(fā)生率進行預(yù)測,2021~2022年預(yù)測結(jié)果顯示出生缺陷發(fā)生率均呈現(xiàn)上升趨勢,與全國總體水平[12]以及其他部分省市[13-15]報道基本一致。這可能與《中國婦女發(fā)展綱要(2011-2020)》和《中國兒童發(fā)展綱要(2011-2020)》進一步貫徹和落實,出生缺陷監(jiān)測系統(tǒng)日益完善,監(jiān)測覆蓋面逐漸加大有關(guān)。出生缺陷的發(fā)生受多種因素的影響:10%~25%與遺傳因素有關(guān),10%~20%與環(huán)境有關(guān),兩者共同作用占60%~80%[16]。隨著國家三孩政策[17]放開,出生人口數(shù)、高齡產(chǎn)婦比例及高危產(chǎn)婦數(shù)不斷增加[18-20]。近年來B超[21]、MRI[22]等影像學(xué)技術(shù)以及分子生物學(xué)技術(shù)[23-24]等檢測技術(shù)的不斷提高使得出生缺陷檢出率增加、漏檢情況減少,這些可能是出生缺陷發(fā)生率不斷上升的原因。針對出生缺陷上升,河南省近年來已圍繞出生缺陷三級預(yù)防采取一系列措施:涵蓋婚前檢查、葉酸補服、孕前優(yōu)生教育;免費NT產(chǎn)前超聲篩查、免費產(chǎn)前血清篩查(唐氏篩查)、唐氏篩查高危人群、高齡孕婦(≥35歲)免費產(chǎn)前診斷管理;新生兒苯丙酮尿癥、先天性甲狀腺功能減低癥、聽力篩查等。
ARIMA模型綜合考慮時間序列的趨勢性、周期性變化及隨機干擾等情況,使用模型參數(shù)進行量化,在一定程度上排除了主觀判斷的隨意性,在反復(fù)識別和擬合中選擇最佳模型來預(yù)測序列的發(fā)展趨勢,能較好地反映序列的趨勢和變化[25],它將影響疾病發(fā)生發(fā)展的多種因素綜合考慮于時間變量中,是一種實用性很強且成本較低的預(yù)測方法。本研究使用ARIMA乘積季節(jié)模型進行預(yù)測,考慮出生缺陷發(fā)生率與季節(jié)之間的相關(guān)關(guān)系,充分提取了數(shù)據(jù)中的有效信息,提高了預(yù)測的準確度。近年來,國內(nèi)已有學(xué)者利用ARIMA模型對出生缺陷發(fā)生率進行預(yù)測,并得出了可靠的結(jié)果:張麗等[26]利用ARIMA(0,0,1)(0,l,1)12預(yù)測2015年9月至2016年9月西安市婦幼保健院出生缺陷發(fā)生率,平均相對誤差為11.00%;陳敏等[6]利用ARIMA(1,1,1)預(yù)測2016年1~12月上海市閔行區(qū)出生缺陷發(fā)生率,平均相對誤差為12.41%。本研究預(yù)測模型與其他不同地區(qū)預(yù)測模型不盡相同,可能與經(jīng)濟發(fā)展水平、環(huán)境空氣質(zhì)量、醫(yī)療環(huán)境、社會保障力度、文化程度、生育觀改變等因素有關(guān)。因此不可直接采用其他地區(qū)的預(yù)測模型,應(yīng)當結(jié)合實際情況,構(gòu)建適宜本地區(qū)使用的模型。
本研究將數(shù)學(xué)模型與出生缺陷研究結(jié)合,為河南省出生缺陷研究提供了新的思路,為制定科學(xué)的出生缺陷防控策略提供依據(jù)。但是,本研究構(gòu)建ARIMA乘積季節(jié)模型以2011~2020年河南省月度出生缺陷發(fā)生率數(shù)據(jù)為基礎(chǔ)進行數(shù)據(jù)外延,若影響出生缺陷發(fā)生的外界因素突然變化,或是更新數(shù)據(jù),都會影響模型預(yù)測效果,減低預(yù)測效能。ARIMA模型適用于短期預(yù)測模型,無法實現(xiàn)長期趨勢預(yù)測[27-28],因此需要持續(xù)收集和更新數(shù)據(jù),確保模型的預(yù)測性能。其次,本研究構(gòu)建模型著眼于河南省出生缺陷總發(fā)生率的預(yù)測,未對重大出生缺陷疾病如先天性心臟病、多指(趾)、外耳其他畸形、尿道下裂、并指(趾)的發(fā)生趨勢進行預(yù)測。最后,本研究構(gòu)建的ARIMA模型并未考慮干預(yù)措施、診斷手段和報告質(zhì)量等因素對出生缺陷發(fā)生率的影響。在今后的研究中,可以探討Holt-Winters加法模型、多層感知器模型、灰色模型、神經(jīng)網(wǎng)絡(luò)模型等模型在出生缺陷發(fā)生率以及重大出生缺陷發(fā)生率中的應(yīng)用價值。
綜上所述,合理的預(yù)測模型在出生缺陷的科學(xué)防控中具有一定的指導(dǎo)意義。出生缺陷的防控是一項長期、艱巨的任務(wù),需要政府、社會、家庭的共同參與。衛(wèi)生行政部門應(yīng)當重視出生缺陷防控工作,健全出生缺陷防治網(wǎng)絡(luò),加強出生缺陷監(jiān)測,加強防治出生缺陷病因?qū)W科研攻關(guān),促進出生缺陷防治領(lǐng)域科技創(chuàng)新和成果轉(zhuǎn)化,將出生缺陷發(fā)生率控制在合理的范圍。