于 敏,劉楚陽(yáng),宋 暉,李 琛,王曉婷,文 華
(1.西安交通大學(xué)醫(yī)院,陜西 西安 710049;2.西安交通大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,陜西 西安 710049;3.西安市婦幼保健院,陜西 西安 710002;4.西安市第四醫(yī)院,陜西 西安 710004)
出生缺陷是指胚胎由于遺傳原因或者物理、化學(xué)、生物等環(huán)境原因或二者的交互作用所引起的先天性異常[1-2]。目前,關(guān)于出生缺陷的研究主要集中在出生缺陷危險(xiǎn)因素及流行病學(xué)特征方面,而出生缺陷預(yù)測(cè)類(lèi)研究較少。為了解西安市圍產(chǎn)兒神經(jīng)管缺陷(neural tube defects,NTDs)率的動(dòng)態(tài)變化趨勢(shì),本研究對(duì)NTDs率進(jìn)行了預(yù)測(cè),以評(píng)估NTDs未來(lái)的流行趨勢(shì)與風(fēng)險(xiǎn)。數(shù)學(xué)模型預(yù)測(cè)是運(yùn)用科學(xué)的統(tǒng)計(jì)方法對(duì)連續(xù)的歷史數(shù)據(jù)進(jìn)行未來(lái)值定量預(yù)測(cè)。準(zhǔn)確地預(yù)測(cè)可以為出生缺陷防治策略提供依據(jù),使資源和效率得到優(yōu)化,對(duì)出生缺陷人群的預(yù)防有指導(dǎo)意義。
本研究依托國(guó)家出生缺陷監(jiān)測(cè)系統(tǒng),自2003年開(kāi)始,收集2003年至2015年期間在西安市各級(jí)開(kāi)設(shè)產(chǎn)科的醫(yī)療保健機(jī)構(gòu)出生的孕28周至生后7天的所有圍產(chǎn)兒的出生缺陷監(jiān)測(cè)資料,從中得到每年西安市確診圍產(chǎn)兒NTDs的發(fā)生情況;對(duì)出生7天內(nèi)發(fā)現(xiàn)但不能確診者,跟蹤至確診時(shí)填報(bào)。
一般而言,脊柱裂合并腦積水或脊柱裂合并腦膨出不需要分別計(jì)入,僅計(jì)為脊柱裂。排除隱性脊柱裂、脊柱裂合并無(wú)腦畸形者、骶尾部畸胎瘤的情況后,可通過(guò)體格檢查、超聲診斷及X線檢查進(jìn)行診斷。
西安市各級(jí)開(kāi)設(shè)產(chǎn)科的醫(yī)療保健機(jī)構(gòu)均全面開(kāi)展監(jiān)測(cè)工作,監(jiān)測(cè)人員全部為婦產(chǎn)科或兒(新生兒)科醫(yī)師,每發(fā)現(xiàn)1例NTDs圍產(chǎn)期患兒需要填報(bào)1張《出生缺陷兒登記卡》。在監(jiān)測(cè)前及監(jiān)測(cè)過(guò)程中,每年對(duì)監(jiān)測(cè)人員需進(jìn)行統(tǒng)一培訓(xùn)。
缺陷兒出生情況、診斷結(jié)果、產(chǎn)婦情況、產(chǎn)婦孕早期情況、異常生育史、缺陷兒史、家族史、近親婚配史等。出生缺陷診斷結(jié)果分為23類(lèi)常見(jiàn)出生缺陷和其他類(lèi)型。
本研究對(duì)所有出生缺陷卡均進(jìn)行復(fù)核,主要核對(duì):①當(dāng)卡上登記有多種出生缺陷時(shí)是否為綜合征;②是否重復(fù)計(jì)算出生缺陷兒;③診斷為“其他”類(lèi)型的出生缺陷及其詳細(xì)描述是否可以確認(rèn)歸屬于常見(jiàn)23類(lèi)常見(jiàn)出生缺陷中;④是否為不需報(bào)《出生缺陷兒登記卡》的異常體征或單純正常變異;⑤母親居住地、診斷時(shí)間、診斷依據(jù)、患兒出生孕周/出生時(shí)間/年齡、妊娠結(jié)局等關(guān)鍵變量是否在監(jiān)測(cè)方案界定的范圍內(nèi)等。
自回歸移動(dòng)平均模型(autoregressive integrated moving average model,ARIMA)的基本思想是:將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,用一定的數(shù)學(xué)模型近似描述這個(gè)序列。這個(gè)模型一旦被識(shí)別后就可以從時(shí)間序列的過(guò)去值及現(xiàn)在值預(yù)測(cè)未來(lái)值。該模型目前廣泛應(yīng)用于數(shù)據(jù)分析領(lǐng)域,尤其是針對(duì)時(shí)間序列上具有依存性和擾動(dòng)性的數(shù)據(jù)分析。ARIMA模型分為簡(jiǎn)單季節(jié)性和乘積季節(jié)性?xún)煞N模型。ARIMA模型將非平穩(wěn)的時(shí)間序列進(jìn)行平穩(wěn)化后,通過(guò)成熟的統(tǒng)計(jì)測(cè)算建立優(yōu)化的模型和準(zhǔn)確的參數(shù),擬合模型無(wú)限接近平穩(wěn)的時(shí)間序列,同時(shí)使誤差最小。結(jié)合對(duì)應(yīng)的數(shù)學(xué)模型和數(shù)據(jù),對(duì)連續(xù)變化數(shù)據(jù)的時(shí)間序列走向及趨勢(shì)進(jìn)行分析和預(yù)判。簡(jiǎn)化的建模策略主要由模型識(shí)別、模型擬合和模型診斷構(gòu)成。ARIMA模型包含:AR(自回歸過(guò)程)、MA(移動(dòng)平均過(guò)程)、ARMA(自回歸移動(dòng)平均過(guò)程)環(huán)節(jié)。
灰色數(shù)據(jù)是數(shù)據(jù)序列中的部分信息已知,部分信息未知,同時(shí)數(shù)據(jù)序列內(nèi)各因素間的關(guān)系不確定?;疑P褪轻槍?duì)灰色系統(tǒng),通過(guò)鑒別系統(tǒng)因素之間的發(fā)展趨勢(shì)預(yù)測(cè)相異程度,并進(jìn)行關(guān)聯(lián)度分析,同時(shí)對(duì)原始數(shù)據(jù)進(jìn)行生成處理以尋找灰色系統(tǒng)變動(dòng)的規(guī)律,形成有較強(qiáng)規(guī)律性的數(shù)據(jù)序列組合,然后通過(guò)建立相應(yīng)的微分方程數(shù)學(xué)模型,對(duì)事物未來(lái)發(fā)展趨勢(shì)的狀況進(jìn)行預(yù)測(cè)。灰色模型進(jìn)行數(shù)據(jù)預(yù)測(cè)的步驟主要有原始數(shù)據(jù)預(yù)處理、建立預(yù)測(cè)模型和模型檢驗(yàn)。
采用Excel軟件進(jìn)行數(shù)據(jù)錄入,并對(duì)出生缺陷數(shù)據(jù)按年統(tǒng)計(jì)匯總。使用R 3.5.1軟件進(jìn)行ARIMA模型預(yù)測(cè);使用Matlab 7.0軟件進(jìn)行灰色模型預(yù)測(cè)。
整理2003年至2015年西安市出生缺陷發(fā)生情況的資料,根據(jù)其N(xiāo)TDs發(fā)生率建立數(shù)學(xué)模型,通過(guò)建立的數(shù)學(xué)模型對(duì)2016年至2018年西安市圍生兒NTDs發(fā)生情況進(jìn)行預(yù)測(cè)。
2003年至2015年共監(jiān)測(cè)圍產(chǎn)兒1 236 937例,確診出生缺陷兒10 619例,確診NTDs共1 241例,見(jiàn)表1。
表1 2003年至2015年西安市圍產(chǎn)兒出生缺陷及NTDs率
2.2.1讀入數(shù)據(jù)并繪制時(shí)間序列圖
結(jié)合原始數(shù)據(jù)的時(shí)間序列,在此基礎(chǔ)上繪制時(shí)間序列圖,觀察其隨時(shí)間變化或季節(jié)變化的趨勢(shì)。2003年至2015年西安市圍生兒NTDs率的時(shí)間序列顯示呈逐年降低趨勢(shì),見(jiàn)圖1。
圖1 2003年至2015年西安市圍生兒NTDs率
2.2.2繪制自相關(guān)函數(shù)圖與偏自相關(guān)函數(shù)圖
如果時(shí)間序列是非平穩(wěn)的,則其存在向上或向下的趨勢(shì),就需要對(duì)非平穩(wěn)的時(shí)間序列進(jìn)行平穩(wěn)化處理,直到該時(shí)間序列的均值和方差趨向于常數(shù),則可以保證序列內(nèi)部性質(zhì)穩(wěn)定[3]。差分是保證時(shí)間序列平穩(wěn)的數(shù)學(xué)變換方法。平穩(wěn)的時(shí)間序列的差分仍然是平穩(wěn)的,但是過(guò)度差分會(huì)對(duì)序列帶來(lái)不必要的相關(guān)性并使建模過(guò)程復(fù)雜化。為了避免過(guò)度差分,計(jì)算時(shí)應(yīng)依次仔細(xì)查看各個(gè)差分并遵循簡(jiǎn)潔性的原則。利用時(shí)間序列圖和自相關(guān)圖均可以對(duì)時(shí)間序列的平穩(wěn)性進(jìn)行判斷[4]。繪制自相關(guān)函數(shù)(autocorrelation function,ACF)圖,可知時(shí)間序列非平穩(wěn),需要進(jìn)行差分,見(jiàn)圖2。繪制偏自相關(guān)函數(shù)(partial autocorrelation function,PACF)圖,發(fā)現(xiàn)偏自相關(guān)函數(shù)一階截尾,因此進(jìn)行一階差分,見(jiàn)圖3。原始時(shí)間序列經(jīng)過(guò)一階差分后形成時(shí)間序列S1,使用時(shí)間序列S1繪制時(shí)間序列圖,可見(jiàn)時(shí)間序列S1無(wú)明顯隨時(shí)間波動(dòng)趨勢(shì),見(jiàn)圖4。
圖2 2003年至2015年西安市圍生兒NTDs率自相關(guān)函數(shù)圖
圖3 2003年至2015年西安市圍生兒NTDs率偏自相關(guān)函數(shù)圖
圖4 一階差分后S1序列時(shí)間序列圖
2.2.3差分后時(shí)間序列繪制自相關(guān)函數(shù)圖和偏自相關(guān)函數(shù)圖
對(duì)差分后的時(shí)間序列S1繪制自相關(guān)函數(shù)圖,見(jiàn)圖5。對(duì)差分后的時(shí)間序列S1繪制偏自相關(guān)函數(shù)圖,見(jiàn)圖6。
圖5 一階差分后S1序列自相關(guān)函數(shù)圖
圖6 一階差分后S1序列偏自相關(guān)函數(shù)圖
2.2.4時(shí)間序列模型的識(shí)別規(guī)則
總體策略遵照“Box-Jenkins方法”識(shí)別時(shí)間序列模型。首先確定合理的但為嘗試性的p、d、q值,然后估計(jì)模型中的Φ、θ、σt,嚴(yán)格審查得到的擬合模型,檢驗(yàn)該模型的擬合充分性。通過(guò)模型參數(shù),獲得參數(shù)的檢驗(yàn)結(jié)果。獲得模型殘差檢驗(yàn)、模型擬合優(yōu)度等指標(biāo)后,按照如下模型選取原則,選擇最佳模型。首先判斷自相關(guān)函數(shù)ACF和偏自相關(guān)函數(shù)PACF是否都在95%的可信區(qū)間內(nèi),如果ACF和PACF都是拖尾的,則選擇ARMA(p,q)模型;如果ACF拖尾,但是PACF截尾,則選擇AR(p)模型;若ACF截尾,但是PACF拖尾則選擇MA(q)模型。通過(guò)觀察圖5和圖6發(fā)現(xiàn),自相關(guān)函數(shù)圖中自相關(guān)系數(shù)拖尾,偏自相關(guān)函數(shù)圖中偏自相關(guān)系數(shù)拖尾,其均落在2倍標(biāo)準(zhǔn)差范圍內(nèi),且不是一致趨向于零,所以對(duì)原時(shí)間序列擬合ARMA(p,q)模型。
2.2.5進(jìn)行Box-Ljung檢驗(yàn)并繪制Q-Q圖
通過(guò)進(jìn)行Box-Ljung檢驗(yàn),發(fā)現(xiàn)X-squared=0.071 189,df=1,P=0.789 6。如果P>0.05說(shuō)明殘差為白噪聲,差異無(wú)統(tǒng)計(jì)學(xué)意義,可選擇通過(guò)擬合優(yōu)度檢驗(yàn)的適宜模型,進(jìn)行下一步的模型預(yù)測(cè)。本研究所用ARIMA(0,1,0)模型通過(guò)擬合優(yōu)度檢驗(yàn)且殘差為白噪聲。
Q-Q圖和Box-Ljung檢驗(yàn)的結(jié)果顯示,殘差符合正態(tài)性假設(shè)且不相關(guān),則認(rèn)為模型擬合數(shù)據(jù)比較充分,可以用來(lái)進(jìn)行下一步預(yù)測(cè),見(jiàn)圖7。
圖7 ARIMA模型的Q-Q圖結(jié)果
2.2.6 對(duì)2016年至2018年西安市圍生兒NTDs率的預(yù)測(cè)
依據(jù)模型進(jìn)行計(jì)算,預(yù)測(cè)2016年至2018年西安市圍產(chǎn)兒NTDs率分別為0.17‰、0.16‰和0.16‰,見(jiàn)圖8。
注:藍(lán)色線條表示預(yù)測(cè)值。
依據(jù)2003年至2015年西安市圍產(chǎn)兒NTDs發(fā)生率建立灰色模型,預(yù)測(cè)2016年至2018年西安市圍產(chǎn)兒NTDs率。
X(0)(k)={26.26,22.89,21.34,17.73,12.79,12.22,13.14,10.11,10,9.02,3.33,2.7,1.8}
弱化算子之后的灰色數(shù)據(jù):
X(1)(k)={12.563 846,11.422 5,10.38,9.284,8.345 556,7.79,7.157 143,6.16,5.37,4.212 5,2.61,2.25,1.8}
通過(guò)Matlab 7.0軟件計(jì)算GM(1,1)參數(shù)估計(jì)值:發(fā)展系數(shù)a=0.132 802,灰色作用量u=14.574 517。
平均相對(duì)誤差=16.202 976%,詳見(jiàn)表2。
相對(duì)精度=83.797 024%
X(k+1)=-97.181 993exp(-0.132 802×k)+109.745 839
表2 灰色預(yù)測(cè)模型模擬值、殘差及相對(duì)誤差
灰色模型后驗(yàn)差比值檢驗(yàn):
C值=0.721 47/7.756 711=0.093
后驗(yàn)差比值C值屬于[<0.35],GM(1,1)模型預(yù)測(cè)精度等級(jí)為:好。
灰色模型預(yù)測(cè)2016年至2018年西安市圍產(chǎn)兒NTDs率為0.25‰、0.22‰、0.19‰。
通過(guò)與實(shí)際值比較發(fā)現(xiàn),ARIMA模型與灰色模型準(zhǔn)確度都很高,ARIMA模型的殘差平方和為0.015 2,灰色模型的殘差平方和為0.009 8,見(jiàn)表3。
表3 ARIMA模型與灰色模型預(yù)測(cè)值與實(shí)際值的比較結(jié)果
NTDs是目前能夠采取措施有效預(yù)防的少數(shù)出生缺陷之一[5-9]。為了控制NTDs的發(fā)生,我國(guó)采取了多種措施,如計(jì)劃懷孕宣傳、增補(bǔ)葉酸預(yù)防NTDs項(xiàng)目、健康教育、遺傳咨詢(xún)、產(chǎn)前超聲、血清學(xué)篩查等,綜合措施成效顯著,NTDs率連年下降。西安市從2009年第四季度開(kāi)始在全市范圍內(nèi)針對(duì)孕前和早孕期婦女免費(fèi)增補(bǔ)葉酸[10]。NTDs平均發(fā)生率由2003年的2.23‰下降到2012年的0.90‰,然后下降到2015年的0.18‰。全國(guó)圍產(chǎn)兒NTDs率從1987年的2.74‰下降到2011年的0.45‰,2000年至2011年期間,下降幅度超過(guò)60%。西安市的下降趨勢(shì)和全國(guó)趨勢(shì)一致,也與文獻(xiàn)報(bào)道[5]相關(guān)研究結(jié)果一致。本研究應(yīng)用ARIMA模型和灰色模型對(duì)2016年至2018年西安市圍產(chǎn)兒NTDs率進(jìn)行了預(yù)測(cè),以明確NTDs未來(lái)的流行趨勢(shì),其均發(fā)現(xiàn)NTDs率穩(wěn)定在低發(fā)生率水平。
本研究將ARIMA模型預(yù)測(cè)值、灰色模型預(yù)測(cè)值與實(shí)際值進(jìn)行比較發(fā)現(xiàn),這兩種模型預(yù)測(cè)值與實(shí)際值間的殘差平方和均較低,可靠性均較高。有研究發(fā)現(xiàn)ARIMA模型和灰色模型應(yīng)用于短期及中期預(yù)測(cè)效果較好[3]。今經(jīng)過(guò)對(duì)ARIMA模型研究及與其他數(shù)學(xué)模型比較發(fā)現(xiàn),其在擬合動(dòng)態(tài)數(shù)據(jù)方面具有明顯優(yōu)勢(shì)[11-12]。近年來(lái),由于NTDs率呈現(xiàn)明顯的逐年下降趨勢(shì),因此用ARIMA模型對(duì)NTDs率進(jìn)行預(yù)測(cè)具有很強(qiáng)的必要性和現(xiàn)實(shí)意義,對(duì)進(jìn)一步降低NTDs率提供了信息支持。本研究歷經(jīng)2003年至2015年,統(tǒng)計(jì)年限長(zhǎng),且樣本量巨大,共監(jiān)測(cè)圍產(chǎn)兒1 236 937例,出生缺陷兒10 619例,大樣本和監(jiān)測(cè)時(shí)長(zhǎng)使數(shù)學(xué)模型預(yù)測(cè)更加可靠,結(jié)果更可信。
出生缺陷的危險(xiǎn)因素包括環(huán)境因素和遺傳因素等,一般預(yù)測(cè)模型往往很難納入所有的危險(xiǎn)因素,但是作為時(shí)間序列研究之一的ARIMA模型綜合了長(zhǎng)期趨勢(shì)、季節(jié)因素和隨機(jī)誤差因素等,通過(guò)差分實(shí)現(xiàn)數(shù)據(jù)序列的平穩(wěn),具有不受數(shù)據(jù)類(lèi)型限制的優(yōu)點(diǎn),是一種短期預(yù)測(cè)效果很好的預(yù)測(cè)模型[13]?;疑P途哂袕?qiáng)化算子、弱化算子、均值生成、級(jí)比生成、累加生成、累減生成等多種運(yùn)算模式對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,使數(shù)據(jù)本身的規(guī)律能夠得到顯化,具有運(yùn)算簡(jiǎn)便、可靠性較高的優(yōu)點(diǎn)。
出生缺陷主要是由遺傳因素和環(huán)境因素共同作用所致[14]。一級(jí)預(yù)防是控制出生缺陷的根本策略,防控出生缺陷重點(diǎn)應(yīng)放在一級(jí)干預(yù)措施[15]。因此,應(yīng)加強(qiáng)孕早期保健指導(dǎo),如加強(qiáng)營(yíng)養(yǎng)、小劑量葉酸補(bǔ)充、吸煙干預(yù)、用藥指導(dǎo)、疾病預(yù)防、遺傳咨詢(xún)干預(yù)、避免接觸致畸物質(zhì)等,督促其接受系統(tǒng)的孕產(chǎn)期保健服務(wù),對(duì)預(yù)防和減少出生缺陷的發(fā)生具有重要意義。葉酸、鐵等營(yíng)養(yǎng)素的補(bǔ)充可以降低多種出生缺陷的風(fēng)險(xiǎn),因此,積極探索各種主要出生缺陷的一級(jí)預(yù)防措施是目前面臨的重要任務(wù)。