楊麗娟 段 禹 張燕杰 操龍挺 潘貴霞 葉冬青,2 王 靜△
【提 要】 目的 用動(dòng)態(tài)因子模型提取并比較我國各地區(qū)肺結(jié)核發(fā)病率共同趨勢,分析其與人均國內(nèi)生產(chǎn)總值(GDP)的關(guān)系。方法 用Stata 14.0基于動(dòng)態(tài)因子模型分別對我國2004-2015年各地區(qū)肺結(jié)核發(fā)病率標(biāo)準(zhǔn)化值提取共同因子。用SPSS 23.0做滯后相關(guān)分析。以共同因子為因變量,人均月度GDP(千元)相應(yīng)滯后期為自變量做線性回歸分析。結(jié)果 我國肺結(jié)核年均發(fā)病率(1/10萬)最高的三個(gè)省是新疆(178.65)、貴州(146.60)和海南(116.58)。各地區(qū)肺結(jié)核發(fā)病率共同因子均在下降,中部、東北和西部北方地區(qū)下降較快。滯后相關(guān)分析顯示中部和東部南方地區(qū)的人均GDP對發(fā)病率共同因子的影響滯后二期,東部北方滯后三期,西部南方、西部北方和東北地區(qū)滯后一期。發(fā)病率共同因子與人均GDP負(fù)相關(guān),人均月度GDP每增加1千元,東部南方地區(qū)肺結(jié)核發(fā)病率(1/10萬)減少34.4%,北方地區(qū)減少32.5%;西部南方地區(qū)減少14.9%,北方地區(qū)減少75.2%;中部地區(qū)減少68.8%,東北地區(qū)減少45.3%。結(jié)論 我國肺結(jié)核發(fā)病趨勢在降低,且有一定地區(qū)差異。人均GDP對肺結(jié)核發(fā)病率的影響滯后1-3個(gè)月。應(yīng)加大西部南方地區(qū)對肺結(jié)核防治的經(jīng)濟(jì)投入。動(dòng)態(tài)因子模型可應(yīng)用于肺結(jié)核發(fā)病數(shù)據(jù)的分析。
肺結(jié)核(tuberculosis)由結(jié)核分支桿菌侵犯肺臟所致[1-2]。2015年全世界新發(fā)肺結(jié)核1040萬例,病死140萬例。中國是肺結(jié)核高發(fā)國家之一且發(fā)病水平存在地區(qū)差異[3-4]。研究發(fā)現(xiàn)經(jīng)濟(jì)水平對肺結(jié)核的發(fā)病有一定影響[5-6]。
作為一種傳染病,相鄰各省的肺結(jié)核發(fā)病可能有較高相關(guān)性。動(dòng)態(tài)因子模型(dynamic factor model,DFM)是處理高維數(shù)據(jù)的一種統(tǒng)計(jì)方法,可從多組相關(guān)變量中獲取潛在不可觀測的共同趨勢[7],正逐步應(yīng)用于醫(yī)學(xué)領(lǐng)域的研究中[8]??紤]到肺結(jié)核流行和經(jīng)濟(jì)發(fā)展的區(qū)域差異及影響因素作用的滯后性,本次研究目的是運(yùn)用DFM分別提取并觀察各經(jīng)濟(jì)區(qū)域肺結(jié)核發(fā)病率的共同趨勢,并確定人均GDP對肺結(jié)核發(fā)病率影響的滯后期數(shù),進(jìn)一步分析各區(qū)域發(fā)病率共同趨勢與區(qū)域經(jīng)濟(jì)因素的關(guān)系,為結(jié)核病的研究拓寬思路,同時(shí)為結(jié)核病的防治工作提供一定參考。
1.數(shù)據(jù)來源 從公共衛(wèi)生科學(xué)數(shù)據(jù)中心網(wǎng)站查詢到全國各省、直轄市及自治區(qū)從2004年1月到2015年12月肺結(jié)核的月發(fā)病人數(shù)。從國家統(tǒng)計(jì)局網(wǎng)站獲取各省同期各年的年末常住人口數(shù)和季度GDP數(shù)據(jù)。以年初和年末人口數(shù)的平均值作為當(dāng)年的平均人口數(shù),用各省每月肺結(jié)核的發(fā)病人數(shù)除以當(dāng)年平均人口數(shù)可得到各省月發(fā)病率(1/10萬)時(shí)間序列。肺結(jié)核的年平均發(fā)病率是用該期間內(nèi)的年平均發(fā)病人數(shù)除以年平均人口數(shù)計(jì)算。
肺結(jié)核發(fā)病數(shù)據(jù)和人口數(shù)據(jù)無缺失值及異常值,經(jīng)對比與各年衛(wèi)生統(tǒng)計(jì)年鑒公布的數(shù)據(jù)基本相符。2004年GDP季度數(shù)據(jù)有缺失,經(jīng)查閱相關(guān)統(tǒng)計(jì)年鑒補(bǔ)充了部分?jǐn)?shù)據(jù),對無法查閱到的缺失值采用線性插值的方法填補(bǔ)。
2.變量選取和數(shù)據(jù)處理 本研究對區(qū)域的劃分參照國家統(tǒng)計(jì)局經(jīng)濟(jì)區(qū)域的劃分方法[9]。實(shí)際操作中東部和西部地區(qū)包括省份較多,不能有效提取出共同因子。根據(jù)地理位置,東部和西部地區(qū)均被進(jìn)一步分成南方和北方兩部分。DFM要求納入的觀測變量有平穩(wěn)性,經(jīng)單位根檢驗(yàn),在α=0.05水準(zhǔn)下各省肺結(jié)核月發(fā)病率時(shí)間序列均有平穩(wěn)性(限于篇幅,單位根檢驗(yàn)結(jié)果未展示)。所有發(fā)病率時(shí)間序列經(jīng)標(biāo)準(zhǔn)化處理以便估計(jì)因子值。
3.統(tǒng)計(jì)分析方法
(1)DFM分析 本研究采用Stata 14.0建立DFM。模型可表述如下:
yt=Pft+Qxt+ut
(1)
ft=Rwt+A1ft-1+…+A2ft-2+A1-pft-p+vt
(2)
ut=C1ut-1+C2ut-2+Ct-qu1-q+εt
(3)
式中,yt是觀測到的n個(gè)發(fā)病率時(shí)間序列;ft是不可觀測的共同因子,即這n個(gè)序列的共同趨勢,P是共同因子載荷矩陣;ut是特殊因子;ft和ut分別有p和q階自回歸結(jié)構(gòu),自回歸參數(shù)矩陣分別是Ai和Ci,νt和εt是自回歸方程的擾動(dòng)向量;xt和wt是可能納入方程的外生變量,Qi和Ri是外生變量參數(shù)矩陣。
本研究用Stata 14.0建立DFM,對每組觀測變量提取一個(gè)共同因子,檢驗(yàn)水準(zhǔn)α=0.05。共同因子和特殊因子的自回歸階數(shù)根據(jù)貝葉斯信息準(zhǔn)則(BIC)估計(jì)。
(2)共同因子與人均GDP的滯后相關(guān)分析 根據(jù)各省市2004-2015年GDP季度值,經(jīng)計(jì)算得到各地區(qū)近似人均月度GDP時(shí)間序列數(shù)據(jù)(以季度值除以3作為該季度各月的近似值)。用SPSS 23.0對各地區(qū)的共同因子和人均月度GDP作滯后相關(guān)分析以確定人均GDP對肺結(jié)核發(fā)病率趨勢影響的滯后期數(shù)(每一個(gè)月為一期),滯后相關(guān)分析的統(tǒng)計(jì)量選擇Spearman秩相關(guān)系數(shù)。
(3)共同因子與人均GDP的回歸分析 分別以各地區(qū)相應(yīng)滯后期的人均月度GDP為自變量,以發(fā)病率共同因子估計(jì)值為因變量做線性回歸分析。回歸分析用SPSS 23.0完成。excel和網(wǎng)絡(luò)繪圖平臺被用于本文圖形的繪制。
1.肺結(jié)核發(fā)病率 2004-2015年全國共報(bào)告肺結(jié)核12345871例,年均發(fā)病率為77.11/10萬,發(fā)病率隨時(shí)間呈下降的趨勢。肺結(jié)核在春夏季節(jié)發(fā)病較多,發(fā)病率存在一定地區(qū)差異。
2004-2015年間肺結(jié)核年均發(fā)病率(1/10萬)最高的三個(gè)省份是新疆(178.65)、貴州(146.60)和海南(116.58)。發(fā)病率較高的省份多分布在西部以及中部經(jīng)濟(jì)區(qū)域,東部區(qū)域省份的發(fā)病率一般相對較低,低于全國的平均發(fā)病水平。
2.動(dòng)態(tài)因子提取結(jié)果 把全國分成六個(gè)區(qū)域,以各地區(qū)所有省份的月發(fā)病率序列為觀測變量,分別對每個(gè)地區(qū)各提取一個(gè)發(fā)病率共同因子。以中部地區(qū)六省為例,根據(jù)BIC信息準(zhǔn)則和模型估計(jì)效果,發(fā)病率共同因子自回歸階數(shù)取2,特殊因子自回歸階數(shù)取1。對DFM的檢驗(yàn)以及模型參數(shù)估計(jì)的檢驗(yàn),P<0.05(表1),可認(rèn)為該模型建立效果較好。模型參數(shù)估計(jì)完成后進(jìn)一步得到各區(qū)域共同因子估計(jì)值,各地區(qū)發(fā)病率共同因子變化趨勢見圖1。
表1 2004-2015年中部地區(qū)肺結(jié)核發(fā)病率動(dòng)態(tài)因子模型參數(shù)估計(jì)及檢驗(yàn)結(jié)果
*:A1,共同因子一階自回歸系數(shù);A2,共同因子二階自回歸系數(shù);P,共同因子載荷;C1,特殊因子一階自回歸系數(shù);*參數(shù)檢驗(yàn)P<0.05
本研究中所提取的共同因子可反映出各地區(qū)肺結(jié)核發(fā)病率變化的共同趨勢。由圖1看,各地區(qū)共同因子都隨時(shí)間呈下降趨勢,中部、西部北方和東北地區(qū)發(fā)病率波動(dòng)最為明顯,發(fā)病趨勢降低最快;東部的南方和北方地區(qū)發(fā)病趨勢變化相似,且相對平穩(wěn),南方地區(qū)發(fā)病率在2009年降低明顯,而北方地區(qū)則是持續(xù)緩慢下降;西部南方地區(qū)的發(fā)病趨勢最平穩(wěn),下降不明顯。
圖1 2004-2015年各地區(qū)肺結(jié)核發(fā)病率共同因子估計(jì)值變化趨勢
共同因子的波動(dòng)提示肺結(jié)核發(fā)病有明顯季節(jié)特征,且波動(dòng)幅度在逐年減小。各地區(qū)發(fā)病率共同因子波動(dòng)過程中出現(xiàn)峰值的時(shí)刻略有差異,西部南方地區(qū)發(fā)病率的峰值一般略早于其他地區(qū)出現(xiàn)。
3.各地區(qū)人均月度GDP與動(dòng)態(tài)因子的關(guān)系 各地區(qū)人均GDP逐年升高,東部的南方和北方地區(qū)人均GDP水平最高,東北地區(qū)緊隨其后,西部南方地區(qū)最低,其次是中部地區(qū)。
(1)相關(guān)性分析 對2004-2015年各地區(qū)共同因子估計(jì)值和相應(yīng)的人均月度GDP作滯后相關(guān)分析。結(jié)果顯示,人均月度GDP相對于發(fā)病率共同因子有一定滯后性,中部和東部南方地區(qū)的人均GDP對發(fā)病率共同因子的影響滯后二期,東部北方滯后三期,西部南方、西部北方和東北地區(qū)滯后一期。各地區(qū)發(fā)病率共同因子與人均月度GDP均呈較強(qiáng)負(fù)相關(guān)(表2)。
表2 人均月度GDP與肺結(jié)核發(fā)病率共同因子的滯后相關(guān)分析結(jié)果
*:該滯后期自變量與因變量相關(guān)系數(shù)首次出現(xiàn)最大值,即自變量相對因變量的滯后期
(2)線性回歸分析 觀察散點(diǎn)圖發(fā)現(xiàn)各共同因子估計(jì)值與人均月度GDP相應(yīng)滯后期呈較明顯的線性關(guān)系。以人均月度GDP(千元)的相應(yīng)滯后期時(shí)間序列為自變量,所提取動(dòng)態(tài)因子為因變量做線性回歸分析,進(jìn)一步觀察肺結(jié)核發(fā)病率共同趨勢與經(jīng)濟(jì)因素的關(guān)系?;貧w分析結(jié)果顯示,地區(qū)人均月度GDP每增加1千元,中部地區(qū)肺結(jié)核發(fā)病率(1/10萬)減少68.8%,東部南方地區(qū)減少34.4%,東部北方地區(qū)減少32.5%,西部南方地區(qū)減少14.9%,西部北方地區(qū)減少75.2%,東北地區(qū)減少45.3%(表3)。
表3 各地區(qū)人均月度GDP(千元)及其與肺結(jié)核發(fā)病率共同因子的回歸分析結(jié)果
*:參數(shù)檢驗(yàn)P<0.05
從共同因子看,各地區(qū)肺結(jié)核總體發(fā)病率隨時(shí)間呈下降趨勢,但不同地區(qū)下降速度有差異。這可能和不同地區(qū)的發(fā)病率水平以及經(jīng)濟(jì)發(fā)展速度等因素有關(guān)。西部南方地區(qū)各省份的肺結(jié)核發(fā)病率處于很高水平,但發(fā)病趨勢卻下降不明顯,加強(qiáng)該地區(qū)肺結(jié)核的防控對降低全國發(fā)病水平具有較大意義。
人均GDP水平對肺結(jié)核發(fā)病率有一定影響[10-11]。本次研究發(fā)現(xiàn)地區(qū)人均GDP和發(fā)病率共同因子呈負(fù)相關(guān),這得到先前研究的支持[10-11]。人均GDP對我國中部、東部、東北和西部北方地區(qū)肺結(jié)核的發(fā)病率影響較大。加速這些地區(qū)的經(jīng)濟(jì)發(fā)展,可充分發(fā)揮經(jīng)濟(jì)因素在肺結(jié)核防控工作中的作用。西部南方地區(qū)人均GDP對肺結(jié)核發(fā)病率的影響較小,這可能由于防控措施不當(dāng),收益較低也可能是該地區(qū)對肺結(jié)核防控的經(jīng)濟(jì)投入相對較少。研究發(fā)現(xiàn),用于肺結(jié)核社會保障的資金占GDP的比例每增加1%,肺結(jié)核發(fā)病率可減少8.16/10萬[12]。對于該地區(qū),在加快經(jīng)濟(jì)發(fā)展的同時(shí)需加大對肺結(jié)核防控工作的資源投入,并多關(guān)注非經(jīng)濟(jì)因素對肺結(jié)核發(fā)病水平的影響[10,13-14]。
關(guān)于肺結(jié)核發(fā)病情況的研究內(nèi)容多側(cè)重于發(fā)病水平的差異[6]。本研究考慮到臨近地區(qū)肺結(jié)核發(fā)病的相關(guān)性,用DFM提取了有代表性的綜合指標(biāo)。前期研究用該方法對我國乙類傳染病發(fā)病率提取了共同因子[8]。所提取的共同因子可作為反向預(yù)測模型中的各觀測變量的基礎(chǔ),也可作為獨(dú)立的變量納入到其他分析方法中。本次研究以前期研究為參考,把提取的共同因子作為新變量進(jìn)一步分析經(jīng)濟(jì)因素對其影響情況,在DFM的應(yīng)用方面做了更深的拓展。此外,本研究還考慮到了影響因素作用的滯后性,采用滯后相關(guān)分析方法確定滯后時(shí)長,以影響因素的滯后期為自變量進(jìn)行回歸分析,結(jié)果更有科學(xué)性。希望本次研究能夠?qū)Ψ谓Y(jié)核的分析方法以及防控措施提供一定參考價(jià)值。