廣東省衛(wèi)生健康委政務(wù)服務(wù)中心(510006) 黃曉亮 謝易嫻
【提 要】 目的 建立廣東省住院人次時(shí)間序列預(yù)測(cè)模型,評(píng)估新冠疫情對(duì)2020年廣東省住院量的影響。方法 采集廣東省衛(wèi)生健康信息網(wǎng)絡(luò)直報(bào)系統(tǒng)2010-2020年住院人次月度數(shù)據(jù),采用時(shí)序圖描述住院量的時(shí)間分布情況,采用指數(shù)平滑法、ARIMA模型對(duì)2010-2018年住院人次月度數(shù)據(jù)進(jìn)行模型擬合,根據(jù)2019年實(shí)測(cè)數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的比較評(píng)價(jià)模型預(yù)測(cè)效果,并結(jié)合模型擬合參數(shù)選出最優(yōu)模型預(yù)測(cè)2020年住院人次,分析此次新冠疫情對(duì)2020年住院人次的影響。結(jié)果 廣東省住院人次表現(xiàn)為季節(jié)依存性,呈現(xiàn)7-8月波峰,1-2月波谷的周期趨勢(shì),指數(shù)平滑法winter相乘模型擬合效果最優(yōu),決定系數(shù)R2為 0.970。2019年的預(yù)測(cè)值平均相對(duì)誤差為2.98%。受疫情影響,2020年全省實(shí)際住院1567.5萬(wàn)人次,比預(yù)測(cè)值低16.6%。結(jié)論 季節(jié)指數(shù)平滑winter相乘模型較好地?cái)M合了廣東省住院人次變化趨勢(shì),受新冠疫情影響,廣東省 2020年住院人次近十年首次負(fù)增長(zhǎng)。
住院人次是衡量醫(yī)院工作量的重要指標(biāo),也是醫(yī)院發(fā)展的基礎(chǔ)[1],統(tǒng)計(jì)預(yù)測(cè)在醫(yī)院管理工作中發(fā)揮著重要的作用[2]。時(shí)間序列模型是根據(jù)數(shù)據(jù)資料所呈現(xiàn)的季節(jié)變動(dòng)規(guī)律和長(zhǎng)期趨勢(shì),對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行分析和總結(jié),以預(yù)測(cè)未來(lái)變化趨勢(shì)[3]。目前,國(guó)內(nèi)對(duì)住院人次的統(tǒng)計(jì)預(yù)測(cè)僅限于單個(gè)模型預(yù)測(cè)[4-6],樣本量小,未對(duì)各模型擬合結(jié)果進(jìn)行比較。常見(jiàn)的模型有指數(shù)平滑簡(jiǎn)單季節(jié)模型、Holt-Winter模型、Winter相加模型、Winter相乘模型、ARIMA模型等[7]。本文旨在通過(guò)對(duì)比分析各模型對(duì)廣東省近十年住院人次的擬合情況,找出最佳模型,并通過(guò)對(duì)比2020年廣東省住院人次的模型預(yù)測(cè)值與實(shí)際值,分析新冠疫情對(duì)住院人次的影響。
根據(jù)《全國(guó)衛(wèi)生資源與醫(yī)療服務(wù)統(tǒng)計(jì)調(diào)查制度》,通過(guò)廣東省衛(wèi)生健康統(tǒng)計(jì)信息網(wǎng)絡(luò)直報(bào)平臺(tái),采集2010-2020年全省醫(yī)療衛(wèi)生機(jī)構(gòu)月報(bào)(衛(wèi)健統(tǒng)1-8表),納入住院人次指標(biāo)。所有上報(bào)數(shù)據(jù)經(jīng)過(guò)機(jī)構(gòu)自審,縣區(qū)-地市-省-國(guó)家四級(jí)衛(wèi)生健康統(tǒng)計(jì)部門(mén)審核把關(guān),并通過(guò)信息采集平臺(tái)的審核校驗(yàn),數(shù)據(jù)真實(shí)可靠。
本研究采用指數(shù)平滑法和ARIMA模型對(duì)廣東省住院人次進(jìn)行模型擬合,構(gòu)建住院人次的預(yù)測(cè)模型。
(1)指數(shù)平滑法
指數(shù)平滑法認(rèn)為時(shí)間間隔會(huì)對(duì)時(shí)間序列發(fā)展趨勢(shì)造成影響,間隔增大,各期權(quán)重呈指數(shù)衰減[8]。首先建立趨勢(shì)直線作為初始逼近,然后用指數(shù)平滑法修正趨勢(shì)直線,最后引進(jìn)季節(jié)調(diào)整因子得到未來(lái)水平的預(yù)測(cè)值,適用于兼有線性趨勢(shì)和季節(jié)變動(dòng)的短期預(yù)測(cè)[9]。本研究納入Winter相加模型和Winter相乘模型。
(2)ARIMA模型
ARIMA模型能綜合考慮序列的趨勢(shì)變化、周期變化及隨機(jī)干擾,其結(jié)構(gòu)為ARIMA(p,d,q)(P,D,Q)s,其中,p、d、q和P、D、Q分別為非季節(jié)性和季節(jié)性自回歸(AR)、差分(I)、移動(dòng)平均(MA)的階數(shù),s為季節(jié)周期[10]。通過(guò)觀察原始時(shí)間序列圖是否需要數(shù)據(jù)轉(zhuǎn)換或差分,以使該序列滿足零均值且方差不隨時(shí)間變化的平穩(wěn)序列,根據(jù)差分次數(shù)確定d和D,通過(guò)觀察新序列的自相關(guān)系數(shù)(ACF)圖和偏自相關(guān)系數(shù)(PACF)圖對(duì)目標(biāo)序列定階[11],擬合優(yōu)度檢驗(yàn)得到包括方差、對(duì)數(shù)似然函數(shù)值、赤池信息準(zhǔn)則(AIC)、貝葉斯信息準(zhǔn)則(BIC)等參數(shù),選用參數(shù)有統(tǒng)計(jì)意義、對(duì)數(shù)似然函數(shù)值較大、而AIC、BIC較小的預(yù)測(cè)模型,并通過(guò)模型殘差的白噪聲檢驗(yàn)作為最終模型判定依據(jù);本研究最終擬合最優(yōu)ARIMA模型為ARIMA(0,0,0)(0,1,1)12。
模型中的R2表示模型所能解釋的數(shù)據(jù)變異占總變異的比例;Ljung-Box(18)檢驗(yàn)是對(duì)模型中殘差錯(cuò)誤的隨機(jī)檢驗(yàn),表示指定模型是否正確,顯著性P小于0.05表示殘差誤差不是隨機(jī)的,所觀測(cè)的序列中存在模型無(wú)法解釋的結(jié)構(gòu)。最優(yōu)預(yù)測(cè)模型選擇依據(jù)為:Ljung-Box(18)檢驗(yàn)結(jié)果不顯著、R2值最大、均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)、貝葉斯信息準(zhǔn)則(BIC)、平均預(yù)測(cè)相對(duì)誤差最小[1,9,12]。
采用SPSS 22.0建立數(shù)據(jù)庫(kù),運(yùn)用時(shí)間序列建模器進(jìn)行擬合預(yù)測(cè)模型,檢驗(yàn)水準(zhǔn)α=0.05。
2013-2019年廣東省醫(yī)療衛(wèi)生機(jī)構(gòu)住院人次呈現(xiàn)長(zhǎng)期上升的趨勢(shì),并以年為單位呈現(xiàn)周期波動(dòng),波谷出現(xiàn)在每年的第一季度,波峰出現(xiàn)在第三季度,呈現(xiàn)明顯的季節(jié)性特征,見(jiàn)圖1。
圖1 廣東省2013-2019年住院人次時(shí)間序列圖
采用三個(gè)模型對(duì)2010-2018年廣東省醫(yī)療機(jī)構(gòu)月度住院人次進(jìn)行擬合。結(jié)果顯示:三模型R2均在0.94以上,指數(shù)平滑法中季節(jié)性Winter相乘模型的均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)、標(biāo)化BIC最小,且R2最大,綜合比較各項(xiàng)統(tǒng)計(jì)量提示,該模型較適用于廣東省月度住院人次模型預(yù)測(cè),見(jiàn)表1。
表1 時(shí)間序列分析的三種模型擬合統(tǒng)計(jì)量
為驗(yàn)證預(yù)測(cè)效果,以2019年1-12月各月預(yù)測(cè)數(shù)值為例,利用模型擬合所得的預(yù)測(cè)值與實(shí)際值比較,分別計(jì)算相對(duì)誤差和平均相對(duì)誤差來(lái)驗(yàn)證預(yù)測(cè)效果。結(jié)果顯示,指數(shù)平滑法Winter相加模型、Winter相乘模型、ARIMA模型平均相對(duì)誤差分別為3.42%、2.98%、3.11%,Winter相乘模型平均相對(duì)誤差最小,預(yù)測(cè)值與實(shí)際值差別不大,見(jiàn)表2。
表2 時(shí)間序列分析的三種模型預(yù)測(cè)值誤差(%)
綜合比較各模型擬合情況和預(yù)測(cè)結(jié)果,選取指數(shù)平滑法Winter相乘模型擬合2010-2019年廣東省住院人次,并對(duì)2020年的數(shù)據(jù)進(jìn)行預(yù)測(cè)。結(jié)果顯示,2010-2019年,觀測(cè)值與預(yù)測(cè)值數(shù)據(jù)擬合效果佳,平均相對(duì)誤差小,模型較好地描述了數(shù)據(jù)的長(zhǎng)期遞增趨勢(shì)和季節(jié)周期規(guī)律,見(jiàn)圖2。
圖2 廣東省2010-2021年住院人次觀測(cè)值與模型預(yù)測(cè)圖
根據(jù)指數(shù)平滑法Winter相乘模型預(yù)測(cè)2020年住院人次。結(jié)果顯示,2020年住院人次預(yù)測(cè)值為1878.7萬(wàn)人次,實(shí)際住院人次為1567.5萬(wàn)人次,實(shí)際值與預(yù)測(cè)值相差311.2萬(wàn)人次,實(shí)際值較預(yù)測(cè)值減少16.6%。
從月度分析來(lái)看,2020年1-8月住院人次實(shí)際值低于預(yù)測(cè)水平,9月-12月逐步恢復(fù)正常住院量水平。新冠肺炎疫情對(duì)廣東省住院人次的影響主要集中在前8個(gè)月,后3個(gè)月逐步恢復(fù)正常,見(jiàn)圖3。
圖3 2020年廣東省住院人次實(shí)際觀測(cè)值與Winter相乘法模型預(yù)測(cè)值比較
時(shí)間序列預(yù)測(cè)模型種類多,各模型具有自身的優(yōu)勢(shì)和不足,依據(jù)研究數(shù)據(jù)的特征,選擇合適的方法,對(duì)于實(shí)現(xiàn)可靠、精準(zhǔn)的預(yù)測(cè)具有重要的意義。本研究三個(gè)模型預(yù)測(cè)的平均相對(duì)誤差均在5%以內(nèi),表明模型擬合效果好,預(yù)測(cè)值能準(zhǔn)確地反映真實(shí)值。綜合比較各模型的擬合參數(shù),Winter相乘模型的R2值最大、均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)、貝葉斯信息準(zhǔn)則(BIC)最小,擬合效果最優(yōu),這與相關(guān)研究結(jié)果一致[6,8-9]。在醫(yī)療衛(wèi)生服務(wù)的統(tǒng)計(jì)預(yù)測(cè)中,指數(shù)平滑法的Winter相加、Winter相乘和ARIMA模型是較為常用的模型,部分研究表明,ARIMA模型能夠考慮季節(jié)效應(yīng)、隨機(jī)波動(dòng)效應(yīng)等因素,從而能較好地應(yīng)用于醫(yī)院業(yè)務(wù)管理預(yù)測(cè)[1,11,13],但亦存在計(jì)算方法復(fù)雜,序列數(shù)據(jù)較少導(dǎo)致擬合效果差,只適用于短期預(yù)測(cè)等問(wèn)題[1]。而季節(jié)性指數(shù)平滑法作為指數(shù)平滑法的一種高級(jí)形式,其方法簡(jiǎn)便,具有遞推性質(zhì),適用范圍廣,充分使用歷史資料信息等優(yōu)勢(shì),因此在統(tǒng)計(jì)預(yù)測(cè)領(lǐng)域中應(yīng)用廣泛[4,9,12]。對(duì)于預(yù)測(cè)住院人次的最佳模型選擇,各研究者的結(jié)果尚存在差異[4-5]。本研究認(rèn)為,住院人次的數(shù)據(jù)擬合結(jié)果取決于數(shù)據(jù)本身的特性,要根據(jù)數(shù)據(jù)特征和實(shí)際擬合結(jié)果進(jìn)行最優(yōu)預(yù)測(cè)模型的選擇。
2010年-2019年廣東省住院人次總體呈逐年穩(wěn)步增長(zhǎng)的態(tài)勢(shì),住院人次的月度變化特點(diǎn)為:各月住院人次中7月份門(mén)診人次平均值最高,月平均值為127.5萬(wàn)人次;其次為8月,月平均值為126.1萬(wàn)人次;最低月份是2月份,月平均值為86.9萬(wàn)人次,出現(xiàn)波底的原因可能是2月受春節(jié)假日影響,患者不愿意就醫(yī),導(dǎo)致住院量較少[8,14]。住院人次的季節(jié)變化特點(diǎn)為:4個(gè)季度中第一季度呈現(xiàn)最低谷,第二季度緩慢上升,第三季度波峰,第四季度緩慢回落的總體趨勢(shì),住院人次的周期波動(dòng)與其他研究具有相似的趨勢(shì)[1,2,7,15-16]。
受新冠疫情的影響,全國(guó)各地的醫(yī)療衛(wèi)生機(jī)構(gòu)總診療量和住院量出現(xiàn)不同幅度的下降,據(jù)國(guó)家衛(wèi)生健康委統(tǒng)計(jì)信息中心數(shù)據(jù)顯示,2020年1-11月全國(guó)醫(yī)療衛(wèi)生機(jī)構(gòu)出院人次同比下降10.7%,其中醫(yī)院下降10.1%,基層醫(yī)療衛(wèi)生機(jī)構(gòu)同比下降13.0%。但統(tǒng)計(jì)描述結(jié)果是與2019年的基期數(shù)進(jìn)行比較,未考慮住院人次的年增長(zhǎng)趨勢(shì)。目前,尚未有研究能夠定量地分析新冠疫情對(duì)2020年住院人次的實(shí)際影響程度。本研究采用Winter相乘模型對(duì)廣東省2020年住院量進(jìn)行預(yù)測(cè),結(jié)果顯示,2020年廣東省住院人次的預(yù)測(cè)值為1878.7萬(wàn)人次,預(yù)估平均相對(duì)誤差在2.98%以內(nèi),數(shù)據(jù)能真實(shí)反映實(shí)際住院人次情況。廣東省2020年實(shí)際住院人次為1567.5萬(wàn)人次,住院量比預(yù)測(cè)值下降311.2萬(wàn)人次,較預(yù)測(cè)值減少16.6%。受疫情影響,廣東省醫(yī)療衛(wèi)生機(jī)構(gòu)的住院人次出現(xiàn)近十年的首次負(fù)增長(zhǎng)。
通過(guò)分析2020年住院量月度數(shù)據(jù)發(fā)現(xiàn),住院量的下降與疫情防控局勢(shì)相關(guān)。2020年1月23日,廣東省新冠疫情防控工作領(lǐng)導(dǎo)小組決定啟動(dòng)重大突發(fā)公共衛(wèi)生事件一級(jí)響應(yīng),防控局勢(shì)嚴(yán)峻,倡導(dǎo)居民非必要不外出,2月住院量出現(xiàn)大幅度下降。2月24日,省內(nèi)疫情得到較好的遏制,廣東省新冠疫情應(yīng)對(duì)級(jí)別調(diào)整為二級(jí)響應(yīng),廣東省住院量開(kāi)始轉(zhuǎn)折并逐步回升,4-8月隨著常態(tài)化疫情防控措施的落實(shí),我省社會(huì)經(jīng)濟(jì)生活逐步恢復(fù)正常,居民醫(yī)療服務(wù)需求得到釋放,廣東省住院量快速回升,9月后,住院量基本恢復(fù)正常水平。這與疫情防控取得階段性成果的實(shí)際情況相符。
科學(xué)掌握住院人次的變動(dòng)規(guī)律,有利于醫(yī)院制定工作計(jì)劃和為決策管理提供科學(xué)依據(jù),進(jìn)而最大限度地滿足人民群眾的醫(yī)療衛(wèi)生服務(wù)需求,提高醫(yī)院的社會(huì)效益和經(jīng)濟(jì)效益。本研究通過(guò)對(duì)比分析四種模型擬合效果,發(fā)現(xiàn)指數(shù)平滑法Winter相乘模型擬合效果最佳,進(jìn)一步通過(guò)模型預(yù)測(cè)2020年廣東省住院人次,定量分析了新冠疫情對(duì)廣東省住院量的影響,為評(píng)估新冠疫情對(duì)醫(yī)療衛(wèi)生服務(wù)的影響及程度提供了科學(xué)依據(jù)。
中國(guó)衛(wèi)生統(tǒng)計(jì)2021年3期