曹丙艷
山東第一醫(yī)科大學(xué)第二附屬醫(yī)院,271000 山東 泰安
手術(shù)量是醫(yī)院業(yè)務(wù)工作量的一項(xiàng)重要統(tǒng)計(jì)指標(biāo),它不僅反映就醫(yī)群眾對(duì)醫(yī)院醫(yī)療技術(shù)水平和醫(yī)療服務(wù)的認(rèn)可,同時(shí)也是體現(xiàn)醫(yī)務(wù)人員勞動(dòng)價(jià)值的重要指標(biāo)。對(duì)手術(shù)量進(jìn)行科學(xué)準(zhǔn)確的統(tǒng)計(jì)預(yù)測(cè),可以幫助醫(yī)院和臨床科室提前做好醫(yī)療資源配置,提升工作效率,還可為醫(yī)院管理者制定臨床科室下一年目標(biāo)值提供參考依據(jù)。本研究運(yùn)用某醫(yī)院2016年1月至2021年12月手術(shù)量資料,基于R語(yǔ)言自回歸移動(dòng)平均乘積季節(jié)模型(auto-regressive integrated moving average,ARIMA)[1]選擇最優(yōu)模型,進(jìn)行手術(shù)量短期預(yù)測(cè)。
數(shù)據(jù)來(lái)源于某醫(yī)院統(tǒng)計(jì)管理信息系統(tǒng),從系統(tǒng)導(dǎo)出2016年1月至2021年12月手術(shù)量統(tǒng)計(jì)報(bào)表。2016年1月至2020年12月手術(shù)量用R 4.1.3軟件進(jìn)行ARIMA乘積季節(jié)模型建模,用2021年1月至12月手術(shù)量評(píng)價(jià)模型預(yù)測(cè)效能,外推預(yù)測(cè)2022年上半年的手術(shù)量。
本研究運(yùn)用ARIMA(p,d,q)(P,D,Q)s模型建立手術(shù)量的數(shù)學(xué)模型。其中,p、d、q分別為自回歸階數(shù)、非季節(jié)差分階數(shù)、移動(dòng)平均階數(shù);P、D、Q分別代表季節(jié)自回歸階數(shù)、季節(jié)差分階數(shù)、季節(jié)性移動(dòng)平均階數(shù);s為周期[2]。
ARIMA模型建模的基本步驟[3-6]:
1)時(shí)間序列的平穩(wěn)化。先對(duì)原始數(shù)據(jù)制作時(shí)序圖、月度圖觀察數(shù)據(jù)變化規(guī)律,繪制自相關(guān)圖(autocorrelations function,ACF)、偏自相關(guān)圖(partial autocorrelations function,PACF),用adf.test()函數(shù)驗(yàn)證有無(wú)單位根。如果數(shù)據(jù)存在趨勢(shì)性和季節(jié)性,對(duì)數(shù)據(jù)進(jìn)行趨勢(shì)差分、周期性差分,將數(shù)據(jù)轉(zhuǎn)換為無(wú)長(zhǎng)期趨勢(shì)性和周期性的平穩(wěn)序列。
2)模型識(shí)別。對(duì)平穩(wěn)后的數(shù)據(jù),繪制ACF圖和PACF圖,根據(jù)其截尾或拖尾的情況識(shí)別模型中p、q、P、Q的數(shù)值,擬合1個(gè)或多個(gè)ARIMA模型,用R 4.1.3軟件中auto.arima()函數(shù)自動(dòng)選取AIC和BIC最小模型,與ACF圖和PACF圖建立的模型進(jìn)行比較。
3)參數(shù)估計(jì)和模型診斷。對(duì)模型殘差進(jìn)行Ljung-Box殘差白噪聲檢驗(yàn)(L-B檢驗(yàn)),以判斷模型中的信息提取是否充分,再通過(guò)比對(duì)備選模型的池赤信息準(zhǔn)則(Akaike information criteri-on,AIC)值,在所有通過(guò)檢驗(yàn)的模型中,依據(jù)AIC函數(shù)達(dá)到最小的模型為相對(duì)最優(yōu)模型。
4)模型驗(yàn)證及預(yù)測(cè)。利用選出的最優(yōu)模型進(jìn)行驗(yàn)證并預(yù)測(cè),將2021年手術(shù)量的實(shí)際值和預(yù)測(cè)值進(jìn)行比較,使用平均相對(duì)誤差(mean absolute percent error,MAPE)評(píng)價(jià)模型的準(zhǔn)確性,并預(yù)測(cè)2022年上半年手術(shù)量。
2016—2021年醫(yī)院手術(shù)量呈明顯上升趨勢(shì),且呈現(xiàn)季節(jié)性,說(shuō)明時(shí)間序列不平穩(wěn)。每年的2月是醫(yī)院手術(shù)量低谷時(shí)期,每年的7月、8月是醫(yī)院手術(shù)量高峰時(shí)期,且2020年2月手術(shù)量低于2016年以來(lái)歷年同期水平。見(jiàn)圖1、圖2。運(yùn)用R 4.1.3軟件中ndiffs()函數(shù)進(jìn)行差分判斷后,用diff()函數(shù)對(duì)原始數(shù)據(jù)進(jìn)行一階差分,消除時(shí)間序列的趨勢(shì)和季節(jié)影響,使用tseries包中的adf.test()函數(shù)檢驗(yàn)(P=0.01),由此可知差分后數(shù)據(jù)滿足平穩(wěn)性要求。
圖1 2016—2021年手術(shù)量月度情況
圖2 2016—2021年手術(shù)量時(shí)序分解圖
經(jīng)過(guò)一次一階差分后ACF圖和PACF圖見(jiàn)圖3。根據(jù)一次一階差分后的自相關(guān)圖得知,自相關(guān)系數(shù)一階截尾,q=1,偏自相關(guān)2階后減為0;從周期來(lái)看,ACF一階后減為0,PACF一階后截尾,P=1,初步確定模型中ARIMA(p,1,1)(1,1,Q),p的備選參數(shù)0,1,2,Q的備選參數(shù)0,1。用R 4.1.3軟件auto.arima()函數(shù)自選模型是ARIMA(3,1,0)(1,0,0)12。
圖3 一階差分后的分析圖
用arima()函數(shù)對(duì)ARIMA(p,1,1)(1,1,Q)中p的備選參數(shù)0,1,2,Q的備選參數(shù)0,1由低到高逐個(gè)測(cè)試,P值有意義的模型是ARIMA(1,1,1)(1,1,0)12,ARIMA(0,1,1)(1,1,0)12,把測(cè)試后的模型和R軟件自選模型ARIMA(3,1,0)(1,0,0)12用box.test()函數(shù)進(jìn)行Ljung-Box殘差白噪聲檢驗(yàn),以AIC最小作為依據(jù)確定最優(yōu)模型。見(jiàn)表1。
表1 模型確定信息情況
用forecast()函數(shù)對(duì)ARIMA(1,1,1)(1,1,0)12模型進(jìn)行2021年1月至12月手術(shù)量預(yù)測(cè),平均相對(duì)誤差是7.71%。手術(shù)量實(shí)際值除2月、3月外,其他月份全落在了95%置信區(qū)間內(nèi),說(shuō)明模型預(yù)測(cè)效果良好,見(jiàn)表2、圖4。用ARIMA(1,1,1)(1,1,0)12模型預(yù)測(cè)2022年上半年的手術(shù)量,2022年上半年手術(shù)量繼續(xù)增長(zhǎng),見(jiàn)表3、圖4。
表3 2022年某醫(yī)院上半年手術(shù)量預(yù)測(cè)值
圖4 某醫(yī)院手術(shù)量預(yù)測(cè)圖
表2 2021年某醫(yī)院手術(shù)量實(shí)際值與真實(shí)值比較
通過(guò)數(shù)據(jù)分析可知,某院手術(shù)量呈明顯上升趨勢(shì)且呈現(xiàn)季節(jié)性,每年的2月手術(shù)量最少,7月、8月手術(shù)量最多。主要原因是2月一般恰逢春節(jié),受習(xí)俗的影響,只要不是危、急、重患者,一般等過(guò)了春節(jié)就醫(yī);7月、8月手術(shù)量多,主要原因是學(xué)生在放假期間,小兒外科、口腔科、眼科手術(shù)病人數(shù)量相對(duì)增加。醫(yī)院管理者應(yīng)結(jié)合手術(shù)量實(shí)際情況,在手術(shù)量低谷時(shí)期,組織科室人員進(jìn)行業(yè)務(wù)學(xué)習(xí),外派進(jìn)修人員學(xué)習(xí)先進(jìn)醫(yī)療技術(shù);在手術(shù)量高峰時(shí)期,要加大醫(yī)療資源的投入,適當(dāng)增加相關(guān)科室的醫(yī)務(wù)人員數(shù)量,保證手術(shù)能夠安全高效地進(jìn)行。
本研究運(yùn)用R語(yǔ)言軟件,利用2016年1月至2020年12月手術(shù)量建立ARIMA(1,1,1)(1,1,0)12模型,用該模型對(duì)2021年1月至12月手術(shù)量進(jìn)行預(yù)測(cè),手術(shù)量的實(shí)際值與預(yù)測(cè)值的平均相對(duì)誤差7.71%,說(shuō)明預(yù)測(cè)結(jié)果良好,可以用于外推預(yù)測(cè)。但2021年2月、3月實(shí)際值超出了95%置信區(qū)間,由于2020年2月、3月受新冠肺炎疫情影響嚴(yán)重,手術(shù)量低于歷史前期水平,出現(xiàn)模型預(yù)測(cè)時(shí)預(yù)測(cè)值偏小的情況。
ARIMA模型是將多種因素的綜合效應(yīng)蘊(yùn)含于時(shí)間變量之中,不用考慮影響預(yù)測(cè)變量的相關(guān)因素,通過(guò)對(duì)模型反復(fù)識(shí)別和修正達(dá)到最滿意的預(yù)測(cè)模型[7]。ARIMA模型預(yù)測(cè),只適合短期預(yù)測(cè),不能進(jìn)行長(zhǎng)期預(yù)測(cè);要繼續(xù)進(jìn)行后期預(yù)測(cè),需要不斷地更新數(shù)據(jù),用添加后的數(shù)據(jù)不斷地修正或重新建立預(yù)測(cè)模型,才能得到更好的預(yù)測(cè)結(jié)果。
統(tǒng)計(jì)預(yù)測(cè)是現(xiàn)代醫(yī)院管理的一種科學(xué)手段和方法,ARIMA模型不僅可以用于預(yù)測(cè),還可以用于目標(biāo)值的制定。選擇適合自己醫(yī)院的統(tǒng)計(jì)預(yù)測(cè)模型,可以為醫(yī)院合理配置資源,提高工作效率,提升服務(wù)質(zhì)量,還可以為醫(yī)院管理者進(jìn)行更好的管理和決策提供有利依據(jù)[8]。
中國(guó)醫(yī)院統(tǒng)計(jì)2022年3期