薛允蓮張晉昕
移動假日效應調整對春節(jié)影響月份的出院病例數預測效果研究*
薛允蓮1張晉昕2△
目的對比用原始出院人數序列預測的直接預測值與調整移動春節(jié)效應后序列的調整預測值對春節(jié)影響月份的預測效果。方法采用時間序列ARIMA模型進行預測研究。用移動假日效應調整方法進行出院人數移動春節(jié)效應的調整,并根據均值預測值和預測年份的調整差值計算得出調整預測值。結果兩次預測的預測模型相同,均為ARIMA(1,(1,12),1)模型。2013年2月調整預測的相對預測誤差為0.4%,其絕對值顯著小于實際預測的相對預測誤差(-13.58%)的絕對值。結論移動春節(jié)效應嚴重影響了春節(jié)效應月份的預測效果。調整移動春節(jié)效應后的調整預測值與實際值更為接近。
出院人數 移動假日效應 春節(jié) ARIMA模型 預測
出院人數是衡量醫(yī)院醫(yī)療業(yè)務量發(fā)展的重要指標之一,醫(yī)院統(tǒng)計的業(yè)務量指標均與出院人數有一定的關系。因此,在病床數不變的前提下,預測出院人數情況,能提示醫(yī)療科室未來某個時間段可能面臨的問題,以便院方及時采取措施,更好地為醫(yī)療和患者服務。由于每年的春節(jié)在1月和2月不同月份出現,移動春節(jié)效應會影響序列的預測效果。本文比較用出院人數原始序列預測的直接預測值與調整移動春節(jié)效應后序列的調整預測值對春節(jié)所處月份出院人數的預測效果。
一、研究對象
本次研究利用2007年1月至2012年12月廣州市某三甲醫(yī)院出院病人資料進行建模,利用2013年的出院病人數資料進行模型預測效果的評價。
二、研究方法
1.ARIMA模型
本文用ARIMA(auto regressive integrated moving average)模型進行模型擬合和預測。ARIMA模型,又稱求和自回歸移動平均模型,是進行時間序列分析的重要模型[1],能同時處理長期趨勢、季節(jié)性、周期性等固定效應和無法分解的隨機效應對預測的影響。用ARIMA模型進行預測的步驟如下。
(1)模型識別[2]
ARIMA模型的思想是將不平穩(wěn)序列轉為平穩(wěn)序列,然后采用ARMA模型進行建模。因此,平穩(wěn)性是序列建模的前提。若序列不滿足平穩(wěn)性,應將其轉為平穩(wěn)序列。差分是序列平穩(wěn)化的一個有效方法。通常一階差分用于去除趨勢性,針對月度序列的12階差分用于去除年度周期。通常可根據逆自相關函數圖判斷是否過差分。
(2)模型選擇[2]
①根據自相關函數(ACF)圖和偏自相關函數(PACF)圖初步選擇模型的階數;②根據所選模型階數進行ARIMA建模;③選取參數均有統(tǒng)計學意義、殘差序列為白噪聲、AIC和SBC最小的模型進行建模預測。
2.兩次預測
(1)原始出院人數預測
用原始出院病人數的月度序列進行提前12期的預測,稱該預測值為直接預測值;
(2)調整移動假日效應后預測
①先利用以春節(jié)為0點的逐日觀測值時序圖、配對t檢驗(將移動假日影響期間(1~3月)n年序列的某一天觀測值(共n個數據)與該年觀測值(除該影響期外)均值進行比較)等方法確定移動春節(jié)效應期[3];②用均值替代序列(年度均值替代效應期內出院人數)進行提前12期的預測,稱該預測值為均值預測值;③定義:調整差值=出院人數-調整均值??紤]到觀測值的變化趨勢,令預測年份的調整差值=2×預測年份前第一年的調整差值-預測年份前第二年的調整差值。調整預測值=均值預測值+預測年份的調整差值。調整預測值即為調整移動春節(jié)效應后的序列預測值。
3.預測效果比較
比較兩次預測的絕對預測誤差和相對預測誤差的大小。預測誤差越小,表明預測效果越好。絕對預測誤差=實際值-預測值,相對預測誤差=(絕對預測誤差/實際值)×100%。
三、統(tǒng)計軟件
采用SAS 9.1.3軟件進行ARIMA模型分析。
一、出院人數的直接預測
2007年1月至2012年12月的出院人數序列圖見圖1??梢娦蛄杏芯徛仙厔菀约澳甓戎芷谔卣鳌_M行1階差分和年度差分(即季節(jié)差分),差分后序列滿足零均值、平穩(wěn)的特點,見圖2。單位根檢驗結果認為無單位根,即序列平穩(wěn)。
圖1 2007年1月-2012年12月出院人數的時序圖
圖2 1階和12階差分后的時序圖
根據模型判定標準,經過多次嘗試,最終選擇AIC(856.7)和SBC(863.0)最小的ARIMA(1,(1,12),1)模型。模型預測效果見表1。2013年2月10日為春節(jié),移動春節(jié)效應僅影響2月份的出院人數。2月份預測誤差較大,相對預測誤差為-13.58%。
二、調整移動假日效應后的預測
由于移動春節(jié)效應影響預測效果,故調整移動假日效應后進行預測。圖3和圖4分別為2007-2012年1-3月出院人數的逐日觀測值時序圖和以春節(jié)為0點的逐日觀測值時序圖(春節(jié)前日期橫軸為負數,春節(jié)后日期橫軸為正數)。可見,春節(jié)對出院人數有頗為一致的影響。
根據圖3和配對t檢驗的結果,最終確定移動春節(jié)效應的范圍為春節(jié)前第5天至春節(jié)后第14天。將該范圍的出院人數用年度均值替代,并進行預測。圖5和圖6分別為2007年1月至2012年12月的調整后的出院人數(移動假日效應期內觀測值用均值替換)時序圖和平穩(wěn)化(1階差分和年度差分)后的序列圖。
圖3 2007-2012年1-3月出院人數的逐日觀測值時序圖
圖4 2007-2012年以春節(jié)為0點的逐日觀測值時序圖
經過多次嘗試,最終選擇AIC(797.8)和SBC(804.0)最小的ARIMA(1,(1,12),1)模型。2月份的均值預測值為4661,調整差值為-1112。故2013年2月的調整預測值=4661-1112=3549。調整預測值的預測效果見表1。可見,2013年2月份的調整預測誤差的絕對值明顯小于直接預測誤差的絕對值。
圖5 2007年1月-2012年12月均值替換出院人數的時序圖
圖6 1階和12階差分后的時序圖
表1 ARIMA模型預測效果
移動假日效應是指假日在各年出現的公歷日期不同,具體表現為以下兩個特征[3]:①假日前后序列測量的活動規(guī)律有上升或下降趨勢,②假日對某相鄰兩個月(公歷)的影響程度依賴于每年出現的不同日期。節(jié)假日在公歷日期上的“移動”最直接表現為各年某些月份(如春節(jié)影響到的1、2月份)觀測指標的不可比,甚至影響最終季節(jié)調整的效果[4]。Edward等[5]指出調整移動假日效應能提高序列的預測效果。
在我國,常見的移動假日有農歷春節(jié)(中國農歷正月初一)、元宵節(jié)(中國農歷正月十五)、中秋節(jié)(中國農歷八月十五)和龍舟節(jié)(中國農歷五月二十)等。在實際工作中,我們發(fā)現出院人數受春節(jié)和元宵節(jié)的影響很大。由于春節(jié)和元宵節(jié)時間上接近,且傳統(tǒng)意義上認為元宵節(jié)后才是真正春節(jié)的結束,故本研究將這一時間段內的影響均稱為移動春節(jié)效應。我們發(fā)現,出院人數通常節(jié)前一周下降,春節(jié)期間最少,春節(jié)后緩慢增加。本課題組既往研究中也發(fā)現這一特點[6],本文中確定的移動春節(jié)效應期為節(jié)前第5天至節(jié)后第14天。用2007-2012年實際出院人數序列進行2013年1-12月出院人數預測,從相對預測誤差看2013年2月的預測誤差最大。文獻[7]用ARIMA模型對出院人數進行預測,研究結果也顯示春節(jié)月份的預測誤差最大(其中,2005年1月為45.45%,2006年 1月為40.64%)。
本文通過比較調整預測誤差與直接預測誤差發(fā)現,移動假日效應調整后序列的調整預測誤差明顯低于直接預測誤差??梢?,移動春節(jié)效應確實降低了序列的預測效果,調整移動假日效應后對春節(jié)移動假日效應影響月份進行預測,調整預測值具有很好的預測效果。
本文用觀測值比例因子模型的方法,確定移動假日效應期的長度。用年度均值替代移動假日效應期內的出院人數,并對均值替代后的序列進行移動假日效應的調整。國外移動假日效應調整方法主要采用天數比例因子模型,作者在既往研究中已經通過模擬和實例驗證了觀測值比例因子模型的優(yōu)勢[8]。故這里仍采用了觀測值比例因子模型的思想進行移動假日效應的調整。此外,國內對出院人數影響明顯的移動假日為春節(jié),無法直接使用基于國外移動假日的X-12-ARIMA方法。本研究直觀地說明了春節(jié)移動假日效應調整的必要性,同時給出具體的、可操作的調整方法,以期為同類研究提供參考。
[1]周青,陳秋,葉小云,等.基于A RIMA模型的醫(yī)院門診量預測.中國病案,2011,12(1):51-52.
[2]肖枝洪,郭明月.時間序列分析與SAS應用,2009:13-109,145-163.
[3]X-12-ARIMA Reference Manual.Version 0.3.Time Series Staff Statistical Research Division Room.U.S.Census Bureau,Washington,2007.http://www.census.gov/srd/www/x12a/
[4]Alper CE,Aruoba SB.Moving Holidays and Seasonal Adjustment:The Case of Turkey.Review of M iddle East Economics and Finance,2004,2(3):203-209.
[5]Edward E.Leamer.Workday,holiday and calendar adjustment with 21st century data:monthly aggregates from daily diesel fuel purchases.2011,C81:http://www.nber.org/papers/w16897.
[6]薛允蓮,張晉昕,劉貴浩,等.醫(yī)院住院人數序列的春節(jié)效應調整.中國衛(wèi)生統(tǒng)計,2010,27(5):473-476.
[7]阿里木江·艾山.某專科醫(yī)院門診人次、出院人數預測方法的探討.新疆醫(yī)科大學,2007.
[8]薛允蓮,張晉昕.時間序列分析中的移動假日效應.中國衛(wèi)生統(tǒng)計,2009,26(5):502-504.
(責任編輯:郭海強)
*:廣東省醫(yī)學科研基金(No.B2014126)
1.中山大學孫逸仙紀念醫(yī)院(510120)
2.中山大學公共衛(wèi)生學院
△通信作者:張晉昕,E-mail:zhjinx@m(xù)ail.sysu.edu.cn