馬春柳 劉海霞 李小升 雷海科 王 紅 李 琳 馬 喆 周 宏△
住院量是評(píng)價(jià)一個(gè)醫(yī)院醫(yī)療工作的重要指標(biāo),直接或間接地反映出一個(gè)醫(yī)院的規(guī)模、醫(yī)療質(zhì)量及醫(yī)療水平〔1〕。因此,了解住院量的變化情況,對(duì)于合理安排資源,提高醫(yī)療工作效率意義重大。要了解住院量的情況,就要對(duì)其進(jìn)行預(yù)測(cè)。目前預(yù)測(cè)的模型及方法主要有線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型、灰色預(yù)測(cè)模型、馬爾科夫鏈模型以及時(shí)間序列模型等〔2〕。針對(duì)住院量數(shù)據(jù)的特殊性,本文選用季節(jié)自回歸滑動(dòng)平均模型(seasonal auto regressive integrated moving average model,SARIMA模型),分析2000-2011年住院量的歷史數(shù)據(jù),探討其發(fā)生發(fā)展的規(guī)律并預(yù)測(cè)未來半年醫(yī)院住院量的情況,為醫(yī)院規(guī)劃自身發(fā)展提供科學(xué)的依據(jù)。
所有資料來源于2000-2011年某三甲腫瘤專科醫(yī)院統(tǒng)計(jì)月報(bào)表。
利用統(tǒng)計(jì)學(xué)軟件SPSS18.0進(jìn)行統(tǒng)計(jì)分析。根據(jù)醫(yī)院住院量的數(shù)據(jù)呈周期變化的特點(diǎn),利用SARIMA(p,d,q)(P,D,Q)模型對(duì)我院 2000 ~2011 年住院量數(shù)據(jù)進(jìn)行擬合。其中p,d,q分別表示自回歸階數(shù)、差分階數(shù)和移動(dòng)平均階數(shù)。乘積季節(jié)時(shí)間序列模型的p、q判斷較為困難,根據(jù)以往研究文獻(xiàn)參數(shù)中報(bào)道超過2階的情況很少,可以分別取0,1,2逐個(gè)試驗(yàn),然后根據(jù)標(biāo)準(zhǔn)化貝葉斯信息準(zhǔn)則(normalized bayesian information criterion,BIC)、平均絕對(duì)誤差百分比(mean absolute percentage error,MAPE)判定模型的擬合情況、以及通過Ljung-Box檢驗(yàn)殘差情況來綜合判斷〔3〕。先通過對(duì)數(shù)據(jù)進(jìn)行非季節(jié)性差分和季節(jié)性差分后,得到一個(gè)新的平穩(wěn)化的時(shí)間序列,然后采用Box-Jenkins模型識(shí)別方法進(jìn)行模型識(shí)別,即根據(jù)樣本自相關(guān)、偏相關(guān)函數(shù)的截尾、拖尾性初步判斷序列所適合的模型類別。通過標(biāo)準(zhǔn)化貝葉斯信息標(biāo)準(zhǔn)以及平均絕對(duì)誤差百分比判定模型擬合情況,BIC與MAPE值越小,模型擬合的越好。通過Ljung-Box檢驗(yàn)來判斷模型殘差是否為白噪聲〔4〕。最后用所篩選的模型預(yù)測(cè)醫(yī)院2012年7~12月的住院量。
圖1可見醫(yī)院各年住院量在不斷增加,而且呈現(xiàn)一定的季節(jié)分布趨勢(shì)。根據(jù)其特點(diǎn),對(duì)其進(jìn)行一次一般差分和一次季節(jié)差分后(見圖2),所有樣本點(diǎn)基本上都是圍繞0這一水平線上下波動(dòng),符合了時(shí)間序列的平穩(wěn)化要求。
圖1 2001年1月到2012年6月醫(yī)院住院量的時(shí)間序列圖
圖2 對(duì)數(shù)據(jù)差分后的醫(yī)院住院量的時(shí)間序列圖
原始數(shù)據(jù)的序列圖發(fā)現(xiàn),數(shù)據(jù)具有季節(jié)性。經(jīng)篩選得最優(yōu)模型為 SARIMA(1,1,1)(2,1,0)12,其中BIC值為13.59,MAPE的值為7.44(見表1),模型決定系數(shù)R2為0.94,一階非季節(jié)移動(dòng)平均參數(shù)MA1=0.43,一階季節(jié)自回歸參數(shù)季節(jié) AR1=-0.34,二階季節(jié)自回歸參數(shù)季節(jié) AR2=-0.60,參數(shù)的估計(jì)值均有統(tǒng)計(jì)學(xué)意義,Box-Ljung檢驗(yàn)無統(tǒng)計(jì)學(xué)意義(Q18=22.64,P=0.1238),可以認(rèn)為殘差序列是白噪聲,說明所選模型恰當(dāng)。
表1 不同時(shí)間序列模型的BIC值與MAPE值
利用所篩選的 SARIMA(1,1,1)(2,1,0)12模型預(yù)測(cè)我院2012年1~6月的住院量(見表2),將預(yù)測(cè)值與實(shí)際值比較,相對(duì)誤差最小值能達(dá)到4.94%,誤差較大的為4月份,為10.94%??傮w上看,模型預(yù)測(cè)值的相對(duì)誤差很小,進(jìn)一步說明了此模型具有較好的預(yù)測(cè)性。同時(shí)利用 SARIMA(1,1,1)(2,1,0)12模型預(yù)測(cè)2000-2012年的住院量,并將實(shí)際值與預(yù)測(cè)值一起繪圖(見圖3),發(fā)現(xiàn)2000-2011年的實(shí)際值與預(yù)測(cè)值的曲線基本吻合。
表2 2012年1到6月住院量的SARIMA模型的預(yù)測(cè)值與實(shí)際值
圖3 預(yù)測(cè)值與實(shí)際值的擬合圖
利用 SARIMA(1,1,1)(2,1,0)12模型預(yù)測(cè)醫(yī)院2012年7~12月的住院量(見表3),發(fā)現(xiàn)醫(yī)院的住院量有不斷上升的趨勢(shì)。
表3 2012年7月到12月醫(yī)院住院量的預(yù)測(cè)值
時(shí)間序列分析是一種重要的現(xiàn)代統(tǒng)計(jì)分析方法,廣泛應(yīng)用于自然領(lǐng)域、社會(huì)領(lǐng)域、科學(xué)研究和人類思維。ARIMA模型自20世紀(jì)70年代提出,已經(jīng)不斷得到完善,日益發(fā)展成熟,已在經(jīng)濟(jì)、衛(wèi)生、工業(yè)自動(dòng)化、水文、地質(zhì)、氣象、環(huán)境保護(hù)等多種領(lǐng)域得到廣泛應(yīng)用〔5〕。與傳統(tǒng)的時(shí)間序列模型相比,ARIMA模型更具有廣泛的適用性。傳統(tǒng)模型都是假設(shè)各變量之間是一種線性關(guān)系,而實(shí)際情況,常受季節(jié)效應(yīng)、隨機(jī)波動(dòng)效應(yīng)等影響,所以擬合出來的效果往往不佳〔6〕。而ARIMA模型能考慮這些效應(yīng),從而得到的預(yù)測(cè)結(jié)果與實(shí)際較為吻合。劉會(huì)恩比較了12種不同的預(yù)測(cè)方法,研究結(jié)果認(rèn)為ARIMA模型在短期預(yù)測(cè)中擁有較高的精確度〔7〕。
ARIMA模型也具有一定的局限性,主要表現(xiàn)在:計(jì)算方法比較復(fù)雜;如果原始序列數(shù)據(jù)較少,擬合效果會(huì)較差;只能適用于短期內(nèi)的預(yù)測(cè),如果用于中長(zhǎng)期預(yù)測(cè),預(yù)測(cè)效果就不會(huì)理想〔8〕。因此,在應(yīng)用前也應(yīng)該考慮其適用條件,比如考慮序列的平穩(wěn)性及白噪聲。如果序列不是一個(gè)平穩(wěn)序列或是一個(gè)白噪聲序列及時(shí)間序列太短,則不適合應(yīng)用ARAMA模型進(jìn)行分析。
醫(yī)院的住院量有不斷上升的趨勢(shì),呈現(xiàn)出季節(jié)波動(dòng)的特征。醫(yī)院應(yīng)根據(jù)變化波動(dòng)的規(guī)律特點(diǎn),合理調(diào)整現(xiàn)有床位分布結(jié)構(gòu),除腫瘤內(nèi)科、乳腺科、婦瘤科等科室保持現(xiàn)有床位外,其他科室以“大病房”形式建立綜合病房,統(tǒng)一安排床位,并按照季節(jié)不同,進(jìn)行相應(yīng)的調(diào)整,改變病房床位歸屬永久不變的現(xiàn)狀。通過對(duì)住院量的預(yù)測(cè),在一定程度上可以幫助醫(yī)院對(duì)成本進(jìn)行有效的控制,充分利用現(xiàn)有的配置,不斷優(yōu)化醫(yī)療資源的使用結(jié)構(gòu)。
1.明星辰,方孝梅,王玉責(zé),等.某三級(jí)醫(yī)院2007年住院人次預(yù)測(cè)分析.中國衛(wèi)生統(tǒng)計(jì),2008,25(1):68-69.
2.Martinez E Z,Silva E A,F(xiàn)abbro A L.A SARIMA forecasting model to predict the number of cases of dengue in Campinas,State of S~ao Paulo,Brazil.Rev Soc Bras Med Trop,2011,44(4):436-440.
3.劉曉宏,金丕煥,陳啟明.ARIMA模型中時(shí)間序列平穩(wěn)性的統(tǒng)計(jì)檢驗(yàn)方法及應(yīng)用.中國衛(wèi)生統(tǒng)計(jì),1998,15(3):12-14.
4.Rosychuk RJ,Klassen TP,Voaklander DC,et al.Seasonality patterns in croup presentations to emergency departments in Alberta,Canada:a time series analysis.Pediatr Emerg Care,2011,27(4):256-260.
5.朱惠敏,齊麗萍,孫莉.對(duì)我院2004年住院人次及周轉(zhuǎn)次數(shù)的預(yù)測(cè).中國衛(wèi)生統(tǒng)計(jì),2005,22(2):126-127.
6.姚炯.影響住院人次的因素分析.中國衛(wèi)生統(tǒng)計(jì),2004,21(4):228-229.
7.劉會(huì)恩.用統(tǒng)計(jì)方法對(duì)我院住院人次和門診診療人次進(jìn)行預(yù)測(cè).中國醫(yī)院統(tǒng)計(jì),2007,14(2):107-108.
8.薛冬梅.ARIMA模型及其在時(shí)間序列分析中的應(yīng)用.吉林化工學(xué)院學(xué)報(bào),2010,27(3):80-83.