唐 路,宋 萍,謝冰玨,佘 穎
(重慶醫(yī)科大學(xué)附屬兒童醫(yī)院病案統(tǒng)計(jì)科,重慶 400014)
門(mén)診醫(yī)療服務(wù)工作通常具有點(diǎn)多、線長(zhǎng)、面廣的特點(diǎn),是醫(yī)療活動(dòng)的首要環(huán)節(jié),關(guān)系到醫(yī)院的整體形象[1]。門(mén)診量在很大程度上直接反映出醫(yī)院規(guī)模、醫(yī)療技術(shù)水平、管理水平及患者對(duì)醫(yī)院的信任度[2]。我院是集醫(yī)教研為一體的國(guó)家三級(jí)甲等綜合性兒童醫(yī)院,在全國(guó)最佳醫(yī)院排行榜中連續(xù)多年位居全國(guó)兒童醫(yī)院第三位。2019 年醫(yī)院日均門(mén)診量0.92 萬(wàn)人次,門(mén)診外埠患者比例近20%,加上兒童就診特殊性,極易形成短時(shí)間內(nèi)人流量高峰,增加排隊(duì)時(shí)間,從而引發(fā)醫(yī)患矛盾。求和自回歸移動(dòng)平均(auto regressive integrated moving average model,ARIMA)在門(mén)診量預(yù)測(cè)中已得到了廣泛應(yīng)用,且預(yù)測(cè)效果較好[2-4]。本文通過(guò)對(duì)我院月門(mén)診量時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,了解其變化特點(diǎn)及規(guī)律,以期為醫(yī)院合理配置人力資源及醫(yī)療物資提供有力支撐,增強(qiáng)現(xiàn)代醫(yī)院的門(mén)診綜合服務(wù)能力及效率。
1.1 資料來(lái)源 數(shù)據(jù)來(lái)源于重慶醫(yī)科大學(xué)附屬兒童醫(yī)院病案統(tǒng)計(jì)科2009 年~2019 年醫(yī)院業(yè)務(wù)量月報(bào)表,其中2009 年~2018 年逐月數(shù)據(jù)用于建立時(shí)間序列預(yù)測(cè)模型,2019 年逐月數(shù)據(jù)用于模型效果檢驗(yàn)及預(yù)測(cè)評(píng)價(jià),數(shù)據(jù)真實(shí)可靠。
1.2 方法 ARIMA 模型全稱(chēng)為求和自回歸移動(dòng)平均模型,該模型是由1970 年美國(guó)統(tǒng)計(jì)學(xué)家G.E.P.Box和英國(guó)統(tǒng)計(jì)學(xué)家G.M.Jenkins 提出的一種經(jīng)典時(shí)間序列預(yù)測(cè)模型[5,6]。ARIMA 模型可對(duì)具有季節(jié)效應(yīng)的時(shí)間序列進(jìn)行建模,根據(jù)季節(jié)效應(yīng)的提取難易程度分為簡(jiǎn)單季節(jié)模型ARIMA(P,D,Q)S 和乘積季節(jié)模型ARIMA(p,d,q)×(P,D,Q)S。因門(mén)診量時(shí)間序列既有季節(jié)效應(yīng)又有長(zhǎng)期趨勢(shì)效應(yīng)且和隨機(jī)波動(dòng)之間存在比較復(fù)雜的交互影響,所以本文采用混合效應(yīng)的乘積季節(jié)模型ARIMA(p,d,q)×(P,D,Q)S,其中p、d 和q 分別表示非季節(jié)自回歸階數(shù)、差分階數(shù)和移動(dòng)平均階數(shù);P、D 和Q 分別表示季節(jié)自回歸階數(shù)、季節(jié)差分階數(shù)和季節(jié)移動(dòng)平均階數(shù),S 為季節(jié)差分周期[6-8]。
乘積季節(jié)模型建模步驟[9-10]:①時(shí)間序列平穩(wěn)化:ARIMA 模型的使用前提條件是數(shù)據(jù)必須是平穩(wěn)的時(shí)間序列數(shù)據(jù)。應(yīng)用時(shí)序圖、自相關(guān)函數(shù)圖初步識(shí)別序列趨勢(shì)性、季節(jié)性等特征,采用單位根檢驗(yàn)判斷序列的平穩(wěn)性。對(duì)于非平穩(wěn)時(shí)間序列則需進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換、非季節(jié)差分、季節(jié)差分等預(yù)處理,直到序列平穩(wěn)為止。②模型參數(shù)定階:根據(jù)差分次數(shù)確定d、D 階數(shù),p、q 和P、Q 階數(shù)依據(jù)平穩(wěn)序列的自相關(guān)函數(shù)圖及偏相關(guān)函數(shù)圖拖尾、截尾特征來(lái)確定。R軟件中的auto.arima 函數(shù)可以進(jìn)行最優(yōu)模型自動(dòng)篩選[11,12]。篩選依據(jù):赤池信息準(zhǔn)則(AIC)或貝葉斯信息準(zhǔn)則(BIC)最小,對(duì)數(shù)似然函數(shù)值(Log likelihood)最大的模型為最優(yōu)模型。③模型的檢驗(yàn):采用Ljung-Box test 判斷模型的適合性,若殘差滿足白噪聲,該統(tǒng)計(jì)量應(yīng)沒(méi)有顯著性,否則模型需要進(jìn)行改進(jìn)。④模型預(yù)測(cè):以2009 年~2018 年逐月門(mén)診量數(shù)據(jù)進(jìn)行模型擬合,篩選出最優(yōu)乘積季節(jié)模型。再用2019 年逐月門(mén)診量數(shù)據(jù)檢驗(yàn)?zāi)P皖A(yù)測(cè)效果,根據(jù)預(yù)測(cè)值與實(shí)際值的平均絕對(duì)百分比誤差(MAPE)評(píng)價(jià)預(yù)測(cè)效果。,其中Xi為原始數(shù)據(jù),為預(yù)測(cè)值,N 為數(shù)據(jù)個(gè)數(shù)。
1.3 統(tǒng)計(jì)學(xué)分析 采用Microsoft Excel 2016 建立數(shù)據(jù)庫(kù),應(yīng)用R-3.6.3 軟件中的tseries 程序包和forecast 程序包進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)建模,以P<0.05 表示差異有統(tǒng)計(jì)學(xué)意義。
2.1 2009 年~2018 年門(mén)診量時(shí)序圖 依據(jù)我院2009年~2018 年門(mén)診量數(shù)據(jù)繪制原始序列時(shí)序圖,見(jiàn)圖1。2009 年~2018 年我院門(mén)診量總體呈現(xiàn)上升趨勢(shì),且有明顯的季節(jié)波動(dòng)特征,每年的5~7 月份出現(xiàn)第一個(gè)高峰期,之后有所回落,在11~12 月份再次出現(xiàn)高峰。
圖1 原始序列時(shí)序圖
2.2 時(shí)間序列平穩(wěn)化 由于原始序列時(shí)序圖存在上升和季節(jié)波動(dòng)趨勢(shì),且經(jīng)單位根檢驗(yàn)差異無(wú)統(tǒng)計(jì)學(xué)意義(Dickey-Fuller=-2.9882,P=0.1656),因此判斷原始序列不滿足ARIMA 模型建模要求。為了消除原始序列的時(shí)間趨勢(shì),對(duì)其進(jìn)行一階非季節(jié)差分和一階季節(jié)差分處理,處理后經(jīng)單位根檢驗(yàn)差異有統(tǒng)計(jì)學(xué)意義(Dickey-Fuller=-12.3890,P=0.01),時(shí)間序列數(shù)據(jù)已平穩(wěn),滿足建模前提。
2.3 模型參數(shù)定階 繪制平穩(wěn)時(shí)間序列的時(shí)序圖、自相關(guān)圖(ACF 圖)和偏自相關(guān)圖(PACF 圖),見(jiàn)圖2??梢钥闯?,平穩(wěn)序列的ACF 和PACF 均拖尾,由此可以判斷模型適用于ARIMA(p,d,q)×(P,D,Q)S。因?qū)υ夹蛄羞M(jìn)行了一階非季節(jié)差分和周期為12個(gè)月的一階季節(jié)差分,所以d=1,D=1,S=12,初步確定模型為ARIMA(p,1,q)×(P,1,Q)12。對(duì)于p、q 和P、Q 階數(shù)的判斷可以從平穩(wěn)序列的自相關(guān)函數(shù)圖及偏相關(guān)函數(shù)圖拖尾、截尾的特征得到啟示,且根據(jù)歷史文獻(xiàn)參考超過(guò)兩階的情況較少[13,14]。本文利用R軟件中的auto.arima 函數(shù)自動(dòng)篩選最優(yōu)模型,得出參數(shù)分別為:p=1、q=2,P=2、Q=0,因此經(jīng)篩選得出最優(yōu)模型為ARIMA(1,1,2)×(2,1,0)12。
圖2 平穩(wěn)序列相關(guān)圖
2.4 模型檢驗(yàn) 最優(yōu)模型ARIMA(1,1,2)×(2,1,0)12 的赤池信息準(zhǔn)則AIC=2315.69,貝葉斯信息準(zhǔn)則BIC=2334.46,模型中各參數(shù)檢驗(yàn)均有統(tǒng)計(jì)學(xué)意義(P<0.05),見(jiàn)表1。采用Ljung-Box 方法對(duì)模型殘差進(jìn)行檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量Q=6.3022,P=0.3902,模型殘差為白噪聲序列。同時(shí)對(duì)殘差序列做自相關(guān)圖(圖3)和偏相關(guān)圖(圖4)。此模型殘差大部分都落入95%可信區(qū)間內(nèi),序列信息已經(jīng)被充分提取,得到的模型是適合的擬合模型。
圖4 模型殘差偏相關(guān)圖
圖3 模型殘差自相關(guān)圖
表1 ARIMA(1,1,2)×(2,1,0)12 預(yù)測(cè)模型參數(shù)檢驗(yàn)
2.5 模型預(yù)測(cè) 運(yùn)用ARIMA(1,1,2)×(2,1,0)12 模型預(yù)測(cè)2019 年1 月~12 月門(mén)診量,預(yù)測(cè)值與實(shí)際值對(duì)比情況見(jiàn)表2,實(shí)際值均在月門(mén)診量預(yù)測(cè)值的95%可信區(qū)間以內(nèi),平均絕對(duì)百分誤差6.56%<10%,預(yù)測(cè)模型精確度較高。
表2 某兒童醫(yī)院2019 年1 月~12 月門(mén)診量預(yù)測(cè)值與實(shí)際值比較
表2(續(xù))
隨著社會(huì)經(jīng)濟(jì)發(fā)展,人們就醫(yī)意識(shí)不斷增強(qiáng),及時(shí)就診成為人們的迫切需求[15]。兒童作為一個(gè)特殊群體,面對(duì)二孩政策放開(kāi),公立醫(yī)院應(yīng)及時(shí)整合醫(yī)療資源來(lái)優(yōu)化兒童門(mén)診,以便滿足日益增長(zhǎng)的兒童衛(wèi)生服務(wù)需求,提高兒童衛(wèi)生服務(wù)效率,保證兒童健康水平。因此,科學(xué)準(zhǔn)確的短期門(mén)診量預(yù)測(cè)在醫(yī)院日常管理和經(jīng)營(yíng)決策中具有重要意義,是現(xiàn)代醫(yī)院管理的重要內(nèi)容。及時(shí)掌握門(mén)診量的變化趨勢(shì)可以為醫(yī)院合理開(kāi)設(shè)門(mén)診科室、配置醫(yī)護(hù)人員等資源配置提供基礎(chǔ)數(shù)據(jù),同時(shí)節(jié)約醫(yī)療業(yè)務(wù)成本,提高醫(yī)院的經(jīng)濟(jì)效益,有利于公立醫(yī)院社會(huì)效益的實(shí)現(xiàn)[16]。
越來(lái)越多的預(yù)測(cè)模型在門(mén)診量短期預(yù)測(cè)中得到廣泛應(yīng)用,如線性回歸預(yù)測(cè)、灰色GM(1,1)預(yù)測(cè)、指數(shù)平滑模型預(yù)測(cè)、ARIMA 模型預(yù)測(cè)等[17]。不同的模型各有其優(yōu)缺點(diǎn)及適用范圍,其中,ARIMA 模型在醫(yī)學(xué)領(lǐng)域的應(yīng)用較為廣泛,主要適用于有季節(jié)變動(dòng)的數(shù)據(jù),在短期預(yù)測(cè)上精確度較高。R 軟件作為一款開(kāi)源軟件,在處理時(shí)間序列數(shù)據(jù)時(shí)具有強(qiáng)大的統(tǒng)計(jì)運(yùn)算及繪圖功能,本研究利用R 語(yǔ)言,通過(guò)時(shí)間序列數(shù)據(jù)預(yù)處理、模型參數(shù)定階、模型檢驗(yàn)等步驟,最終擬合得到門(mén)診量ARIMA(1,1,2)×(2,1,0)12 模型,進(jìn)一步對(duì)該模型殘差分析發(fā)現(xiàn),該模型較好地模擬了我院月門(mén)診量時(shí)間序列變化趨勢(shì)。利用該模型預(yù)測(cè)2019 年逐月門(mén)診量,預(yù)測(cè)值與實(shí)際值的平均絕對(duì)百分比誤差為6.56%,實(shí)際值均在預(yù)測(cè)值95%可信區(qū)間內(nèi),提示模型預(yù)測(cè)精準(zhǔn)度較高。
綜上所述,本研究建立的ARIMA 乘積季節(jié)模型為相對(duì)最優(yōu)模型,且適合門(mén)診量的短期預(yù)測(cè),預(yù)測(cè)結(jié)果對(duì)醫(yī)院合理配置人力資源具有實(shí)際應(yīng)用價(jià)值,醫(yī)院可以根據(jù)預(yù)測(cè)結(jié)果采取如下措施:①提前在門(mén)診高峰時(shí)間、季節(jié)盡可能多增加知名專(zhuān)家門(mén)診的坐診人數(shù),周末適當(dāng)增加專(zhuān)家或?qū)?铺?hào),增強(qiáng)門(mén)診醫(yī)療技術(shù)力量。②實(shí)施彈性排班、分時(shí)段預(yù)約等措施,合理配置門(mén)診醫(yī)療資源,發(fā)揮人、財(cái)、物資源的最大效益。③對(duì)于慢性患者,健康宣教時(shí)盡量提醒他們?cè)陂T(mén)診低峰時(shí)就診,既可緩解門(mén)診高峰時(shí)的就診壓力,也可節(jié)約患者的等待時(shí)間,從而緩解醫(yī)患矛盾。但門(mén)診量的變化是由多因素聯(lián)合作用引起的,某些因素的改變可能會(huì)使得擬合模型不適用,如政策因素、傳染病疫情流行與暴發(fā)。同時(shí),ARIMA 模型由于其模擬的原理,對(duì)數(shù)據(jù)要求不高,只適合短期預(yù)測(cè),因此下一步可以考慮通過(guò)組合模型進(jìn)行預(yù)測(cè),不斷提高模型預(yù)測(cè)精確度。