三峽大學(xué)人民醫(yī)院信息科(443000) 覃 桓
基于多重回歸模型的住院人數(shù)預(yù)測
三峽大學(xué)人民醫(yī)院信息科(443000) 覃 桓
目的尋長合適的預(yù)測方法預(yù)測住院人數(shù)。方法以上一年度的住院人數(shù)及本年平均開放床位增加數(shù)為自變量建立多重回歸模型預(yù)測本年住院人數(shù)。結(jié)果建立的多重回歸模型具有極高的擬合程度。結(jié)論用此種模型預(yù)測住院人數(shù)在置信度一定的前提下置信區(qū)間窄,具有科學(xué)性和實用性。
多重回歸 住院人數(shù) 預(yù)測
準確合理的預(yù)測醫(yī)院住院人數(shù)對醫(yī)院管理者指導(dǎo)工作、制定工作計劃、做出科學(xué)決策提供有效依據(jù);在實際工作中一方面有利于醫(yī)院管理者合理利用人力、財力、物力,減少工作中的盲目性,另一方面能更有效合理的分配各項資源,為病人提供更優(yōu)質(zhì)、高效的服務(wù)。
1.資料來源
資料來源為本院2000-2011年的統(tǒng)計資料,資料包含住院人數(shù)、平均開放床位增加數(shù)(表1)。平均開放床位增加數(shù)為本年平均開放床位數(shù)減上年平均開放床位數(shù)。資料通過本院HIS系統(tǒng)收集匯總,有統(tǒng)計臺帳、統(tǒng)計報表存檔,另有原始數(shù)據(jù)備份,數(shù)據(jù)真實可靠。
表1 三峽大學(xué)人民醫(yī)院2000-2011年住院人數(shù)和平均開放床位增加數(shù)表
2.預(yù)測方法
預(yù)測方法為以上一年度的住院人數(shù)及本年度的平均開放床位增加數(shù)為自變量,以本年度的住院人數(shù)為應(yīng)變量建立多重線性回歸方程。上一年度住院人數(shù)在完成上一年度住院人數(shù)統(tǒng)計工作后取得,本年度平均開放床位增加數(shù)在醫(yī)院沒有增減病床計劃的情況下為零,如本年度有增減病床數(shù)計劃,則根據(jù)病床增減的時間及床位數(shù)可以準確測算。以上兩個自變量均可在年初取得,預(yù)測方法切實可行。
(1)預(yù)測模型
建立多重線性回歸方程對原始資料擬合。
(2)預(yù)測方程
利用OLS估計式求得,建立回歸方程。
(3)統(tǒng)計結(jié)果分析
方差分析結(jié)果F=111.327,P<0.01,說明該回歸方程具有統(tǒng)計學(xué)意義。
計算t統(tǒng)計量得到關(guān)于b1的t統(tǒng)計量t1=13.063,P1<0.05,b2的t統(tǒng)計量t2=2.480,P2<0.05,說明方程引入的兩個自變量均有統(tǒng)計學(xué)意義。
復(fù)相關(guān)系數(shù)R=0.983,決定系數(shù)R2=0.965,計算結(jié)果表明此回歸方程中應(yīng)變量與各自變量之間的相關(guān)程度極高,各自變量對應(yīng)變量的解釋程度高達96.5%。
通過分析預(yù)測模型的誤差來檢驗預(yù)測模型的可靠度是一個必要環(huán)節(jié),通過分析誤差,觀測預(yù)測結(jié)果是否需要作合適的修正,進而將誤差控制在合理的范圍之內(nèi)以提高預(yù)測結(jié)果的準確性[1-3]。首先分別將各自變量的實際數(shù)值代入建立的多重回歸模型,計算出預(yù)測的住院人數(shù)即預(yù)測值,然后計算預(yù)測值與實際值之差的絕對值即絕對誤差及絕對誤差占實際值的百分比即百分比誤差(表2)。
從表2中可以看出預(yù)測值與實際值的百分比誤差最大為12.26,最小為0.11,誤差較小,預(yù)測的效果較好。以5年為一組,2007-2011年的百分比誤差合計為18.21,2002-2006年的百分比誤差合計為20.38;以3年為一組,2009-2011年的百分比誤差合計為5.56,2006-2008年的百分比誤差合計為13.57,2003-2005年的百分比誤差合計為16.46;從以上數(shù)據(jù)可以看出相對靠后的年份預(yù)測誤差小,相對靠前的年份預(yù)測誤差大,其中相對靠后的年份預(yù)測誤差小的現(xiàn)象正是實際運用中想要達到的目標,能提高預(yù)測結(jié)果的準確性。
表2 預(yù)測誤差分析表
2012年平均開放床位增加數(shù)為131張。
1.點估計
2.區(qū)間估計
給定α=0.05,查表得自由度為n-k=8的臨界值為:
通過以上外推計算得出2012年住院人數(shù)的點估計值為34039人,在95%的置信度下預(yù)計2012年住院人數(shù)的變動范圍在30292人至37786人之間。
1.預(yù)測模型考慮到對住院人數(shù)影響最大的兩個因素,第一個自變量是上一年度的住院人數(shù),利用了自回歸的特點,第二個自變量是可以準確測算的當年平均開放床位增加數(shù),合理選取對應(yīng)變量影響最大的自變量是實現(xiàn)預(yù)測精度高、取得預(yù)測成功的關(guān)鍵。本院2012年實際住院人數(shù)為33218人,與預(yù)測的點估計值34039人僅相差821人,預(yù)測值與實際值的百分比誤差僅為2.47,當然這也與2012年無重大疫情,未出現(xiàn)反常天氣現(xiàn)象等有密切關(guān)系。
2.近3年的住院人數(shù)同比增長幅度明顯高于以前年度的同比增長幅度,主要是因為近年來我國國民經(jīng)濟高速增長及國家相關(guān)醫(yī)療體制改革政策的出臺,這也是回歸方程b0為負的原因,因此在對住院人數(shù)進行統(tǒng)計預(yù)測的時候還必須考慮國家相關(guān)醫(yī)療體制改革政策的變動及國民經(jīng)濟高速增長的前提條件是否發(fā)生了明顯的轉(zhuǎn)變,如上述因素發(fā)生明顯的變化,應(yīng)對預(yù)測的結(jié)果做適當修正。
3.本預(yù)測模型不適宜做過長時間的預(yù)測,原始數(shù)據(jù)的跨度也不宜過長如數(shù)十年的歷史資料,因住院人數(shù)受影響的因素極多,有些在數(shù)年內(nèi)不能明顯體現(xiàn)的特征,在數(shù)十年的變化中則產(chǎn)生較為顯著的影響,相對短期的資料能減少其它長期因素的影響,使得預(yù)測的效果更理想[4-5]。
4.雖然統(tǒng)計預(yù)測是建立在嚴格的數(shù)學(xué)理論之上,但是現(xiàn)實世界中有很多現(xiàn)象與數(shù)學(xué)理論并非完全相符合,因此在做統(tǒng)計預(yù)測的時候不僅要利用已知的數(shù)據(jù)和方法進行點值估計,還要給出預(yù)測期實際值的可能范圍(上、下限值)和預(yù)測期實際值在這一范圍內(nèi)的把握程度(置信水平),即區(qū)間預(yù)測[6]。本文利用多重回歸模型預(yù)測了2012年住院人數(shù)點估計值和一定把握性下的區(qū)間估計值,預(yù)測結(jié)果體現(xiàn)了把握性和準確性的統(tǒng)一。
5.在實際的工作中對同一個指標可能存在多種預(yù)測方法且均存在合理的解釋,在預(yù)測時應(yīng)選擇解釋程度高的預(yù)測方法進行預(yù)測。筆者結(jié)合醫(yī)院住院人數(shù)變動的特征建立的多重回歸模型,達到了很好的預(yù)測效果。國內(nèi)外有學(xué)者報道采用以前年度的住院人數(shù)、門診量、手術(shù)量等數(shù)據(jù)來預(yù)測住院人數(shù),但相關(guān)系數(shù)不及本模型,同時預(yù)測的準確率也會相應(yīng)較低,估計的區(qū)間也會相對較寬,本預(yù)測方法的精度較高,具有一定的實用價值。
1.Rogerson PA.Weight estimation and significance testing for three focused statistics.Statistical methods in medical research,2012,21(5):433-444.
2.Gerds TA,Scheike TH,Andersen PK.Absolute risk regression for competing risks:interpretation,link functions,and prediction.Statistics in medicine,2012,31(29):3921-3930.
3.Whitaker HJ,Hocine MN,F(xiàn)arrington CP.The methodology of self-controlled case series studies.Statisticalmethods in medical research,2009,18(1):7-26.
4.Sun Y,Teow KL,Heng BH,etal.Real-time prediction ofwaiting time in the emergency department,using quantile regression.Annals of emergency medicine,2012,60(3):299-308.
5.Crabtree BF,Ray SC,Schmidt PM,et al.The individual over time:time series applications in health care research.Journal of clinical epidem iology,1990,43(3):241-260.
6.Julious SA,Owen RJ.A comparison of methods for sample size estimation for non-inferiority studies w ith binary outcomes.Statisticalmethods in medical research,2011,20(6):595-612.
(責(zé)任編輯:郭海強)