亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于時間序列方法適配建模分析的衛(wèi)生支出預(yù)測實(shí)證研究*

        2015-03-09 11:13:14李望晨王春平張利平
        中國衛(wèi)生統(tǒng)計 2015年2期
        關(guān)鍵詞:模型

        李望晨王春平張利平△

        基于時間序列方法適配建模分析的衛(wèi)生支出預(yù)測實(shí)證研究*

        李望晨1,2,3王春平1,2,3張利平1,2,3△

        目的探討幾種代表時間序列預(yù)測建模原理和適配性能,根據(jù)算例分別建立程序和綜合比較。方法衛(wèi)生支出預(yù)測算例以ARIMA、GM、SVM和曲線擬合法制定方案,借助MATLAB、SAS等軟件實(shí)現(xiàn),討論性能差異和應(yīng)用價值。結(jié)果ARIMA法通用性好、GM法擬合失效、SVM技術(shù)設(shè)計待完善、曲線擬合法有限制而應(yīng)作預(yù)分析,數(shù)據(jù)資料特點(diǎn)影響方法適配性能。結(jié)論ARIMA法擬合長較多期隨機(jī)時序資料有代表意義;GM法適于貧信息小樣本資料建模;SVM泛化性能強(qiáng)但滑動窗多試取、結(jié)果對參數(shù)敏感;曲線擬合法受數(shù)據(jù)特點(diǎn)、離群數(shù)據(jù)和建模數(shù)據(jù)段等條件限制;各法應(yīng)對特定問題擇優(yōu)取舍。

        時間序列 適配比較 程序設(shè)計 衛(wèi)生預(yù)測 實(shí)證研究

        時間序列法以擬合歷史資料而慣性延續(xù)外推未來,原理性能和信息提取效果受數(shù)據(jù)量和資料特點(diǎn)限制,而且適于短期預(yù)測。當(dāng)前衛(wèi)生領(lǐng)域預(yù)測問題較代表性統(tǒng)計方法[1-2]包括ARIMA(autoregressive integrated moving average)、GM(grey method)、SVM(support vector machine)和曲線擬合(curve fit)法。但文獻(xiàn)檢索發(fā)現(xiàn)多以方法實(shí)現(xiàn)為主,有必要進(jìn)行綜合適配比較研究。

        基本原理

        1.GM(1,1):根據(jù)原始數(shù)據(jù)序列進(jìn)行一次累加生成序列該法包括序列累加、建模、識別、檢驗(yàn)、外推和累減過程。對隨機(jī)不規(guī)則序列累加生成為規(guī)律性序列,建模提取信息擬合和外推,計算殘差序列并作可行性檢驗(yàn)、殘差檢驗(yàn)和后驗(yàn)差檢驗(yàn),然后預(yù)測應(yīng)用。

        2.SVM:屬于基于結(jié)構(gòu)風(fēng)險最小化原則的數(shù)據(jù)挖掘技術(shù),解決樣本容量依賴、維數(shù)災(zāi)難、局部極小點(diǎn)問題,根據(jù)樣本集訓(xùn)練逼近非線性關(guān)系,泛化性能優(yōu)良。根據(jù)SVM智能算法原理建立關(guān)系模型,進(jìn)行數(shù)據(jù)段組成的樣本集訓(xùn)練后,映射關(guān)系f以“黑箱”存儲,可根據(jù)新數(shù)據(jù)段的輸入信息仿真外推和預(yù)測應(yīng)用。

        3.曲線擬合法:假定序列隨時間變化類似某種曲線特點(diǎn),可建立與時序t的回歸曲線y=f(t),應(yīng)用時還應(yīng)對曲線類型進(jìn)行優(yōu)選。序列預(yù)處理后計算增長特征并與曲線理論性質(zhì)比較:一階差分ut大致線性時取直線;二階差分u(2)t大致線性時選拋物線;lgut特征大致線性時取曲線yt=k+abt;lg(lgyt-lgyt-1)特征大致線性時選曲線yt=kgbt,lg(ut/ytyt-1)特征大致線性時取曲線yt=k/(1+ae-bt)。以特征線性顯著擇優(yōu)適配相應(yīng)曲線,常以與時序t相關(guān)系數(shù)r優(yōu)選。優(yōu)選并識別模型參數(shù)后,可將時序t代入表達(dá)式擬合或外推計算yt。

        4.ARIMA:

        基本步驟包括定階、識別、檢驗(yàn)和應(yīng)用。序列趨勢性時應(yīng)差分實(shí)現(xiàn)平穩(wěn)化。自相關(guān)系數(shù)q階截尾則擬合MA(q)模型,偏自相關(guān)系數(shù)p階截尾則擬合AR(p)模型,兩種相關(guān)系數(shù)均拖尾則擬合ARIMA(p,q)模型,可根據(jù)AIC、SBC信息量選擇最佳模型,經(jīng)條件最小二乘法識別參數(shù)。該法以序列低階差分后的平穩(wěn)序列建模,提取長期序列變化信息,已成為隨機(jī)時間序列經(jīng)典方法,算法復(fù)雜成熟。

        實(shí)證分析

        本文擬借助衛(wèi)生支出算例進(jìn)行實(shí)證比較和適配論證。以1990-2011年醫(yī)療衛(wèi)生服務(wù)支出數(shù)據(jù)為例,資料來自《中國衛(wèi)生統(tǒng)計年鑒》,數(shù)據(jù)平滑變化、規(guī)律性強(qiáng)、資料連貫豐富、有趨勢性,早期長時線性增長而近期起伏顯著,見圖1:

        圖1 醫(yī)療衛(wèi)生服務(wù)支出時序演化

        1.GM(1,1)預(yù)測。借助excel或MATLAB軟件計算實(shí)現(xiàn)。將1990-2011年數(shù)據(jù)組成序列{x(0)},累加計算序列{x(1)}和均值序列{z(1)},最后計算參數(shù)a=-0.193056,b=-42.2857。得到序列{x(1)}擬合模型依次回代數(shù)值k,并累減還原為擬合或預(yù)測值擬合與原始序列x(0)不相符,擬合失效。重新以1990年-2000年早期較平緩數(shù)據(jù)建立擬合模型-956.9024,經(jīng)比較與原序列擬合尚可以。最后繼續(xù)建立模型對少量近期強(qiáng)增長趨勢數(shù)據(jù)擬合仍不太好。

        2.SVM預(yù)測。借助Matlab軟件Libsvm工具箱實(shí)現(xiàn)。SVM法是通過樣本自組織訓(xùn)練反映時序延續(xù)規(guī)律及非線性聯(lián)系。通過設(shè)置滑動窗將等間隔數(shù)據(jù)進(jìn)行組對,順次截取組成訓(xùn)練樣本和映射關(guān)系f:{x(i),x(i+1),x(i+2)}→{x(i+3)},其中輸出為x(i+3),輸入為x(i),x(i+1),x(i+2)。將訓(xùn)練樣本對分別演示如下:{122.86 132.38 144.77}→{164.81};{132.38 144.77 164.81}→{212.85};…;{1397.23 2081.09 2565.6}→{3111.36}。

        訓(xùn)練完畢經(jīng)對原始輸入依次測試后得到仿真結(jié)果,經(jīng)驗(yàn)證比較仿真誤差幾乎為零,說明SVM對訓(xùn)練集有極強(qiáng)“內(nèi)插”能力再由輸入{2081.09 2565.6 3111.36}外推預(yù)測值773,與實(shí)際差距太遠(yuǎn)。如果改變滑動窗設(shè)置映射f:{x(i),x(i+1)}→{x(i+2)}。重新訓(xùn)練SVM,經(jīng)驗(yàn)證預(yù)測值與實(shí)際相差仍很大,滑動窗設(shè)置改變對結(jié)果影響不大。如調(diào)試參數(shù)重新訓(xùn)練SVM,結(jié)果變化敏感但預(yù)測值無法超過3000,與實(shí)際不符。原因是原序列訓(xùn)練后融入早期線性信息,對近期新趨勢的外推不好但符合該方法原理特點(diǎn)。

        3.擬合曲線預(yù)測。借助excel和SPSS軟件實(shí)現(xiàn)。對原序列yt平滑處理后差分計算增長特征發(fā)現(xiàn)均與時序t有大致線性變化關(guān)系。又計算增長特征與時序t相關(guān)系數(shù)分別為r1=0.9501,r2=0.749,r3=-0.534。|r1|最大說明修正指數(shù)曲線為最優(yōu)模型。然后用三和法識別參數(shù),去除1990年數(shù)據(jù)后可將序列(共21個數(shù)據(jù))等分為三段,計算參數(shù)得預(yù)測模型yt=132.5122+36.2046× 1.2417t。令t=21,帶入計算2012年預(yù)測值3546.73。重取2003-2011年數(shù)據(jù)建立模型yt=513.7442+115.2188×1.4994t。令t=9計算2012年預(yù)測值4927.22,因近期少量數(shù)據(jù)突增起伏趨勢,預(yù)測值大于實(shí)際值,小樣本建模時外推結(jié)果受個別數(shù)據(jù)影響而敏感、不穩(wěn)定。建模數(shù)據(jù)段須經(jīng)調(diào)試以保證曲線適配所給該時段特點(diǎn),該法解釋性好但精度欠佳。

        4.ARIMA預(yù)測。全步驟借助SAS軟件編程實(shí)現(xiàn)。序列經(jīng)二階差分平穩(wěn)化預(yù)處理消除趨勢,并經(jīng)過平穩(wěn)性檢驗(yàn)和純隨機(jī)性檢驗(yàn)。設(shè)置自回歸和移動平均最高階數(shù)為5,分別建模后根據(jù)AIC、SBC或BIC信息量擇優(yōu)配置階數(shù),最優(yōu)定階q=4時信息量最小,AIC=241.34,SBC=245.32。LB,Q或DW統(tǒng)計量用于檢驗(yàn)擬合效果。經(jīng)殘差自相關(guān)檢驗(yàn),延遲6階、12階和18階,P值0.4509,0.9864,0.9998>0.05,經(jīng)確認(rèn)原序列信息已提取充分,ARIMA(0,1,4)表達(dá)式:(1-B)2xt=1-0.3016B+0.7922B2-0.6868B3+0.11B4。經(jīng)分析模型擬合效果佳,對2012年外推預(yù)測值3556.7,與實(shí)際情況相符。

        討 論

        1.衛(wèi)生支出時序數(shù)據(jù)有早期長時平緩、后期起伏遞增趨勢,GM模型累加后無法擬合指數(shù)函數(shù),截取近期強(qiáng)趨勢數(shù)據(jù)后仍不好,對該類特點(diǎn)數(shù)據(jù)擬合性能不高,有選擇性,尤為適配于數(shù)據(jù)少、貧信息、欠規(guī)則、隨機(jī)時序數(shù)據(jù)特點(diǎn)問題[3]。

        2.衛(wèi)生支出時序數(shù)據(jù)SVM法建模時,順次截取等數(shù)據(jù)段后,段前數(shù)據(jù)為輸入,段后數(shù)據(jù)為輸出,經(jīng)反復(fù)訓(xùn)練計算,經(jīng)外推仿真得預(yù)測值。數(shù)據(jù)有強(qiáng)趨勢性,雖經(jīng)參數(shù)調(diào)試優(yōu)化,外推預(yù)測欠佳,該法未有效適配強(qiáng)趨勢數(shù)據(jù),預(yù)測應(yīng)用代表意義不應(yīng)夸大。

        3.衛(wèi)生支出時序數(shù)據(jù)有平緩光滑曲線增長趨勢,類型多而須借助特征計算優(yōu)選。鑒于對數(shù)據(jù)量要求低,不應(yīng)全納入,否則歷史數(shù)據(jù)干擾近期信息描述力度,外推效果差。該法對趨勢反映會過度敏感,引起曲線外推值過大,該法適于短期外推。

        4.衛(wèi)生支出時序數(shù)據(jù)有明顯趨勢,且觀測期較長(數(shù)據(jù)豐富),可差分提取趨勢信息后平穩(wěn)序列以ARIMA法建模,算法復(fù)雜易實(shí)現(xiàn)。簡言之,ARIMA法通用性強(qiáng)且長時數(shù)據(jù)優(yōu)先應(yīng)用,短時數(shù)據(jù)可選GM法,趨勢數(shù)據(jù)可選曲線法,時序數(shù)據(jù)圖預(yù)分析和方法性能特點(diǎn)綜合論證后預(yù)測建模設(shè)計有科學(xué)性,探索應(yīng)用對策有必要。

        1.徐國祥.統(tǒng)計預(yù)測與決策.上海:上海財經(jīng)大學(xué)出版社,2012.

        2.王燕.應(yīng)用時間序列分析.北京:中國人民大學(xué)出版社,2012,12:120-177.

        3.周林.GM(1,1)模型預(yù)測腸道傳染病發(fā)病趨勢的應(yīng)用.中國衛(wèi)生統(tǒng)計,2013,30(5):715,718.

        (責(zé)任編輯:郭海強(qiáng))

        *健康山東重大社會風(fēng)險預(yù)測與治理協(xié)同創(chuàng)新中心項(xiàng)目(XT1401001-1401003);山東統(tǒng)計局項(xiàng)目(2014-184);濰坊市科技局項(xiàng)目(201301079)

        1.濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院(261053)

        2.健康領(lǐng)域社會風(fēng)險預(yù)測治理協(xié)同創(chuàng)新中心

        3.健康山東重大社會風(fēng)險與治理協(xié)同創(chuàng)新中心

        △通信作者:張利平

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        国产三级久久精品三级91| 无码日韩AⅤ一区二区三区| 国产精品久久久亚洲第一牛牛| 在线观看国产av一区二区 | 级毛片内射视频| 漂亮人妻被中出中文字幕久久 | 午夜射精日本三级| 无码一区二区波多野结衣播放搜索| 在线看片国产免费不卡| 亚洲精品综合久久中文字幕| 久久精品国产亚洲夜色av网站| 图片区小说区激情区偷拍区| 白浆出来无码视频在线| 狼人狠狠干首页综合网| 日韩精品一区二区在线天天狠天| 狠狠色婷婷久久一区二区三区| 黄色资源在线观看| 一区二区三区精品偷拍av| 极品粉嫩小仙女高潮喷水网站 | 东北熟妇露脸25分钟| 粗大猛烈进出白浆视频| 日韩中文字幕中文有码| 日韩精品极品在线观看视频| 国产三级久久精品三级91| 麻豆国产原创视频在线播放| 亚洲电影中文字幕| 国产自拍视频一区在线| 无码熟妇人妻av在线影片最多| 躁躁躁日日躁| 无遮挡粉嫩小泬| 国产精品成人久久a级片| 日韩熟女系列中文字幕| 国产成人涩涩涩视频在线观看| 伊人久久一区二区三区无码| 中文字幕人妻久久一区二区三区| 亚洲中文字幕无码爆乳app| 99精品视频在线观看免费| 国产精品一区二区AV不卡| 一区二区三区日韩亚洲中文视频| 国产成本人片无码免费2020| 本道无码一区二区久久激情|