亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        ARIMA和Prophet模型在艾滋病發(fā)病預(yù)測(cè)中的應(yīng)用

        2020-10-20 02:22:32李順勇李可心
        河南科學(xué) 2020年9期
        關(guān)鍵詞:階數(shù)時(shí)序差分

        李順勇, 李可心

        (山西大學(xué)數(shù)學(xué)科學(xué)學(xué)院,太原 030006)

        艾滋病主要是由HIV病毒攻擊人體免疫系統(tǒng)而引起,具有傳染性強(qiáng)、致死率高的特點(diǎn),現(xiàn)已引起全球健康機(jī)構(gòu)的高度關(guān)注[1-3]. 目前,我國(guó)處于艾滋病發(fā)病和死亡的高峰期,有效地預(yù)測(cè)短期內(nèi)艾滋病的發(fā)病人數(shù),可以為我國(guó)衛(wèi)生防護(hù)工作帶來(lái)可靠的依據(jù). 當(dāng)前,國(guó)內(nèi)對(duì)各地區(qū)艾滋病發(fā)病人數(shù)的預(yù)測(cè)研究已有多種方法,且都取得了不錯(cuò)的效果[4-14]. 2017年,Taylor等研究人員提出了一種新時(shí)序模型,即Prophet模型. 該模型加入了新的構(gòu)成項(xiàng)Holiday 以及Changepoint,并將其廣泛應(yīng)用于語(yǔ)言處理以及圖像處理中[15-16]. 但是相比之下,Prophet模型與傳統(tǒng)時(shí)序模型哪個(gè)對(duì)艾滋病發(fā)展?fàn)顩r有更好的預(yù)測(cè)效果,也是值得討論的問(wèn)題. 本文采用ARIMA乘積季節(jié)模型和Prophet模型對(duì)我國(guó)艾滋病發(fā)病數(shù)進(jìn)行預(yù)測(cè)與評(píng)估,從而為艾滋病的控制和預(yù)防提供合理依據(jù).

        1 資料與方法

        1.1 資料來(lái)源

        2013年1月至2019年10月的艾滋病發(fā)病人數(shù)來(lái)源于國(guó)家疾病預(yù)防控制局[17],發(fā)病人數(shù)據(jù)統(tǒng)計(jì)截至每月最后一天.

        1.2 ARIMA時(shí)間序列模型的構(gòu)建

        ARIMA模型是應(yīng)用最廣泛的一種時(shí)間序列預(yù)測(cè)統(tǒng)計(jì)模型,主要是利用一定的數(shù)學(xué)原理,將預(yù)測(cè)對(duì)象隨時(shí)間推移所形成的數(shù)據(jù)序列進(jìn)行近似描述. ARIMA模型不需利用額外的變量,但要求序列本身或差分后的序列是平穩(wěn)的[18-20]. 考慮到時(shí)間序列數(shù)據(jù)的季節(jié)性、周期性和長(zhǎng)期趨勢(shì)性,選擇了ARIMA乘積季節(jié)模型,即ARIMA(p,d,q)×(P,D,Q)s.其中,p和P分別為自回歸平均階數(shù)與季節(jié)性自回歸平均階數(shù),q和Q分別為移動(dòng)平均階數(shù)與季節(jié)性移動(dòng)平均階數(shù),d和D分別為平穩(wěn)化過(guò)程中的差分階數(shù)與季節(jié)差分階數(shù),s為季節(jié)周期[1].

        圖1 Prophet模型流程圖Fig.1 Prophet model flow chart

        1.3 Prophet模型

        Prophet 模型是Taylor 等研究人員在2017 年提出的時(shí)序模型,該模型能夠有效地分析數(shù)據(jù)本身的特征以及變化規(guī)律,并有良好的預(yù)測(cè)性能. 該模型相較于傳統(tǒng)時(shí)序模型,加入了節(jié)日以及切換因子,預(yù)測(cè)更加靈活[21-22],Prophet工作流程如圖1.

        1.3.1 模型構(gòu)成

        Prophet模型從另一角度可看作加性模型[22],分為趨勢(shì)、季節(jié)、節(jié)日3個(gè)部分,模型構(gòu)成如式(1).

        1.3.2 模型解釋

        1)g(t)為趨勢(shì)項(xiàng),是模型的核心項(xiàng),用來(lái)擬合時(shí)序中的非周期性變化[23-24],該項(xiàng)函數(shù)式為

        式中:C 代表容量;k 代表模型的增長(zhǎng)率;b 代表模型偏移量,當(dāng)t 不斷增加時(shí),1+e()-k(t-b)會(huì)趨近于1,即g(t)趨近于C.

        2)s(t)為季節(jié)項(xiàng),該項(xiàng)的周期因子采用了傅里葉級(jí)數(shù),表達(dá)式為:

        式中:T代表周期;n代表模型中使用周期數(shù)的一半.

        3)h(t)為節(jié)日項(xiàng),該項(xiàng)將節(jié)日影響這一因素獨(dú)立出來(lái),表達(dá)式為

        式中:每個(gè)節(jié)日用i 表示;Di為節(jié)日集合;Z(t)=[1(t ∈D1),…,1(t ∈Di)];1(t ∈Di)為指示函數(shù),若t 在Di中,則1(t ∈Di)的值為1,若t不在Di中,則1(t ∈Di)的值為0;κi為每個(gè)節(jié)日的參數(shù),代表對(duì)每個(gè)節(jié)日的影響.

        2 結(jié)果與分析

        2.1 ARIMA時(shí)間序列模型

        2.1.1 檢驗(yàn)時(shí)間序列穩(wěn)定性 利用Python軟件,對(duì)2013年1月至2019年10月的艾滋病發(fā)病數(shù)進(jìn)行趨勢(shì)與季節(jié)分解(圖2). 圖2表明,艾滋病發(fā)病人數(shù)在2013年1月至2019年10月呈現(xiàn)明顯上升趨勢(shì),且具有極強(qiáng)的季節(jié)性,周期約為1年. 進(jìn)入10月后,發(fā)病人數(shù)迅速升高,達(dá)到一年中的頂峰,隨后又快速下降至最小值.

        為判斷該時(shí)間序列數(shù)據(jù)是否為平穩(wěn)序列,對(duì)其進(jìn)行Dickey Fuller 平穩(wěn)性檢驗(yàn),結(jié)果見(jiàn)表1. 所得P值為1.00,遠(yuǎn)遠(yuǎn)大于臨界值0.05,說(shuō)明不能拒絕原假設(shè). 所以在一定的可信度下,可以認(rèn)為該時(shí)間序列數(shù)據(jù)是不穩(wěn)定的.

        圖2 AIDS發(fā)病數(shù)趨勢(shì)分解圖Fig.2 AIDS incidence trend decomposition chart

        表1 DF檢驗(yàn)統(tǒng)計(jì)結(jié)果Tab.1 DF test statistics result

        2.1.2 時(shí)間序列平穩(wěn)化 時(shí)間序列數(shù)據(jù)的不穩(wěn)定因素主要有兩個(gè):一是趨勢(shì),數(shù)據(jù)隨時(shí)間推移有上升或下降的趨勢(shì). 二是季節(jié)性,數(shù)據(jù)在經(jīng)過(guò)一段時(shí)間后,又出現(xiàn)相似的發(fā)展?fàn)顩r. 對(duì)不平穩(wěn)序列的處理方式主要有對(duì)數(shù)變換法、平滑法、差分法以及分解法. 本文主要采用對(duì)數(shù)變換法消除時(shí)間序列的方差不齊性,采用差分法消除時(shí)間序列的季節(jié)性.

        首先對(duì)2013年1月至2019年10月間的艾滋病發(fā)病人數(shù)進(jìn)行對(duì)數(shù)變換,使得數(shù)據(jù)值域的范圍縮小,振幅減小,并在此基礎(chǔ)上進(jìn)行一階差分(d=1)(圖3(a)),由圖可見(jiàn)時(shí)序圖仍存在一定的趨勢(shì). 再進(jìn)一步進(jìn)行季節(jié)差分(D=1)(圖3(b)). 結(jié)果表明,經(jīng)過(guò)兩次差分后,時(shí)間序列的移動(dòng)平均值與移動(dòng)標(biāo)準(zhǔn)差都趨于一個(gè)固定的常數(shù),幾乎沒(méi)有波動(dòng),由此可以認(rèn)為此時(shí)的序列數(shù)據(jù)已經(jīng)達(dá)到平穩(wěn)狀態(tài).

        2.1.3 模型階數(shù)的確定 對(duì)經(jīng)過(guò)一階差分與季節(jié)差分后的平穩(wěn)時(shí)間序列做ACF 和PACF 檢測(cè),結(jié)果見(jiàn)圖4. 時(shí)間序列的自相關(guān)系數(shù)與偏自相關(guān)系數(shù)超過(guò)95%落在2 倍標(biāo)準(zhǔn)差范圍內(nèi),且呈現(xiàn)拖尾狀態(tài),故初步假定模型為ARIMA(p,1,q)×(P,1,Q)12. 其中,p、q、P 和Q 可以取值為0 和1. 依據(jù)赤池信息量準(zhǔn)則(AIC)和貝葉斯信息量準(zhǔn)則(BIC)對(duì)16 種模型進(jìn)行判定(表2),最終選取AIC 和BIC 最小值所對(duì)應(yīng)的最優(yōu)模型:ARIMA(0,1,1)×(0,1,1)12.

        圖3 兩次差分后的指標(biāo)時(shí)序圖Fig.3 Index timing chart after two differences

        圖4 差分后序列的ACF和PACF圖Fig.4 ACF and PACF diagram of the sequence after difference

        表2 16種ARIMA模型的信息量對(duì)比Tab.2 Comparison of the information contents of ARIMA model

        2.1.4 AIDS發(fā)病數(shù)預(yù)測(cè) 將2013年1月至2019年10月的艾滋病發(fā)病人數(shù)取對(duì)數(shù)后分為訓(xùn)練集(2013年1月至2018 年12 月)和預(yù)測(cè)集(2019 年1 月至2019 年10 月),利用ARIMA 模型進(jìn)行預(yù)測(cè)與評(píng)估,結(jié)果見(jiàn)表3 和圖5. 可以看出,艾滋病發(fā)病人數(shù)的預(yù)測(cè)數(shù)據(jù)和實(shí)際數(shù)據(jù)基本吻合,且發(fā)展趨勢(shì)也相同,相對(duì)誤差RMSE 為345.46.

        表3 ARIMA模型2019 年各月序列預(yù)測(cè)評(píng)價(jià)結(jié)果Tab.3 Monthly sequence prediction evaluation results in 2019 with ARIMA model

        圖5 ARIMA模型序列預(yù)測(cè)趨勢(shì)圖Fig.5 Monthly forecast trend chart with ARIMA model

        2.2 Prophet模型

        2.2.1 評(píng)價(jià)指標(biāo)選取 為判斷Prophet模型對(duì)艾滋病發(fā)病數(shù)的預(yù)測(cè)效果,同樣選取相對(duì)誤差(RMSE)作為評(píng)估的標(biāo)準(zhǔn). 指標(biāo)計(jì)算公式:

        式中:x為艾滋病發(fā)病數(shù)的實(shí)際值;x?為Prophet 模型的預(yù)測(cè)值;n為預(yù)測(cè)的總月數(shù). RMSE值越小,說(shuō)明模型預(yù)測(cè)性能越好.

        2.2.2 Prophet 模型擬合效果 采用fbprophet 庫(kù)建立Prophet 模型,模型的interval width 參數(shù)設(shè)置為0.95,periods 參數(shù)設(shè)置為12,fre設(shè)置為MS. 運(yùn)用Prophet模型對(duì)2013年1月至2019年10月的數(shù)據(jù)進(jìn)行擬合,結(jié)果見(jiàn)表4和圖6. 可以看出,預(yù)測(cè)趨勢(shì)和實(shí)際趨勢(shì)基本相同,RMSE為328.88.

        表4 Prophet模型2019 年各月序列預(yù)測(cè)評(píng)價(jià)結(jié)果Tab.4 Monthly sequence prediction evaluation results in 2019 with Prophet model

        圖6 Prophet模型序列預(yù)測(cè)趨勢(shì)圖Fig.6 Monthly forecast trend chart with Prophet model

        3 討論

        艾滋病是全球關(guān)注的健康衛(wèi)生問(wèn)題,正確預(yù)測(cè)艾滋病的發(fā)展趨勢(shì)有助于艾滋病的控制和防護(hù).

        ARIMA模型結(jié)合了回歸分析和移動(dòng)平均兩種方法的優(yōu)點(diǎn),主要通過(guò)階數(shù)判定來(lái)選擇最優(yōu)模型,它以數(shù)據(jù)平穩(wěn)性為前提條件,對(duì)具有趨勢(shì)性與周期性的序列進(jìn)行預(yù)測(cè). 本文以2013年1月至2019年10月艾滋病發(fā)病人數(shù)為基礎(chǔ),根據(jù)AIC最小原則選取ARIMA(0,1,1)×(0,1,1)12模型,對(duì)全國(guó)艾滋病發(fā)病數(shù)進(jìn)行了預(yù)測(cè)和驗(yàn)證. 結(jié)果表明,實(shí)際發(fā)病人數(shù)在預(yù)測(cè)值的95%置信范圍內(nèi)波動(dòng),說(shuō)明ARIMA模型可以有效地對(duì)我國(guó)艾滋病發(fā)病狀況進(jìn)行短期預(yù)測(cè).

        Prophet模型在傳統(tǒng)時(shí)序模型的基礎(chǔ)上,減小了時(shí)間在結(jié)構(gòu)上的依賴關(guān)系,綜合考慮了時(shí)間序列中可能存在的趨勢(shì)性、周期性、節(jié)假日效應(yīng)以及異常值等情況,可以通過(guò)調(diào)整參數(shù)來(lái)尋找最優(yōu)的預(yù)測(cè)效果. 本文在進(jìn)行多次模擬后,將參數(shù)interval width設(shè)置為0.95,periods設(shè)置為12,fre設(shè)置為MS,對(duì)2013年1月至2019年10月的艾滋病發(fā)病數(shù)進(jìn)行擬合. 結(jié)果表明,預(yù)測(cè)數(shù)據(jù)和實(shí)際數(shù)據(jù)基本吻合,且發(fā)展趨勢(shì)也相同. 同時(shí),相比ARIMA模型,Prophet模型預(yù)測(cè)所得的RMSE有所降低,這說(shuō)明Prophet模型在全國(guó)艾滋病發(fā)病數(shù)上的預(yù)測(cè)效果優(yōu)于ARIMA模型.

        猜你喜歡
        階數(shù)時(shí)序差分
        時(shí)序坐標(biāo)
        基于Sentinel-2時(shí)序NDVI的麥冬識(shí)別研究
        關(guān)于無(wú)窮小階數(shù)的幾點(diǎn)注記
        數(shù)列與差分
        確定有限級(jí)數(shù)解的階數(shù)上界的一種n階展開方法
        一種毫米波放大器時(shí)序直流電源的設(shè)計(jì)
        電子制作(2016年15期)2017-01-15 13:39:08
        基于差分隱私的大數(shù)據(jù)隱私保護(hù)
        一種新的多址信道有效階數(shù)估計(jì)算法*
        關(guān)于動(dòng)態(tài)電路階數(shù)的討論
        相對(duì)差分單項(xiàng)測(cè)距△DOR
        太空探索(2014年1期)2014-07-10 13:41:50
        领导边摸边吃奶边做爽在线观看 | 国产粉嫩嫩00在线正在播放| 91亚洲精品久久久中文字幕| 成人日韩精品人妻久久一区| 老司机亚洲精品影院| 亚洲福利视频一区| 精品理论一区二区三区| 男女射精视频在线观看网站| 国产电影一区二区三区| 成 人 网 站 免 费 av| 尤物蜜芽福利国产污在线观看 | 日本视频一区二区三区| 精品+无码+在线观看| 日本又黄又爽gif动态图| 中文字幕日产人妻久久| 丝袜美腿一区在线观看| 精品av熟女一区二区偷窥海滩| 老司机在线精品视频网站| 男人阁久久| 白白色视频这里只有精品| 国产综合精品| 五十路熟妇亲子交尾| 精品日本韩国一区二区三区| 麻豆最新国产av原创| 国内露脸少妇精品视频| 日韩AV有码无码一区二区三区| 国产激情免费观看视频| 女人无遮挡裸交性做爰| 男男车车的车车网站w98免费| 精品国产一区二区三区久久女人| 精品老熟女一区二区三区在线| 亚洲精品无码专区| 日本高清一区二区三区水蜜桃| 日韩精品中文字幕综合| 在线观看国产成人av天堂野外| 精精国产xxxx视频在线播放| 国产精品亚洲午夜不卡| 国产一区二区白浆在线观看| 国产98色在线 | 国产| 国产欧美VA欧美VA香蕉在| 成人在线视频自拍偷拍|