亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于組合預(yù)測(cè)模型的疫情確診人數(shù)預(yù)測(cè)

        2022-11-25 02:56:14龐夢(mèng)吟王海寧萬(wàn)通明
        關(guān)鍵詞:新冠預(yù)測(cè)疫情

        龐夢(mèng)吟,王海寧,萬(wàn)通明,馬 苗,2*

        (1.陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,陜西 西安 710119;2.空天地海一體化大數(shù)據(jù)應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室,陜西 西安 710129)

        0 引 言

        公共衛(wèi)生安全事件常常是牽動(dòng)著一個(gè)地區(qū)、一個(gè)國(guó)家,乃至整個(gè)世界的重大問(wèn)題。新冠肺炎疫情的發(fā)生和蔓延,對(duì)中國(guó)乃至全球經(jīng)濟(jì)產(chǎn)生了巨大的沖擊和深遠(yuǎn)影響。在對(duì)抗新冠肺炎疫情的過(guò)程中,已經(jīng)有不少的科研人員研究了疫情傳播及其發(fā)展趨勢(shì),為疫情防控政策的制定提供宏觀的數(shù)據(jù)依據(jù),節(jié)省決策時(shí)間。

        現(xiàn)有的傳染病預(yù)測(cè)方法已有很多,如流行控制圖法、灰色模型、求和自回歸移動(dòng)平均模型(Auto Regressive Integrated Moving Average Model,ARIMA)、Logistic回歸模型、神經(jīng)網(wǎng)絡(luò)模型等。針對(duì)新冠肺炎疫情問(wèn)題,研究人員進(jìn)行了深入研究,并取得了一系列成果。例如,張琳采用一般增長(zhǎng)模型分3個(gè)階段非線性擬合新冠肺炎疫情中確診、疑似和密切接觸人數(shù),擬合結(jié)果與實(shí)證數(shù)據(jù)高度吻合[1]。喻孜等人基于時(shí)變參數(shù)-SIR模型評(píng)估和預(yù)測(cè)COVID-19疫情,預(yù)測(cè)在2020年2月9日確診人數(shù)達(dá)到高峰后,將呈現(xiàn)下降趨勢(shì)[2]。Li等人建立梯度推進(jìn)決策樹(shù)(Gradient Boosting Decision Tree,GBDT)、Logistic回歸(Logistic Regression,LR)模型和簡(jiǎn)化LR模型預(yù)測(cè)COVID-19的死亡率,其結(jié)果表明GBDT模型顯示出最高的敏感性和特異性,且死亡率的預(yù)測(cè)性能優(yōu)于LR模型[3]。盛華熊等人對(duì)武漢封城階段運(yùn)用經(jīng)典的SIR模型和差分遞推方法分析來(lái)預(yù)測(cè)疫情,理論值和實(shí)際值能較好吻合。對(duì)武漢封城前的自由傳染階段運(yùn)用Logistic模型進(jìn)行預(yù)測(cè)和比較,且模型對(duì)其他地區(qū)疾病傳播的分析與預(yù)測(cè)具有廣泛適用性[4]。李偉煒等人利用動(dòng)力學(xué)模型(Susceptible Exposed Infectious Removed,SEIR)擬合COVID-19的再生系數(shù)曲線,并對(duì)湖北省以及國(guó)外疫情進(jìn)行預(yù)測(cè)分析,其結(jié)果表明湖北省的疫情傳播相對(duì)于國(guó)外得到更好控制[5]。王瑞等人提出運(yùn)用Dropout技術(shù)的LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,構(gòu)建更多層數(shù)的LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并在隱藏層采用Dropout技術(shù),能夠有效解決過(guò)擬合問(wèn)題,較精準(zhǔn)地預(yù)測(cè)疫情趨勢(shì)[6]。Takasar等人采用SEIQR模型通過(guò)參數(shù)校正預(yù)測(cè)了巴基斯坦的情況并對(duì)未來(lái)情況進(jìn)行了討論[7]。Yudistira等人考慮COVID-19病例增長(zhǎng)的多種因素,使用可解釋卷積-LSTM的視覺(jué)歸因觀察高貢獻(xiàn)因素,比其他模型的預(yù)測(cè)誤差都低[8]。季偉東等人分析粒子群優(yōu)化算法的尋優(yōu)特點(diǎn),改進(jìn)了尋優(yōu)速度和尋優(yōu)目的,采用100天新增確診人數(shù)數(shù)據(jù),將改進(jìn)算法與其他算法對(duì)比,驗(yàn)證其算法的良好性能[9]。Wibowo等人采用Logistic回歸模型預(yù)測(cè)印尼新冠肺炎疫情,實(shí)驗(yàn)結(jié)果誤差較小[10]。Song Jialu等人提出一種通過(guò)考慮時(shí)變模型參數(shù)來(lái)動(dòng)態(tài)預(yù)測(cè)新冠肺炎擴(kuò)展的新方法,用最大似然估計(jì)理論估計(jì)時(shí)變模型參數(shù),提出擴(kuò)展卡爾曼濾波器來(lái)估計(jì)新冠肺炎擴(kuò)散情況[11]。Shahid等人采用ARIMA、SVR、LSTM、Bi-LSTM等模型對(duì)COVID-19影響的十個(gè)主要國(guó)家進(jìn)行預(yù)測(cè),其結(jié)果表明預(yù)測(cè)模型的性能優(yōu)劣排序?yàn)锽i-LSTM>LSTM>SVR>ARIMA[12]。

        受已有研究成果啟發(fā),由于Logistic模型常常被應(yīng)用于描述種群、傳染病增長(zhǎng)以及人口預(yù)測(cè)等領(lǐng)域,因此利用Logistic曲線的特性選擇該模型,通過(guò)調(diào)參擬合疫情的歷史變化趨勢(shì),并預(yù)測(cè)未來(lái)的疫情數(shù)據(jù)。但是在本次疫情傳播過(guò)程中,受外界諸多因素影響較大,同時(shí)疫情確診人數(shù)數(shù)據(jù)具有時(shí)間序列特征,而LSTM深度學(xué)習(xí)網(wǎng)絡(luò)模型擅長(zhǎng)解決與時(shí)間序列高度相關(guān)的問(wèn)題,可以來(lái)學(xué)習(xí)一些人為干擾因素,因此該文利用國(guó)家衛(wèi)生健康委員會(huì)、世界衛(wèi)生組織等權(quán)威機(jī)構(gòu)公開(kāi)報(bào)道的數(shù)據(jù),以歷史累計(jì)確診人數(shù)為基礎(chǔ),采用上述兩個(gè)模型的組合來(lái)分析預(yù)測(cè)之后疫情累計(jì)確診人數(shù);最后,通過(guò)評(píng)價(jià)指標(biāo)值對(duì)各模型預(yù)測(cè)結(jié)果進(jìn)行分析比較,結(jié)果表明組合預(yù)測(cè)模型相對(duì)其他模型的預(yù)測(cè)效果更好,為后續(xù)的疫情預(yù)測(cè)和防控工作提供技術(shù)支撐。

        1 組合預(yù)測(cè)模型

        單個(gè)預(yù)測(cè)模型進(jìn)行預(yù)測(cè)時(shí)會(huì)存在一些缺陷,如信息源的不全面、對(duì)模型設(shè)定形式敏感等。自Bates和Granger首次提出組合預(yù)測(cè)方法以來(lái),因其能有效提高預(yù)測(cè)精度,受到國(guó)內(nèi)外預(yù)測(cè)工作者的重視。組合預(yù)測(cè)是指應(yīng)用兩種和兩種以上的預(yù)測(cè)模型對(duì)傳染病進(jìn)行預(yù)測(cè),綜合利用單個(gè)模型所提供的信息,以適當(dāng)?shù)募訖?quán)平均形式得出組合預(yù)測(cè)模型[10],盡可能地提高精度。組合預(yù)測(cè)模型有線性組合模型、最優(yōu)線性組合模型、貝葉斯組合模型、轉(zhuǎn)換函數(shù)組合模型、計(jì)量經(jīng)濟(jì)與系統(tǒng)動(dòng)力學(xué)組合模型等,該文采用的是線性組合模型。

        1.1 Logistic模型

        Logistic模型,又可稱(chēng)為邏輯回歸模型,是一種廣義的線性回歸分析模型[13],它是皮埃爾·弗朗索瓦·韋呂勒在研究它與人口增長(zhǎng)的關(guān)系時(shí)命名的。在疫情傳播過(guò)程中,剛開(kāi)始的環(huán)境阻力比較小,因此增長(zhǎng)率比較大;之后隨著“封城”、隔離、戴口罩等措施的實(shí)施,環(huán)境阻力增大,增長(zhǎng)率減小,傳播規(guī)律與Logistic模型類(lèi)似,故可以用Logistic模型來(lái)預(yù)測(cè)未來(lái)疫情數(shù)據(jù),其公式為:

        (1)

        其中,t為時(shí)間;K為容量,即增長(zhǎng)到最后,P(t)能達(dá)到的極限;P0為初始容量,即t=0時(shí)刻的數(shù)量;r為增長(zhǎng)速率,r越大則增長(zhǎng)越快,越快逼近K值,r越小增長(zhǎng)越慢,越慢逼近K值。該文建立Logistic模型后,采用非線性最小二乘法對(duì)K、P0、r進(jìn)行參數(shù)估計(jì),并以此對(duì)未來(lái)數(shù)據(jù)進(jìn)行預(yù)測(cè)。

        Logistic模型起初階段大致是指數(shù)增長(zhǎng);然后隨著開(kāi)始變得飽和,增加變慢;最后達(dá)到成熟時(shí),增加停止。Logistic模型常用于數(shù)據(jù)挖掘、疾病自動(dòng)診斷、經(jīng)濟(jì)預(yù)測(cè)等領(lǐng)域。例如,探討引發(fā)疾病的危險(xiǎn)因素,并根據(jù)危險(xiǎn)因素預(yù)測(cè)疾病發(fā)生的概率等[13]。

        1.2 LSTM模型

        LSTM由Hochreiter和Schmidhuber在1997首先提出,是為解決一般循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)存在的長(zhǎng)期依賴(lài)問(wèn)題而專(zhuān)門(mén)設(shè)計(jì)出來(lái)的一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò)[14]。LSTM通過(guò)增加輸入門(mén)限、遺忘門(mén)限和輸出門(mén)限,使得在自循環(huán)的過(guò)程中權(quán)重是變化的,從而避免梯度消失或者梯度膨脹的問(wèn)題。由于其獨(dú)特的設(shè)計(jì)結(jié)構(gòu),LSTM適合于處理和預(yù)測(cè)時(shí)間序列中有間隔和延遲的重要事件。

        圖1為L(zhǎng)STM單元結(jié)構(gòu)流動(dòng)圖,其中A模塊為L(zhǎng)STM的單元結(jié)構(gòu)圖。假定hi為第i時(shí)刻狀態(tài)的輸出值,xi為第i時(shí)刻的輸入值,W表示相應(yīng)門(mén)的權(quán)重矩陣,b表示相應(yīng)門(mén)的偏置,LSTM的具體流程為:

        (1)遺忘門(mén)限:將前一時(shí)刻的網(wǎng)絡(luò)輸出和當(dāng)前時(shí)刻的網(wǎng)絡(luò)輸入結(jié)合起來(lái),然后進(jìn)行線性變換后經(jīng)過(guò)sigmoid激活函數(shù),并將結(jié)果映射到0~1作為記憶衰減系數(shù)ft,其中1表示“完全接受”,0表示“完全忽略”,公式如下:

        ft=σ(Wf·[ht-1,xt]+bf)

        (2)

        it=σ(Wi·[ht-1,xt]+bi)

        (3)

        (4)

        (5)

        (4)輸出門(mén)限:首先采用類(lèi)似于計(jì)算記憶衰減系數(shù)的方法得到輸出門(mén)限的系數(shù)ot,之后將細(xì)胞狀態(tài)輸入tanh后與該系數(shù)相乘得到輸出值,這兩步公式為:

        ot=σ(Wo·[ht-1,xt]+bo)

        (6)

        ht=ot×tanh(Ct)

        (7)

        LSTM模型常用于文本生成、機(jī)器翻譯、語(yǔ)音識(shí)別、生成圖像描述和視頻標(biāo)記等領(lǐng)域,同時(shí)LSTM模型也常被應(yīng)用于機(jī)械故障診斷和預(yù)測(cè)領(lǐng)域,如處理機(jī)械設(shè)備的振動(dòng)信號(hào)、航班延誤預(yù)測(cè)、金融時(shí)間序列預(yù)測(cè)、加油站時(shí)序數(shù)據(jù)異常檢測(cè)等問(wèn)題。

        1.3 組合預(yù)測(cè)模型

        基于以上兩種模型,該文將Logistic模型和LSTM模型的預(yù)測(cè)結(jié)果通過(guò)線性回歸網(wǎng)絡(luò)[15]訓(xùn)練權(quán)重參數(shù)并進(jìn)行預(yù)測(cè),以期得到更好的預(yù)測(cè)效果。

        組合預(yù)測(cè)模型定義為:

        (8)

        損失函數(shù)為:

        (9)

        (10)

        采用小批量隨機(jī)梯度下降來(lái)優(yōu)化參數(shù),將模型各參數(shù)作如下迭代:

        (11)

        其中,|β|表示每個(gè)小批量中的樣本個(gè)數(shù),η稱(chēng)為學(xué)習(xí)率,η過(guò)大可能會(huì)導(dǎo)致震蕩而無(wú)法收斂,η過(guò)小會(huì)導(dǎo)致收斂的速度慢,因此選擇一個(gè)恰當(dāng)?shù)摩侵抵陵P(guān)重要。

        圖2為所建立的組合預(yù)測(cè)模型結(jié)構(gòu),其中LSTM模型有四層網(wǎng)絡(luò):輸入層、LSTM層、全連接層、回歸輸出層,其中設(shè)定LSTM層有200個(gè)隱含單元;Logistic模型和LSTM模型預(yù)測(cè)結(jié)果作為線性回歸網(wǎng)絡(luò)的兩個(gè)輸入,通過(guò)線性回歸網(wǎng)絡(luò)訓(xùn)練該組合預(yù)測(cè)模型后,輸出的結(jié)果為該組合預(yù)測(cè)模型的預(yù)測(cè)結(jié)果。

        2 模型求解與對(duì)比分析

        該文采用國(guó)家衛(wèi)生健康委員會(huì)公布的2020年1月13日至2020年11月13日的累計(jì)確診人數(shù),將前276天(即2020年1月13日至2020年10月14日)的數(shù)據(jù)作為訓(xùn)練集來(lái)訓(xùn)練模型,之后的30天(即2020年10月15日至2020年11月13日)作為測(cè)試集來(lái)測(cè)試模型的效果。并利用評(píng)價(jià)指標(biāo)對(duì)組合預(yù)測(cè)模型與LSTM模型、Logistic模型、SEIR模型預(yù)測(cè)進(jìn)行對(duì)比分析。

        2.1 模型求解

        基于Python語(yǔ)言和PyTorch平臺(tái)將Logistic模型與LSTM模型的預(yù)測(cè)結(jié)果作為輸入層,將其結(jié)果進(jìn)行歸一化后輸入到線性回歸網(wǎng)絡(luò)中,通過(guò)網(wǎng)絡(luò)不斷迭代對(duì)組合預(yù)測(cè)模型的參數(shù)進(jìn)行訓(xùn)練,得到的模型參數(shù)為:

        w1=1.000 5,w2=-0.001 5,b=-0.001 8

        (12)

        即最終得到的組合預(yù)測(cè)模型為:

        (13)

        圖3為組合預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,橫坐標(biāo)為天數(shù)(1月13日為開(kāi)始),縱坐標(biāo)為確診人數(shù)。實(shí)線部分為真實(shí)數(shù)據(jù),虛線部分為預(yù)測(cè)的數(shù)據(jù)。圖3表明,在前期疫情剛剛爆發(fā),沒(méi)有人為因素、政策等措施的控制,疫情的累計(jì)確診人數(shù)急劇增長(zhǎng),在“封城”等一些措施實(shí)施后,疫情的累計(jì)確診人數(shù)的增長(zhǎng)速率減小,在中后期確診人數(shù)趨于穩(wěn)定,但仍在緩慢增長(zhǎng)。

        2.2 對(duì)比分析

        組合預(yù)測(cè)模型、LSTM模型、Logistic模型、SEIR模型在2020年10月15日-2020年11月13日的累計(jì)確診人數(shù)預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)如表1所示。從表1中可以看出,組合預(yù)測(cè)模型得到的結(jié)果最接近于真實(shí)數(shù)據(jù),LSTM模型次之,Logistic模型和SEIR模型的結(jié)果與真實(shí)數(shù)據(jù)相差較遠(yuǎn)。Logistic模型的多日預(yù)測(cè)結(jié)果差距并不大,這是因?yàn)長(zhǎng)ogistic模型的特征為后期階段達(dá)到容量后數(shù)據(jù)基本不變,因此在該時(shí)期預(yù)測(cè)結(jié)果較差。由于在后期國(guó)家對(duì)疫情的傳播進(jìn)行了有效的控制使得累計(jì)確診人數(shù)增長(zhǎng)緩慢,同時(shí)感染概率、康復(fù)概率、潛伏者的患病概率等因素值無(wú)法精確評(píng)估,因此在該時(shí)期SEIR模型的預(yù)測(cè)效果相對(duì)較差,預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)相差較大。

        對(duì)于回歸模型的評(píng)價(jià)指標(biāo)有以下三種:

        (1)均方根誤差(Root Mean Squared Error,RMSE)。

        (14)

        (2)平均絕對(duì)誤差(Mean Absolute Error,MAE)。

        (15)

        (3)平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)。

        表1 不同模型預(yù)測(cè)2020年10月15日-2020年11月13日的累計(jì)確診人數(shù)

        (16)

        根據(jù)這三個(gè)指標(biāo),所提出的組合預(yù)測(cè)模型與其他三種模型的指標(biāo)值如表2所示。

        表2表明,Logistic模型與SEIR模型的RMSE值、MAE值和MAPE值更大,說(shuō)明預(yù)測(cè)效果較差;而LSTM模型的RMSE值、MAE值和MAPE值較小,說(shuō)明預(yù)測(cè)效果較好;組合預(yù)測(cè)模型較其他模型誤差最小,說(shuō)明預(yù)測(cè)效果最好。

        表2 組合預(yù)測(cè)模型與單一模型的評(píng)價(jià)指標(biāo)

        3 結(jié)束語(yǔ)

        為克服單一模型預(yù)測(cè)精度低的缺點(diǎn),在Logistic模型和LSTM模型預(yù)測(cè)的基礎(chǔ)上,建立了基于線性回歸網(wǎng)絡(luò)進(jìn)行訓(xùn)練的組合預(yù)測(cè)模型,并預(yù)測(cè)了之后的累計(jì)確診人數(shù),其中所采用的LSTM模型使用前一時(shí)間步的觀測(cè)值來(lái)更新網(wǎng)絡(luò)狀態(tài),使得到的預(yù)測(cè)值更加準(zhǔn)確。采用三種評(píng)價(jià)指標(biāo)將組合預(yù)測(cè)模型與LSTM模型、Logistic模型、SEIR模型進(jìn)行評(píng)估對(duì)比,結(jié)果表明所建立的組合預(yù)測(cè)模型誤差更小,預(yù)測(cè)效果更準(zhǔn)確,可以為疫情預(yù)測(cè)提供科學(xué)有效的參考,同時(shí)為之后可能發(fā)生的公共衛(wèi)生安全事件提供準(zhǔn)確的預(yù)測(cè)模型。

        猜你喜歡
        新冠預(yù)測(cè)疫情
        無(wú)可預(yù)測(cè)
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預(yù)測(cè)卷(A卷)
        選修2-2期中考試預(yù)測(cè)卷(B卷)
        戰(zhàn)疫情
        新冠疫苗怎么打?
        您想知道的新冠疫苗那些事
        抗疫情 顯擔(dān)當(dāng)
        疫情中的我
        寧愿死于新冠,也要自由?
        37°女人(2020年5期)2020-05-11 05:58:52
        久99久精品视频免费观看v| 少妇人妻在线无码天堂视频网| 人人爽人人爱| 在线观看av手机网址| 中文字幕国产精品专区| 国产日韩精品中文字幕| 国产伦理一区二区| 香蕉视频在线观看国产| 美女黄网站永久免费观看网站| 东北熟妇露脸25分钟| 亚洲av片在线观看| 亚洲AV无码一区二区三区日日强| 一区二区特别黄色大片| 国产国语按摩对白av在线观看| 欧美四房播播| 18禁免费无码无遮挡网站| 中文字幕人妻少妇美臀| 一区二区三区中文字幕脱狱者| 屁屁影院ccyy备用地址 | 无码精品一区二区三区超碰 | 国产人妻熟女高跟丝袜图片| 99久久综合狠狠综合久久| 国产亚洲一区二区三区夜夜骚| 亚洲国产精品久久无人区| 忘忧草社区www日本高清| 日韩AV无码一区二区三区不卡毛片| 少妇激情一区二区三区久久大香香 | 嗯啊 不要 啊啊在线日韩a| 国产激情视频在线观看大全| 久久久老熟女一区二区三区| 国产精品亚洲A∨天堂不卡| 日韩精品视频中文字幕播放| 综合五月激情二区视频| 亚洲av第一成肉网| 国产精品视频免费一区二区三区| 一区二区三区最新中文字幕| 久久夜色精品国产噜噜麻豆| 国产国拍亚洲精品福利| 一本色道久久88加勒比| 亚洲国产成人精品无码区二本| 夜夜爽无码一区二区三区 |