梁晴 宋彥辰
摘 要:埃博拉病毒所致疾病傳播速度遠遠高于其控制的速度,本文通過分析其傳播過程建立了埃博拉病毒傳播模型,并使用拉丁超立方抽樣對疾病傳播進行預測估計。首先,根據(jù)Sir Epidemic動態(tài)系統(tǒng)-seiifr模型建立了一個模型,在這個模型中,考慮了暴露于人群中的易感人群、埃博拉病人以及患者的自愈恢復。為了確定最優(yōu)參數(shù),構造了最小二乘法優(yōu)化方案。結果顯示該模型短期預測效果較好。
關鍵詞:埃博拉病毒傳播 拉丁超立方抽樣 最小二乘法
引言
2014年西非全面爆發(fā)的埃博拉疫情(EVD)是世界近年來見證的規(guī)模空前、規(guī)模巨大、范圍廣泛和嚴重后果的公共衛(wèi)生危機。本輪埃博拉疫情主要突擊西非幾內(nèi)亞、利比里亞和塞拉利昂三個國家。 這是自1976年人類首次發(fā)現(xiàn)并命名埃博拉病毒以來歷史上最嚴重的公共衛(wèi)生災難,顯示出與過去的許多不同特征。
1 埃博拉傳播模型
為了研究埃博拉病毒傳播的規(guī)律性,本文建立了分階段的埃博拉傳播模型,明確納入疾病的自然病史和動態(tài)ETU能力,同時考慮到諸如報告率、癥狀評分和高危人群比例問題等因素??梢允褂帽疚哪P蛠碓u估預測病例的不確定性、死亡和床位預測,估計疾病的每個階段對傳播的影響,并檢查ETU能力供應,減少傳染病對EVD爆發(fā)的影響動態(tài)的關系。
從圖1所示的結構模型可看出,該模型包括分階段感染過程,以反映隨著感染進展而增加的感染癥狀和傳播。埃博拉經(jīng)常經(jīng)歷多個階段的疾?。旱谝浑A段是感染的初始階段,并且癥狀趨于輕微,并且常常發(fā)展成腹瀉和嘔吐;第二階段是更嚴重的階段,伴有更嚴重的癥狀(例如出血和多器官衰竭),典型的進展約5-7天。受感染的人最有可能在第一階段復原,而第二階段通常是致命的。圖1的相應等式:
其中S代表易感人群比例,E代表暴露人口比例,R代表最近恢復的人口F代表已經(jīng)死亡和正在被埋葬的人的比例。
最后,將模型與世衛(wèi)組織提供的關于累計病例和死亡的數(shù)據(jù)聯(lián)系起來。
2參數(shù)估計
本文期望有一個廣泛的模型參數(shù),特別是截至10月1日的數(shù)據(jù)仍處于指數(shù)增長階段,在這個階段,它只能有兩個參數(shù)。 這個想法已被用于開發(fā)簡單的雙參數(shù)預測模型的流行,這代表了這一流行期間內(nèi)在的不可識別性問題,因為大量參數(shù)值可用于產(chǎn)生相同的初始流行病增長率,但在流行病動態(tài)開始偏離指數(shù)增長時可能有不同的時間點。
因此,本文使用拉丁超立方(LH)抽樣方法,其中抽取了實際范圍內(nèi)的大部分參數(shù),然后對于每個樣本,只計算兩個參數(shù),即傳輸參數(shù)和總體死亡率。這使我們能夠檢查與數(shù)據(jù)和所有參數(shù)的已知實際范圍一致的潛在模型行為范圍。
實際值的范圍非常廣泛,上限為1(代表完美報告和完全處于危險中的人群),并且其下限通過取得仍然產(chǎn)生良好擬合的最低值來確定。本文對每個案例(采樣了1000個參數(shù)集,同時測試數(shù)據(jù)中每個范圍的極值,以說明模型在實際范圍內(nèi)產(chǎn)生的全部潛在行為。
圖中,紅色表示累計病例總數(shù),綠色表示累計死亡總數(shù),藍色×表示實際的累計病例總數(shù),紫色×表示實際累計死亡總數(shù)。
從圖中可以看出,自2014年11月12日以后,該模型計算得到的數(shù)據(jù)與利比亞的實際數(shù)據(jù)非常吻合,表明該模型具有較好的適應性。
結論
本文模型中存在大量參數(shù),并且僅使用簡單的加速度方法可能無法獲得全局最優(yōu)解。且擬合結果仍然存在一些差異,應該引入更多變量,并且對于參數(shù)估計,選擇遺傳算法如群算法進行求解,從而可以得到更好的全局最優(yōu)解。
參考文獻:
[1]World Health Organization.Ebola response roadmap - Situation report,http://www.who.nt/csr/disease/ebola/situation-reports/en/, 2014.
[2]Marisa C.Eisenberg,Joseph N.S.Eisenberg,JeremyP.DSilva,EdenV.wells.”Modeling surveillance and interventions in the 2014 Ebola epidemic”The Lancet Infections Diseases(2015)