李大偉
(上海立信會(huì)計(jì)金融學(xué)院統(tǒng)計(jì)與數(shù)學(xué)學(xué)院 上海 201620)
2019年12月,一場(chǎng)突如其來(lái)的新型冠狀病毒肺炎(COVID-19)疫情打破了我們平靜的生活,隨后迅速席卷全球。時(shí)至今天,已有數(shù)百萬(wàn)人死于新冠病毒。新冠疫情的爆發(fā)嚴(yán)重影響了人們的工作、學(xué)習(xí)、生活以及健康,對(duì)全球經(jīng)濟(jì)以及世界格局更是產(chǎn)生了無(wú)法估量的影響。新冠肺炎作為一種急性呼吸道傳染病,研究它的發(fā)生、發(fā)展、診斷、預(yù)防以及治療等方面能夠幫助我們抓住疾病的薄弱環(huán)節(jié),采取有效的措施,達(dá)到更好的防控效果。本文我們將從概率論與數(shù)理統(tǒng)計(jì)的角度對(duì)新冠疫情中的一些問(wèn)題進(jìn)行分析與研究。
潛伏期,是一般疾病在發(fā)展過(guò)程中的一定階段,這一階段是從致病刺激物侵入機(jī)體或?qū)C(jī)體發(fā)生作用起,到機(jī)體出現(xiàn)反應(yīng)或開始呈現(xiàn)癥狀時(shí)止。不同傳染病的潛伏期時(shí)間不同,同一種傳染病在不同個(gè)體之間的潛伏期也是不同的。很多疾病在潛伏期的某個(gè)節(jié)點(diǎn)開始都是具有傳染性的,而不是等潛伏期結(jié)束了才具有傳染性。潛伏期是傳染病的重要傳播動(dòng)力學(xué)參數(shù)之一,是確定檢疫(包括醫(yī)學(xué)觀察、留驗(yàn)和集體檢疫)時(shí)間的重要依據(jù),在制定傳染病防控策略與措施、評(píng)價(jià)防控措施效果及預(yù)測(cè)流行趨勢(shì)中均具有重要意義[1]。
新冠疫情暴發(fā)初期,專家們通過(guò)對(duì)部分病例進(jìn)行跟蹤分析與研究。根據(jù)收集到的數(shù)據(jù)做出一條曲線,確定95%的置信區(qū)間,然后經(jīng)過(guò)反復(fù)試驗(yàn)和觀察確定最長(zhǎng)的時(shí)間間隔是14天,從而把隔離期定為14天。對(duì)于傳染病的潛伏期,常見的分布有對(duì)數(shù)正態(tài)分布(Log-normal)、伽馬分布(Gamma)和韋伯分布(Weibull)[2-4]。杜志成等[5]利用區(qū)間刪失數(shù)據(jù)估計(jì)方法,通過(guò)比較Log-normal、Gamma和Weibull分布,對(duì)新冠肺炎的潛伏期分布進(jìn)行估計(jì),得到Gamma分布具有較大的對(duì)數(shù)似然函數(shù)值,從而得出Gamma分布可能是COVID-19潛伏期的最優(yōu)分布,潛伏期M=5.064(P25~P75:3.489~7.304)天。從概率論與數(shù)理統(tǒng)計(jì)角度證明了把新冠隔離期定為14天是合理的。
雖然混合檢測(cè)法可以更高效的獲取檢測(cè)結(jié)果,但是要把多少個(gè)樣本混合在一起進(jìn)行檢測(cè)也是我們需要考慮的一個(gè)重要問(wèn)題。嚴(yán)加安院士在“概率破玄機(jī),統(tǒng)計(jì)解迷離”中提到,假設(shè)已知人群的患病率為p,要對(duì)N個(gè)樣本進(jìn)行混合檢測(cè)時(shí),通過(guò)概率計(jì)算可得平均檢測(cè)總次數(shù)為N/k[qk+(k+1)(1-qk)],其中q=1-p,k代表每組混合的樣本數(shù)量,從而我們可以通過(guò)計(jì)算機(jī)確定最佳的k值。李榕[8]同樣從概率論角度對(duì)混合檢測(cè)的樣本數(shù)量進(jìn)行了分析,得出當(dāng)把10個(gè)樣本放在一起進(jìn)行檢測(cè)時(shí)的效果最好,而實(shí)際上武漢部分區(qū)域正是一次性將10個(gè)樣本放在一起進(jìn)行了混合檢測(cè)。
例1. 根據(jù)醫(yī)學(xué)數(shù)據(jù)分析,假設(shè)某次新冠肺炎核酸檢測(cè)以95%的概率將新冠患者檢查出呈陽(yáng)性,但也有2%的概率誤將非新冠患者檢查出呈陽(yáng)性(“假陽(yáng)性”)。若某一特殊群體患新冠肺炎的概率為0.05%,求
(1)其中一個(gè)個(gè)體新冠病毒核酸檢測(cè)結(jié)果為陽(yáng)性的條件下,他確實(shí)患病的概率(確診率)是多少?
(2)如果“假陽(yáng)性”的概率降為0.2%,0.02%和0時(shí),確診率如何變化?
(3)重復(fù)檢測(cè)能否提高確診率?
解:記A={核酸檢查結(jié)果為陽(yáng)性},B={檢查者患新冠肺炎},
已知P(B)=0.0005
P(A|B)=0.95
根據(jù)貝葉斯公式可得
因此,一次檢測(cè)結(jié)果為陽(yáng)性的條件下,實(shí)際患病的概率僅為2.32%。
也是非常高的(一般診斷價(jià)值LR>20就認(rèn)為很高了),但是此處P(B|A)的值卻很小,這是為什么呢?其實(shí)主要原因就是因?yàn)樾鹿诘幕疾÷蔖(B)=0.0005遠(yuǎn)小于檢測(cè)錯(cuò)誤率。針對(duì)此處情形,通常會(huì)進(jìn)行多次獨(dú)立重復(fù)的復(fù)查。
(3)在(1)中我們得到即使核酸檢測(cè)結(jié)果是陽(yáng)性,實(shí)際患病率僅為2.32%。
針對(duì)此種情形,我們通常會(huì)進(jìn)行多次獨(dú)立重復(fù)的復(fù)查。設(shè)Ai={第i次核酸檢查結(jié)果為陽(yáng)性},i=1,2,3, ..., n。此時(shí)由貝葉斯公式可得
即兩次核酸檢測(cè)都是陽(yáng)性者,患新冠的可能性為53.02%,相對(duì)于第一次檢測(cè),準(zhǔn)確性提高了接近23倍。如果我們繼續(xù)做第三次檢測(cè),此時(shí)P(B|A1A2A3)≈0.9817。由此可見,若三次核酸檢測(cè)都是陽(yáng)性,患新冠的可能性就非常大了。當(dāng)然,因?yàn)檫@里題目中都是一些假設(shè)的數(shù)據(jù),與實(shí)際情況可能會(huì)存在一些差距,但是根據(jù)上述理論分析我們可知,一次核酸檢測(cè)陽(yáng)性并不能說(shuō)明一定患病,通常需要經(jīng)過(guò)多次獨(dú)立重復(fù)檢測(cè),并配合一些其他項(xiàng)目的檢查,才能最終做出判斷。
自疫情暴發(fā)以來(lái),為了有效的控制疫情,遏制疫情的蔓延,各國(guó)都在努力研發(fā)新冠疫苗以及治療藥物。任何一種新藥從研發(fā)到投產(chǎn),中間都要經(jīng)過(guò)許多的試驗(yàn)和評(píng)估等措施,接下來(lái)我們從概率論角度對(duì)藥物療效相關(guān)問(wèn)題做簡(jiǎn)單分析。
例 2. 假設(shè)新冠患者自然痊愈率為0.3,醫(yī)院檢查員任意抽查100名注射某種疫苗的患者。根據(jù)相關(guān)部門規(guī)定,如果治愈患者數(shù)超過(guò)75人,則判定疫苗是有效的;否則,判定疫苗無(wú)效。試求
(1) 疫苗治愈率為0.8,但被判定無(wú)效的概率是多少?
(2) 疫苗無(wú)效,但被判定有效的概率是多少?
解:設(shè)X={治愈患者數(shù)},由題意知
(1)當(dāng)疫苗治愈率為0.8時(shí),根據(jù)題意分析可知,如果實(shí)際治愈患者人數(shù)不超過(guò)75人,則被判定為無(wú)效,此時(shí)概率為
(2)疫苗無(wú)效,此時(shí)的治愈率為自然痊愈率0.3,根據(jù)題意分析可知,如果實(shí)際治愈患者人數(shù)超過(guò)75人,則被判定有效,此時(shí)概率為
綜上所述,概率論與數(shù)理統(tǒng)計(jì)在醫(yī)學(xué)中具有非常廣泛的應(yīng)用。本文我們主要以新冠肺炎為例,從概率論與數(shù)理統(tǒng)計(jì)的角度對(duì)其中的相關(guān)應(yīng)用做了簡(jiǎn)單介紹。期望通過(guò)這些理論分析,可以幫助我們采取更高效的措施去防控疫情。