福建省石獅市第三中學(xué)(362700) 李 榕
新冠疫情爆發(fā)以來(lái),我國(guó)在武漢、北京、新疆等地開(kāi)展全員新冠病毒核酸檢測(cè)篩查.面對(duì)數(shù)量巨大的檢測(cè)樣本我們采用了混合檢測(cè)方式,這樣的方式是否有效合理? 本文以數(shù)學(xué)建模的方式探究核酸檢測(cè)過(guò)程中的數(shù)學(xué)問(wèn)題,從而解釋核酸檢測(cè)背后的數(shù)學(xué)原理.
關(guān)鍵字 核酸檢測(cè);混合檢測(cè);均值不等式;二項(xiàng)分布
2020年5月11日武漢市下發(fā)《關(guān)于開(kāi)展全市新冠病毒核酸篩查的緊急通知》,要求在10 天之內(nèi),對(duì)全武漢人員做一次核酸檢測(cè),徹底摸清武漢市的人員感染新型肺炎病毒的詳細(xì)情況.
在新冠肺炎疫情防控期間,利用核酸檢測(cè)出武漢市存在的確診病例對(duì)早日戰(zhàn)勝疫情來(lái)說(shuō)至關(guān)重要.然而核酸檢測(cè)確診病例最快的話也需要幾個(gè)小時(shí),因此檢測(cè)策略的效率將直接影響疫情的防空和確診病人的救治.面對(duì)我國(guó)這樣巨大的檢測(cè)人數(shù)壓力以及龐大的公共衛(wèi)生經(jīng)濟(jì)資源的壓力,去探究一種有效的解決途徑勢(shì)在必行.
2020年6月2日,湖北省新冠病毒肺炎疫情防控工作指揮部召開(kāi)新聞發(fā)布會(huì),介紹武漢市在十天內(nèi)集中核酸檢測(cè)排查結(jié)果,如下表[1]:
武漢市新冠病毒核酸檢測(cè)“十天大會(huì)戰(zhàn)”情況
為什么說(shuō)657.4 萬(wàn)的檢測(cè)試劑數(shù)量完成了武漢約1000萬(wàn)人全員排查的呢? 面對(duì)大于1 千萬(wàn)人數(shù)的檢測(cè)需求,武漢一天需要完成超百萬(wàn)的檢測(cè)量,這樣的艱難目標(biāo)到底如何去實(shí)現(xiàn)? 其中核酸檢測(cè)的背后數(shù)學(xué)原理是什么呢?
(一)模型假設(shè):
1.新冠病毒核酸檢測(cè)試劑的判斷正確率為100%.
2.新冠病毒核酸檢測(cè)試劑同樣可以正確檢測(cè)出混合樣本,當(dāng)混合樣本的人均為陰性時(shí)則顯現(xiàn)陰性特性,否則顯示陽(yáng)性特征.
3.假設(shè)每個(gè)人的取樣足夠多,且分組之后不影響最終檢測(cè)結(jié)果.
4.假設(shè)武漢各地區(qū)感染情況是均勻分布的,且病毒總體感染率為p
(二)數(shù)學(xué)記號(hào):
數(shù)學(xué)記號(hào)含義說(shuō)明數(shù)學(xué)記號(hào)含義說(shuō)明________________p 新冠病毒總體患病率k 混合檢測(cè)的一組人數(shù)N 需要檢測(cè)的總樣本數(shù)eff 檢測(cè)效率= 期望檢測(cè)次數(shù)樣品總數(shù)X 一個(gè)個(gè)體核酸檢測(cè)次數(shù)q 檢測(cè)結(jié)果為陽(yáng)性的概率____
(三)模型建立與求解
1.初步探究問(wèn)題
假設(shè)武漢各地區(qū)感染情況是均勻分布的,現(xiàn)對(duì)某社區(qū)進(jìn)行新冠病毒核酸檢測(cè),全員100 人采集樣本后,每20 個(gè)樣本為一組,每組內(nèi)的20 個(gè)樣本混合起來(lái),這樣共得到5 組樣本.若某個(gè)組的混合樣本檢測(cè)為陽(yáng)性,則對(duì)這組的20 人再去進(jìn)行逐一檢測(cè).記該社區(qū)檢測(cè)總次數(shù)為η,且各組之間相互獨(dú)立.求一個(gè)混合樣本為陽(yáng)性的概率q及其該社區(qū)檢測(cè)總次數(shù)η分布列和期望.
2.初步探究結(jié)論
共需要檢測(cè)多少次? 寫(xiě)出所有可能的次數(shù).
·5 組都是陰性,則共需要5 次檢測(cè);
·1 組是陽(yáng)性,4 組陰性,則共需要5+20 次檢測(cè);
·2 組是陽(yáng)性,3 組陰性,則共需要5+20+20 次檢測(cè);
·3 組是陽(yáng)性,2 組陰性,則共需要5+20+20+20 次檢測(cè);
·4 組是陽(yáng)性,1 組陰性,則共需要5+20+20+20+20 次檢測(cè);
·5組是陽(yáng)性,0 組陰性,則共需要5+20+20+20+20+20 次檢測(cè).
可得一組混合樣本檢測(cè)為陰性的概率為(1-p)20,陽(yáng)性的概率為q=1-(1-p)20,η可能的取值為5,25,45,65,85,105.概率分布列圖如下:
η 5 25 45 65 85 105 P C05(1-q)5 C15(1-q)4q C25(1-q)3q2 C35(1-q)2q3 C45(1-q)q4 C55q5
假設(shè)共有Y組檢測(cè)結(jié)果為陽(yáng)性,則Y ~B(5,q).因此E(Y)=5q.又由于隨機(jī)變量η與Y的關(guān)系可得:
所以社區(qū)檢測(cè)總次數(shù)為η的數(shù)學(xué)期望為:
3.再探究問(wèn)題
4.再探究結(jié)論
易知,單次核酸檢測(cè)效率為1,即每個(gè)個(gè)體所需的檢測(cè)次數(shù)為1 次,一般來(lái)說(shuō)個(gè)體平均需要檢測(cè)的次數(shù)往往低于1.所以只需要求出每個(gè)個(gè)體的核酸檢測(cè)次數(shù)X的數(shù)學(xué)期望,如果數(shù)學(xué)期望小于1,說(shuō)明每個(gè)個(gè)體的檢測(cè)次數(shù)平均小于1,也即混合檢測(cè)的策略能夠提高檢測(cè)效率.同時(shí)每個(gè)個(gè)體的核酸檢測(cè)次數(shù)X的取值只可能有兩種:因此可以說(shuō)隨機(jī)變量X服從二項(xiàng)分布:
如果混合樣本檢測(cè)結(jié)果為陰性,k人平均測(cè)試即:
如果混合樣本檢測(cè)結(jié)果為陽(yáng)性,k人平均測(cè)試次,即:
可得X的數(shù)學(xué)期望:
根據(jù)實(shí)際情況可知p非常小,同時(shí)根據(jù)二項(xiàng)式定理有:
所以有:
依據(jù)武漢衛(wèi)健委公布數(shù)據(jù): 武漢約1000 萬(wàn)人口, 約8萬(wàn)人感染新冠病毒, 感染率p約為0.008, 四舍五入可以取p=0.01 代入式(1)為:
隨著社會(huì)的發(fā)展,技術(shù)的進(jìn)步,可能現(xiàn)在孩子學(xué)的許多東西到二三十年后就沒(méi)有用了,但是讓孩子做最好的自己,可以讓他們受益一輩子。
顯然E(X) 越小越好, 根據(jù)均值不等式可得當(dāng)且僅當(dāng)時(shí),即k= 10 時(shí),E(X)取最小值0.2.也就是說(shuō)平均單人只需要檢測(cè)0.2 次,這約節(jié)省了80%的成本.實(shí)際上,武漢市的部分區(qū)域正是一次性將10 人的樣本混合在一起作為一組進(jìn)行檢測(cè),從而提高檢測(cè)效率.
武漢市十天大會(huì)戰(zhàn)需要核酸檢測(cè)的人數(shù)約為1000 萬(wàn),如果每天可以檢測(cè)10 萬(wàn)人次的話,單次檢測(cè)則需要100 天(3 個(gè)多月).但是如果采取混合檢測(cè)的策略,就可以通過(guò)數(shù)學(xué)方法解決了這個(gè)棘手的問(wèn)題.假設(shè)如上方法武漢市每10 人一組進(jìn)行混檢,只需要10 天便可以完成全武漢一千萬(wàn)人的核酸檢測(cè).
以上模型通過(guò)數(shù)據(jù)運(yùn)算說(shuō)明了在保證正確率的前提下,最佳的混合檢測(cè)樣本數(shù).但是以上的結(jié)果當(dāng)然只是理論上的期望估計(jì)值,實(shí)際檢測(cè)過(guò)程還有很多制約和干擾因素,比如,在疫情嚴(yán)重的地方我們可以采取單一檢測(cè)的方法,在病毒感染率較高情況下可以采取混合檢測(cè)的方法,以此提高效率.
核酸檢測(cè)過(guò)程中我們還可以在此地方進(jìn)行改進(jìn):
(一)適當(dāng)縮小混合組,這即可以減小混合樣本過(guò)多檢不準(zhǔn)的問(wèn)題, 還可以減少一個(gè)組中可能包含兩個(gè)陽(yáng)性的概率.實(shí)際上武漢是使用這種方式,將5 10 人的樣本作為一組進(jìn)行混合檢測(cè)。
(二)排除實(shí)踐中陽(yáng)性不會(huì)呈現(xiàn)完全均勻分布問(wèn)題的對(duì)檢測(cè)的干擾.我們可以根據(jù)以往的新型肺炎感染率,同時(shí)可以先將整個(gè)待測(cè)地進(jìn)行預(yù)采樣,得到此片區(qū)的整體平均感染率.針對(duì)低陽(yáng)性率的地區(qū)用多人分組混合檢測(cè),較高陽(yáng)性率的地區(qū)可以采用兩三人一組為混合檢測(cè).疫情最嚴(yán)重的地區(qū)可以采用逐一檢測(cè),即1 人1 測(cè).
(三)重視從技術(shù)上解決個(gè)別誤檢問(wèn)題.在假設(shè)誤檢概率不是很大時(shí),現(xiàn)在采取重復(fù)檢測(cè)方法,如果有2 個(gè)檢測(cè)結(jié)果為陽(yáng)性的話,則最后判定為陽(yáng)性.這樣的話一次誤檢的結(jié)果也不會(huì)影響最后的結(jié)果.
實(shí)踐和理論分析表明,當(dāng)大量的待檢測(cè)樣本中含陽(yáng)性樣本較少時(shí),如高考考生體檢驗(yàn)血、新兵入伍復(fù)查體檢驗(yàn)血,組合檢測(cè)法比逐一檢測(cè)法需要的檢測(cè)次數(shù)要少.反之如果所有樣本中陽(yáng)性的比較多,那么組合檢測(cè)法很有可能不僅不會(huì)減少檢測(cè)的次數(shù),還會(huì)增加檢測(cè)的次數(shù).根據(jù)Hu-Hwang-Wang猜想: 若已知有1/3 以上的樣本是壞的,則逐一檢測(cè)法是最好的[2].