愛新覺羅華苡
在美國約翰斯·霍普金斯大學(xué)土木與系統(tǒng)工程系攻讀博士學(xué)位的中國留學(xué)生董恩盛和杜鴻儒,做夢(mèng)也沒有想到,他們竟然會(huì)成為世界矚目的焦點(diǎn)。
這一切要從一場(chǎng)新冠肺炎疫情的爆發(fā)說起。
2019年年底,新冠肺炎疫情在武漢爆發(fā),身在美國學(xué)習(xí)疾病模型的董恩盛心里始終牽掛著中國的同胞。他迫不及待地想研究新冠肺炎疫情是怎么爆發(fā)的、數(shù)據(jù)是如何增長(zhǎng)的,并希望通過追蹤數(shù)據(jù),觀察一場(chǎng)疫情從發(fā)生到結(jié)束的整個(gè)過程,為全球新冠肺炎疫情的發(fā)展趨勢(shì)做出基本的判斷和推測(cè)。于是,他向?qū)焺趥悺ぜ拥录{提出了這個(gè)想法,導(dǎo)師支持他建立一個(gè)數(shù)據(jù)地圖,以追蹤疫情的數(shù)據(jù)。董恩盛立刻著手從事這項(xiàng)研究,經(jīng)過7個(gè)多小時(shí)的苦戰(zhàn),他很快就開發(fā)出了交互式數(shù)據(jù)地圖。
統(tǒng)計(jì)系統(tǒng)有了,去哪里找數(shù)據(jù)呢?為了保證新冠肺炎疫情數(shù)據(jù)來源的準(zhǔn)確性,董恩盛從世界衛(wèi)生組織、美國疾病控制與預(yù)防中心、歐洲疾病預(yù)防控制中心、中華人民共和國國家衛(wèi)生健康委員會(huì)等權(quán)威組織及網(wǎng)站上獲取信息。就這樣,董恩盛通過篩選海量的信息,整理出了精確的數(shù)據(jù),并從2020年1月22日起上傳到相關(guān)的學(xué)術(shù)網(wǎng)站。
起初,數(shù)據(jù)收集完全靠手動(dòng)進(jìn)行,每天兩次的更新,通常是在美國東部時(shí)間的早、晚進(jìn)行,最多時(shí)要更新4至5次,工作量非常大。特別是隨著新冠肺炎疫情向全球蔓延,董恩盛發(fā)現(xiàn)手動(dòng)更新的數(shù)據(jù)已經(jīng)趕不上疫情的發(fā)展變化,導(dǎo)致數(shù)據(jù)滯后。這時(shí),博士生杜鴻儒也加入收集、整理、發(fā)布疫情的行列中。
在數(shù)據(jù)來源和數(shù)據(jù)結(jié)構(gòu)搭建上,董恩盛和杜鴻儒遇到了一個(gè)棘手的問題:數(shù)據(jù)的半自動(dòng)化比較費(fèi)事,它需要考慮到地圖上標(biāo)注點(diǎn)的放置,一個(gè)小小功能的增加往往會(huì)讓數(shù)據(jù)產(chǎn)生很大的變動(dòng)。另外,在數(shù)據(jù)更新的時(shí)候,他們還遇到了如何標(biāo)注時(shí)間的麻煩。因?yàn)槭澜绺鞯氐臅r(shí)間不一樣,要想在同一時(shí)間,反映世界各地的疫情變化,就需要把地圖的時(shí)間調(diào)整為格林威治時(shí)間,而要將世界各地的時(shí)間都換算成格林威治時(shí)間,則是一組龐大的數(shù)據(jù)。
為此,董恩盛和杜鴻儒加快了工作進(jìn)度,編寫出一個(gè)程序,可以從各個(gè)數(shù)據(jù)源收集數(shù)據(jù),再整理成統(tǒng)一格式,更新到服務(wù)器,增加了時(shí)間上的準(zhǔn)確性,同時(shí)也增加了工作的難度。
1月20日,董恩盛和杜鴻儒從數(shù)據(jù)中發(fā)現(xiàn),“鉆石公主號(hào)”郵輪從日本橫濱港出發(fā),航行10天后,船上有一名香港乘客被確診為新冠肺炎。2月3日,該郵輪被迫返回橫濱港。不過,郵輪上所有人都被要求留在船上,接受隔離檢查。當(dāng)他們被隔離14天之后,郵輪上的乘客開始分批下船,而船上有789名外籍人士,他們離開了郵輪,返回了自己的國家。
對(duì)于這種特殊情況應(yīng)該如何標(biāo)注呢?一開始大家把“鉆石公主號(hào)”的所有案例歸結(jié)為日本當(dāng)?shù)氐陌咐?,之后又把日本國?nèi)的案例與“鉆石公主號(hào)”分開計(jì)算,于是就需要重新調(diào)整數(shù)據(jù)。有部分“鉆石公主號(hào)”的旅客回到了美國,由于他們中的患者具體位置不明,給地圖的標(biāo)注增加了難度,董恩盛和杜鴻儒就選擇了美國的一個(gè)地理中心進(jìn)行標(biāo)注。結(jié)果,有些美國人通過放大地圖,找到了這個(gè)標(biāo)注點(diǎn)上的小區(qū),貿(mào)然上報(bào)了小區(qū),小區(qū)又將這一情況上報(bào)給了當(dāng)?shù)匦l(wèi)生部門,最后經(jīng)過核實(shí)此地并沒有出現(xiàn)這一患者,后來相關(guān)部門找到了他們,希望能夠更正信息。這時(shí),董恩盛和杜鴻儒才意識(shí)到,它在地圖上僅僅代表一個(gè)小小的標(biāo)注點(diǎn),卻在現(xiàn)實(shí)中很可能被人對(duì)號(hào)入座,所以標(biāo)記必須非常準(zhǔn)確才行。于是,他們不斷完善數(shù)據(jù)的表現(xiàn)方式,以便消除人們?cè)诮庾x上的誤會(huì)。
近期,董恩盛和杜鴻儒還增加了更多可視化的工具,讓任何數(shù)據(jù)、形式和位置都包含在同一個(gè)視圖中,并且精確地公布出每座城市新冠肺炎確診的人數(shù),同時(shí)做到全天候?qū)崟r(shí)維護(hù)地圖。
正是由于董恩盛和杜鴻儒精益求精的努力工作,才使得他們的數(shù)據(jù)統(tǒng)計(jì)工作比美國疾病控制與預(yù)防中心的數(shù)據(jù)更勝一籌,因而受到世界各地的廣泛關(guān)注,平均每日點(diǎn)擊量高達(dá)10億次,最高日點(diǎn)擊量達(dá)到45億次。他們接下來要做的,就是盡快讓數(shù)據(jù)更新變成全自動(dòng)化,只要是某個(gè)地方出現(xiàn)疫情數(shù)據(jù)的變化,他們就像獵手一樣迅速捕捉到,從而為防控疫情提供第一手的可靠資料。他們希望早日找到新冠病毒的起因與源頭,為人類戰(zhàn)勝新冠病魔譜寫醫(yī)學(xué)史上新的篇章。