云賀
大數(shù)據(jù)在疾病監(jiān)測(cè)領(lǐng)域依然大有可為,但僅靠在線數(shù)據(jù)進(jìn)行疾病識(shí)別和預(yù)測(cè)存在一定風(fēng)險(xiǎn)。
2008年,谷歌推出了一款名為“谷歌流感趨勢(shì)”(Google Flu Trends)的產(chǎn)品。工程師們假定:一旦人們患上流感,就可能會(huì)在搜索引擎上輸入特定的檢索詞條以獲得與流感相關(guān)的信息。通過(guò)匯總和分析這些檢索詞條,谷歌就能預(yù)測(cè)流感將在何時(shí)何地爆發(fā)。2009年,這款產(chǎn)品在甲型H1N1流感爆發(fā)幾周前成功預(yù)測(cè)了其在全美范圍的傳播。一時(shí)間,有關(guān)大數(shù)據(jù)開啟公共衛(wèi)生變革的觀點(diǎn)接踵而來(lái)。然而,2013年英國(guó)《自然》雜志刊文稱,在最近一次預(yù)測(cè)流感爆發(fā)趨勢(shì)時(shí),谷歌所預(yù)測(cè)的流感病例數(shù)目幾乎是美國(guó)疾病控制與預(yù)防中心統(tǒng)計(jì)數(shù)據(jù)的兩倍。這是否意味著大數(shù)據(jù)在疾病監(jiān)測(cè)領(lǐng)域失去了價(jià)值?
近日,查塔姆學(xué)會(huì)全球衛(wèi)生安全中心兩位研究員邁克爾·埃德爾斯坦(Michael Edelstein)和大衛(wèi)·哈珀(David Harper),發(fā)表題為《在線數(shù)據(jù)助力高效應(yīng)對(duì)國(guó)際公共衛(wèi)生突發(fā)事件》的文章,通過(guò)探討數(shù)字疾病監(jiān)測(cè)在追蹤和預(yù)測(cè)疾病方面的應(yīng)用,提出了大數(shù)據(jù)在疾病監(jiān)測(cè)領(lǐng)域的發(fā)展機(jī)遇和目前面臨的問(wèn)題。他們認(rèn)為:大數(shù)據(jù)在疾病監(jiān)測(cè)領(lǐng)域依然大有可為,但僅靠在線數(shù)據(jù)進(jìn)行疾病識(shí)別和預(yù)測(cè)是存在風(fēng)險(xiǎn)的。
“數(shù)字疾病監(jiān)測(cè)”
數(shù)字疾病監(jiān)測(cè)(digital disease detection,簡(jiǎn)稱“DDD”)是指通過(guò)收集和分析網(wǎng)絡(luò)在線數(shù)據(jù),在早期確認(rèn)和追蹤疾病或公共衛(wèi)生事件的爆發(fā)。具體來(lái)說(shuō),DDD采用的方法包括:由個(gè)人自愿上報(bào)疾病癥狀,掃描媒體對(duì)于疾病的報(bào)道,分析人們發(fā)布在社交媒體上的信息,通過(guò)手機(jī)數(shù)據(jù)繪制出人口流動(dòng)路線圖,總結(jié)一段時(shí)間以來(lái)人們?cè)谒阉饕嬷墟I入關(guān)鍵詞的模式等。
盡管DDD早在1990年代中期就開始投入應(yīng)用,但直到谷歌流感趨勢(shì)推出,這一技術(shù)的影響力才有了切實(shí)的提升。目前,DDD已被廣泛應(yīng)用于傳染病暴發(fā)(如禽流感、埃博拉和寨卡病毒)以及一些慢性疾?。ㄈ缡吆头逝謫?wèn)題)的識(shí)別和調(diào)查過(guò)程中。同時(shí),DDD還被應(yīng)用于為出現(xiàn)疫情的熱點(diǎn)地區(qū)建立模型,以及收集其他公共衛(wèi)生事件的相關(guān)信息,如槍支暴力和衛(wèi)生保健質(zhì)量等。
查塔姆學(xué)會(huì)的文章認(rèn)為,隨著DDD這一新興技術(shù)開始走向成熟,無(wú)論是其識(shí)別和預(yù)測(cè)疾病的準(zhǔn)確性,還是對(duì)于數(shù)據(jù)價(jià)值的挖掘都有了一些改善。目前,這一技術(shù)正在為越來(lái)越多的公共衛(wèi)生機(jī)構(gòu)所用。例如,當(dāng)埃博拉病毒在西非地區(qū)爆發(fā)時(shí),手機(jī)數(shù)據(jù)被用于追蹤人口流動(dòng)路線,以便能預(yù)測(cè)出哪些地區(qū)可能會(huì)產(chǎn)生新病例;再比如,通過(guò)人們發(fā)布在推特上的內(nèi)容,來(lái)識(shí)別和聯(lián)系那些可能會(huì)被食源性疾病爆發(fā)所影響的人員。
谷歌流感趨勢(shì)遇挫
雖然DDD的出現(xiàn)引發(fā)了公共衛(wèi)生領(lǐng)域的極大熱情,但在2012-2013年,它對(duì)疾病的實(shí)際預(yù)測(cè)能力卻遭到強(qiáng)烈質(zhì)疑。因?yàn)榫驮谶@一時(shí)期,谷歌流感趨勢(shì)被指出其預(yù)測(cè)的禽流感病例數(shù)目是實(shí)際數(shù)目的兩倍。2015年,谷歌流感趨勢(shì)不再對(duì)公眾開放。
然而,邁克爾·埃德爾斯坦和大衛(wèi)·哈珀卻認(rèn)為,谷歌所遭遇的挫折并不能完全否定大數(shù)據(jù)對(duì)疾病監(jiān)測(cè)領(lǐng)域的價(jià)值。畢竟,谷歌流感趨勢(shì)曾不止一次準(zhǔn)確地提供了有關(guān)流感爆發(fā)的消息。這只能說(shuō)明:僅僅依靠大數(shù)據(jù)技術(shù)來(lái)監(jiān)測(cè)公共衛(wèi)生事件是存在風(fēng)險(xiǎn)的。
這種風(fēng)險(xiǎn)在一定程度上來(lái)源于大數(shù)據(jù)應(yīng)用的核心,即通過(guò)捕捉事物間的相關(guān)關(guān)系——而非因果關(guān)系來(lái)預(yù)測(cè)未來(lái)。《金融時(shí)報(bào)》專欄作家、英國(guó)經(jīng)濟(jì)學(xué)家提姆·哈福德(Tim Harford)認(rèn)為,如果不知道相關(guān)關(guān)系形成背后的原因,也就不知道造成相關(guān)關(guān)系破裂的原因。
實(shí)際上,對(duì)于谷歌預(yù)測(cè)失靈的一種解釋就是:2012年12月,網(wǎng)絡(luò)上充斥著有關(guān)流感爆發(fā)的恐怖消息,這使得那些健康的網(wǎng)民也會(huì)上網(wǎng)搜索有關(guān)流感的信息。而谷歌只是簡(jiǎn)單地將“鍵入流感關(guān)鍵詞”與“患上流感”視為關(guān)聯(lián)關(guān)系,卻沒(méi)有深究人們搜索流感信息的真正動(dòng)機(jī)是什么。
在《大數(shù)據(jù)時(shí)代》一書中,維克托·邁爾-舍恩伯格(Viktor Mayer-Sch?nberger)和肯尼思·庫(kù)克耶(Kenneth Cukier)也曾提出:大數(shù)據(jù)不可能也不必要實(shí)現(xiàn)精確性。因此,要想實(shí)現(xiàn)在疾病監(jiān)測(cè)領(lǐng)域的真正價(jià)值,大數(shù)據(jù)應(yīng)該與那些以常規(guī)監(jiān)測(cè)為基礎(chǔ)的、傳統(tǒng)的疾病監(jiān)測(cè)系統(tǒng)形成互補(bǔ)關(guān)系,同時(shí)與其他那些可以提供疾病追蹤記錄的統(tǒng)計(jì)工具相結(jié)合。
難題待解
查塔姆學(xué)會(huì)的文章認(rèn)為,大數(shù)據(jù)在疾病監(jiān)測(cè)領(lǐng)域依然大有可為,隨著相關(guān)技術(shù)的發(fā)展,DDD的應(yīng)用機(jī)會(huì)將不斷增加。不過(guò),目前DDD在公共衛(wèi)生監(jiān)測(cè)領(lǐng)域的應(yīng)用中,還亟須解決兩個(gè)方面的難題。
一是,DDD怎樣才可以與官方的疾病監(jiān)測(cè)體系及應(yīng)急反應(yīng)機(jī)制相結(jié)合?目前,很少有政府衛(wèi)生部門對(duì)DDD數(shù)據(jù)進(jìn)行常規(guī)應(yīng)用,而大多數(shù)能夠產(chǎn)生這些數(shù)據(jù)的組織都處于政府的疾病監(jiān)測(cè)和反應(yīng)機(jī)制之外,如學(xué)術(shù)、私營(yíng)和非營(yíng)利機(jī)構(gòu)等。這可能會(huì)導(dǎo)致這樣一種情況發(fā)生:某一公共衛(wèi)生事件的爆發(fā)雖然被監(jiān)測(cè)到了,但是對(duì)這一信息做出應(yīng)急反應(yīng)的責(zé)任機(jī)制卻沒(méi)有到位。
例如,在2015年11月,一個(gè)致力于通過(guò)分析網(wǎng)絡(luò)內(nèi)容以監(jiān)測(cè)傳染病爆發(fā)的小組注意到:巴西有關(guān)皮疹的報(bào)道數(shù)量呈現(xiàn)出顯著的上升趨勢(shì)。然而,由于沒(méi)有官方溝通渠道,這個(gè)小組沒(méi)能將此情況反饋給巴西衛(wèi)生部門或者世界衛(wèi)生組織。幾個(gè)星期之后,巴西寨卡病毒爆發(fā)的消息傳遍了全世界。而皮疹正是感染寨卡病毒最常見(jiàn)的癥狀之一。
二是,有關(guān)使用網(wǎng)絡(luò)數(shù)據(jù)的道德和法律問(wèn)題。例如,如何去看待和處理那些屬于私人信息的數(shù)據(jù)?如何去平衡個(gè)人隱私權(quán)與公共利益之間的關(guān)系?目前上述問(wèn)題還沒(méi)有得到充分解答。而公眾如何看待他們的在線數(shù)據(jù)被應(yīng)用于疾病監(jiān)測(cè)領(lǐng)域,現(xiàn)在業(yè)內(nèi)對(duì)此的了解和認(rèn)識(shí)也十分匱乏。
兩位研究員在文章中表示:無(wú)論是DDD在公共衛(wèi)生領(lǐng)域中的定位,還是與此相關(guān)的道德與法律問(wèn)題,現(xiàn)在都務(wù)必要得到解決,只有這樣才能確保DDD的潛力得到充分發(fā)揮。其中,各國(guó)政府和公共衛(wèi)生機(jī)構(gòu)的參與,將為可持續(xù)的數(shù)字疾病監(jiān)測(cè)系統(tǒng)提供重要推動(dòng)力。如果不這樣做,大數(shù)據(jù)的應(yīng)用弱點(diǎn)將會(huì)重現(xiàn),最終將削弱整個(gè)疾病監(jiān)測(cè)系統(tǒng)對(duì)下一次類似埃博拉或寨卡疫情的預(yù)測(cè)和反應(yīng)能力。