李儒銀,李 洋,羅志宏△
(1.重慶醫(yī)科大學(xué)附屬第一醫(yī)院 400016;2.成都體育學(xué)院,成都 610041)
突發(fā)公共衛(wèi)生事件是指突然發(fā)生,造成或可能造成社會公眾健康嚴(yán)重損害的重大傳染病疫情、群體性不明原因疾病、重大食物和職業(yè)中毒及其他嚴(yán)重影響公眾健康的事件[1]。近年來,國內(nèi)外突發(fā)公共衛(wèi)生事件頻發(fā),如2003年的非典型肺炎、2009年的甲型流感、2014年西非的埃博拉病毒及2019年的新型冠狀病毒肺炎(簡稱新冠肺炎),都給國家建設(shè)、人民利益、社會經(jīng)濟造成了巨大損失,甚至一度引發(fā)公眾恐慌情緒。而歷次突發(fā)公共衛(wèi)生事件均會產(chǎn)生大量的疫情相關(guān)數(shù)據(jù),要充分了解疫情數(shù)據(jù)信息,才能做到“心中有數(shù),手中有策”[2]。所以,如何有效管控突發(fā)公共衛(wèi)生事件中產(chǎn)生的數(shù)據(jù),協(xié)調(diào)突發(fā)公共衛(wèi)生事件數(shù)據(jù)的有效開放和利用,有利于各級政府部門對疫情整體發(fā)展情況做出客觀判斷,部署防控措施;有利于執(zhí)行部門制訂科學(xué)防控方案,把握重點工作方向;有利于衛(wèi)生部門合理配置資源,提高工作效率;還有利于疫情防控的國際合作和民眾安撫。
“關(guān)聯(lián)數(shù)據(jù)(Linked Data)”的概念由TIM于2006年提出,是“互聯(lián)網(wǎng)+”時代,進行大數(shù)據(jù)管理、發(fā)布和服務(wù)的核心技術(shù)之一。目前,關(guān)聯(lián)數(shù)據(jù)已經(jīng)在藥物知識發(fā)現(xiàn)、智慧醫(yī)療建設(shè)、醫(yī)學(xué)資源共享和醫(yī)學(xué)信息學(xué)知識體系構(gòu)建等領(lǐng)域有諸多應(yīng)用實踐[3]。為了充分發(fā)揮關(guān)聯(lián)數(shù)據(jù)在突發(fā)公共衛(wèi)生事件數(shù)據(jù)管控中的價值,筆者論述了關(guān)聯(lián)數(shù)據(jù)應(yīng)用于突發(fā)公共衛(wèi)生事件數(shù)據(jù)開放平臺的必要性和技術(shù)實現(xiàn)路徑,并以新冠肺炎疫情數(shù)據(jù)為例,設(shè)計了基于關(guān)聯(lián)數(shù)據(jù)的疫情數(shù)據(jù)開放平臺。同時,也分析了平臺建設(shè)過程中可能存在的一些問題。
利用關(guān)聯(lián)數(shù)據(jù)技術(shù),將公共衛(wèi)生領(lǐng)域的結(jié)構(gòu)化數(shù)據(jù)通過網(wǎng)絡(luò)進行關(guān)聯(lián)和共享,充分挖掘信息價值,實現(xiàn)信息高效利用、提升信息協(xié)同效率,能夠給予數(shù)據(jù)更大的附加價值[4]。以新冠肺炎為例,筆者發(fā)現(xiàn):有關(guān)新冠肺炎疫情的數(shù)據(jù)類型多樣、渠道豐富,有政府部門官方網(wǎng)站的數(shù)據(jù),有醫(yī)藥衛(wèi)生行業(yè)的主流媒體數(shù)據(jù),有社交網(wǎng)絡(luò)的數(shù)據(jù),有第三方支付平臺的數(shù)據(jù)等。這些信息的全方位、深層次、多渠道傳播,使公眾對新冠肺炎有了全面的認識和了解,增強了民眾的防護意識。但這些數(shù)據(jù)之間存在內(nèi)容重復(fù)、真?zhèn)坞y辨等現(xiàn)象,且數(shù)據(jù)平臺之間的數(shù)據(jù)缺乏統(tǒng)一標(biāo)準(zhǔn)、管理混亂、共享性差、內(nèi)容深度挖掘不足等問題。
由此可見,突發(fā)公共衛(wèi)生事件數(shù)據(jù)的管理中還存在諸多問題,不利于公共衛(wèi)生部門做出科學(xué)決策,也增加了疫情管控、醫(yī)療資源協(xié)調(diào)的難度,使得許多具體工作難以有效落實和開展;同時,突發(fā)公共衛(wèi)生事件數(shù)據(jù)的不規(guī)范發(fā)布還容易引發(fā)大眾的信息焦慮和心理恐慌。所以,建立行之有效的突發(fā)公共衛(wèi)生事件數(shù)據(jù)開放平臺勢在必行。
將關(guān)聯(lián)數(shù)據(jù)技術(shù)嵌入到突發(fā)公共衛(wèi)生事件數(shù)據(jù)開放平臺建設(shè)中,由公共衛(wèi)生部門進行統(tǒng)一規(guī)劃、統(tǒng)一建設(shè)、統(tǒng)一協(xié)調(diào)、統(tǒng)一管理,能夠有效推動公共衛(wèi)生突發(fā)事件數(shù)據(jù)管理。
突發(fā)公共衛(wèi)生事件具有生命周期,其演變階段可分為疫情潛伏期、疫情暴發(fā)期和疫情恢復(fù)期[5],在疫情發(fā)展的不同階段,數(shù)據(jù)信息存在較為明顯的差異,但也會有交叉重復(fù)。疫情潛伏期的數(shù)據(jù)包含疫情監(jiān)測監(jiān)控、趨勢預(yù)測、風(fēng)險評估、防護指南、輿情防控等;疫情暴發(fā)期的數(shù)據(jù)包括病毒檢測、疫苗研制、醫(yī)療救助、物資調(diào)用、人員流動、患者上報、虛假謠言等;疫情恢復(fù)期的數(shù)據(jù)包括整理疫情起因、爆發(fā)過程、損失評估、事后分析等。根據(jù)疫情發(fā)展的不同階段,研究者構(gòu)建了突發(fā)公共衛(wèi)生事件數(shù)據(jù)整合框架,見圖1。
圖1 突發(fā)公共衛(wèi)生事件數(shù)據(jù)整合框架
根據(jù)關(guān)聯(lián)數(shù)據(jù)語義描述的步驟,筆者認為突發(fā)公共衛(wèi)生事件疫情數(shù)據(jù)的語義描述步驟為,(1)疫情數(shù)據(jù)標(biāo)識:采用統(tǒng)一格式進行標(biāo)識,便于疫情數(shù)據(jù)的規(guī)范化處理和集中管理;(2)疫情數(shù)據(jù)集選擇:參考MeSH主題詞表、醫(yī)學(xué)標(biāo)準(zhǔn)術(shù)語和通用語,或自定義新的術(shù)語為數(shù)據(jù)集命名;(3)疫情數(shù)據(jù)資源描述框架的描述:使用固定格式的計算機語言描述不同數(shù)據(jù),創(chuàng)建訪問入口,通過搜索引擎檢索數(shù)據(jù);(4)疫情數(shù)據(jù)鏈接:在規(guī)范化的數(shù)據(jù)描述之后,建立疫情數(shù)據(jù)的網(wǎng)絡(luò)鏈接;(5)疫情數(shù)據(jù)語義發(fā)布:將不同來源、不同類型的疫情數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)類型,嵌入數(shù)據(jù)的版本號或標(biāo)識符,進行數(shù)據(jù)發(fā)布;(6)疫情數(shù)據(jù)平臺維護與運營:及時更新平臺數(shù)據(jù),關(guān)注疫情數(shù)據(jù)的維護和實時更新。
采用關(guān)聯(lián)數(shù)據(jù)技術(shù)實現(xiàn)了后臺數(shù)據(jù)的規(guī)范、統(tǒng)一管理,便于各類用戶的訪問、瀏覽與檢索。針對用戶的操作需求,選擇專門的關(guān)聯(lián)數(shù)據(jù)搜索引擎,或嵌入關(guān)聯(lián)數(shù)據(jù)瀏覽器。同時,對疫情數(shù)據(jù)進行分類導(dǎo)航,根據(jù)疫情發(fā)展態(tài)勢,適時更新不同階段的數(shù)據(jù)類型。
新冠肺炎是新中國成立以來在我國發(fā)生的傳播速度最快、感染范圍最廣、防控難度最大的一次重大突發(fā)公共衛(wèi)生事件[6]。本平臺依托關(guān)聯(lián)數(shù)據(jù)技術(shù),構(gòu)建新冠肺炎數(shù)據(jù)開放平臺框架[7],見圖2。通過整合各種類型、不同來源的新冠肺炎疫情數(shù)據(jù),進行統(tǒng)一標(biāo)引,數(shù)據(jù)解析、提取與合并,利用資源描述框架機制進行描述,建立計算機可識別的鏈接和語言,在Web頁面上發(fā)布數(shù)據(jù),提供訪問接口,嵌入用戶導(dǎo)航界面,使用戶通過互聯(lián)網(wǎng)進行瀏覽和檢索,促進新冠疫情數(shù)據(jù)互聯(lián)互通和深度應(yīng)用。
圖2 新冠肺炎數(shù)據(jù)開放平臺
數(shù)據(jù)標(biāo)準(zhǔn)化是實現(xiàn)數(shù)據(jù)開放共享的基礎(chǔ)。突發(fā)公共衛(wèi)生事件數(shù)據(jù)開放平臺的建設(shè)會涉及不同類型、非結(jié)構(gòu)化數(shù)據(jù),如疫情監(jiān)測數(shù)據(jù)、病毒檢測工具、疫苗研制信息、物資調(diào)用信息、防護指南信息、患者就診信息等,以及各種醫(yī)學(xué)專業(yè)術(shù)語等。所以,面對龐雜的突發(fā)公共衛(wèi)生事件數(shù)據(jù),需要全面收集、分類、整理和組織,制訂科學(xué)的數(shù)據(jù)規(guī)范標(biāo)準(zhǔn),實現(xiàn)語義上的互操作。
突發(fā)公共衛(wèi)生事件數(shù)據(jù)的收集過程中,通常會涉及患者隱私信息,如個人背景信息、健康狀況、病歷信息等,一旦被泄露,會對患者的日常生活帶來很大困擾。所以,數(shù)據(jù)開放的過程中,需要設(shè)定專門的隱私保護屏蔽技術(shù),保障患者隱私權(quán)。此外,需要把握病毒檢測和疫苗研發(fā)中科學(xué)數(shù)據(jù)開放與保護的平衡點,同時對涉及的臨床試驗、科研倫理問題,成立專門的倫理評估系統(tǒng)和審查機制,保證科學(xué)研究順利開展[8]。
明確數(shù)據(jù)權(quán)利,保護數(shù)據(jù)主體、數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)控制者和參與者、數(shù)據(jù)客體的利益平衡,才能促進數(shù)據(jù)的合理開發(fā)和使用。突發(fā)公共衛(wèi)生事件中產(chǎn)生的數(shù)據(jù),按照來源可分為個人數(shù)據(jù)、商業(yè)數(shù)據(jù)、政府?dāng)?shù)據(jù)、醫(yī)療機構(gòu)數(shù)據(jù),這些數(shù)據(jù)由哪個部門主張收集、如何兼顧公共利益和個人信息保護,以及所收集到數(shù)據(jù)的權(quán)利界定與歸屬問題均關(guān)系到數(shù)據(jù)的合法利用。所以,有必要主張數(shù)據(jù)權(quán)利,采取技術(shù)措施降低風(fēng)險,避免因個人信息泄露、濫用而引發(fā)人身損害、財產(chǎn)損失,甚至是公眾恐慌和政府信任減損[9]。
數(shù)據(jù)開放在突發(fā)公共衛(wèi)生事件數(shù)據(jù)監(jiān)測、分析和利用等方面起到了積極作用,如歐盟創(chuàng)建的新冠肺炎數(shù)據(jù)共享平臺。但科學(xué)界定數(shù)據(jù)開放范圍、審批數(shù)據(jù)開放對象,需要成立專門的審查機構(gòu)進行嚴(yán)密審核,依法確定完全公開、適度公開、申請公開、保密等權(quán)限;申請者依托機構(gòu)認證,簽署保密協(xié)議和合理使用協(xié)議等證書。同時,還需要關(guān)注數(shù)據(jù)保護問題,必要的時候限定數(shù)據(jù)分析的用途。
由于突發(fā)公共衛(wèi)生事件具有不確定性、群發(fā)性、演變復(fù)雜性、高危害性等特點,需要快速、準(zhǔn)確地獲取并有效地收集、利用相關(guān)數(shù)據(jù),以提高應(yīng)急響應(yīng)的科學(xué)性和效率,降低疫情帶來的危害和負面影響。本研究基于關(guān)聯(lián)數(shù)據(jù)技術(shù),提出突發(fā)公共衛(wèi)生事件數(shù)據(jù)開放平臺的建設(shè)方案,展現(xiàn)了數(shù)據(jù)開放平臺在疫情防控工作中的廣闊應(yīng)用前景。未來研究可以依托數(shù)據(jù)開放平臺,針對疫情防控中產(chǎn)生的科學(xué)知識、科研成果、政府決策、醫(yī)療救治等數(shù)據(jù)信息,形成專題資源數(shù)據(jù)庫,強化突發(fā)公共衛(wèi)生事件大數(shù)據(jù)分析和智庫建設(shè)。