李果慶 李昭慧 金珂 劉紫微 桑藝格
【摘 ?要】本文在介紹了大數(shù)據(jù)相關(guān)概念與特征后,分析了大數(shù)據(jù)在公共衛(wèi)生管理(下文皆寫為“公衛(wèi)管理”)中數(shù)據(jù)量大、應(yīng)用范圍廣等優(yōu)勢(shì),也探討了其相關(guān)技術(shù)不完善與應(yīng)用人才少、不易管理等劣勢(shì),以及數(shù)據(jù)挖掘與數(shù)據(jù)整合難度大、醫(yī)療信息平臺(tái)尚未聯(lián)通等問(wèn)題,提出了其需要注意的數(shù)據(jù)泄露風(fēng)險(xiǎn)。研究目的是為了探討讓大數(shù)據(jù)技術(shù)更好地與公衛(wèi)管理相結(jié)合的可能性。本次研究參考了許多相關(guān)文獻(xiàn),在前人的基礎(chǔ)上我們稍作發(fā)展寫就此文。并在文末提出深度挖掘醫(yī)療大數(shù)據(jù)、提高其真實(shí)性和安全性等建議。以此讓大數(shù)據(jù)在公衛(wèi)管理中更好地發(fā)揮出它的優(yōu)勢(shì),降低突發(fā)性公衛(wèi)事件對(duì)社會(huì)經(jīng)濟(jì)的影響。
【關(guān)鍵詞】大數(shù)據(jù);公共衛(wèi)生事件;應(yīng)急管理
引言
隨著信息多元化的發(fā)展和醫(yī)療技術(shù)的不斷改革,公共衛(wèi)生管理日益成為世界各國(guó)關(guān)注的焦點(diǎn)。同時(shí),大數(shù)據(jù)技術(shù)的形成和不斷完善讓眾多專家、學(xué)者們意識(shí)到將其運(yùn)用于公衛(wèi)管理中的重要性。目前,在大數(shù)據(jù)背景下我國(guó)公衛(wèi)應(yīng)急管理制度由于數(shù)據(jù)過(guò)于龐大、數(shù)據(jù)挖掘技術(shù)不夠完善、醫(yī)療信息平臺(tái)尚未完全聯(lián)通等方面依舊存在許多不足,而大數(shù)據(jù)技術(shù)的運(yùn)用也給公衛(wèi)應(yīng)急管理帶來(lái)了新的挑戰(zhàn)和風(fēng)險(xiǎn)。因此,如何解決這些新的挑戰(zhàn)和風(fēng)險(xiǎn),是本文所研究的主要內(nèi)容。參考文獻(xiàn)主要來(lái)自中國(guó)知網(wǎng)。
1.大數(shù)據(jù)的定義和特征
1.1 大數(shù)據(jù)的定義
大數(shù)據(jù)的定義歷來(lái)解釋不一,現(xiàn)引用以下幾種觀點(diǎn)來(lái)幫助我們理解大數(shù)據(jù)這一概念:美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院認(rèn)為大數(shù)據(jù)是用來(lái)描述在我們網(wǎng)絡(luò)的、數(shù)字的、遍布傳感器的、信息驅(qū)動(dòng)的世界中呈現(xiàn)出的數(shù)據(jù)泛濫的常用詞語(yǔ);麥肯錫全球研究所認(rèn)為大數(shù)據(jù)通常指的是大小超越傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具抓取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)群;國(guó)內(nèi)學(xué)者在進(jìn)行大數(shù)據(jù)研究時(shí)多引用以上和其他大數(shù)據(jù)在國(guó)外的概念,此外國(guó)內(nèi)對(duì)“海量數(shù)據(jù)”這一說(shuō)法認(rèn)同度較高,習(xí)慣稱大數(shù)據(jù)為海量數(shù)據(jù)。從上面對(duì)大數(shù)據(jù)的定義中我們可以總結(jié)出大數(shù)據(jù)的幾個(gè)主要特征。
1.2大數(shù)據(jù)的特征
大數(shù)據(jù)具有4“V”特征:即volume(數(shù)據(jù)量大)、velocity(速度)、variety(數(shù)據(jù)類型多樣)、value(價(jià)值)。
(1)為什么叫“大”數(shù)據(jù)(volume)?Facebook每天更新超過(guò)1,000萬(wàn)張照片,YouTube平均每月有8億訪問(wèn)者,平均每秒上傳超過(guò)一小時(shí)的視頻,Twitter上的信息量每年幾乎翻一番,互聯(lián)網(wǎng)時(shí)代,人人都是大數(shù)據(jù)的制造者。
(2)大數(shù)據(jù)的產(chǎn)生速度非常快(velocity)。例如,歐洲核子研究中心的大型強(qiáng)子對(duì)撞機(jī)在工作狀態(tài)下能每秒產(chǎn)生PB級(jí)的數(shù)據(jù)。在日常生活中,由于用戶群過(guò)于龐大,在極短的時(shí)間里就可以產(chǎn)生更加龐大的數(shù)據(jù)量,比如國(guó)內(nèi)每日產(chǎn)生的GPS位置信息。
(3)大數(shù)據(jù)的類型是多種多樣的(variety)。按產(chǎn)生數(shù)據(jù)的主體劃分,有感知設(shè)備對(duì)現(xiàn)實(shí)世界進(jìn)行測(cè)量而獲得的數(shù)據(jù),有移動(dòng)設(shè)備的傳感器收集的用戶行為數(shù)據(jù);按數(shù)據(jù)格式劃分,可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。此外還有其他分類標(biāo)準(zhǔn)。
(4)利用好大數(shù)據(jù),可以以低成本創(chuàng)造高價(jià)值(value)。大數(shù)據(jù)最大的價(jià)值在于通過(guò)從大量不相關(guān)的各種類型的海量數(shù)據(jù)中,挖掘出對(duì)模式預(yù)測(cè)有價(jià)值的數(shù)據(jù),并通過(guò)AI或數(shù)據(jù)挖掘進(jìn)行深度分析,從而發(fā)現(xiàn)新規(guī)律和新知識(shí)。如果有了全國(guó)幾萬(wàn)感染者的數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行分析就能預(yù)測(cè)疫情的發(fā)展態(tài)勢(shì),從而在公共衛(wèi)生應(yīng)急管理中做出更有針對(duì)性的決策,最終達(dá)到控制疫情的效果。
2.大數(shù)據(jù)在公共衛(wèi)生管理中的優(yōu)勢(shì)分析
2.1數(shù)據(jù)挖掘是大數(shù)據(jù)在公衛(wèi)管理里發(fā)揮優(yōu)勢(shì)的前提
在這里首先引出兩個(gè)概念:數(shù)據(jù)挖掘和醫(yī)學(xué)數(shù)據(jù)挖掘。
(1)數(shù)據(jù)挖掘是指在不完全的、大量且隨機(jī)的數(shù)據(jù)中通過(guò)某種算法找出數(shù)據(jù)中所隱藏的、人們未知的、具有潛在價(jià)值的知識(shí)和信息的過(guò)程。數(shù)據(jù)挖掘具有自身獨(dú)有的理念,給人們解決問(wèn)題提供了一種新的思路和方法。
(2)基于大數(shù)據(jù)的醫(yī)學(xué)數(shù)據(jù)挖掘是一門覆蓋面廣、技術(shù)難度大的新興交叉學(xué)科。它是計(jì)算機(jī)技術(shù)、人工智能和現(xiàn)代醫(yī)學(xué)相結(jié)合的產(chǎn)物,需要從事計(jì)算機(jī)和統(tǒng)計(jì)學(xué)的研究人員與醫(yī)務(wù)工作者之間的充分合作。隨著理論研究的深入和進(jìn)一步的實(shí)踐探索,醫(yī)學(xué)數(shù)據(jù)挖掘在疾病的診療、醫(yī)學(xué)科研以及公衛(wèi)管理等方面發(fā)揮了強(qiáng)有力的作用,而這也是大數(shù)據(jù)在公衛(wèi)應(yīng)急管理里發(fā)揮其優(yōu)勢(shì)的前提。
2.2大數(shù)據(jù)應(yīng)用在公共衛(wèi)生應(yīng)急管理中的優(yōu)勢(shì)
(1)大數(shù)據(jù)應(yīng)用范圍十分廣,這意味著,在進(jìn)行公衛(wèi)管理時(shí)能靠大數(shù)據(jù)獲得幾乎所有需要的信息。從交通出行數(shù)據(jù)到醫(yī)院確診數(shù)據(jù)到醫(yī)療物資數(shù)據(jù),從多樣的數(shù)據(jù)里可以得到全面的信息。新冠疫情防控前期,電信企業(yè)利用大數(shù)據(jù)分析技術(shù)聚焦重點(diǎn)地區(qū)、省份,特別是在關(guān)鍵時(shí)間節(jié)點(diǎn),提供了人員的流動(dòng)信息以及疫情的態(tài)勢(shì);中國(guó)電子科技集團(tuán)建立了風(fēng)險(xiǎn)人群感知大數(shù)據(jù)平臺(tái),在這個(gè)基礎(chǔ)上還研發(fā)了密切接觸者測(cè)量?jī)x,每個(gè)人只要輸入自己的姓名、身份證,就能知道自己是不是密切接觸者;中國(guó)信息通訊研究院研發(fā)了重點(diǎn)醫(yī)療物資的調(diào)度和保障平臺(tái),極好地實(shí)現(xiàn)了調(diào)度和保障的有效性。
(2)大數(shù)據(jù)數(shù)據(jù)量十分大,對(duì)海量數(shù)據(jù)進(jìn)行挖掘分析可以讓相關(guān)部門在進(jìn)行公衛(wèi)管理時(shí)結(jié)合數(shù)據(jù)庫(kù)中提煉出大量的潛在有效信息對(duì)特定人群進(jìn)行分析診斷并得出診斷結(jié)論;也可以通過(guò)分析處理一些歷史數(shù)據(jù)挖掘出與疾病相關(guān)的重要信息并形成結(jié)論。例如在對(duì)抗新冠肺炎疫情中,通過(guò)追蹤感染者與疑似感染人群的歷史出行數(shù)據(jù)、消費(fèi)數(shù)據(jù),摸清這些人過(guò)去的出現(xiàn)狀況來(lái)預(yù)測(cè)相關(guān)地區(qū)的疫情發(fā)展趨勢(shì),對(duì)傳染病進(jìn)行有效遏制;疾病的分布通常隨人口的年齡,性別,職業(yè)等而變化,也與人群的日常行為和生活環(huán)境有關(guān)。對(duì)醫(yī)院病例數(shù)據(jù)庫(kù)中的病人群體的相關(guān)信息進(jìn)行整合分析,可以從中得出各類社會(huì)群體與疾病間的相互關(guān)聯(lián)性,判斷出易感染易發(fā)病人群與潛在傳染源,降低疾病的蔓延程度與負(fù)面影響。這些都是大數(shù)據(jù)在應(yīng)急管理中的優(yōu)勢(shì)所在。
3.目前運(yùn)用大數(shù)據(jù)進(jìn)行公共衛(wèi)生管理時(shí)存在的劣勢(shì)、問(wèn)題與風(fēng)險(xiǎn)
3.1運(yùn)用大數(shù)據(jù)進(jìn)行公衛(wèi)管理的劣勢(shì)
(1)與傳統(tǒng)管理手段相比,大數(shù)據(jù)式的管理顯然對(duì)技術(shù)的要求更高。比如數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)挖掘本身就是一種新的數(shù)據(jù)處理技術(shù),它融合了數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、人工智能等領(lǐng)域的理論和技術(shù)。因此醫(yī)療數(shù)據(jù)挖掘?qū)夹g(shù)的要求極其嚴(yán)苛。而目前,中國(guó)的數(shù)據(jù)挖掘技術(shù)還處于起步階段,相關(guān)可應(yīng)用人才還不足以滿足社會(huì)需要。在不斷增長(zhǎng)的海量數(shù)據(jù)群中挖掘出有價(jià)值的數(shù)據(jù)進(jìn)行分析,仍是一大挑戰(zhàn)。
(2)大數(shù)據(jù)加大了管理的難度。醫(yī)學(xué)人才與技術(shù)人才彼此獨(dú)立,兩者間存在著專業(yè)壁壘不能輕易打破,而運(yùn)用大數(shù)據(jù)進(jìn)行公衛(wèi)管理時(shí)是需要雙方甚至更多方密切合作的。如果不能對(duì)各主體進(jìn)行有效的管理,在進(jìn)行數(shù)據(jù)分析時(shí)數(shù)據(jù)與醫(yī)學(xué)間的知識(shí)轉(zhuǎn)化過(guò)程會(huì)極大地拉低工作效率,這在以高速高效為應(yīng)急防控關(guān)鍵的重大突發(fā)性公衛(wèi)事件中是相當(dāng)不利的。
3.2運(yùn)用大數(shù)據(jù)進(jìn)行公衛(wèi)管理存在的問(wèn)題
(1)數(shù)據(jù)挖掘與數(shù)據(jù)整合難度大。一方面是前文提到的數(shù)據(jù)挖掘本身就是一種新技術(shù),其發(fā)展并不充分,國(guó)內(nèi)相關(guān)技術(shù)還不完善;一方面是數(shù)據(jù)太過(guò)龐大太過(guò)多樣,且數(shù)據(jù)增長(zhǎng)速度正在不斷加快,在進(jìn)行數(shù)據(jù)挖掘與整合時(shí)對(duì)技術(shù)和管理的要求都在不斷提高。
(2)醫(yī)療信息平臺(tái)尚未完全聯(lián)通。國(guó)內(nèi)的醫(yī)療衛(wèi)生信息化還處于一種各自開發(fā)、各自建設(shè)的狀態(tài),區(qū)域醫(yī)療衛(wèi)生信息數(shù)據(jù)中心還在建設(shè)當(dāng)中,區(qū)域內(nèi)醫(yī)療機(jī)構(gòu)信息互聯(lián)互通還未實(shí)現(xiàn),各醫(yī)療信息平臺(tái)位于“信息孤島”仍是還未充分解決的現(xiàn)實(shí)問(wèn)題。
3.3使用大數(shù)據(jù)技術(shù)進(jìn)行公衛(wèi)管理的潛在風(fēng)險(xiǎn)
(1)假數(shù)據(jù)的風(fēng)險(xiǎn)。大數(shù)據(jù)環(huán)境下的數(shù)據(jù)具有較高的信噪比,在龐大的數(shù)據(jù)海洋里也容納了“假”數(shù)據(jù)、“臟數(shù)據(jù)”,如果不能過(guò)濾掉那些非真實(shí)數(shù)據(jù),則會(huì)不同程度地影響到數(shù)據(jù)分析結(jié)果的真實(shí)性,甚至可能帶來(lái)“矯枉過(guò)正”的后果。
(2)數(shù)據(jù)泄露的風(fēng)險(xiǎn)。云計(jì)算等大數(shù)據(jù)技術(shù)、醫(yī)療保健信息的集中化收集和一些大型數(shù)據(jù)庫(kù)的建立,不僅使私人醫(yī)療數(shù)據(jù)遭受個(gè)人或不良團(tuán)體攻擊竊取的風(fēng)險(xiǎn)加大了,也為第三方出于商業(yè)目的在未經(jīng)授權(quán)的情況下濫用患者的健康信息提供了便利。醫(yī)療大數(shù)據(jù)與其他類型的大數(shù)據(jù)相比要更加敏感,患者數(shù)據(jù)泄漏可能會(huì)給其個(gè)人帶來(lái)被孤立、傷害等后果,而數(shù)據(jù)隱私保護(hù)問(wèn)題尚無(wú)完美的解決方案。
4.建立大數(shù)據(jù)的相關(guān)建議
4.1建立建全數(shù)據(jù)挖掘、篩選體制,將應(yīng)急管理與現(xiàn)代化信息技術(shù)充分結(jié)合
(1)在數(shù)據(jù)準(zhǔn)備階段要確保途徑準(zhǔn)確、提供數(shù)據(jù)人員真實(shí)可靠,從源頭上遏制數(shù)據(jù)的不真實(shí)性。
(2)在數(shù)據(jù)儲(chǔ)存階段,面對(duì)數(shù)量大、病例和數(shù)據(jù)類型復(fù)雜、數(shù)據(jù)變化快的醫(yī)學(xué)數(shù)據(jù)時(shí),需要進(jìn)行分類和模式化整理。還要注重?cái)?shù)據(jù)更新,需要完善多級(jí)聯(lián)動(dòng)的數(shù)字化信息采集系統(tǒng)來(lái)提高數(shù)據(jù)采集的及時(shí)性,以便在第一時(shí)間采集到新的數(shù)據(jù),這樣在重大突發(fā)性公共衛(wèi)生事件發(fā)生時(shí),可以第一時(shí)間地獲取到多源的數(shù)據(jù)來(lái)進(jìn)行風(fēng)險(xiǎn)評(píng)價(jià)、疾病防控,為醫(yī)院和相關(guān)政府部門應(yīng)對(duì)風(fēng)險(xiǎn)提供全面的數(shù)據(jù)支持。
(3)在篩選階段,建立或選取成熟有效的大數(shù)據(jù)模型,比如通過(guò)已有的傳染病模型(SI,SIR等模型)來(lái)提供一定的理論數(shù)據(jù)基礎(chǔ),作為大數(shù)據(jù)篩選的類比模本。要在突發(fā)性公共衛(wèi)生事件發(fā)生時(shí)快速構(gòu)建應(yīng)急管理數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)分類檢索系統(tǒng),這樣在需要各類不同數(shù)據(jù)時(shí)就可以通過(guò)檢索快速準(zhǔn)確地提取出相關(guān)數(shù)據(jù)。
4.2增強(qiáng)數(shù)據(jù)互用性,促進(jìn)信息共享
公共衛(wèi)生領(lǐng)域需要全面實(shí)現(xiàn)信息的標(biāo)準(zhǔn)化,建立有效的數(shù)據(jù)分析、管理系統(tǒng),搭建基于云計(jì)算的大數(shù)據(jù)研究技術(shù)平臺(tái),形成系統(tǒng)、成熟的大數(shù)據(jù)分析方法和模型,實(shí)現(xiàn)公共衛(wèi)生數(shù)據(jù)收集、整理、共享、挖掘、分析、決策一體化。
4.3提高數(shù)據(jù)的安全性
(1)完善數(shù)據(jù)保密與隱私保護(hù)的相關(guān)的法律法規(guī),確定由具有保密資質(zhì)的國(guó)家公共安全信息維護(hù)部門來(lái)組織相關(guān)部門獲得私人信息以外的時(shí)空活動(dòng)信息。
(2)病例數(shù)據(jù)庫(kù)在系統(tǒng)后臺(tái)運(yùn)行時(shí),讓公眾只能查看自身及其周邊整體情況,無(wú)權(quán)限調(diào)查、獲取他人具體的數(shù)據(jù)資料,從而進(jìn)一步保障數(shù)據(jù)安全問(wèn)題。
(3)最重要的是在技術(shù)上提高數(shù)據(jù)的安全性,做好數(shù)據(jù)加密,牢固數(shù)據(jù)防火墻,對(duì)醫(yī)療數(shù)據(jù)進(jìn)行集中儲(chǔ)存管理,確定好有權(quán)限獲取數(shù)據(jù)資料的管理層與相關(guān)工作人員,建立追責(zé)問(wèn)責(zé)機(jī)制。
5.結(jié)束語(yǔ)
在應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行公衛(wèi)管理上中國(guó)已經(jīng)具備了一定的基礎(chǔ),而2020年中國(guó)對(duì)新冠疫情的防控也說(shuō)明了大數(shù)據(jù)應(yīng)用在公衛(wèi)管理上的卓有成效。然而,公共衛(wèi)生領(lǐng)域需要的大數(shù)據(jù)十分龐雜,醫(yī)療數(shù)據(jù)具備一定的敏感性,目前國(guó)內(nèi)的大數(shù)據(jù)技術(shù)仍處于起步階段,在應(yīng)用大數(shù)據(jù)時(shí)存在的數(shù)據(jù)泄露風(fēng)險(xiǎn),這些都制約著用運(yùn)用大數(shù)據(jù)進(jìn)行公衛(wèi)管理。同時(shí)也說(shuō)明,大數(shù)據(jù)在公衛(wèi)管理上還有十分寬廣的發(fā)展空間。國(guó)內(nèi)應(yīng)該在已有技術(shù)基礎(chǔ)上,加強(qiáng)對(duì)相關(guān)技術(shù)人才、復(fù)合型人才的培養(yǎng)力度,注重技術(shù)創(chuàng)新,完善關(guān)于數(shù)據(jù)隱私保護(hù)的相關(guān)法律法規(guī),將應(yīng)急管理與現(xiàn)代化信息技術(shù)充分結(jié)合,早日建立完善的數(shù)字化公衛(wèi)管理體系。
參考文獻(xiàn)
[1]彭宗超,黃昊,吳洪濤,謝起慧. 新冠肺炎疫情前期應(yīng)急防控的“五情”大數(shù)據(jù)分析[J].治理研究.2020(2):6-20
[2]秦文哲,陳進(jìn),董力.大數(shù)據(jù)背景下醫(yī)學(xué)數(shù)據(jù)挖掘的研究進(jìn)展及應(yīng)用[J].中國(guó)胸心血管外科臨床雜志.2016 (1):55-60.
[3]劉彥培, 劉恩順. 醫(yī)學(xué)數(shù)據(jù)挖掘綜述[J]. 光明中醫(yī).2018 (12): 1714-1716.
[4]張世紅,徐國(guó)桓,劉會(huì)霞,龔文濤.數(shù)據(jù)挖掘在醫(yī)學(xué)上的應(yīng)用[J].醫(yī)學(xué)信息學(xué)雜志.2004(06):408-410.