謝芳華 孟 戈 包喜軍
大數(shù)據(jù)在寵物醫(yī)療中相關(guān)問題的探討
謝芳華 孟 戈 包喜軍
近年來,大數(shù)據(jù)引起了產(chǎn)業(yè)界、科技界和政府部門的高度關(guān)注。2008年《N ature》出版??禕igData》,2011年《Science》也推出關(guān)于數(shù)據(jù)處理的??禗ealingw ithdata》,2012年3月,奧巴馬宣布美國政府投資2億美元啟動“大數(shù)據(jù)研究和發(fā)展計(jì)劃”。美國政府認(rèn)為大數(shù)據(jù)是 “未來的新石油”,必將給未來的科技與經(jīng)濟(jì)發(fā)展帶來深遠(yuǎn)的影響,并將“大數(shù)據(jù)研究”上升為國家意志。同樣,寵物醫(yī)療衛(wèi)生領(lǐng)域也迎來了自己的“大數(shù)據(jù)時(shí)代”,其中重要的發(fā)展包括在藥物研發(fā)中使用基因數(shù)據(jù)、臨床實(shí)驗(yàn)數(shù)據(jù)的共享、電子病歷系統(tǒng) (EM Rs)的廣泛使用和患者登記數(shù)據(jù)使用等。寵物醫(yī)學(xué)業(yè)界越來越關(guān)注大數(shù)據(jù)在寵物醫(yī)療衛(wèi)生領(lǐng)域的診療、科研、管理和教學(xué)等方面的作用。本文將從大數(shù)據(jù)概述、大數(shù)據(jù)在犬病治療中的應(yīng)用分析、云存儲數(shù)據(jù)傳輸?shù)陌踩詥栴}等方面對大數(shù)據(jù)進(jìn)行綜述。
(一)大數(shù)據(jù)的定義
目前,對于大數(shù)據(jù)的定義尚未達(dá)成共識。李國杰等認(rèn)為大數(shù)據(jù)是指無法在可容忍的時(shí)間內(nèi)用傳統(tǒng)I T技術(shù)和軟硬件工具對其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合。孟小峰等則認(rèn)為,不同的定義基本是對大數(shù)據(jù)特征的闡述和歸納,即認(rèn)為大數(shù)據(jù)滿足3個(gè)特點(diǎn):規(guī)模性、多樣性和高速性。因此工程師們必須改進(jìn)處理數(shù)據(jù)的工具,這導(dǎo)致了新的處理技術(shù)的誕生,例如M apReduce和開源Hadoop平臺。大數(shù)據(jù)也是一次思維上的變革,主要包括要全體數(shù)據(jù)不要抽樣、要效率不要絕對精確、要相關(guān)不要因果。
(二)大數(shù)據(jù)的意義
大數(shù)據(jù)的核心意義是預(yù)測。谷歌對美國人每天頻繁檢索的搜索詞條進(jìn)行數(shù)據(jù)挖掘,基于其中4 5個(gè)檢索詞組合的一個(gè)數(shù)學(xué)模型可以準(zhǔn)確預(yù)測流感,其預(yù)測結(jié)果與官方數(shù)據(jù)的相關(guān)性達(dá)到9 7%。Farecast公司開發(fā)出了一個(gè)機(jī)票價(jià)格預(yù)測系統(tǒng),其票價(jià)預(yù)測準(zhǔn)確度超過7 5%。大數(shù)據(jù)已經(jīng)成為一種新型戰(zhàn)略資源,其潛在價(jià)值和增長速度正在改變著人類的工作、生活和思維方式。但是大數(shù)據(jù)并不能主宰一切,大數(shù)據(jù)能夠發(fā)現(xiàn) “是什么”,而不能說明 “為什么”;大數(shù)據(jù)能夠發(fā)現(xiàn)大趨勢和規(guī)律,而不能發(fā)生顛覆性的創(chuàng)新;大數(shù)據(jù)能夠提供貼切的服務(wù),而不能創(chuàng)造新需求。
目前,寵物醫(yī)院的管理水平以及醫(yī)療技術(shù)在逐年提高,主旨在與服務(wù)家庭寵物類。現(xiàn)代生活中大量的寵物進(jìn)入人們的生活當(dāng)中,對寵物更人性化和更合理的管理方式也越來越重要。對寵物醫(yī)院的管理逐步進(jìn)入以信息服務(wù)為主的醫(yī)療技術(shù)服務(wù)、寵物主人滿意度和醫(yī)院知名度為中心的管理階段。
(一)對寵物醫(yī)療信息資源庫的預(yù)測建模
寵物脖子上都植入有電子芯片,可以儲存和讀取寵物基本信息以及各種結(jié)構(gòu),通過這種數(shù)據(jù)可以很快了解病史,從而更有針對性的對寵物進(jìn)行治療。
在寵物醫(yī)院中以電子病歷為中心的管理信息系統(tǒng)將原有的電子信息系統(tǒng)、影像系統(tǒng)、檢驗(yàn)系統(tǒng)以及寵物主人管理系統(tǒng)等有效地組織起來,實(shí)現(xiàn)寵物醫(yī)院以寵物為中心的全信息化服務(wù)。如果寵物醫(yī)療事業(yè)發(fā)展的更好,電子病歷系統(tǒng)可以通過互聯(lián)網(wǎng)相連接,實(shí)現(xiàn)數(shù)據(jù)共享,可以減少就醫(yī)寵物的重復(fù)檢查,縮短就醫(yī)時(shí)間提高就診效率。由此可見,電子病歷系統(tǒng)產(chǎn)生的數(shù)據(jù)是大數(shù)據(jù),它包含3部分:動物電子病歷數(shù)據(jù)、動物醫(yī)學(xué)檢驗(yàn)數(shù)據(jù)和動物醫(yī)學(xué)影像數(shù)據(jù)。動物電子病歷是通過主人描述癥狀和大夫記錄產(chǎn)生的以文字表述為主的數(shù)據(jù),它是一種非結(jié)構(gòu)化的數(shù)據(jù),寵物信息管理系統(tǒng)業(yè)務(wù)登記表如表1所示,電子病歷管理信息登記表如表2所示;動物醫(yī)學(xué)檢驗(yàn)數(shù)據(jù)來自于動物醫(yī)學(xué)檢驗(yàn)設(shè)備,如血常規(guī)檢查、肝功能檢驗(yàn)和心電圖檢查等,由這些醫(yī)學(xué)儀器產(chǎn)生的數(shù)據(jù)一般是數(shù)學(xué)數(shù)據(jù),且有標(biāo)準(zhǔn)和規(guī)范,因此它是一種結(jié)構(gòu)化的數(shù)據(jù)。急診儀檢驗(yàn)報(bào)告單如圖1所示,動物影像數(shù)據(jù)來自于影像設(shè)備,是一種以圖像顯示為檢測結(jié)構(gòu)的醫(yī)學(xué)檢驗(yàn)裝置,由它產(chǎn)生的數(shù)據(jù)是圖像,是一種非結(jié)構(gòu)化數(shù)據(jù),X線片如圖2所示等。
表1 寵物信息管理系統(tǒng)業(yè)務(wù)登記表
表2 電子病歷管理信息登記表
圖1 急診儀檢驗(yàn)報(bào)告單
圖2 X線片
電子病歷系統(tǒng)的開發(fā)與電子芯片有效地結(jié)合起來,不管在什么地方給寵物看病,都會有以前的病歷,甚至可以通過電子芯片傳入更多的信息,再去寵物醫(yī)院看病的時(shí)候就可以直接通過掃描芯片了解寵物的病情。
通過對電子病歷系統(tǒng)產(chǎn)生的3種不同的大數(shù)據(jù)以及植入的芯片可以解析出很多信息并加以利用。如果一頭犬去寵物醫(yī)院就醫(yī),第一次去就醫(yī)時(shí)會將所有信息填入病歷中,并將信息輸入芯片中上傳到后臺服務(wù)器,這樣不管犬隨主人走到哪里,全國的各個(gè)寵物醫(yī)院都可以通過芯片調(diào)取到相關(guān)有用信息,那么這樣可以通過與芯片直接引導(dǎo)去具體的那個(gè)科室去看病,醫(yī)生通過看電子病歷初步了解情況,避免重復(fù)問診并結(jié)合一定的問診,確診后直接開處方取得藥物。下次同一頭犬在不同的醫(yī)院看病時(shí),通過電子病歷就能查到以上結(jié)果,可以讓醫(yī)生系統(tǒng)的了解犬的病情并得出結(jié)論。這樣的看病方式較以往而言,不但節(jié)約主人的時(shí)間和金錢,而且為我國動物醫(yī)學(xué)的發(fā)展起到了很大的促進(jìn)作用。
寵物信息、診療信息、處方醫(yī)囑和檢查報(bào)告等共同構(gòu)成了寵物醫(yī)療的大數(shù)據(jù)資源,可以通過這些數(shù)據(jù)采集、抽取和轉(zhuǎn)換,形成醫(yī)療信息資源庫,為寵物和獸醫(yī)提供數(shù)據(jù)支持。面向?qū)櫸?,醫(yī)療信息資源庫為寵物提供個(gè)性化健康管理,如智能導(dǎo)診、健康記錄和疫苗接種預(yù)警等。面向獸醫(yī),醫(yī)療信息資源庫為醫(yī)生提供個(gè)性化臨床決策支持。
(二)如何實(shí)現(xiàn)大數(shù)據(jù)、云存儲下的醫(yī)療信息資源庫管理服務(wù)
首先采集原始數(shù)據(jù),將所有醫(yī)療信息資源庫全部數(shù)字化。那如何做到全部數(shù)字化呢?拍照、掃描都可以。不過,這項(xiàng)工作說著簡單做起來卻非常艱難,如果按文件來劃分的話,以南京某寵物醫(yī)院為例,一年所有收集來的檔案材料保守估計(jì)有 6000 件左右。如果是10年、20年的檔案材料會有多少呢?這將是一個(gè)繁重的系統(tǒng)項(xiàng)目工作,可是如果不使用大數(shù)據(jù)與云儲存技術(shù)的話就無法運(yùn)用到最新的科學(xué)技術(shù)、無法將被動服務(wù)變?yōu)橹鲃臃?wù)了。這就需要檔案工作人員夜以繼日地辛勤工作,通過對文件有計(jì)劃地掃描、更名、錄入、排序,存儲為相應(yīng)格式。掃描的分辨率最好和A4的尺寸一樣大,甚至更大,因?yàn)橐玫剡€原原始檔案各方面數(shù)據(jù)。
將這些數(shù)據(jù)的文件全部進(jìn)行重命名,按照所有文字的內(nèi)容,盡可能全地提供各方面信息,比方說時(shí)間、文號、文件名稱、頁數(shù)、標(biāo)題、關(guān)鍵詞等各方面數(shù)據(jù)都要盡可能全面進(jìn)行記錄。由于涉及的文件數(shù)量巨大,材料較多,就要有更大的存儲空間。幾年前是以GB級別的數(shù)據(jù)單位,現(xiàn)在至少需要到以 TB 為數(shù)據(jù)的單位,再過幾年甚至需要更大的PB單位。為了數(shù)據(jù)的安全,建議高校使用自己的存儲系統(tǒng)甚至是自己的云存儲系統(tǒng)。
將所有的客戶端訪問程序(W EB2.0、智能手機(jī)、平板電腦等設(shè)備)都連接到醫(yī)院的云服務(wù)器查詢系統(tǒng),從后臺監(jiān)控?cái)?shù)據(jù)的利用率以及各個(gè)方面的查詢數(shù)據(jù)。通過這些大數(shù)據(jù)查詢出查詢者需要的信息,這樣便可以在合適的時(shí)間主動提供服務(wù)了。
云存儲數(shù)據(jù)是通過網(wǎng)絡(luò)進(jìn)行傳輸?shù)?,網(wǎng)絡(luò)的安全問題勢必會對云存儲數(shù)據(jù)傳輸?shù)陌踩詭碛绊懀@主要包括對數(shù)據(jù)的惡意攻擊和破壞以及數(shù)據(jù)的篡改和竊取等問題。這就要做到防范黑客攻擊,或者是惡意攻擊者,要做到從軟、硬件相結(jié)合的防護(hù)方法,比如應(yīng)用軟、硬件防火墻,關(guān)閉無用端口,使用殺毒程序,運(yùn)用云監(jiān)控、數(shù)據(jù)加密、限制訪問等保護(hù)措施。以上是筆者對于大數(shù)據(jù)時(shí)代下如何做好醫(yī)療信息資源庫工作的一些見解。醫(yī)療信息資源庫最大的功能就是保存信息以及提供信息服務(wù),利用大數(shù)據(jù)、云存儲技術(shù)能完美地將這兩個(gè)功能發(fā)揮出來。身處這個(gè)“未來”的世界,醫(yī)療信息資源庫管理人員一定要與時(shí)俱進(jìn),積極創(chuàng)新,把互聯(lián)網(wǎng)、大數(shù)據(jù)等高新技術(shù)應(yīng)用到工作中,為醫(yī)療信息資源庫事業(yè)做出積極的貢獻(xiàn)。
大數(shù)據(jù)時(shí)代無疑會對寵物醫(yī)療領(lǐng)域產(chǎn)生巨大的影響和推動,它可以揭露健康的影響因素,將最適合的治療方式提供給無法開口交流的小動物;能夠促進(jìn)新的發(fā)現(xiàn)、優(yōu)化治療結(jié)果和削減開支。大數(shù)據(jù)也會通過數(shù)據(jù)的開放,將醫(yī)療信息直接傳遞給寵物主人,從而改變目前將病歷儲存在醫(yī)療機(jī)構(gòu),使被動選擇醫(yī)療機(jī)構(gòu)轉(zhuǎn)變成主動選擇的模式。可以預(yù)見在不久的將來,大數(shù)據(jù)會越來越多地管理健康,并在其中占主導(dǎo)地位。然而大數(shù)據(jù)研究是一個(gè)近幾年來新興的、正在快速發(fā)展的技術(shù),尤其是在寵物醫(yī)療行業(yè)的應(yīng)用,將會面臨更多的挑戰(zhàn)。為了實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值,寵物醫(yī)療行業(yè)需要提高數(shù)據(jù)的標(biāo)準(zhǔn)化和互用性,促進(jìn)信息的共享,建立有效的數(shù)據(jù)管理方式,改進(jìn)分析技術(shù)和方法,培養(yǎng)數(shù)據(jù)分析專業(yè)人才。
(作者單位:公安部南京警犬研究所,210012)
(本文圖片由作者提供)
(編輯:全群麗)