孫愛婷++張海平
[摘 要] 進入信息時代,快速發(fā)展的信息技術(shù)逐漸滲透到了各行各業(yè),現(xiàn)代科學(xué)研究也因此得以飛速發(fā)展。生命科學(xué)作為科學(xué)的重要組成部分,也與信息技術(shù)有著越來越多的交集。在這樣的時代背景下,醫(yī)療大數(shù)據(jù)技術(shù)將會給傳統(tǒng)的臨床醫(yī)學(xué)研究帶來新的變革,但在創(chuàng)造其巨大機遇的同時,也面臨著不小的挑戰(zhàn)。文章介紹了大數(shù)據(jù)的特點和存在意義,以及醫(yī)療大數(shù)據(jù)的數(shù)據(jù)來源和研究的必要性;分析了傳統(tǒng)醫(yī)療領(lǐng)域的現(xiàn)狀和存在的問題,并對醫(yī)療大數(shù)據(jù)在臨床決策、藥物研發(fā)和健康監(jiān)測等應(yīng)用的發(fā)展趨勢進行了展望;最后闡述了醫(yī)療大數(shù)據(jù)所面臨的技術(shù)和實施上的雙重挑戰(zhàn)。
[關(guān)鍵詞] 醫(yī)療大數(shù)據(jù);臨床醫(yī)學(xué);發(fā)展方向
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 19. 082
[中圖分類號] R197.32 [文獻標(biāo)識碼] A [文章編號] 1673 - 0194(2017)19- 0193- 03
0 前 言
隨著互聯(lián)網(wǎng)時代的飛速發(fā)展,大數(shù)據(jù)已經(jīng)在金融、交通運輸、互聯(lián)網(wǎng)等領(lǐng)域得到廣泛應(yīng)用,大數(shù)據(jù)一詞因此被人們熟知。既然大數(shù)據(jù)在眾多領(lǐng)域都已經(jīng)產(chǎn)生了重要的影響。那么,在醫(yī)療領(lǐng)域,這個對數(shù)據(jù)要求更為敏感和精準(zhǔn)的行業(yè),大數(shù)據(jù)又會為其帶來哪些機遇和挑戰(zhàn)呢?大數(shù)據(jù)和醫(yī)療領(lǐng)域的碰撞又會擦出怎樣的火花呢?本文就從醫(yī)療大數(shù)據(jù)說起,逐步了解大數(shù)據(jù)與醫(yī)療之間密不可分的聯(lián)系,進而發(fā)掘其應(yīng)用前景。
1 醫(yī)療大數(shù)據(jù)
1.1 大數(shù)據(jù)的概念及意義
隨著互聯(lián)網(wǎng)的廣泛應(yīng)用和云計算的高速發(fā)展,數(shù)據(jù)量正呈指數(shù)趨勢增長。大數(shù)據(jù)一詞雖被人們熟知,在各領(lǐng)域也進行過激烈的討論,然而在學(xué)術(shù)界卻依然沒有對大數(shù)據(jù)給出統(tǒng)一的定義。著名的麥肯錫公司所屬的麥肯錫全球研究所給出了這樣的定義:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征。這也是目前大眾普遍認(rèn)可的大數(shù)據(jù)的4V特點,即容量(Volume)、種類(Variety)、價值(Value)、速度(Velocity)。
容量是指數(shù)據(jù)量巨大?,F(xiàn)在大數(shù)據(jù)的數(shù)據(jù)量已經(jīng)可以達到EB,ZB的級別,而數(shù)據(jù)量的多少正是決定數(shù)據(jù)價值和潛在信息的關(guān)鍵;種類指數(shù)據(jù)種類的多樣性。數(shù)據(jù)既有常見的以文本為主的結(jié)構(gòu)化數(shù)據(jù),也包含圖片、音頻、視頻、位置信息等非結(jié)構(gòu)化數(shù)據(jù),所以,數(shù)據(jù)的處理能力是應(yīng)對數(shù)據(jù)多樣性的關(guān)鍵;價值指數(shù)據(jù)量巨大但密度低。在這種情況下,如何用較低的成本讓單純的數(shù)據(jù)轉(zhuǎn)化成有意義的信息,是大數(shù)據(jù)行業(yè)所面臨的挑戰(zhàn);速度指獲得數(shù)據(jù)的速度快。大數(shù)據(jù)中的數(shù)據(jù)大部分都是實時產(chǎn)生的在線數(shù)據(jù),因此,數(shù)據(jù)量比正常方式獲取的速度快得多。在大數(shù)據(jù)時代下的今天,人們的日常生活無處不見大數(shù)據(jù)的存在,人類將從IT(Information Technology)時代邁入DT(Data Technology)時代。在這種時代背景下,大數(shù)據(jù)已然作為一種重要戰(zhàn)略資源,成為各大企業(yè)和公司爭奪的對象。
1.2 醫(yī)療大數(shù)據(jù)
醫(yī)療大數(shù)據(jù)就是指在醫(yī)療領(lǐng)域所產(chǎn)生的海量數(shù)據(jù),其主要的數(shù)據(jù)來源有3類。一是臨床醫(yī)學(xué)數(shù)據(jù)。在現(xiàn)代的臨床治療中,數(shù)據(jù)的增長速度非???,從心電圖,CT圖像,再到完整的病歷圖,臨床醫(yī)學(xué)在目前所涉及的信息量越來越大。二是藥理研究和生命科學(xué)數(shù)據(jù)。藥物研發(fā)需要了解藥理作用和藥物間的相互作用,這是密集型的過程,此時會產(chǎn)生海量數(shù)據(jù)。而在生命科學(xué)領(lǐng)域,隨著人們對基因越來越深入的了解,基因測序和個人基因圖譜等數(shù)據(jù)也會走入普通人的生活中。三是個人健康數(shù)據(jù),目前人們主要通過每年的體檢了解自己的身體狀況,伴隨著互聯(lián)網(wǎng)和移動設(shè)備的飛速發(fā)展,便攜式的身體監(jiān)控設(shè)備也走進了人們的生活當(dāng)中。
未來,人們可以通過這些便攜設(shè)備查看身體的各項健康數(shù)據(jù),從而做到預(yù)防疾病或及時就醫(yī)。因此,某些傳統(tǒng)臨床醫(yī)學(xué)終將會被醫(yī)療大數(shù)據(jù)技術(shù)所取代,使得診斷結(jié)果更加精準(zhǔn),得出的結(jié)論更有說服力,醫(yī)療大數(shù)據(jù)也將成為未來醫(yī)療行業(yè)發(fā)展的重中之重。
2 傳統(tǒng)醫(yī)療行業(yè)存在的問題
在過去的十幾年間,傳統(tǒng)醫(yī)療行業(yè)也在飛速發(fā)展,醫(yī)療條件和醫(yī)療技術(shù)雖然在不斷進步,但自身存在的問題也不斷顯現(xiàn)。
2.1 優(yōu)秀醫(yī)療資源的分配不合理
在一線城市中,每千人中有3到4名專家級別的醫(yī)生教授提供醫(yī)療服務(wù),而在非一線城市,平均只有一名中水平的醫(yī)生。優(yōu)秀醫(yī)療資源的集中化不僅會使基層醫(yī)療機構(gòu)的醫(yī)療水平和資源利用率下降,還會使大醫(yī)院的資源得不到合理利用,從而導(dǎo)致想看病、先排隊的看病難問題。
2.2 傳統(tǒng)臨床診斷的局限性
當(dāng)前的臨床學(xué)科還是以系統(tǒng)和器官來命名,臨床疾病的診斷體系大多也是通過系統(tǒng)和器官為基礎(chǔ)進行診斷。然而,很多臨床疾病有著極為相似甚至是完全相同的表型,但這些疾病的基因型卻天差地別。而另一些疾病,它們的表型可能絲毫沒有關(guān)聯(lián),但基因型卻是完全相同的。舉個例子,某個基因發(fā)生基因突變產(chǎn)生缺陷,會使肺部發(fā)生病變,心臟、喉嚨也會產(chǎn)生一系列問題,但是患者會通過患病的系統(tǒng)和器官找對應(yīng)科室的醫(yī)生來診斷疾病,這樣每個科室的醫(yī)生所給出的診斷結(jié)論可能完全不同,給臨床診斷帶來了困難。
2.3 個人醫(yī)療信息不完整
目前,患者幾乎不可能獲得來自不同醫(yī)院完整的個人健康數(shù)據(jù),原因主要是醫(yī)療信息復(fù)雜性高,數(shù)據(jù)格式不統(tǒng)一,難于管理和充分利用。而這些個人健康數(shù)據(jù)存儲在各大醫(yī)院的數(shù)據(jù)庫中,數(shù)據(jù)安全問題也面臨著挑戰(zhàn)。所以,如何將完整的醫(yī)療健康數(shù)據(jù)還給患者是目前醫(yī)療行業(yè)需要思考的問題。
隨著大數(shù)據(jù)的發(fā)展和應(yīng)用,傳統(tǒng)醫(yī)療領(lǐng)域一定會發(fā)生翻天覆地的變化。而之前存在的問題也會隨著大數(shù)據(jù)的飛速發(fā)展而迎刃而解。例如,針對優(yōu)秀醫(yī)療資源過于集中的問題,可以通過大數(shù)據(jù)實現(xiàn)個人醫(yī)療信息的傳輸與共享,將病人完整的電子病歷共享給中小型醫(yī)院及社區(qū)醫(yī)院,或者通過在線醫(yī)療的形式,使得優(yōu)秀的醫(yī)療資源實現(xiàn)共享,從而實現(xiàn)醫(yī)療資源的均衡化,以及合理的發(fā)展和利用。
而對于傳統(tǒng)臨床醫(yī)學(xué)的局限性,也可以通過大數(shù)據(jù)來解決。通過對群體海量身體數(shù)據(jù)的研究,今后的疾病命名方式都可能發(fā)生改變,肺炎,肝炎等以器官命名的疾病名稱也許會被以基因型,分子名稱命名的疾病名稱所取代。
3 大數(shù)據(jù)在醫(yī)療領(lǐng)域的應(yīng)用分析
3.1 目前大數(shù)據(jù)在醫(yī)療領(lǐng)域已經(jīng)實現(xiàn)的應(yīng)用
隨著傳統(tǒng)醫(yī)學(xué)研究的局限性越發(fā)明顯,大數(shù)據(jù)必將在醫(yī)學(xué)研究中發(fā)揮重要的作用。目前在醫(yī)療領(lǐng)域,已經(jīng)有許多利用大數(shù)據(jù)的實例。
(1)百度通過搜索數(shù)據(jù),構(gòu)建疾病預(yù)測模型。由于流行病的發(fā)生和傳染有一定的規(guī)律性,而這些規(guī)律和環(huán)境指數(shù),氣候變化,人口流動等因素有密切關(guān)系。百度旗下的預(yù)測平臺由此推出了“疾病預(yù)測” 產(chǎn)品,實時提供幾種流行病的發(fā)病指數(shù)。同時,將網(wǎng)民搜索的大量流行病信息匯聚起來,從而形成統(tǒng)計規(guī)律,經(jīng)過一段時間的積累,可以形成許多預(yù)測模型,預(yù)測未來疾病的活躍指數(shù)。
(2)“康諾云”構(gòu)建健康管理方案??抵Z云產(chǎn)品是由時云醫(yī)療科技有限公司開發(fā)的,康諾云的基準(zhǔn)數(shù)據(jù)和分析預(yù)測模型來自美國明尼蘇達大學(xué)“時間生物學(xué)”中心,該中心也是現(xiàn)代時間生物學(xué)之父 Dr. Franz Halberg(哈爾貝格)教授的實驗室。從20世紀(jì) 60 年代開始,哈爾貝格時間生物學(xué)中心聯(lián)合全球幾十個醫(yī)學(xué)實驗室和醫(yī)院在北美、南美、歐洲、澳洲、非洲、亞洲采集了上百萬人次的基礎(chǔ)體征數(shù)據(jù),建立了豐富的跨種族和地域的人體體征數(shù)據(jù)庫與分析模型,并為 NASA 宇航員提供數(shù)據(jù)分析服務(wù)。因此,康諾云產(chǎn)品背后所依附的是權(quán)威的學(xué)術(shù)理論。傳統(tǒng)的醫(yī)療監(jiān)測模式只能對已有疾病的身體狀態(tài)進行監(jiān)測和判斷,而康諾云能對人體還沒形成的疾病狀態(tài)做出預(yù)測,從而為用戶提供健康管理方案。
3.2 未來醫(yī)療大數(shù)據(jù)應(yīng)用方向
3.2.1 臨床決策與診斷
在目前,傳統(tǒng)的臨床醫(yī)療雖然已經(jīng)開始使用一些先進的醫(yī)療檢測設(shè)備,如電子計算機斷層掃描,但疾病診斷主要還是依靠行醫(yī)經(jīng)驗。醫(yī)療從業(yè)人員積累的經(jīng)驗畢竟有限,并且靠經(jīng)驗診斷疾病不是百分之百可靠,按照經(jīng)驗去診斷疾病不可避免的會發(fā)生誤診、漏診的現(xiàn)象。調(diào)查顯示,我國的平均誤診率為27.8%,誤診所造成的醫(yī)療事故不僅會加重醫(yī)患矛盾,更會導(dǎo)致患者產(chǎn)生極大的生理和心理負擔(dān)。這些情況今后都可以通過大數(shù)據(jù)來解決,使用大數(shù)據(jù)技術(shù)對海量的醫(yī)療數(shù)據(jù)進行處理和分析,這些數(shù)據(jù)可以讓醫(yī)療工作者將主觀的經(jīng)驗和客觀的數(shù)據(jù)有效的結(jié)合起來,從而做出最正確的臨床決策,提高治療效率和治療效果。
3.2.2 藥品研發(fā)
制藥公司在新藥品的研發(fā)和推廣階段,會消耗大量的時間和成本。而一些患病幾率為千萬分之一的小眾疾病,即使可以研制出對癥的藥物,制藥公司也會因為研發(fā)成本的問題而放棄研發(fā),這就導(dǎo)致了這些患者面臨著無藥可醫(yī)的狀況。而通過大數(shù)據(jù),藥物的研發(fā)成本和研發(fā)時間將被極大降低,從而解決上述問題。
首先,在藥品研發(fā)階段,利用大數(shù)據(jù)進行數(shù)據(jù)建模并進行分析,預(yù)測藥物的臨床結(jié)果,可以為臨床階段的實驗結(jié)果提供參考,節(jié)省臨床階段的時間并優(yōu)化臨床實驗結(jié)果。在此之后,通過分析數(shù)據(jù)可以暫緩不必要的臨床實驗,降低研發(fā)成本。在藥品的推廣階段,制藥公司也可以通過大數(shù)據(jù)更快地回收成本。制藥公司也可以通過數(shù)據(jù)建模進行分析,從而生產(chǎn)出治療成功率更高的藥品并極大地縮短藥品從研發(fā)到投入市場的時間。
3.2.3 健康監(jiān)測和健康管理
隨著互聯(lián)網(wǎng)和移動設(shè)備的快速發(fā)展,智能可穿戴式設(shè)備已經(jīng)走進每個人的生活中。如索尼SWR12智能手環(huán),它具有震動提醒、睡眠監(jiān)測、步數(shù)測量、心率監(jiān)測等功能,在佩戴者的心率超過一定范圍后,手環(huán)還會發(fā)出警告提醒佩戴者。在今后,這些智能可穿戴設(shè)備也會更加完善。未來,這些設(shè)備可以通過收集個人的醫(yī)療健康數(shù)據(jù),對個人的健康狀況作出評估,并在有患病風(fēng)險的情況下作出正確反映和提醒,幫助其監(jiān)測健康狀況。用戶也可以利用互聯(lián)網(wǎng),將設(shè)備所收集的健康數(shù)據(jù)發(fā)送到醫(yī)院。這樣,醫(yī)護工作者就可以通過在線醫(yī)療的形式了解患者目前的身體狀況,并為患者制定出最有效的治療方案。
4 醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)
4.1 數(shù)據(jù)分析有難度
伴隨著醫(yī)療信息化的飛速發(fā)展,醫(yī)療行業(yè)所產(chǎn)生的數(shù)據(jù)量也在不斷增長,而如何讓這些醫(yī)療數(shù)據(jù)實現(xiàn)合理的利用是醫(yī)療領(lǐng)域目前所面臨的問題。并且,醫(yī)療數(shù)據(jù)的過于分散和數(shù)據(jù)利用率低的問題也在困擾著各大醫(yī)療機構(gòu),醫(yī)療機構(gòu)雖然積累了大量數(shù)據(jù),但這些數(shù)據(jù)的質(zhì)量還不能支撐臨床層面的研究。在面對醫(yī)療數(shù)據(jù)急劇增長的情況下,若可以通過大數(shù)據(jù)進行有效的數(shù)據(jù)挖掘和數(shù)據(jù)分析,就可以從海量醫(yī)療數(shù)據(jù)中篩選出質(zhì)量較高的有價值的信息,從而推動醫(yī)療行業(yè)的發(fā)展,提高醫(yī)療水平。另外,醫(yī)療數(shù)據(jù)中的偶然性和真實性問題也不容忽視。醫(yī)療數(shù)據(jù)的復(fù)雜性高,例如醫(yī)療監(jiān)測數(shù)據(jù),它存在著偶然性的小概率事件,而這些信息對于醫(yī)療信息的動態(tài)監(jiān)控沒有任何價值,反而容易造成干擾,所以如何規(guī)避這些偶然數(shù)據(jù)也是醫(yī)療行業(yè)今后要面對的問題。
4.2 技術(shù)上的困難
第一,醫(yī)療行業(yè)所產(chǎn)生的數(shù)據(jù)包含大量非結(jié)構(gòu)化數(shù)據(jù)。就目前而言,如何處理并整合這些非結(jié)構(gòu)化數(shù)據(jù)是醫(yī)療行業(yè)所面臨的一個挑戰(zhàn)。第二,數(shù)據(jù)利用率問題也是當(dāng)前研究的難點。由于醫(yī)療數(shù)據(jù)量爆炸性的增長,如何將有高質(zhì)量的有效數(shù)據(jù)從海量醫(yī)療數(shù)據(jù)中提取出來是今后的重點研究問題。第三,數(shù)據(jù)存儲問題。醫(yī)療數(shù)據(jù)不光存儲常規(guī)的結(jié)構(gòu)化數(shù)據(jù),中間還夾雜著大量非結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)的存儲方式已經(jīng)滿足不了醫(yī)療大數(shù)據(jù)的需要。因此,如何存儲這些醫(yī)療數(shù)據(jù)也是目前的難題。最后是延遲問題,醫(yī)療大數(shù)據(jù)存在實時性,許多臨床數(shù)據(jù)都需要進行實時或準(zhǔn)實時的處理,而以目前的技術(shù),想要處理這些實時數(shù)據(jù)還十分困難。
4.3 實施中的挑戰(zhàn)
首先,醫(yī)療工作者意識的缺乏。大部分人還不能充分意識到醫(yī)療大數(shù)據(jù)和醫(yī)療信息系統(tǒng)存在的意義,醫(yī)療大數(shù)據(jù)應(yīng)用的推廣經(jīng)常存在人為的干預(yù)。第二,信息孤島問題。中國擁有約十三億人口,醫(yī)療數(shù)據(jù)龐大且復(fù)雜,不同類型的醫(yī)療數(shù)據(jù)分散在各自的系統(tǒng)中,彼此之間幾乎沒有聯(lián)系。第三,標(biāo)準(zhǔn)化難于實施。由于醫(yī)療資源的分散,不僅醫(yī)療機構(gòu)間的數(shù)據(jù)不能共享,就連同一機構(gòu)不同科室間的數(shù)據(jù)也難以集成。這些問題主要都是因為缺乏數(shù)據(jù)標(biāo)準(zhǔn)所造成的。第四,相關(guān)法律的缺失。目前大數(shù)據(jù)發(fā)展速度已經(jīng)遠遠超過了法律更新的速度,在這種情況下,某些無良企業(yè)通過私自分析用戶健康數(shù)據(jù)獲利的事件屢有發(fā)生。所以,對其制定相關(guān)法律法規(guī)刻不容緩。
5 結(jié) 語
在如今繁榮發(fā)展的互聯(lián)網(wǎng)時代,大數(shù)據(jù)作為一項新興技術(shù)進入醫(yī)療行業(yè),必將影響整個醫(yī)療衛(wèi)生領(lǐng)域。研究人員要做的,就是與時俱進,精準(zhǔn)的實現(xiàn)大數(shù)據(jù)和醫(yī)療相結(jié)合,推動未來醫(yī)療事業(yè)的發(fā)展。本文介紹了什么是醫(yī)療大數(shù)據(jù),分析了傳統(tǒng)醫(yī)療行業(yè)的弊端,最后分析了醫(yī)療大數(shù)據(jù)的實際應(yīng)用及其未來的主要發(fā)展方向。希望能為研究醫(yī)療大數(shù)據(jù)的學(xué)者們提供一些參考。
主要參考文獻
[1]郭曉科.大數(shù)據(jù)[M].北京:清華大學(xué)出版社,2013.
[2][英]維克托·邁爾-舍恩伯格. 大數(shù)據(jù)時代[M].盛揚燕,譯.杭州:浙江人民出版社,2012.
[3][美]埃里克·托普. 顛覆醫(yī)療:大數(shù)據(jù)時代的個人健康革命[M].張南,譯.北京:電子工業(yè)出版社,2013.
[4]周建文. 大數(shù)據(jù)環(huán)境中的醫(yī)療數(shù)據(jù)隱私保護[J].中國管理信息化,2015,18(4).
[5]張苗苗. 大數(shù)據(jù)撬動醫(yī)療數(shù)據(jù)應(yīng)用杠桿[N].中國電腦教育報,2013-02-25.