摘? 要:醫(yī)學影像學正朝向大數(shù)據(jù)應用方面發(fā)展,醫(yī)學影像大數(shù)據(jù)具有大規(guī)模、高增速、多結構、高價值和真實準確五個特點。受技術方面的制約,目前絕大多數(shù)影像數(shù)據(jù)還需依賴影像診斷醫(yī)師進行人工分析,因此出現(xiàn)了誤診率高、醫(yī)師缺口大的問題。隨著我國發(fā)展人工智能腳步的加快,醫(yī)學影像被業(yè)內認為是人工智能在醫(yī)療中最有潛力的落地領域。在未來,AI醫(yī)學影像大數(shù)據(jù)主要會有以下幾個發(fā)展方向:開發(fā)智能醫(yī)學影像圖像分析工具、助力精準醫(yī)療、促進影像組學方法的發(fā)展。在發(fā)展的同時,我們還要關注制約醫(yī)學影像大數(shù)據(jù)應用的幾個因素,即影像數(shù)據(jù)的規(guī)模與質量還較低、數(shù)據(jù)標注效率有待提高、“人工智能+醫(yī)療”的復合背景人才稀缺。
關鍵詞:醫(yī)學影像大數(shù)據(jù);人工智能;精準醫(yī)療
中圖分類號:R445 文獻標識碼:A ? ?文章編號:1671-2064(2019)24-0000-00
1 認識醫(yī)學影像大數(shù)據(jù)
1.1 什么是醫(yī)學影像大數(shù)據(jù)
在醫(yī)學領域,隨著信息化的不斷深入,數(shù)字醫(yī)學數(shù)據(jù)越來越豐富,其中醫(yī)學影像數(shù)據(jù)是一個十分重要的組成部分,有超過80%的醫(yī)療數(shù)據(jù)來自于醫(yī)學影像。如果按照大數(shù)據(jù)的特點,醫(yī)學影像大數(shù)據(jù)的定義可表示為:由DR、CT、MR等醫(yī)學影像設備所產(chǎn)生的,存儲在PACS系統(tǒng)內的,大規(guī)模、高增速、多結構、高價值和真實準確的影像數(shù)據(jù)集合。其具有以下五個特點:大規(guī)模、高增速、多結構、高價值和真實準確。
多結構和高價值這兩點很好理解。醫(yī)療影像設備種類日益增長,使得醫(yī)學影像大數(shù)據(jù)包含結構化表格、半結構化文本、非結構化影像等,數(shù)據(jù)結構多樣;且現(xiàn)代醫(yī)學越來越依賴醫(yī)學影像數(shù)據(jù)進行診斷,約80%的臨床問題需要影像檢查才能得到準確的診斷結果,這使得影像大數(shù)據(jù)具有很高的醫(yī)學分析和指導價值。
大規(guī)模和高增速需要從市場和人口兩個大環(huán)境來解釋。據(jù)統(tǒng)計,我國科室級PACS、多科室或全院級PACE系統(tǒng)建設水平已經(jīng)分別達到了60-70%和50-60%,基本覆蓋國內一線城市的三甲醫(yī)院,從市場增速來看,我國PACS市場年均增速在25%以上;人口方面,影響醫(yī)療影像大數(shù)據(jù)規(guī)模的主要是人口基數(shù)和年齡的分布,據(jù)預測,到本世紀中葉,我國老年人口數(shù)量將達到峰值,超過4億,屆時每3個人中就會有一個老年人,老齡化必將帶來醫(yī)療服務的旺盛需求。所以,目前PACS系統(tǒng)的普及率和人口數(shù)量的龐大,是我國醫(yī)學影像大數(shù)據(jù)的大規(guī)?;A,而PACS系統(tǒng)和老齡人口的快速增長率,是醫(yī)學影像大數(shù)據(jù)的高增速的基礎。
作為大數(shù)據(jù)5V特征中的最后一環(huán),醫(yī)學影像大數(shù)據(jù)的真實性是如何實現(xiàn)的呢?這需要從數(shù)據(jù)處理技術方面來解釋。事實上,PACS系統(tǒng)從不同的影像設備上收集的數(shù)據(jù)在質量上往往參差不齊,而數(shù)據(jù)分析結果的準確度和可信度很大程度上取決于收集到的數(shù)據(jù)質量的高低,所謂“垃圾進,垃圾出”,沒有數(shù)據(jù)準確性作保證,大數(shù)據(jù)分析就變成了一紙空談。為了保證影像大數(shù)據(jù)的真實性,在影像設備將影像數(shù)據(jù)傳遞給PACS系統(tǒng)后,首先要做的第一步就是由PACS系統(tǒng)來對影像進行后處理。以多維影像融合這項技術為例,主要包括數(shù)據(jù)預處理、圖像分割、特征提取以及匹配判斷這幾個過程。簡單來說,數(shù)據(jù)預處理是指將大量模糊的、不完整的、帶有噪聲和冗余的信息進行清理和過濾, 濾掉殘渣,留下精華,將其變成適合挖掘的形式,包括圖像去噪、增強、平滑、銳化等工作;圖像分割和特征提取環(huán)節(jié)是將預處理過的圖像“切絲、切段”,為后期的智能匹配和判斷提供精準的素材,例如器官形態(tài)模型、圖像邊緣特征模型、神經(jīng)網(wǎng)絡聚類模型等;最后的圖像匹配和聚類的過程,需要依賴深度學習等核心技術,即人工智能與醫(yī)學影像大數(shù)據(jù)的融合。
1.2 醫(yī)學影像大數(shù)據(jù)的應用現(xiàn)狀
據(jù)了解,目前絕大多數(shù)醫(yī)學影像數(shù)據(jù)都要依賴影像診斷醫(yī)師進行人工分析。人工分析主要存在以下兩個問題:第一是精確度低。影像診斷結果會因為受到醫(yī)師的精力、耐力、眼力、經(jīng)驗水平等因素的局限,很容易被誤判。中國醫(yī)學會的一份誤診數(shù)據(jù)資料顯示,中國臨床醫(yī)療每年的誤診人數(shù)約為5700萬人,總誤診率為27.8%,其中惡性腫瘤平均誤診率為40%,如鼻咽癌、白血病、胰腺癌等,肝結核、胃結核等肺外結核的平均誤診率也在40%以上。因為醫(yī)療行業(yè)中80%-90%的數(shù)據(jù)都來源于醫(yī)學影像,醫(yī)學影像是醫(yī)生進行疾病判斷的重要依據(jù),所以要降低誤診率,首先要提高影像診斷的精確度。
第二是放射科醫(yī)師缺口大。目前我國放射科醫(yī)師僅有8萬多名,每年承擔的診斷工作量卻達到了14.4億張影像,并且這個需求還在不停地增加,我國醫(yī)學影像數(shù)據(jù)以每年30%的速率增長,與之相對應的放射科醫(yī)師的年增長速率卻只有4%,其間的差距是26%,放射科醫(yī)師數(shù)量的增長遠不及影像數(shù)據(jù)的增長。這意味著放射科醫(yī)師在未來處理影像數(shù)據(jù)的壓力會越來越大,甚至遠遠超過負荷。據(jù)統(tǒng)計,有超過50%的放射科醫(yī)師工作時間在8小時以上,20.6%的醫(yī)師每天平均工作時間超過10個小時。面對爆炸式增長的醫(yī)學影像數(shù)據(jù)集和相當較少的、水平不一的閱片醫(yī)師,醫(yī)師的疲勞、情緒等因素都將會導致誤診、漏診率的上升。
那么,面對目前醫(yī)學影像誤診率高、醫(yī)師缺口大的問題,應該通過何種途徑去解決呢?從現(xiàn)有技術水平來看,最好的途徑便是人工智能,隨著人工智能和醫(yī)學影像大數(shù)據(jù)的逐漸普及,兩者的融合,必將成為醫(yī)學影像發(fā)展的重要方向。
2 未來醫(yī)學影像大數(shù)據(jù)的應用發(fā)展
得益于高質量、高標準化的醫(yī)療影像數(shù)據(jù)庫的快速積累,醫(yī)學影像天然具有使用人工智能進行大數(shù)據(jù)處理的可能,再加上智能圖像診斷算法趨于成熟,人工智能技術被認為是解決當前醫(yī)學影像界面臨難題的“救命稻草”,醫(yī)學影像也因此成為人工智能在醫(yī)療中最有潛力的落地領域。醫(yī)學影像大數(shù)據(jù)與人工智能相結合主要會有以下幾個發(fā)展方向:
2.1 提供醫(yī)學影像圖像分析工具
AI醫(yī)學影像應用中最為亮眼的成果無疑是“醫(yī)學影像閱片機器人”了。大數(shù)據(jù)、計算力以及人工智能算法是AI近年來崛起的基石,醫(yī)學影像閱片機器人的誕生也正基于此。據(jù)檢測,通過輸入上萬多張高質量的人工標注的CT影像,配以適用于AI的高性能計算機(HPC)設備和用于影像識別的3D卷積神經(jīng)網(wǎng)絡算法,閱片機器人就可以從若干張肺部CT光片中找到隱匿著的少量病人的CT片,快速識別圖片中病灶的位置,在準確率上勝過了絕大多數(shù)專業(yè)醫(yī)生,在用時上更是遠遠超過了人類選手。
這種以“閱片機器人”為代表的人工智能醫(yī)學影像輔助診斷系統(tǒng)進入臨床應用后,勢必會將放射科醫(yī)師從繁重的閱片工作量中解脫出來,幫助醫(yī)生快速獲得影像診斷結果,提高診療效率和準確性,并且這種經(jīng)過大數(shù)據(jù)訓練后的影像輔助診斷系統(tǒng)可以變身為一個“類似應用程序的東西”,嵌入在任何的服務器甚至手機上,從而能夠在社區(qū)、鄉(xiāng)鎮(zhèn)等醫(yī)療條件不高的地方給基層醫(yī)生“頂級專家看病的本事”。
2.2 助力精準醫(yī)療
2013年,美國女星安吉麗娜·朱莉通過基因檢測,發(fā)現(xiàn)其攜帶了一個“乳腺癌易感基因”,根據(jù)醫(yī)生建議,朱莉接受了雙側乳腺切除手術,通過手術,朱莉患有乳腺癌的幾率從87%下降到了5%。這是一個典型的利用基因大數(shù)據(jù)實現(xiàn)“精準治療”的案例。隨著計算機存儲量和運行速度的提升,生物醫(yī)學大數(shù)據(jù)的整合利用,疾病的治療將從經(jīng)驗醫(yī)學向精準醫(yī)學轉變,最終可實現(xiàn)疾病的“同病不同因,同因不同治”。而醫(yī)學影像大數(shù)據(jù)在精準醫(yī)療的發(fā)展中發(fā)揮著絕對的主力作用,有超過90%的臨床醫(yī)學數(shù)據(jù)來自于醫(yī)學影像,如果能夠運用人工智能技術分析醫(yī)學影像,深入挖掘影像特征與病狀之間的聯(lián)系,并將影像與醫(yī)學文本記錄進行交叉對比,與基因組數(shù)據(jù)相結合,即可更準確地分析出針對個體的診斷與治療方案,挽救患者的生命。
2.3 促進影像組學方法的發(fā)展
在臨床實踐中,影像醫(yī)生對圖像的解讀還停留于主觀的判斷,通?;诓≡钚螒B(tài)、大小、部位、密度/信號、增強強化模式等作出診斷。這樣的方法存在主觀性強、依賴于臨床經(jīng)驗等缺點,已不能滿足現(xiàn)代醫(yī)療模式轉向精準醫(yī)學實踐的要求,在臨床上亟需研發(fā)影像量化方法。近年來,隨著醫(yī)學影像大數(shù)據(jù)和醫(yī)學圖像分析技術的發(fā)展,從醫(yī)學圖像中挖掘信息,提供臨床醫(yī)生肉眼不能判讀的深層定量信息用于臨床分析與臨床指導,逐漸成為醫(yī)學圖像研究的熱點,影像組學因此而產(chǎn)生。
荷蘭學者Philippe Lambin教授于2012年提出影像組學(Radiomics)的概念,其定義是:利用計算機軟件,將醫(yī)學影像轉化為可挖掘的數(shù)據(jù),從中抽取海量的定量影像特征,用于臨床信息的解析。其基本分析流程包括:圖像獲取及病灶分割,影像組學特征提取,影像組學特征篩選、模型構建和臨床信息解析等。簡單來說,它的工作流程與醫(yī)生日常讀片是非常類似的,針對影像數(shù)據(jù),提取特征,利用人工智能建模,然后再進行臨床應用、輔助決策。但相比醫(yī)生,它的最大優(yōu)勢在于計算機看到了高維信息,能夠看到蛋白基因在宏觀影像上的變化,這樣的寶貴數(shù)據(jù)可以輔助醫(yī)生提升臨床診斷的正確性和準確性。
3 AI醫(yī)學影像發(fā)展面臨的問題
3.1 影像數(shù)據(jù)的規(guī)模與質量需要進一步提高
數(shù)據(jù)是人工智能算法所需的核心資源,僅掌握算法而缺乏數(shù)據(jù)是無法獲得較好訓練效果的。現(xiàn)階段,我國的醫(yī)療影像仍處于從傳統(tǒng)膠片向電子數(shù)據(jù)過渡的階段,大量影像資料尚未數(shù)字化,且醫(yī)院之間的數(shù)據(jù)共享和互通程度較低,是否能夠獲取大規(guī)模的、優(yōu)質的、標準化的、規(guī)范化的可靠大數(shù)據(jù)是對本行業(yè)的一個巨大考驗。
3.2 數(shù)據(jù)標注效率有待提高
在獲取數(shù)據(jù)的基礎上,人工智能在對模型進行訓練之前,訓練集需要進行事先標注。由于大多數(shù)圖像標注還需依賴人工識別,至少需要兩位以上的資深醫(yī)學專家來控制標注質量,如果標注結果不一樣,還會再聘請一位更高資歷的專家來確定標準,數(shù)據(jù)標注工作耗費了較大量的人力和時間,成本非常高。因此在AI醫(yī)療影像領域,如何高效的自動獲取具有高可靠性的標注數(shù)據(jù)也成為今后需重點解決的問題。
3.3 跨學科人才稀缺
在醫(yī)學這個專業(yè)程度很高的領域,AI醫(yī)學影像應用及平臺開發(fā)者不僅要研究人工智能算法,更要對醫(yī)療影像識別建立深入的了解,急需一大批高素質,既懂醫(yī)學,又懂理學、工科的復合型、跨學科人才。歸根到底,一個AI產(chǎn)品是否符合醫(yī)療行業(yè)需求,主要看是不是解決臨床問題,是不是按照醫(yī)生的需求去設計,按照醫(yī)生的規(guī)劃達到一定效果,因此開發(fā)者只懂AI技術是遠遠不夠的,只有“人工智能+醫(yī)療”的復合背景人才才能開發(fā)出醫(yī)生真正覺得好用的產(chǎn)品,人才是決定本行業(yè)未來發(fā)展高度的決定性因素。
4 結語
醫(yī)學影像大數(shù)據(jù)與人工智能的結合已是大勢所趨,深入挖掘醫(yī)學影像大數(shù)據(jù)背后的價值,用人工智能賦能醫(yī)學影像大數(shù)據(jù),用科技的力量改變醫(yī)學影像診斷,釋放人工智能在醫(yī)療領域應用的巨大潛力,解放醫(yī)生,讓患者看病不再困難,這將是時代賦予影像人肩上的重擔!
參考文獻
[1] 張振,周毅,杜守洪,等.醫(yī)療大數(shù)據(jù)及其面臨的機遇與挑戰(zhàn)[J].醫(yī)學信息學雜志,2014,35(6):2—8.
收稿日期:2019-10-22
作者簡介:滕樹凝(1981—),女,山東濟南人,碩士,講師,研究方向:醫(yī)學影像成像原理、醫(yī)學信息學。