孫滔
王革(右)于2014 年當(dāng)選美國科學(xué)促進會會員
AI正在對醫(yī)學(xué)成像領(lǐng)域深度滲透,這已是業(yè)內(nèi)共識。
根據(jù)市場調(diào)查公司 Signify Research 報告,包括自動檢測、量化、決策支持和診斷軟件在內(nèi),全球醫(yī)學(xué)影像 AI 市場在 2023 年將達到 20 億美元。如今除了通用電氣公司(GE)、西門子和谷歌等大公司,大量的新創(chuàng)公司正在涌入到這個領(lǐng)域來。
然而,很少有人能看清滲透將如何發(fā)生。
4月16日,一篇題為《醫(yī)學(xué)影像 AI 路線圖》的報告在業(yè)內(nèi)頂級雜志《放射學(xué)雜志》上發(fā)布。這份攸關(guān)醫(yī)學(xué)影像AI應(yīng)用未來發(fā)展方向的路線圖,理清了未來數(shù)年醫(yī)學(xué)影像AI可能重點突破的技術(shù)主題,應(yīng)為業(yè)內(nèi)重點關(guān)注。它是2018年8月一次研討會的成果,當(dāng)時美國國立衛(wèi)生研究院、北美放射學(xué)會 (RSNA)、美國放射學(xué)院 (ACR) 和放射學(xué)與生物醫(yī)學(xué)成像研究學(xué)院在華盛頓特區(qū)聯(lián)合主辦這次會議。
路線圖指出了五個關(guān)鍵主題:1.圖像重建:如何從源數(shù)據(jù)生成適合解釋的圖像;2.圖像自動標(biāo)記和注釋:從臨床影像、電子檔案和結(jié)構(gòu)化圖像中提取信息;3.臨床影像機器學(xué)習(xí)新方法:包括定制的、預(yù)先訓(xùn)練的模型架構(gòu)和分布式機器學(xué)習(xí)方法等;4.機器學(xué)習(xí)人工智能方法的解釋性;5.圖像識別和數(shù)據(jù)共享:以促進臨床影像數(shù)據(jù)應(yīng)用和學(xué)科發(fā)展。
如何解讀這份路線圖?這份路線圖對于下一步的醫(yī)學(xué)影像 AI 應(yīng)用有多大的指導(dǎo)價值?為此專訪了路線圖作者之一、美國紐約倫斯勒理工學(xué)院講席教授王革。
王革:這和圖像性質(zhì)有關(guān)。在醫(yī)院,成像技術(shù)會產(chǎn)生大量的圖像數(shù)據(jù),而圖像數(shù)據(jù)分析正是 AI 相對成熟的技術(shù)。醫(yī)學(xué)成像相當(dāng)于是現(xiàn)代醫(yī)學(xué)中的眼睛,可以把人的五臟六腑看得一清二楚。無論做手術(shù),還是開藥方,或者是放療都離不開圖像。所以人工智能介入進來理所應(yīng)當(dāng),于是就變成了很熱的一個領(lǐng)域。
此外,在醫(yī)療數(shù)據(jù)里邊,斷層掃描圖像應(yīng)該是最精確的數(shù)據(jù)了,因此利于 AI 研發(fā)。其他如電子病歷或者是保險數(shù)據(jù)可能都會有較大誤差,這也讓醫(yī)學(xué)影像領(lǐng)域在 AI 方面走得較快。不過那些不太精確的數(shù)據(jù)并非沒用,如果這些數(shù)據(jù)分析和精確的圖像數(shù)據(jù)結(jié)合起來分析,就會讓醫(yī)生有一個整合性的更精準(zhǔn)的決策。
王革:是的,還是初級階段。比如說圖像重建的問題,現(xiàn)在 AI 用在醫(yī)學(xué)圖像品質(zhì)提升方面進展稍微快一些。比如說,對于一張模糊的醫(yī)學(xué)影像,我們可以增強它的清晰度。原來用經(jīng)典的 CT 影像分析方法可以將清晰度增強30%左右,現(xiàn)在我用深度學(xué)習(xí)分析CT圖像或核磁共振圖像,能增強100%甚至到200%。這個進步是顯著的,但還需深入研究與嚴(yán)格檢驗。
圖像增強對病患者是有實際收益的。比方說X光CT篩查癌癥。因為大部分來體檢的人是沒有癌癥的,在這個過程中人們會擔(dān)憂X射線的安全性。因為X光照射本身可能會引發(fā)基因變異以及增加癌變的可能性。盡管這個可能性很小,但是畢竟讓人們有所顧慮。在這種情況下,我們就考慮用比較少的X光劑量來做癌癥篩查。問題是把劑量減少之后,就會得到背景嘈雜的影像。那么我們可以用機器學(xué)習(xí)來減少低劑量照射的噪音和偽影。也就是說,低劑量照射得到的原始圖像是模糊的,有噪音的,經(jīng)過機器學(xué)習(xí)處理這個圖像就變得清楚了。這也是2018年8月NIH會議說的第一個要點,低劑量造影圖像的重建。圖像重建是機器學(xué)習(xí)的一個新領(lǐng)域。我們正在和GE合作研究基于AI的CT圖像的重建。
另外,如何審批這類應(yīng)用產(chǎn)品還沒有明確規(guī)則。美國 FDA 正在考慮這個方向。AI研究結(jié)果看著很好,但要是用到病人身上,萬一有失誤怎么辦?而且AI產(chǎn)品的監(jiān)管和傳統(tǒng)產(chǎn)品監(jiān)管不一樣,以前的產(chǎn)品的發(fā)布和修改是很明確的,但是AI產(chǎn)品是交互式的和自適應(yīng)的,它會不斷從現(xiàn)實環(huán)境中學(xué)習(xí)迭代,因此給 FDA監(jiān)管帶來新挑戰(zhàn)。所以說,AI在醫(yī)學(xué)影像中距離廣泛應(yīng)用還有工作要做。
在非醫(yī)學(xué)圖像數(shù)據(jù)庫ImageNet大規(guī)模AI識別中,錯誤率已經(jīng)低于人類的錯誤率。這是機器學(xué)習(xí)的結(jié)果,而錯誤率的降低對患者的健康至關(guān)重要。要知道,診斷錯誤造成了不少病患者死亡,而放射科醫(yī)生的讀片常有錯誤。在某些特定的圖像識別中,現(xiàn)在人工智能已經(jīng)超過人類了,將來機器一定程度上甚至是很大程度上會取代醫(yī)生來讀片,我認(rèn)為這正在發(fā)生或遲早會發(fā)生。
全球醫(yī)學(xué)成像軟件的收入預(yù)測
王革:至少目前看我們還不能完全讓機器來做復(fù)雜的處理,現(xiàn)在的AI還有可解釋性、魯棒性(即系統(tǒng)穩(wěn)定性)等在醫(yī)學(xué)影像領(lǐng)域尤其重要的問題需要解決。AI的介入希望能提高醫(yī)生的診治效率。我認(rèn)為,最終這樣的半自動化技術(shù)會在很多場景下變?yōu)槿詣?。也就是說,在一些特定場合取代醫(yī)生是可以實現(xiàn)的。
一些很常規(guī)的分析,比方說骨頭在X照射中看得很清楚。機器分析會明確診斷出有沒有骨折。這種情況下,我覺得醫(yī)生就可以相信機器。那么,醫(yī)生的重要性怎么體現(xiàn)呢?在整個診斷過程中,將來醫(yī)生的角色可能更宏觀一些,進行一些有創(chuàng)造性、有想象力的分析。
王革:這份路線圖是行業(yè)專家告訴美國相關(guān)機構(gòu)下一步要怎么走,側(cè)重的是接下來幾年要關(guān)注的要點以及可實現(xiàn)的改進,而不側(cè)重AI的遠景。
除了剛才說的圖像重建問題,還有一個當(dāng)前重要的問題是黑匣子問題,就是說機器學(xué)習(xí)的可解釋性。醫(yī)生可以和患者溝通病情、病因以及診治的依據(jù),但機器學(xué)習(xí)只會給出一個結(jié)論,這不容易讓患者放心,會讓人感覺把自己完全交給未知了。但這其實也是一個進步,以前患者只能聽到醫(yī)生的判斷,現(xiàn)在患者還能聽到AI的判斷。我們現(xiàn)在正與IBM合作研究神經(jīng)網(wǎng)絡(luò)可解釋性的問題。
另外一個問題是圖像數(shù)據(jù)庫。機器學(xué)習(xí)需要用大數(shù)據(jù),來保證訓(xùn)練分析是合理的。還有外國的數(shù)據(jù)庫拿到能不能用,要不要監(jiān)管部門來審批,公司能不能開放數(shù)據(jù),這都是問題。
再一個問題是硬件。機器學(xué)習(xí)用到大量的數(shù)據(jù),所以對硬件的要求越來越高,盡管這幾年硬件在快速升級,但對于普通機構(gòu)可能就要負(fù)擔(dān)不起。
還有,數(shù)據(jù)庫會涉及病患者隱私,現(xiàn)在機器學(xué)習(xí)可能猜出患者的身份信息。對于隱私問題,我們可以借助于模擬計算來解決。比如用 10 個病人的圖像,根據(jù)特征隨機構(gòu)造出一個新的患者(他不是這 10 個病人中的任何一個)。然后,我們用這個模擬患者來訓(xùn)練分析,這樣就規(guī)避了數(shù)據(jù)隱私的問題。當(dāng)然這個也會有弊端,它畢竟不是實際的病例,這就需要強大的數(shù)字模擬能力。
王革:美國有一些公開的數(shù)據(jù)庫,但更多數(shù)據(jù)庫是不讓別人用的。醫(yī)院出于隱私的考慮很少開放其數(shù)據(jù)庫。他們擔(dān)心病人的訴訟。如果要把病人的身份信息去掉,以及標(biāo)注這些數(shù)據(jù),要花大量的時間精力。
王革:中國國內(nèi)的應(yīng)用研究很好,前景廣闊。但源頭創(chuàng)新比方說神經(jīng)網(wǎng)的基礎(chǔ)理論以及硬件芯片還是落后的,這方面定會進步。
王革:因為視網(wǎng)膜圖像是兩維的,相對比較簡單,不像那種三維的甚至動態(tài)的圖像分析那么復(fù)雜。另外糖尿病視網(wǎng)膜病變數(shù)據(jù)也比較豐富,又不是那么隱私敏感,所以這類應(yīng)用已有很好的結(jié)果,甚至在智能手機上就能使用,很貼近老百姓。
我覺得發(fā)展都是從易到難。將來AI能不能精準(zhǔn)地預(yù)測心臟病,預(yù)測中風(fēng)以及癌癥,就要一步一步來。我們和康奈爾大學(xué)在心臟疾病方面有些合作。
對于放射影像而言,放射科的主流機器都是由大公司來做。我們從兩年前開始與 GE 合作人工智能成像方面的研究。而 IBM 側(cè)重于大數(shù)據(jù)和推理,屬于自然語言理解分析。有人說自然語言理解的進展沒有圖像領(lǐng)域進展大,但是我認(rèn)為這事也不能急,時機成熟自然就會有好的結(jié)果。(摘自美《深科技》)(編輯/華生)