姜永軍
由25位頂尖高手組成的人類團隊挑戰(zhàn)AI的影像讀片能力。在診斷腦腫瘤上,AI正確率87%,人類只有66%;在腦卒中診斷上,AI正確率83%,人類只有63%
現代醫(yī)學的進展一定程度上就是影像學的進展。CT和核磁共振的發(fā)明極大促進了現代醫(yī)學的發(fā)展,也造福于老百姓。記得很小的時候,大概1990年代初吧,我們老家的醫(yī)學院附屬醫(yī)院買了一臺CT,這種消息一般傳播性很差,但居然就傳播到我那閉塞的小鄉(xiāng)村,說人往那一躺,就知道得了什么??;當然價格也很驚人,據說光機器就要100萬美元,那個時代的100萬美元啊。在我學了醫(yī),尤其是當了神經科大夫之后,更能體會影像的重要性。影像的重要性也讓影像科醫(yī)生的重要性和稀缺性水漲船高,很少有臨床醫(yī)生不抱怨影像報告的滯后性的。近年來,一個變化讓我看到了希望。
2018年6月份,我去北京參加天壇會議,這是我們腦血管病領域的一個專業(yè)學術會議,規(guī)模是國內最大的,其中有一場報告特別有意思,就是“人機大戰(zhàn)”,由25位頂尖高手組成的人類團隊挑戰(zhàn)人工智能(AI)的影像讀片能力。對戰(zhàn)分為兩輪,分別是腦腫瘤和腦卒中。會場上坐得是滿滿當當,場上25位是高手,場下的更是不乏高人。結果讓無數人,包括我自己,大跌眼鏡。在診斷腦腫瘤上,AI正確率87%,人類只有66%;在腦卒中上,AI正確率83%,人類只有63%。有幾個情況和柯潔輸給阿爾法狗還不同,首先柯潔是單人作戰(zhàn),這次是團隊作戰(zhàn),群策群力都打不過機器;其次,阿爾法狗是谷歌這種超級大公司開發(fā)的產品,而這次使用的AI只是國內一個團隊做出的初創(chuàng)產品,沒有鄙視的意思,但算法之類的應該是阿爾法更強;最后,越到最后,人類錯誤率越高,而機器則正確率越高。人類的傲嬌在AI面前被擊得粉碎,人類還能當醫(yī)生嗎?
首先,AI準確率高啊。腦腫瘤和腦卒中在我們專業(yè)領域都不是什么疑難雜癥,但即便這樣,頂尖專家的準確率也就剛過及格線,而初出茅廬的AI卻能拿個優(yōu)秀。這簡直就是一個連槍都沒拿過的毛頭小孩打敗了一支久經沙場的軍隊。震撼不震撼?
其次,AI更全面。拿中風來說吧,人類目前只能判斷有無中風,粗略估測中風的大小,根據自己的經驗估計一下預后怎么樣;而AI呢,可以準確計算出體積大小,結合最新文獻,判斷出好轉或惡化的概率。AI閱讀文獻的廣度和深度就更不是人類所能比擬的。
再者,AI更便宜。就拿這次會議來說吧,培養(yǎng)這25個頂尖專家要花多少時間和精力?大學學醫(yī)5年,讀研究生讀博士再6年,加上后期的臨床實踐,沒個20年的功夫很難培養(yǎng)出來。這種級別的專家一家大型三甲醫(yī)院可能就幾個人。而AI呢,只要一臺不算很破的電腦,加上軟件幾乎不受限制的復制能力,幾乎可以短時間讓全國的診療水平提升幾個檔次。
最后,AI更快捷。我們臨床醫(yī)生老是抱怨影像科發(fā)報告太慢,而影像科的同仁們也是一肚子苦水。一個病人圖像少說三五百張,多則一千多張,可以算一下時間,1秒鐘看2張片子,1000張就要10分鐘左右,這幾乎就是人類的極限了。所以一天能看50份報告幾乎就是極限了。但AI的掃描速度只和軟件及機器有關,效率是驚人的。
當然,疾病是復雜的,光神經科的疾病就上萬種,影像科醫(yī)生們暫時還不用考慮轉行的問題,目前機器能看的就幾種常見的疾病,但這種趨勢在持續(xù)。后期我閱讀相關的文獻,看到AI判斷疾病的種類在不斷增加,比如乳腺癌的鉬靶讀片等等,并進行了一些小規(guī)模的研究。有趣的是,這些研究都是影像科醫(yī)生在做,也就是說影像科醫(yī)生正親手敲掉自己的飯碗。
AI的出現對影像科醫(yī)生來說可能意味著工作機會的減少,但從更大的層面來講,意味著臨床醫(yī)生可以更快拿到報告,邊遠地區(qū)的患者可以得到更好地診治,國家層面來說可以更好地統計和監(jiān)控國民的健康。所以,未來可期。
(作者為內科學副教授)