據(jù)以色列《耶路撒冷郵報》網(wǎng)站4月9日報道,以色列特拉維夫大學一項新研究顯示,在虛擬急診環(huán)境中,人工智能(AI)在臨床決策方面可能比醫(yī)生做得更好——至少在涉及常見疾病時。
特拉維夫大學埃坦·貝格拉斯經(jīng)濟學院丹·采爾策教授從事的這項研究的成果發(fā)表在美國《內(nèi)科學紀事》月刊上。研究評估了人工智能在“西達賽奈連線”應用程序(一個位于洛杉磯的虛擬急診診所)中的表現(xiàn)。相關研究成果還被提交至美國內(nèi)科醫(yī)師學會的年度會議。
研究人員分析了2024年6月至7月461名成年患者的就診情況,重點關注呼吸道、泌尿、眼、陰道、牙科癥狀等相對常見的疾病。每次就診都始于一個人工智能賦能的接診系統(tǒng),在患者與醫(yī)生進行視頻看診前,該系統(tǒng)會生成診斷和治療建議,包括處方、實驗室檢測和轉(zhuǎn)診。
研究顯示,在77%的病例中,人工智能系統(tǒng)的建議被評為“最優(yōu)”,而主治醫(yī)師做出的決定有67%被評為“最優(yōu)”。在21%的就診病例中,人工智能的建議被評判為優(yōu)于醫(yī)生的建議,而醫(yī)生的表現(xiàn)優(yōu)于人工智能的病例占11%。在其余68%的病例中,二者的建議獲得了相同評分。
評分是基于一個由4名經(jīng)驗豐富、均有超過10年臨床經(jīng)驗的醫(yī)生組成的專家小組進行的評估而得出。他們通過一個四點量表對(人工智能或醫(yī)生的)建議的質(zhì)量進行評估:最優(yōu)、合理、不充分或潛在有害。
該專家小組還發(fā)現(xiàn),人工智能提出的潛在有害建議較少——2.8%,而醫(yī)生為4.6%。
采爾策說:“人工智能始終遵守臨床指南,避免開具不必要的抗生素,并識別出患者病史中的危險信號。例如,它正確地識別出隱形眼鏡佩戴者眼睛疼痛是感染的潛在征兆——這一點在快節(jié)奏的虛擬環(huán)境下很容易被忽略?!?/p>
這種基于數(shù)以百萬份匿名醫(yī)療記錄的算法僅在達到很高信任門檻時提供建議。在大約20%的病例中,由于把握不足,人工智能拒絕提供指導。
雖然人工智能顯示出值得關注的優(yōu)勢,但這項研究也凸顯了醫(yī)生保持明顯優(yōu)勢的領域。真人醫(yī)生能更好地解讀細微之處,回應就診現(xiàn)場的新信息,并實時評估患者病情。
采爾策解釋說:“例如,在患者因新冠肺炎而主訴呼吸急促的病例中,醫(yī)生可能會斷定這是輕度堵塞,不需要急救護理——而人工智能由于僅僅基于結(jié)構(gòu)化輸入進行判斷,可能會作出錯誤歸類?!?/p>
這項研究的一個局限性在于,它沒有追蹤醫(yī)生在作出最終決定前是否審視了人工智能的建議,因此難以評估人工智能對醫(yī)生行為的影響。這項研究只聚焦于比較二者建議本身的質(zhì)量。
采爾策說:“這是首批在現(xiàn)實醫(yī)學實踐中評估人工智能的研究之一——不是基于教科書或測試病例,而是基于實際的患者就診。上述研究結(jié)果令人鼓舞,表明人工智能能夠作為有效的臨床決策支持工具,尤其是在虛擬醫(yī)療環(huán)境中?!?/p>
采爾策還說,雖然人工智能不大可能取代醫(yī)生,但它可以幫助減少誤診,引起人們對關鍵數(shù)據(jù)的關注,并加快臨床工作流程的速度。他說:“醫(yī)療的未來很可能是醫(yī)療專業(yè)人士與人工智能系統(tǒng)之間的合作?!保ň幾g/裘芳)