亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        網(wǎng)上問(wèn)醫(yī)斷病,這輪AI行不行

        2023-08-31 13:47:07
        家庭醫(yī)學(xué) 2023年16期
        關(guān)鍵詞:醫(yī)師專(zhuān)家醫(yī)學(xué)

        你在網(wǎng)上搜過(guò)“我哪哪疼是不是得了啥啥病”嗎?答案可能不盡如人意。但隨著ChatGPT等大型自然語(yǔ)言模型(LLM)風(fēng)生水起,人們開(kāi)始嘗試用它來(lái)回答醫(yī)學(xué)問(wèn)題或醫(yī)學(xué)知識(shí)。

        不過(guò),靠譜嗎?

        就其本身而言,人工智能(AI)給出的答案是準(zhǔn)確的。但英國(guó)巴斯大學(xué)教授詹姆斯·達(dá)文波特指出了醫(yī)學(xué)問(wèn)題和實(shí)際行醫(yī)之間的區(qū)別,他認(rèn)為“行醫(yī)并不只是回答醫(yī)學(xué)問(wèn)題,如果純粹是回答醫(yī)學(xué)問(wèn)題,我們就不需要教學(xué)醫(yī)院,醫(yī)生也不需要在學(xué)術(shù)課程之后接受多年的培訓(xùn)了?!?/p>

        鑒于種種疑惑,在《自然》雜志新近發(fā)表的一篇論文中,全球頂尖的人工智能專(zhuān)家們展示了一個(gè)基準(zhǔn),用于評(píng)估大型自然語(yǔ)言模型能多好地解決人們的醫(yī)學(xué)問(wèn)題。

        現(xiàn)有的模型尚不完善

        最新的這項(xiàng)評(píng)估,來(lái)自谷歌研究院和深度思維公司。專(zhuān)家們認(rèn)為,人工智能模型在醫(yī)學(xué)領(lǐng)域有許多潛力,包括知識(shí)檢索和支持臨床決策。但現(xiàn)有的模型尚不完善,例如可能會(huì)編造令人信服的醫(yī)療錯(cuò)誤信息,或納入偏見(jiàn)加劇健康不平等。因此才需要對(duì)其臨床知識(shí)進(jìn)行評(píng)估。

        相關(guān)的評(píng)估此前并非沒(méi)有。然而,過(guò)去通常依賴(lài)有限基準(zhǔn)的自動(dòng)化評(píng)估,例如個(gè)別醫(yī)療測(cè)試得分。這轉(zhuǎn)化到真實(shí)世界中,可靠性和價(jià)值都有欠缺。

        而且,當(dāng)人們轉(zhuǎn)向互聯(lián)網(wǎng)獲取醫(yī)療信息時(shí),他們會(huì)遭遇“信息超載”,然后從10種可能的診斷中選擇出最壞的一種,從而承受很多不必要的壓力。

        研究團(tuán)隊(duì)希望語(yǔ)言模型能提供簡(jiǎn)短的專(zhuān)家意見(jiàn),不帶偏見(jiàn)、表明其引用來(lái)源,并合理表達(dá)出不確定性。

        5400億參數(shù)的LLM表現(xiàn)如何

        為評(píng)估LLM編碼臨床知識(shí)的能力,谷歌研究院的專(zhuān)家謝庫(kù)菲·阿齊茲及其同事探討了它們回答醫(yī)學(xué)問(wèn)題的能力。團(tuán)隊(duì)提出了一個(gè)基準(zhǔn),稱(chēng)為“MultiMedQA”:它結(jié)合了6個(gè)涵蓋專(zhuān)業(yè)醫(yī)療、研究和消費(fèi)者查詢(xún)的現(xiàn)有問(wèn)題回答數(shù)據(jù)集以及“HealthSearchQA”——這是一個(gè)新的數(shù)據(jù)集,包含3173個(gè)在線(xiàn)搜索的醫(yī)學(xué)問(wèn)題。

        團(tuán)隊(duì)隨后評(píng)估了PaLM(一個(gè)5400億參數(shù)的LLM)及其變體Flan-PaLM。他們發(fā)現(xiàn),在一些數(shù)據(jù)集中Flan-PaLM達(dá)到了最先進(jìn)水平。在整合美國(guó)醫(yī)師執(zhí)照考試類(lèi)問(wèn)題的MedQA數(shù)據(jù)集中,F(xiàn)lan-PaLM超過(guò)此前最先進(jìn)的LLM達(dá)17%。

        不過(guò),雖然Flan-PaLM的多選題成績(jī)優(yōu)良,進(jìn)一步評(píng)估顯示,它在回答消費(fèi)者的醫(yī)療問(wèn)題方面存在差距。

        專(zhuān)精醫(yī)學(xué)的LLM令人鼓舞

        為解決這一問(wèn)題,人工智能專(zhuān)家們使用一種稱(chēng)為設(shè)計(jì)指令微調(diào)的方式,進(jìn)一步調(diào)試Flan-PaLM適應(yīng)醫(yī)學(xué)領(lǐng)域。同時(shí),研究人員介紹了一個(gè)專(zhuān)精醫(yī)學(xué)領(lǐng)域的LLM-Med-PaLM。

        設(shè)計(jì)指令微調(diào)是讓通用LLM適用新的專(zhuān)業(yè)領(lǐng)域的一種有效方法。產(chǎn)生的模型Med-PaLM在試行評(píng)估中表現(xiàn)令人鼓舞。例如,F(xiàn)lan-PaLM被一組醫(yī)師評(píng)分與科學(xué)共識(shí)一致程度僅61.9o%的長(zhǎng)回答,Med-PaLM的回答評(píng)分為92.6%,相當(dāng)于醫(yī)師作出的回答(92.9%)。同樣,F(xiàn)lan-PaLM有29.7%的回答被評(píng)為可能導(dǎo)致有害結(jié)果,Med-PaLM僅5.8%,相當(dāng)于醫(yī)師所作的回答(6.5%)。

        研究團(tuán)隊(duì)提到,結(jié)果雖然很有前景,但有必要作進(jìn)一步評(píng)估,特別是在涉及安全性、公平性和偏見(jiàn)方面。

        換句話(huà)說(shuō),在LLM的臨床應(yīng)用可行之前,還有許多限制要克服。

        猜你喜歡
        醫(yī)師專(zhuān)家醫(yī)學(xué)
        中國(guó)醫(yī)師節(jié)
        韓醫(yī)師的中醫(yī)緣
        金橋(2022年8期)2022-08-24 01:33:58
        致謝審稿專(zhuān)家
        醫(yī)學(xué)的進(jìn)步
        預(yù)防新型冠狀病毒, 你必須知道的事
        祝您健康(2020年4期)2020-05-20 15:04:20
        請(qǐng)叫我專(zhuān)家
        醫(yī)學(xué)
        醫(yī)師為什么不滿(mǎn)意?
        專(zhuān)家面對(duì)面
        醫(yī)學(xué)、生命科學(xué)類(lèi)
        亚洲精品午夜无码专区| 久久国产精品亚洲我射av大全| 中文字幕亚洲视频一区| 国产av午夜精品一区二区入口| 亚洲中文字幕在线综合| 国模无码一区二区三区不卡| 国产精品露脸视频观看| 无码流畅无码福利午夜| 日本一区二三区在线中文| 亚洲精品综合中文字幕组合| 日日麻批免费40分钟无码| 熟女少妇内射日韩亚洲| 久久国产成人午夜av影院| 传媒在线无码| 色婷婷亚洲一区二区在线| 国产精品久久免费中文字幕| 无码人妻一区二区三区在线| 色翁荡息又大又硬又粗又视频图片| 人妻中出精品久久久一区二| 日本免费精品一区二区三区视频| 国产成人无码a在线观看不卡| 少妇人妻大乳在线视频不卡| 午夜片无码区在线| 日本久久精品在线播放| 亚洲午夜精品一区二区麻豆av | 日韩亚洲欧美久久久www综合| 一本大道久久东京热无码av| 中文字幕无码高清一区二区三区| 狼狼色丁香久久女婷婷综合| 日本一区二区在线播放| 成人无码视频| 高清国产美女一级a毛片在线 | 日韩视频第二页| 国产精品不卡在线视频| 大陆老熟女自拍自偷露脸| 国产丝袜在线精品丝袜| 亚洲最大无码AV网站观看| 日韩一区三区av在线| 高清精品一区二区三区| 亚洲AV色无码乱码在线观看| 一区二区亚洲 av免费|