陳耀龍,羅旭飛,史乾靈,呂 萌,周 奇,王健健,楊 楠,高東平,楊 書,商洪才,楊克虎,4,5
1蘭州大學(xué)公共衛(wèi)生學(xué)院,蘭州 730000 2蘭州大學(xué)健康數(shù)據(jù)科學(xué)研究院,蘭州 730000 3蘭州大學(xué)基礎(chǔ)醫(yī)學(xué)院循證醫(yī)學(xué)中心,蘭州 730000 4世界衛(wèi)生組織指南實(shí)施與知識轉(zhuǎn)化合作中心,蘭州 730000 5Cochrane中國協(xié)作網(wǎng)蘭州大學(xué)分中心,蘭州 730000 6蘭州大學(xué)第一臨床醫(yī)學(xué)院,蘭州 730000 7中國醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)信息研究所/圖書館,北京 100020 8成都中醫(yī)藥大學(xué),成都 610075 9北京中醫(yī)藥大學(xué)東直門醫(yī)院中醫(yī)內(nèi)科學(xué) 教育部和北京市重點(diǎn)實(shí)驗(yàn)室,北京 100700
在醫(yī)學(xué)領(lǐng)域,人工智能(artificial intelligence,AI)目前不僅被廣泛應(yīng)用于輔助診斷、治療選擇、風(fēng)險(xiǎn)預(yù)測等[1],還被引入循證醫(yī)學(xué)(evidence-based medicine,EBM)領(lǐng)域,用于系統(tǒng)評價(jià)和臨床實(shí)踐指南(下文簡稱“指南”)的制訂、評價(jià)、傳播與實(shí)施等[2-3]。雖然目前該領(lǐng)域很多方面仍處于理論探索階段[4],但進(jìn)展迅速,未來可期。本文通過分析AI在指南中的應(yīng)用現(xiàn)狀,探討如何通過AI縮短指南的制訂周期,提高其制訂效率,創(chuàng)新其傳播與實(shí)施模式,并對促進(jìn)AI與指南領(lǐng)域的有效結(jié)合提出思考與建議。
美國食品藥品監(jiān)督管理局迄今已批準(zhǔn)29款A(yù)I相關(guān)醫(yī)療產(chǎn)品[5]。盡管AI在醫(yī)學(xué)領(lǐng)域的應(yīng)用取得了一系列較為重要的成果,但其在指南領(lǐng)域的應(yīng)用仍處于起步階段。目前國際上AI與指南結(jié)合的領(lǐng)域主要集中在模型、算法及工具的開發(fā)方面,其相關(guān)方法已在指南的制訂、評價(jià)、傳播與實(shí)施等某些環(huán)節(jié)小范圍內(nèi)試用,常用的算法和技術(shù)包括樸素貝葉斯法和決策樹等。表1列舉了近年來AI在指南領(lǐng)域應(yīng)用的重要事件及進(jìn)展情況。
表1 人工智能在臨床實(shí)踐指南領(lǐng)域應(yīng)用的重要事件
我國相關(guān)研究人員已在該領(lǐng)域開展積極探索。2013年,李博等[6]基于語義關(guān)系,將高血壓指南文本轉(zhuǎn)變?yōu)榕R床實(shí)踐指南知識庫,以提高指南的轉(zhuǎn)化和利用;2019年,羅旭飛等[4]將AI在指南領(lǐng)域的應(yīng)用現(xiàn)狀和發(fā)展進(jìn)行了概況評價(jià),結(jié)果顯示來自美國、澳大利亞、英國和加拿大的研究居多,但大部分研究仍停留于理論探索和算法的驗(yàn)證階段;2020年,蒲曉蓉等[7]提出了一種基于機(jī)器學(xué)習(xí)的計(jì)算機(jī)輔助智能分析方法,自動分析不同版本《新型冠狀病毒肺炎診療方案》的異同。此外,北京大學(xué)第三醫(yī)院開發(fā)的EBM AI-Reviewer(http://www.ebm-easyreviewer.com/login),致力于協(xié)助系統(tǒng)評價(jià)人員快速篩選文獻(xiàn)。
AI應(yīng)用于指南制訂領(lǐng)域,旨在縮短指南的制訂時(shí)間、提高制訂質(zhì)量、優(yōu)化和加速整個制訂流程,現(xiàn)就其中較為重要的5個方面展開闡述。
2.1.1 篩選臨床問題,確定指南領(lǐng)域
關(guān)于研究選題的確定,傳統(tǒng)方法主要依靠研究人員的經(jīng)驗(yàn)。隨著AI的發(fā)展,Chen等[8]采用結(jié)構(gòu)主題模型(structural topic modeling,STM)與文獻(xiàn)計(jì)量分析相結(jié)合的方法,從近十年AI輔助人腦研究的6317篇文獻(xiàn)中自動識別突出的研究主題,通過對主題趨勢、相關(guān)性和集群的分析,以及對其在有影響力的國家/地區(qū)和研究機(jī)構(gòu)中多樣化分布的描述,揭示了有研究前景的主題方向。
關(guān)于臨床問題的遴選,傳統(tǒng)方法一般需耗時(shí)數(shù)月,對臨床一線醫(yī)務(wù)人員進(jìn)行多輪調(diào)查后方可完成,但AI技術(shù)可對數(shù)據(jù)庫或網(wǎng)絡(luò)上已有的相關(guān)臨床問題進(jìn)行快速分析,自動篩選出高頻問題清單,作為指南擬解決問題的重要參考。AI可對已發(fā)表的指南、系統(tǒng)評價(jià)及臨床研究進(jìn)行快速、全面的文獻(xiàn)掃描和分析,發(fā)現(xiàn)指南與研究領(lǐng)域的關(guān)聯(lián)分布,以及指南與臨床問題的涵蓋關(guān)系。
2.1.2 尋找合適專家,管理利益沖突
關(guān)于指南專家的遴選,傳統(tǒng)方法多采用“方便抽樣”,而AI有助于查找到最適合參與指南制訂的成員,特別是在專業(yè)、地域、性別等方面更具代表性。同時(shí),可借助算法分析出每位專家潛在的利益沖突。如AI通過對不同渠道信息和數(shù)據(jù)的關(guān)聯(lián)分析,可發(fā)現(xiàn)某專家多次出席某企業(yè)產(chǎn)品的推廣活動或其直系親屬與醫(yī)藥企業(yè)關(guān)系密切,指南利益沖突管理委員會可以此作為其存在潛在利益沖突的證據(jù)。Graham等[21]使用機(jī)器學(xué)習(xí)法對159種期刊發(fā)表的128 781篇文章的利益沖突進(jìn)行分析,發(fā)現(xiàn)有商業(yè)利益關(guān)系的期刊更有可能發(fā)表存在利益沖突的文章。
2.1.3 進(jìn)行研究合成與評價(jià)
使用自動化軟件可極大縮短系統(tǒng)評價(jià)制作過程中文獻(xiàn)檢索、篩選及質(zhì)量評價(jià)等過程的周期[22-23](表2);國際系統(tǒng)評價(jià)自動化小組(International Collaboration for the Automation of Systematic Reviews,ICASR)提出的系統(tǒng)評價(jià)自動化維也納原則[19](表3),為AI加速系統(tǒng)評價(jià)制作指明了方向。此外,為方便讀者選用合適的自動化工具,Marshall等[24]于2015年建立了系統(tǒng)評價(jià)制作工具箱(systematic review toolbox),用戶可登錄網(wǎng)站進(jìn)行文獻(xiàn)搜索和選取。AI技術(shù)的應(yīng)用使系統(tǒng)評價(jià)的制作周期縮短至幾天甚至幾個小時(shí)。Clark等[22]使用自動化技術(shù),僅用2周時(shí)間完成了一篇評估患者增加液體攝入量對泌尿系統(tǒng)感染(urinary tract infection,UTI)的復(fù)發(fā)、抗菌素的使用及UTI癥狀影響因素的隨機(jī)對照試驗(yàn)的系統(tǒng)評價(jià)。
表2 系統(tǒng)評價(jià)中的自動化工具匯總[22-23]
表3 系統(tǒng)評價(jià)自動化維也納原則[19]
2.1.4 形成當(dāng)前最優(yōu)推薦意見
傳統(tǒng)方法制訂的指南推薦意見,主要依靠專家對干預(yù)措施的安全性、有效性、成本、可實(shí)施性及患者意愿等進(jìn)行綜合分析后得出。然而,在指南制訂過程中是否對這些因素進(jìn)行了全面考慮,以及各因素之間相互作用對指南造成影響的系統(tǒng)考量,是傳統(tǒng)方法的主要局限性。AI可以在更廣闊的視野下對相關(guān)數(shù)據(jù)進(jìn)行挖掘和分析,為制訂者提供更全面的有效信息,協(xié)助制訂者更好地平衡干預(yù)措施的利弊,形成對患者最優(yōu)的推薦意見。
2.1.5 改編和更新指南
傳統(tǒng)依靠人工更新指南的方法,已滿足不了對最新文獻(xiàn)的跟進(jìn)與整合。借助AI可推斷出最佳證據(jù)的出現(xiàn)時(shí)間,協(xié)助完成指南的及時(shí)更新,并確定指南中推薦意見最適合的實(shí)施環(huán)境。特別是隨著動態(tài)指南(living guideline)的出現(xiàn),指南更新的頻率和要求越來越高[25]。如關(guān)于新型冠狀病毒肺炎的文獻(xiàn)已超過20萬篇,占2020年所有文獻(xiàn)的4%。新型冠狀病毒肺炎指南的更新頻率已從每月縮短至每周甚至實(shí)時(shí)[26]。AI可對新文獻(xiàn)進(jìn)行更快速和更高效地監(jiān)測和遴選;另一方面,還可幫助缺乏指南制訂能力的國家改編現(xiàn)有的指南[27]。與指南的制訂過程不同,指南的改編需評估已有的指南推薦意見,以及與本地區(qū)人群和臨床環(huán)境的匹配性,通過AI提供更為全面的當(dāng)?shù)財(cái)?shù)據(jù),可協(xié)助指南改編人員,作出更合適的推薦意見。
當(dāng)前指南傳播與實(shí)施最常用的方法為媒體、期刊或?qū)W術(shù)會議宣傳等,通過多種途徑讓使用者知曉指南,進(jìn)而應(yīng)用于臨床實(shí)踐。研究顯示,這種模式花費(fèi)時(shí)間較長,從指南發(fā)布到被指南使用者知曉和應(yīng)用,需數(shù)月甚至數(shù)年不等[28]。應(yīng)用AI技術(shù),則可將該過程明顯縮短。AI技術(shù)將指南中的推薦意見整合至電子病歷(electronic medical record,EMR)系統(tǒng)中,通過OpenMRS及DHIS2等開源EMR平臺,進(jìn)一步加速了指南信息的傳播,惠及更多醫(yī)療資源匱乏的機(jī)構(gòu)或地區(qū)[29-30]。此外,研究顯示,美國約25%的醫(yī)療費(fèi)用被浪費(fèi)掉,每年約合7600億~9350億美元[31];若采用AI技術(shù),則可以促進(jìn)指南或醫(yī)療信息在患者中的傳播,通過去偽存真,為患者提供有價(jià)值的信息,從而節(jié)約醫(yī)療資源。
目前針對單個臨床研究的風(fēng)險(xiǎn)偏倚AI評估工具已經(jīng)產(chǎn)生[32]。而指南的評價(jià)工具,有針對方法學(xué)質(zhì)量的指南研究與評價(jià)工具(Appraisal of Guidelines for Research and Evaluation Ⅱ,AGREE Ⅱ),包含6個領(lǐng)域的23個條目[33];以及針對報(bào)告質(zhì)量的國際實(shí)踐指南報(bào)告標(biāo)準(zhǔn)(Reporting Items for Practice Guidelines in Healthcare,RIGHT),包含7個領(lǐng)域的22個條目[31]。然而,研究顯示使用這些工具時(shí)存在一定挑戰(zhàn),即不同的使用者對標(biāo)準(zhǔn)的把握不一致,人力和時(shí)間成本亦不可控[34-35]。如使用AGREE Ⅱ評價(jià)一部指南,常規(guī)情況下需要3~4名經(jīng)過培訓(xùn)的研究人員,每人至少耗時(shí)1 h;如評價(jià)糖尿病領(lǐng)域百余部指南的質(zhì)量,則需500 h以上。但通過開發(fā)、訓(xùn)練相應(yīng)的AI算法,不僅可以降低評價(jià)的主觀偏倚,還可較大程度上縮短評價(jià)所需的時(shí)間。此外,對指南的評價(jià)還包括對推薦意見的對比分析,而快速提取其中的推薦意見是關(guān)鍵步驟。Hussain等[36]開發(fā)的AI算法,用于提取高血壓指南中的推薦意見,其準(zhǔn)確度可達(dá)85.54%。
就目前科技進(jìn)步的速度和學(xué)科交叉的深度而言,AI技術(shù)與指南的結(jié)合已是箭在弦上。指南的制訂已從1.0時(shí)代邁向2.0時(shí)代[37],而AI很有可能引領(lǐng)指南發(fā)展的3.0時(shí)代。為提前做好應(yīng)對并促進(jìn)其科學(xué)發(fā)展,筆者提出以下思考與建議。
AI在指南領(lǐng)域的發(fā)展和應(yīng)用,除技術(shù)支持外,還有賴于政策支撐。2021年,國家自然科學(xué)基金委新增設(shè)了交叉科學(xué)部,為AI與指南結(jié)合相關(guān)研究工作的開展提供了獲取更多支持的可能性。近年來,“國家重點(diǎn)研發(fā)計(jì)劃”“科技創(chuàng)新2030-重大項(xiàng)目”等也加大了對AI、大數(shù)據(jù)在醫(yī)學(xué)領(lǐng)域應(yīng)用的支持力度。此外,多所高校先后設(shè)立了人工智能學(xué)院,開設(shè)AI與醫(yī)學(xué)交叉相關(guān)課程,招收本科生和研究生,并在基礎(chǔ)理論和關(guān)鍵技術(shù)等方面開展相關(guān)研究和培訓(xùn),是未來在該領(lǐng)域把握機(jī)遇和掌握話語權(quán)的重要途徑。
在指南制訂者和實(shí)施者層面主要提出以下建議:(1)制訂指南或開展指南研究時(shí),應(yīng)納入AI相關(guān)學(xué)科人員。(2)使用已被證實(shí)可靠的AI算法、模型和工具時(shí),應(yīng)提供相應(yīng)的指導(dǎo)手冊或操作規(guī)范。(3)撰寫基于AI的指南手冊或?qū)V?。英國國家健康與臨床優(yōu)化研究所(National Institute for health and Clinical Excellence,NICE)在其指南制訂手冊中納入應(yīng)用機(jī)器學(xué)習(xí)搜索和篩選文獻(xiàn)的內(nèi)容[38],其他指南制訂手冊則無相關(guān)內(nèi)容的描述。(4)借助AI加速指南的傳播與實(shí)施,促進(jìn)醫(yī)患溝通,改善患者關(guān)系。正如斯坦福大學(xué)AI實(shí)驗(yàn)室主任Christopher Manning教授所言:“AI可以把指南帶入每一次的患者咨詢中,讓每一次咨詢都安全、穩(wěn)妥地支持醫(yī)患雙方溝通。”[39]
在研究者層面主要提出以下建議:(1)研發(fā)基于AI的系統(tǒng)評價(jià)工具。指南制訂的限速環(huán)節(jié)主要是系統(tǒng)評價(jià)的制作,盡管當(dāng)前已有AI協(xié)助系統(tǒng)評價(jià)制作的案例,但仍需進(jìn)一步深入研究,推動AI大范圍應(yīng)用于系統(tǒng)評價(jià)的制作是當(dāng)前指南制訂最重要和最需優(yōu)先開展的研究。(2)研發(fā)AI相關(guān)的報(bào)告規(guī)范。指南制訂過程中應(yīng)用AI的關(guān)鍵步驟和信息應(yīng)予以充分、透明地報(bào)告,故應(yīng)研發(fā)AI應(yīng)用于指南的報(bào)告規(guī)范“RIGHT for AI”,現(xiàn)已成為RIGHT工作組擴(kuò)展版內(nèi)容之一。目前,AI聲明“CONSORT(Consolidated Standards of Reporting Trail) for AI ”已完成研發(fā),其成果已在學(xué)術(shù)期刊上發(fā)表[40]。隨著AI相關(guān)系統(tǒng)評價(jià)的不斷增多,系統(tǒng)評價(jià)和Meta分析優(yōu)先報(bào)告條目“PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) for AI”的出現(xiàn)將是必然。在AI相關(guān)的臨床研究、系統(tǒng)評價(jià)和指南等領(lǐng)域形成完整的報(bào)告規(guī)范體系,對于促進(jìn)AI發(fā)展、彰顯其應(yīng)用價(jià)值具有重要意義。(3)開展AI識別與管理指南參與人員的利益沖突、患者偏好及形成推薦意見等相關(guān)研究是未來需要探索的重要方向。如利用AI收集患者偏好與價(jià)值觀等信息時(shí),如何考慮公平性(當(dāng)前關(guān)于患者偏好與價(jià)值觀的研究基本上是基于西方患者人群);管理指南參與人員的利益沖突時(shí),如何保護(hù)其個人隱私等,都是研究者需要關(guān)注和解決的問題。AI為指南提供的信息越全面,制訂者做出最優(yōu)推薦意見的可能性越大。
目前,AI在指南領(lǐng)域的應(yīng)用仍處于起步階段,未來前景廣闊,其可在指南的制訂、實(shí)施到自動更新全過程中發(fā)揮作用,但也面臨諸多問題與挑戰(zhàn),這些問題和挑戰(zhàn)將隨著人們對AI的認(rèn)識和掌握不斷加深而轉(zhuǎn)化為機(jī)遇。我們可以期待,未來指南的制訂也許只需基于患者個體數(shù)據(jù)便可產(chǎn)出極具針對性的“基于證據(jù)的個體化指南”,屆時(shí)精準(zhǔn)醫(yī)學(xué)的受益對象將不再是少數(shù)人的罕見病,而是所有人的大健康。
作者貢獻(xiàn):陳耀龍、羅旭飛負(fù)責(zé)統(tǒng)計(jì)數(shù)據(jù)并撰寫文章初稿;史乾靈、呂萌、周奇、王健健、楊楠、高東平、楊書、商洪才、楊克虎負(fù)責(zé)修改初稿;陳耀龍負(fù)責(zé)文章審校。
利益沖突:無