孫岳川,高鍵東,2,吳及,2
人工智能的概念最早于1956年在達(dá)特茅斯會議上提出,它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能方法具有對多樣化問題的適應(yīng)性,對復(fù)雜關(guān)系的建模能力,以及遠(yuǎn)高于人類的計(jì)算處理能力。目前人工智能分為多個(gè)分支研究領(lǐng)域,包括計(jì)算機(jī)視覺、自然語言處理及數(shù)據(jù)挖掘等,在社會各行業(yè)均有廣泛應(yīng)用。在醫(yī)學(xué)行業(yè),人工智能領(lǐng)域獲得了大量研究成果,且部分研究成果已成功進(jìn)入應(yīng)用階段,但在不同醫(yī)學(xué)細(xì)分領(lǐng)域中,人工智能方法適于解決不同問題,需要不同的應(yīng)用條件,應(yīng)用中需要注意的問題和不足各異。本文將對人工智能在臨床醫(yī)學(xué)中的應(yīng)用現(xiàn)狀進(jìn)行總結(jié),并對發(fā)展前景進(jìn)行展望。
人工智能是研究、開發(fā)用于模擬、延伸和擴(kuò)展人智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。機(jī)器學(xué)習(xí)是一種常用的實(shí)現(xiàn)人工智能的方法。研究者們在解決現(xiàn)實(shí)問題時(shí)經(jīng)常需要對問題進(jìn)行數(shù)學(xué)建模,即對現(xiàn)實(shí)問題中的原因和結(jié)果進(jìn)行抽象和簡化,用數(shù)學(xué)的形式語言進(jìn)行描述,此過程中常常需要把握原因到結(jié)果的主要聯(lián)系,忽略次要聯(lián)系。機(jī)器學(xué)習(xí)本質(zhì)上是借助優(yōu)化算法對數(shù)學(xué)模型參數(shù)的搜索過程,其目的是找到一組模型參數(shù)使得該模型能夠描述從原因到結(jié)果的主要聯(lián)系,對實(shí)際問題有較好的近似或模擬。機(jī)器學(xué)習(xí)方法可大致分為傳統(tǒng)機(jī)器學(xué)習(xí)和以神經(jīng)網(wǎng)絡(luò)模型為主的深度學(xué)習(xí)兩類。傳統(tǒng)機(jī)器學(xué)習(xí)方法模型簡單、計(jì)算量小,對于復(fù)雜而大量的數(shù)據(jù),其通常借助以矩陣分解為主的數(shù)學(xué)原理,在盡量保留數(shù)據(jù)樣本之間關(guān)系的基礎(chǔ)上壓縮數(shù)據(jù)量,從而用較簡單的模型實(shí)現(xiàn)問題的近似,但對于模型輸入和輸出之間復(fù)雜的非線性關(guān)系的近似程度不夠理想。深度學(xué)習(xí)模型較復(fù)雜、計(jì)算量大,其通常借助梯度下降等方法直接構(gòu)建從輸入至輸出的函數(shù)關(guān)系,對于復(fù)雜關(guān)系的擬合能力較好,但有時(shí)容易過度擬合數(shù)據(jù)中與問題無關(guān)的其他特性,過度關(guān)注從原因到結(jié)果的次要聯(lián)系,甚至偶然的無關(guān)聯(lián)系,從而削減了對問題本質(zhì)關(guān)系的擬合[1]。
用于臨床的人工智能系統(tǒng)并非近些年才出現(xiàn)。從早期的專家系統(tǒng),如斯坦福大學(xué)開發(fā)的為感染患者制訂抗生素處方的MYCIN[2]系統(tǒng);至臨床決策支持系統(tǒng),如哈佛大學(xué)研發(fā)的DXplain[3]和匹茲堡大學(xué)研發(fā)的QMR[4];再直至今日的以IBM Watson Health為代表的基于機(jī)器學(xué)習(xí)的復(fù)雜診療系統(tǒng)。
臨床人工智能伴隨著人工智能技術(shù)的發(fā)展慢慢走向成熟。今日的醫(yī)學(xué)人工智能系統(tǒng)覆蓋篩查、診斷、治療、預(yù)后及管理等多個(gè)臨床環(huán)節(jié),可利用實(shí)驗(yàn)室檢查結(jié)果、影像、文本、音頻多種異質(zhì)數(shù)據(jù),完成系統(tǒng)性的復(fù)雜任務(wù)。
人工智能方法同時(shí)具有對復(fù)雜數(shù)據(jù)來源和復(fù)雜優(yōu)化目標(biāo)的強(qiáng)大處理能力,可以處理如圖像、文本一類的復(fù)雜數(shù)據(jù),也可融合處理多種形式的醫(yī)學(xué)數(shù)據(jù);可以完成多樣化的任務(wù)目標(biāo),處理分類、回歸、圖像分割、知識圖譜構(gòu)建等機(jī)器學(xué)習(xí)任務(wù),在此基礎(chǔ)上完成數(shù)據(jù)整理及輔助診療工作。
臨床影像數(shù)據(jù)包括CT、MRI、超聲、X線等,是目前人工智能方法應(yīng)用最為廣泛的一類數(shù)據(jù),經(jīng)常用于快速獲得病情診斷或病灶標(biāo)定等結(jié)果。如利用神經(jīng)網(wǎng)絡(luò)分析眼底影像數(shù)據(jù),并進(jìn)行糖尿病眼底病變的診斷[5];基于皮膚影像設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò),可獲得與皮膚??漆t(yī)師水平相當(dāng)?shù)钠つw癌變診斷結(jié)果[6];根據(jù)超聲數(shù)據(jù)診斷乳腺病變,以及利用CT數(shù)據(jù)判斷肺小結(jié)節(jié)良惡性病變[7];根據(jù)心臟圖像進(jìn)行心血管病的診斷或預(yù)測[8-9],以及結(jié)直腸息肉的標(biāo)定[10]與腦腫瘤的圖像分割[11]等。
醫(yī)學(xué)文本數(shù)據(jù)包括電子病歷、影像學(xué)或其他檢查報(bào)告等,通常采用自然語言處理技術(shù)進(jìn)行處理和應(yīng)用,其可形成病情診斷,也可以進(jìn)行更高層次知識圖譜的構(gòu)建,并可輔助構(gòu)建病歷數(shù)據(jù)庫等,可完成多樣化任務(wù)。如根據(jù)患者病歷分析得出可能存在的不良反應(yīng)和術(shù)后并發(fā)癥[12-13];從非結(jié)構(gòu)化病歷中提取結(jié)構(gòu)化數(shù)據(jù)并進(jìn)行癌癥診斷[14],用于構(gòu)建醫(yī)療知識框架并達(dá)到職業(yè)醫(yī)師的知識儲備水平[15];利用患者死亡證明上的文本信息,根據(jù)國際疾病分類標(biāo)準(zhǔn)進(jìn)行癌癥分類[16]等。
在以上研究的基礎(chǔ)上,目前已有研究成果進(jìn)入轉(zhuǎn)化應(yīng)用?;谌斯ぶ悄芊椒ǖ奶攸c(diǎn),其被更多地用于減輕臨床醫(yī)護(hù)人員的工作負(fù)擔(dān)或輔助經(jīng)驗(yàn)不足的醫(yī)師進(jìn)行疾病診斷。在各類疾病篩查階段,人工智能方法可以輔助選擇對病情診斷較為重要的放射影像技術(shù)[17];可以進(jìn)行光學(xué)相干斷層成像檢查,評估患者患眼部病變風(fēng)險(xiǎn),并決定該患者是否應(yīng)該接受專業(yè)醫(yī)師檢查[18];也可以內(nèi)嵌于手機(jī)應(yīng)用程序中,可輔助篩查應(yīng)該接受進(jìn)一步檢查的患者[19]。對于各類重復(fù)性的簡單工作,人工智能方法可輔助臨床節(jié)省人力,并提升工作效率,如采用放射影像技術(shù)進(jìn)行骨齡檢測[17],采用斷層成像進(jìn)行眼部疾病的檢查[20],以及標(biāo)定心血管影像中的狹窄血管段[21]等。
此外,人工智能方法也被用于開拓醫(yī)療診斷和醫(yī)學(xué)研究領(lǐng)域。人工智能方法可以輔助醫(yī)師進(jìn)行病情診斷,使得診斷結(jié)果更加準(zhǔn)確,超越以往專家或醫(yī)療設(shè)備單獨(dú)工作能夠達(dá)到的診斷水平[22-23],還可以自主進(jìn)行治療方案的探索[24]。傳統(tǒng)方法對乳腺癌的分級僅依據(jù)乳腺癌上皮細(xì)胞的小部分形態(tài)特征,而人工智能方法探索了將間質(zhì)細(xì)胞的形態(tài)特征和顯微圖像特征等增加至乳腺癌預(yù)測任務(wù)中的可能性[25],以及根據(jù)檢查結(jié)果預(yù)測心血管疾病危險(xiǎn)因素[26],如根據(jù)正常心率情況下獲得的心電圖數(shù)據(jù)檢測心房顫動(dòng)[27],根據(jù)CT檢查結(jié)果獲得早期的癡呆癥診斷[28]等多種創(chuàng)新性工作。
盡管人工智能方法是一類功能強(qiáng)大的工具,但對于人工智能方法的研究和實(shí)施具有特殊要求。與人類的認(rèn)知特點(diǎn)不同,計(jì)算機(jī)程序?qū)τ跀?shù)據(jù)標(biāo)準(zhǔn)化的要求非常嚴(yán)格,對于包括文件格式,數(shù)據(jù)種類和順序,數(shù)據(jù)單位等因素在內(nèi)的數(shù)據(jù)格式,均需要明確的標(biāo)準(zhǔn),否則可能造成輸出亂碼等不合常理的結(jié)果,甚至不能順利運(yùn)行程序。目前各醫(yī)療中心中臨床影像數(shù)據(jù)、病歷數(shù)據(jù)等格式各異,如果能夠建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),就可省略對不同數(shù)據(jù)建立不同程序流程的工作,并可促進(jìn)一些成熟人工智能方法迅速部署至具有統(tǒng)一數(shù)據(jù)格式的醫(yī)療中心;也實(shí)現(xiàn)了科研數(shù)據(jù)通用化,使得科研人員能夠方便獲得多個(gè)醫(yī)療中心的數(shù)據(jù),對其進(jìn)行算法驗(yàn)證和調(diào)優(yōu)。目前已有的數(shù)據(jù)標(biāo)準(zhǔn)化工作以“醫(yī)學(xué)數(shù)字成像和通信(DICOM)”標(biāo)準(zhǔn)為先,其整合了CT、X線、超聲及MRI等醫(yī)療影像技術(shù),為一線醫(yī)師和科研人員提供了統(tǒng)一的數(shù)據(jù)接口,使后續(xù)工作省略了數(shù)據(jù)整理等流程,同時(shí)有效地節(jié)省了人力。
數(shù)據(jù)格式標(biāo)準(zhǔn)的制定需要綜合考慮現(xiàn)有條件,如程序接口、數(shù)據(jù)完整性及未來流程改進(jìn)工作等多種因素,由各醫(yī)療中心協(xié)商制定。進(jìn)一步建立統(tǒng)一的醫(yī)療數(shù)據(jù)庫還需要考慮患者隱私及數(shù)據(jù)安全等因素。目前已有的醫(yī)學(xué)數(shù)據(jù)庫包括心臟地圖集項(xiàng)目[29]和內(nèi)臟解剖基準(zhǔn)項(xiàng)目[30],隨著人工智能方法在醫(yī)學(xué)領(lǐng)域的普及,此類數(shù)據(jù)庫的建立和完善將有長足發(fā)展。
目前人工智能的實(shí)施主要依靠機(jī)器學(xué)習(xí)方法,而大部分機(jī)器學(xué)習(xí)方法需要依賴人工總結(jié)的邏輯規(guī)律作為起點(diǎn),進(jìn)行高層次關(guān)系的學(xué)習(xí)或訓(xùn)練。在具體任務(wù)中,如病情的診斷和預(yù)測,則需要大量已知病情和其他信息的患者檔案作為起始知識,進(jìn)行從患者數(shù)據(jù)至病情診斷的關(guān)系構(gòu)建,從而能夠根據(jù)患者前瞻性數(shù)據(jù)獲得病情的診斷或預(yù)測結(jié)果。對于一些較為復(fù)雜的任務(wù),如器官區(qū)域的圖像分割,則需要大量已知分割結(jié)果的醫(yī)學(xué)影像數(shù)據(jù),而分割結(jié)果往往由醫(yī)師進(jìn)行精細(xì)標(biāo)注,一方面大量精細(xì)標(biāo)注對醫(yī)師的時(shí)間和精力具有一定要求,另一方面標(biāo)注結(jié)果會受到醫(yī)師主觀因素的影響,使人工智能方法的參數(shù)擬合過程受到影響,進(jìn)而使模型建立不準(zhǔn)確的數(shù)據(jù)與標(biāo)注的映射關(guān)系,并對模型性能造成不利影響。機(jī)器學(xué)習(xí)領(lǐng)域?qū)o標(biāo)注的學(xué)習(xí)方法也進(jìn)行了研究,可以提取無標(biāo)注數(shù)據(jù)內(nèi)在的關(guān)系進(jìn)行疾病表型分類等研究,但由于缺少客觀一致的評價(jià)研究效果的標(biāo)準(zhǔn),此種方法不易準(zhǔn)確評價(jià)其性能,同時(shí)欠缺可解釋性。
作為一種技術(shù)工具,人工智能技術(shù)并不能完全替代醫(yī)學(xué)專家。醫(yī)學(xué)知識在不斷演進(jìn),醫(yī)學(xué)也是一門復(fù)雜性學(xué)科,目前人工智能系統(tǒng)的構(gòu)建仍然需要醫(yī)學(xué)專家的深入?yún)⑴c。如從數(shù)據(jù)的角度分析,盡管特征篩選[31]等方法可以研究患者各類數(shù)據(jù)的重要性區(qū)別,但這類方法存在局限性,無法從更本質(zhì)的病理學(xué)角度進(jìn)行解釋,因此人工智能方法常需要醫(yī)師給定一種可能的數(shù)據(jù)集合,再從中選擇較為重要的數(shù)據(jù)用來完成任務(wù)。從任務(wù)目標(biāo)的角度分析,依賴于醫(yī)學(xué)專家明確研究方向,將具體工作由機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)。合理的問題定義和目標(biāo)需要考慮目標(biāo)實(shí)現(xiàn)的難度、臨床意義及預(yù)期性能等多方面因素,從而使人工智能方法的研發(fā)流程更加順利,并有利于合理進(jìn)行實(shí)際部署。
臨床人工智能依然處于早期研發(fā)階段。為了使得人工智能方法更好地輔助臨床,研究人員需要就人工智能方法的局限性進(jìn)行使用范圍的界定,并警惕其產(chǎn)生不合常理的診斷或操作結(jié)果。
目前大部分人工智能方法均依靠具體的機(jī)器學(xué)習(xí)算法實(shí)現(xiàn),而大部分機(jī)器學(xué)習(xí)算法均以數(shù)理統(tǒng)計(jì)和概率相關(guān)理論作為支撐,并假設(shè)各病患數(shù)據(jù)樣本是“獨(dú)立同分布”的。盡管滿足“獨(dú)立同分布”假設(shè)的數(shù)據(jù)在實(shí)際工作中較少見,利用“非獨(dú)立同分布”樣本訓(xùn)練得到的機(jī)器學(xué)習(xí)模型,其在與訓(xùn)練數(shù)據(jù)相獨(dú)立的測試數(shù)據(jù)集上的性能仍然可以接受,但該模型能否在多變的實(shí)際應(yīng)用條件下保持其性能仍然未知,其原因是機(jī)器學(xué)習(xí)模型嚴(yán)重依賴現(xiàn)有數(shù)據(jù)的分布情況,而數(shù)據(jù)集的體量總是有限的,無法窮盡所有可能的實(shí)際情況。
為尋找數(shù)據(jù)特點(diǎn)與標(biāo)注之間的映射關(guān)系,機(jī)器學(xué)習(xí)模型可能會將一些無關(guān)的數(shù)據(jù)特性與標(biāo)注聯(lián)系起來。如將皮膚上的外科水筆標(biāo)記作為黑色素瘤的診斷標(biāo)準(zhǔn)[32],或由于不同醫(yī)學(xué)中心的診斷標(biāo)準(zhǔn)不同造成肺炎的診斷結(jié)果不一致[33]。數(shù)據(jù)上的漂移或偏見還可能造成社會問題或削弱病情診斷結(jié)果的穩(wěn)定性,如對不同人群死亡率的預(yù)測差異[34],根據(jù)不同人群的胸部X線檢查結(jié)果預(yù)測胸部疾病的效果差異[35],又如給皮膚圖像添加人眼不可識別的微小噪聲就會造成分類結(jié)果的差異[36]。研究者們往往嘗試?yán)霉た祁I(lǐng)域的方法解決上述數(shù)據(jù)漂移等問題。電子病歷是機(jī)器學(xué)習(xí)算法的一大數(shù)據(jù)來源,而病患的臨床表現(xiàn)、診斷方法、治療方法等因素的變化使得電子病歷數(shù)據(jù)在較長時(shí)間尺度上的分布不同[37]。為維持算法穩(wěn)定性和較好的性能,可以采用非參數(shù)方法[38]及時(shí)更新模型,使其適應(yīng)數(shù)據(jù)分布的變化。但現(xiàn)實(shí)問題復(fù)雜多變,工科領(lǐng)域提出的解決方案往往只針對模型的數(shù)學(xué)原理,而構(gòu)建一種穩(wěn)定可靠的人工智能系統(tǒng)不僅需要完善的數(shù)學(xué)理論,還需要結(jié)合醫(yī)學(xué)知識的指導(dǎo)。
數(shù)據(jù)分布的不同會造成模型表現(xiàn)的不穩(wěn)定,因此研究者們希望尋求增強(qiáng)模型可解釋性的方法以了解模型結(jié)果的來源和過程。傳統(tǒng)機(jī)器學(xué)習(xí)模型的可解釋性要優(yōu)于深度學(xué)習(xí)模型,如支持向量機(jī)模型可提供從數(shù)據(jù)到結(jié)果的解析表達(dá)式,決策樹模型可提供每一步?jīng)Q策的理由,而深度學(xué)習(xí)模型常用激活圖提供了圖像中對分類結(jié)果重要的部分,或利用注意力機(jī)制形成自我解釋,但目前對于人工智能可解釋性的研究成果有限。醫(yī)學(xué)領(lǐng)域?qū)τ谌斯ぶ悄艿目山忉屝院桶踩杂衅惹行枨螅瑢τ诨颊叩脑\斷和治療過程,醫(yī)師希望人工智能模型在提供結(jié)果的同時(shí)也有原因分析,從而提高該結(jié)果的可信度。由于模型可解釋性的欠缺,目前的人工智能應(yīng)用仍存在局限,無法完全替代醫(yī)師對患者進(jìn)行全流程診斷與治療。
多數(shù)臨床場景下,人工智能系統(tǒng)提供的結(jié)果僅作為參考信息。維也納醫(yī)科大學(xué)皮膚科探究了醫(yī)師如何采納人工智能系統(tǒng)提供的診斷建議,得到如下結(jié)論:①經(jīng)驗(yàn)越少的醫(yī)師越容易相信人工智能診斷結(jié)果而非醫(yī)師的診斷(即使醫(yī)師的診斷是正確的);②專家在信心充分時(shí)不易根據(jù)人工智能結(jié)果改變自己的判斷,在信心不足時(shí)也可通過人工智能系統(tǒng)獲得更多有助于診斷的參考信息;③不同經(jīng)驗(yàn)水平醫(yī)師在缺乏信心時(shí)均易接受人工智能的診斷建議;④若醫(yī)師過度依賴人工智能系統(tǒng)的診斷結(jié)果,可能導(dǎo)致隨著人工智能系統(tǒng)的誤診而改變自己正確判斷的結(jié)果[39]。因此在臨床應(yīng)用中,醫(yī)師仍需保持獨(dú)立思考,應(yīng)避免輕易采納人工智能系統(tǒng)提供的診斷結(jié)果。
人工智能的研究已進(jìn)行了數(shù)十年,研究進(jìn)程頗為曲折,目前借由計(jì)算機(jī)硬件技術(shù)的發(fā)展而得以發(fā)揮潛力。人工智能方法的優(yōu)勢在于快速大規(guī)模的數(shù)據(jù)處理能力及對復(fù)雜輸入輸出關(guān)系的強(qiáng)擬合能力,不足之處在于其良好性能依賴于數(shù)據(jù)質(zhì)量,可解釋性問題也限制了其應(yīng)用場景。作為一種技術(shù)工具,人工智能進(jìn)入實(shí)際應(yīng)用需要數(shù)據(jù)標(biāo)準(zhǔn)化、人工數(shù)據(jù)標(biāo)注、醫(yī)學(xué)專家指導(dǎo)等外部條件的輔助。未來在疾病初篩、輔助和提升人工診斷效率,醫(yī)學(xué)科研前沿探索等方面,將會出現(xiàn)更多優(yōu)秀的臨床人工智能產(chǎn)品;而在數(shù)據(jù)偏倚較大,誤診后果嚴(yán)重或?qū)υ\斷邏輯要求高等多種應(yīng)用場景下,人工智能方法仍有待深入研究和探索。