孟雨
器官損傷總是不易察覺,往往會因此錯過最佳治療時機?;谌斯ぶ悄艿男路椒艹掷m(xù)監(jiān)測病人的健康數(shù)據(jù)并及時預測即將發(fā)生的腎臟損傷。
在美國的醫(yī)院中,急性腎功能損傷的發(fā)病率高達20 %,包括異常血壓和血容量等多種因素都會誘發(fā)這種十分普遍的病癥。但目前醫(yī)療界卻缺乏有效的手段來預測病人是否會發(fā)生以及何時會發(fā)生急性腎損傷。目前,對于高危病人的臨床處理手段是每天檢測血液中的肌酸酐濃度,濃度過高就意味著腎功能出現(xiàn)了問題。
近日,來自DeepMind等多個機構的研究人員提出了一種基于人工智能的新方法,能夠有效預測病人即將發(fā)生的腎功能損傷。相較于傳統(tǒng)方法,這種新方法可以提前一到兩天檢測出大部分病人腎臟損傷的發(fā)生風險。由于腎臟損傷往往在最后階段才被察覺,此時腎臟已經發(fā)生不可逆的損害,嚴重時將會留下需要暫時或長期透析的后遺癥,甚至引起病人死亡。對于腎臟損傷的早期檢測方法將為有效的臨床治療贏得寶貴的時間。
深度學習作為近年來發(fā)展最快的人工智能方法,可以有效識別出數(shù)據(jù)中隱含的與特定結果相關的模式。在這一研究中,研究人員利用深度學習的方法來檢測急性腎損傷。訓練深度學習算法需要大量的數(shù)據(jù),研究人員從美國退伍軍人事務部(US Department of Veterans Affairs,為美國退伍軍人及其家屬提供服務)負責運營的172家醫(yī)院和1062家門診中,收集了超過70萬例成年病例的數(shù)據(jù)(2011- 2015年)。這些經過匿名處理的數(shù)據(jù)為研究人員提供了人口統(tǒng)計信息、電子健康檔案、化驗結果、藥物處方和過往治療記錄等數(shù)據(jù)。論文的第一作者Tomasev和同事們從數(shù)據(jù)中整理出了約60億個數(shù)據(jù)點和60多萬個記錄特征,他們選擇了一種被稱為循環(huán)神經網(wǎng)絡的深度學習方法來處理時序數(shù)據(jù)并對計算機進行訓練,這種方法在深度學習領域被證明非常適合處理時序數(shù)據(jù)。
在訓練完成后,研究人員利用事先分離出的獨立數(shù)據(jù)集對算法的有效性進行了測試?;跍y試數(shù)據(jù),計算機將生成接下來48小時內連續(xù)的概率值來追蹤每個病人隨時間推移發(fā)生急性腎損傷的可能性。如果預測的概率值超過一定閾值,這個預測結果將被標記為陽性(如圖一所示)。病人后續(xù)是否被檢查出病情則會驗證算法的預測精度。該模型同時還提供了預測概率值的不確定性,為醫(yī)生提供了評估預測信號的強度指標。
Tomasev團隊提出的方法可以給出急性腎損傷的預警信號。研究人員利用人工智能中的深度學習方法來訓練計算機從數(shù)據(jù)中檢測與后續(xù)腎損傷相關的模式。研究人員利用這種算法來分析過往的醫(yī)療數(shù)據(jù),包括電子健康檔案和化驗結果等等。計算機分析某個病人的歷史數(shù)據(jù)后,將生成接下來48小時內的連續(xù)概率值,對應病人發(fā)生急性腎功能損傷的可能性。如果概率超過一定閾值,預測結果將被標記為陽性,并向醫(yī)生發(fā)出警報。
在此假設場景下,Tomasev團隊的研究方法將提供比傳統(tǒng)方法更早的預警信號,為醫(yī)生和病人贏得了寶貴的治療時間。
Tomasev和同事們提出的新方法比其他基于統(tǒng)計或機器學習的方法更為精確地預測了即將要發(fā)生的腎損傷,而且對于醫(yī)院內病人的預測精度最高———醫(yī)院內病人發(fā)生急性腎損傷的比門診診所更為頻繁,同時時間窗口也更為短暫。對于所有病人和所有類別的腎損傷,包括較為輕微的損傷,這一系統(tǒng)的平均預測精度達到了56 %;而針對更為嚴重的腎損傷預測,對于后續(xù)30天和后續(xù)90天內需要透析的病人預測精度則分別達到了84 %和90 %。該模型在不同的醫(yī)療場所和不同時間周期內具有相似的預測精度。
此外,研究人員使用了消融性分析方法來鑒別與腎損傷發(fā)生風險相關的因素,結果發(fā)現(xiàn)有很多,這也許解釋了為何過去讓研究人員分析這種風險是一件棘手的事。
假設病例顯示了研究人員所開發(fā)的新方法的重大應用潛力。如果利用傳統(tǒng)方法檢測,醫(yī)生將在第四天才能獲悉腎損傷的發(fā)生,而新方法則可以提前兩天預測出來,為醫(yī)務人員提供了更多寶貴的時間和更多干預治療的手段,包括增加病人的液體攝取,或者避免使用可能造成腎毒性的藥物。
然而這一系統(tǒng)也存在一定問題:生成一系列假陽性的預測結果,即誤報一些沒有發(fā)生的腎損傷。每個精確的預測會對應兩個假陽性結果。假陽性絕大多數(shù)來源于患有慢性腎病的病人,疾病的癥狀會與急性腎損傷疊加,造成結果難以預測。
本研究的另一局限在于這是一項回顧性研究,利用回顧性研究構建的人工智能方法將在前瞻性研究中發(fā)生一定程度的退化,這可能是因為臨床中的真實數(shù)據(jù)會比預先存在的經過清洗的“干凈”數(shù)據(jù)要復雜得多。
前瞻性研究是檢測預測系統(tǒng)的真實臨床價值的根本所在,而預測成功與否不是唯一應加以評估的因素。要確定計算機生成的預警信號是否在臨床中減少了急性腎損傷的發(fā)生率,一種方法是開展隨機設計的臨床試驗,只將其中一半的預測傳遞給醫(yī)生。此外,作者的模型也應該在其他人群身上進行有效性的測試。作者的研究只包含了不到7 %的女性病例,那么,模型對于不同性別的病人是否具有相同的預測精度,也值得在未來進行深入地研究。
雖然這一研究包含了不同種類的數(shù)據(jù),但還有其他數(shù)據(jù)源也值得納入進來,例如病歷上的手寫內容,來自可穿戴傳感器的連續(xù)生命監(jiān)測信號,如心率等,這些都有可能提供有價值的相關信息。
對于非重癥病人來說,常規(guī)監(jiān)測方法是每天測量一次生命體征,但病人經常會突然出現(xiàn)病情急轉直下的情況。Tomasev和同事的研究對于這樣的病人來說十分有用,可以在病人發(fā)生嚴重的器官衰竭之前發(fā)出預警,為病人贏得寶貴的救治時機。先前,很多臨床背景下基于人工智能的預測性研究主要著重于研究疾病轉歸,包括死亡、再入院或住院時間等,而Tomasev等人的研究結果則提供了獨特的視角,為臨床干預提供了有效的預測信號。
深度學習有望為醫(yī)生提供針對任何器官狀況的有力預警手段,它的廣泛應用也許需要醫(yī)療界改變思維方式。但是從非經常的一次性測試轉向系統(tǒng)性的連續(xù)監(jiān)測,或將為醫(yī)務人員提供更有效的手段來預測病人的病情變化。