文/任在方
隨著AI技術(shù)和醫(yī)學(xué)本身的快速進步,臨床對知識庫的需求已不僅僅局限于查詢和檢索文獻資料了。
從海量數(shù)據(jù)中“發(fā)現(xiàn)”有價值的信息,是知識庫區(qū)別于一般數(shù)據(jù)庫(DB)最突出的特征。在人工智能(AI)技術(shù)飛速發(fā)展的今天,如何利用AI等技術(shù)手段盤活臨床大數(shù)據(jù),讓數(shù)據(jù)真正形成“取之于臨床而又服務(wù)于臨床”的良性循環(huán)?將AI與數(shù)據(jù)庫有機結(jié)合的知識庫的應(yīng)用與未來,被行業(yè)賦予了更多的期待。
當(dāng)前,以電子病歷為核心的醫(yī)院信息化建設(shè)不斷升級發(fā)展,數(shù)據(jù)采集和集成技術(shù)日益成熟,在此背景下,利用AI技術(shù)手段對數(shù)據(jù)進行知識化表示,構(gòu)建具有自我學(xué)習(xí)能力的“活”的知識圖譜,讓知識庫能夠真正服務(wù)于臨床實踐,乃至指導(dǎo)臨床實踐,是醫(yī)學(xué)知識庫構(gòu)建和應(yīng)用的重點發(fā)展方向。
醫(yī)學(xué)知識庫是從書籍教材、指南文獻、醫(yī)學(xué)科研等渠道中抽取科學(xué)知識,同時對醫(yī)生的臨床經(jīng)驗進行歸納總結(jié),編碼成計算機可以利用的形式,執(zhí)行輔助診斷、決策支持和臨床管理等功能。
傳統(tǒng)的醫(yī)學(xué)知識庫多為文獻知識庫,充當(dāng)“電子詞典”或“電子文獻庫”的功能,供臨床醫(yī)務(wù)人員檢索,服務(wù)于臨床診療和研究。但這類文獻知識庫較少有自主的深度學(xué)習(xí)和知識更新能力,其知識重用的效率和共享程度不高,不能為臨床醫(yī)生和科研人員提供長期、動態(tài)、全面的知識源,更難以適應(yīng)復(fù)雜臨床問題的處理,不能對臨床的真實數(shù)據(jù)提供實時聯(lián)機決策支持。這就導(dǎo)致了傳統(tǒng)醫(yī)學(xué)知識庫的服務(wù)能力,與臨床業(yè)務(wù)和醫(yī)療管理的需求之間存在著巨大的差距。
隨著AI技術(shù)和醫(yī)學(xué)本身的快速進步,臨床對知識庫的需求已不僅僅局限于查詢和檢索文獻資料,對具備知識推理和知識發(fā)現(xiàn)的專科專病知識庫需求日益增多。知識庫的開發(fā),也從初級的集成檢索,逐步向智能知識發(fā)現(xiàn)的高級階段過渡。因此,提高知識庫的標(biāo)準(zhǔn)程度與量級,是未來醫(yī)學(xué)知識庫建設(shè)的重要前提和方向。
官方數(shù)據(jù)顯示,我國已有近90%的二級及以上公立醫(yī)院建立了規(guī)范化的電子病歷,醫(yī)療數(shù)據(jù)量正在以TB、PB、EB為單位快速增長,政府及相關(guān)部門亦希望通過挖掘數(shù)據(jù)紅利,提升醫(yī)療服務(wù)的效率、質(zhì)量與可及性。
電子病歷系統(tǒng)應(yīng)用水平分級評價辦法中,知識庫體系建設(shè)和臨床決策支持水平成為重要指標(biāo)。利用人工智能技術(shù)、大數(shù)據(jù)分析將固化的經(jīng)驗知識轉(zhuǎn)化為可執(zhí)行的診療路徑,成為創(chuàng)新醫(yī)療服務(wù)模型和支持臨床質(zhì)量持續(xù)改進的重要方式。
盡管行業(yè)已經(jīng)認識到AI技術(shù)在分析大型數(shù)據(jù)集、規(guī)范診療行為、管控臨床質(zhì)量等方面具有先發(fā)優(yōu)勢,但實際上,包括醫(yī)療AI企業(yè)和技術(shù)研發(fā)機構(gòu)在內(nèi),能夠采用AI技術(shù)真正獲取專家知識的能力仍顯不足,知識庫的專業(yè)性、完整性等方面仍面臨較大挑戰(zhàn)。
要解決這個問題,核心在于知識庫的建設(shè)是否可以將數(shù)據(jù)挖掘技術(shù)與支持循證醫(yī)學(xué)進行深度融合。
中日醫(yī)院在信息化建設(shè)過程中,一方面以患者為核心,進行流程改造和優(yōu)化,改善患者就醫(yī)體驗,同時,以提高臨床規(guī)范化管理水平、持續(xù)改善醫(yī)療過程質(zhì)量、切實保障患者安全為目的,借助醫(yī)療AI企業(yè)的算法等技術(shù)優(yōu)勢,深度挖掘中日醫(yī)院各個學(xué)科的知識積淀和專家豐富的臨床經(jīng)驗,共同建設(shè)基于循證的、完全滿足臨床需求的大型??浦R庫。
??浦R庫的構(gòu)建也并非從零開始,醫(yī)療AI企業(yè)的原始數(shù)據(jù)庫經(jīng)過多年積累,通過自然語言處理、機器學(xué)習(xí)等人工智能技術(shù)抽取國內(nèi)外公開發(fā)表的論文、指南及專家共識、醫(yī)學(xué)教材等知識資源中包含的醫(yī)學(xué)邏輯,已經(jīng)形成了龐大的的疾病知識庫。在此基礎(chǔ)上,醫(yī)院運營與信息中心聯(lián)合科室臨床專家一起,拆解最新的??圃\療指南,采用聚類、分類方法,將融入專家診療經(jīng)驗的真實病歷數(shù)據(jù)進行臨床特征抽取,構(gòu)建體征庫、診斷庫、治療庫等,并結(jié)合人工標(biāo)注和機器學(xué)習(xí)建模,應(yīng)用決策樹方法建立知識表示,自動映射國際通用術(shù)語標(biāo)準(zhǔn)。這種有監(jiān)督的深度學(xué)習(xí)方法形成了一種良性循環(huán),提高了知識模型的準(zhǔn)確度、完全性。
結(jié)合了人工智能和醫(yī)療大數(shù)據(jù)的??浦R庫,具有自我學(xué)習(xí)的能力,以知識庫應(yīng)用為核心的臨床路徑應(yīng)用不再是“靜態(tài)”的“死”路徑,而是能夠動態(tài)自適應(yīng)、能根據(jù)病人個性化特征實時調(diào)整的最優(yōu)“活”路徑。醫(yī)院運營與信息中心希望能夠?qū)⒅R庫與電子病歷融合,為醫(yī)務(wù)人員提供醫(yī)療活動的過程控制、決策支持。也希望吸納了優(yōu)勢學(xué)科精華的知識庫在醫(yī)聯(lián)體中得到推廣應(yīng)用,實現(xiàn)優(yōu)質(zhì)醫(yī)療資源的有效、高效下沉,推進醫(yī)聯(lián)體的內(nèi)涵建設(shè),促進醫(yī)療服務(wù)質(zhì)量的整體改進。