詹世鵬,馬攀,劉芳 (陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院藥劑科,重慶 400038)
國務(wù)院于2017年7月20日發(fā)布的《新一代人工智能發(fā)展規(guī)劃》,明確將人工智能(artificial intelligence,AI)作為未來國家重要的發(fā)展戰(zhàn)略。近年來,AI不斷得到各領(lǐng)域的重視,取得了令人矚目的發(fā)展。機(jī)器學(xué)習(xí)是AI的一種實(shí)現(xiàn)方式,也是一門專注于研究計(jì)算機(jī)如何從數(shù)據(jù)中學(xué)習(xí)的科學(xué)學(xué)科[1],通過強(qiáng)大的計(jì)算算法,可以實(shí)現(xiàn)對(duì)數(shù)據(jù)高效、準(zhǔn)確地分析和預(yù)測[2]。醫(yī)療大數(shù)據(jù)給機(jī)器學(xué)習(xí)提供了海量的數(shù)據(jù)來源,近年來,機(jī)器學(xué)習(xí)已在醫(yī)療監(jiān)護(hù)[3]、影像判斷[4]、衛(wèi)生決策[5]等領(lǐng)域發(fā)揮了重要作用。在藥學(xué)領(lǐng)域,機(jī)器學(xué)習(xí)在藥物研發(fā)階段的應(yīng)用已趨于成熟[6],但在治療藥物監(jiān)測和個(gè)體化用藥領(lǐng)域仍處于上升階段。
個(gè)體化用藥旨在為患者“量體裁藥”,提供精準(zhǔn)化藥學(xué)服務(wù)。治療藥物監(jiān)測為個(gè)體化用藥提供了重要的技術(shù)支撐。既往基于治療藥物監(jiān)測的個(gè)體化用藥模型構(gòu)建多采用群體藥動(dòng)學(xué)模型,存在建模困難、影響因素考慮較少且準(zhǔn)確度不高的局限性。機(jī)器學(xué)習(xí)可通過對(duì)數(shù)據(jù)的多層次挖掘,篩選出多個(gè)影響因素,并將其一并納入分析,從而構(gòu)建出實(shí)用性更強(qiáng)、準(zhǔn)確度更高的個(gè)體化用藥模型[7—8]。因此,機(jī)器學(xué)習(xí)與個(gè)體化用藥的結(jié)合有助于臨床更好地實(shí)現(xiàn)精準(zhǔn)用藥。本研究擬通過查閱國內(nèi)外相關(guān)文獻(xiàn),對(duì)機(jī)器學(xué)習(xí)在治療藥物監(jiān)測與個(gè)體化用藥中的應(yīng)用進(jìn)行綜述,以期為臨床精準(zhǔn)用藥提供理論依據(jù)和技術(shù)支撐。
機(jī)器學(xué)習(xí)的本質(zhì)是通過算法使計(jì)算機(jī)從大量的數(shù)據(jù)中學(xué)習(xí)規(guī)律并形成相應(yīng)的模型,并對(duì)該模型進(jìn)行驗(yàn)證和不斷優(yōu)化,其目標(biāo)是對(duì)新的樣本作出識(shí)別和預(yù)測[9]。因此,機(jī)器學(xué)習(xí)的能力是訓(xùn)練出來的,不是明確地用程序編寫出來的[10]。機(jī)器學(xué)習(xí)根據(jù)學(xué)習(xí)方式可以分為監(jiān)督式學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)和強(qiáng)化學(xué)習(xí)四大類[11]。
在監(jiān)督式學(xué)習(xí)中,每組訓(xùn)練數(shù)據(jù)都有一個(gè)明確的目標(biāo)變量,這個(gè)變量由已知的一系列預(yù)示變量預(yù)測而來。監(jiān)督式學(xué)習(xí)主要用于解決分類及回歸問題,常見的基于監(jiān)督式學(xué)習(xí)的算法包括——(1)回歸算法:采用對(duì)誤差的衡量來探索變量之間的關(guān)系,代表算法有線性回歸、邏輯回歸等。(2)決策樹算法:根據(jù)數(shù)據(jù)的屬性采用樹狀結(jié)構(gòu)建立決策模型,代表算法有分類回歸樹、多元自適應(yīng)回歸樣條等。(3)貝葉斯算法:基于貝葉斯定理的一類算法,代表算法有樸素貝葉斯、貝葉斯網(wǎng)絡(luò)等。(4)基于核的算法:將輸入數(shù)據(jù)映射到高維空間中,并在高維空間學(xué)習(xí)得到對(duì)應(yīng)的線性模型,使模型具有極強(qiáng)的非線性表達(dá)能力,代表算法有支持向量機(jī)、徑向基函數(shù)等。(5)人工神經(jīng)網(wǎng)絡(luò):模擬生物神經(jīng)網(wǎng)絡(luò),通過大量節(jié)點(diǎn)互相連接構(gòu)成網(wǎng)絡(luò),代表算法有感知器神經(jīng)網(wǎng)絡(luò)、反向傳遞等。
在半監(jiān)督式學(xué)習(xí)中,輸入的數(shù)據(jù)部分被標(biāo)識(shí),部分未被標(biāo)識(shí),這種學(xué)習(xí)模型可以用來預(yù)測,但是模型首先需要學(xué)習(xí)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)以便合理地組織數(shù)據(jù)來進(jìn)行預(yù)測。半監(jiān)督式學(xué)習(xí)的算法大多是常用監(jiān)督式學(xué)習(xí)算法的延伸,即先對(duì)未標(biāo)識(shí)數(shù)據(jù)進(jìn)行建模,在此基礎(chǔ)上再對(duì)標(biāo)識(shí)的數(shù)據(jù)進(jìn)行預(yù)測,如圖論推理算法或者拉普拉斯支持向量機(jī)等。
在非監(jiān)督式學(xué)習(xí)中,數(shù)據(jù)并不被特別標(biāo)識(shí),學(xué)習(xí)的目的是推斷出數(shù)據(jù)的一些內(nèi)在結(jié)構(gòu)。該算法主要用于聚類和降維,其中用于聚類的主要有K-均值算法、分層聚類等,用于降維的主要有主成分分析、偏最小二乘回歸等。
強(qiáng)化學(xué)習(xí)的工作機(jī)制是將機(jī)器放在一個(gè)能讓其通過反復(fù)試錯(cuò)來訓(xùn)練自己的環(huán)境中,從過去的經(jīng)驗(yàn)中進(jìn)行學(xué)習(xí),通過學(xué)習(xí)策略達(dá)成回報(bào)最大化。其與監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)等的最大不同之處在于,其是通過與環(huán)境之間的交互和反饋來學(xué)習(xí)的,例如馬爾可夫模型。
除了以上單個(gè)的算法外,目前集成學(xué)習(xí)算法也在逐漸流行。集成學(xué)習(xí)算法本身不算一種單獨(dú)的機(jī)器學(xué)習(xí)算法,而是通過構(gòu)建并結(jié)合多個(gè)機(jī)器學(xué)習(xí)器來完成學(xué)習(xí)任務(wù),集各種算法的優(yōu)點(diǎn)于一體,能在機(jī)器學(xué)習(xí)算法中擁有較高的準(zhǔn)確率,但同時(shí)訓(xùn)練過程會(huì)相對(duì)復(fù)雜、效率較低。目前常見的集成學(xué)習(xí)算法主要有2種:基于Bagging的算法(如隨機(jī)森林)和基于Boosting的算法[如梯度提升樹、自適應(yīng)增強(qiáng)和極致梯度提升(eXtreme Gradient Boosting,XGBoost)]。
臨床常用的免疫抑制劑有他克莫司、環(huán)孢素A、霉酚酸等,是移植術(shù)后抗排斥反應(yīng)的基礎(chǔ)用藥。由于這類藥物治療窗窄,藥動(dòng)學(xué)存在明顯的個(gè)體內(nèi)及個(gè)體之間的差異,常需通過監(jiān)測血藥濃度以優(yōu)化給藥劑量,確保藥物處于安全有效的治療范圍。目前已有較多基于群體藥動(dòng)學(xué)的免疫抑制劑個(gè)體化用藥模型,但各模型間納入的影響因素差異較大,導(dǎo)致模型的外推性和適用性不強(qiáng)[12—14]。機(jī)器學(xué)習(xí)可將所有可能的影響因素納入分析,外推性和實(shí)用性更強(qiáng)。
他克莫司是目前實(shí)體器官移植(如肝移植、腎移植)術(shù)后抗排斥反應(yīng)的一線用藥。國內(nèi)學(xué)者任斌教授團(tuán)隊(duì)通過人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測了腎移植[15]和肝移植患者[7—8,16]體內(nèi)的他克莫司血藥濃度,進(jìn)行了個(gè)體化給藥研究。該團(tuán)隊(duì)以患者性別、年齡、體質(zhì)量、身高、術(shù)后時(shí)間、他克莫司每日劑量或累積劑量、免疫抑制方案(二聯(lián)或三聯(lián))、他克莫司濃度測定前3 d(或測定前4 d)各項(xiàng)實(shí)驗(yàn)室檢查結(jié)果以及合并用藥等為輸入變量,采用神經(jīng)網(wǎng)絡(luò)方法建模,利用遺傳算法配合動(dòng)量法優(yōu)化網(wǎng)絡(luò)參數(shù),最終建立基于人工神經(jīng)網(wǎng)絡(luò)的他克莫司血藥濃度預(yù)測模型,預(yù)測他克莫司血藥濃度。以平均預(yù)測誤差和平均絕對(duì)誤差為參數(shù)進(jìn)行評(píng)估,同時(shí)與多元線性回歸和群體藥動(dòng)學(xué)常用的非線性混合效應(yīng)模型進(jìn)行對(duì)比,結(jié)果發(fā)現(xiàn),其所建立的人工神經(jīng)網(wǎng)絡(luò)模型在預(yù)測的相關(guān)性、準(zhǔn)確性和精密度方面都要更優(yōu)。Chen等[17]也采用人工神經(jīng)網(wǎng)絡(luò)模型,以性別、年齡、體質(zhì)量、受者和供者的巨細(xì)胞病毒狀態(tài)、移植時(shí)長、實(shí)驗(yàn)室檢查指標(biāo)為變量,預(yù)測了美國肝移植患者他克莫司的血藥濃度。結(jié)果顯示,他克莫司模型預(yù)測值與實(shí)測值無明顯差異[(12.05±2.67)ng/mL vs.(12.14±2.64)ng/mL,P=0.80],平均絕對(duì)誤差為1.74 ng/mL。這表明,使用人工神經(jīng)網(wǎng)絡(luò)模型可精確預(yù)測肝移植患者的他克莫司血藥濃度,指導(dǎo)移植患者精準(zhǔn)化個(gè)體化用藥。Thishya等[18]也采用人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測了他克莫司在腎移植患者中的生物利用度,并嘗試解釋ABCB1和CYP3A5基因多態(tài)性對(duì)他克莫司生物利用度的影響。結(jié)果發(fā)現(xiàn),CYP3A5*3等位基因和ABCB1基因與他克莫司的生物利用度高度相關(guān);ABCB1聯(lián)合CYP3A5*3基因?qū)︻A(yù)測他克莫司生物利用度具有更好的效果,有利于改善治療效果并預(yù)防毒性。
除人工神經(jīng)網(wǎng)絡(luò)模型外,其他機(jī)器學(xué)習(xí)模型也在他克莫司個(gè)體化用藥中有所應(yīng)用。Cai等[19]收集了182例腎移植術(shù)后至少3個(gè)月的患者數(shù)據(jù),納入了包括內(nèi)源性CYP3A4表型、CYP3A5基因型和一些常規(guī)的實(shí)驗(yàn)室檢查數(shù)據(jù)以及基本人口信息學(xué)資料,通過建立隨機(jī)森林模型實(shí)現(xiàn)了對(duì)腎移植患者他克莫司血藥濃度和劑量的精準(zhǔn)預(yù)測。Seeling等[20]應(yīng)用回歸樹模型預(yù)測了腎移植患者他克莫司的血藥濃度水平,并將該模型轉(zhuǎn)化為知識(shí)庫,直接整合應(yīng)用于維也納總醫(yī)院的信息系統(tǒng)中。Tang等[21]比較了多元線性回歸和其他8種機(jī)器學(xué)習(xí)算法(人工神經(jīng)網(wǎng)絡(luò)、多元自適應(yīng)回歸、回歸樹、增長回歸樹、支持向量回歸、隨機(jī)森林回歸、套索回歸和貝葉斯加性回歸樹)在預(yù)測他克莫司穩(wěn)定劑量方面的性能,以平均絕對(duì)誤差為指標(biāo)進(jìn)行判斷。結(jié)果發(fā)現(xiàn),8種機(jī)器學(xué)習(xí)算法構(gòu)建的模型結(jié)果相似,其中回歸樹模型在訓(xùn)練集和驗(yàn)證集中均獲得了最優(yōu)的預(yù)測性能,優(yōu)于傳統(tǒng)多元線性回歸模型。Woillard等[22]采用4種機(jī)器學(xué)習(xí)模型對(duì)他克莫司常規(guī)制劑以及緩釋制劑的藥-時(shí)曲線下面積和推薦給藥劑量進(jìn)行擬合,以相對(duì)平均誤差和均方根誤差為指標(biāo)進(jìn)行評(píng)價(jià),并與群體藥動(dòng)學(xué)模型進(jìn)行比較。結(jié)果發(fā)現(xiàn),基于3個(gè)濃度點(diǎn)的XGBoost算法得到的擬合結(jié)果最優(yōu),但目前這種學(xué)習(xí)算法需要大樣本量的原始數(shù)據(jù),具有局限性。針對(duì)這一局限性,該團(tuán)隊(duì)隨后利用文獻(xiàn)報(bào)道的群體藥動(dòng)學(xué)數(shù)據(jù),采用蒙特卡洛法擬合擴(kuò)大樣本量后,仍以基于3個(gè)濃度點(diǎn)的XGBoost算法建模。結(jié)果發(fā)現(xiàn),該模型可用于估計(jì)他克莫司的藥-時(shí)曲線下面積,從而擴(kuò)展了機(jī)器學(xué)習(xí)的外延性[23]。
環(huán)孢素屬于鈣調(diào)磷酸酶類抑制劑,常用于預(yù)防實(shí)體器官移植受者的排斥反應(yīng),也用于治療各種免疫介導(dǎo)性疾病。國內(nèi)學(xué)者余俊先等[24—26]利用人工神經(jīng)網(wǎng)絡(luò)建立了腎移植患者環(huán)孢素的血藥濃度預(yù)測模型與個(gè)體化給藥模型,所建模型預(yù)測誤差率小于20%,可有助于臨床根據(jù)預(yù)測模型調(diào)整劑量。徐楚鴻等[27]將人工神經(jīng)網(wǎng)絡(luò)用于預(yù)測腎移植患者術(shù)后環(huán)孢素的血藥濃度,其收集了60例腎移植患者環(huán)孢素的血藥濃度,將身高、體質(zhì)量、肝腎功等13項(xiàng)指標(biāo)采用反向傳播算法構(gòu)建人工神經(jīng)網(wǎng)絡(luò)模型,同時(shí)采用多元線性回歸法進(jìn)行預(yù)測,并比較二者的預(yù)測結(jié)果。結(jié)果顯示,人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測值與實(shí)測值之間相關(guān)系數(shù)r為0.931 4,優(yōu)于多元線性回歸(r=0.714 5),提示人工神經(jīng)網(wǎng)絡(luò)模型優(yōu)于傳統(tǒng)多元線性回歸模型,可用于環(huán)孢素的血藥濃度預(yù)測。張靖悅等[28]建立了基于主成分分析-多項(xiàng)式曲線回歸的人全血中環(huán)孢素谷濃度的預(yù)測模型。該研究收集了37例確診為免疫相關(guān)性全血細(xì)胞減少癥并使用環(huán)孢素治療的患者,首先采用主成分分析法對(duì)33個(gè)生理生化指標(biāo)降維簡化,確定了10個(gè)主成分,再以多元線性回歸模型和多項(xiàng)式曲線回歸模型擬合建模。結(jié)果顯示,主成分分析-多項(xiàng)式曲線回歸模型的擬合優(yōu)度為1.000,均方誤差為3×e-15,表明該模型擬合優(yōu)度高、均方誤差較小,適用于患者環(huán)孢素谷濃度的預(yù)測。
國外不少學(xué)者也通過機(jī)器學(xué)習(xí)建立了環(huán)孢素濃度預(yù)測或劑量預(yù)測模型。Camps-Valls等[29]將神經(jīng)網(wǎng)絡(luò)模型用于預(yù)測環(huán)孢素的個(gè)體化給藥劑量。該研究共納入32例患者,隨機(jī)分為訓(xùn)練集(n=22)和測試集(n=10),將患者的年齡、體質(zhì)量、性別、移植時(shí)長、給藥劑量、血藥濃度和肌酐水平等指標(biāo)作為變量,通過建立兩層鏈?zhǔn)侥P停阮A(yù)測環(huán)孢素的血藥濃度,再進(jìn)一步預(yù)測環(huán)孢素的給藥劑量,并采用3種神經(jīng)網(wǎng)絡(luò)模型以及集成模型進(jìn)行預(yù)測和驗(yàn)證,并與傳統(tǒng)的時(shí)間序列常用模型——自回歸移動(dòng)平均模型進(jìn)行比較。結(jié)果發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果比傳統(tǒng)模型的結(jié)果精確;而3種神經(jīng)網(wǎng)絡(luò)模型結(jié)果間差異無統(tǒng)計(jì)學(xué)意義,且與集成模型結(jié)果的差異也無統(tǒng)計(jì)學(xué)意義。這提示神經(jīng)網(wǎng)絡(luò)可用于環(huán)孢素的血藥濃度和給藥劑量預(yù)測,從而輔助指導(dǎo)臨床用藥。Hoda等[30]采用進(jìn)化算法預(yù)測了環(huán)孢素的全血谷濃度,其將101名接收心臟移植并使用環(huán)孢素治療的患者,隨機(jī)分為訓(xùn)練集(n=64)和測試集(n=37),將年齡、性別、體質(zhì)量、身體質(zhì)量指數(shù)、住院時(shí)間、移植術(shù)后時(shí)長、免疫抑制方案、血清肌酐、膽紅素水平、環(huán)孢素日劑量等15個(gè)數(shù)字變量和50個(gè)符號(hào)變量納入研究,隨后將預(yù)測濃度與實(shí)測濃度進(jìn)行比較。結(jié)果顯示,訓(xùn)練集和測試集的平均百分誤差分別為(7.1±5.4)%、(8.0±6.7)%,預(yù)測濃度和實(shí)測濃度的相關(guān)系數(shù)分別為0.93、0.85,預(yù)測準(zhǔn)確率為80%~90%。通過該項(xiàng)技術(shù),有望實(shí)現(xiàn)不用采集患者血樣即可準(zhǔn)確預(yù)測患者的環(huán)孢素血藥濃度,從而降低衛(wèi)生系統(tǒng)成本。Leclerc等[31]以一種樹增強(qiáng)樸素貝葉斯網(wǎng)絡(luò)模型,預(yù)測了兒科造血干細(xì)胞移植術(shù)后環(huán)孢素從靜脈注射切換到口服給藥時(shí)的給藥劑量。該學(xué)者收集了某中心10年間的兒科造血干細(xì)胞移植患者數(shù)據(jù),將前8年的157例患者數(shù)據(jù)作為訓(xùn)練集,后2年的54例患者數(shù)據(jù)作為測試集,將多個(gè)變量納入建模,最終生成了一種在線決策支持工具,通過在頁面端口輸入各變量值,即可實(shí)現(xiàn)對(duì)靜脈注射轉(zhuǎn)換為口服給藥時(shí)的第一劑環(huán)孢素劑量的預(yù)測。
霉酚酸是一種淋巴細(xì)胞增殖的強(qiáng)效抑制劑,有研究發(fā)現(xiàn),霉酚酸的谷濃度與療效及不良反應(yīng)的相關(guān)性不強(qiáng),而體內(nèi)暴露量的藥-時(shí)曲線下面積與療效及不良反應(yīng)有較強(qiáng)的相關(guān)性。目前臨床對(duì)于霉酚酸的監(jiān)測,多采用有限采樣法,即選擇3~4個(gè)采樣點(diǎn),以多元線性回歸構(gòu)建公式推算霉酚酸的體內(nèi)暴露量。但目前國內(nèi)外暫無統(tǒng)一的公式,不同公式計(jì)算得到的曲線下面積不同,使得基于曲線下面積的療效與安全性評(píng)價(jià)缺乏室間可比性。任斌教授團(tuán)隊(duì)采用遺傳算法配合動(dòng)量法優(yōu)化網(wǎng)絡(luò)參數(shù),建立了人工神經(jīng)網(wǎng)絡(luò),以0、0.5、2 h的血藥濃度數(shù)據(jù)預(yù)測0~12 h的曲線下面積,結(jié)果顯示,該人工神經(jīng)網(wǎng)絡(luò)模型的平均預(yù)測誤差與平均絕對(duì)誤差分別為-1.53%、9.12%,且準(zhǔn)確度和精密度均優(yōu)于多元線性回歸[32]。此外,該團(tuán)隊(duì)還通過人工神經(jīng)網(wǎng)絡(luò)以服藥前及服用霉酚酸制劑0.5、2 h后的血藥濃度數(shù)據(jù)預(yù)測霉酚酸的藥動(dòng)學(xué)。結(jié)果發(fā)現(xiàn),人工神經(jīng)網(wǎng)絡(luò)平均預(yù)測誤差和平均絕對(duì)誤差分別為(0.39±1.24)、(0.90±0.94) μg/mL,以霉酚酸預(yù)測濃度計(jì)算的藥動(dòng)學(xué)參數(shù)與實(shí)際濃度計(jì)算的藥動(dòng)學(xué)參數(shù)差異無統(tǒng)計(jì)學(xué)意義(P>0.05)[33]。Woillard等[34]利用6 884例患者的12 877個(gè)霉酚酸藥-時(shí)曲線下面積數(shù)據(jù),開發(fā)了基于2個(gè)或3個(gè)濃度的機(jī)器學(xué)習(xí)模型,將75%的數(shù)據(jù)作為訓(xùn)練集,25%的數(shù)據(jù)作為測試集。結(jié)果顯示,該研究采用XGBoost算法建立的基于3個(gè)血藥濃度點(diǎn)的霉酚酸藥-時(shí)曲線下面積估算模型,比傳統(tǒng)群體藥動(dòng)學(xué)模型更優(yōu)。
治療藥物監(jiān)測對(duì)治療指數(shù)小、毒性大且個(gè)體差異大的抗菌藥物較為重要,對(duì)提高療效、降低毒副作用具有重要意義。隨著基于藥動(dòng)學(xué)/藥效學(xué)模型的抗感染藥物用藥管理,越來越多的抗感染藥物被納入治療藥物常規(guī)監(jiān)測項(xiàng)目中。當(dāng)下,將機(jī)器學(xué)習(xí)與抗感染藥物個(gè)體化用藥相結(jié)合已成為研究熱點(diǎn),目前開展研究較多的主要是萬古霉素。
萬古霉素屬于糖肽類抗生素,廣泛用于治療耐甲氧西林金黃色葡萄球菌和其他革蘭氏陽性菌感染。但萬古霉素治療窗窄,較易發(fā)生腎損傷等不良反應(yīng),因此有必要對(duì)其進(jìn)行血藥濃度監(jiān)測以降低不良反應(yīng)的發(fā)生率。Huang等[35]采用集成算法對(duì)兒科患者應(yīng)用萬古霉素的谷濃度進(jìn)行了預(yù)測,其納入了407例使用萬古霉素并開展了治療藥物監(jiān)測的兒童患者,以萬古霉素谷濃度為目標(biāo)變量,對(duì)8種不同算法的預(yù)測性能進(jìn)行了比較,最終選擇R2值較高的5種算法構(gòu)建集成模型。結(jié)果顯示,與經(jīng)典的群體藥動(dòng)學(xué)預(yù)測模型相比,該集成模型擬合度及準(zhǔn)確度均更高。隨后,該團(tuán)隊(duì)又納入184例患者數(shù)據(jù),采用XGBoost算法,對(duì)患者人口學(xué)信息、萬古霉素相關(guān)信息、實(shí)驗(yàn)室檢查指標(biāo)等共計(jì)29個(gè)變量進(jìn)行了擬合,并采用SHAP(Shapley Additive exPlanations)方法對(duì)各變量的影響進(jìn)行直觀的展示和解釋,以平均絕對(duì)誤差、均方誤差和均方根誤差為指標(biāo)進(jìn)行模型評(píng)價(jià)。結(jié)果顯示,XGBoost算法擬合得到的模型R2為67.5%,平均絕對(duì)誤差、均方誤差和均方根誤差分別為0.212、0.097、0.310。該研究進(jìn)一步采用SHAP方法解釋了前10個(gè)重要的影響變量,有望將這種方法應(yīng)用于臨床實(shí)踐[36]。一項(xiàng)日本的研究使用機(jī)器學(xué)習(xí)和決策樹分析構(gòu)建了萬古霉素初始劑量設(shè)置的最佳算法[37]。該研究納入654例輸注萬古霉素并接受治療藥物監(jiān)測的患者,分為訓(xùn)練集(n=496)和測試集(n=158)。訓(xùn)練集采用分類與回歸樹算法進(jìn)行決策樹分析,構(gòu)建萬古霉素初始劑量設(shè)置的算法(即決策樹算法);測試集比較了決策樹算法和3種常規(guī)劑量設(shè)置方法分別達(dá)到萬古霉素治療范圍的百分率。結(jié)果顯示,與傳統(tǒng)的劑量設(shè)置方法相比,決策樹算法更優(yōu)。
目前癲癇治療以抗癲癇藥物為主,常用的抗癲癇藥物如丙戊酸、卡馬西平、苯妥英鈉等都具有個(gè)體差異大、治療周期相對(duì)較長的特點(diǎn)[38]。按照臨床治療指南的建議,需對(duì)這類藥物進(jìn)行藥物濃度監(jiān)測,以提高療效、降低不良反應(yīng)[39]。
本課題組曾采用支持向量機(jī)技術(shù)對(duì)丙戊酸的血藥濃度進(jìn)行預(yù)測[40]。本課題組收集了206例患者共計(jì)271例樣本,分為訓(xùn)練集(n=190)和測試集(n=81),將血藥濃度和16個(gè)影響血藥濃度的因素一并納入考量,先基于支持向量機(jī)技術(shù)對(duì)訓(xùn)練集進(jìn)行訓(xùn)練并構(gòu)建預(yù)測模型,再用外部驗(yàn)證法將81個(gè)測試樣本的預(yù)測濃度值與實(shí)測值進(jìn)行對(duì)比。結(jié)果顯示,所建立的血藥濃度預(yù)測模型取得了良好的預(yù)測效果,預(yù)測值與實(shí)測值的相對(duì)誤差小于20%的樣本比例達(dá)85.18%,平均絕對(duì)誤差為9.98 mg/L,預(yù)測值與實(shí)測值的相關(guān)系數(shù)為0.788。這提示該模型準(zhǔn)確度較好、相對(duì)誤差較小,可為臨床制定個(gè)體化給藥方案提供參考。
拉莫三嗪是第二代抗癲癇藥物,其藥動(dòng)學(xué)變異大,導(dǎo)致患者用藥個(gè)體差異大,因此有必要進(jìn)行血藥濃度監(jiān)測和個(gè)體化用藥。Zhu等[41]采用機(jī)器學(xué)習(xí)算法預(yù)測了拉莫三嗪的穩(wěn)態(tài)谷濃度與劑量比值,其納入了1 141個(gè)血藥濃度監(jiān)測點(diǎn),將其中80%數(shù)據(jù)作為訓(xùn)練集用于模型構(gòu)建,剩余20%數(shù)據(jù)作為測試集用于模型測試,以平均絕對(duì)誤差為評(píng)價(jià)指標(biāo),對(duì)15個(gè)模型進(jìn)行了10倍交叉驗(yàn)證的優(yōu)化和評(píng)估。結(jié)果顯示,非線性模型優(yōu)于線性模型;非線性模型中樹外回歸算法性能良好、擬合模型最優(yōu),且經(jīng)驗(yàn)證,其可準(zhǔn)確預(yù)測拉莫三嗪的穩(wěn)態(tài)谷濃度與劑量比值。
近年來,面對(duì)臨床大樣本、多影響因素、非線性關(guān)聯(lián)的診療數(shù)據(jù),相比于傳統(tǒng)的基于群體藥動(dòng)學(xué)的方法,機(jī)器學(xué)習(xí)算法在處理高維數(shù)據(jù)方面展現(xiàn)出了強(qiáng)大的優(yōu)勢(shì),現(xiàn)已在免疫抑制劑、抗感染藥物和抗癲癇藥物等血藥濃度預(yù)測和給藥劑量預(yù)測領(lǐng)域取得了顯著的成績,在一定程度上提高了臨床個(gè)體化用藥水平,但仍存在一些局限性。
首先,機(jī)器學(xué)習(xí)構(gòu)建的模型不易解讀。傳統(tǒng)的統(tǒng)計(jì)學(xué)方法或基于群體藥動(dòng)學(xué)構(gòu)建的模型,對(duì)于輸入值和處理過程都有相對(duì)明確的關(guān)系。但目前絕大多數(shù)的機(jī)器學(xué)習(xí)算法具有自主學(xué)習(xí)能力,沒有明確的處理過程,常常被認(rèn)為是“暗箱”,從而造成結(jié)果不易解釋和難以理解?,F(xiàn)有研究應(yīng)用SHAP方法有助于模型結(jié)果的解釋,后續(xù)可利用人工智能技術(shù)將機(jī)器學(xué)習(xí)算法的實(shí)現(xiàn)過程更加“透明化”。
其次,機(jī)器學(xué)習(xí)需要的數(shù)據(jù)量大,其本質(zhì)和核心是通過算法使計(jì)算機(jī)從大量的數(shù)據(jù)中學(xué)習(xí)規(guī)律并形成相應(yīng)的模型,進(jìn)而對(duì)該模型進(jìn)行驗(yàn)證和不斷優(yōu)化。因此,機(jī)器學(xué)習(xí)得到的預(yù)測模型需要不斷使用大量數(shù)據(jù)進(jìn)行訓(xùn)練保證其有效。但目前相關(guān)研究所用的樣本量都不算大,且現(xiàn)有的醫(yī)療環(huán)境在數(shù)據(jù)共享方面還存在較大壁壘,導(dǎo)致預(yù)測模型的準(zhǔn)確率還有待進(jìn)一步提高。因此,今后的臨床數(shù)據(jù)應(yīng)盡量做到規(guī)范化、結(jié)構(gòu)化,使診療大數(shù)據(jù)能真正地被應(yīng)用于臨床AI分析。
再次,機(jī)器學(xué)習(xí)對(duì)計(jì)算機(jī)知識(shí)背景要求較高,但目前多數(shù)醫(yī)務(wù)工作者對(duì)該領(lǐng)域了解不多,使得其應(yīng)用受限;而擁有計(jì)算機(jī)知識(shí)背景的人員可能對(duì)醫(yī)學(xué)知識(shí)不太了解,導(dǎo)致其所建模型和預(yù)測結(jié)果讓臨床人員難以理解。隨著機(jī)器學(xué)習(xí)的快速發(fā)展,學(xué)科交叉的不斷深入,今后可推薦醫(yī)務(wù)工作者接受機(jī)器學(xué)習(xí)相關(guān)訓(xùn)練,從而能更好地分析、整合信息并在機(jī)器學(xué)習(xí)的輔助下作出更為科學(xué)的臨床決策。
總之,基于治療藥物監(jiān)測的個(gè)體化治療是臨床合理用藥的重要環(huán)節(jié),機(jī)器學(xué)習(xí)相比傳統(tǒng)方法能夠更精準(zhǔn)地預(yù)測血藥濃度和給藥劑量,提高臨床精準(zhǔn)用藥水平,減少不良反應(yīng)的發(fā)生。相信在未來的治療藥物監(jiān)測和個(gè)體化用藥實(shí)踐中,機(jī)器學(xué)習(xí)將發(fā)揮更大的作用,實(shí)現(xiàn)個(gè)體化治療決策的智能化。