屈展 劉凱
(1.四川大學(xué)華西醫(yī)院心內(nèi)科,四川 成都610041;2.四川大學(xué)華西臨床醫(yī)學(xué)院,四川 成都610041)
高血壓的患病率隨人口老齡化而增加,每年導(dǎo)致全球數(shù)百萬人過早死亡。高血壓知曉率、治療率和達(dá)標(biāo)率不足是中國高血壓管理的主要障礙。人工智能(artificial intelligence,AI)的出現(xiàn)揭示了高血壓管理的新策略,如基于遠(yuǎn)程醫(yī)療和大數(shù)據(jù)驅(qū)動的數(shù)字醫(yī)療。大量證據(jù)表明AI在高血壓管理中的應(yīng)用是可行的,可預(yù)見的趨勢是將各種可穿戴傳感器和智能手機(jī)整合實(shí)現(xiàn)連續(xù)血壓監(jiān)測簡便化,同時AI模型算法可進(jìn)一步驗(yàn)證新的預(yù)測和預(yù)后工具,驗(yàn)證有效后即可運(yùn)用于臨床實(shí)踐,這將極大地便利高血壓患者的臨床決策與預(yù)后管理,大大提高其生活質(zhì)量。這些技術(shù)的進(jìn)步使慢性病管理朝著數(shù)字化管理的未來模式邁出了一大步?,F(xiàn)就近期高血壓疾病診療中AI的應(yīng)用進(jìn)行綜述。
AI是對人的意識和思維信息過程的模擬并與機(jī)器結(jié)合,使機(jī)器能以人類智能相似的方式作出反應(yīng),機(jī)器學(xué)習(xí)(machine learning,ML))和深度學(xué)習(xí)(deep learning,DL)是AI的兩種常見子類型。近年來ML在心血管醫(yī)學(xué)中的研究有所增長,但與ML相比,DL更新、更復(fù)雜,具有不同的優(yōu)勢和局限性[1]。
ML算法模型通過研究已給定的訓(xùn)練數(shù)據(jù)集與變量之間的機(jī)制和關(guān)聯(lián)進(jìn)行“自我學(xué)習(xí)”,完成學(xué)習(xí)后可對新出現(xiàn)的數(shù)據(jù)集進(jìn)行預(yù)測分析。ML與傳統(tǒng)統(tǒng)計(jì)(如多變量分析)用于不同的目的。后者傾向于強(qiáng)調(diào)推理,即基于樣本得出關(guān)于總體的結(jié)論,而ML則強(qiáng)調(diào)預(yù)測和決策,為了進(jìn)行預(yù)測分析,ML需大量數(shù)據(jù)用于訓(xùn)練和測試。ML可大致分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)是一種有明確目的的訓(xùn)練方式(如預(yù)測高血壓卒中發(fā)生),而無監(jiān)督學(xué)習(xí)是無明確目的的訓(xùn)練方式(如發(fā)展為高血壓的危險(xiǎn)因素)[2]。依賴于數(shù)據(jù)建模和數(shù)據(jù)質(zhì)量的不同,多種ML技術(shù)可使用,如判別分析、k最近鄰域法、支持向量機(jī)、決策樹和樸素貝葉斯法等。
DL也叫深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),用于學(xué)習(xí)樣本數(shù)據(jù)(文字、圖像和聲音)的內(nèi)在規(guī)律和表示層次,與ML算法相比,在圖像和聲音分析方面發(fā)展迅速[2]。包括深度神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)。鑒于電子健康記錄數(shù)據(jù)庫、心血管成像和來自可穿戴技術(shù)的可用數(shù)據(jù)的增加,DL分析大量數(shù)據(jù)和預(yù)測不良結(jié)果或隱藏表型的能力對于精準(zhǔn)心血管醫(yī)學(xué)的發(fā)展很有希望。然而,在醫(yī)學(xué)中使用DL確實(shí)存在重大挑戰(zhàn)。首先,DL因其“黑盒”方法而廣為人知,這意味著由于DL設(shè)計(jì)的復(fù)雜性和缺乏標(biāo)準(zhǔn)化,DL的結(jié)果可能不容易解釋。其次,使用多層神經(jīng)網(wǎng)絡(luò),非線性分析數(shù)據(jù)集中的各種變量可能會導(dǎo)致過度擬合,從而導(dǎo)致結(jié)果的泛化性降低,可通過提供足夠數(shù)量的訓(xùn)練數(shù)據(jù)集、優(yōu)化隱藏層數(shù)和Dropout技術(shù)來改善這種情況[3-6]。
在醫(yī)療科研中,AI工具既能用于高血壓患者的預(yù)測、診斷以及治療方案的選擇,還可探索復(fù)雜數(shù)據(jù)集之間有意義的關(guān)系,以實(shí)現(xiàn)個性化治療和護(hù)理。AI算法有可能對未來高血壓管理是有益的,但值得警惕的是,AI的這種非線性復(fù)雜算法還未完全成熟且未經(jīng)過大規(guī)模驗(yàn)證,尚未為臨床實(shí)踐作好準(zhǔn)備。
Huang等[14]對中國農(nóng)村地區(qū)3 054例35歲受試者利用傳統(tǒng)邏輯回歸模型和ANN模型預(yù)測高血壓發(fā)生作比較,ANN構(gòu)建的預(yù)測模型比傳統(tǒng)邏輯回歸模型更精確,曲線下面積(area under the curve,AUC)為0.9。眾多研究者[15-16]發(fā)現(xiàn)當(dāng)納入遺傳學(xué)基因數(shù)據(jù)后,采用支持向量機(jī)算法的ML通過整合環(huán)境和遺傳因素能提高預(yù)測高血壓發(fā)生的準(zhǔn)確性。AI也在大型人群隊(duì)列研究中進(jìn)行了預(yù)測高血壓的應(yīng)用,Ye等[17]使用k最近鄰域法的ML分析電子健康記錄數(shù)據(jù)(年齡、性別、種族和基礎(chǔ)疾病等),823 627例受試者數(shù)據(jù)作為回顧性隊(duì)列預(yù)測1年高血壓事件發(fā)生風(fēng)險(xiǎn),AUC為0.917;680 810例受試者作為前瞻性驗(yàn)證隊(duì)列預(yù)測高血壓,AUC為0.870;2型糖尿病、血脂異常、心血管疾病、精神疾病、用藥和社會經(jīng)濟(jì)決定因素被認(rèn)為與原發(fā)性高血壓相關(guān)。另一項(xiàng)針對18 258例日本人群受試者體檢數(shù)據(jù)的研究[18]表明,ML可通過使用人口統(tǒng)計(jì)數(shù)據(jù)、腰圍、血壓、血常規(guī)檢查、基礎(chǔ)病史、吸煙和飲酒情況來預(yù)測高血壓的發(fā)生,AUC為0.877。Sakr等[19]使用ML分析運(yùn)動跑步機(jī)壓力測試數(shù)據(jù),研究比較六種ML技術(shù)LogitBoost 、貝葉斯網(wǎng)絡(luò)分類器、局部加權(quán)樸素貝葉斯、ANN、支持向量機(jī)和隨機(jī)森林,發(fā)現(xiàn)隨機(jī)森林模式(運(yùn)動代謝當(dāng)量、靜息和峰值血壓)預(yù)測高血壓事件更準(zhǔn)確,AUC為0.93。這些研究提示AI有可能利用體檢數(shù)據(jù)用于預(yù)測高血壓發(fā)生的風(fēng)險(xiǎn),通過早期干預(yù)來預(yù)防或延緩高血壓的發(fā)展。
AI在高血壓管理中的應(yīng)用主要涉及心血管疾病風(fēng)險(xiǎn)評估、最佳血壓治療目標(biāo)、高血壓控制不佳導(dǎo)致不良事件發(fā)生風(fēng)險(xiǎn)。利用電子健康檔案中提取的數(shù)據(jù)包括:人口統(tǒng)計(jì)數(shù)據(jù)、體重指數(shù)、血壓、合并癥和血清肌酐、鉀、肌鈣蛋白和腦鈉肽水平。Sun等[20]使用ML算法開發(fā)了一個風(fēng)險(xiǎn)預(yù)測模型,該模型可準(zhǔn)確預(yù)測1 692例患者血壓控制不佳的風(fēng)險(xiǎn)和時間,準(zhǔn)確率為77.3%。Mohammadi等[21]使用ML分析人口統(tǒng)計(jì)數(shù)據(jù)、生命體征、常規(guī)血液和尿液實(shí)驗(yàn)室數(shù)據(jù),可預(yù)測高血壓患者3個月內(nèi)血壓不達(dá)標(biāo)風(fēng)險(xiǎn),AUC為0.719。Lacson等[22]使用ML和隨機(jī)森林算法分析SPRINT的數(shù)據(jù),ML篩選出包括尿白蛋白/肌酐比值、估算的腎小球?yàn)V過率、年齡、血清肌酐、膽固醇、小波變換的收縮壓信號、高密度脂蛋白、收縮壓的第90百分位和甘油三酯水平預(yù)測心血管相關(guān)結(jié)果,AUC為0.71。Wu等[23]使用ML方法構(gòu)建一個包括左心房內(nèi)徑、高密度脂蛋白膽固醇、內(nèi)皮素-1、右臂舒張壓、右腿收縮壓、左腿收縮壓、右腿舒張壓、左臂收縮壓、夜間平均動脈血氧飽和度、既往最高收縮壓和尿素等11個臨床變量模型預(yù)測終末期腎病發(fā)生率和全因死亡率,AUC為0.76(95%CI0.66~0.85)。相比經(jīng)典的心血管事件評分模型,AI的準(zhǔn)確性還需提高。
為了解不同人群對不同降壓藥物的敏感性差異,Chunyu等[24]應(yīng)用數(shù)據(jù)挖掘方法,通過比較五種常用藥物(厄貝沙坦、美托洛爾、非洛地平、氨氯地平和左旋氨氯地平)降壓達(dá)標(biāo)和不達(dá)標(biāo)的病例,獲得預(yù)測治療反應(yīng)的臨床特征譜,然后基于ML的結(jié)果來實(shí)現(xiàn)可視化的相對權(quán)重矩陣。在所有生物標(biāo)志物中,無論藥物類型和類別如何,血清肌酐都是最重要的指標(biāo),而空腹血糖水平是鈣通道阻滯劑有效性的第二重要指標(biāo)[24]。Duan等[25]使用X-learner方法構(gòu)建強(qiáng)化血壓治療預(yù)測個體治療效果的模型,同時檢驗(yàn)該方法與傳統(tǒng)邏輯回歸法預(yù)測3年心血管事件風(fēng)險(xiǎn)優(yōu)劣。結(jié)果發(fā)現(xiàn)邏輯回歸的校準(zhǔn)更差,它高估了強(qiáng)化治療導(dǎo)致的心血管事件絕對風(fēng)險(xiǎn)降低(absolute risk reduction,ARR),預(yù)測和觀察到的ARR之間的斜率為0.73(95%CI0.30~1.14),而 X-learner的ARR為1.06 (95%CI0.74~1.32),理想情況下為1。使用邏輯回歸預(yù)測的ARR通常與基線預(yù)測心血管風(fēng)險(xiǎn)成正比,而X-learner觀察到個體治療效果通常與基線風(fēng)險(xiǎn)不成比例。ML方法可改善從臨床試驗(yàn)數(shù)據(jù)中對個體化治療效果估計(jì)的區(qū)分和校準(zhǔn)[25]。Aziz等[26]在藥物依從性評估方面,使用ANN、隨機(jī)森林和支持向量回歸法,對160例高血壓受試者的數(shù)據(jù)進(jìn)行了檢查和預(yù)測依從性評分,影響因素包括婚姻狀況、教育程度、職業(yè)、種族、宗教、月收入和過量用藥,支持向量回歸法準(zhǔn)確性最高。
盡管目前的AI研究仍處于早期階段,未來AI引導(dǎo)的高血壓研究允許研究人員通過將ML或DL應(yīng)用于具有多模式輸入的大數(shù)據(jù),來探索導(dǎo)致高血壓發(fā)病機(jī)制和病理生理學(xué)的新風(fēng)險(xiǎn)因素,聯(lián)合可穿戴設(shè)備提供高血壓高效個性化的診斷管理,最終進(jìn)一步降低高血壓及其并發(fā)癥的發(fā)生率。