王慧霞,張玉婷,朱曼輝
(蘇州大學(xué)理想眼科醫(yī)院斜視與小兒眼科1,病理科2,江蘇 蘇州 215000)
糖尿病視網(wǎng)膜病變(diabetic retinopathy,DR)是最常見且患病率較高的糖尿?。╠iabetic mellitus,DM)微血管并發(fā)癥之一,主要病理改變是視網(wǎng)膜血管閉塞性循環(huán)障礙[1]。DR 嚴(yán)重威脅著糖尿病患者的生存質(zhì)量,同時(shí)給社會(huì)帶來嚴(yán)重經(jīng)濟(jì)負(fù)擔(dān)。早期篩查防治DR,對(duì)于改善DM 患者遠(yuǎn)期預(yù)后至關(guān)重要[2]。近年來,國(guó)內(nèi)外學(xué)者基于醫(yī)院或社區(qū)的橫斷面或病例對(duì)照研究,利用廣義線性模型算法,建立了一系列預(yù)測(cè)DM 患者發(fā)生DR 的模型及列線圖,展現(xiàn)出較好的預(yù)判能力和臨床運(yùn)用效果[3,4]。廣義線性模型屬于機(jī)器學(xué)習(xí)中發(fā)展較早的統(tǒng)計(jì)學(xué)模型,而今機(jī)器學(xué)習(xí)飛速發(fā)展,算法不斷更新,在監(jiān)督學(xué)習(xí)中涌現(xiàn)出如支持向量機(jī)、決策樹、樸素貝葉斯、人工神經(jīng)網(wǎng)絡(luò)等算法[5]。算法的不斷更迭進(jìn)步,伴隨而來是對(duì)建模者專業(yè)知識(shí)不斷增長(zhǎng)的要求,這大大提高了臨床醫(yī)生利用機(jī)器學(xué)習(xí)算法的門檻。自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)可通過自動(dòng)化建模和調(diào)參程序,大大降低建模人員的工作門檻和負(fù)擔(dān)[6]。本研究采集本院患者一般資料及實(shí)驗(yàn)室檢查結(jié)果,利用H2O 運(yùn)算平臺(tái)推出的AutoML 算法建立預(yù)測(cè)模型,旨在為DM 人群的DR 篩查提供新的思路。
1.1 一般資料 選取2019 年1 月-2021 年1 月于蘇州大學(xué)理想眼科醫(yī)院就診患者電子病歷數(shù)據(jù),采用ICD-10 疾病分類標(biāo)準(zhǔn)進(jìn)行編碼。納入606 例DM 患者,根據(jù)眼底照相分為單純DM(DM 組)303 例及DM合并DR(DR 組)303 例。納入標(biāo)準(zhǔn):所有患者診斷均符合最新國(guó)內(nèi)臨床指南[1,2]。排除標(biāo)準(zhǔn):①其他原因?qū)е碌母哐?;②合? 型DM 急性并發(fā)癥;③妊娠及哺乳期女性;④合并顯著肝腎功能異常、嚴(yán)重的心腦血管疾病或惡性腫瘤等;⑤資料不全者。本研究已獲蘇州大學(xué)附屬理想眼科醫(yī)院倫理委員會(huì)批準(zhǔn)(批準(zhǔn)號(hào)SLER2018112),所有患者均簽署知情同意書。
1.2 臨床及實(shí)驗(yàn)室檢測(cè)
1.2.1 人體數(shù)據(jù)測(cè)量 測(cè)量并記錄納入人群的身高、體重、血壓(SBP/DBP)、臀圍和腰圍,并計(jì)算體質(zhì)量指數(shù)(BMI)和腰臀比(WHR)。采集患者既往病史、服藥史、煙酒史,并通過計(jì)算代謝當(dāng)量商(metabolic equivalent of task,MET)計(jì)算體力活動(dòng)量。
1.2.2 DR 檢查方法 視網(wǎng)膜檢查使用免散瞳眼底數(shù)碼照相機(jī)(型號(hào):TRC-NW300),由??萍紟熢跀z片暗室進(jìn)行。患者進(jìn)入暗室休息5 min,待視覺適應(yīng)后,由技師應(yīng)用免散瞳眼底數(shù)碼照相機(jī)進(jìn)行拍攝以黃斑為中心的視網(wǎng)膜彩色圖像,每只眼睛拍攝一張照片。照片由對(duì)此項(xiàng)研究盲法的眼科醫(yī)生進(jìn)行閱讀。
1.2.3 血清學(xué)檢測(cè) 獲取所有納入者空腹靜脈血10 ml。將收集的血樣統(tǒng)一離心,立刻上機(jī)檢測(cè)或儲(chǔ)存于-80 ℃冰箱待檢。血清生化分析采用Mindray 邁瑞800 全自動(dòng)生化分析儀。檢測(cè)項(xiàng)目包括:①糖代謝和胰島素功能相關(guān)指標(biāo):空腹血糖(FPG)、空腹胰島素(FINS)及糖化血紅蛋白(HbA1c),并計(jì)算穩(wěn)態(tài)模型胰島素抵抗指數(shù)(HOMA-IR);②肝酶指標(biāo):谷丙轉(zhuǎn)氨酶(ALT)、谷草轉(zhuǎn)氨酶(AST)及γ-谷氨酰轉(zhuǎn)肽酶(GGT);③脂質(zhì)代謝相關(guān)指標(biāo):三酰甘油(TG)、高密度脂蛋白膽固醇(HDL-C)及低密度脂蛋白膽固醇(LDL-C)。
1.3 評(píng)價(jià)方法 利用H2O 運(yùn)算平臺(tái)推出的AutoML算法建立針對(duì)DR 二分類結(jié)局的機(jī)器學(xué)習(xí)預(yù)測(cè)模型,產(chǎn)生相應(yīng)預(yù)測(cè)結(jié)果,據(jù)此繪制受試者工作特征(ROC)曲線并建立混淆矩陣,計(jì)算特異度、敏感度、準(zhǔn)確度及誤分類率,評(píng)價(jià)模型區(qū)分能力。
1.4 統(tǒng)計(jì)學(xué)方法 本研究建模及繪圖軟件包括:R(4.0.4 版)、H2O 包(H2O cluster 版本:h2o_3.32.1.7)、tableone 包(0.13.2 版本)及l(fā)ime 包(0.5.3 版本)。計(jì)量資料以(±s)或[M(P25,P75)]表示,組間比較采用Student'st檢驗(yàn)或Mann-WhitneyU檢驗(yàn)。計(jì)數(shù)資料采用[n(%)]表示,比較采用χ2檢驗(yàn)。為進(jìn)一步了解變量在模型中的重要性及分布情況,進(jìn)行可視化分析,包括Shapley Additive exPlanations(SHAP 分析)、Partial dependence(部分依賴)及LIME 可視化。雙側(cè)P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 兩組一般及臨床資料比較 DR 組糖尿病病程長(zhǎng)于DM 組,吸煙、飲酒、高血壓、脂肪肝比例、腰臀比、BMI 及收縮壓高于DM 組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05);DR 組 HDL -C 低 于 DM 組,F(xiàn)PG、FINS、HOMA-IR、HbA1c、ALT 和AST 均高于DM 組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見表1。
表1 兩組一般及臨床資料比較[±s,M(P25,P75)]
表1 兩組一般及臨床資料比較[±s,M(P25,P75)]
2.2 模型建立判斷DR 發(fā)病風(fēng)險(xiǎn) 將上述單因素分析中存在差異的變量納入AutoML 機(jī)器學(xué)習(xí)工作環(huán)境中,利用H2O 平臺(tái)進(jìn)行隨機(jī)分組、特征選擇、建模運(yùn)算及驗(yàn)證。將606 例DM 患者按照8∶2 比例隨機(jī)分組為Train 集(482 例)及Valid 集(124 例)。最佳模型為通用梯度回歸模型(generalized boosted regression model,GBM)。這是一種由多棵決策樹組成的迭代決策樹算法。該模型(基于Train 數(shù)據(jù)集的5 折交叉 驗(yàn) 證):Gini 值0.914,R2為0.679,LogLoss 為0.260。模型中各變量的重要性見表2。其中在最佳模型GBM 中,重要性排名前3 的變量(即對(duì)模型貢獻(xiàn)的排名)分別為空腹血糖、糖尿病病程及空腹胰島素,其占比均超過10%。
表2 最佳模型中各變量重要性排名
2.3 變量在模型中的作用 在最佳模型GBM 中,各變量的SHAP 特征圖繪制在圖1 中。重要性排名前3 的變量是空腹血糖、糖尿病病程及空腹胰島素。三者在結(jié)局二分類中的分布,體現(xiàn)其標(biāo)準(zhǔn)化數(shù)值與發(fā)病呈正相關(guān)趨勢(shì)。圖2 為L(zhǎng)IME 可視化,顯示是隨機(jī)抽取的8 個(gè)樣本(DM 組5 例,DR 組3 例),3 個(gè)重要變量對(duì)預(yù)測(cè)結(jié)果的重要性貢獻(xiàn)。圖3 顯示的3 個(gè)變量在模型中的部分依賴圖,可以看出三者與結(jié)果基本上呈現(xiàn)的是單調(diào)的上升趨勢(shì)。
圖1 最佳模型中各變量SHAP 特征
圖2 隨機(jī)樣本中變量重要性LIME 可視化
圖3 最佳模型中變量部分依賴圖
2.4 預(yù)測(cè)模型的區(qū)分能力 采用上述獲得的預(yù)測(cè)模型GBM 繪制預(yù)判DR 發(fā)病的ROC 曲線并建立混淆矩陣。在Train 數(shù)據(jù)集中,ROC 曲線下面積為0.942(95%CI:0.921~ 0.963)。利用混淆矩陣得到特異度為0.924,敏感度為0.959,準(zhǔn)確度為0.942,誤分類率為0.058。在Valid 數(shù)據(jù)集中,ROC 曲線下面積為0.831(95%CI:0.764~0.897)。利用混淆矩陣得到特異度為0.828,敏感度為0.833,準(zhǔn)確度為0.831,誤分類率為0.169,見表3。
表3 最佳預(yù)測(cè)模型GBM 在各個(gè)數(shù)據(jù)集中的區(qū)分能力
隨著機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的快速發(fā)展,選擇合適的模型并根據(jù)超參數(shù)不斷調(diào)整優(yōu)化模型,這一過程變得十分繁瑣且耗時(shí)。此外,它還對(duì)建模者的計(jì)算機(jī)知識(shí)提出了較高要求[5]。近幾年,各大科技公司陸續(xù)推出自動(dòng)化學(xué)習(xí)平臺(tái),如谷歌公司推出的Cloud AutoML、H2O 平臺(tái)的AutoML 等[6]。AutoML 可以自動(dòng)化完成機(jī)器學(xué)習(xí)的前期工作:包括數(shù)據(jù)準(zhǔn)備、編碼、功能選擇/提取以及工程化環(huán)境。同時(shí),在模型生成過程中,如模型算法選擇、優(yōu)化、迭代以及驗(yàn)證,AutoML 均可在少量代碼基礎(chǔ)上實(shí)現(xiàn)。
H2O AutoML 是H2O 平臺(tái)提供一種針對(duì)自動(dòng)化工作流程的算法,主要功能涵蓋:輕數(shù)據(jù)準(zhǔn)備、環(huán)境建立、模型選擇及優(yōu)化[6]。其中亮點(diǎn)包括:通過堆疊一組集成學(xué)習(xí)模型,自動(dòng)化迭代模型。當(dāng)前版本H2O AutoML 可建立并交叉驗(yàn)證以下模型:廣義線性模型、隨機(jī)森林、極隨機(jī)森林、梯度提升機(jī)隨機(jī)網(wǎng)格、XGBoosts、深神經(jīng)網(wǎng)隨機(jī)網(wǎng)格以及相關(guān)的集成學(xué)習(xí)。H2O AutoML 的一大特點(diǎn)就是組合堆疊多個(gè)集成學(xué)習(xí)算法,以獲得比從單個(gè)成分學(xué)習(xí)算法更好的預(yù)測(cè)性能,廣泛運(yùn)用在監(jiān)督學(xué)習(xí)中。許多流行的現(xiàn)代機(jī)器學(xué)習(xí)算法實(shí)際上都是集成學(xué)習(xí)。例如,隨機(jī)森林和梯度提升機(jī)都是通過組合弱學(xué)習(xí)算法(例如決策樹)并形成單一、強(qiáng)學(xué)習(xí)的集成學(xué)習(xí)法。
近年來,隨著人民群眾飲食結(jié)構(gòu)改變、人口老齡化等因素的影響,我國(guó)糖尿病患病率大幅增加。流行病調(diào)查顯示[7],我國(guó)大陸糖尿病患者中合并視網(wǎng)膜病變約占23%。由于DR 的早期隱蔽性、慢性進(jìn)展性、不可逆性等特點(diǎn),目前早期篩查工作仍然面臨諸多困難,選擇基于臨床資料、實(shí)驗(yàn)室檢查的無創(chuàng)性篩查工具是DR 的防治工作重點(diǎn)[8]。DR 的發(fā)生發(fā)展是一個(gè)較復(fù)雜的病理生理過程,具體的機(jī)制尚不明確[9]。目前觀點(diǎn)認(rèn)為[10],DM 患者機(jī)體能量代謝障礙,特別是胰島素抵抗和糖脂代謝紊亂可誘發(fā)視網(wǎng)膜病變。DR 在病程10 年以上的DM 患者中患病率高達(dá)80%,是全球中老年人視力喪失的首要病因[11]?;颊唠S著DM 病程的延長(zhǎng),一系列機(jī)體能量代謝功能紊亂逐漸發(fā)展并加重,其中如高血糖或血糖波動(dòng)大、脂類代謝紊亂等都被證實(shí)是DR 的獨(dú)立危險(xiǎn)因素。
及時(shí)的DR 篩查對(duì)于高危病例至關(guān)重要,通過全面的眼科檢查與干預(yù),來避免永久性的視力喪失。在過去幾年中,各個(gè)國(guó)家通過大型流行病學(xué)研究提出了綜合各類風(fēng)險(xiǎn)因素的個(gè)性化篩查方案,體現(xiàn)了較好的成本-效益比。DCCT 是北美地區(qū)一項(xiàng)開展了近40 年的大型隊(duì)列研究,該研究提示長(zhǎng)病程、高HbA1c、高血壓等是DR 發(fā)生發(fā)展的獨(dú)立危險(xiǎn)因素,為基于社區(qū)的篩查提供標(biāo)記工具[12]。有研究[4]報(bào)道了一項(xiàng)跨我國(guó)多省份的橫斷面研究,發(fā)現(xiàn)DM 發(fā)病早、病程久、高血壓、高血糖及高HbA1c 是DR 的獨(dú)立危險(xiǎn)因素;該團(tuán)隊(duì)構(gòu)建了列線圖模型,為DR 早篩早診提供幫助?;谌斯ぶ悄艿男录夹g(shù),包括移動(dòng)設(shè)備檢測(cè)系統(tǒng)、數(shù)字圖像算法等,將在未來改變篩查模式,再次改善成本-效益比[13,14]。
本研究收集單純DM 患者和合并DR 的DM 患者臨床資料及實(shí)驗(yàn)室結(jié)果,利用H2O 平臺(tái)的AutoML算法進(jìn)行自動(dòng)化的變量篩選,發(fā)現(xiàn)高血糖、DM 病程、高空腹胰島素等是該地區(qū)DR 發(fā)生的重要獨(dú)立危險(xiǎn)因素,這與國(guó)內(nèi)外研究相似[3,4,12]。采用上述因素建立的GBM 預(yù)測(cè)模型判斷DR 發(fā)病,顯示出較好區(qū)分能力以及均衡的敏感度和特異度,優(yōu)于基于線性模型算法的相關(guān)報(bào)道[3,15]。本研究中的機(jī)器學(xué)習(xí)模型在訓(xùn)練集和測(cè)試集中都展現(xiàn)了良好的特異性,作為一個(gè)初篩工具,可以用于社區(qū)高危人群的篩選,大大降低眼科衛(wèi)生機(jī)構(gòu)的工作壓力,避免醫(yī)療資源的浪費(fèi)[16-18]。
本研究報(bào)道了利用AutoML 算法處理DM 患者數(shù)據(jù),為今后的DR 篩查提供參考和思路。該方法優(yōu)勢(shì)在于:一方面相比較傳統(tǒng)的邏輯回歸等統(tǒng)計(jì)模型,提高了模型準(zhǔn)確率;另外,使用自動(dòng)化算法,大大降低了醫(yī)務(wù)人員利用人工智能技術(shù)的門檻,為今后AutoML 在臨床科研領(lǐng)域的應(yīng)用提供參考[19,20]。本研究樣本是基于我院的單中心數(shù)據(jù),利用隨機(jī)分組和交叉驗(yàn)證,具有較高的參考價(jià)值。但仍需多中心的外部驗(yàn)證進(jìn)一步評(píng)估該模型在DR 診斷中的作用。
綜上所述,本次利用AutoML 算法建立的通用梯度回歸DR 患病預(yù)測(cè)模型可用于DM 人群中DR的篩查。