葛小玲 尚于娟 徐 錦 曾 玫 王傳清 李 靜施 宇 王 一 胡子欣 徐 虹 張曉波
(1國(guó)家兒童醫(yī)學(xué)中心/復(fù)旦大學(xué)附屬兒科醫(yī)院統(tǒng)計(jì)和數(shù)據(jù)管理中心,2臨床檢驗(yàn)中心,3感染傳染科,4院內(nèi)感染控制與防保辦公室,7腎臟科,8呼吸科 上海 201102;5萬(wàn)達(dá)信息股份有限公司數(shù)據(jù)中心 上海 201112;6 復(fù)旦大學(xué)生命科學(xué)學(xué)院 上海 200433)
流行性感冒(流感)是由甲、乙、丙等分型流感病毒導(dǎo)致的急性上呼吸道傳染病,其中甲型和乙型病毒具有高度傳染性,容易造成大范圍甚至世界性的大流行[1]。流行病學(xué)研究顯示,近年來(lái)兒童占全部流感確診患者的比例>60%[2],<2歲易發(fā)生嚴(yán)重并發(fā)癥[3],且臨床癥狀并不典型,極易與普通感冒或急性呼吸道感染相混淆,早診斷、早治療對(duì)降低兒童流感危害、控制疾病進(jìn)程、防止并發(fā)癥具有重要意義。流感早期診斷途徑包括血常規(guī)、病毒核酸檢測(cè)、病毒抗原檢測(cè)等,通過(guò)鼻咽拭子檢測(cè)及血常規(guī)檢驗(yàn)是臨床最快捷、常用的方法。多項(xiàng)研究顯示,甲、乙流患者血常規(guī)數(shù)值差異明顯[4]。
在大數(shù)據(jù)時(shí)代,通過(guò)醫(yī)療大數(shù)據(jù)+ 人工智能(artificial intelligence,AI)可應(yīng)用于流感流行趨勢(shì)預(yù)測(cè)、疾病轉(zhuǎn)歸、輔助診斷等多個(gè)方面[5-7],所采用的研究數(shù)據(jù)包括但不局限于外源性天氣數(shù)據(jù)、互聯(lián)網(wǎng)搜索數(shù)據(jù)[5]、國(guó)家流感監(jiān)測(cè)數(shù)據(jù)[8]和電子病歷記錄(electronic medical record,EMR)等。在疾病輔助診斷領(lǐng)域,結(jié)合大數(shù)據(jù)量級(jí)的EMR 記錄和其他相關(guān)信息學(xué)習(xí)后,算法可在很短的時(shí)間內(nèi)完成復(fù)雜的分析任務(wù),并根據(jù)輸入信息反饋出最佳的分類(lèi)模式結(jié)果,輔助醫(yī)師提高患者診斷的準(zhǔn)確性和效率。Sauthier 等[9]通過(guò)機(jī)器學(xué)習(xí)算法、隨機(jī)森林機(jī)器學(xué)習(xí)算法和Logistic 回歸,預(yù)測(cè)了258 名小兒重癥流感患者的長(zhǎng)期急性低氧性呼吸衰竭,實(shí)現(xiàn)住院期間的早期確診;廣州婦兒醫(yī)院利用2016年到2017年7月的136萬(wàn)例EMR 數(shù)據(jù)開(kāi)發(fā)出用于兒科55 種疾病的AI診斷系統(tǒng),其中在31萬(wàn)余例原發(fā)性呼吸系統(tǒng)疾病中診斷流感的正確率達(dá)94%[10],但模型遷移性和臨床應(yīng)用價(jià)值仍待研究?,F(xiàn)階段鮮有將AI 技術(shù)專(zhuān)項(xiàng)用于兒童流感輔助診斷的研究。
本研究以2013年1月—2020年6月在上海單中心門(mén)診就診的數(shù)百萬(wàn)呼吸道感染性疾病患兒為研究對(duì)象,納入基本特征信息(包括年齡和性別、鼻咽拭子及血常規(guī)檢驗(yàn)數(shù)據(jù)),建立專(zhuān)項(xiàng)鑒別甲流、乙流感染陽(yáng)性的AI 輔助診斷模型,協(xié)助開(kāi)展傳染病門(mén)診診前預(yù)診。
數(shù)據(jù)來(lái)源考慮到醫(yī)院門(mén)診新舊信息系統(tǒng)更迭及過(guò)去門(mén)診數(shù)據(jù)存在完整性不足的問(wèn)題,本次分析從門(mén)診HIS/EMR 系統(tǒng)選取2013年1月—2020年6月間就診且具有血常規(guī)檢驗(yàn)記錄的呼吸道感染疾病門(mén)診患兒為研究對(duì)象。
診斷標(biāo)準(zhǔn)以病原體膠乳檢測(cè)(鼻咽拭子)結(jié)果作為甲流、乙流感染病例組納入標(biāo)準(zhǔn)。甲流病例組:甲流陽(yáng)性且乙流陰性;乙流病例組:乙流陽(yáng)性且甲流陰性;對(duì)照組:病原體膠乳檢測(cè)陰性或未做該項(xiàng)檢測(cè)。
圖1 研究對(duì)象納入流程Fig 1 The inclusion process of research objects
統(tǒng)計(jì)學(xué)分析對(duì)計(jì)量資料,即連續(xù)性連續(xù)型變量資料,使用±s進(jìn)行統(tǒng)計(jì)描述,兩組樣本間采用配對(duì)t檢驗(yàn)確定差異;對(duì)計(jì)數(shù)資料,即結(jié)果表現(xiàn)為屬性特征的資料使用頻數(shù)分析,采用χ2檢驗(yàn)確定差異,P<0.05 為差異有統(tǒng)計(jì)學(xué)意義;使用Python 軟件進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析。
模型構(gòu)建本研究分別采用邏輯回歸(Logistics regression,LR)模型和梯度提升決策樹(shù)(gradient boosted decision tree,GBDT)模型兩種機(jī)器學(xué)習(xí)算法針對(duì)甲流病例組、乙流病例組進(jìn)行調(diào)參、訓(xùn)練和測(cè)試,構(gòu)建輔助診斷模型。通過(guò)計(jì)算模型特征重要性,探索對(duì)疾病診斷具有重要價(jià)值的臨床指標(biāo)。
模型算法
LR 模型 LR 是一種在疾病預(yù)測(cè)研究中十分常用的廣義線性回歸分類(lèi)模型,通過(guò)輸入未知樣本的特征屬性,可計(jì)算出樣本屬于某一類(lèi)別的概率[11]。
GBDT 模型 GBDT 是機(jī)器學(xué)習(xí)算法中對(duì)真實(shí)分布擬合得最好的算法之一,通過(guò)設(shè)定閾值,大于閾值為正例,反之為負(fù)例,適用于分類(lèi)、回歸問(wèn)題,并能夠篩選特征,是目前醫(yī)學(xué)診斷研究中最常用的模型之一[12-13],模型構(gòu)建流程見(jiàn)圖2。
圖2 輔助診斷GBDT 模型構(gòu)建流程圖Fig 2 Flow chart of auxiliary diagnostic GBDT model construction
數(shù)據(jù)處理數(shù)據(jù)集成:不同時(shí)期數(shù)據(jù)庫(kù)結(jié)構(gòu)存在差異,采用門(mén)診號(hào)+日期模糊匹配。數(shù)據(jù)變換:將字符類(lèi)型變量轉(zhuǎn)換為模型可以識(shí)別的數(shù)值變量。缺失值處理:分別采用均值填充法和眾數(shù)填充法來(lái)處理連續(xù)型變量和類(lèi)別型變量缺失值。數(shù)據(jù)歸一化處理:為消除不同指標(biāo)之間的量綱影響,采用最大值-最小值標(biāo)準(zhǔn)化方法,將原始指標(biāo)縮放到0-1 區(qū)間內(nèi),使各指標(biāo)處于同一數(shù)量級(jí)。
特征選擇基于門(mén)診患者血常規(guī)檢驗(yàn)指標(biāo)實(shí)現(xiàn)對(duì)疾病的輔助診斷,選擇檢測(cè)率較高的血常規(guī)指標(biāo)作為模型特征。
樣本處理每一組模型病例組樣本和對(duì)照組取樣比例為1∶1。采用10 折交叉驗(yàn)證法,使用9 個(gè)子集的并集作為訓(xùn)練集,剩余1 個(gè)子集作為測(cè)試集,最終返回10 次測(cè)試結(jié)果的均值。
模型評(píng)價(jià)根據(jù)模型測(cè)試結(jié)果,采用精確率(查準(zhǔn)率)、召回率(查全率)、F1 值、ROC 曲線、AUC值和模型概率預(yù)測(cè)箱型圖多種指標(biāo)評(píng)估模型效果,以衡量模型的泛化能力,并對(duì)比兩種模型在分類(lèi)性能上的差異。AUC 越接近1.0 真實(shí)性越高。
一般情況2013年1月—2020年6月期間5503350例門(mén)診常見(jiàn)呼吸道感染疾病患者中,做過(guò)血常規(guī)檢驗(yàn)的共計(jì)3199113例,納入為本研究對(duì)象。其中做過(guò)病原體膠乳檢測(cè)(鼻咽拭子)的共303944例(9.5%),確診為流感陽(yáng)性共計(jì)63101例,單甲流感染陽(yáng)性38094例(60.37%),單乙流感染陽(yáng)性24792例(39.29%),甲乙流合并感染陽(yáng)性215例(0.34%)。患兒年齡分布顯示,甲流病例組和乙流病例組平均年齡分別為4.59歲和5.73歲,乙流患兒年齡相對(duì)較大;患兒性別分布顯示,甲流病例組和乙流病例組男女性別比分別為1.22∶1 和1.19∶1,男童發(fā)病率高于女童。研究對(duì)象中未做過(guò)鼻咽拭子檢測(cè)病例2895169例(90.5%),鼻咽拭子檢測(cè)結(jié)果為陰性240843例,將兩者合并作為對(duì)照組(3136012例)。
模型特征選擇患兒性別、年齡和血常規(guī)檢驗(yàn)完整率超過(guò)20% 的22 個(gè)指標(biāo)(表1)作為模型訓(xùn)練特征值。鑒于已有研究發(fā)現(xiàn)的中性粒細(xì)胞/淋巴細(xì)胞比值在不同分型流感患者中具有明顯差異[14-15],將其一同納入,共計(jì)25 個(gè)特征值。
表1 血常規(guī)各項(xiàng)指標(biāo)檢測(cè)情況Tab 1 The detection of various indexes in blood routine test
模型結(jié)果在模型構(gòu)建前,對(duì)病例組及對(duì)照組間納入的各類(lèi)指標(biāo)進(jìn)行統(tǒng)計(jì)檢驗(yàn)。除乙流病例組與對(duì)照組的嗜堿性粒細(xì)胞百分比之外,其他指標(biāo)的差異均有統(tǒng)計(jì)學(xué)意義。甲流、乙流病例組的血小板、嗜酸性粒細(xì)胞百分比、淋巴細(xì)胞百分比、白細(xì)胞、C 反應(yīng)蛋白、淋巴細(xì)胞絕對(duì)值、嗜酸性細(xì)胞計(jì)數(shù)顯著低于對(duì)照組,單核細(xì)胞百分比、中性粒細(xì)胞百分比、中性粒細(xì)胞/淋巴細(xì)胞比值顯著高于對(duì)照組(表2)。屬性類(lèi)特征中,病例組男童比例明顯高于女童(表3)。
表2 甲流/乙流與對(duì)照組計(jì)量特征統(tǒng)計(jì)檢驗(yàn)結(jié)果Tab 2 Statistical results of measurement data of Flu A/B and control group
表3 甲流/乙流與對(duì)照組屬性特征統(tǒng)計(jì)檢驗(yàn)結(jié)果Tab 3 Statistical results of attributive characteristics of Flu A/B and control group (n)
對(duì)于二分類(lèi)的模型,當(dāng)計(jì)算兩組數(shù)據(jù)量一致時(shí)可達(dá)到較佳的分類(lèi)效果,經(jīng)數(shù)據(jù)處理,在模型構(gòu)建時(shí)納入甲流病例組及對(duì)照組各38094例,乙流病例組及對(duì)照組各24792例,分別進(jìn)行甲流及乙流輔助診斷模型的訓(xùn)練和驗(yàn)證。
模型性能比較利用查準(zhǔn)率、查全率和F1 值等多種指標(biāo)評(píng)估模型效果(表4)。從ROC 曲線和模型概率箱型圖(圖3~4)可看出,兩類(lèi)算法均具有較好的性能,模型能夠比較準(zhǔn)確地從呼吸道感染性疾病患者人群中檢測(cè)出甲流、乙流陽(yáng)性,在實(shí)際應(yīng)用場(chǎng)景中,模型可發(fā)揮輔助診斷的作用。 相比于Logistics 模型,GBDT 模型的分類(lèi)性能更好(AUC=0.894,0.895,0.902),在鑒別乙流與非乙流陽(yáng)性時(shí)性能最佳(AUC=0.902),已接近醫(yī)師診斷水平。
圖3 Logistics 模型(左)及GBDT 模型(右)模型ROC 曲線圖Fig 3 ROC curves of Logistics model(left)and GBDT model(right)
表4 模型結(jié)果Tab 4 The model results
模型特征重要性通過(guò)計(jì)算模型特征重要性得出區(qū)分陽(yáng)性病例組及對(duì)照組的關(guān)鍵因素(圖5)。甲流輔助診斷GBDT 模型前5 個(gè)特征為年齡、單核細(xì)胞百分比、白細(xì)胞、淋巴細(xì)胞絕對(duì)值和C 反應(yīng)蛋白;乙流輔助診斷模型GBDT 模型前5 個(gè)特征為年齡、單核細(xì)胞百分比、嗜酸性細(xì)胞計(jì)數(shù)、白細(xì)胞和血小板。
圖5 甲流、乙流GBDT 模型特征重要性排序Fig 5 Sequence of feature importance of GBDT model for Flu A and Flu B
流行性感冒具有季節(jié)性流行和周期性爆發(fā)的特點(diǎn),兒童屬高危人群,其發(fā)病率及感染率最高。本次分析結(jié)果顯示,該單中心醫(yī)院歷年流感病例中,主要為甲型流感病例,乙流病例組患兒相對(duì)甲流病例組平均年齡更大。男性患兒約占比55%,發(fā)病率略高于女性,通過(guò)文獻(xiàn)檢索,證實(shí)與國(guó)內(nèi)近年來(lái)多項(xiàng)調(diào)查結(jié)果基本一致[16-17]。本文采用兩種模型進(jìn)行流感病例的輔助診斷實(shí)驗(yàn)并比較模型結(jié)果,其中GBDT 模型在鑒別乙流與非乙流陽(yáng)性時(shí)性能最佳,AUC 值高達(dá)0.902,已接近醫(yī)師診斷水平。LR模型因其形式簡(jiǎn)單、可解釋性好在前期得到廣泛應(yīng)用,但其在自動(dòng)發(fā)現(xiàn)有效的特征并組合特征方面不及GBDT 模型。另外,相比于LR 模型,GBDT 模型利用患兒特征,通過(guò)對(duì)二分類(lèi)問(wèn)題的回答來(lái)得到陽(yáng)性病例更符合臨床醫(yī)師的思維方式。
圖4 Logistics 模型(左)及GBDT 模型(右)模型概率箱型圖Fig 4 Model probability box diagram of Logistics model(left)and GBDT model(right)
經(jīng)特征重要性計(jì)算,血小板、白細(xì)胞、C 反應(yīng)蛋白、淋巴細(xì)胞絕對(duì)值、嗜酸性細(xì)胞計(jì)數(shù)、年齡、單核細(xì)胞百分比是本研究中可以判斷患兒是否感染甲流或乙流的重要特征,與對(duì)照組存在較為顯著的差異。這可能與不同病原體引起各類(lèi)血細(xì)胞敏感反應(yīng)不同,作為一種急性呼吸道傳染疾病,流感起病急、傳染性強(qiáng),通過(guò)血常規(guī)可與一般細(xì)菌性感染進(jìn)行區(qū)分。已有多項(xiàng)研究發(fā)現(xiàn),白細(xì)胞計(jì)數(shù)、中性粒細(xì)胞百分比等指標(biāo)在甲流及乙流患兒間比較差異均有統(tǒng)計(jì)學(xué)意義[2,18-19],甲流患兒白細(xì)胞計(jì)數(shù)及中性粒細(xì)胞升高更明顯[20]。此外,流感合并肺炎支原體感染患兒易發(fā)展為重癥病例,本研究中乙流病例組肺炎支原體陽(yáng)性率(21.18%)高于甲流組(16.93%),與國(guó)內(nèi)已有研究一致[21],提示我們?cè)谠\斷之余須重點(diǎn)關(guān)注流感合并IgM 陽(yáng)性、尤其是乙流患者后續(xù)轉(zhuǎn)化為重癥的可能性,其他呼吸道病原的臨床檢驗(yàn)由于檢驗(yàn)率未達(dá)到本研究納入標(biāo)準(zhǔn)而未被納入。本文的研究還存在一定的不足之處和局限性,感染性疾病在兒科發(fā)病率極高,感染原因包括但不限于各類(lèi)細(xì)菌、病毒、真菌、支原體、衣原體、寄生蟲(chóng)感染。此外,生理、藥物治療以及檢測(cè)相關(guān)因素也可能導(dǎo)致檢驗(yàn)結(jié)果異常[22]。本研究未對(duì)照實(shí)驗(yàn)室檢查結(jié)果對(duì)非流感病例感染原因進(jìn)行具體區(qū)分,有待進(jìn)一步完善和改進(jìn)。應(yīng)用血常規(guī)檢驗(yàn)進(jìn)行流感(甲流/乙流)的輔助診斷具有一定的可行性,然而后續(xù)在嘗試對(duì)兩者進(jìn)行鑒別區(qū)分時(shí)模型表現(xiàn)一般,單純以這25 個(gè)特征來(lái)區(qū)分甲流和乙流人群仍具有一定難度,未來(lái)將結(jié)合甲、乙流患兒臨床病歷及住院數(shù)據(jù)進(jìn)一步加強(qiáng)模型鑒別能力。
本文所研究的基于AI 的輔助診斷模型通過(guò)訓(xùn)練大量呼吸道感染性疾病患者血常規(guī)特征數(shù)據(jù),在實(shí)際應(yīng)用場(chǎng)景中能較為準(zhǔn)確地從呼吸道感染性疾病患者人群中檢測(cè)出“甲流感染陽(yáng)性”及“乙流感染陽(yáng)性”人群,且納入數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)單,可在其他醫(yī)療中心部署應(yīng)用,模型可遷移性高。該模型可幫助醫(yī)師判斷患者是否進(jìn)行病原體膠乳鼻咽拭子檢測(cè),協(xié)助開(kāi)展傳染病診前預(yù)檢,縮短就診流程,減少院內(nèi)交叉感染。
通過(guò)結(jié)合甲流、乙流患兒臨床病歷及住院數(shù)據(jù),可進(jìn)一步優(yōu)化模型診斷能力,為臨床輔助診斷提供可靠的決策支持,并基于人機(jī)診斷結(jié)果對(duì)比開(kāi)展隨機(jī)對(duì)照試驗(yàn),為模型診斷能力提供可循的依據(jù)。
作者貢獻(xiàn)聲明葛小玲 論文構(gòu)思、撰寫(xiě)和修訂。尚于娟 數(shù)據(jù)收集和保存,文獻(xiàn)調(diào)研,論文撰寫(xiě)。徐錦,曾玫,王傳清 監(jiān)督指導(dǎo),數(shù)據(jù)解釋。李靜 提供分析工具。施宇 數(shù)據(jù)統(tǒng)計(jì)和建模。王一,胡子欣 研究咨詢(xún),可行性分析。徐虹 獲取資助,研究設(shè)計(jì),論文修訂。張曉波 研究設(shè)計(jì),數(shù)據(jù)解釋?zhuān)撐男抻啞?/p>
利益沖突聲明所有作者均聲明不存在利益沖突。