賴麗莎,鄧任堂,張露,揭育幫,丘文峰,徐軍發(fā),付文金(1.廣東醫(yī)科大學 a.檢驗醫(yī)學研究所,b.生物醫(yī)學工程學院,廣東東莞 53808;.廣東醫(yī)科大學附屬厚街醫(yī)院檢驗科,廣東東莞 53945)
泌尿系感染(urinary tract infection,UTI)是泌尿系受到細菌侵襲而出現(xiàn)的炎癥,嚴重影響患者的生活質量,一旦擴散,將造成全身性感染[1]。目前,明確UTI病原菌的金標準是進行尿培養(yǎng)[2]。然而,尿培養(yǎng)所需時間長,可能耽誤感染患者的及時治療。因此,尋找一種快速可靠且易于分辨UTI病原菌的方法迫在眉睫。
隨著人工智能技術的推廣,深度學習越來越普遍應用于醫(yī)學[3-5]。深度學習是機器學習的分支,是一種以人工神經(jīng)網(wǎng)絡為計算架構,對數(shù)據(jù)進行表征學習的方法。卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)作為深度學習最有效的神經(jīng)網(wǎng)絡方法,已在醫(yī)學顯微圖像分類中有較多應用,例如:細菌性陰道病圖像分類[6],糖尿病眼底視網(wǎng)膜病變圖像分型[7],乳腺活檢樣本組織學切片中的癌癥標志物檢測[8-9],血細胞形態(tài)識別[10-12]等。然而將深度學習技術與UTI革蘭染色圖像分析相結合,判斷中段尿沉渣中的病原菌,鮮有研究。本研究通過構建快速診斷模型EKNet,對引起UTI常見的革蘭陰性桿菌大腸埃希菌和肺炎克雷伯菌[13]進行分類,以實現(xiàn)對UTI病原菌的快速診斷。
1.1一般資料 選取2020年5月至12月在廣東醫(yī)科大學附屬厚街醫(yī)院確診UTI(未用抗菌藥物)病原菌為大腸埃希菌、肺炎克雷伯菌患者的中段尿標本,其中大腸埃希菌368例,肺炎克雷伯菌292例,采用ARIS 2X微生物系統(tǒng)鑒定病原菌。
1.2儀器與試劑 革蘭染色液(珠海貝索公司),BX51顯微鏡(奧林巴斯公司),TK-C9501EC高清彩色攝像機(日本JVC公司),ARIS 2X微生物鑒定系統(tǒng)(美國賽默飛公司),電熱恒溫培養(yǎng)箱(德國BINDER公司)。
1.3方法
1.3.1樣本收集、處理與圖像采集 留取UTI患者清潔中段尿5 mL,離心后吸取尿沉渣涂片,自然干燥,革蘭染色。收集經(jīng)ARIS 2X微生物系統(tǒng)鑒定病原菌為大腸埃希菌或肺炎克雷伯菌的尿沉渣標本涂片,采集細菌顯微圖像。見圖1。為保持數(shù)據(jù)來源的多樣性和真實性,每份標本僅選取1張圖像。顯微圖像于正常臨床檢查過程中收集,為達到真實性,沒有對深度學習的顯微圖像的生物豐度或染色質量進行預篩選,圖像在染色強度、染色偽影和樣本分布方面具有典型的可變性。
圖1 顯微圖像采集步驟(革蘭染色)
1.3.2顯微圖像數(shù)據(jù)集的劃分 為驗證學習模型的訓練有效性,將760像素×570像素的顯微圖像數(shù)據(jù)按照8∶1∶1的比例隨機劃分為訓練集、驗證集和測試集3個部分。訓練集用于訓練模型,調整參數(shù);驗證集用于檢驗模型的效果;測試集用于檢驗最優(yōu)模型的性能和分類能力。見表1。
表1 各類樣本圖像數(shù)目
1.3.3細菌顯微圖像的預處理 為減少細菌圖像特征之間的相關性,同時保證模型的泛化能力,對原始圖像進行歸一化,對訓練集圖像以隨機水平翻轉的方式進行增強操作,將數(shù)據(jù)增強后的細菌圖像每批8張圖片進行歸一化后傳入網(wǎng)絡。
1.3.4基于深度學習方法的網(wǎng)絡訓練 細菌圖像分類的深度學習方法是一種改進的輕量級殘差網(wǎng)絡,暫命名為EKNet(取Eco和Kpn英文縮寫的首字母),網(wǎng)絡參數(shù)個數(shù)為2 791 826,訓練優(yōu)化器使用Adam,學習率為0.000 1,將預處理后的細菌圖像輸入殘差網(wǎng)絡模型,計算交叉熵損失,通過反向傳播算法進行參數(shù)優(yōu)化,獲得預訓練模型EKNet。使用基于PyTorch的開源深度學習框架LisaDPF(開源地址:https://gitee.com/summit/lisadpf),可以讓使用者針對應用場景快速生成訓練模型。該模型基于殘差網(wǎng)絡ResNet18進行改進,網(wǎng)絡由殘差前的卷積層(conv)、池化層(pool)、殘差塊層(Bottleneck)和全連接層(fc)組成,EKNet的網(wǎng)絡結構見圖2。
注:網(wǎng)絡輸入顯微細菌圖像,輸出所屬細菌分類的概率??蛑械臄?shù)字代表每個模塊輸出的通道數(shù)。conv,卷積層;pool,最大池化層;bottleneck,殘差塊層;avg pool,平均池化層;fc,全連接層。
1.3.5模型比對 以圖像分類常用的ResNet50模型和AlexNet模型作為對照,對表1訓練集和驗證集的顯微圖像進行迭代訓練和驗證,并對模型進行比對,評估EKNet模型的實用性。
1.3.6臨床測試 為評估EKNet模型的性能,使用UTI患者尿沉渣顯微圖像作測試集(病原菌為未知的革蘭陰性桿菌)對模型進行測試,輸出大腸埃希菌和肺炎克雷伯菌2種細菌類別中的每一種的相對概率,以概率高的細菌作為測試集的輸出結果,測試集的正確性以尿培養(yǎng)的結果作為評判。通過對測試集的準確性進行量化,初步評估模型的泛化能力。
2.1深度學習模型的建立 本研究模型在殘差網(wǎng)絡ResNet18基礎上進行改進。與ResNet網(wǎng)絡模型相比,當前EKNet 4個殘差塊層的通道數(shù)均為ResNet18的一半,在不降低精度的同時,EKNet模型的參數(shù)量大幅度減少,以降低模型的復雜度,提高其泛化性,并減少推理時間。該模型測試單個樣本的平均用時是0.165 s,優(yōu)于ResNet模型的0.38 s和AlexNet模型的0.66 s。使用不同的模型對表1訓練集和驗證集的顯微圖像進行迭代訓練和驗證,結果表明,EKNet模型能對2種不同的細菌進行精確的分類。EKNet模型實驗結果的驗證集準確率達到98.8%,優(yōu)于ResNet50模型的96.4%和AlexNet模型的78.6%。見表2。EKNet模型的訓練損失和驗證損失均能保持一致下降,表明訓練過程無過擬合跡象,見圖3A。相對于EKNet模型,ResNet50模型的訓練集與驗證集的損失函數(shù)在縱向存在一定距離,即存在一定的過擬合現(xiàn)象,見圖3B。與EKNet模型相比,AlexNet模型的訓練無法正常收斂,存在明顯過擬合現(xiàn)象,見圖3C。
表2 不同模型的訓練結果對比
2.2臨床測試結果 104例測試集包含大腸埃希菌56例,肺炎克雷伯菌48例,輸出結果與尿培養(yǎng)結果完全吻合,正確率為100%。該模型測試樣本的平均用時為0.165 s。
注:A,EKNet模型;B,ResNet50模型;C,AlexNet模型。
UTI是常見的感染性疾病,革蘭染色法能在較短時間內對感染的細菌進行識別[14],但革蘭染色結果只能提供細菌形態(tài)學依據(jù),不能定位病原學種類。本研究選擇使用CNN,是因為其在圖像分析任務中具有出色的能力,除圖像采集之外無需人工干預。本研究擬建立EKNet模型對大腸埃希菌和肺炎克雷伯菌這2種細菌圖像進行快速判讀分析,快速可靠地分辨UTI病原菌,為臨床早期診斷提供重要的指導意義。
ResNet18是針對ImageNet自然場景數(shù)據(jù)集的分類,由于細菌顯微圖像與通過攝像機采集的自然場景圖像在采集方式、數(shù)據(jù)源上不一致,使用原模型對細菌進行分類可能會失效,而且網(wǎng)絡模型深度增加容易出現(xiàn)參數(shù)量過多、過擬合以及難以訓練等問題[15]。因此,本研究在殘差網(wǎng)絡ResNet18基礎上進行改進:引入殘差塊、進行數(shù)據(jù)增強和歸一化。引入的殘差塊有利于網(wǎng)絡在梯度下降時的快速收斂,提高模型的表達能力;數(shù)據(jù)增強能有效地緩解訓練數(shù)據(jù)不足導致的深度學習模型過擬合,進一步提高模型的精度和泛化能力;歸一化處理能消除采集數(shù)據(jù)過程中存在的噪音,使采集的數(shù)據(jù)統(tǒng)一到一個特征維度,有利于網(wǎng)絡訓練在反向傳播期間更好地收斂。與ResNet18網(wǎng)絡模型相比,EKNet模型的特征通道數(shù)量減少,通過減少模型參數(shù)以降低模型的復雜度,對圖像的識別準確率達98.8%。在臨床測試中,EKNet模型的輸出結果與尿培養(yǎng)結果完全吻合,顯示該模型具有較好的泛化能力,在大腸埃希菌和肺炎克雷伯菌這2種細菌之間具有強大的區(qū)分能力。由此可見,本研究構建的EKNet模型實現(xiàn)了對泌尿系統(tǒng)感染常見細菌的快速診斷。
本研究也存在一定的局限性。該模型目前僅包含大腸埃希菌和肺炎克雷伯菌2種病原體,缺乏抗菌藥物作用下的細菌L型和其他革蘭陰性桿菌。課題組正在添加樣本的種類與數(shù)量,以期區(qū)分更多不同類別的細菌。我們相信,提供深度學習圖像分類的結果,可以為微生物的診斷提供廣闊的前景。
綜上所述,本研究成功構建的大腸埃希菌和肺炎克雷伯菌的圖像診斷模型,具有識別準確率高、速度快、操作簡便、泛化強等優(yōu)點,為臨床UTI的快速診斷提供參考。