尚智偉,夏麗曄,李晶晶
臨床常見(jiàn)的紅斑鱗屑性疾病包括銀屑病(psoriasis)、副銀屑病(parapsoriasis)、扁平苔蘚(lichen planus)、玫瑰糠疹(pityriasis rosea)、多形紅斑(erythema multiforme)等,此類疾病影響患者容貌外觀,且表現(xiàn)相似,不易鑒別,尤其是對(duì)于基層醫(yī)院皮膚科醫(yī)生以及全科醫(yī)生來(lái)說(shuō),診斷和鑒別這些疾病存在一定的困難。目前人工智能(artificial intelligence,AI)已逐漸運(yùn)用于皮膚科領(lǐng)域,如皮膚病的輔助診斷、治療方案制訂及療效評(píng)估等方面[1-3]。其中應(yīng)用最多的是通過(guò)皮損圖像、組織生長(zhǎng)方式、組織形態(tài)、局部顏色、病理診斷等分析皮膚良惡性腫瘤,并進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)[4-5],而紅斑鱗屑性疾病的智能輔助診斷未見(jiàn)報(bào)道。因此本課題組對(duì)5種常見(jiàn)紅斑鱗屑性疾病進(jìn)行了AI診斷模型的初步建立和評(píng)價(jià),現(xiàn)報(bào)告如下。
1.1圖像數(shù)據(jù)的采集 1 600張手機(jī)圖像數(shù)據(jù)(圖像分辨率800~4 800萬(wàn)像素不等)來(lái)源于2017年9月—2022年9月河南科技大學(xué)第一附屬醫(yī)院皮膚科符合銀屑病、副銀屑病、扁平苔蘚、玫瑰糠疹、多形紅斑診斷標(biāo)準(zhǔn)[6]的患者(由于均為常見(jiàn)疾病,因此5種疾病大部分通過(guò)臨床表現(xiàn)診斷,通過(guò)病理學(xué)診斷的病例僅為10%)。其中銀屑病400張,副銀屑病、扁平苔蘚、玫瑰糠疹、多形紅斑各300張。每種疾病圖像數(shù)據(jù)中的80%作為訓(xùn)練集,10%作為驗(yàn)證集,剩余10%作為測(cè)試集,數(shù)據(jù)集間完全獨(dú)立,無(wú)交叉。5種疾病圖像及數(shù)據(jù)集的分布情況見(jiàn)圖1和表1。
表1 5種疾病圖像數(shù)據(jù)集的分布情況
1.2方法
1.2.1圖像色彩恒?;幚?使用色彩恢復(fù)多尺度Retinex算法(MSRCR)對(duì)1 280張訓(xùn)練集圖像和160張驗(yàn)證集圖像進(jìn)行色彩恒?;幚?解決圖像對(duì)比度不足、色彩偏差大、細(xì)節(jié)不充分、背景噪聲過(guò)大等問(wèn)題。
1.2.2模型的訓(xùn)練與測(cè)試 人工智能診斷模型的構(gòu)建及訓(xùn)練基于ResNet50算法、ImageNet數(shù)據(jù)集。首先根據(jù)訓(xùn)練集得到目標(biāo)檢測(cè)初始模型,再應(yīng)用初始模型對(duì)驗(yàn)證集數(shù)據(jù)進(jìn)行分析,如出現(xiàn)誤判的圖像,對(duì)初始模型的參數(shù)修改,明確最終的人工智能診斷模型,再應(yīng)用測(cè)試集數(shù)據(jù)進(jìn)行檢測(cè)。
1.2.3診斷模型的測(cè)試 利用人工智能診斷模型與河南科技大學(xué)第一附屬醫(yī)院皮膚科3位工作年限達(dá)到10年的醫(yī)生以及非三甲的基層醫(yī)院皮膚科3位工作年限達(dá)到10年的醫(yī)生對(duì)測(cè)試集數(shù)據(jù)進(jìn)行檢測(cè),比較評(píng)價(jià)結(jié)果的準(zhǔn)確性,進(jìn)而評(píng)價(jià)模型的性能。
1.2.4結(jié)果判定標(biāo)準(zhǔn) 使用準(zhǔn)確率、敏感性、特異性作為評(píng)價(jià)指標(biāo)。準(zhǔn)確率=(檢測(cè)陽(yáng)性且確診陽(yáng)性例數(shù)+檢測(cè)陰性且確診陰性例數(shù))/總例數(shù),敏感性=檢測(cè)陽(yáng)性且確診陽(yáng)性例數(shù)/(檢測(cè)陽(yáng)性且確診陽(yáng)性例數(shù)+檢測(cè)陰性但確診陽(yáng)性例數(shù)),特異性=檢測(cè)陰性且確診陰性例數(shù)/(檢測(cè)陽(yáng)性但確診陰性例數(shù)+檢測(cè)陰性且確診陰性例數(shù))。
1.3統(tǒng)計(jì)學(xué)方法 采用卡方檢驗(yàn)對(duì)診斷模型和醫(yī)生診斷準(zhǔn)確率進(jìn)行統(tǒng)計(jì)學(xué)分析,P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
本研究使用1 600張手機(jī)圖像和ResNet50算法進(jìn)行模型構(gòu)建。訓(xùn)練時(shí)設(shè)置分類層種類為5,其中0是銀屑病,1是副銀屑病,2是扁平苔蘚,3是玫瑰糠疹,4是多形紅斑。訓(xùn)練前對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),將所有數(shù)據(jù)縮放至224×224,并對(duì)數(shù)據(jù)進(jìn)行隨機(jī)旋轉(zhuǎn)、亮度增強(qiáng)。設(shè)置batch=64,learningrate=0.000 1,epoch=100;采用Adam優(yōu)化器,設(shè)置momentum=0.9,decay=0.000 1。5種疾病診斷ResNet50模型的平均準(zhǔn)確率為0.91,平均敏感性為0.89,平均特異性為0.95,本院醫(yī)生的平均準(zhǔn)確率為0.96,平均敏感性為0.93,平均特異性為0.98,基層醫(yī)院醫(yī)生的平均準(zhǔn)確率為0.71,平均敏感性為0.71,平均特異性為0.86,顯示ResNet50模型的診斷水平與本院皮膚科醫(yī)生相當(dāng),在副銀屑病、扁平苔蘚、玫瑰糠疹、多形紅斑4種疾病的診斷方面與基層醫(yī)院醫(yī)生差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。三者測(cè)試集測(cè)試結(jié)果見(jiàn)表2,三者統(tǒng)計(jì)學(xué)比較見(jiàn)表3。
臨床上銀屑病、副銀屑病、扁平苔蘚、玫瑰糠疹、多形紅斑等紅斑鱗屑性疾病比較常見(jiàn),患者對(duì)于紅斑鱗屑性疾病的診斷和治療的需求比較高。但是醫(yī)生的主觀判斷在此類疾病的診斷中具有重要作用,不同醫(yī)生對(duì)疾病的理解不盡相同,因此不同等級(jí)、不同年資的皮膚科醫(yī)生對(duì)紅斑鱗屑性疾病的診斷具有明顯的差異,往往影響此類疾病的診斷效率。因此探索紅斑鱗屑性疾病的客觀診斷方法具有重要臨床意義,本研究探索性將AI輔助診斷引入其診治,取得一定進(jìn)展。
目前皮膚科AI輔助診斷領(lǐng)域更多關(guān)注皮膚腫瘤和皮膚色素性疾病,結(jié)果顯示AI模型的鑒別能力與皮膚科醫(yī)生的水平相當(dāng)[7-9]。目前國(guó)內(nèi)有關(guān)紅斑鱗屑性疾病的AI輔助診斷研究較少。本研究利用1 600張銀屑病、副銀屑病、扁平苔蘚、玫瑰糠疹、多形紅斑5種常見(jiàn)紅斑鱗屑性疾病的手機(jī)皮損圖像,將皮膚圖像分成訓(xùn)練集、驗(yàn)證集和測(cè)試集,通過(guò)ResNet50算法建立了5種紅斑鱗屑性疾病的AI診斷模型,結(jié)果顯示此模型的平均準(zhǔn)確率、敏感性和特異性為0.91、0.89和0.95,診斷水平與本院皮膚科醫(yī)生相當(dāng),在副銀屑病、扁平苔蘚、玫瑰糠疹、多形紅斑4種疾病的診斷方面明顯高于基層醫(yī)院醫(yī)生。本研究模型基于手機(jī)圖像,目前智能手機(jī)廣泛普及,手機(jī)圖像具有簡(jiǎn)便、可操作性強(qiáng)等優(yōu)勢(shì),對(duì)設(shè)備、技術(shù)、場(chǎng)景的依賴度極大降低,基于手機(jī)圖像建立的AI診斷模型有著廣泛真實(shí)的應(yīng)用場(chǎng)景。當(dāng)然手機(jī)圖像不同于皮膚鏡和病理圖像,容易受到攝像頭型號(hào)、環(huán)境光線、拍攝距離、拍攝角度以及拍攝背景等影響,所以識(shí)別難度更大。為了消除圖像背景噪聲和偏倚的影響,本研究對(duì)圖像數(shù)據(jù)進(jìn)行色彩恒?;幚?利用Retinex圖像恒常算法模擬人類的視覺(jué)系統(tǒng)達(dá)到圖像色彩還原目的[10-11],去掉了多余的背景噪聲,進(jìn)而縮短了圖像識(shí)別時(shí)間。另外在采集皮膚圖像時(shí),不同的采集環(huán)境以及毛發(fā)部位皮損被遮擋等均會(huì)造成黑框、光斑噪聲等,進(jìn)而導(dǎo)致判斷出現(xiàn)偏差[12],因此本研究對(duì)圖像中的黑框、光斑噪聲也進(jìn)行了調(diào)整。
卷積神經(jīng)網(wǎng)絡(luò)識(shí)別時(shí)不用人工標(biāo)注需要識(shí)別的皮損位置,而是直接把圖像判斷分類為某種疾病,具有良好的便捷性和準(zhǔn)確率。ResNet50卷積神經(jīng)網(wǎng)絡(luò)又稱為殘差神經(jīng)網(wǎng)絡(luò),是目前應(yīng)用廣泛的醫(yī)學(xué)圖像識(shí)別分類算法[13-16]。ResNet50中包含了49個(gè)卷積層和1個(gè)全連階層,可解決卷積神經(jīng)網(wǎng)絡(luò)退化和梯度問(wèn)題,使其識(shí)別深度增加,識(shí)別性能提升[17],因此本研究選擇ResNet50算法建模。皮膚病圖像不同于其他醫(yī)學(xué)圖像,樣本量相對(duì)較少且需要專業(yè)經(jīng)驗(yàn)豐富的醫(yī)生進(jìn)行識(shí)別,所以精確識(shí)別難度較大。因?yàn)橥环N皮膚病不同個(gè)體的表現(xiàn)差異性較大,同時(shí)不同種類的皮膚病圖像表現(xiàn)又極其相似,這對(duì)模型的準(zhǔn)確分類有著很大的影響。針對(duì)這些問(wèn)題,本研究在ResNet50卷積神經(jīng)網(wǎng)絡(luò)上采用遷移學(xué)習(xí)[18-19]對(duì)手機(jī)皮損圖像進(jìn)行分類研究,一定程度上解決了數(shù)據(jù)量較小的問(wèn)題,同時(shí)使識(shí)別精度得到大幅度提升。本研究為了解決5種疾病間數(shù)據(jù)不平衡的問(wèn)題,給遷移學(xué)習(xí)模型設(shè)置了一個(gè)加權(quán)權(quán)重,強(qiáng)化小數(shù)據(jù)量手機(jī)皮損圖像的數(shù)據(jù)集的學(xué)習(xí),并采用分層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練以提高識(shí)別準(zhǔn)確率。本次建立的模型具有以下特點(diǎn):①對(duì)5種常見(jiàn)紅斑鱗屑性疾病的手機(jī)圖像進(jìn)行直接識(shí)別和判斷,不用再人工去標(biāo)識(shí)皮損位置,因此識(shí)別難度更高且更加便捷;②本研究將模型與本院醫(yī)生以及基層醫(yī)院醫(yī)生進(jìn)行了初步比較,為模型以后的大規(guī)模臨床應(yīng)用提供了依據(jù)。本模型的移動(dòng)端也可供患者自我皮損檢測(cè)和診斷,以便患者能對(duì)該類疾病早診斷,早治療。
紅斑鱗屑性疾病人工智能診斷模型對(duì)疾病的判斷效果良好,降低了醫(yī)生判斷的主觀性,更為客觀、便捷。當(dāng)然本模型作為初步研究存在一些不足:①本次納入的病例數(shù)和病種較少,在以后的研究中可以增加樣本數(shù)和其他較為少見(jiàn)的紅斑鱗屑性疾病如線狀苔蘚、毛發(fā)紅糠疹、光澤苔蘚等病種,以更好地滿足臨床需要;②除皮損大體照片外,缺少皮膚鏡圖像及病理圖像等多模態(tài)圖像,希望在以后的研究中進(jìn)一步完善和優(yōu)化。