陳明海,賀建峰
皮膚癌是一種比較常見(jiàn)的癌癥。數(shù)據(jù)表明全球每年有大約300萬(wàn)例皮膚癌發(fā)生,每3例癌癥患者中就有1例是皮膚癌患者[1]。皮膚病的早期發(fā)現(xiàn)可以讓患者得到及時(shí)治療并避免病情的進(jìn)一步惡化,還可以降低致死率[2]。有些皮膚病,比如黑色素瘤(melanoma,MEL)和黑色素細(xì)胞痣(melanocytic nevi,NV),從表面看非常相似,醫(yī)生在診斷這類疾病時(shí)極易混淆[3]。另外,醫(yī)生在診斷疾病時(shí)還有可能受到一些非主觀因素的影響,比如眼疲勞等,對(duì)患者造成誤診[4]。
為了解決上述問(wèn)題,研究人員利用數(shù)字圖像處理技術(shù)輔助醫(yī)生診斷。Celebi ME等[5]采用基于閾值分割算法對(duì)MEL圖像進(jìn)行分割,然后從分割的病變區(qū)域中選取病兆特征,并訓(xùn)練支持向量機(jī)(support vector machine,SVM)分類器對(duì)MEL進(jìn)行識(shí)別,實(shí)驗(yàn)證明該方法有較好的效果。Ganster H等[6]和She Z等[7]采用皮膚病診斷常用的ABCD(asymmetry,border,color,diameter)準(zhǔn)則對(duì)皮膚病圖像提取特征,從惡性MEL中檢測(cè)出良性病變,診斷精確度達(dá)到85%~91%。以上這些方法在提取圖像特征過(guò)程中,存在著過(guò)程復(fù)雜、特征提取不夠精細(xì)的不足。
近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展,研究人員把深度學(xué)習(xí)技術(shù)應(yīng)用到皮膚病的輔助診斷中。Yu L等[8]采用了一種深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)MEL進(jìn)行識(shí)別,利用殘差網(wǎng)絡(luò)處理過(guò)擬合和模型退化問(wèn)題,設(shè)計(jì)了一種全卷積殘差網(wǎng)絡(luò)對(duì)圖像進(jìn)行分類,精確度平均達(dá)到85.5%。Codella N等[9]采用了稀疏編碼、深度學(xué)習(xí)和SVM相結(jié)合的方法對(duì)3類皮膚病圖像進(jìn)行分類,分類精度達(dá)到了93.1%。以上方法均用到了深度學(xué)習(xí)的方法,但是一般的深度神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練模型用的數(shù)據(jù)集都有著嚴(yán)格要求,比如數(shù)據(jù)集要足夠大、數(shù)據(jù)樣本要有標(biāo)注等,這對(duì)一些數(shù)據(jù)量較小或者無(wú)標(biāo)注的數(shù)據(jù)集,在訓(xùn)練時(shí)很難達(dá)到相應(yīng)的效果。正是因?yàn)樯鲜鲈?,研究人員采用了訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)對(duì)數(shù)據(jù)集沒(méi)有以上嚴(yán)格要求的遷移學(xué)習(xí)[10]方法。Esteva A等[11]采用遷移學(xué)習(xí)方法,在網(wǎng)絡(luò)模型Inception V3的基礎(chǔ)上微調(diào),然后對(duì)網(wǎng)絡(luò)模型進(jìn)行端到端訓(xùn)練,對(duì)3類皮膚病進(jìn)行分類。分類精度達(dá)到了71.2%。Brinker TJ等[12]分別在網(wǎng)絡(luò)模型VGG16和GoogleNet基礎(chǔ)上進(jìn)行遷移學(xué)習(xí)對(duì)皮膚病分類,分類精度分別達(dá)到了79.7%和81.5%。董青青[13]在網(wǎng)絡(luò)模型DenseNet基礎(chǔ)上進(jìn)行二次遷移學(xué)習(xí),對(duì)ISIC2017數(shù)據(jù)集進(jìn)行分類,分類精確度達(dá)到了85.15%。Honsny KM等[14]在網(wǎng)絡(luò)模型AlexNet基礎(chǔ)上遷移學(xué)習(xí),對(duì)ISIC2018數(shù)據(jù)集進(jìn)行分類,其精確度、靈敏度、特異度及準(zhǔn)確度分別達(dá)到了98.7%、95.6%、99.27%和95.06%。以上傳統(tǒng)遷移學(xué)習(xí)方法都是在已有網(wǎng)絡(luò)模型基礎(chǔ)上進(jìn)行微調(diào)來(lái)遷移,所利用網(wǎng)絡(luò)模型的預(yù)訓(xùn)練參數(shù)是在與皮膚病數(shù)據(jù)集相似度很低的數(shù)據(jù)集上訓(xùn)練得到的,很容易把不相關(guān)的特征遷移到目標(biāo)域上,導(dǎo)致負(fù)遷移現(xiàn)象的產(chǎn)生,從而降低了訓(xùn)練網(wǎng)絡(luò)模型的性能。
為減少在傳統(tǒng)遷移學(xué)習(xí)方法中存在的負(fù)遷移現(xiàn)象,筆者提出了一種基于部分遷移學(xué)習(xí)[15]的皮膚病圖像分類方法。
1.1.1 實(shí)驗(yàn)環(huán)境
該實(shí)驗(yàn)的環(huán)境配置如下:CPU i7;內(nèi)存64 GB;GPU GeForce RTX2080Ti;顯存11 GB。操作系 統(tǒng)Windows10 Professional;深度學(xué)習(xí)框架PyTorch 1.2。
1.1.2 實(shí)驗(yàn)數(shù)據(jù)集
實(shí)驗(yàn)采用的數(shù)據(jù)集是由國(guó)際皮膚成像協(xié)會(huì)(International Skin Imaging Collaboration,ISIC)提 供 的ISIC2018和ISIC2019數(shù)據(jù)集。ISIC2018數(shù)據(jù)集光化角化?。╝ctinic keratoses,AKIEC)圖像327幅,良性角化病(benign keratosis-like lesions,BKL)圖像1 099幅,基底細(xì)胞癌(basal cell carcinoma,BCC)圖像514幅,皮膚纖維瘤(dermatofibroma,DF)圖像115幅,MEL圖像1 113幅,NV圖像6 705幅,血管病變(vascular lesions,VASC)圖像142幅,鱗狀細(xì)胞癌(squamous cell carcinoma,SCC)圖像0幅,合計(jì)10 015幅。ISIC2019數(shù)據(jù)集AKIEC圖像867幅,BKL圖像2 624幅,BCC圖像3 323幅,DF圖像239幅,MEL圖像4 522幅,NV圖 像12 875幅,VASC圖 像253幅,SCC圖 像628幅,合計(jì)25 331幅。
數(shù)據(jù)集ISIC2018和ISIC2019共有的圖像類別有7類,前者的類別是后者類別的真子集,符合部分遷移學(xué)習(xí)對(duì)源域和目標(biāo)域數(shù)據(jù)樣本類別數(shù)目的要求。根據(jù)部分遷移學(xué)習(xí)對(duì)源域和目標(biāo)域數(shù)據(jù)集的要求,把包含8類圖像的ISIC2019數(shù)據(jù)集作為源域數(shù)據(jù)集,把包含7類圖像的ISIC2018數(shù)據(jù)集作為目標(biāo)域數(shù)據(jù)集。
從兩個(gè)數(shù)據(jù)集中每個(gè)類別的數(shù)量上可以看出,類別之間圖像數(shù)量存在嚴(yán)重不平衡的情況。比如ISIC2018數(shù)據(jù)集中NV類包含6 705幅圖像,而DF類僅有115幅圖像。類別之間圖像數(shù)量的不平衡會(huì)降低神經(jīng)網(wǎng)絡(luò)的分類性能。為了解決圖像類別之間數(shù)據(jù)不平衡的問(wèn)題,采用對(duì)數(shù)據(jù)集擴(kuò)增的方法。數(shù)據(jù)擴(kuò)增主要是通過(guò)對(duì)圖像進(jìn)行翻轉(zhuǎn)及0°~355°的隨機(jī)旋轉(zhuǎn)等幾何變換來(lái)實(shí)現(xiàn)。在對(duì)ISIC2019數(shù)據(jù)集擴(kuò)增的時(shí)候,考慮到NV類有12 875幅圖像,已經(jīng)有足夠的圖像數(shù)量用于訓(xùn)練,無(wú)需再進(jìn)行擴(kuò)增。其余類別均擴(kuò)增到10 000幅左右。在對(duì)ISIC2018數(shù)據(jù)集擴(kuò)增的時(shí)候,是對(duì)所有的類別都進(jìn)行了擴(kuò)增,每一類別擴(kuò)增后的圖像均達(dá)到10 000幅左右。
1.2.1 問(wèn)題的提出
遷移學(xué)習(xí)方法中有一個(gè)源域和一個(gè)目標(biāo)域。目前大部分遷移學(xué)習(xí)算法假設(shè)源域和目標(biāo)域有著相同的標(biāo)簽空間,但實(shí)際應(yīng)用中這樣的條件很難達(dá)到,更多的情況是目標(biāo)域的標(biāo)簽空間是源域標(biāo)簽空間的子集。通常需要把一個(gè)模型從一個(gè)大規(guī)模數(shù)據(jù)集(e.g.ImageNet)遷移到一個(gè)小規(guī)模數(shù)據(jù)集(e.g.Caltech256)上。假設(shè)源域目標(biāo)域其中表示源域Ds中的數(shù)據(jù)樣本表示對(duì)應(yīng)的類別;ns表示源域Ds中帶有標(biāo)簽的樣本數(shù)目表示目標(biāo)域Dt中的數(shù)據(jù)樣本;nt表示目標(biāo)域Dt中無(wú)標(biāo)簽的樣本數(shù)目。假設(shè)源域和目標(biāo)域數(shù)據(jù)樣本類別數(shù)目分別是Cs和Ct。在實(shí)驗(yàn)提出的部分遷移學(xué)習(xí)應(yīng)用場(chǎng)景中,二者存在如下關(guān)系:Cs>Ct。源域和目標(biāo)域中數(shù)據(jù)樣本分別有著不同的概率分布p和q。在傳統(tǒng)的遷移學(xué)習(xí)中有p≠q,但是在部分遷移學(xué)習(xí)中更進(jìn)一步,有著這里pCt表示源域中屬于目標(biāo)域的數(shù)據(jù)樣本類別的概率分布。筆者的目標(biāo)是設(shè)計(jì)一個(gè)深度神經(jīng)網(wǎng)絡(luò),不但能夠?qū)W習(xí)可遷移的特征,而且可以讓那些僅屬于源域的數(shù)據(jù)在遷移過(guò)程中造成的負(fù)遷移現(xiàn)象降到最低。
在傳統(tǒng)的遷移學(xué)習(xí)中,一個(gè)主要的挑戰(zhàn)是目標(biāo)域數(shù)據(jù)無(wú)標(biāo)注,加之源域和目標(biāo)域數(shù)據(jù)樣本有著不同的概率分布,因此在源域上訓(xùn)練好的分類器不能直接用到目標(biāo)域上。在部分遷移學(xué)習(xí)中,存在的另一個(gè)更加困難的問(wèn)題是甚至不知道源域中哪一部分?jǐn)?shù)據(jù)樣本和目標(biāo)域數(shù)據(jù)樣本有著共同的標(biāo)簽空間。以上存在的問(wèn)題導(dǎo)致的結(jié)果是:①僅存于源域中的數(shù)據(jù)樣本在整個(gè)遷移過(guò)程中導(dǎo)致負(fù)遷移的發(fā)生,從而影響整個(gè)遷移的性能;②減小源域中和目標(biāo)域?qū)儆诠餐悇e數(shù)據(jù)樣本的分布差異成為遷移學(xué)習(xí)的關(guān)鍵。為避免上述結(jié)果對(duì)網(wǎng)絡(luò)最終分類性能的影響,實(shí)驗(yàn)采用了通過(guò)選擇性對(duì)抗網(wǎng)絡(luò)實(shí)現(xiàn)的部分遷移學(xué)習(xí)方法。
1.2.2 域?qū)咕W(wǎng)絡(luò)
域?qū)咕W(wǎng)絡(luò)[16]通過(guò)提取可遷移的特征減少源域和目標(biāo)域的分布差異,這種方法被成功地應(yīng)用到遷移學(xué)習(xí)當(dāng)中。對(duì)抗學(xué)習(xí)過(guò)程是一個(gè)雙人游戲。第一個(gè)游戲者是域判別器Gd,域判別器負(fù)責(zé)分辨數(shù)據(jù)樣本是來(lái)自源域還是目標(biāo)域。第二個(gè)游戲者是特征提取器Gf,特征提取器負(fù)責(zé)提取源域和目標(biāo)域的特征迷惑域判別器。為了提取域不變特征f,通過(guò)最大化域判別器Gd的損失學(xué)習(xí)特征提取器Gf的參數(shù)θf(wàn),同時(shí),通過(guò)最小化域判別器Gd的損失學(xué)習(xí)域判別器參數(shù)θd。另外,也要讓標(biāo)簽預(yù)測(cè)器Gy的損失最小化。最終,域?qū)咕W(wǎng)絡(luò)[16]的目標(biāo)函數(shù)如(1)式所示:
公式(1)中:λ是實(shí)現(xiàn)上述目標(biāo)的調(diào)和參數(shù)。模型訓(xùn)練收斂后,將會(huì)由參數(shù)得到函數(shù)(1)的一個(gè)鞍點(diǎn),如(2)式所示:
域?qū)咕W(wǎng)絡(luò)在傳統(tǒng)的遷移學(xué)習(xí)中,在源域和目標(biāo)域標(biāo)簽空間相同,即Cs=Ct的條件下有著很好的性能。
1.2.3 選擇性對(duì)抗網(wǎng)絡(luò)
在部分遷移學(xué)習(xí)中,沒(méi)有了上述域?qū)咕W(wǎng)絡(luò)中的Cs=Ct的條件,目標(biāo)域的標(biāo)簽空間是源域標(biāo)簽空間的子集,即Cs?Ct,因此如果再匹配整個(gè)源域的概率分布p和目標(biāo)域的概率分布q,將會(huì)因?yàn)閮H存于源域中的數(shù)據(jù)樣本的存在而造成負(fù)遷移現(xiàn)象的產(chǎn)生。為了降低負(fù)遷移現(xiàn)象的產(chǎn)生,在進(jìn)行域?qū)惯m應(yīng)的過(guò)程中必須過(guò)濾掉那些僅存于源域中的數(shù)據(jù)樣本。
為了匹配源域和目標(biāo)域不同的標(biāo)簽空間,需要把(1)式中的域判別器Gd劃分為Cs個(gè)類級(jí)別的域判別器,k=1,…,Cs,每一個(gè)判別器負(fù)責(zé)匹配源域與目標(biāo)域中的第k類數(shù)據(jù)樣本(圖1)。
圖1 部分遷移學(xué)習(xí)的選擇性對(duì)抗網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Selective adversarial network structure diagram of partial transfer learning
因?yàn)槟繕?biāo)域數(shù)據(jù)樣本無(wú)標(biāo)注,所以在模型訓(xùn)練期間,目標(biāo)域的標(biāo)簽空間是不可訪問(wèn)的。這樣就很難決定哪一個(gè)域判別器(k=1,…,Cs)負(fù)責(zé)對(duì)目標(biāo)域的數(shù)據(jù)樣本進(jìn)行判別。但是,觀察到標(biāo)簽預(yù)測(cè)器yi=Gy(Xi)對(duì)于每一個(gè)數(shù)據(jù)樣本的輸出是在整個(gè)源域標(biāo)簽空間上的概率分布。這個(gè)概率正好能說(shuō)明Xi屬于Cs類中某一類的概率。因此,就用作為每一個(gè)數(shù)據(jù)樣本Xi被分配到Cs個(gè)域判別器的概率。每一個(gè)數(shù)據(jù)樣本被分配到不同的判別器可以通過(guò)(3)式所示的概率權(quán)重域判別器損失來(lái)實(shí)現(xiàn)。
在(3)式中:是第k個(gè)域判別器;是其交叉熵?fù)p失;di是數(shù)據(jù)樣本的域標(biāo)簽。與(1)式中單個(gè)判別器的域?qū)咕W(wǎng)絡(luò)相比,實(shí)驗(yàn)提出的算法可以實(shí)現(xiàn)更加細(xì)粒度的域適應(yīng),讓每一個(gè)樣本點(diǎn)只與自己相關(guān)的域判別器進(jìn)行匹配。這種細(xì)粒度的域適應(yīng)有三個(gè)優(yōu)點(diǎn):①避免了硬性的把每個(gè)數(shù)據(jù)樣本指派給一個(gè)域判別器,這種硬性的指派對(duì)目標(biāo)域來(lái)講是不準(zhǔn)確的;②通過(guò)過(guò)濾掉不相關(guān)類別的數(shù)據(jù)樣本,減少了負(fù)遷移;③概率權(quán)重域判別器分配不同的損失給不同的域判別器,使得不同的判別器學(xué)習(xí)到不同的參數(shù),促進(jìn)了每個(gè)數(shù)據(jù)樣本的正向遷移。
除了上述樣本級(jí)別的權(quán)重機(jī)制,實(shí)驗(yàn)還采用了類級(jí)別的權(quán)重方法來(lái)進(jìn)一步地降低僅存在于源域中的數(shù)據(jù)類別樣本造成的負(fù)遷移。注意到只有負(fù)責(zé)對(duì)目標(biāo)域類別進(jìn)行判別的判別器對(duì)促進(jìn)正向遷移是有效的,其他的判別器在遷移過(guò)程中只會(huì)帶來(lái)噪聲,降低正向遷移的性能。因此需要降低那些僅負(fù)責(zé)判別只存在于源域中的數(shù)據(jù)樣本類別的判別器的權(quán)重。因?yàn)槟繕?biāo)域的數(shù)據(jù)樣本屬于僅存于源域中的那部分?jǐn)?shù)據(jù)樣本類別的可能性較小,所以可以降低那些僅負(fù)責(zé)只存于源域中數(shù)據(jù)樣本類別判斷的判別器的權(quán)重,如(4)式所示。
盡管(4)式中的域判別器可以通過(guò)降低僅存在于源域中的數(shù)據(jù)造成的負(fù)遷移現(xiàn)象實(shí)現(xiàn)了選擇性地遷移相關(guān)知識(shí),但是這些判別器主要依靠的是概率=Gy(Xi)。因此進(jìn)一步地利用促進(jìn)類間低密度分離的熵最小化原則[17]來(lái)改進(jìn)標(biāo)簽預(yù)測(cè)器Gy。通過(guò)最小化數(shù)據(jù)樣本Xi在目標(biāo)域Dt上的概率的條件熵來(lái)實(shí)現(xiàn)上述要求,如(5)式所示。
綜上所述,選擇性對(duì)抗網(wǎng)絡(luò)最終的目標(biāo)函數(shù)如(6)式所示。
其中:λ是一個(gè)超參數(shù),在上述的聯(lián)合優(yōu)化問(wèn)題中用來(lái)調(diào)和兩個(gè)目標(biāo)。整個(gè)優(yōu)化的問(wèn)題的目標(biāo)就是找到滿足(7)式的參數(shù)(k=1,2,…,Cs)。
選擇性對(duì)抗網(wǎng)絡(luò)通過(guò)過(guò)濾掉僅存于源域的數(shù)據(jù)樣本類別成功地實(shí)現(xiàn)了部分遷移學(xué)習(xí),同時(shí)在共享標(biāo)簽空間Ct上最大化地匹配數(shù)據(jù)分布pCt和q,從而更加促進(jìn)了正向遷移。
1.2.4 實(shí)驗(yàn)與分析
1.2.4.1 網(wǎng)絡(luò)模型的訓(xùn)練 在PyTorch深度學(xué)習(xí)框架中應(yīng)用實(shí)驗(yàn)提出的方法來(lái)訓(xùn)練網(wǎng)絡(luò)模型。因?yàn)閷?shí)驗(yàn)的目標(biāo)是對(duì)包含7類皮膚病圖像的ISIC2018數(shù)據(jù)集進(jìn)行分類。實(shí)驗(yàn)采用ResNet網(wǎng)絡(luò)模型作為基礎(chǔ)網(wǎng)絡(luò)模型,對(duì)最后的全連接層和分類層進(jìn)行微調(diào),并采用ResNet在大型數(shù)據(jù)集ImageNet上訓(xùn)練的參數(shù)作為預(yù)訓(xùn)練參數(shù)。對(duì)于選擇性對(duì)抗網(wǎng)絡(luò),實(shí)驗(yàn)微調(diào)了所有的特征層、分類層和對(duì)抗層。因?yàn)檫@些網(wǎng)絡(luò)都是從頭開(kāi)始訓(xùn)練,所以把這些層的學(xué)習(xí)率設(shè)置為其他層的10倍。因?yàn)樗脭?shù)據(jù)集不同的圖像類別之間存在嚴(yán)重的數(shù)量不平衡現(xiàn)象,注意到Focal Loss損失函數(shù)[18]主要用來(lái)解決樣本比例嚴(yán)重失衡的問(wèn)題,因此在計(jì)算每個(gè)類別判別器的損失時(shí),用Focal Loss代替了交叉熵?fù)p失函數(shù)。
1.2.4.2 圖像分類實(shí)驗(yàn) 針對(duì)實(shí)驗(yàn)提出的部分遷移學(xué)習(xí)皮膚病圖像分類算法,做了兩組實(shí)驗(yàn)。①在部分遷移學(xué)習(xí)時(shí),采用類級(jí)別的域判別器過(guò)濾掉僅存于源域中的數(shù)據(jù)樣本類別。單個(gè)類級(jí)別域判別器的損失函數(shù)采用交叉熵?fù)p失函數(shù);提取特征時(shí)采用ResNet作為基礎(chǔ)網(wǎng)絡(luò)模型,并針對(duì)要分類的目標(biāo)數(shù)據(jù)集ISIC2018對(duì)ResNet進(jìn)行微調(diào)(實(shí)驗(yàn)1)。②在實(shí)驗(yàn)1的基礎(chǔ)上,把單個(gè)類級(jí)別域判別器的損失函數(shù)替換為Focal Loss損失函數(shù);提取特征時(shí)針對(duì)要分類的目標(biāo)數(shù)據(jù)集ISIC2018對(duì)ResNet網(wǎng)絡(luò)模型進(jìn)行微調(diào)(實(shí)驗(yàn)2)。并與Honsny KM等[14]結(jié)果進(jìn)行對(duì)比。
1.2.4.3 評(píng)價(jià)指標(biāo) 實(shí)驗(yàn)采用了圖像分類中常用的4種評(píng)價(jià)指標(biāo)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià)。這4種評(píng)價(jià)指標(biāo)分別是精確度(accuracy)、靈敏度(sensitivity)、特異度(specificity)、準(zhǔn)確度(precision)。
其中:tp、fp、fn、tn分別表示真陽(yáng)性(true positive)、假陽(yáng)性(false positive)、假陰性(false negative)、真陰性(true negative)的數(shù)目。
第1組實(shí)驗(yàn)的結(jié)果中,精確度、靈敏度、特異度及準(zhǔn)確度分別是99.13%、96.99%、99.45%和97.12%;第2組實(shí)驗(yàn)結(jié)果中上述指標(biāo)分別是99.24%、97.73%、99.56%和97.32%。實(shí)驗(yàn)結(jié)果與Honsny KM等[14]結(jié)果對(duì)比,數(shù)值接近。見(jiàn)表1。
表1 兩組實(shí)驗(yàn)結(jié)果與Honsny KM結(jié)果對(duì)比Tab.1 Comparison of results between 2 experimental groups and Honsny KM
混淆矩陣是評(píng)價(jià)圖像分類結(jié)果的一個(gè)常用方法,實(shí)驗(yàn)1與實(shí)驗(yàn)2從混淆矩陣中可以清楚地看出每一類圖像的分類結(jié)果基本相似。見(jiàn)圖2。
圖2 實(shí)驗(yàn)1和實(shí)驗(yàn)2混淆矩陣Fig.2 Confusion matrix graph of experiment No.1 and experiment No.2
傳統(tǒng)遷移學(xué)習(xí)把已有網(wǎng)絡(luò)模型學(xué)習(xí)到的知識(shí)遷移到新的領(lǐng)域中加以利用,可以節(jié)省新模型的訓(xùn)練時(shí)間,但是在遷移過(guò)程中極易造成負(fù)遷移現(xiàn)象的產(chǎn)生。筆者通過(guò)引入選擇性對(duì)抗網(wǎng)絡(luò)進(jìn)行部分遷移,降低了負(fù)遷移現(xiàn)象的產(chǎn)生,提高了圖像的分類精度。實(shí)驗(yàn)中特征提取時(shí)采用ResNet網(wǎng)絡(luò)模型,使得提取的特征更加豐富,但是比采用層次淺的網(wǎng)絡(luò)訓(xùn)練時(shí)間會(huì)長(zhǎng)一些。從實(shí)驗(yàn)結(jié)果可以看出,4項(xiàng)指標(biāo)均比傳統(tǒng)遷移學(xué)習(xí)方法有了顯著提高。
從實(shí)驗(yàn)結(jié)果來(lái)看,采用實(shí)驗(yàn)提出的部分遷移學(xué)習(xí)方法,因?yàn)橐?guī)避了傳統(tǒng)遷移學(xué)習(xí)方法中容易出現(xiàn)的負(fù)遷移現(xiàn)象,降低了負(fù)遷移對(duì)網(wǎng)絡(luò)性能的影響;又通過(guò)降低僅存于源域數(shù)據(jù)的判別器的權(quán)重促進(jìn)了正向遷移,實(shí)驗(yàn)結(jié)果相比Honsny KM等[14]采用的傳統(tǒng)遷移學(xué)習(xí)方法有明顯的提升。另外,提取圖像特征的時(shí)候,在ResNet的基礎(chǔ)上進(jìn)行遷移,并且采用了ResNet的預(yù)訓(xùn)練參數(shù)。因?yàn)镽esNet是在ImageNet數(shù)據(jù)集上訓(xùn)練的模型,ImageNet數(shù)據(jù)集中每類圖像的數(shù)量相對(duì)比較均衡,而筆者實(shí)驗(yàn)采用的數(shù)據(jù)集都存在著嚴(yán)重的圖像類別之間數(shù)量的嚴(yán)重失衡的問(wèn)題,所以實(shí)驗(yàn)采用了Focal Loss損失函數(shù),從實(shí)驗(yàn)結(jié)果看,相比采用圖像分類常用的交叉熵?fù)p失函數(shù)也有著一定的改善。如何降低遷移學(xué)習(xí)中的負(fù)遷移現(xiàn)象和如何通過(guò)少樣本訓(xùn)練出精度高的網(wǎng)絡(luò)模型依然值得深入研究。
筆者提出的基于部分遷移學(xué)習(xí)的皮膚病圖像分類算法降低了傳統(tǒng)遷移學(xué)習(xí)算法中極易出現(xiàn)的負(fù)遷移現(xiàn)象,同時(shí)通過(guò)最大化地匹配源域和目標(biāo)域共享標(biāo)簽空間促進(jìn)了正向遷移。實(shí)驗(yàn)表明,該方法優(yōu)于傳統(tǒng)的遷移學(xué)習(xí)方法。一個(gè)值得注意的問(wèn)題是,目前在對(duì)皮膚病分類實(shí)驗(yàn)中,采用數(shù)據(jù)集中的皮膚病圖像大部分來(lái)自歐洲及北美的白種人[19],為了提高分類器的泛化能力,還需要針對(duì)不同種族人群的皮膚病圖像進(jìn)行深入研究。