林漢斌
摘 要:基于深度學習的計算機視覺研究都是基于大量圖片數(shù)據(jù)樣本,由于有時在工業(yè)上收集目標樣本的成本很高,因此這大大限制了深度學習在計算機視覺中的應用。針對少量樣本下的圖片分類任務,本文提出一種新型的網(wǎng)絡模型。并跟目前主流的深度學習網(wǎng)絡比較。證明了我們的模型在少量樣本下仍然具有很好分類精度。
中圖分類號:TP391文獻標識碼:A文章編號:1003-9082(2020)02-000-01
一、卷積神經網(wǎng)絡模型
卷積神經網(wǎng)絡是一類特殊的人工神經網(wǎng)絡,其主要特點是卷積運
算操作。理論上卷積神經網(wǎng)絡的深度越深,模型的擬合能力越強。但研究發(fā)現(xiàn),當隨著卷積神經網(wǎng)絡深度的加深,模型的擬合性能不升反降,這主要是因為如果網(wǎng)絡的深度過深,卷積神經網(wǎng)絡在反向傳播時容易出現(xiàn)梯度消失或梯度爆炸。因此一些研究人員設計出了一種殘差網(wǎng)絡可以有效防止網(wǎng)絡在反向傳播時出現(xiàn)梯度消失或梯度爆炸。殘差網(wǎng)絡的核心創(chuàng)新點是將前面的輸入也與后面的網(wǎng)絡層連接。
二、少量樣本下卷積神經網(wǎng)絡模型的設計
由于少量樣本下,樣本的數(shù)據(jù)有限,因此應當設計一個網(wǎng)絡使得網(wǎng)
絡能有效的提取圖片的深層次特征。為此,鑒于對殘差網(wǎng)絡,我們設計了一個基于殘差塊的注意力卷積神經網(wǎng)絡(Res-attention)模型。結構如圖1所示。
與傳統(tǒng)卷積神經網(wǎng)絡對殘差塊進行簡單堆疊所不同的是,我們還加入了如虛線所示的結構。該結構先對前置網(wǎng)絡輸出的特征圖先進行下采樣,以獲得更深層次的特征,接著進行上采樣,將特征圖縮放至原特征圖一樣大小。接著經過sigmoid函數(shù)將,特征圖中的值縮放至0-1之,值越大代表著特征圖區(qū)域所對應的圖像為我們的目標區(qū)域,使我們的網(wǎng)絡更能關注到目標區(qū)域的圖像值。
三、模型驗證
1.數(shù)據(jù)集獲取
為了驗證我們的模型在小樣本下具有很好的分類效果,我們使用爬蟲技術從網(wǎng)上下載213種觀賞魚的圖片,每種魚的圖片數(shù)量大約在5-40個,圖2是一些示例圖片。
2.數(shù)據(jù)增強
這里我們通過水平翻轉和改變亮度對比度增強數(shù)據(jù),圖3是一些示例圖片。
3. 實驗對比
我們將上面通過數(shù)據(jù)增強的圖像數(shù)據(jù)集應用在幾個經典的神經網(wǎng)絡模型上,比較它們的分類準確率。得到的結果見表1所示:
從表中可以看出,在少量樣本我們的Res-attention網(wǎng)絡較其他的網(wǎng)絡結構擁有更高的準確率。
四、結束語
本文基于在少量數(shù)據(jù)樣本的條件下,提出了Res-atttention網(wǎng)絡模型。該模型基于殘差網(wǎng)絡,多加一個注意力模塊,使得模型更能關注到目標區(qū)域,而忽視圖片的背景區(qū)域。實驗結果顯示本文模型在小樣本下仍然具有很好的分類效果。
參考文獻
[1] Krizhevsky A, Sutskever I, Hinton G E. Imagenet Classification with Deep Convolutional Neural Networks[C]//International Conference on Neural Information Processing Systems, Curran Associations Inc. 2012: 1097-1105.
[2]李亞飛,董紅斌.基于卷積神經網(wǎng)絡的遙感圖像分類研究[J].智能系統(tǒng)學報,2018(4):550-556.
[3] Christian Szegedy, Wei Liu, Yang qing. Going Deeper with Convolution[C]. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2015:1-9.