陳昕卓,李建軍,張 超
(內(nèi)蒙古科技大學(xué) 信息工程學(xué)院,內(nèi)蒙古 包頭 014010)
隨著我國工業(yè)的蓬勃發(fā)展,我國已進(jìn)入制造大國行列。近年來,隨著我國“工業(yè)4.0”和“中國制造2025”等戰(zhàn)略目標(biāo)的提出以及制造業(yè)數(shù)字化、網(wǎng)絡(luò)化、智能化的普及,工業(yè)品供應(yīng)商對其產(chǎn)品的質(zhì)量把控越來越嚴(yán)。在工業(yè)品生產(chǎn)線上,表面缺陷檢測技術(shù)是保障工業(yè)品質(zhì)量、性能和提高企業(yè)綜合競爭力的關(guān)鍵。目前工業(yè)品缺陷檢測的方法可以概括為以下3類:1)采用傳統(tǒng)的人工方法檢測產(chǎn)品表面,耗費(fèi)大量人力、物力資源,費(fèi)時且效率低下;人工處理具有較強(qiáng)的主觀性,檢測的準(zhǔn)確率無法得到保障;2)采用傳統(tǒng)的機(jī)器學(xué)習(xí)的方法提取特征進(jìn)行缺陷檢測時,主要任務(wù)量集中于圖像預(yù)處理、提取特征、特征分類器設(shè)計(jì)。此類方法過度依賴人為設(shè)計(jì)的特征提取與分類方法,并且需要通過大量的實(shí)驗(yàn)進(jìn)行參數(shù)調(diào)節(jié)和閾值設(shè)定,準(zhǔn)確率隨外界環(huán)境波動較大,誤差率較高[1-4];3)基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的檢測方法,該方法以經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)進(jìn)行圖像處理,進(jìn)而生成特征圖,最后完成缺陷檢測,但是工業(yè)品表面缺陷復(fù)雜多樣、缺陷區(qū)域大小不一、種類和程度均不相同,使得深度神經(jīng)網(wǎng)絡(luò)在工業(yè)品表面檢測領(lǐng)域的應(yīng)用受到了限制[5-7]。
基于卷積神經(jīng)網(wǎng)絡(luò)的檢測和分類方法近年來已取得較好發(fā)展,Krizhevsky等[8]在2012年提出AlexNet網(wǎng)絡(luò)模型,該模型由5個卷積層、3個全連接層和3個池化層構(gòu)成,采用BN層加快收斂速度、采用Dropout防止過擬合。在ILSRVC大規(guī)模視覺識別挑戰(zhàn)賽中斬獲冠軍,top5數(shù)據(jù)集預(yù)測的錯誤率為16.4%。Li等[9]簡化了AlexNet模型的參數(shù)并用于鋼板表面的缺陷分類,通過網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)缺陷特征,避免了特征提取與圖像分類分離的問題,形成了端到端的缺陷識別,分類準(zhǔn)確率達(dá)99.05%。
K.M.He等[10]在2015年提出了ResNet網(wǎng)絡(luò),基于Basic Block層數(shù)的不同,將殘差網(wǎng)絡(luò)分為ResNet18、ResNet34、ResNet50、ResNet101、ResNet152共5個類型,通過downsample使輸入與輸出尺寸相統(tǒng)一,利用恒等映射原理,可以使網(wǎng)絡(luò)進(jìn)一步地加深而不會導(dǎo)致網(wǎng)絡(luò)梯度消失和爆炸,也不會增加誤差。獲得當(dāng)年CVPR大賽第一名,在ImageNet測試集上達(dá)到了96.32%的準(zhǔn)確率。何[11]等人提出了基于RestNet34的弱監(jiān)督鋼板缺陷分類檢測系統(tǒng),分類準(zhǔn)確率達(dá)93.2%。
He等[12]通過采用殘差網(wǎng)絡(luò)(ResNet34、ResNet50)在每個階段生成的特征圖,提出多級特征融合網(wǎng)絡(luò)(MFN),進(jìn)行鋼板表面缺陷檢測,該方法可以在單個GPU上以20fps的速度進(jìn)行檢測,缺陷檢測任務(wù)的準(zhǔn)確率達(dá)到82.3%。
基于以上基礎(chǔ)。本文針對現(xiàn)有網(wǎng)絡(luò)模型復(fù)雜、特征尺度單一、參數(shù)過多、難以訓(xùn)練、網(wǎng)絡(luò)收斂速度慢等問題,在ResNet網(wǎng)絡(luò)模型的基礎(chǔ)上提出了一種多尺度殘差融合模型。其主要創(chuàng)新點(diǎn)包括:
1)在特征提取方面,為避免輸入特征尺度單一、特征信息丟失。使用多尺度特征融合網(wǎng)絡(luò)模型,將卷積核分別設(shè)置為5×5、7×7、9×9提取多尺度特征信息。
2)針對神經(jīng)網(wǎng)絡(luò)中全連接層參數(shù)量大,導(dǎo)致的收斂速度滿,且易產(chǎn)生過擬合等問題。在網(wǎng)絡(luò)模型中,采用全局平局池化層替代全連接層。防止網(wǎng)絡(luò)的過擬合,加強(qiáng)特征圖與類別的一致性,加快網(wǎng)絡(luò)收斂速度。
3)為了提高神經(jīng)網(wǎng)絡(luò)中BatchNorm[13]模塊對圖像進(jìn)行批量歸一化能力,避免樣本之間差異過大的問題,使用Representative BatchNorm[14]層代替BatchNorm層,在原BatchNorm層的基礎(chǔ)上增加中心校準(zhǔn)和縮放校準(zhǔn)環(huán)節(jié)。增強(qiáng)特征信息并削弱噪聲,提高分類任務(wù)的準(zhǔn)確率。
本文所提出的網(wǎng)絡(luò),在東北大學(xué)鋼板缺陷數(shù)據(jù)集NEU-CLS進(jìn)行實(shí)驗(yàn)分析,相比現(xiàn)有技術(shù),得到了比現(xiàn)有檢測更高的識別準(zhǔn)確率,因此,將該項(xiàng)技術(shù)應(yīng)用于實(shí)際生產(chǎn)中,將會進(jìn)一步提升產(chǎn)品的質(zhì)量保障,提升產(chǎn)品競爭力。
在運(yùn)用殘差網(wǎng)絡(luò)ResNet時,由于特征提取尺度的單一性,存在特征信息丟失的現(xiàn)象。針對這個問題,提出多尺度特征融合模塊提取圖像中不同尺度的特征。本文提出的多尺度特征融合模塊的基本思想是運(yùn)用多個不同的卷積核提取多尺度特征,采用并聯(lián)三通道結(jié)構(gòu),并將多個卷積操作提取的特征圖融合,最終構(gòu)成了完整的多尺度特征提取模塊。該模塊的結(jié)構(gòu)如圖1所示。
圖1 多尺度特征融合模塊結(jié)構(gòu)示意圖
多尺度特征提取與融合模塊主要分為兩個部分:多尺度特征提取部分、多尺度特征融合部分。
1)多尺度特征提取部分采用并聯(lián)三通道結(jié)構(gòu),且各分支結(jié)構(gòu)卷積核不同。卷積核大小分別為5×5、7×7和9×9,不同尺寸的卷積核對不同尺度的特征進(jìn)行提取,既保留淺層的細(xì)節(jié)信息又融合了深層信息。
2)特征融合部分是將多尺度特征提取層提取的多個特征圖進(jìn)行融合,運(yùn)用Concatenate使多通道提取的特征圖拼接成一個完整的特征圖。最后融合成的特征圖的輸出通道數(shù)為各分支輸出通道數(shù)之和。在融合過程中,為保證輸出特征圖大小一致,采用padding填充特征圖邊緣區(qū)域。多尺度特征提取與融合模塊原理如圖2所示。
圖2 多尺度特征提取與融合模塊原理圖
在使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類任務(wù)時,全連接層通常作為神經(jīng)網(wǎng)絡(luò)的最后一層。該層存在大量的參數(shù),導(dǎo)致計(jì)算量增大,極大地限制了神經(jīng)網(wǎng)絡(luò)的收斂速度,且易產(chǎn)生過擬合等問題。為解決上述問題,一般會在全連接層設(shè)置Dropout,按照一定的概率隨機(jī)失活一些網(wǎng)絡(luò)單元,減弱神經(jīng)元之間的依賴性,增加網(wǎng)絡(luò)的泛化能力。但是采用Dropout會增加網(wǎng)絡(luò)的訓(xùn)練時間,并且不易設(shè)置最優(yōu)參數(shù)。
全局平均池化(GAP,global average pooling)[15]不以小窗的形式滑動,而是在上一層輸出的整張?zhí)卣鲌D上進(jìn)行全局均值化,將特征圖轉(zhuǎn)化為一個特征向量,輸入的每一層特征圖由特征向量的每一個數(shù)值表示,其原理如圖3所示。使用全局平均池化層對整張?zhí)卣鲌D所有值求平均,可以充分利用每張?zhí)卣鲌D的信息提取關(guān)鍵特征并減少計(jì)算量。本文利用全局池化層代替殘差網(wǎng)絡(luò)中的最大池化層,將特征向量導(dǎo)入殘差網(wǎng)絡(luò)的輸出層進(jìn)行求解,即可獲得分類結(jié)果,減少了參數(shù)量,不需要優(yōu)化參數(shù),提高了網(wǎng)絡(luò)訓(xùn)練效率,減輕了擬合程度。因此,運(yùn)用GAP代替全連接層有助于提高網(wǎng)絡(luò)性能,提升識別率。
圖3 全局平均池化原理圖
1.3.1 BN
BatchNorm模塊能加速神經(jīng)網(wǎng)絡(luò)的收斂并提升識別準(zhǔn)確率,因而被廣泛使用。Batch- Norm由特征居中、特征縮放和放射變換3個步驟實(shí)現(xiàn)。給定輸入特征x∈RN×C×H×W,其中N、C、H、W為batch的大小、通道數(shù)、輸入特征的高度和寬度。特征居中、縮放、仿射公式如下:
xm=x-μ
(1)
(2)
Y=γxs+β
(3)
式中,xm為feature map中心,xs為特征縮放值,Y為仿射變換后的結(jié)果,γ是用來調(diào)整數(shù)值分布的方差大小,β是用來調(diào)節(jié)數(shù)值均值的位置。γ、β是由反向傳播過程中學(xué)習(xí)得到,γ的默認(rèn)值是1,β的默認(rèn)值是0。μ和σ為feature map 所有像素值點(diǎn)總數(shù)的平均值和方差,在歸一化的過程中,使其滿足均值為0,方差為1的分布,其公式為:
(4)
(5)
式中,μ為像素點(diǎn)總數(shù)的平均值,σ為像素點(diǎn)總數(shù)的方差值;xi為該圖像樣本中第i個像素點(diǎn)值;n表示該樣本總像素點(diǎn)數(shù),∈為保證分母恒大于0的常數(shù)值。
BN通過歸一化方程對樣本進(jìn)行歸一化操作將數(shù)據(jù)規(guī)整到統(tǒng)一的區(qū)間,減輕了數(shù)據(jù)的發(fā)散度,降低了網(wǎng)絡(luò)的學(xué)習(xí)難度。且在一定程度上保留原數(shù)據(jù)的分布。
1.3.2 RBN
通過BatchNorm的均值和方差歸一化處理使得神經(jīng)網(wǎng)絡(luò)的訓(xùn)練更加穩(wěn)定,通過使用小批量統(tǒng)計(jì)信息將中間特征限制在歸一化分布內(nèi),從而減輕了訓(xùn)練難度,但在歸一化過程中忽略了樣本之間的表示差異。為了解決上述問題,提出了RBN(representative batch normalization)模型,其中RBN分為兩個步驟:1)中心化校準(zhǔn)(centering calibration);2)縮放校準(zhǔn)(scaling calibration) 。中心化步驟是為了增強(qiáng)信息特征,減少噪聲:縮放步驟是為了讓特征服從一個穩(wěn)定的分布,其原理如圖4所示。
圖4 BN(左)和RBN(右)工作流程圖
1)中心化校準(zhǔn)。中心化校準(zhǔn)在原BatchNorm層的居中操作前添加中心校準(zhǔn)環(huán)節(jié)。若給定輸入特征為X,定心校準(zhǔn)如式(6)所示:
Xm=X+ωm⊙Km
(6)
式中,輸入特征X∈RN×C×H×W,Xm為定心校準(zhǔn)值,其中N、C、H、W為batch的大小、通道數(shù)、輸入特征的高度和寬度。ωm是一個形狀為(N,C,1,1)的可學(xué)習(xí)變量,Km是各個實(shí)例特征的統(tǒng)計(jì)量且Km∈RN×C×H×W,⊙是將兩個特征散步同一形狀的點(diǎn)積運(yùn)算符。通過定心校準(zhǔn)后,feature map的中心公式為:
XM=Xm-E(Xm)
(7)
式中,XM為特征中心,E(Xm)為中心校準(zhǔn)后的均值。
2)縮放校準(zhǔn)??s放操作是添加在特征縮放之后的校準(zhǔn)環(huán)節(jié),可對特征的方差進(jìn)行縮放,并得到特征的單位方差。然而,均值縮放會導(dǎo)致特征強(qiáng)度不穩(wěn)定,即某些通道的特征遠(yuǎn)大于其他通道的特征。因此,在縮放操作后采用縮放校準(zhǔn)來校準(zhǔn)特征強(qiáng)度??s放校準(zhǔn)公式如下:
XS=XS·R(ωv⊙Ks+ωb)
(8)
式中,ωv、ωb∈R1×c×1×1是可學(xué)習(xí)變量,R()為限制函數(shù),本文采用Sigmoid函數(shù)作為限制函數(shù)抑制極值,Ks是實(shí)例特征XS的統(tǒng)計(jì)量。
RBN采用了簡單而有效的特征校準(zhǔn)方案,保留了樣本中各實(shí)例的特征,并產(chǎn)生了更穩(wěn)定的特征分布。定心校準(zhǔn)增強(qiáng)了信息特征并削弱了噪聲;縮放校準(zhǔn)限制了特征強(qiáng)度以形成更穩(wěn)定的特征分布。用RBN取代BN可較大限度地提高神經(jīng)網(wǎng)絡(luò)模型的性能。
1.4.1 ResNet網(wǎng)絡(luò)的優(yōu)缺點(diǎn)
隨著深度學(xué)習(xí)的發(fā)展,自AlexNet網(wǎng)絡(luò)誕生以來,許多學(xué)者選擇通過加深網(wǎng)絡(luò)深度的方法解決目標(biāo)檢測、分類等任務(wù),雖然取得了較好的效果,但也帶來了一些問題:
1)傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)由一系列卷積層與下采樣層進(jìn)行堆疊得到,在淺層網(wǎng)絡(luò)疊加到一定深度時,會產(chǎn)生梯度消失和梯度爆炸問題。導(dǎo)致網(wǎng)絡(luò)反向傳播過程中無法對前面的網(wǎng)層權(quán)重進(jìn)行有效的調(diào)整。
2)在深度模型上增加更多的網(wǎng)層會導(dǎo)致網(wǎng)絡(luò)退化的現(xiàn)象,即隨著網(wǎng)絡(luò)深度的增加,準(zhǔn)確性達(dá)到飽和,然后迅速下降。這是由于冗余的網(wǎng)層學(xué)習(xí)了非恒等映射的參數(shù)造成的。
ResNet網(wǎng)絡(luò)通過引入一個深度殘差學(xué)習(xí)框架解決了深層網(wǎng)絡(luò)梯度消失(爆炸)的問題,使用shortcut 的連接方式,進(jìn)行恒等映射,不會產(chǎn)生額外的參數(shù),也不會增加計(jì)算復(fù)雜度。以ResNet18為例,ResNet18共有18層,網(wǎng)絡(luò)輸入為224×224,通過卷積和最大池化操作,圖像降維到56×56,且通道數(shù)保持不變。完成前兩步操作后進(jìn)入殘差模塊,每經(jīng)歷一部分殘差模塊圖像降維一半,通道數(shù)則增加到原通道數(shù)的二倍,通過4次殘差網(wǎng)絡(luò)的處理,圖像降維到7×7,此時通道數(shù)為512,最后連接平均池化層和全連接層。
ResNet雖然解決了梯度消失(爆炸)的問題,也可以避免隨著網(wǎng)層的疊加而導(dǎo)致的網(wǎng)絡(luò)退化現(xiàn)象。但在工業(yè)品表面缺陷檢測與分類的使用場景下,仍存在特征提取尺度單一、模型參數(shù)多、資源需求大、收斂速度慢等缺陷。
1.4.2 改進(jìn)的ResNet網(wǎng)絡(luò)
通過設(shè)計(jì)多尺度特征提取模塊,充分提取深淺層的特征信息,并且隨著網(wǎng)絡(luò)寬度的增加,可以有效緩解訓(xùn)練樣本有限的問題。全局平均池化層代替全連接層,減少了參數(shù)量,提高了網(wǎng)絡(luò)訓(xùn)練效率,減輕了殘差網(wǎng)絡(luò)過擬合程度。
在每個殘差塊中,當(dāng)輸入通過卷積操作后,采用RBN層代替BN層,通過中心化校準(zhǔn)和縮放校準(zhǔn),增強(qiáng)信息特征,減少噪聲,并使特征分布更加均勻。再通過線性整流函數(shù)(ReLU,rectified linear unit)進(jìn)行激活,最后通過卷積層和RBN層的處理得到輸出,設(shè)計(jì)框圖如圖5所示。
圖5 殘差塊設(shè)計(jì)框圖
該網(wǎng)絡(luò)首先使用多尺度特征提取和融合模塊對原圖像進(jìn)行卷積操作學(xué)習(xí)特征,然后添加RBN層進(jìn)行數(shù)據(jù)的歸一化處理,保證網(wǎng)絡(luò)性能的穩(wěn)定。然后采用線性整流函數(shù),以提高該模塊的非線性映射能力,函數(shù)關(guān)系如下式所示:
fi(x)=ωi*x+bi
(9)
(10)
其中:x表示多尺度特征提取模塊的輸入;fi(x)為第i個卷積層的的輸出;wi和bi分別表示該模塊的第i個卷積層的權(quán)重和偏置;“*”表示卷積操作;σ(·)表示ReLU激活函數(shù)。最后將得到的f(x)作為ResNet的輸入。
將殘差網(wǎng)絡(luò)結(jié)構(gòu)分為4個階段(當(dāng)輸出空間大小或輸出通道數(shù)要改變時,標(biāo)志著另一個階段的開始)。每個階段有2個BasicBlock,在網(wǎng)絡(luò)末端使用全局平均池化層代替全連接層。網(wǎng)絡(luò)模型架構(gòu)如圖6所示。
圖6 改進(jìn)的ResNet網(wǎng)絡(luò)結(jié)構(gòu)圖
本文的實(shí)驗(yàn)在東北大學(xué)公開的鋼板表面缺陷數(shù)據(jù)集NEU-CLS上進(jìn)行,該數(shù)據(jù)集涵蓋了6類常見的熱軋鋼板表面缺陷,分別為軋制氧化皮(RS),斑塊(Pa),開裂(Cr),點(diǎn)蝕表面(PS),內(nèi)含物(In)和劃痕(Sc)該數(shù)據(jù)集共有1 800張樣本,每個類別300張。訓(xùn)練集與測試集的比例設(shè)置為8∶2。
以搭載Intel酷睿i7-11700kF CPU,內(nèi)存大小32G,Nidia 1660GPU的計(jì)算機(jī)作為實(shí)驗(yàn)硬件基礎(chǔ),實(shí)驗(yàn)軟件環(huán)境基于Windows10操作系統(tǒng)、pytorch1.6深度學(xué)習(xí)框架、python3.7搭建的缺陷檢測框架。
在原有ResNet18、ResNet34、ResNet50上進(jìn)行改進(jìn),采用多尺度輸入代替單一尺度輸入,通過RBN層代替BN層,通過平均池化層代替全連接層得到Multi-scale-RBN-ResNet網(wǎng)絡(luò)。將Multi-scale-RBN-ResNet模型和原有ResNet模型進(jìn)行對比實(shí)驗(yàn),在非遷移學(xué)習(xí)的情況下,訓(xùn)練時每次讀取數(shù)據(jù)的樣本數(shù)為batch size=8,本文提出的網(wǎng)絡(luò)模型在該數(shù)據(jù)集上迭代30次(epoch=30),實(shí)驗(yàn)結(jié)果如圖7所示。
圖7 NET-CLS數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對比圖
由圖可知,隨著迭代次數(shù)的增加,各模型的測試準(zhǔn)確率也隨之提高,最終接近100%。其中,本文提出的模型明顯優(yōu)于傳統(tǒng)殘差網(wǎng)絡(luò)模型,在不使用遷移學(xué)習(xí)的情況下,分類準(zhǔn)確率可達(dá)到100%。其中,Multi-scale-RBN-ResNet18收斂速度最快,并且相對穩(wěn)定,模型的識別性能最為優(yōu)異。
該數(shù)據(jù)集來源于實(shí)際生產(chǎn)中帶有表面缺陷的鋼板并已完成圖像預(yù)處理:將尺寸歸一到200×200、對噪聲進(jìn)行去除、并完成二值化操作,使得缺陷檢測過程中受外界干擾較小,檢測的準(zhǔn)確率達(dá)100%。
本文提出的Multi-scale-RBN-ResNet18網(wǎng)絡(luò)模型和使用NEC-CLS數(shù)據(jù)集的其他方法在分類準(zhǔn)確率上的對比實(shí)驗(yàn),結(jié)果如表1所示。
表1 本文模型與其他的檢測方法對比實(shí)驗(yàn)
其中,在文獻(xiàn)[16]中,提出了一種金字塔特征融合和全局注意力網(wǎng)絡(luò),用于表面缺陷檢測;在文獻(xiàn)[17]中,根據(jù)基線卷積神經(jīng)網(wǎng)絡(luò)在每個階段生成的特征地圖,提出多級特征融合網(wǎng)絡(luò)(MFN)用于融合更多深度信息;在文獻(xiàn)[13]中,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的鋼表面缺陷半監(jiān)督學(xué)習(xí)方法,該方法需要的標(biāo)記樣本較少,并利用偽標(biāo)簽對CNN進(jìn)行了改進(jìn);在文獻(xiàn)[18]中,提出一種用于帶鋼表面檢測的端到端表面缺陷識別系統(tǒng)。該系統(tǒng)基于對稱的環(huán)繞顯著圖進(jìn)行表面缺陷檢測,深度卷積神經(jīng)網(wǎng)絡(luò)直接以缺陷圖像作為輸入,以缺陷類別作為輸出;可對數(shù)據(jù)集中的6類缺陷和無缺陷鋼板進(jìn)行分類。本文提出的模型取得了最高的識別準(zhǔn)確率,驗(yàn)證了該模型的有效性。
為了驗(yàn)證本文提出的網(wǎng)絡(luò)模型對不同工業(yè)品表面缺陷的測試效果,選取阿里天池比賽的鋁型材表面缺陷數(shù)據(jù)集,并結(jié)合鋁型材在生產(chǎn)過程中的常見缺陷類別進(jìn)行實(shí)驗(yàn)驗(yàn)證。大賽數(shù)據(jù)集里有1萬份來自實(shí)際生產(chǎn)中有瑕疵的鋁型材監(jiān)測圖像數(shù)據(jù),本文隨機(jī)選取其中的8個瑕疵類別,每個類別包含200個數(shù)據(jù)。訓(xùn)練集和測試集的比例設(shè)置為8∶2。原始樣本瑕疵種類如圖8所示。
圖8 鋁型材表面缺陷數(shù)據(jù)集
在鋁型材缺陷數(shù)據(jù)集上疊加30個epoch,將本文提出的模型與AlexNet[19]、VGG16[20]和ResNet模型進(jìn)行對比,如圖9所示。由圖可知,對于橘皮、劃痕、擦花缺陷種類,缺陷信息較為接近,且鋁型材的制造與加工處于工況復(fù)雜的場景下,通過小樣本和細(xì)節(jié)缺陷信息的輸入,網(wǎng)絡(luò)分類準(zhǔn)確率仍可達(dá)到98.8%。與AlexNet、VGG16和ResNet網(wǎng)絡(luò)模型相比,Multi-scale-RBN-ResNet18在準(zhǔn)確率和收斂速度兩方面均得到了極大限度的提升。
圖9 鋁型材數(shù)據(jù)集測試準(zhǔn)確率對比圖
本文針對工業(yè)品表面缺陷檢測任務(wù),在ResNet模型的基礎(chǔ)上,添加多尺度特征融合模塊,利用多尺度卷積提取更多尺度的特征;然后,采用RBN層代替BN層,增強(qiáng)了特征信息;最后使用全局平均池化代替全連接層,使輸出與特征類別映射更加直觀,并簡化了網(wǎng)絡(luò)模型。在NEU-CLS數(shù)據(jù)集上識別率達(dá)100%,在阿里天池鋁型材表面數(shù)據(jù)集上識別率達(dá)98.8%。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的網(wǎng)絡(luò)模型對工業(yè)品表面陷檢測效果比較理想,性能優(yōu)于其他同類模型。