肖玉麟,路 凱,2*,張 洋,2,劉 曄,江 超,田潤(rùn)強(qiáng)
(1. 許昌學(xué)院信息工程學(xué)院,許昌 461000;2. 河南省偏振感知與智能信號(hào)處理國(guó)際聯(lián)合實(shí)驗(yàn)室,許昌 461000)
羊絨和羊毛兩種纖維的外觀和化學(xué)物理特性都非常相似,因此它們的鑒別一直是紡織領(lǐng)域的難題。傳統(tǒng)的羊絨識(shí)別方法采用人工顯微鏡檢測(cè)法,即通過(guò)人工在顯微鏡下觀察放大的纖維圖像中的特征來(lái)識(shí)別。然而,這種依賴人類主觀觀察的方法效率低且人力成本高。多年以來(lái),人們對(duì)相似纖維的鑒別進(jìn)行了深入探索,并提出了多種鑒別方法,其中主要包括DNA 分析法、蛋白質(zhì)組學(xué)檢測(cè)法、近紅外光譜法以及基于圖像處理技術(shù)和計(jì)算機(jī)視覺(jué)的方法等。
DNA分析法是一種可靠的技術(shù),可以用來(lái)檢測(cè)混合纖維的比例?;赥aqMan 的熒光定量PCR技術(shù),可以用于擴(kuò)增DNA并定量檢測(cè)混合纖維的比例,這種方法可以用于動(dòng)物纖維的鑒別[1]。
利用近紅外光譜法可以根據(jù)有機(jī)物中含氫基團(tuán)對(duì)光的吸收差異特性,對(duì)相似動(dòng)物纖維中的成分進(jìn)行分析[2]。周金鳳[2]采用了不同重量比的羊絨和羊毛纖維進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)中使用了近紅外光譜儀來(lái)獲取混合纖維的光譜信號(hào),并使用這些信號(hào)建立數(shù)學(xué)回歸模型來(lái)分析纖維的含量。
動(dòng)物纖維的主要成分是蛋白質(zhì),而不同種類動(dòng)物纖維所包含蛋白質(zhì)中的氨基酸比例也不同,所以可以通過(guò)檢測(cè)纖維中蛋白質(zhì)的氨基酸成分來(lái)確定混合纖維的組成比例。張娟[3]采用還原法和酶解法制備了羊絨和羊毛纖維的蛋白質(zhì)溶液,然后使用MALDI TOF5800 質(zhì)譜儀掃描干燥后的溶液,質(zhì)譜儀可以生成多肽質(zhì)譜圖的特征峰值,憑此可以確定溶液中所含的不同氨基酸序列,從而判斷混合纖維中羊絨和羊毛的含量。
基于計(jì)算機(jī)圖像處理和計(jì)算機(jī)視覺(jué)的方法主要是從纖維的顯微鏡圖像中提取視覺(jué)特征,并以此來(lái)識(shí)別纖維的類別。Xing 等[4]從纖維圖像中提取四個(gè)形態(tài)特征(鱗片高度、纖維直徑、徑高比、鱗片平均面積),根據(jù)這四個(gè)特征來(lái)識(shí)別羊絨和羊毛兩類纖維。Zhu 等[5]利用離散小波變換取得羊毛和羊絨纖維圖像表面紋理的特征,然后使用支持向量機(jī)得到95.2%的識(shí)別率。
最近幾年,基于深度學(xué)習(xí)的方法備受研究者關(guān)注,這類方法與基于手動(dòng)選擇特征的方法不同,而是使用端到端的方式,將纖維圖像輸入卷積網(wǎng)絡(luò),通過(guò)一個(gè)網(wǎng)絡(luò)完成特征提取和分類。從明芳等[6]使用羊絨和羊毛樣本訓(xùn)練Mask R-CNN模型,測(cè)試集的識(shí)別率達(dá)到95%以上。
本文選用了經(jīng)典的殘差網(wǎng)絡(luò)Resnet-34 作為識(shí)別模型,用于從羊絨和羊毛的顯微鏡圖像中提取特征并進(jìn)行分類,嘗試尋求一種快速、準(zhǔn)確的纖維識(shí)別方法,為實(shí)現(xiàn)纖維的自動(dòng)識(shí)別提供算法支持。
研究中首先采集羊絨和羊毛纖維的顯微鏡圖像,然后按照以下幾個(gè)步驟進(jìn)行實(shí)驗(yàn):對(duì)樣本圖像進(jìn)行預(yù)處理、在訓(xùn)練集上訓(xùn)練網(wǎng)絡(luò)模型、在驗(yàn)證集上識(shí)別纖維類別、數(shù)據(jù)集上進(jìn)行五折交叉驗(yàn)證。
高質(zhì)量的圖像對(duì)于保證識(shí)別效果是必不可少的,掃描電子顯微鏡的成像原理是通過(guò)使用電子束掃描物體來(lái)獲取物體表面的詳細(xì)信息。與光學(xué)顯微鏡相比,掃描電子顯微鏡的視場(chǎng)光線分布均勻,干擾因素較少,可以生成高分辨率的物體表面圖像,且生成的圖像具有大景深和強(qiáng)烈的立體感,用其拍攝動(dòng)物纖維圖像能夠清晰地顯示纖維鱗片的完整形態(tài)。實(shí)驗(yàn)中使用的掃描電子顯微鏡系統(tǒng)設(shè)備型號(hào)為日立TM3000,該設(shè)備如圖1 所示。實(shí)驗(yàn)中用該顯微鏡采集羊絨和羊毛纖維圖像,放大倍數(shù)為1000倍,如圖2所示。
圖1 日立TM3000掃描電子顯微鏡系統(tǒng)
圖2 日立TM3000臺(tái)式掃描電子顯微鏡采集的纖維圖像
殘差網(wǎng)絡(luò)(residual network,ResNet)是一種經(jīng)典的深度卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),其主要思想是引入殘差連接(residual connection)或短連接(shortcut),來(lái)解決深度神經(jīng)網(wǎng)絡(luò)模型中的梯度爆炸與梯度消失的問(wèn)題,從而訓(xùn)練更深的網(wǎng)絡(luò)[7]。殘差網(wǎng)絡(luò)通過(guò)在每個(gè)殘差塊(residual block)中添加一個(gè)短連接,將原始輸入直接添加到輸出上,即使在后續(xù)的層中也可以直接訪問(wèn)到原始輸入,如圖3所示。這種設(shè)計(jì)使得網(wǎng)絡(luò)可以更容易地學(xué)習(xí)恒等映射,并且減少了訓(xùn)練中的信息丟失,從而提高了網(wǎng)絡(luò)的精度和穩(wěn)定性。通過(guò)使用殘差塊構(gòu)建網(wǎng)絡(luò),ResNet 可以達(dá)到非常深的深度,同時(shí)保持較低的錯(cuò)誤率。
圖3 殘差學(xué)習(xí)結(jié)構(gòu)示例[7]
ResNet 是由多個(gè)殘差塊組成的網(wǎng)絡(luò)結(jié)構(gòu),每個(gè)殘差塊包括兩個(gè)卷積層和一條短連接。在訓(xùn)練過(guò)程中,ResNet 采用了批量歸一化等方法,以提高模型的訓(xùn)練速度和性能。以34 層的ResNet模型為例,其結(jié)構(gòu)如圖4所示。
圖4 ResNet網(wǎng)絡(luò)結(jié)構(gòu)[7]
在圖4 中,該網(wǎng)絡(luò)通過(guò)使用5 組不同的卷積核來(lái)進(jìn)行特征提取。每組卷積核用不同顏色表示,并在每組卷積后對(duì)得到的特征圖進(jìn)行下采樣。此外,每經(jīng)過(guò)兩個(gè)卷積操作會(huì)進(jìn)行一次短連接,圖4中用黑色實(shí)線表示。當(dāng)短連接的兩個(gè)特征圖維度不一致時(shí),會(huì)在進(jìn)行1×1 卷積運(yùn)算后再進(jìn)行1/2 的下采樣,圖中用黑色虛線表示。最后,網(wǎng)絡(luò)采用Softmax分類器進(jìn)行分類。
實(shí)驗(yàn)中使用的操作系統(tǒng)是Ubuntu 16.04,深度學(xué)習(xí)框架使用的是PyTorch,計(jì)算機(jī)配置的顯卡為NVIDIA 3060,12 GB 顯存,CPU 為Intel i5 10400 F,主頻為2.90 GHz,內(nèi)存16 GB。
數(shù)據(jù)集中包含了675幅纖維圖像,其中羊絨纖維343 幅、羊毛纖維332 幅。為了實(shí)驗(yàn)結(jié)果更有普遍意義,實(shí)驗(yàn)中使用了五折交叉驗(yàn)證。數(shù)據(jù)集被劃分為5 份,進(jìn)行5 次實(shí)驗(yàn),每次實(shí)驗(yàn)中,其中4 份作為訓(xùn)練集,剩余1 份作為驗(yàn)證集,即每次使用540 幅圖像用來(lái)訓(xùn)練,135 幅圖像進(jìn)行驗(yàn)證。最終將5次實(shí)驗(yàn)的平均值作為模型的結(jié)果,數(shù)據(jù)集的劃分情況如圖5所示。
圖5 五折交叉驗(yàn)證
當(dāng)訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)模型時(shí),如果訓(xùn)練數(shù)據(jù)較少,很容易出現(xiàn)過(guò)擬合問(wèn)題。為了應(yīng)對(duì)這個(gè)問(wèn)題,實(shí)驗(yàn)中采用了數(shù)據(jù)增強(qiáng)技術(shù)來(lái)增加纖維樣本圖像的數(shù)量及多樣性,從而擴(kuò)充訓(xùn)練集,這樣降低模型的過(guò)擬合并提高模型的泛化能力。在實(shí)驗(yàn)中,我們使用了多種數(shù)據(jù)增強(qiáng)方法,主要有水平/垂直翻轉(zhuǎn)、隨機(jī)比例縮放圖像大小、隨機(jī)角度旋轉(zhuǎn)等。圖6為對(duì)羊絨纖維圖像進(jìn)行增強(qiáng)的示例。
圖6 數(shù)據(jù)增強(qiáng)示例
學(xué)習(xí)率是卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練中的一個(gè)關(guān)鍵超參數(shù),較大的學(xué)習(xí)率可能導(dǎo)致結(jié)果難以收斂,而較小的學(xué)習(xí)率會(huì)導(dǎo)致收斂速度很慢。實(shí)驗(yàn)中使用動(dòng)量(momentum)方法優(yōu)化梯度下降,學(xué)習(xí)率的初始值設(shè)置為0.001,權(quán)重衰減速率(weight decay)系數(shù)是5×10-4,模型使用交叉熵作為損失函數(shù),使用網(wǎng)絡(luò)在ImageNet 上訓(xùn)練的權(quán)重作為網(wǎng)絡(luò)的初始權(quán)重,batch size 為32,即訓(xùn)練時(shí)每批次送入到模型中的樣本數(shù)量為32。
實(shí)驗(yàn)中可視化顯示了訓(xùn)練過(guò)程中損失和準(zhǔn)確率的變化,一共訓(xùn)練了200 輪(Epoch),訓(xùn)練過(guò)程中的損失變化和訓(xùn)練時(shí)驗(yàn)證集的準(zhǔn)確率變化分別如圖7(a)和圖7(b)所示。
圖7 損失和準(zhǔn)確率變化曲線
從圖7可以發(fā)現(xiàn),訓(xùn)練時(shí)損失剛開(kāi)始迅速下降且準(zhǔn)確率迅速上升,從第25輪(Epoch)的位置開(kāi)始,損失緩慢下降,同時(shí)準(zhǔn)確率也緩慢上升,到第175 輪位置上基本上收斂。從圖7(b)可以看到,訓(xùn)練到第175輪時(shí),曲線開(kāi)始變得平緩且不再上升,說(shuō)明訓(xùn)練已經(jīng)達(dá)到比較充分的程度,最后得到的平均識(shí)別率是96.56%。將本實(shí)驗(yàn)與其他研究方法進(jìn)行比較,結(jié)果見(jiàn)表1,其他幾種方法對(duì)羊絨和羊毛纖維的識(shí)別準(zhǔn)確率都未超過(guò)96%,低于本文提出的方法。
表1 與其他方法的比較
實(shí)驗(yàn)中使用類別熱力圖(class activation map,CAM)來(lái)觀察殘差網(wǎng)絡(luò)對(duì)纖維圖像的哪些位置更關(guān)注,CAM 通過(guò)使用模型中類別特定的權(quán)重來(lái)將最后一個(gè)卷積層的特征圖投影到輸入圖像上,以顯示不同類別的特征響應(yīng)區(qū)域。如圖8所示。
圖8 羊毛與羊絨熱力圖
圖8中紅色代表權(quán)重值較大,表示該位置對(duì)類別判斷的貢獻(xiàn)更大;藍(lán)色代表權(quán)重較小,即該位置對(duì)類別判斷的貢獻(xiàn)小,從中也可以看出纖維更關(guān)注圖像中纖維中間部分表面鱗片的紋理,通過(guò)熱力圖有助于從直觀上理解檢測(cè)模型內(nèi)部的工作機(jī)制。
本文提出了一種基于殘差網(wǎng)絡(luò)的相似動(dòng)物纖維檢測(cè)方法,該方法能夠較好地鑒別羊絨和羊毛這兩種動(dòng)物纖維。實(shí)驗(yàn)中首先對(duì)采集的樣本進(jìn)行五次劃分,使用五折交叉驗(yàn)證的方法訓(xùn)練模型和測(cè)試樣本。訓(xùn)練時(shí)使用數(shù)據(jù)增強(qiáng)方法以減小過(guò)擬合,通過(guò)五次訓(xùn)練和測(cè)試,得到平均識(shí)別率為96.56%,能夠?yàn)閷?shí)現(xiàn)纖維的自動(dòng)識(shí)別提供算法支持。