◆施愷杰 王穎 王嘉璐 錢立峰 徐力晨 楊昊天 顧乾輝
(南昌工程學(xué)院 信息工程學(xué)院 江西 330096)
在汽車發(fā)電機、汽油發(fā)電機等領(lǐng)域,電子換向器起整流的作用,使電樞繞組中的電流方向是交變的,從而來保證電磁轉(zhuǎn)矩方向始終不變,所以它的質(zhì)量保障具有重要意義。但是在其生產(chǎn)的過程中,由于原材料的受限、環(huán)境溫濕度的差異以及加工過程中的失誤等多方面的原因,很大可能會導(dǎo)致產(chǎn)品表面出現(xiàn)損壞和缺陷。19世紀(jì)中期,產(chǎn)品表面缺陷的檢測[1]大部分還是傳統(tǒng)的檢測方法,以人工檢測[2]為主。但是人工檢測成本較高、效率低下,而且由于產(chǎn)品表面缺陷細(xì)微,加上工廠光線亮度和周圍環(huán)境的種種條件限制,易產(chǎn)生視覺疲勞,從而造成誤檢、漏檢現(xiàn)象[3]的產(chǎn)生,所以一種低成本高效率的表面缺陷檢測方法亟待開發(fā)。
20世紀(jì)以來,人們對于產(chǎn)品質(zhì)量要求的不斷提高,傳統(tǒng)的人工檢測技術(shù)產(chǎn)生的諸多原因已經(jīng)完全不能達到令人滿意的效果了。因此,基于傳統(tǒng)的數(shù)字圖像處理自動化檢測技術(shù)受到了人們的廣泛重視,主要可以分為基于紋理檢測算法[4]、閾值檢測算法[5]、邊緣檢測算法[6]等。雖然這類算法在自動化缺陷檢測方面相對于人工檢測具備了成本低、效率高等優(yōu)點,但是它對于圖像質(zhì)量要求較高,例如基于紋理的檢測算法,它對于原圖像的對比度要求很高,圖像中稍有噪聲干擾會嚴(yán)重影響檢測的結(jié)果。所以對于產(chǎn)品表面缺陷的不穩(wěn)定性,傳統(tǒng)的數(shù)字圖像處理方法普適性不高。
鑒于以上原因,本文提出了一種采用深度學(xué)習(xí)的技術(shù)來對缺陷進行檢測,優(yōu)勢在于不需要針對目標(biāo)的特征來設(shè)計特定的算法對其進行特征的提取,這大大提高了算法的靈活性和普適性。該方法在實驗過程中取得了較好的效果,可行性較高,有效提高了效率,為電子換向器產(chǎn)品缺陷檢測的自動化檢測開辟了新途徑[7]。
對于電子換向器產(chǎn)品表面缺陷來說,有些可能是很細(xì)微的裂縫缺陷,有些則是較大面積的缺口等,所以模型要重視對圖像中的細(xì)節(jié)和邊緣信息的保留。所以本文設(shè)計了一個兩段式的網(wǎng)絡(luò)模型,第一部分是將原圖像進行像素級的分割,將每一個像素作為分割網(wǎng)絡(luò)[8]的訓(xùn)練樣本輸入,然后針對損失值調(diào)整權(quán)重,第二部分則是決策網(wǎng)絡(luò),對全局圖像而不是單純的局部特征進行考慮,最終判斷原圖像是否為缺陷圖像,整個模型網(wǎng)絡(luò)結(jié)構(gòu)[9]如下圖1所示:
圖1 原模型網(wǎng)絡(luò)結(jié)構(gòu)圖
本文采用的是加權(quán)平均法,將紅綠藍(lán)三個分量用不同的權(quán)值進行加權(quán)平均后能得到較合理的灰度圖像。計算公式如下:
式中,F(xiàn)(i,j)表示圖像矩陣函數(shù),R(i,j)、G(i,j)、B(i,j)為彩色圖像的三個分量。
本文在原來的基礎(chǔ)上進行了一些改進,將最后一層的卷積層變?yōu)?×5 大小卷積核的卷積層,能夠在原來的基礎(chǔ)上省去一半的參數(shù)量,避免了參數(shù)過多導(dǎo)致的過擬合現(xiàn)象的產(chǎn)生。另外,由于經(jīng)過最大池化層,縮小了特征圖像的分辨率,所以本文在模型中加入了上采樣層,采用雙線性插值法進行上采樣操作。其核心思想就是在X 和Y 方向上各進行一次插值。雙線性插值法相對于最鄰近點法而言,效果更連續(xù),而且對于圖像信息的保存也更加完好,使用應(yīng)用于工業(yè)產(chǎn)品表面缺陷圖像。首先對X 方向上進行線性插值,計算公式如下:
模型有兩個網(wǎng)絡(luò)主體,改進之后的模型將原模型中的損失函數(shù)從均方誤差(MSE)改為了二分類的交叉熵函數(shù)(binary_crossentropy)。binary_crossentropy 損失函數(shù)向最后一層權(quán)重的傳遞參數(shù)時,不再跟激活函數(shù)的導(dǎo)數(shù)相關(guān),所以收斂更快,并且交叉熵?fù)p失函數(shù)更適合做分類問題,在分類問題中,該損失函數(shù)能得到線性的梯度,有效防止梯度消失現(xiàn)象的產(chǎn)生。而MSE 相對于binary_crossentropy 來說,更適合做回歸問題。所以模型改變前后具體參數(shù)如表1所示。
表1 模型改變前后參數(shù)
本次實驗的數(shù)據(jù)集使用的是公開的KolektorSDD 數(shù)據(jù)集,在其表面上存在微小的破損或裂縫,大部分均為1~2 厘米的裂縫。數(shù)據(jù)集中包含了50 種編寫的電子換向器,每種有20 張圖片。下圖2 為一些正樣本圖像。
圖2 部分正樣本數(shù)據(jù)集
考慮到該數(shù)據(jù)集樣本相對較少,共有1000 個樣本,并且比例不均的原因,需要對數(shù)據(jù)集進行樣本增強和擴充,防止在后續(xù)的模型訓(xùn)練過程中出現(xiàn)因為數(shù)據(jù)集不充分導(dǎo)致的過擬合現(xiàn)象的產(chǎn)生。并且為了使樣本比例均衡,本文控制了正負(fù)樣本數(shù)量比為1:1,具體如表2。
表2 缺陷數(shù)據(jù)集
本實驗在原始圖像輸入到分割網(wǎng)絡(luò)后,模型會有一個分割輸出對應(yīng)分割后的圖像,這里稱其為mask 圖像,如下圖3所示。
圖3 分割網(wǎng)絡(luò)輸出的mask 圖像
本實驗記錄了模型改進前后訓(xùn)練的損失值(class_output_loss)和準(zhǔn)確度(class_output_acc)的變化曲線,其中參數(shù)設(shè)計為:初始學(xué)習(xí)率(Ir)為0.0001;batch_size 為6,優(yōu)化器(optimizer)為Adam。改進前圖像如圖4所示。
圖4 模型改進前損失圖
從上圖可以明顯看到,訓(xùn)練集和驗證集整體呈現(xiàn)下降的趨勢,但是loss 值隨著epoch(次/百)緩慢降低,收斂速度較慢,而且驗證集出現(xiàn)了明顯的振蕩現(xiàn)象。
圖5 模型改進后損失圖
上圖為模型改進后,比較前后兩幅圖像可以看出,在模型改進之后,下降速度和收斂速度都有了很大的提高,loss 值很快就趨于了平緩,而且無論是訓(xùn)練集還是驗證集都沒有再出現(xiàn)振蕩的現(xiàn)象。
在本實驗中對于模型的評價設(shè)置了3 個指標(biāo),分別為準(zhǔn)確率、查準(zhǔn)率和查全率,其公式如下:
上式中,存在缺陷的樣本被預(yù)測正確為TP,沒有缺陷的樣本被預(yù)測正確為TN,存在缺陷的樣本被預(yù)測錯誤為FP,沒有缺陷的樣本被預(yù)測錯誤為FN,詳細(xì)數(shù)值如表3 所列:
表3 測試樣本統(tǒng)計結(jié)果
從上表中可以看出,模型對于電子換向器產(chǎn)品表面缺陷的檢測,查全率高,大部分產(chǎn)品表面缺陷樣本均能被正確的分類,漏檢的情況低;準(zhǔn)確率和查準(zhǔn)率均為96%,取得了預(yù)期之中較好的結(jié)果。
本文針對電子換向器產(chǎn)品的表面缺陷,提出了基于深度學(xué)習(xí)的電子換向器產(chǎn)品表面缺陷檢測方法進行自動化的檢測,對自己設(shè)計的兩段式模型進行改進。實驗結(jié)果表明,改進后的模型樣本準(zhǔn)確度達到接近96%,收斂速度更快,性能普遍得到提高,該方法在能有效識別缺陷,對保障產(chǎn)品安全具有重要意義。