陳法法,鄧斌,劉莉莉,陳保家,肖文榮
(三峽大學(xué) 水電機械設(shè)備設(shè)計與維護湖北省重點實驗室,湖北宜昌 443002)
帶鋼作為工業(yè)領(lǐng)域中重要的基礎(chǔ)材料,受加工環(huán)境、生產(chǎn)工藝及原材料的影響,其表面極易產(chǎn)生劃痕、孔洞、夾雜物等缺陷[1-2]。針對帶鋼表面缺陷進(jìn)行精準(zhǔn)識別,可以明確帶鋼表面缺陷的主要類別,據(jù)此調(diào)整并改進(jìn)軋制工藝,提升帶鋼成品的產(chǎn)品質(zhì)量[3-4]。然而,帶鋼表面缺陷類型復(fù)雜多樣,部分缺陷形貌相似,區(qū)分度較小,難以有效分類辨識。傳統(tǒng)依賴人工目測對帶鋼表面缺陷進(jìn)行分類辨識,其分類準(zhǔn)確度在很大程度上取決于檢測人員的檢測經(jīng)驗,同時由于長時間的重復(fù)勞動,容易產(chǎn)生視覺疲勞,準(zhǔn)確度較低[5-6]。
在基于視覺圖像進(jìn)行帶鋼表面缺陷辨識的過程中,由于帶鋼表面缺陷類型復(fù)雜,缺陷特征多樣,部分不同缺陷之間形貌相似,而同類缺陷之內(nèi)又存在較大差異,難以有效區(qū)分[7-8]。為了實現(xiàn)對帶鋼表面缺陷的有效辨識,首先需要構(gòu)造能夠有效表征帶鋼表面缺陷的特征集合。為此,本文從帶鋼表面的灰度特征和紋理特征出發(fā),從不同角度構(gòu)建表征帶鋼表面缺陷的混合域特征集,以期實現(xiàn)對帶鋼表面缺陷的精確定量描述。
隨后,為了實現(xiàn)對帶鋼表面缺陷的自動辨識,還需要構(gòu)建智能分類模型?,F(xiàn)今,部分文獻(xiàn)正在采用深度學(xué)習(xí)等先進(jìn)的智能分類模型,深度學(xué)習(xí)對于特征向量規(guī)模龐大的大數(shù)據(jù)分類辨識場合,其優(yōu)勢無可比擬[9-10]。但是,在實際工程應(yīng)用中,對于特征向量規(guī)模不大的小樣本分類辨識場合,支持向量機(SVM)在算法復(fù)雜度、運行效率及泛化能力等方面依舊具有一定的優(yōu)勢[11-12]。在利用SVM 進(jìn)行分類辨識的過程中,多核相對于單核在解決小樣本、非線性問題等方面具有獨特優(yōu)勢,尤其在面對區(qū)分度較小的帶鋼表面缺陷特征的分類辨識方面,魯棒性更高,泛化能力更強。
為此,本文設(shè)計了基于混合域特征集與MK-SVM的帶鋼表面缺陷分類辨識方法。首先,將預(yù)處理后的缺陷圖像轉(zhuǎn)化為灰度圖像,提取帶鋼表面缺陷的灰度特征和紋理特征,構(gòu)建混合域特征集,然后建立多核支持向量機的分類辨識模型,通過K 重交叉驗證和網(wǎng)格搜索對核函數(shù)參數(shù)和權(quán)值參數(shù)進(jìn)行優(yōu)化,最后將獲取的混合域特征集輸入給優(yōu)化后的多核SVM 分類器實現(xiàn)對帶鋼表面缺陷的分類辨識。
為了對帶鋼表面缺陷進(jìn)行準(zhǔn)確定量描述,本文以灰度圖像為基礎(chǔ),提取帶鋼表面缺陷的灰度特征和紋理特征,構(gòu)建帶鋼表面缺陷的混合域特征集。
1.1.1 灰度特征參數(shù)
灰度特征是圖像識別領(lǐng)域中最為直觀的特征參數(shù)之一,不因圖像旋轉(zhuǎn)或尺寸變化而改變。灰度特征參數(shù)是在圖像的灰度直方圖的基礎(chǔ)上通過統(tǒng)計計算來獲取的。設(shè)P(k)為 灰度直方圖中灰度級k出現(xiàn)的概率,則
式中:N為圖像中像素點的總數(shù);N(k)為灰度級為k的像素點個數(shù)。在此基礎(chǔ)上,灰度直方圖的均值、方差、傾斜度、能量、以及熵分別計算如下:
1)均值。反映了圖像的平均灰度值,不同缺陷類別的圖像,其灰度水平有一定差異。
2)方差值。反映了圖像灰度分布的離散程度。
3)傾斜度。反映了圖像灰度直方圖分布偏離均值的對稱情況。直方圖分布越不均勻,傾斜度值則越大。
4)峭度。其值反映像素點灰度值分布的相對平坦性。當(dāng)圖像灰度集中于均值附近,峭度值較小。
5)能量。衡量圖像灰度分布的平均程度。當(dāng)圖像中灰度值分布越均勻,能量值越大。
6)熵。衡量圖像信息的失調(diào)程度。當(dāng)直方圖分布不均勻,即圖像信息失調(diào)度變大,則信息熵增大。
1.1.2 紋理特征參數(shù)
紋理是一種反映圖像中同質(zhì)現(xiàn)象的視覺特征,該類特征指標(biāo)主要表征在缺陷的形狀和大小等方面,不受缺陷圖像自身的顏色和亮度的影響。本文采用灰度共生矩陣[13-14],來計算帶鋼表面缺陷圖像的紋理特征。
設(shè)灰度圖像大小為M×N像素,灰度級為L,f(x,y)為 灰度圖像在像素點 (x,y)處的灰度值,圖像中像元 (x1,y1)的 灰度值為i, 像元 (x2,y2)的 灰度值為j,則圖像的灰度共生矩陣可表示為
式中:1 ≤x1,x2≤M,1 ≤y1,y2≤N;d為生成步長,即兩個像元間的距離; θ為兩像元的連線按順時針方向與橫軸的夾角。文中,設(shè)定步長d=1, 灰度級L=16,θ 取0,45°,90°,135°。為便于計算,通常采用歸一化的概率值表示灰度共生矩陣元素,即
式中s為灰度共生矩陣中各元素之和。
在此基礎(chǔ)上,計算對比度、相關(guān)性、熵、方差、逆差矩以及2 階矩,共6 種紋理特征參數(shù)來描述圖像的紋理特征。各計算式如下:
1)對比度。反映了圖像的清晰度和紋理溝紋深淺的程度,紋理溝紋越深,其對比度越大。
2)相關(guān)度。衡量灰度共生矩陣元素在行或列方向上的相似程度。當(dāng)矩陣元素值均勻相等時,相關(guān)值就大;相反,若矩陣元素值相差很大,則相關(guān)值就小。
式中:ux為矩陣的行均值;為矩陣的列均值,為矩陣的行標(biāo)準(zhǔn)差,為矩陣的列標(biāo)準(zhǔn)差,
3)熵。反映圖像中紋理的復(fù)雜程度和非均勻程度,紋理復(fù)雜程度越高,其熵值越大。
4)方差。反映了紋理的周期,周期越大,方差越大。
式中m為p(i,j)的均值。
5)逆差矩。反映了圖像紋理的同質(zhì)性,是紋理局部變化的度量。紋理越規(guī)則,逆差矩的值越大。
6)角2 階矩。是灰度共生矩陣各元素的平方和,反映圖像紋理的粗細(xì)程度。紋理越粗,2 階矩的值越大。
支持向量機(SVM)是一種基于結(jié)構(gòu)風(fēng)險最小化原理的機器學(xué)習(xí)方法,在處理小樣本、非線性和高維模式識別問題上具有顯著的優(yōu)勢。目前,在實際運用中常用的核函數(shù)包括線性核函數(shù)、多項式核函數(shù)和徑向核函數(shù)等。
線性核函數(shù)表達(dá)式為
多項式核函數(shù)表達(dá)式為
式中:g>0; coef0≥0;q≥1。
徑向基核函數(shù)表達(dá)式為
多核相對于單核在解決小樣本、非線性問題等方面具有獨特的優(yōu)勢,尤其在面對區(qū)分度較小的帶鋼表面缺陷特征的分類辨識方面,魯棒性更高,泛化能力更強。為此,本文設(shè)計多核支持向量機,進(jìn)行帶鋼表面缺陷特征的辨識和分類。
多核函數(shù)一般表達(dá)式為
多核函數(shù)可由不同的基本核組成,在此選用泛化能力較強的多項式核函數(shù)和學(xué)習(xí)能力較強的徑向基函數(shù)構(gòu)造多核支持向量機MK-SVM,其表達(dá)式為
式中: c oef0默 認(rèn)為0;q為 多項式階數(shù); σ為高斯核帶寬;n為多核權(quán)重因子。
在帶鋼表面缺陷的分類辨識過程中,首先提取帶鋼表面缺陷的灰度特征和紋理特征,構(gòu)建混合域特征集,根據(jù)缺陷分類辨識對特征指標(biāo)的敏感程度對特征指標(biāo)進(jìn)行優(yōu)化選擇,去除不相關(guān)的非敏感特征,然后建立多核支持向量機的分類辨識模型,通過K 重交叉驗證和網(wǎng)格搜索對核函數(shù)參數(shù)和權(quán)值參數(shù)進(jìn)行優(yōu)化,最后將獲取的混合域特征集輸入給優(yōu)化后的MK-SVM 分類器實現(xiàn)對帶鋼表面缺陷的分類辨識。帶鋼表面缺陷分類模型結(jié)構(gòu)如圖1 所示。
圖1 帶鋼表面缺陷分類模型
帶鋼表面缺陷分類模型具體步驟如下:
步驟1 對帶鋼表面缺陷圖像進(jìn)行濾波去噪、特征增強處理。
步驟2 基于預(yù)處理后的灰度圖像,提取帶鋼表面缺陷的灰度特征和紋理特征。
步驟3 根據(jù)缺陷分類辨識對特征指標(biāo)的敏感程度對特征指標(biāo)進(jìn)行優(yōu)化選擇,去除相關(guān)性較小的非敏感特征,構(gòu)建表征帶鋼表面缺陷的混合特征集。
步驟4 建立MK-SVM 的分類辨識模型,通過K 重交叉驗證和網(wǎng)格搜索優(yōu)化核函數(shù)參數(shù)和權(quán)值參數(shù),利用訓(xùn)練集對優(yōu)化后的MK-SVM 進(jìn)行訓(xùn)練。
步驟5 使用測試集對訓(xùn)練后的MK-SVM 模型進(jìn)行測試驗證,得到分類結(jié)果。
為了驗證本文方法的有效性和適用性,采用東北大學(xué)宋克臣博士在國內(nèi)某大型鋼廠采集到的帶鋼表面圖像[15]。圖像采集的硬件配置主要包括光源和相機,其中光源為LED,型號為HLND-1 200-SW2;通過Balser 公司型號為acA640-90uc 的4 臺面陣彩色CCD 相機獲取帶鋼表面的缺陷圖像,其分辨率為658×492,最大幀數(shù)為90 fps。為了提高圖像處理效率,設(shè)置圖像尺寸大小為200×200。
帶鋼表面缺陷數(shù)據(jù)集包含6 種典型的熱軋帶鋼表面缺陷,即劃痕、補丁、夾雜物、麻點、銀紋和軋制鱗片,各個缺陷示例如圖2 所示。6 種不同類型表面缺陷分別包含300 個圖像樣本,則數(shù)據(jù)庫共包括1 800 幅灰度圖像,每幅圖像的原始分辨率大小為200×200。
圖2 各類缺陷圖像示例
帶鋼表面的缺陷類型及圖像特征描述如表1 所示。在實際工程應(yīng)用中,為了對帶鋼表面的缺陷進(jìn)行智能檢測與識別,需要對帶鋼表面缺陷的圖像特征進(jìn)行定量描述。為此,本文以灰度圖像為基礎(chǔ),分別提取其灰度特征參數(shù)和紋理特征參數(shù),構(gòu)造帶鋼表面缺陷的特征集,從不同角度量化帶鋼的表面缺陷特征。
表1 帶鋼表面的缺陷類型及特征描述
1)灰度特征
帶鋼表面不同缺陷圖像的灰度分布直方圖如圖3 所示。由圖3 可以看出,劃痕缺陷集中在左側(cè)的低灰度值區(qū)域,直方圖上升和衰減趨勢都較快,呈現(xiàn)尖峰特性。補丁缺陷的灰度值分布范圍大,集中分布在中間和左側(cè)的灰度值區(qū)域,含有多個波峰。夾雜物缺陷的灰度值集中分布在中間區(qū)域,直方圖左側(cè)呈垂直上升趨勢,右側(cè)呈梯度衰減。麻點缺陷圖像的灰度值集中分布在右側(cè)高灰度值區(qū)域。銀紋缺陷的灰度值集中于較高灰度值區(qū)域,分布范圍較大,近似于正態(tài)分布。軋制鱗片缺陷的灰度值集中在灰度值較低的區(qū)域。
圖3 不同帶鋼表面缺陷圖像的灰度分布直方圖
對灰度直方圖進(jìn)行統(tǒng)計計算,得到表征帶鋼表面缺陷的定量灰度特征,如表2 所示。為了直觀觀察灰度特征指標(biāo)對帶鋼表面缺陷的可分性,從樣本庫中對6 種不同的帶鋼表面缺陷隨機各抽取50 個樣本,共計300 個樣本,其中樣本編號1 ~ 50 為劃痕缺陷、51 ~ 100 為補丁缺陷、101 ~ 150 為夾雜物缺陷、151 ~ 200 為麻點缺陷、201 ~ 250 為銀紋缺陷、251 ~ 300 為軋制鱗片缺陷。通過計算每一個樣本圖像的6 個灰度特征指標(biāo),繪制不同指標(biāo)下300 個樣本的特征指標(biāo)序列如圖4 所示。
表2 帶鋼表面不同缺陷圖像的灰度特征參數(shù)
圖4 各類帶鋼表面缺陷的灰度特征數(shù)值分布情況
由圖4 可以看出,灰度特征中,平均值、方差、能量和熵4 個特征指標(biāo)在帶鋼的所有表面缺陷類型上都有較為獨立的分布區(qū)間。對于傾斜度和峭度兩個特征在劃痕缺陷下的特征分布具有一定的區(qū)分度,但對于其他缺陷類型的區(qū)分度極小,兼顧考慮灰度特征提取的全面性和敏感性,摒棄了對帶鋼表面缺陷不敏感的傾斜度和峭度兩個灰度特征指標(biāo)。
2)紋理特征
紋理特征是對于包含若干個像素點的某一區(qū)域的灰度變化進(jìn)行統(tǒng)計計算,包括:2 階矩、對比度、相關(guān)度、紋理熵、紋理方差、逆差矩等指標(biāo)。對帶鋼表面缺陷圖像的紋理特征進(jìn)行統(tǒng)計計算,其結(jié)果如表3 所示。
表3 帶鋼表面不同缺陷的紋理特征參數(shù)
為了直觀觀察紋理特征指標(biāo)對帶鋼表面缺陷的可分性,對前述的300 個樣本,通過計算每一個樣本的6 個紋理特征指標(biāo),繪制不同缺陷的紋理特征指標(biāo)序列如圖5 所示。
圖5 各類帶鋼表面缺陷的紋理特征數(shù)值分布情況
由圖5 可以看出,不同帶鋼表面缺陷之間具有較強的可區(qū)分性。通過比較可以發(fā)現(xiàn),方差均值指標(biāo)在補丁和銀紋缺陷的數(shù)值分布上存在一定的混疊現(xiàn)象,但是在其他缺陷上還是具備一定的可分性。兼顧考慮紋理特征提取的全面性和敏感性,在此,保留了紋理特征的6 個特征參數(shù)作為后續(xù)識別模型的特征指標(biāo)輸入。
綜合帶鋼表面缺陷的灰度特征和紋理特征對帶鋼表面缺陷的敏感程度,對每一幅帶鋼表面缺陷圖像各提取4 個灰度特征和6 個紋理特征,構(gòu)成識別帶鋼表面缺陷的混合域特征集。
為了避免混合域特征集中個別數(shù)值較大的特征指標(biāo)在后續(xù)的分類辨識中起主導(dǎo)作用,同時進(jìn)一步統(tǒng)一不同采集硬件和光照環(huán)境下所采集的帶鋼圖像特征指標(biāo)量值,在此將混合域特征集的特征指標(biāo)進(jìn)行歸一化處理。設(shè)N類帶鋼表面缺陷樣本圖像的某一特征指標(biāo)為Ei, 其中1
提取帶鋼表面缺陷各狀態(tài)下的10 個特征指標(biāo)作為后續(xù)辨識模型的特征輸入,其計算結(jié)果如表4所示。從得到的缺陷樣本中隨機抽取6 種狀態(tài)下各100 組數(shù)據(jù)作為訓(xùn)練樣本,構(gòu)建帶鋼表面缺陷的分類辨識模型,剩余樣本作為測試樣本。
表4 基于混合域特征集的特征向量.
為驗證多核支持向量對在帶鋼表面缺陷分類辨識的有效性,本文將多核支持向量機與傳統(tǒng)的多項式核、徑向基核支持向量機作對比實驗。從東北大學(xué)宋克臣博士公開的帶鋼表面缺陷圖像數(shù)據(jù)集中抽取的1 800 個樣本,包含6 類缺陷,每類缺陷各有300 個樣本。取每類缺陷200 個樣本,共1 200 個樣本作為訓(xùn)練樣本,其余600 個作為測試樣本,所有模型的訓(xùn)練和測試均基于64 位的Windows 10 操作系統(tǒng),計算機顯卡配置為Intel(R) UHD Graphics 630,處理器為Intel(R) Core(TM) i7-8700 CPU @ 3.20 GHz,機帶內(nèi)存4.00 GB。利用上述分析得到的特征向量建立樣本特征向量矩陣,通過相同的訓(xùn)練集進(jìn)行訓(xùn)練得到分類模型,并以相同的測試集進(jìn)行分類測試評估。
文中采用K 重交叉驗證法對多項式核函數(shù)中核參數(shù)g和徑向基核函數(shù)中的懲罰因子 γ和核參數(shù)進(jìn) 行優(yōu)化選取。參數(shù) γ的取值范圍設(shè)為g和g的取值范圍設(shè)為步長設(shè)置為20.5, 設(shè)定多項式核函數(shù)的階數(shù)q=1,對數(shù)據(jù)集進(jìn)行5 重交叉驗證的參數(shù)尋優(yōu),尋優(yōu)結(jié)果為g=150、γ=5.656 9和
在MK-SVM 的相關(guān)參數(shù)確定過程中,多核函數(shù)內(nèi)部各個單核函數(shù)的參數(shù)設(shè)置與單一多項式SVM與徑向基SVM 設(shè)置相同,然后再通過網(wǎng)格搜索的方式對MK-SVM 的懲罰因子 γ和多核權(quán)重因子n進(jìn)行優(yōu)化選取,最終得到 γ =5.443,n=0.16。不同辨識模型的分類辨識準(zhǔn)確率如表5 所示。為更直觀的對比不同SVM 的分類效果的優(yōu)劣,繪制各類缺陷分類準(zhǔn)確率折線圖,如圖6 所示。
表5 3 種SVM 對各類缺陷的正確分類量
圖6 3 種SVM 對帶鋼表面各類缺陷分類準(zhǔn)確度
結(jié)合表5、圖6 可以看出,劃痕缺陷的正確分類數(shù)量明顯低于其它缺陷,多項式SVM 識別準(zhǔn)確率為64%,徑向基SVM 的識別準(zhǔn)確率為71%,MK-SVM對劃痕缺陷的分類準(zhǔn)確率顯著提高,達(dá)到91%,但麻點缺陷的準(zhǔn)確率有小幅降低。針對補丁、夾雜物、銀紋以及軋制鱗片的缺陷,不同SVM 的分類準(zhǔn)確率浮動較小,均有95%左右的識別準(zhǔn)確率。由此可見,選擇合適的核函數(shù)對帶鋼表面缺陷的分類識別準(zhǔn)確率有較大影響,由于3 種核函數(shù)的SVM 均有一定的識別效果,單核SVM 的特征映射能力不如多核SVM,因此選擇多核通過自適應(yīng)調(diào)整核函數(shù)的權(quán)重能夠達(dá)到最優(yōu)的分類辨識效果,同時多核SVM 識別一張圖片的平均時間約為50.98 ms,滿足帶鋼生產(chǎn)時表面缺陷實時識別的要求。
為進(jìn)一步分析MK-SVM 的分類效果,通過混淆矩陣直觀觀察MK-SVM 對不同缺陷類型的正確辨識以及誤判情況,MK-SVM 對帶鋼表面缺陷的分類辨識結(jié)果的混淆矩陣如圖7 所示。
圖7 多核支持向量機的混淆矩陣
從圖7 可以得知,對于軋制鱗片缺陷圖像的分類效果最好,100 張測試圖像的分類準(zhǔn)確率達(dá)100%;補丁、夾雜物、銀紋缺陷圖像的分類準(zhǔn)確率均超過了96%;劃痕和麻點缺陷的誤判率相對較高,而且通過混淆矩陣可以看出,劃痕被錯識為夾雜物缺陷,麻點缺陷較易被識別為劃痕缺陷,這與實際的帶鋼表面缺陷圖像特征一致。
本文設(shè)計了一種混合域特征集與多核支持向量機結(jié)合的帶鋼表面缺陷特征識別方法,并通過實驗驗證得出以下結(jié)論:
1)針對帶鋼表面不同類型缺陷圖像樣本,從多個角度提取特征參數(shù),構(gòu)造混合特征集,包含了豐富的缺陷特征信息,保證了缺陷類別識別的準(zhǔn)確度。
2)本文通過設(shè)計多核支持向量機,克服了單核SVM 在對規(guī)模較大、特征信息繁多、多維數(shù)據(jù)分布不規(guī)則等樣本特征數(shù)據(jù)識別時泛化能力不強的局限性,顯著提高了帶鋼表面缺陷辨識的準(zhǔn)確率。