段 茵, 陳愷煊, 劉 昕, 張金鳳(西安理工大學(xué) 印刷包裝與數(shù)字媒體學(xué)院, 陜西 西安 710048)
紙張?jiān)谏a(chǎn)過程中因受到外界環(huán)境污染以及生產(chǎn)操作不當(dāng)、設(shè)備污損等影響,會(huì)產(chǎn)生種類繁多的表面缺陷。紙張缺陷的出現(xiàn)會(huì)嚴(yán)重影響紙張的質(zhì)量和使用效果,降低經(jīng)濟(jì)效益。因此,對(duì)于紙張缺陷的檢測(cè)是造紙過程中不可或缺的環(huán)節(jié)。
國內(nèi)外學(xué)者針對(duì)紙張缺陷的智能化檢測(cè)做了很多相關(guān)研究。文獻(xiàn)[1]提出了利用Prewitt算子檢測(cè)孔洞、臟點(diǎn)和褶皺的方法,但由于紙張缺陷的多樣性,導(dǎo)致識(shí)別率不足。文獻(xiàn)[2]在背景與目標(biāo)紙張缺陷的對(duì)比度低的情況下,提出了一種將邊緣檢測(cè)和小波融合結(jié)合起來的方法,定位準(zhǔn)確且具有一定的抗噪性,但算法本身過于復(fù)雜,不能滿足檢測(cè)的時(shí)效性。文獻(xiàn)[3]提出了通過提取紙張缺陷的幾何及灰度特征并將其分類的方法,但只描述了不同特征量的差異,并未給出具體的分類方法。
合格的紙張除了要達(dá)到物理的質(zhì)量指標(biāo)外,還必須符合外觀指標(biāo)要求。外觀缺陷通常有塵埃、孔洞、裂口、褶子[4]等四種,見圖1。塵埃是指紙頁表面用肉眼可見的與紙頁表面顏色有明顯區(qū)別的斑點(diǎn)[5]及束狀纖維。其來源廣且復(fù)雜,有的由原料帶來,有的是由于蒸煮、粗選、精選工藝不當(dāng)或者操作不當(dāng)及設(shè)備原因造成的,按照塵埃的特性和外觀特點(diǎn),可分為纖維性塵埃、非金屬性塵埃、金屬性塵埃??锥词禽^為常見的紙張缺陷,一般分為孔眼、斜眼、窟窿,統(tǒng)稱孔洞,是指在紙頁局部沒有纖維完全穿透的點(diǎn)子。裂口一般出現(xiàn)在紙張的中部或者邊部,中部裂口多為縱向,邊部裂口多為橫向。褶子是紙張抄造過程中產(chǎn)生的一種常見的紙張缺陷,它的種類繁多,主要易分布于壓榨部、壓光部、干燥部和卷紙部,根據(jù)其主要特征和產(chǎn)生地點(diǎn),大致可分為濕褶子和干褶子。
圖1 常見紙張缺陷Fig.1 Common types of paper defects
紙張缺陷檢測(cè)流程分為兩部分(見圖2)。首先是訓(xùn)練部分[6],即將一定數(shù)目含有紙張缺陷的樣張經(jīng)過預(yù)處理、形態(tài)學(xué)處理后,對(duì)其形狀特征參數(shù)進(jìn)行提取并利用BP神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行訓(xùn)練,使參數(shù)與紙張缺陷類型建立起映射關(guān)系。其次是檢測(cè)部分,對(duì)待檢測(cè)的樣張同樣進(jìn)行預(yù)處理和形態(tài)學(xué)處理后,調(diào)用訓(xùn)練完成的網(wǎng)絡(luò)對(duì)參數(shù)進(jìn)行判別,從而完成紙張缺陷類型的識(shí)別。
圖2 紙張缺陷檢測(cè)流程Fig.2 Paper defect inspection procedure
設(shè)備在實(shí)際采集中一般為彩色圖像,彩色圖像因其信息量大,運(yùn)行消耗時(shí)間。因此在數(shù)字圖像處理之前需要將彩色圖像轉(zhuǎn)化為灰度圖像,這樣即可以反映圖像的亮度分布特征,還能減少運(yùn)算量,縮短圖像處理的時(shí)間。由于紙張缺陷檢測(cè)的核心思想在于其形狀特征,對(duì)顏色并無要求,所以采取最大值法,見式(1),將彩色圖像中的三分量亮度的最大值作為灰度值來進(jìn)行灰度化。
f(i,j)=max[R(i,j),G(i,j),B(i,j)]
(1)
在光電性質(zhì)及設(shè)備器材自身質(zhì)量等原因的影響下,圖像的傳輸和獲取過程中不可避免的會(huì)受到噪聲干擾。中值濾波法作為一種典型的非線性平滑技術(shù),不僅可以消除噪聲污染,同時(shí)保護(hù)圖像的邊緣細(xì)節(jié),使其不被模糊。中值濾波的基本思想是將數(shù)字圖像中待處理像素的值用該點(diǎn)濾窗內(nèi)的所有像素點(diǎn)的灰度值中間值代替(見圖3)。
圖3 中值濾波原理Fig.3 Median filtering principle
全局Otsu算法[7]又稱最大類間方差法或大津法,該方法的基本思想是根據(jù)選取的閾值將圖像分為目標(biāo)和背景兩個(gè)部分,計(jì)算像素的灰度值對(duì)應(yīng)的最大類間方差值,將類間方差值取最大時(shí)對(duì)應(yīng)的閾值作為最佳閾值。
設(shè)圖像最佳閾值為T,T將圖像分為目標(biāo)和背景。其中目標(biāo)點(diǎn)數(shù)占總圖像比例為w0,平均灰度值為u0;背景點(diǎn)數(shù)占圖像比例為w1,平均灰度值為u1,則圖像的總平均灰度值為:
u=w0×u0+w1×u1
(2)
類間方差為:
g=w0(u0-u)2+w1(u1-u)2
(3)
通過遍歷計(jì)算最小灰度值到最大灰度值分割的目標(biāo)和背景的灰度直方圖,使類間方差值g最大時(shí)的灰度閾值則為最佳閾值T。
方差是度量圖像灰度分布均勻化的方法,當(dāng)選擇適當(dāng)?shù)拈撝?使得數(shù)據(jù)間的方差越大,表明該閾值使得兩部分差別越大。u0和u1分別代表著目標(biāo)和背景的中心灰度值,u代表整幅圖像的中心灰度,當(dāng)目標(biāo)和背景分割最優(yōu)時(shí),即分割出的目標(biāo)遠(yuǎn)離圖像中心,因此g盡量大。
為了減少計(jì)算量,提高圖像處理運(yùn)行速度,一般用等價(jià)公式(4)進(jìn)行表示:
g=w0×w1×(u0-u1)2
(4)
Otsu閾值分割不受圖像對(duì)比度與亮度的影響,其閾值將目標(biāo)和背景分離開來,很好地克服了此缺點(diǎn)。
在紙張缺陷的形狀特征參數(shù)處理過程中,需要對(duì)每種紙張缺陷[8]的參數(shù)進(jìn)行提取,但由于圖像采集和閾值分割等原因,往往一個(gè)缺陷會(huì)由很多離散的部分組合而成。見圖4,裂口和褶子缺陷圖像中含有很多不規(guī)則的干擾點(diǎn)[9],其本身是組成裂口或者缺陷的一部分,但若不對(duì)其進(jìn)行處理,這些干擾點(diǎn)有可能會(huì)被識(shí)別為臟點(diǎn)或者孔洞,從而造成誤判。
圖4 未經(jīng)形態(tài)學(xué)處理的樣張F(tuán)ig.4 Sample without morphological processing
為了避免誤判的發(fā)生,需要對(duì)同一個(gè)缺陷的幾個(gè)離散的部分進(jìn)行“聚合化”處理,將離散的部分相連,而又不影響形狀特征參數(shù)的準(zhǔn)確性。
數(shù)學(xué)形態(tài)學(xué)是一種以形態(tài)結(jié)構(gòu)元素為基礎(chǔ)提取圖像分量的工具,基本思想是利用一定形態(tài)的結(jié)構(gòu)元素去探測(cè)和提取圖像區(qū)域形態(tài)特征以達(dá)到對(duì)圖像分析和識(shí)別的目的。其基本操作運(yùn)算是腐蝕和膨脹[10]。
腐蝕是消除圖像所有邊界點(diǎn),使圖像邊界收縮和細(xì)化的過程,一般用來消除圖像中不相關(guān)的細(xì)節(jié)。A被B腐蝕相當(dāng)于B完全包括在A里面時(shí)B的原點(diǎn)所有位置的集合,數(shù)學(xué)式子為:
AΘB={Z|(B)z?A}
(5)
膨脹是將模板與圖像的背景點(diǎn)合并的過程,可以使圖像邊界加長或變粗,填充空洞,連接裂縫。A被B膨脹是將結(jié)構(gòu)元素B平移后使B與A的交集非空的點(diǎn)構(gòu)成的集合。數(shù)學(xué)式子為:
(6)
將二值化圖像經(jīng)過多次膨脹和腐蝕之后,得到的結(jié)果見圖5,同一個(gè)缺陷的各個(gè)離散部分已經(jīng)被“聚合”到了一起,而缺陷本身的形狀卻并未發(fā)生太大改變。
圖5 經(jīng)過形態(tài)學(xué)處理的樣張F(tuán)ig.5 Sample after morphological processing
BP神經(jīng)網(wǎng)絡(luò)[11]是一種典型的按誤差反向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò)運(yùn)算模型,在學(xué)習(xí)梯度下降的規(guī)則的基礎(chǔ)上利用反向傳播進(jìn)行閾值和權(quán)值的不斷調(diào)整,使神經(jīng)網(wǎng)絡(luò)的誤差平方和達(dá)到最小。
BP神經(jīng)網(wǎng)絡(luò)是由大量的神經(jīng)元聯(lián)結(jié)構(gòu)成,神經(jīng)元的基本結(jié)構(gòu)見圖6。
圖6 神經(jīng)元結(jié)構(gòu)Fig.6 Neuron structure
其中x1~xi為輸入向量的各個(gè)分量,w1~wi為神經(jīng)元各個(gè)突觸的權(quán)值,b為偏置又稱為閾值,f(Sj)為傳遞函數(shù),yj代表著每個(gè)神經(jīng)元的輸出。每個(gè)神經(jīng)元節(jié)點(diǎn)的輸出值與上層節(jié)點(diǎn)的輸出值、兩個(gè)節(jié)點(diǎn)之間的連接權(quán)值、當(dāng)前節(jié)點(diǎn)的閾值或稱為偏置以及傳遞函數(shù)有關(guān),具體的實(shí)現(xiàn)方法為:
(7)
yj=f(Sj)
(8)
BP神經(jīng)網(wǎng)絡(luò)是由信息的正反方向傳播的過程,通常是由輸入層、隱藏層、輸出層三層構(gòu)成,見圖7。當(dāng)輸入層接受從外界輸入信息,神經(jīng)網(wǎng)絡(luò)開始進(jìn)入分類判斷的訓(xùn)練過程,將輸入的多個(gè)樣本進(jìn)行訓(xùn)練,當(dāng)出現(xiàn)實(shí)際輸出不符合預(yù)期輸出情況時(shí),將會(huì)進(jìn)入誤差的反傳播階段,誤差通過輸出層,會(huì)以誤差下降方式對(duì)各層權(quán)值進(jìn)行修正,并在隱藏層和輸入層進(jìn)行逐層反轉(zhuǎn)。各層權(quán)值通過信息正向傳播和誤差反向傳播進(jìn)行不斷調(diào)整,同時(shí)也是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程,這個(gè)過程結(jié)束的標(biāo)識(shí)是網(wǎng)絡(luò)輸出誤差減少到可以接受的程度或者達(dá)到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)。
圖7 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.7 Structure of neural network
在紙張缺陷判斷的過程中,將一定數(shù)量的訓(xùn)練樣本提取參數(shù)[12-13](塵埃、孔洞、裂口、褶子)進(jìn)行訓(xùn)練,將訓(xùn)練完畢的神經(jīng)網(wǎng)絡(luò)的連接權(quán)值和偏置保存后,就可以判斷后續(xù)樣本到底是哪一種紙張缺陷了。
文章采用最遠(yuǎn)距離,面積,延長因子,Heywood圓度因子四個(gè)參數(shù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。最遠(yuǎn)距離指圖像中粒子周邊最遠(yuǎn)兩點(diǎn)的距離;面積為圖像中不含空洞的所有粒子面積;延長因子是指粒子圖像最大直徑與等效矩形短邊的商,越細(xì)長的粒子,其延長因子越大;圓度因子則是指粒子周長和與其面積相等的圓的周長的商,當(dāng)粒子形狀越接近圓,圓度因子的值趨于1。其中一組樣本的四個(gè)參數(shù)值見表1。
表1 紙張缺陷的特征參數(shù)值Tab.1 Characteristic parameter values of paper defects
紙張缺陷檢測(cè)軟件采用Labview 2014作為開發(fā)語言,完成紙張缺陷檢測(cè)軟件結(jié)構(gòu)設(shè)計(jì)及界面的搭建,見圖8。
圖8 程序界面Fig.8 Program interface
利用Matlab 2012b作為腳本語言對(duì)紙張缺陷參數(shù)進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練及判別,并通過Labview中的Matlab Script節(jié)點(diǎn)對(duì)[14]Matlab的結(jié)果進(jìn)行調(diào)用,達(dá)到識(shí)別判斷紙張缺陷的目的,見圖9。
圖9 部分程序框圖Fig.9 Part of program diagram
訓(xùn)練部分選取了塵埃、孔洞、裂口、褶子四種紙張缺陷樣本每種各10個(gè),總共40個(gè)樣本。對(duì)樣本進(jìn)行預(yù)處理、形態(tài)學(xué)處理后,建立隱含層神經(jīng)元個(gè)數(shù)為3,輸出層神經(jīng)元個(gè)數(shù)為1的BP神經(jīng)網(wǎng)絡(luò),測(cè)量40個(gè)樣本的形狀特征參數(shù)對(duì)并網(wǎng)絡(luò)進(jìn)行訓(xùn)練訓(xùn)練結(jié)果見圖10。選取一組紙張缺陷圖片驗(yàn)證訓(xùn)練結(jié)果的正確性,首先對(duì)待檢測(cè)樣本進(jìn)行預(yù)處理,包括灰度化及濾波去噪,見圖11。然后進(jìn)行圖像分割及形態(tài)學(xué)處理,見圖12。
圖10 神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果Fig.10 Training result of neural network
圖11 預(yù)處理后的待測(cè)樣張F(tuán)ig.11 Sample to be measured after pretreatment
圖12 形態(tài)學(xué)處理后的待測(cè)樣張F(tuán)ig.12 Sample to be measured after morphological processing
最后用訓(xùn)練完畢的神經(jīng)網(wǎng)絡(luò)對(duì)紙張缺陷進(jìn)行識(shí)別,塵埃、孔洞、裂口、褶子四個(gè)紙張缺陷樣本的識(shí)別數(shù)據(jù)及結(jié)果見表2,實(shí)驗(yàn)取樣的識(shí)別結(jié)果見表3。
表2 神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果Tab.2 Detection results of neural network
表3 取樣結(jié)果分析Tab.3 Detection results of sample
文章通過對(duì)常見紙張缺陷及其形成原因進(jìn)行分析,提出了一種常見紙張缺陷的檢測(cè)及識(shí)別方法。對(duì)紙張缺陷樣本的最遠(yuǎn)距離、面積、延長因子、Heywood圓度因子四個(gè)形狀參數(shù)進(jìn)行測(cè)量記錄,利用按誤差逆?zhèn)鞑ビ?xùn)練的三層前饋BP神經(jīng)網(wǎng)絡(luò)對(duì)樣本參數(shù)進(jìn)行訓(xùn)練并保存結(jié)果,以對(duì)待檢樣張進(jìn)行識(shí)別。通過實(shí)驗(yàn)證明,此方法可以有效的檢測(cè)出塵埃、孔洞、裂口、褶子四種常見紙張缺陷,滿足工業(yè)生產(chǎn)的自動(dòng)化檢測(cè)需求。