1引言
陶瓷產(chǎn)品在生產(chǎn)過程中會出現(xiàn)各種缺陷,不僅影響產(chǎn)品的美觀性,還可能影響其使用性能,但是傳統(tǒng)的陶瓷產(chǎn)品缺陷檢測方法主要依賴于人工檢查,但這種方法存在耗時、低效和易受人為因素影響的問題。隨著信息技術(shù)發(fā)展,在電子技術(shù)支持下運(yùn)用檢測算法能夠提高檢測效率,對算法進(jìn)行優(yōu)化還可以更加精準(zhǔn)識別陶瓷產(chǎn)品缺陷,對于提高檢測效果具有積極作用。
2陶瓷產(chǎn)品缺陷檢測采集流程
在陶瓷產(chǎn)品生產(chǎn)與加工過程中,常見的缺陷包括裂紋、黑點(diǎn)和表面凹凸等問題。陶瓷產(chǎn)品表面一般比較平滑,但由于產(chǎn)品特性仍有凸起部位,該部位會反射外界光照,產(chǎn)生表面反光,且難以完全避免,給陶瓷產(chǎn)品缺陷檢測帶來了困難。要對陶瓷產(chǎn)品展開無損檢測,必須獲得高質(zhì)量的全方位圖像,并利用相應(yīng)算法與模型對其展開分析與識別。陶瓷產(chǎn)品缺陷檢測采集流程如圖1所示。
3目標(biāo)檢測算法基礎(chǔ)
3.1卷積神經(jīng)網(wǎng)絡(luò)
目標(biāo)檢測需要從整個圖像中獲取物體的全部信息,并識別出物體的具體位置,并對物體進(jìn)行分類。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種面向2D圖像數(shù)據(jù)的端到端的學(xué)習(xí)方法,它采用多個網(wǎng)絡(luò)層對特征圖進(jìn)行卷積操作,將特征信息抽取為一個特定的對象,并在此基礎(chǔ)上利用損失函數(shù)及優(yōu)化方法對其進(jìn)行訓(xùn)練。其中,卷積神經(jīng)網(wǎng)絡(luò)通過對多層卷積網(wǎng)絡(luò)進(jìn)行多層卷積,使其能夠有效地獲取圖像中的紋理、邊緣和形狀等信息;而上層的卷積網(wǎng)絡(luò)利用其龐大的感知野((ReceptiveField),能夠獲取更多的語義信息。在對卷積網(wǎng)絡(luò)進(jìn)行訓(xùn)練的同時,可以對卷積核的權(quán)值不斷更新。卷積運(yùn)算本質(zhì)上是線性變換的一種,因此,僅依賴卷積運(yùn)算層層堆疊的卷積神經(jīng)網(wǎng)絡(luò)在本質(zhì)上是處理線性關(guān)系的,然而計算機(jī)視覺領(lǐng)域的核心任務(wù),如圖像分類和目標(biāo)檢測,本質(zhì)上都是復(fù)雜的非線性問題。為提高卷積神經(jīng)網(wǎng)絡(luò)對缺陷檢測等非線性問題的處理能力,可以引入非線性變換性質(zhì)的激活函數(shù),例如sigmoid、ReLU、LeakyRelu等。
3.2YOLOv5算法
YOLOv5是一種基于深度學(xué)習(xí)的目標(biāo)檢測算法,是YOLO系列算法的第五個版本,由Ultralytics公司在2020年發(fā)布。其核心思想是將輸入的圖像分成多個網(wǎng)格,并在每個網(wǎng)格上預(yù)測目標(biāo)的位置、類別和置信度。相較于之前的版本,YOLOv5在模型結(jié)構(gòu)、訓(xùn)練策略和性能指標(biāo)等方面進(jìn)行了顯著改進(jìn),實(shí)現(xiàn)了速度與精度的雙重提升。
YOLOv5通過mosaic數(shù)據(jù)增強(qiáng)和CSPs結(jié)構(gòu)增強(qiáng)等技術(shù),實(shí)現(xiàn)了多尺度上下文信息的融合。mosaic的數(shù)據(jù)強(qiáng)化算法是在數(shù)據(jù)庫中隨意選擇4張圖像,然后對4張圖像進(jìn)行縮放,然后將4張圖像按四個方向進(jìn)行拼接。基于mosaic數(shù)據(jù)增強(qiáng)的圖像能夠在單個訓(xùn)練樣本中融入多角度的上下文信息,從而顯著提升了模型在復(fù)雜多變場景下的精準(zhǔn)識別能力。同時,在mosaic圖像增強(qiáng)的過程中,不完整對象常常被截除,這一特性進(jìn)一步增強(qiáng)了模型對不完整對象的判別能力。CSP將特征層劃分為兩個層次,分別對特征層進(jìn)行抽取,而不需要對其進(jìn)行任何處理。這種算法在保持了深度學(xué)習(xí)模型的稠密連接特性的基礎(chǔ)上,降低了梯度信息的冗余性,提高了算法的運(yùn)算速度。在FPN結(jié)構(gòu)中,采用自上而下的特性聚合策略,PAN結(jié)構(gòu)采用自下而上的特性聚合策略。PAN結(jié)構(gòu)基于網(wǎng)絡(luò)結(jié)構(gòu)的多個位置進(jìn)行融合,以實(shí)現(xiàn)對多層次上下文信息的融合,該方法不但可以用于物體識別與自標(biāo)檢測,而且可以用于實(shí)例分割任務(wù)。
4基于分水嶺約束和邊緣連接的圖像分割算法
4.1圖像分割算法流程
基于分水嶺約束和邊緣連接的圖像分割算法,可以解決圖像分割中邊緣不連續(xù)和封閉性問題,同時保持對微弱邊緣的良好響應(yīng)。分水嶺算法是一種基于形態(tài)學(xué)的圖像分割方法,模擬了地理學(xué)中的分水嶺概念,在圖像處理中,分水嶺算法通過計算圖像的梯度圖像,將局部極小值點(diǎn)視為“山谷”,而區(qū)域邊界則對應(yīng)于“山脊線”。邊緣連接技術(shù)通過邊緣檢測算法獲取初始邊緣圖像,并對其進(jìn)行斷點(diǎn)檢測和距離連接,以獲取斷裂邊緣的搜索初始點(diǎn)。利用分水嶺算法得到的超分割邊緣圖作為搜索路徑,采用局部梯度最大的方法進(jìn)行搜索,以連接斷裂邊緣并獲取邊緣封閉輪廓。該算法的優(yōu)點(diǎn)在于能夠快速提取圖像中邊緣封閉區(qū)域,適用于多種環(huán)境場景,并具去坑好的三遷件和移枯件
階段1:獲取初始邊緣圖 提取錨點(diǎn)
輸入圖像→灰度化高斯濾波 梯度圖 錨點(diǎn)連接 初始邊緣圖像素方向
選取標(biāo)記點(diǎn) 提取斷點(diǎn)+
分水嶺處理超分割邊緣圖一邊緣鏈接 邊緣圖 缺陷檢測 結(jié)果圖
階段2:分水嶺約束和邊緣連接
該算法處理流程為,先對彩色圖像進(jìn)行灰度化、高斯濾除等預(yù)處理,再利用索貝爾算子求解梯度圖,得到對應(yīng)的錨固點(diǎn)圖和方向圖,并通過錨節(jié)點(diǎn)連通得到初始邊界圖。然后,利用基于標(biāo)號的分水嶺算法對圖像進(jìn)行分割,并根據(jù)邊界的連接獲得輪廓,并通過最小外接矩陣長寬判別,完成疵點(diǎn)的自動識別。圖像分割算法總體流程如圖2所示。
4.2圖像分割算法實(shí)現(xiàn)
理想條件下,邊界提取必須是清晰、連續(xù)且準(zhǔn)確的一個像素寬度的邊界。首先采用高斯濾波、灰度濾波等方法對圖像進(jìn)行預(yù)處理,再利用Sobel算子提取圖像的梯度信息,然后提取錨節(jié)點(diǎn)及各像素的方位信息,并將錨點(diǎn)連接得到多個高品質(zhì)邊界。利用CUDA技術(shù)可以將復(fù)雜的計算過程并行化,從而提高整個算法的運(yùn)行效率。圖像預(yù)處理主要是對圖像進(jìn)行灰度變換和高斯去噪。灰度化采用加權(quán)平均的方法,由于人眼對各種色彩的敏感性各不相同,對藍(lán)光的敏感度較低,對綠光的敏感度較高,所以在求整幅圖像灰度值時,采用不同權(quán)值對三條通道展開加權(quán)平均。利用高斯濾波法對圖像濾波,既能消除噪聲,又能使圖像更加平滑,具有較好的通用性。
采用分水嶺算法,將標(biāo)記定位圖片上的局部極值點(diǎn),對高斯濾波后的圖像進(jìn)行特征提取,并將其與分水嶺算法相結(jié)合,形成一種基于邊緣連接的超分割邊緣圖。斷點(diǎn)位置可以根據(jù)初始邊緣得出,以斷點(diǎn)為起點(diǎn),采用邊界搜尋方法,結(jié)合方向信息與超分割邊緣圖,獲得多個閉合的邊界輪廓,實(shí)現(xiàn)目標(biāo)區(qū)域分割。圖像的弱邊緣信息能夠保留在超分割邊緣圖上,有助于查找斷裂邊緣,以每一個像素為圓心遍歷梯度圖,如果八個鄰域內(nèi)像素的梯度值低于這個圓心像素的梯度,就把它當(dāng)作一個標(biāo)記。再把經(jīng)過高斯濾波處理的圖像與標(biāo)記一起輸入到超分割邊緣圖中,將其作為路徑,用于搜索斷裂邊緣,最后提取并檢測出裂紋。采用圖像分割算法對多個閉合邊界進(jìn)行分割,計算出最小外接矩形及縱橫比設(shè)定,如果符合一般裂縫缺陷的縱橫比,則可以判定陶瓷產(chǎn)品存在裂紋。針對陶瓷產(chǎn)品裂紋的特點(diǎn),將陶瓷產(chǎn)品的裂縫縱橫比設(shè)為6,當(dāng)圖像中出現(xiàn)符合裂縫縱橫比的輪廓時,說明有裂縫存在。
5基于YOLOv5的缺陷檢測算法
5.1算法網(wǎng)絡(luò)結(jié)構(gòu)
陶瓷產(chǎn)品缺陷種類繁多,傳統(tǒng)算法難以覆蓋所有缺陷?;谏疃染矸e神經(jīng)網(wǎng)絡(luò)能夠有效地挖掘出具有較強(qiáng)的語義信息的特征,無需進(jìn)行大規(guī)模特征挖掘,且具有較強(qiáng)計算能力。YOLOv5是一種高效的目標(biāo)檢測算法,采用單階段檢測框架,將目標(biāo)檢測視為回歸問題,直接預(yù)測目標(biāo)的邊界、類別和置信度。相比于其他目標(biāo)檢測算法,YOLOv5在保證高精度的同時,具有更快的檢測速度和更強(qiáng)的實(shí)時性能?;赮OLOv5s的陶瓷產(chǎn)品缺陷檢測算法,通過影像采集設(shè)備獲取信息,并在此基礎(chǔ)上建立擴(kuò)展數(shù)據(jù)集,包含待檢測物體的圖像及其對應(yīng)的標(biāo)注信息,通常使用矩形框來表示缺陷區(qū)域的位置。Yolov5的網(wǎng)絡(luò)結(jié)構(gòu)包括輸入端、主干網(wǎng)絡(luò)、頸部網(wǎng)絡(luò)以及頭部網(wǎng)絡(luò)四部分。
輸入端主要包括Mosaic數(shù)據(jù)增強(qiáng)、圖像尺寸處理和自適應(yīng)錨框計算等模塊。Mosaic數(shù)據(jù)增強(qiáng)是指任意選擇4幅圖像進(jìn)行拼接獲得一幅新圖像,從而提高訓(xùn)練樣本的種類與數(shù)量。對新圖像的任意剪切、縮放等操作,使模型能夠更好地學(xué)習(xí)到更多變化與細(xì)節(jié),從而增強(qiáng)模型的穩(wěn)健性與泛化性。YOLOv5使用了一種單一維度探測的方式,即在輸入端必須對圖像進(jìn)行維度調(diào)整,使其達(dá)到一定尺寸。該算法能夠根據(jù)自標(biāo)在訓(xùn)練區(qū)域內(nèi)的大小及分布情況,自動計算出適當(dāng)錨框架尺寸及尺度,與人工設(shè)定錨框架尺寸及尺度相比,具有更高效率與精度。
主干網(wǎng)絡(luò)負(fù)責(zé)對輸入數(shù)據(jù)進(jìn)行特征提取。YOLOv5骨干網(wǎng)采用CSPDarknet53體系結(jié)構(gòu),由三級結(jié)構(gòu)組成,并利用CSP模塊將前、后兩層的特性圖進(jìn)行關(guān)聯(lián),提高了特征的利用率。主干網(wǎng)絡(luò)還包括Focus和SPPF模塊,使用Focus結(jié)構(gòu)對圖像進(jìn)行分層處理,可以有效地防止圖像下采樣時的信息損失,將局部與整體特征相結(jié)合,有效地提升模型對不同尺寸物體的探測能力。
頸部網(wǎng)絡(luò)采用PAN模塊實(shí)現(xiàn)多尺度特征圖融合,該模塊是屬于一種多尺度特征融合模塊,可以將不同尺度的特征圖進(jìn)行融合,可以提高模型對小目標(biāo)的檢測能力。將FPN與PAN結(jié)合,能夠有效地將主干網(wǎng)絡(luò)提取的高層語義特征與低層細(xì)節(jié)特征進(jìn)行融合,增強(qiáng)模型對不同尺度缺陷的檢測能力。FPN通過自頂向下的路徑,將高層特征逐步傳遞并與低層特征進(jìn)行融合,而PAN則通過自底向上的路徑,進(jìn)一步增強(qiáng)特征融合的效果,使得模型能夠更好地捕捉到陶瓷產(chǎn)品表面微小的缺陷特征。
頭部網(wǎng)絡(luò)融合特征圖并輸出邊緣框與類別概率,使檢測模型能力得到提升。采用多個檢測頭分別處理不同尺度的目標(biāo),每個檢測頭都會獨(dú)立地預(yù)測目標(biāo)的類別、邊界框位置和置信度,這些檢測頭通過共享頸部網(wǎng)絡(luò)的特征信息,并結(jié)合各自獨(dú)特的卷積層和池化層,實(shí)現(xiàn)對不同尺度缺陷的精準(zhǔn)檢測。
5.2算法改進(jìn)
為了提高算法檢測精度,在原有的Yolov5架構(gòu)基礎(chǔ)上,將頸部網(wǎng)絡(luò)模塊抽樣層從2次采樣增加到3次,并將新的采樣層與主干網(wǎng)絡(luò)中的CSP-1模塊引出特征層相結(jié)合,再由CoordAtt和CSP2_1模塊引出小目標(biāo)檢測層。小目標(biāo)檢測層通過增大原圖中的單元格數(shù)目增加錨點(diǎn)量,從而提高原圖預(yù)測精度。注意力機(jī)制實(shí)質(zhì)上是對屬性進(jìn)行加權(quán)處理,使得模型更針對預(yù)設(shè)目標(biāo),從而減少無用信息干擾,CA注意力機(jī)制既包含信道信息,又包含方位信息,具有很強(qiáng)的靈活性,可用于輕量化的網(wǎng)絡(luò)環(huán)境。CA注意力機(jī)制是一種輕量級的注意力機(jī)制,旨在增強(qiáng)模型對輸入數(shù)據(jù)的空間結(jié)構(gòu)理解。與傳統(tǒng)的通道注意力機(jī)制不同,CA在通道注意力中嵌人了位置信息,從而更好地在空間上進(jìn)行關(guān)注。它通過1D池化操作分別在水平方向和垂直方向上聚合特征,生成兩個包含位置信息的方向感知特征圖,并結(jié)合這兩個特征圖生成兩個方向上的注意力權(quán)重,分別作用于輸人特征圖的水平方向和垂直方向,實(shí)現(xiàn)方向感知和位置敏感的注意力增強(qiáng)。在3次采樣以及引出小目標(biāo)檢測層后,利用CA注意力機(jī)制,進(jìn)一步增強(qiáng)對陶瓷產(chǎn)品缺陷的識別能力,從而提高對非顯著性缺陷的識別率。
6結(jié)語
利用電子技術(shù)可以提取陶瓷產(chǎn)品缺陷特征,能夠大幅提高缺陷檢測效率,利用分水嶺算法和邊緣檢測算法可以準(zhǔn)確檢測出陶瓷產(chǎn)品開裂缺陷,運(yùn)用基于YOLOv5的缺陷檢測算法可以明顯提升檢測精度。在YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)中添加小目標(biāo)檢測層以及CA注意力機(jī)制,還可以進(jìn)一步優(yōu)化小目標(biāo)缺陷檢測效果,實(shí)現(xiàn)陶瓷產(chǎn)品缺陷實(shí)時檢測。
參考文獻(xiàn)
[1]丁偉利,張志鵬,雷子琦,等.深度學(xué)習(xí)陶瓷表面缺陷檢測算法研究[J].電子測量與儀器學(xué)報,2023,37(11):161-169.
[2]汪韓蕾,周鵬,陳立云,等.基于改進(jìn)YOLOV5算法的氮化硅陶
瓷球表面缺陷檢測[J]無損探傷 2025,49(01):10-15+38.
[3]胡海寧,黃雷陽,楊洪剛,等.改進(jìn)YOLOv8n的輕量型蜂窩陶瓷
缺陷檢測算法[J].激光與光電子學(xué)進(jìn)展,2024,61(22):160-169.
[4]朱永紅,吳松濤.基于改進(jìn)的YOLOv8n瓷磚缺陷檢測與分類
方法[J].陶瓷學(xué)報,2024,45(06):1255-1264.
[5]潘金晶,曾成,張晶,等.基于改進(jìn)YOLOv5的陶瓷表面缺陷檢
測算法[J].現(xiàn)代信息科技,2024,8(13):70-75.