田偉倩 朱華兵 張 淋 胡 斌
(中國(guó)特種設(shè)備檢測(cè)研究院 北京 100029)
工業(yè)產(chǎn)品生產(chǎn)和使用是一個(gè)非常復(fù)雜的過(guò)程,由于產(chǎn)品線(xiàn)設(shè)計(jì)不合理或者設(shè)備工況條件差,生產(chǎn)過(guò)程中往往會(huì)產(chǎn)生一些包含問(wèn)題的產(chǎn)品:如產(chǎn)品表面的瑕疵,鑄造產(chǎn)品中的空洞,運(yùn)輸過(guò)程中產(chǎn)生的擦傷和刮痕等,如圖1 所示。同時(shí)由于產(chǎn)品存儲(chǔ)條件惡劣,也會(huì)產(chǎn)生如腐蝕的缺陷。產(chǎn)品上的缺陷會(huì)影響產(chǎn)品的使用,減少產(chǎn)品的使用年限,同時(shí)也會(huì)增加廠(chǎng)商的成本,影響產(chǎn)品的品牌。因此,缺陷檢測(cè)是企業(yè)提高產(chǎn)品質(zhì)量和服務(wù)所必須具備的核心能力。相比人工檢測(cè),自動(dòng)缺陷檢測(cè)技術(shù)在環(huán)境適應(yīng)性、工作時(shí)長(zhǎng)、精度以及效率上有明顯的優(yōu)勢(shì)。對(duì)缺陷檢測(cè)技術(shù)的研究可以降低生產(chǎn)成本,提高生產(chǎn)效率和產(chǎn)品質(zhì)量,為制造業(yè)的智能轉(zhuǎn)型奠定堅(jiān)實(shí)的基礎(chǔ)。
圖1 不同物品缺陷
缺陷檢測(cè)通常分為2 類(lèi):一類(lèi)是破壞性檢測(cè),另一類(lèi)是非破壞性檢測(cè)。非破壞性檢測(cè)是利用成像技術(shù),如X 光、超聲、紅外、渦流、染色等方式探查產(chǎn)品,生成產(chǎn)品的不同圖像進(jìn)行檢測(cè)。非破壞性檢測(cè)不對(duì)產(chǎn)品進(jìn)行破壞,是目前應(yīng)用很廣的檢測(cè)方法。本文所描述的檢測(cè)方法,就是針對(duì)非破壞性檢測(cè)。由于產(chǎn)品中缺陷的種類(lèi)繁多,所以不同的缺陷所用的技術(shù)也不盡相同。如Aldave 等[1]利用熱紅外圖像對(duì)缺陷進(jìn)行檢測(cè),Xie 等[2]使用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)缺陷進(jìn)行檢測(cè),其他的如超頻、震動(dòng)光譜也廣泛應(yīng)用在產(chǎn)品缺陷檢測(cè)中。目前,在非破壞性檢測(cè)的方法中,基于數(shù)字圖像的方法應(yīng)用最廣,基本涉及日常工業(yè)產(chǎn)品的方方面面。本文將從基于數(shù)字圖像的缺陷檢測(cè)角度出發(fā),對(duì)該類(lèi)缺陷檢測(cè)技術(shù)進(jìn)行總結(jié)。
圖像(image)[3]指的是應(yīng)用各種觀(guān)測(cè)系統(tǒng),以不同形式和手段觀(guān)測(cè)客觀(guān)世界而獲得的,可以直接或間接作用于人眼而產(chǎn)生視覺(jué)的實(shí)體。數(shù)字圖像的處理主要包括幾何處理、算術(shù)處理、圖像增強(qiáng)、圖像復(fù)原、圖像重建、圖像編碼、圖像識(shí)別等。
計(jì)算機(jī)視覺(jué)指的是計(jì)算機(jī)代替人眼對(duì)圖像中的目標(biāo)進(jìn)行識(shí)別、跟蹤以及測(cè)量等,通過(guò)圖像處理操作,使其成為更適合人眼觀(guān)察的圖像。計(jì)算機(jī)視覺(jué)作為綜合型技術(shù),集成了模擬與數(shù)字視頻技術(shù)、光學(xué)成像、圖像處理技術(shù)等,將圖像信號(hào)結(jié)合特定需求,轉(zhuǎn)變?yōu)閿?shù)字化信號(hào)。在計(jì)算機(jī)中,圖像以數(shù)字矩陣的方式存儲(chǔ),基本所有的顏色都可以通過(guò)三原色(紅色、綠色、藍(lán)色)生成,所以在計(jì)算機(jī)中,彩色圖像由三通道矩陣(紅色通道、綠色通道、藍(lán)色通道)構(gòu)成,三個(gè)通道疊加,在計(jì)算機(jī)中的存儲(chǔ)形式為N×M×3,其中N 為高度像素?cái)?shù),M 為寬度像素?cái)?shù),3 為通道數(shù)。有些圖像為灰白圖像,如X 光圖像,圖像則是由單通道矩陣存儲(chǔ),計(jì)算中表示為N×M。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,數(shù)字成像技術(shù)逐漸被應(yīng)用到無(wú)損檢測(cè)領(lǐng)域。機(jī)器視覺(jué)檢測(cè)由于其快速、準(zhǔn)確、無(wú)損和低成本的特點(diǎn),被廣泛應(yīng)用在缺陷檢測(cè)領(lǐng)域。
傳統(tǒng)的基于數(shù)字圖像處理檢測(cè)缺陷的研究工作主要側(cè)重在圖像中缺陷的定位、提取和分割。識(shí)別缺陷主要包括2 個(gè)模塊:圖像的預(yù)處理和缺陷檢測(cè)。圖2展示了一般傳統(tǒng)數(shù)字圖像處理技術(shù)進(jìn)行缺陷檢測(cè)的流程。
圖2 傳統(tǒng)的基于數(shù)字圖像技術(shù)進(jìn)行缺陷識(shí)別流程
與正常部位相比,缺陷圖像通常表現(xiàn)為與正常部位對(duì)比度相似,缺陷周?chē)嬖诖罅吭朦c(diǎn)。這些問(wèn)題對(duì)圖像缺陷的識(shí)別有非常大的影響。圖像的預(yù)處理就是為了減少噪聲,增強(qiáng)缺陷部位和正常部位的對(duì)比度,使后續(xù)步驟能更好地進(jìn)行識(shí)別分類(lèi)。
1)噪聲處理。噪聲點(diǎn)通常不規(guī)則地分布在圖像上,一般會(huì)和周?chē)袼刂涤忻黠@的區(qū)別,表現(xiàn)出來(lái)就是高頻像素值。所以,高頻濾波是最常用的噪聲處理方法。Zscherpel 等[4]使用一種圖像寬度方向的快速傅里葉變化(FFT)的Bessel 操作對(duì)X 光圖像進(jìn)行濾波,取得了非常好的減噪效果。小波變換(wavelet filter)也是一種常用的X 光圖像高頻濾波器。通常,濾波器的表現(xiàn)和濾波器的核大小有很大的關(guān)系。過(guò)小,噪聲濾不掉,過(guò)大,容易造成背景模糊。
2)對(duì)比度增強(qiáng)。很多情況下,缺陷部位和背景像素的對(duì)比度非常不明顯,尤其是對(duì)于使用X 光圖像進(jìn)行缺陷識(shí)別的圖像。這種圖像灰度值通常分布在很小的區(qū)間內(nèi),給缺陷檢測(cè)造成很大的障礙。通常用對(duì)直方圖進(jìn)行操作的方式進(jìn)行對(duì)比度增強(qiáng)。直方圖反映了圖像中像素值的分布情況。比如直方圖太窄,說(shuō)明圖像使用的灰度值范圍太窄。比如直方圖有一個(gè)很強(qiáng)烈的峰值,說(shuō)明圖像部分灰度值頻率比其他值要高得多。Shafeek 等[5]采用直方圖拉伸增加缺陷和周?chē)袼刂g對(duì)比度,采用直方圖均衡對(duì)圖像背景進(jìn)行增亮。
圖像通常不僅僅包括產(chǎn)品缺陷部分,還包括與產(chǎn)品不相關(guān)的背景部分。所以,通常在缺陷檢測(cè)時(shí),需要進(jìn)行背景刪除處理。背景刪除可以采用與沒(méi)有產(chǎn)品的圖片相減得到,如Hyatt 等[6]采用多尺度的方法對(duì)背景進(jìn)行移除。在很多基于X 光圖像的缺陷檢測(cè)中,有別于基體散射,缺陷散射具有獨(dú)特的圖像特征[7]。所以很多方法都是根據(jù)這個(gè)特性進(jìn)行背景刪除。如Liao 等[8]通過(guò)比較發(fā)現(xiàn),好的焊縫表現(xiàn)為鐘形,而缺陷不是。所以基于此設(shè)計(jì)了背景刪除策略,取得了很好的效果。
進(jìn)行完背景處理操作后,生成的圖像就可以進(jìn)行缺陷檢測(cè)識(shí)別處理。張曉光等[9]先對(duì)圖像進(jìn)行預(yù)處理,應(yīng)用直方圖均衡法對(duì)圖像進(jìn)行處理,增強(qiáng)焊縫中的缺陷與圖像背景之間的對(duì)比度,以便于提高后續(xù)缺陷檢測(cè)的準(zhǔn)確率。下一步應(yīng)用邊緣檢測(cè)算法對(duì)圖像進(jìn)行分割,分割后的圖像中含有缺陷信息。最后對(duì)缺陷進(jìn)行識(shí)別,將其分類(lèi)為氣孔、夾渣等。趙永珠[10]首先應(yīng)用不變矩的方法提取圖像中缺陷的特征參數(shù),進(jìn)而應(yīng)用神經(jīng)網(wǎng)絡(luò)的方法對(duì)缺陷進(jìn)行分類(lèi)。林鄧偉[11]應(yīng)用基于計(jì)算機(jī)視覺(jué)的方法,對(duì)焊縫進(jìn)行缺陷識(shí)別,最后應(yīng)用形態(tài)學(xué)方法,消除圖像中的偽信息,進(jìn)行缺陷分類(lèi)。劉涵等[12]先是研究了焊縫中各類(lèi)缺陷的特征,根據(jù)缺陷的特征對(duì)其進(jìn)行分類(lèi),作為缺陷識(shí)別的依據(jù)。通過(guò)擬合獲取焊縫邊界,再通過(guò)分割、邊緣檢測(cè),提取焊縫邊界信息,最終將缺陷從焊縫圖像中分割出來(lái)。最后通過(guò)對(duì)卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,實(shí)現(xiàn)對(duì)缺陷的識(shí)別。栗芝[13]針對(duì)小樣本對(duì)象,提出了一種準(zhǔn)確率高、實(shí)時(shí)性好、魯棒性高的缺陷識(shí)別方法。應(yīng)用sin 函數(shù)增強(qiáng),OSTU 分割,以及邊緣檢測(cè)等方法進(jìn)行圖像預(yù)處理,并使用Hough 變換提取邊界直線(xiàn)信息,最終使用SVM分類(lèi)器進(jìn)行分類(lèi)。李清格[14]應(yīng)用邊緣檢測(cè)算子提取感興趣區(qū)域,進(jìn)而應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分類(lèi)。王睿等[15]在卷積神經(jīng)網(wǎng)絡(luò)中加入倒殘差結(jié)構(gòu),降低了缺陷檢測(cè)的成本,同時(shí)具有較高的檢測(cè)準(zhǔn)確度。
傳統(tǒng)的檢測(cè)方法需要針對(duì)不同的任務(wù),手動(dòng)設(shè)計(jì)圖像特征對(duì)缺陷進(jìn)行檢測(cè)識(shí)別。這種方法對(duì)特定問(wèn)題是較好的解決方案,但魯棒性差。例如對(duì)X 光圖像的處理方法,很難直接移植到紅外圖像的缺陷檢測(cè)中。近年來(lái),深度學(xué)習(xí)在目標(biāo)檢測(cè)領(lǐng)域取得了突破性進(jìn)展,其特點(diǎn)是效率高、魯棒性強(qiáng)。深度學(xué)習(xí)模型可以自動(dòng)學(xué)習(xí)圖像的特征,利用其強(qiáng)大的特征表達(dá)能力和建模能力,對(duì)缺陷進(jìn)行識(shí)別。通過(guò)監(jiān)督、半監(jiān)督及無(wú)監(jiān)督的方式,對(duì)輸入圖像經(jīng)過(guò)一系列非線(xiàn)性變換,生成高維抽象表達(dá),避免了手工設(shè)計(jì)特征的煩瑣低效。
卷積網(wǎng)絡(luò)由最初的多層感知機(jī)逐步向多層化、復(fù)雜化發(fā)展。比如卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolutional Neural Network)、遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network,RNN)、生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)等。卷積神經(jīng)網(wǎng)絡(luò)指的是內(nèi)含卷積結(jié)構(gòu)的深層神經(jīng)網(wǎng)絡(luò),由多層神經(jīng)網(wǎng)絡(luò)構(gòu)成。
數(shù)字圖像中部分區(qū)域與其他區(qū)域的圖像特征可能具有相似性,表明在某些區(qū)域?qū)W習(xí)到的圖像特征同樣適用于其他區(qū)域。卷積神經(jīng)網(wǎng)絡(luò)中,卷積操作主要是卷積核在特征圖上滑動(dòng),并對(duì)其進(jìn)行計(jì)算,填充可以實(shí)現(xiàn)卷積前后圖像大小保持不變。卷積在網(wǎng)絡(luò)中通過(guò)以卷積單元的形式對(duì)數(shù)據(jù)進(jìn)行特征提取,在神經(jīng)網(wǎng)絡(luò)的組成部分中至關(guān)重要。卷積層由若干卷積單元組成,用于對(duì)輸入特征進(jìn)行卷積。卷積層中的參數(shù)主要有卷積核尺寸、步長(zhǎng)、卷積核以及填充的數(shù)量。步長(zhǎng)指的是濾波器每次移動(dòng)的步幅。填充是為了消除卷積層對(duì)特征圖尺寸的影響,最常見(jiàn)的做法是在特征圖的邊緣填充零,使經(jīng)過(guò)卷積層的特征圖尺寸保持一致。在訓(xùn)練過(guò)程中,應(yīng)用反向傳播算法(Backpropagation)來(lái)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),計(jì)算卷積神經(jīng)網(wǎng)絡(luò)的輸出與實(shí)際值之間的誤差,并將其誤差反向傳播回隱藏層,直到輸入層。訓(xùn)練過(guò)程中,通過(guò)調(diào)整訓(xùn)練參數(shù),使損失函數(shù)最小,最后得到相對(duì)滿(mǎn)意的訓(xùn)練結(jié)果。
深度學(xué)習(xí)需要從數(shù)據(jù)集中學(xué)習(xí)并查找圖像中的特征,生成帶有概率的向量輸出。數(shù)據(jù)集一般由數(shù)據(jù)、標(biāo)注和元數(shù)據(jù)組成,其內(nèi)容依據(jù)所研究的領(lǐng)域確定,例如醫(yī)學(xué)圖像以患者所拍MRI 圖像、X 圖像等為主。
數(shù)據(jù)集的標(biāo)注是指通過(guò)人工輔助的方式,應(yīng)用Labelme 等圖像標(biāo)注工具對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)需要學(xué)習(xí)的數(shù)據(jù)進(jìn)行加工,使其適合機(jī)器學(xué)習(xí)的過(guò)程。數(shù)據(jù)集標(biāo)注主要類(lèi)型有圖像標(biāo)注、語(yǔ)音標(biāo)注、文本標(biāo)注、視頻標(biāo)注等。標(biāo)記的形式主要有標(biāo)注畫(huà)框、3D 畫(huà)框、目標(biāo)物體輪廓、圖像打點(diǎn)、文本轉(zhuǎn)錄等。元數(shù)據(jù)(中介數(shù)據(jù)、中繼數(shù)據(jù))是關(guān)于數(shù)據(jù)域、數(shù)據(jù)的組織及其關(guān)系的信息,本質(zhì)上講,元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。
目前,卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測(cè)應(yīng)用中精度的主要問(wèn)題是數(shù)據(jù)集中圖像的數(shù)量還相對(duì)較小,一般為萬(wàn)余張。事實(shí)上,較小數(shù)量的圖像數(shù)據(jù)集的缺點(diǎn)已經(jīng)被廣泛認(rèn)知。近幾年,隨著數(shù)字圖像技術(shù)的發(fā)展,人們獲取圖像的途徑變得多種多樣,獲取方式也更加便捷,這就使得獲取大容量數(shù)據(jù)集逐漸成為可能。比如Labelme,它由數(shù)十萬(wàn)張完全分割的圖像組成,以及ImageNet,它由超過(guò)2 萬(wàn)個(gè)類(lèi)別的,超過(guò)1 400 萬(wàn)張已經(jīng)被標(biāo)記的圖像組成。要想從如此龐大的數(shù)據(jù)集中學(xué)習(xí)到想要的目標(biāo),這對(duì)模型的學(xué)習(xí)能力是很高的挑戰(zhàn)。在任務(wù)如此困難復(fù)雜的情況下,訓(xùn)練學(xué)習(xí)能力較強(qiáng)的模型顯得尤為困難,因此我們的模型還應(yīng)該具備大量的先驗(yàn)知識(shí),以此來(lái)彌補(bǔ)數(shù)據(jù)集數(shù)量不足的問(wèn)題。卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),可以很好地解決上述問(wèn)題[9]。網(wǎng)絡(luò)的學(xué)習(xí)能力可以通過(guò)改變網(wǎng)絡(luò)結(jié)構(gòu)的形狀、深度和寬度來(lái)控制。因此,與具有相似層數(shù)的標(biāo)準(zhǔn)前饋神經(jīng)網(wǎng)絡(luò)相比,CNN 網(wǎng)絡(luò)的連接層和參數(shù)要少得多,因此更容易訓(xùn)練。
目標(biāo)檢測(cè)(Target Detection)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的核心問(wèn)題之一,其主要任務(wù)是找出圖像中所有感興趣的目標(biāo)(物體),確定其大小和位置。在深度學(xué)習(xí)算法成熟之前,目標(biāo)檢測(cè)算法應(yīng)用sift 算法、DPM(Deformable Parts Model)算法等傳統(tǒng)算法,基于人工設(shè)計(jì)的特征進(jìn)行構(gòu)建,由于計(jì)算資源有限,只能通過(guò)提高特征復(fù)雜度來(lái)提高檢測(cè)精度。
目前基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法有2 類(lèi):一階段(one-stage)和兩階段(two-stage)。衡量目標(biāo)檢測(cè)方法性能的指標(biāo)一般是模型的檢測(cè)準(zhǔn)確度和速度。一般情況下,one-stage 模型具有較快的檢測(cè)速度,而two-stage 方法具有較高的檢測(cè)準(zhǔn)確度。表1 介紹了2 種方法的優(yōu)缺點(diǎn)。其中,one-stage 和two-stage方法的主要區(qū)別是,two-stage 方法需要先生成候選框(region proposal)。候選框?yàn)榭赡馨矬w的區(qū)域,然后對(duì)每個(gè)區(qū)域進(jìn)行預(yù)測(cè)回歸。而one-stage 的方法不需要進(jìn)行候選框的生成,直接根據(jù)圖像的特征進(jìn)行預(yù)測(cè)回歸。one-stage 主要算法有YOLOv1、SSD、YOLOv2、RetinaNet、YOLOv3。two-stage 則有Fast RCNN、Faster RCNN。通常在進(jìn)行目標(biāo)檢測(cè)的時(shí)候,尤其是多目標(biāo)檢測(cè)任務(wù)中,不僅需要檢測(cè)出物體,還需要知道這個(gè)物體是什么。所以,在檢測(cè)任務(wù)中,通常會(huì)進(jìn)行多任務(wù)(multi-task)預(yù)測(cè)。例如,在Fast RCNN 中,將位置預(yù)測(cè)(location regressor)和目標(biāo)分類(lèi)(classification)整合到一個(gè)框架中,實(shí)現(xiàn)了將這個(gè)task 同時(shí)進(jìn)行訓(xùn)練。在早期的檢測(cè)算法比如RCNN、SPPNet 等,都屬于multi-task 類(lèi)。
表1 one-stage 和two-stage 目標(biāo)檢測(cè)方法比對(duì)
2012 年Krizhevsky 等[16]應(yīng)用深度卷積神經(jīng)網(wǎng)絡(luò)(DCCN)進(jìn)行ImageNet 分類(lèi),如圖3 所示,在測(cè)試數(shù)據(jù)集中,文章實(shí)現(xiàn)了top-1 和top-5 錯(cuò)誤率分別為37.5%和17.0%,大大優(yōu)于當(dāng)時(shí)技術(shù)水平。DCCN 網(wǎng)絡(luò)有6 000 萬(wàn)個(gè)參數(shù)和65 萬(wàn)個(gè)神經(jīng)元,由5 個(gè)卷積層(其中一些層后連接最大池化層)和3 個(gè)全連接層(最后有1 000 路softmax)組成。
圖3 DCCN(AlexNet)[16]
Faster RCNN 為典型兩階段目標(biāo)檢測(cè)算法[17],如圖4 所示,一階段為region proposal,二階段為bounding box 回歸和分類(lèi)。模型使用CNN 提取圖像特征,進(jìn)而應(yīng)用region proposal network(RPN)提取ROI(region of interest),用ROI pooling 將提取出的ROI 轉(zhuǎn)換成固定尺寸,再送入全連接層進(jìn)行bounding box 回歸和分類(lèi)預(yù)測(cè)。
圖4 結(jié)構(gòu)圖[17]
Mask RCNN 由He 等[18]提出,其原理為在 Faster RCNN 的框架中添加一個(gè)分支網(wǎng)絡(luò),在實(shí)現(xiàn)目標(biāo)檢測(cè)任務(wù)的同時(shí),分割出目標(biāo)像素。Cascade Mask RCNN在Faster RCNN 的基礎(chǔ)上,將幾個(gè)不同IOU 閾值的檢測(cè)網(wǎng)絡(luò)級(jí)聯(lián),形成了基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法[19]。
目前有多種深度學(xué)習(xí)方法應(yīng)用于缺陷檢測(cè),常用的識(shí)別與分類(lèi)方法主要有BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)、模糊神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Supportvector Machine,SVM)以及各種分類(lèi)器的集成模型等。表2 總結(jié)了產(chǎn)品缺陷檢測(cè)中常用的深度學(xué)習(xí)方法的優(yōu)缺點(diǎn),主要包括卷積神經(jīng)網(wǎng)絡(luò)、生成對(duì)抗神經(jīng)網(wǎng)絡(luò)、深度殘差神經(jīng)網(wǎng)絡(luò)、全卷積神經(jīng)網(wǎng)絡(luò)等。
表2 基于深度學(xué)習(xí)的缺陷檢測(cè)方法
在缺陷檢測(cè)技術(shù)的研究工作中,隨著深度學(xué)習(xí)方法的快速發(fā)展,基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法已經(jīng)廣泛應(yīng)用于產(chǎn)品缺陷檢測(cè)的各個(gè)領(lǐng)域。深度學(xué)習(xí)圖像處理技術(shù)學(xué)習(xí)圖像中的特征,對(duì)圖像中的產(chǎn)品缺陷進(jìn)行分類(lèi)和定位,比如裂紋、氣孔、夾渣、條缺等,這種缺陷通過(guò)射線(xiàn)檢測(cè)尤為快捷方便,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)焊縫圖像中缺陷的特征,可使網(wǎng)絡(luò)自行判斷缺陷的位置與類(lèi)別。表3 為目前基于深度學(xué)習(xí)的缺陷檢測(cè)方法中的深度學(xué)習(xí)方法取得的實(shí)驗(yàn)結(jié)果的比較。這些算法的識(shí)別最高精度可以達(dá)到99.52%。
表3 基于機(jī)器學(xué)習(xí)的缺陷檢測(cè)技術(shù)
本文對(duì)工業(yè)過(guò)程中產(chǎn)品缺陷檢測(cè)技術(shù)的研究現(xiàn)狀進(jìn)行了綜述。對(duì)傳統(tǒng)的缺陷檢測(cè)方法和深度學(xué)習(xí)缺陷檢測(cè)技術(shù)進(jìn)行了比較分析,并對(duì)缺陷檢測(cè)技術(shù)的實(shí)驗(yàn)結(jié)果進(jìn)行了綜合性總結(jié)。本文主要針對(duì)卷積神經(jīng)網(wǎng)絡(luò)在焊縫缺陷檢測(cè)中的應(yīng)用進(jìn)行論述,文章首先介紹了無(wú)損檢測(cè)技術(shù)的發(fā)展現(xiàn)狀以及焊縫缺陷檢測(cè)技術(shù)的重要性。文章對(duì)數(shù)字圖像處理技術(shù)的發(fā)展進(jìn)行介紹,針對(duì)卷積神經(jīng)網(wǎng)絡(luò)在數(shù)字圖像處理中的應(yīng)用與發(fā)展進(jìn)行進(jìn)一步介紹,結(jié)論如下:
1)目前深度學(xué)習(xí)在工件缺陷檢測(cè)中已進(jìn)行應(yīng)用,并取得了較高的識(shí)別準(zhǔn)確率,但是識(shí)別速度與精度仍有一定程度的提高空間;
2)目前深度學(xué)習(xí)主要應(yīng)用于焊縫缺陷檢測(cè)與物體表面缺陷檢測(cè),如何將卷積神經(jīng)網(wǎng)絡(luò)算法應(yīng)用到渦流、超聲等檢測(cè)方法中,未來(lái)或成研究熱點(diǎn);
3)在線(xiàn)產(chǎn)品缺陷檢測(cè)、三維缺陷檢測(cè)等,是未來(lái)工業(yè)產(chǎn)品缺陷檢測(cè)領(lǐng)域的發(fā)展趨勢(shì)。
近年來(lái),隨著計(jì)算機(jī)技術(shù)的發(fā)展以及成像技術(shù)的數(shù)字化,越來(lái)越多的計(jì)算方法被應(yīng)用到圖像中缺陷的智能識(shí)別,比如Cascade Mask RCNN 等。但是目前受限于數(shù)據(jù)集樣本的數(shù)量,以及不同模型對(duì)不同數(shù)據(jù)集的泛化性能的不同,導(dǎo)致目前焊縫缺陷的識(shí)別精度提升存在一定的難度,同時(shí)也是未來(lái)深度學(xué)習(xí)在缺陷智能識(shí)別應(yīng)用中準(zhǔn)確率提升的研究熱點(diǎn)與難點(diǎn)。