摘要:本文對機(jī)器視覺技術(shù)基礎(chǔ)理論及基于深度學(xué)習(xí)的AI 機(jī)器視覺技術(shù)做介紹,通過對電池殼制造行業(yè)中電池殼品質(zhì)AI 機(jī)器視覺檢測的典型案例,表明在該檢測領(lǐng)域的技術(shù)優(yōu)越性,并對AI+ 機(jī)器視覺技術(shù)在汽車行業(yè)中的應(yīng)用前景進(jìn)行了展望。
關(guān)鍵詞:機(jī)器視覺;深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);電池殼制造
一、基于深度學(xué)習(xí)的AI 機(jī)器視覺技術(shù)概述
(一)機(jī)器視覺技術(shù)概念
機(jī)器視覺(Machine Vision)的研究是從20 世紀(jì)60 年代中期美國學(xué)者L.R. 羅伯茲關(guān)于理解多面體組成的積木世界研究開始的[1]。根據(jù)美國自動成像協(xié)會(AIA)的定義,機(jī)器視覺是一種應(yīng)用于工業(yè)和非工業(yè)領(lǐng)域的硬件和軟件組合,它基于捕獲并處理的圖像為設(shè)備執(zhí)行其功能提供操作指導(dǎo)。它被稱為智能制造的“慧眼”[2],為智能制造打開新“視”界,是實現(xiàn)工業(yè)自動化和智能化的必要手段。
從狹義上,機(jī)器視覺系統(tǒng)包括圖像采集部分(相機(jī)、鏡頭、光源、光源控制器),圖像傳輸部分(圖像采集卡、線纜、數(shù)據(jù)接口)以及圖像處理解析部分(預(yù)處理器、主處理器、應(yīng)用軟件)。其中圖像采集部分負(fù)責(zé)成像,圖像處理解析部分負(fù)責(zé)對成像結(jié)果進(jìn)行處理分析和輸出。從廣義角度,還包括后端相關(guān)的信息通訊及運動控制系統(tǒng)。
傳統(tǒng)機(jī)器視覺主要用于對檢測物品進(jìn)行識別、測量、定位及檢測,通過機(jī)器代替人工進(jìn)行測量與判斷,識別場景及效率相對標(biāo)準(zhǔn)化。識別是基于對目標(biāo)物的形狀、顏色等特征進(jìn)行甄別;測量是將獲取的圖像像素信息標(biāo)定成常用度量衡單位,再在圖像中精確計算目標(biāo)物的幾何尺寸;定位則是獲得目標(biāo)物關(guān)于二維或三維的位置信息;檢測主要指外觀檢測,對產(chǎn)品裝配后的完整性檢測及外觀缺陷檢測等,其難度最高,因此迫切需要尋找一種有效的技術(shù)方式,提高檢測可靠性。
(二)基于深度學(xué)習(xí)的AI 機(jī)器視覺技術(shù)概念
人工智能(Artificial Intelligence, 縮寫為AI) 指由人制造出來的可以表現(xiàn)出智能的機(jī)器,通常是指通過普通計算機(jī)程序來呈現(xiàn)人類智能的技術(shù)。深度學(xué)習(xí)(deep learning)是人工智能的一個子領(lǐng)域,通過處理數(shù)據(jù)和創(chuàng)建用于決策制定的模式,來模仿人類大腦的工作方式,可通過人工神經(jīng)網(wǎng)絡(luò)等架構(gòu)完成[3]。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional NeuralNetworks, CNN)是人工神經(jīng)網(wǎng)絡(luò)中的一種,是深度學(xué)習(xí)中頗受歡迎的代表算法之一。
機(jī)器視覺經(jīng)常使用CNN 算法, 它的基本結(jié)構(gòu)由輸入層、卷積層(convolutional layer)、池化層(poolinglayer,也成為取樣層)、全連接層及輸出層構(gòu)成。圖像中不同數(shù)據(jù)窗口的數(shù)據(jù)和卷積核(一個濾波矩陣)作內(nèi)積的操作就叫做卷積,它的本質(zhì)是將小區(qū)域內(nèi)的信息統(tǒng)計抽象出來,即提取圖像不同頻段的特征。CNN 的卷積層和池化層一般會取若干個,采用卷積層和池化層交替設(shè)置,即一個卷積層連接一個池化層池化層后再連接一個卷積層,依此類推[4]。卷積層的第一層通常用于捕捉邊緣、顏色、梯度方向和基本幾何形狀等基本特征。添加層后,此模型會填充高級特征。池化層會逐漸縮小表示空間的大小,可提高計算效率,并會單獨對每個特征圖進(jìn)行運算,其常用的方法是最大池化,即捕捉數(shù)組的最大值,從而減少計算所需值的數(shù)量。標(biāo)準(zhǔn)化層會對數(shù)據(jù)進(jìn)行正則化處理,以改善神經(jīng)網(wǎng)絡(luò)的性能和穩(wěn)定性。其通過將所有輸入都轉(zhuǎn)換為均值為 0 且方差為1,從而使每個層的輸入更便于管理。
(三)人工智能帶動機(jī)器視覺技術(shù)發(fā)展
在AI 的加持下,機(jī)器視覺行業(yè)將迎來空前發(fā)展機(jī)會。從算法、技術(shù)到應(yīng)用,AI 技術(shù)極大程度賦能機(jī)器視覺在圖像模型上的智能化應(yīng)用,優(yōu)化了圖像識別的復(fù)雜度及精度,實現(xiàn)萬物識別。深度學(xué)習(xí)算法的加持為機(jī)器視覺應(yīng)用場景的拓寬提供了技術(shù)支持,同時可以進(jìn)一步提升機(jī)器視覺的效率及準(zhǔn)確性。
二、電池殼制造行業(yè)中AI 機(jī)器視覺技術(shù)的典型應(yīng)用
在我國新能源汽車快速發(fā)展的引領(lǐng)下,電動化已成為全球汽車發(fā)展的主要趨勢。新能源動力汽車由電池包提供電源,是電動汽車產(chǎn)業(yè)鏈的核心。其中汽車電池殼制造行業(yè)的自動化程度較高,機(jī)器視覺作為先進(jìn)技術(shù)的典型已成功運用到該行業(yè)中,基于深度學(xué)習(xí)的AI 機(jī)器視覺技術(shù)在此過程中發(fā)揮了巨大的作用。
汽車電池殼生產(chǎn)線上,殼體需經(jīng)過焊接、機(jī)加工、壓鉚、拉鉚等工藝加工,生產(chǎn)過程中可能存在螺母、螺栓、螺柱、蓋板、線束、鋼絲牙套等的安裝錯漏,以及工件孔位、套筒、閥門、封堵片等零件的缺失。任何一個零件的安裝異常都會導(dǎo)致電池包存在安全隱患。因此,在電池殼生產(chǎn)過程中,增加AI機(jī)器視覺檢測品質(zhì)缺陷十分必要。且由于很多電池殼為鋁合金材質(zhì),存在一定程度的反光且結(jié)構(gòu)復(fù)雜,因此,使用傳統(tǒng)機(jī)器視覺技術(shù)很多時候無法滿足客戶的高檢測標(biāo)準(zhǔn)。由于基于深度學(xué)習(xí)的AI 機(jī)器視覺檢測算法可規(guī)避傳統(tǒng)算法對圖像中目標(biāo)特征的高成像要求,因此該技術(shù)在識別電池殼的上述缺陷是非常行之有效的檢測手段。
電池殼體在生產(chǎn)后,通常會預(yù)留一個全面質(zhì)檢工位,采用機(jī)器人帶視覺的方式進(jìn)行全面檢測。電池殼品質(zhì)視覺檢測工作站主要由機(jī)器人系統(tǒng)、視覺系統(tǒng)、變位機(jī)夾具系統(tǒng)、電控系統(tǒng)四大部分組成。待檢電池殼由上工序放入變位機(jī)夾具內(nèi)夾緊,機(jī)器人負(fù)責(zé)在末端安裝視覺設(shè)備采集電池殼各待檢部位圖像。變位機(jī)在機(jī)器人視覺檢測的過程中配合機(jī)器人動作進(jìn)行翻轉(zhuǎn),確保所有待檢部位能夠清晰拍攝。電控系統(tǒng)作為設(shè)備總控,負(fù)責(zé)協(xié)調(diào)機(jī)器人、視覺系統(tǒng)及變位機(jī)夾具系統(tǒng)協(xié)同工作,設(shè)備如圖1 所示。
具體識別步驟如下:
步驟1 :采集大量螺母、螺栓、螺柱等目標(biāo)物的圖片,使用深度學(xué)習(xí)算法構(gòu)建并訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型;
步驟2 :對所構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行打包,生成可執(zhí)行文件;
步驟3 :構(gòu)建傳統(tǒng)機(jī)器視覺框架作為主軟件運行,并單獨建立新線程調(diào)用可執(zhí)行文件啟動運行;
步驟4 :在可執(zhí)行文件啟動時創(chuàng)建服務(wù)端,將主軟件作為客戶端與服務(wù)端進(jìn)行連接,以實現(xiàn)傳統(tǒng)機(jī)器視覺框架與服務(wù)端可執(zhí)行文件間的數(shù)據(jù)通信;
步驟5 :在進(jìn)行電池盒外觀檢測時,作為主軟件的傳統(tǒng)機(jī)器視覺框架采集并獲取電池盒外觀的圖像將其發(fā)送至服務(wù)端,于服務(wù)端執(zhí)行可執(zhí)行文件獲得識別結(jié)果,將識別結(jié)果返回至傳統(tǒng)機(jī)器視覺框架予以輸出。
應(yīng)用結(jié)果表明,與傳統(tǒng)的機(jī)器視覺算法相比,AI+ 機(jī)器視覺技術(shù)對于有反光、結(jié)構(gòu)復(fù)雜的零件檢測更具有優(yōu)勢,可克服反光等不良檢測因素,具有檢出率高、計算速度快、檢測節(jié)拍高等特點。
三、結(jié)語
基于深度學(xué)習(xí)的機(jī)器視覺技術(shù)在現(xiàn)代先進(jìn)汽車制造產(chǎn)業(yè)的各個環(huán)節(jié)中都起到了至關(guān)重要的作用。在工業(yè)4.0 時代背景下,隨著人工智能技術(shù)的進(jìn)步,以及相關(guān)軟硬件技術(shù)及云技術(shù)的發(fā)展,AI+ 機(jī)器視覺的技術(shù)在未來將會有更加廣闊的應(yīng)用空間,能促使汽車制造行業(yè)向模塊化、數(shù)字化、自動化、智能化方向發(fā)展。
參考文獻(xiàn):
[1] 朱陽芬,銀冬平,鄒舜章等. 機(jī)器視覺在汽車行業(yè)中的發(fā)展與應(yīng)用[J]. 汽車實用技術(shù),2017,22 :8-11.
[2] 尹仕斌,任永杰,劉濤等. 機(jī)器視覺技術(shù)在現(xiàn)代汽車制造中的應(yīng)用綜述[J]. 光學(xué)學(xué)報,2017,38(8):1-12.
[3] 黃樺,騰海渤,劉義法等. 機(jī)器視覺技術(shù)在汽車制造行業(yè)中的應(yīng)用研究[J]. 汽車工藝與材料,2022(6):8-15.
[4] 周飛燕,金林鵬,董軍. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計算機(jī)學(xué)報,2017,40(6):1229-1251.