衛(wèi)晶
摘要:在我國(guó)推進(jìn)制造強(qiáng)國(guó)的發(fā)展過(guò)程中,智能制造是十分重要的途徑,在這之中機(jī)器視覺(jué)技術(shù)成為了智能制造的核心技術(shù)。在本文的論述中從技術(shù)概念出發(fā),論述了機(jī)器視覺(jué)技術(shù)在智能制造領(lǐng)域中的應(yīng)用以及產(chǎn)業(yè)發(fā)展。
關(guān)鍵詞:機(jī)器視覺(jué);智能制造;應(yīng)用;產(chǎn)業(yè)發(fā)展
引言
我國(guó)是一個(gè)世界制造大國(guó),但還不是制造強(qiáng)國(guó),存在的突出問(wèn)題主要在于自主創(chuàng)新能力不強(qiáng)、資源利用效率低等,產(chǎn)業(yè)結(jié)構(gòu)調(diào)整刻不容緩,智能制造(SmartManufacturing,SM)為我國(guó)制造業(yè)跨越發(fā)展、實(shí)現(xiàn)制造強(qiáng)國(guó)目標(biāo)提供了歷史性機(jī)遇[1]。人工智能(ArtificialIntelligence,AI)與先進(jìn)制造技術(shù)融合發(fā)展,促進(jìn)了制造業(yè)向人-信息-物理系統(tǒng)(Human-Cyber-PhysicalSystems,HCPS)的新一代智能制造的轉(zhuǎn)型升級(jí)。制造業(yè)信息化專家、中國(guó)工程院院士李培根認(rèn)為智能制造的本質(zhì)和真諦是利用大數(shù)據(jù)、AI等先進(jìn)技術(shù)認(rèn)識(shí)和控制制造系統(tǒng)中的不確定性問(wèn)題,以達(dá)到更高的目標(biāo)。發(fā)達(dá)國(guó)家紛紛運(yùn)用工業(yè)大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、工業(yè)網(wǎng)絡(luò)安全、虛擬現(xiàn)實(shí)(VirtualReality,VR)、工業(yè)機(jī)器人、3D打印、AI、知識(shí)工作自動(dòng)化等信息網(wǎng)絡(luò)技術(shù)大力發(fā)展智能制造。由此,新一輪工業(yè)革命席卷全球。
1、技術(shù)概念
機(jī)器視覺(jué)技術(shù)是一項(xiàng)覆蓋多領(lǐng)域?qū)W術(shù)技術(shù)的科學(xué)技術(shù)[1]。對(duì)機(jī)器視覺(jué)技術(shù)的理解,首先要談到人類視覺(jué)。人類視覺(jué)是引發(fā)機(jī)器視覺(jué)研究的基礎(chǔ)。機(jī)器視覺(jué)模擬人的視覺(jué)感官,以求實(shí)現(xiàn)如人一樣的對(duì)面前事物進(jìn)行分辨,從而替換人力,嵌入機(jī)器設(shè)備而使之改造升級(jí)。需重點(diǎn)提出的是,機(jī)器視覺(jué)不僅能仿人類視覺(jué)能力,同時(shí)還能對(duì)所“見(jiàn)”物體展開(kāi)精確測(cè)量與定位等更高級(jí)的操作,它在某種意義上超越了人的視覺(jué)。
目前,CCD攝像機(jī)是機(jī)器視覺(jué)技術(shù)得以產(chǎn)生價(jià)值的關(guān)鍵。機(jī)器視覺(jué)技術(shù)發(fā)揮功能就在于要對(duì)信息進(jìn)行提取,而CCD攝像機(jī)就像是它的瞳孔,為它進(jìn)行提取信息、監(jiān)測(cè)信息等操作。CCD攝像機(jī)所獲得信息都是以數(shù)據(jù)的形式收入電子信息軟件,然后實(shí)現(xiàn)以信息技術(shù)為依托的全方位檢測(cè)。可以說(shuō),CCD攝像機(jī)為機(jī)器視覺(jué)技術(shù)的操作平添了信息提取力,而信息技術(shù)則為它平添了超強(qiáng)的判斷力、數(shù)據(jù)分析力。
2、機(jī)器視覺(jué)在智能制造中的應(yīng)用
2.1、定位和引導(dǎo)
定位和引導(dǎo)技術(shù)是自動(dòng)導(dǎo)引小車的核心技術(shù)之一。機(jī)器視覺(jué)在定位和引導(dǎo)中起重要作用,近年來(lái),無(wú)預(yù)設(shè)參照介質(zhì)的同步定位與建圖技術(shù)得到迅猛發(fā)展。與傳統(tǒng)磁條、射頻識(shí)別、激光反射板等導(dǎo)引技術(shù)不同,該技術(shù)不必預(yù)設(shè)參照物就能夠?qū)崿F(xiàn)自主避障、自主規(guī)劃路徑,從而大幅度降低成本。
2.2、檢測(cè)
機(jī)器視覺(jué)檢測(cè)技術(shù)主要應(yīng)用于目標(biāo)表面缺陷檢測(cè),傳統(tǒng)的缺陷檢測(cè)主要是從形狀、顏色、面積、圓度、角度、長(zhǎng)度、寬度、長(zhǎng)寬比等信息來(lái)確定被檢測(cè)目標(biāo)是否符合標(biāo)準(zhǔn)。隨著深度學(xué)習(xí)的發(fā)展與應(yīng)用,視覺(jué)檢測(cè)在人眼難以直接量化的特征方面的表現(xiàn)尤其亮眼。南京航空航天大學(xué)開(kāi)發(fā)了一套新型汽車表面缺陷檢測(cè)系統(tǒng),使用5個(gè)CCD相機(jī)同步采集汽車5個(gè)側(cè)面的圖像,利用多尺度Hessian矩陣融合方法選取圖像中的缺陷區(qū)域,然后提取缺陷形狀、尺寸、統(tǒng)計(jì)量、散度特征并運(yùn)用支持向量機(jī)識(shí)別缺陷類別,劃痕、凹陷識(shí)別率分別達(dá)97.1%、95.6%,適用于進(jìn)口車輛海關(guān)檢測(cè)。
2.3、測(cè)量
機(jī)器視覺(jué)技術(shù)可以用來(lái)測(cè)量,根據(jù)相機(jī)的用量和設(shè)計(jì)位置,可以實(shí)現(xiàn)對(duì)二維平面圖像的采集,也可以實(shí)現(xiàn)對(duì)三維立體圖像的采集。傳統(tǒng)的2D圖像分析技術(shù)主要是提取灰度圖像的特征信息來(lái)測(cè)量目標(biāo)物體的X-Y平面,無(wú)法測(cè)量目標(biāo)物體的高度、厚度、曲率和體積等3D參數(shù)。與2D目標(biāo)檢測(cè)相比,3D目標(biāo)檢測(cè)結(jié)合了深度信息,能夠提供目標(biāo)的位置、大小以及方向等空間信息,在自動(dòng)駕駛、機(jī)器人領(lǐng)域應(yīng)用廣泛。
2.4、識(shí)別
常見(jiàn)的視覺(jué)識(shí)別技術(shù)主要有光學(xué)字符識(shí)別、一維碼/二維碼識(shí)別技術(shù)、人臉識(shí)別技術(shù)、產(chǎn)品缺陷識(shí)別、分類識(shí)別等。其中,OCR技術(shù)已廣泛應(yīng)用于食品標(biāo)簽識(shí)別、票據(jù)識(shí)別、產(chǎn)品溯源、儀表讀數(shù)識(shí)別等領(lǐng)域,并且,機(jī)器視覺(jué)與深度學(xué)習(xí)技術(shù)相結(jié)合已能夠識(shí)別更為復(fù)雜的目標(biāo)。
3、機(jī)器視覺(jué)產(chǎn)業(yè)
3.1、產(chǎn)業(yè)發(fā)展
20世紀(jì)50年代,人們開(kāi)始研究二維圖像的統(tǒng)計(jì)模式識(shí)別;60年代,ROBERTS運(yùn)用計(jì)算機(jī)程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu)并對(duì)物體形狀及物體的空間關(guān)系進(jìn)行描述,開(kāi)創(chuàng)了以理解三維場(chǎng)景為目的三維機(jī)器視覺(jué)研究;70年代中期,MIT人工智能實(shí)驗(yàn)室正式開(kāi)設(shè)“機(jī)器視覺(jué)”的課程,DavidMARR提出了著名的Marr理論;到了80年代,在全球范圍內(nèi)掀起了一股研究熱潮,不僅出現(xiàn)了基于感知特征群的物體識(shí)別理論框架、主動(dòng)視覺(jué)理論框架、視覺(jué)集成理論框架等概念,而且產(chǎn)生了很多新的研究方法和理論;90年代,機(jī)器視覺(jué)理論得到進(jìn)一步的發(fā)展,同時(shí)開(kāi)始在工業(yè)領(lǐng)域得到應(yīng)用。早期的視覺(jué)算法大致可以分為特征感知、圖像預(yù)處理、特征提取、特征篩選、推理預(yù)測(cè)與識(shí)別5個(gè)步驟,不但需要手工設(shè)計(jì)特征,還要在此基礎(chǔ)上設(shè)計(jì)合適的分類器算法。卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN)的出現(xiàn),使得不需要手動(dòng)設(shè)計(jì)特征、不挑選分類器的視覺(jué)系統(tǒng)得以實(shí)現(xiàn)。1998年深度學(xué)習(xí)網(wǎng)絡(luò)的最初原型LeNet被提出,2009年李飛飛教授建立了ImageNet數(shù)據(jù)集并于次年創(chuàng)辦了首屆ImageNet圖像識(shí)別挑戰(zhàn)賽,隨后AlexNet、VGG、GoogLeNet、ResNet模型分別在該賽事中奪冠,并涌現(xiàn)出一大批創(chuàng)業(yè)公司,大力推動(dòng)了機(jī)器視覺(jué)的發(fā)展。時(shí)至今日,機(jī)器視覺(jué)獲得了蓬勃發(fā)展,新概念、新理論不斷涌現(xiàn),基于深度學(xué)習(xí)的視覺(jué)系統(tǒng)已在工業(yè)界大量應(yīng)用。
3.2、機(jī)器視覺(jué)在工業(yè)智能化生產(chǎn)中的發(fā)展趨勢(shì)
在工業(yè)智能化生產(chǎn)之中應(yīng)用機(jī)器視覺(jué)技術(shù),表現(xiàn)出如下優(yōu)勢(shì):(1)可以借助機(jī)器在非接觸的狀態(tài)下進(jìn)行測(cè)量,也可以針對(duì)人工難以檢測(cè)的區(qū)域進(jìn)行測(cè)量。(2)相比于人眼,機(jī)器對(duì)光的敏感度更高,可以用于人眼無(wú)法識(shí)別的紅外及微弱光的檢測(cè),有效避免了人眼檢測(cè)的缺陷,在一定程度上拓展了人眼的視覺(jué)范圍。(3)機(jī)器與人不同,不會(huì)出現(xiàn)視覺(jué)疲勞,因此可以維持長(zhǎng)期穩(wěn)定的工作。(4)通過(guò)機(jī)器視覺(jué)技術(shù)的形式可以在一定程度上節(jié)約人力資源,為企業(yè)節(jié)約生產(chǎn)成本,以實(shí)現(xiàn)增收的目的。
一般而言,圖像采集的速度直接取決于硬件的處理速度,如果硬件的質(zhì)量較高,則可以在一定程度上減小對(duì)主機(jī)造成的負(fù)擔(dān),讓系統(tǒng)的圖像分辨率、采集率和圖像處理速度得到切實(shí)提升。此外,軟件的質(zhì)量也十分關(guān)鍵,通過(guò)高質(zhì)量的軟件可以切實(shí)提升機(jī)器的命令執(zhí)行速度,讓圖像處理效率得到充分保障;其次,要求積極研制具有良好適應(yīng)性且效率較高的智能算法,通過(guò)較為穩(wěn)定高效的智能算法,讓系統(tǒng)的分析處理速度得到切實(shí)提升,實(shí)現(xiàn)對(duì)于復(fù)雜環(huán)境中系統(tǒng)抗干擾能力的充分改善,讓系統(tǒng)的即時(shí)性和穩(wěn)定性得到切實(shí)提升,同時(shí),強(qiáng)化系統(tǒng)的環(huán)境適應(yīng)性和魯棒性能。
4、結(jié)語(yǔ)
時(shí)至今日,機(jī)器視覺(jué)獲得了蓬勃發(fā)展,對(duì)新一代智能制造的轉(zhuǎn)型升級(jí)和發(fā)展起了重要的推動(dòng)作用。目前我國(guó)的機(jī)器視覺(jué)技術(shù)水平仍然有待提升,要對(duì)于這一技術(shù)繼續(xù)探索,努力攻克現(xiàn)存的技術(shù)難題,以促進(jìn)其在工業(yè)制造領(lǐng)域中的智能化和自動(dòng)化應(yīng)用,為我國(guó)早日成為現(xiàn)代化科技強(qiáng)國(guó)奠定堅(jiān)實(shí)的基礎(chǔ)。
參考文獻(xiàn):
[1]鄭達(dá).自主性的智能化藝術(shù)[J].畫(huà)刊,2020(10):26-28.
[2]孫鄭芬,吳韶波.機(jī)器視覺(jué)技術(shù)在工業(yè)智能化生產(chǎn)中的應(yīng)用[J].物聯(lián)網(wǎng)技術(shù),2020,10(08):103-105+108.