孫 輝,李曉峰,程遠(yuǎn)方,姜 飛,李文豪
(國(guó)營(yíng)洛陽(yáng)丹城無(wú)線電廠,洛陽(yáng) 471000)
如今數(shù)字式儀器儀表廣泛應(yīng)用于各個(gè)行業(yè),由于歷史原因、成本控制考慮、設(shè)計(jì)要求等因素,仍有相當(dāng)數(shù)量的儀器沒(méi)有提供與計(jì)算機(jī)的數(shù)據(jù)通訊接口,不具備程控功能,在工藝工卡錄入時(shí),還需手動(dòng)記錄儀器儀表測(cè)試數(shù)據(jù)。人工錄入儀表數(shù)據(jù)耗費(fèi)大量人力和時(shí)間,記錄的測(cè)試結(jié)果容易受到更改。相比之下,更方便的是通過(guò)工業(yè)相機(jī)實(shí)時(shí)監(jiān)控采集儀器儀表表盤(pán)圖像,然后使用字符識(shí)別的機(jī)器視覺(jué)技術(shù),對(duì)儀器儀表表盤(pán)圖像中的字符數(shù)據(jù)進(jìn)行識(shí)別[1-2]。
數(shù)字儀器儀表中的數(shù)據(jù)通常包含多個(gè)字符,傳統(tǒng)的方法是先通過(guò)機(jī)器視覺(jué)定位算法,尋找儀表特征,來(lái)確定字符顯示區(qū)域的位置,然后將字符區(qū)域分割成單個(gè)字符進(jìn)行識(shí)別。整個(gè)過(guò)程復(fù)雜,識(shí)別結(jié)果容易受到預(yù)處理過(guò)程中定位和分割結(jié)果的影響[3-4]。如果我們實(shí)現(xiàn)了數(shù)字儀器儀表圖像的像素級(jí)預(yù)測(cè),并且預(yù)測(cè)結(jié)果同時(shí)包含了位置信息和類(lèi)別信息,對(duì)識(shí)別的示數(shù)區(qū)域進(jìn)行預(yù)處理,就可以直接將兩者合成得到字符結(jié)果?;诰矸e神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法被廣泛應(yīng)用于各類(lèi)型工業(yè)應(yīng)用場(chǎng)合[5-8]。若目標(biāo)定位后需對(duì)目標(biāo)信息進(jìn)行內(nèi)容的識(shí)別,則圖像預(yù)處理階段及其重要,處理算法為后續(xù)字符成功分割和識(shí)別提供了重要的基礎(chǔ)。經(jīng)過(guò)工業(yè)相機(jī)在復(fù)雜環(huán)境中獲取到的圖像會(huì)存留各種各樣的噪聲,均值濾波雖然能夠很好的解決噪聲點(diǎn)的保留問(wèn)題,但是其對(duì)原有的信號(hào)點(diǎn)的灰度值進(jìn)行了改變,尤其是針對(duì)前景與背景交界的邊緣處,細(xì)節(jié)保留方面并不完備。文獻(xiàn)[9-10]分別提出利用灰度檢測(cè)器來(lái)檢測(cè)圖像中的噪聲程度,設(shè)計(jì)了相關(guān)模糊加權(quán)的中值濾波器或?yàn)V波選擇器來(lái)進(jìn)行處理,有效的去除了椒鹽噪聲,保護(hù)了大部分圖像細(xì)節(jié)。諧波均值濾波器和非局部均值濾波器(NLM)對(duì)高斯噪聲和白噪聲處理有著顯著作用,但是參數(shù)取值時(shí),則往往需要人工經(jīng)驗(yàn),且NLM濾波器[11-12]對(duì)非局部主要體現(xiàn)在利用整張圖的像素點(diǎn)進(jìn)行濾波,但是該濾波算法濾波速度較慢,無(wú)法應(yīng)用于實(shí)時(shí)圖像檢測(cè)與處理。然而,儀器儀表所處各類(lèi)工業(yè)應(yīng)用場(chǎng)景較為復(fù)雜,目前僅僅針對(duì)光照不均勻和低對(duì)比度圖像的增強(qiáng)算法層出不窮,被不斷發(fā)展來(lái)應(yīng)用于增強(qiáng)各種類(lèi)型的圖像,以方便后期對(duì)字符的分割與提取。文獻(xiàn)[13]設(shè)計(jì)同態(tài)濾波器來(lái)增強(qiáng)圖像對(duì)光照變化的適應(yīng)性,算法能夠解決不同光照條件下,存在指針陰影問(wèn)題,能夠較好的提取指針式儀表的指針區(qū)域。文獻(xiàn)[14]通過(guò)同態(tài)濾波對(duì)圖像進(jìn)行銳化,以提高圖像的清晰度,從而突出了圖像的邊緣細(xì)節(jié)特征。文獻(xiàn)[15]提出了一種結(jié)合對(duì)比度約束的自適應(yīng)直方圖形式來(lái)增強(qiáng)圖像對(duì)比度,取得了較好的效果。但是上述同態(tài)濾波器所需調(diào)節(jié)參數(shù)較多,且往往參數(shù)調(diào)節(jié)需要大量的人工經(jīng)驗(yàn),不利于算法的工業(yè)多場(chǎng)景下的快速部署。
為了解決上述問(wèn)題,本文提出了一種基于改進(jìn)的聯(lián)合濾波與CNN檢測(cè)模型算法,用于對(duì)復(fù)雜場(chǎng)景下的數(shù)字式工業(yè)儀表進(jìn)行快速識(shí)別與判定。通過(guò)CNN目標(biāo)檢測(cè)模型快速準(zhǔn)確定位儀表表盤(pán)位置,然后通過(guò)聯(lián)合濾波算法對(duì)多場(chǎng)景約束下的表盤(pán)圖像進(jìn)行自適應(yīng)濾波操作,能夠快速處理相關(guān)圖像,大幅度的減少運(yùn)算時(shí)間,較好的保留了圖像受關(guān)注的細(xì)節(jié)成份,對(duì)于復(fù)雜場(chǎng)景下的算法工業(yè)部署具備較高的實(shí)用性。
常見(jiàn)的CNN主要分為顯示層和隱藏層兩部分,顯示層包括輸入層和輸出層,隱藏層包括卷積層和池化層。在每一層中,一個(gè)二維平面由多個(gè)神經(jīng)元組成,然后由這些平面形成一個(gè)層結(jié)構(gòu)[16]。圖1是常見(jiàn)的CNN結(jié)構(gòu)圖。
圖1 CNN結(jié)構(gòu)
其中,C1和C3為卷積層,卷積層的作用是通過(guò)在之前的特征圖上滑動(dòng)卷積核來(lái)提取卷積核對(duì)應(yīng)的特征。將前一層的輸出作為輸入,根據(jù)卷積層的卷積核數(shù)進(jìn)行卷積運(yùn)算。卷積層中每個(gè)神經(jīng)元的輸入連接到前一層的局部感受野,局部感受野與卷積核進(jìn)行卷積[17]。然后,經(jīng)過(guò)一個(gè)激活函數(shù)(通常是Sigmoid函數(shù)),提取局部特征,如式(1)所示。
其中S(x)為Sigmoid函數(shù),含義如式2所示。θ和x為卷積核中的參數(shù)值,b為偏置,i和j為卷積核的大小,k為上層特征圖的數(shù)量。使用激活函數(shù)的原因是它是一個(gè)非線性函數(shù),它的輸出對(duì)輸入是非線性的。如果沒(méi)有激活函數(shù),多個(gè)卷積層和單個(gè)卷積層之間不會(huì)有數(shù)學(xué)差異。卷積層的本質(zhì)是從一個(gè)大尺寸的特征圖中選擇一小塊作為樣本,然后通過(guò)訓(xùn)練從這個(gè)小樣本中學(xué)習(xí)到很多不同的特征。然后將這些特征作為檢測(cè)器應(yīng)用到圖像的其他部分進(jìn)行卷積,從而從特征圖不同位置的局部區(qū)域中得到許多不同特征的激活值。
層S2和S4是池化層??梢钥闯墒且粋€(gè)模糊濾波器,起到二次特征提取的作用,也可以降低特征維數(shù)。池化層將在不同位置通過(guò)卷積層的特征進(jìn)行聚合,計(jì)算特征圖某個(gè)區(qū)域內(nèi)某個(gè)特定特征的平均值。這些匯總統(tǒng)計(jì)特征不僅具有較低的維度,而且還提升了檢測(cè)效果。這種聚合的操作稱為池化,池化函數(shù)通常分為平均池化和最大池化。對(duì)于池化層,如果有N個(gè)輸入特征圖,則有N個(gè)輸出特征圖,但每個(gè)輸出特征圖都被池化函數(shù)減少。池化操作是選擇上層的輸出特征圖不與區(qū)域結(jié)合,平均池化計(jì)算區(qū)域的平均值作為輸出,最大池化選擇區(qū)域的最大值作為輸出。
本文中所提出的基于改進(jìn)的聯(lián)合濾波與CNN檢測(cè)模型的數(shù)字式儀表識(shí)別算法的工作流程分為兩個(gè)階段,一個(gè)是游標(biāo)卡尺數(shù)字顯示區(qū)域的位置,另一個(gè)是數(shù)字字符識(shí)別。在識(shí)別游標(biāo)卡尺讀數(shù)之前,需要對(duì)游標(biāo)卡尺儀器的數(shù)顯區(qū)域進(jìn)行定位,這在很大程度上影響了后續(xù)字符識(shí)別的準(zhǔn)確性。如圖2所示,我們隨機(jī)收集了多個(gè)不同場(chǎng)景下的游標(biāo)卡尺圖像。從圖2可以看出,游標(biāo)卡尺圖像存在傾斜、位置、焦距、光照差等現(xiàn)象,增加了字符識(shí)別的難度。圖2(a)的背景不同。圖2(c)的位置不同,焦距較遠(yuǎn)。
圖2 不同場(chǎng)景下的游標(biāo)卡尺圖像
由于游標(biāo)卡尺的背景環(huán)境非常復(fù)雜,需要排除儀器的背景干擾,才能獲得較高的識(shí)別精度和穩(wěn)定性。為減少數(shù)據(jù)樣本采集工作量,同時(shí)提升模型的泛化能力,本文對(duì)采用數(shù)據(jù)增強(qiáng)技術(shù)對(duì)擴(kuò)充樣本類(lèi)別,通過(guò)旋轉(zhuǎn)、位移、鏡像等操作來(lái)擴(kuò)充數(shù)據(jù)樣本量。本文采用CNN模型來(lái)提取游標(biāo)卡尺數(shù)字顯示區(qū)域的特征進(jìn)行定位。首先將游標(biāo)卡尺的數(shù)顯區(qū)域作為候選區(qū)域,隨機(jī)選取10000幅圖像樣本作為數(shù)據(jù)增強(qiáng)的樣本輸入,將數(shù)據(jù)增強(qiáng)后的游標(biāo)卡尺樣本放入CNN模型進(jìn)行訓(xùn)練,使得計(jì)算機(jī)自己學(xué)習(xí)候選區(qū)域的特征。訓(xùn)練完成后,得到一個(gè)結(jié)構(gòu)化的CNN模型。如圖3所示,黃色框?yàn)槎喾N游標(biāo)卡尺樣品的候選區(qū)域標(biāo)定圖。為驗(yàn)證模型的定位效果,隨機(jī)選取多張游標(biāo)卡尺圖像樣本進(jìn)行實(shí)踐實(shí)驗(yàn),定位正確率均在99%以上,因此,構(gòu)建的模型得到驗(yàn)證。
圖3 游標(biāo)卡尺候選區(qū)域標(biāo)記效果圖
在游標(biāo)卡尺圖像采集過(guò)程中,由于操作過(guò)程的隨機(jī)性,難免會(huì)導(dǎo)致圖像采集傾斜。定位傾斜圖像的候選區(qū)域后,圖像的數(shù)字顯示部分傾斜,字符傾斜,如圖4所示。在這種情況下,后續(xù)字符分割得到的字符噪聲會(huì)明顯增加,降低字符識(shí)別的正確率,傾斜過(guò)大的圖像甚至?xí)霈F(xiàn)無(wú)法進(jìn)行字符分割的情況。因此,有必要對(duì)傾斜的游標(biāo)卡尺圖像進(jìn)行校正[18]。對(duì)于游標(biāo)卡尺的水平傾角,主要有兩種修正方法,Hough法[19]和Radon法。與Hough法相比,Radon法計(jì)算簡(jiǎn)單,依賴性小。本文選用Radon法校正游標(biāo)卡尺圖像的傾斜,圖4(a)為逆時(shí)針操作得到的圖像,圖4(b)為順時(shí)針操作得到的圖像。
圖4 游標(biāo)卡尺傾斜校正示意圖
圖5 本文所提改進(jìn)型的中值濾波算法流程圖
通過(guò)工業(yè)相機(jī)拍攝到的高質(zhì)量圖像,是后續(xù)開(kāi)展字符得以準(zhǔn)確識(shí)別的前提,由于拍照過(guò)程會(huì)受到周邊環(huán)境、雜物、光照等影響,因此對(duì)拍攝到的數(shù)字儀表表盤(pán)信息,開(kāi)展相關(guān)的預(yù)處理工作尤為必要,一次位分割后的圖像可以看到,由于環(huán)境光源和數(shù)字式儀表表盤(pán)自身反光或光照不均勻等影響下,導(dǎo)致圖像中的數(shù)字字符顯示部分與背景液晶表盤(pán)對(duì)比度不高,且受一定的噪聲干擾,不利于后期的字符的提取,因此需要采用圖像增強(qiáng)技術(shù)來(lái)改善現(xiàn)有的數(shù)顯部分對(duì)比度。
本文設(shè)計(jì)一種聯(lián)合濾波方式,來(lái)的對(duì)分割獲得含字符的表盤(pán)信息進(jìn)行預(yù)處理,選取改進(jìn)后的自適應(yīng)中值濾波算法來(lái)對(duì)分割后的圖像進(jìn)行先期濾波操作,用來(lái)去除噪聲干擾,然后再對(duì)濾波后的圖像進(jìn)行同態(tài)濾波操作,使得一次分割圖像具備字符與液晶背景具備明顯分離條件。
通過(guò)工業(yè)高清相機(jī),獲取得圖片分辨率較高,區(qū)域分割定位后,儀表顯示區(qū)域所占總畫(huà)面較小,因此受環(huán)境噪點(diǎn)影響較大,針對(duì)定位分割后的儀表區(qū)域圖像,采取了濾波操作,現(xiàn)階段濾波分為均值濾波、中值濾波和NLM濾波,本文設(shè)計(jì)一種急速中值濾波器用于對(duì)一次定位后帶有噪聲分布的儀表圖像進(jìn)行快速濾波。根據(jù)檢測(cè)圖像中噪聲含量,來(lái)自主切換卷積核的尺寸,從而達(dá)到急速濾波的效果。本算法中卷積核的尺寸分為3×3、5×5和7×7三種大小,通過(guò)依次檢測(cè)圖像中存在的噪聲強(qiáng)度,來(lái)逐步切換不同的卷積核,以期達(dá)到混合濾波的效果。其中,噪聲強(qiáng)度檢測(cè)公式如式(3)所示:
其中,像素灰度Gray(i,j)的取值范圍為[λ,255-λ],λ為灰度偏差,當(dāng)Noise(i,j)為1時(shí),代表當(dāng)前像素顆粒為噪聲。
具體的濾波算法流程如下:
步驟一:對(duì)輸入含噪聲圖像時(shí),采用3x3卷積核進(jìn)行濾波操作,當(dāng)濾波完成后,判別當(dāng)前濾波后的圖像是否存在疑似噪聲點(diǎn),若不存在,則噪聲濾波結(jié)束;若存在,則繼續(xù)下一步;
步驟二:對(duì)步驟一完成濾波后的圖像,采用5x5卷積核進(jìn)行濾波操作,當(dāng)濾波完成后,再次判定濾波后的圖像是否存在疑似噪聲點(diǎn),若不存在,則噪聲濾波結(jié)束;若存在,則繼續(xù)下一步;
步驟三:對(duì)第二步驟完成濾波后的圖像,采用7x7卷積核進(jìn)行濾波操作,濾波完成后檢測(cè)當(dāng)前圖像是否存在疑似噪聲點(diǎn),若不存在,則完成濾波;若仍然存在疑似噪聲點(diǎn),則判定是否圖像有大面積二值背景,若存在,則停止濾波,輸出當(dāng)前像素圖像;若判定非二值背景,則繼續(xù)采用7×7卷積核進(jìn)行濾波操作,最終輸出濾波后的像素圖像。
圖6表示幾種濾波算法處理50%密度椒鹽噪聲的對(duì)比圖,這里對(duì)比了高斯濾波器、算數(shù)均值濾波器、逆諧波濾波器、自適應(yīng)中值濾波、NLM濾波。從圖中可以看出,在加入50%椒鹽噪聲密度時(shí),本文所提算法能夠較好的濾掉噪聲,且數(shù)顯部分對(duì)比度較為明顯。
圖6 濾波算法對(duì)比圖
工業(yè)部署情況環(huán)境較為復(fù)雜,針對(duì)光照不均勻情況,本文引入同態(tài)濾波器來(lái)對(duì)光照不均勻圖像,進(jìn)行進(jìn)一步濾波,同態(tài)濾波屬于圖像頻域處理方法中的一種,通過(guò)結(jié)合圖像頻率過(guò)濾和灰度變換來(lái)處理相關(guān)圖像,具備調(diào)節(jié)圖像灰度范圍,突出圖像細(xì)節(jié),增強(qiáng)對(duì)比度,去除照明不均勻的作用,可以用提高圖像對(duì)比度的增強(qiáng)方法。它將圖像f(x,y)看作是由入射分量i(x,y)和反射分量r(x,y)組合而成[20],具體如式(4)所示:
同態(tài)濾波是一種依靠圖像的照度—反射模型來(lái)改善圖像質(zhì)量的頻域方法,對(duì)式(4)兩端求對(duì)數(shù)可得:
對(duì)式(5)兩端求取傅里葉變換,可以得到:
選取頻域函數(shù)H(u,v)對(duì)F(u,v)進(jìn)行濾波處理,可以得到:
其中,H(u,v)為同態(tài)濾波的傳遞函數(shù),濾波后對(duì)式(7)做傅里葉反變換到空間域內(nèi),可得:
對(duì)式(8)兩邊同取指數(shù),可得:
輸出圖像g(x,y)為經(jīng)過(guò)同態(tài)濾波后的最終增強(qiáng)的圖像,具體的同態(tài)濾波的流程如圖7所示。
圖7 同態(tài)濾波流程圖
其中,f(x,y)表示輸入圖像,1n表示以e為底的對(duì)數(shù)變換,DFT為傅里葉變換,H(u,v)表示濾波處理,DFT-1表示傅里葉逆變換,exp表示指數(shù)變換,g(x,y)表示輸出圖像。因此,可以通過(guò)圖像照射分量和反射分量的特征來(lái)選取合適的同態(tài)濾波函數(shù)H(x,y),從而達(dá)到在減弱圖像低頻信息的同時(shí),增強(qiáng)圖像高頻信息的分量的目標(biāo)。
工業(yè)場(chǎng)景中游標(biāo)卡尺的使用,受光照影響較為普遍,為了達(dá)到圖像增強(qiáng)的效果,以期方便后期對(duì)字符的順利分割,選擇合適的同態(tài)濾波器尤為重要[21]。常用的同態(tài)濾波器有高斯型同態(tài)濾波器、Butterworth型同態(tài)濾波器、指數(shù)型同態(tài)濾波器等。由于傳統(tǒng)的同態(tài)濾波器在調(diào)參時(shí),需要花費(fèi)大量的時(shí)間,參數(shù)量較多,如式(10)所示:
其中,D(u,v)為頻率(u,v)到(u0,v0)的距離,;D0為截止頻率;n為濾波器階數(shù);rH為高頻增益系數(shù);rL為低頻增益系數(shù);c為銳化系數(shù),為了增強(qiáng)對(duì)比度,選取n為2。由于指數(shù)型的同態(tài)濾波器可調(diào)參數(shù)較多,且對(duì)于不同的圖像,需要調(diào)節(jié)的參數(shù)也不同,尤其是針對(duì)不同情況來(lái)控制高頻或低頻增益以及截止頻率,就需要依賴大量的經(jīng)驗(yàn)才能調(diào)節(jié)好相關(guān)參數(shù)。為此,本文在指數(shù)型同態(tài)濾波器上進(jìn)行改進(jìn),在保持較好的濾波效果情況下,引入高低頻增益參數(shù)γ,提出了改進(jìn)型的單參數(shù)同態(tài)濾波器,如式(11)所示:
式中:γ為可調(diào)參數(shù),相比其他各類(lèi)型同態(tài)濾波器,可調(diào)參數(shù)個(gè)數(shù)從原始的各類(lèi)型同態(tài)濾波器的≥3個(gè),減少至1個(gè),可以方便的調(diào)節(jié)相關(guān)參數(shù),可使濾波器達(dá)到最佳效果。其三維結(jié)構(gòu)與文獻(xiàn)[22]中采用的同態(tài)濾波器相對(duì)比,如圖8所示。如圖8(b)為文獻(xiàn)[22]所提同態(tài)濾波器結(jié)構(gòu)圖,在壓縮圖像動(dòng)態(tài)范圍容易出現(xiàn)過(guò)壓縮情況,而本文所提改進(jìn)的同態(tài)濾波算法由中心頻率到高頻的過(guò)渡較為平緩,斜率較小,從而導(dǎo)致濾波更為均勻,如圖8(a)所示。
圖8 改進(jìn)后同態(tài)濾波三維結(jié)構(gòu)對(duì)比
本文所提改進(jìn)型同態(tài)濾波與高斯同態(tài)濾波器、Butterworth濾波器、文獻(xiàn)[22]所提的同態(tài)濾波器和指數(shù)濾波器,對(duì)同一低光照度圖像進(jìn)行處理,處理結(jié)果進(jìn)行比較,如圖9所示。
圖9 圖像增強(qiáng)算法對(duì)比
從圖9可以看出,圖9(a)為原始定位分割出來(lái)的儀表顯示區(qū)域圖像,基于高斯同態(tài)濾波器增強(qiáng)后的字符區(qū)域,如圖9(b)所示,可以看出相較原圖可以較好的將前景與背景分離出來(lái),但是并不能夠?qū)⒆址倪吘壖?xì)節(jié)呈現(xiàn)出來(lái),如圖9(b)、圖9(e)所示,Butterworth同態(tài)濾波與文獻(xiàn)[22]所提同態(tài)濾波均不能夠?qū)ψ址捅尘斑M(jìn)行較為明顯的提取,但是指數(shù)同態(tài)濾波后的圖像可以較好的將前景和背景明顯區(qū)分出來(lái),但是前景字符細(xì)節(jié)比較模糊,出現(xiàn)聯(lián)通情況,并不能夠較好的體現(xiàn)細(xì)節(jié)。如圖9(f)所示,本文所提算法可以很好的增強(qiáng)了圖像邊緣與細(xì)節(jié),與其他算法相比較而言,對(duì)所關(guān)注圖像邊緣紋理細(xì)節(jié)得到了較好的重構(gòu)。
二值圖像只包含黑白色,灰度值只有0和1,進(jìn)一步縮小了圖像處理數(shù)據(jù)。候選圖像二值化的目的是將圖像分成兩部分:目標(biāo)和背景。目標(biāo)是我們需要的信息,即字符部分,背景是不需要的部分,包括游標(biāo)卡尺字符的背景信息。二值化過(guò)程大致分為兩個(gè)步驟,首先確定一個(gè)合理的閾值,然后將每個(gè)像素的灰度值與我們?cè)O(shè)置的值進(jìn)行比較。如果灰度值小于閾值,則將像素轉(zhuǎn)換為黑色,否則轉(zhuǎn)換為白色,如圖10(b)所示。二值化處理的重點(diǎn)是如何確定閾值,閾值過(guò)小可能會(huì)得到過(guò)多的干擾信息,給后續(xù)的字符處理帶來(lái)困難。如果閾值過(guò)大,會(huì)破壞部分目標(biāo)信息,導(dǎo)致缺少有效字符信息,無(wú)法進(jìn)行字符識(shí)別。這里我們選取灰度圖像自動(dòng)閾值分割法,通過(guò)統(tǒng)計(jì)學(xué)的方法來(lái)選取一個(gè)閾值,使得這個(gè)閾值可以將前景色和背景色盡可能的分開(kāi)[23]。這里使用的判據(jù)為最大類(lèi)間方差判據(jù),如式(12)所示。
其中:M為灰度平均值;MA為前景色平均值;MB為背景色平均值;前景色像素?cái)?shù)占總像素?cái)?shù)的比例記作PA;背景色像素?cái)?shù)占總像素?cái)?shù)的比例記做PB,最終目標(biāo)是確定最佳閾值,以確保ICV最大。
此外,圖像樣本還需要進(jìn)行邊緣檢測(cè)處理,如圖10(c)所示。邊緣通常是指像素與周?chē)袼刂g明顯的階躍變換,邊緣包含豐富的信息,如方向、階躍屬性和形狀。該方法的目的是檢測(cè)圖像中亮度變化明顯的突出,這些點(diǎn)反映了圖像的局部特征。圖像數(shù)據(jù)中還存在不必要或冗余的干擾信息,會(huì)嚴(yán)重影響圖像質(zhì)量,因此必須進(jìn)行腐蝕噪聲處理,如圖10(d)所示。其基本原理是用一定區(qū)域內(nèi)點(diǎn)的平均值代替圖像中某個(gè)點(diǎn)的值。主要作用是使周?chē)袼鼗叶戎挡町愝^大的像素點(diǎn)變得接近周?chē)袼攸c(diǎn),從而消除孤立的噪聲點(diǎn)。如圖10(e)所示,閉合操作可以連接圖像的近區(qū)域,放大不連續(xù)的噪聲,結(jié)構(gòu)元素不同,放大程度也不同。封閉操作使圖像的像素點(diǎn)粘附在一起,可以填充圖像的封閉區(qū)域,彌補(bǔ)微小裂縫。為了更徹底地消除圖像中的噪聲,我們進(jìn)行了二次腐蝕噪聲處理,如圖10(f)所示。經(jīng)過(guò)一系列的圖像后處理,我們得到了一個(gè)非常清晰的游標(biāo)卡尺字符,為我們進(jìn)一步的圖像字符定位提供了依據(jù)。
本文的字符識(shí)別過(guò)程采用基于多淺層網(wǎng)絡(luò)算法對(duì)單個(gè)字符進(jìn)行識(shí)別,通過(guò)引入循環(huán)檢測(cè)方式,快速檢測(cè)出相關(guān)字符,與顯示區(qū)域定位的訓(xùn)練方式類(lèi)似,在開(kāi)展的圖像字符數(shù)據(jù)識(shí)別之前,必須增加訓(xùn)練階段。在該算法中,應(yīng)在訓(xùn)練過(guò)程中選擇合適的單個(gè)字符訓(xùn)練樣本。樣本輸入網(wǎng)絡(luò)后,計(jì)算各層神經(jīng)元的輸出和理想輸出,然后進(jìn)行反饋,網(wǎng)絡(luò)模型根據(jù)差異調(diào)整修改網(wǎng)絡(luò)的權(quán)重和閾值,重新計(jì)算輸出與理想輸出的差異。以此類(lèi)推,經(jīng)過(guò)大量學(xué)習(xí),不斷修改權(quán)重和閾值,直到確定網(wǎng)絡(luò)權(quán)重和閾值,最終形成分類(lèi)器。
本文所提數(shù)字式儀表識(shí)別方案的總體算法結(jié)構(gòu)圖如圖11所示。
圖11 總體算法結(jié)構(gòu)圖
實(shí)驗(yàn)以MATLAB2017b為仿真平臺(tái),開(kāi)發(fā)相關(guān)識(shí)別模型和人機(jī)交互界面,實(shí)驗(yàn)所使用計(jì)算機(jī)操作系統(tǒng)為Windows7,英特爾酷睿I7處理器,NVIDA GeForce GTX 1050Ti顯卡,8G內(nèi)存,攝像頭選取手動(dòng)可調(diào)變焦距CMOS工業(yè)攝像頭,最大分變率為2448×3264。
為了證明本文所提的算法的多場(chǎng)景下的具備較強(qiáng)的泛化能力,和魯棒性,對(duì)比傳統(tǒng)識(shí)別算法,本文開(kāi)展了一系列實(shí)驗(yàn)與分析。
本文中將攝像頭的拍攝區(qū)域劃分為四個(gè)象限,如圖12所示,在正常光照條件下,分別對(duì)所處四個(gè)象限空間的游標(biāo)卡尺進(jìn)行識(shí)別,共采集1800組數(shù)字式游標(biāo)卡尺圖像,分別用于模板匹配法[24]、穿線法[25]和本文所采用的方法進(jìn)行了評(píng)估比較。將參與評(píng)估算法的預(yù)處理、訓(xùn)練時(shí)間、推理與識(shí)別時(shí)間和識(shí)別正確率作為統(tǒng)計(jì)指標(biāo)進(jìn)行評(píng)判,本文所提算法與傳統(tǒng)算法的實(shí)驗(yàn)結(jié)果如表1所示。
表1 識(shí)別效果統(tǒng)計(jì)與分析
圖12 工業(yè)相機(jī)拍攝區(qū)域坐標(biāo)
雖然,從表1看出模板匹配法和穿線法在平均推理+識(shí)別時(shí)間,均少于本文算法,然而從識(shí)別正確率來(lái)看,文本所提算法遠(yuǎn)遠(yuǎn)優(yōu)于這兩類(lèi)算法。在工業(yè)部署場(chǎng)景中,儀表檢測(cè)的正確率往往作為一個(gè)重要指標(biāo)來(lái)衡量算法適配場(chǎng)景部署的適應(yīng)度。
為了進(jìn)一步說(shuō)明所提算法具備較強(qiáng)的泛化性能,又將游標(biāo)卡尺所處環(huán)境設(shè)計(jì)為高光照度、低光照度和正常光照度,共計(jì)采集圖片測(cè)試集樣本2000張,如圖13所示。應(yīng)用MATLAB GUI開(kāi)發(fā)相關(guān)人機(jī)交互軟件,軟件平臺(tái)的操作界面如圖14所示,能夠直觀的顯示讀數(shù)結(jié)果,大大提高了實(shí)驗(yàn)效率。通過(guò)本文算法對(duì)游標(biāo)卡尺進(jìn)行識(shí)別,在四個(gè)象限內(nèi)分別進(jìn)行展開(kāi)三類(lèi)光照度的實(shí)驗(yàn),具體結(jié)果如圖15所示,對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析如表2所示。
表2 多場(chǎng)景測(cè)試實(shí)驗(yàn)結(jié)果分析
圖13 多場(chǎng)景測(cè)試樣本選取示例
圖14 智能識(shí)別系統(tǒng)人機(jī)交互界面
圖15 光照樣本識(shí)別正確率統(tǒng)計(jì)
如圖14所示,我們整合了游標(biāo)卡尺圖像候選區(qū)域的定位、后處理、二次定位和識(shí)別,并建立了人機(jī)交互界面。通過(guò)對(duì)6000張游標(biāo)卡尺圖像的測(cè)試,經(jīng)統(tǒng)計(jì)第三象限在強(qiáng)光照條件下識(shí)別率相對(duì)較低,這是由于本實(shí)驗(yàn)所采取的光源為固定照射光源,更加模擬真實(shí)工業(yè)場(chǎng)景內(nèi)現(xiàn)場(chǎng)部署時(shí)的光照條件,攝像頭固定位置不變,因此會(huì)導(dǎo)致在第三象限內(nèi)出現(xiàn)大量的反光照射情況,且對(duì)游標(biāo)卡尺的字符影響較大,甚至出現(xiàn)反光字符遮蓋情況,導(dǎo)致了字符缺失,從而使得識(shí)別率較低,但從整體實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)來(lái)看,平均識(shí)別準(zhǔn)確率在95.02%以上。
由于數(shù)字式儀表字符的識(shí)別率受到光照對(duì)被檢測(cè)儀表的影響而持續(xù)降低,圖像增算法能夠有效的提升圖像質(zhì)量,更有利于機(jī)器識(shí)別。本文針對(duì)數(shù)字式游標(biāo)卡尺所處的環(huán)境光照不均勻,所采集的圖像清晰度、對(duì)比度不高的問(wèn)題,研究了基于改進(jìn)的聯(lián)合濾波與CNN檢測(cè)模型的數(shù)字式儀表識(shí)別算法,引入CNN模型對(duì)儀表表盤(pán)進(jìn)行定位和分割,然后設(shè)計(jì)了改進(jìn)的聯(lián)合濾波算法對(duì)分割后的圖像進(jìn)行進(jìn)一步濾波操作,得到對(duì)比度較高的灰度圖,進(jìn)而引入淺層神經(jīng)網(wǎng)絡(luò)對(duì)字符進(jìn)行識(shí)別與組合。最后,本文對(duì)算法進(jìn)行了對(duì)比仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,本文提出的算法能夠有效的削弱光照不均勻干擾的影響,同時(shí)可增強(qiáng)圖像細(xì)節(jié)及清晰度,在多場(chǎng)景下平均識(shí)別率已經(jīng)能達(dá)到95%以上。雖然本文針對(duì)多場(chǎng)景的已經(jīng)達(dá)到了較高的識(shí)別率,但工業(yè)場(chǎng)景的部署應(yīng)在邊緣計(jì)算終端進(jìn)行,尤其是針對(duì)老舊設(shè)備的智能化改造,因此在接下來(lái)的研究中,在保障較高識(shí)別率的前提下,將提升本文算法在邊緣計(jì)算終端部署的能力。