亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Tesseract_OCR的化工包裝袋噴碼質(zhì)量檢測算法

        2022-07-13 02:50:24張茂林葉輕舟
        電子科技 2022年7期
        關(guān)鍵詞:噴碼字符識別包裝袋

        張茂林,葉輕舟,潘 鑫,陸 華

        (1.福建工程學(xué)院 電子電氣與物理學(xué)院,福建 福州350118;2.福建工程學(xué)院 計算機科學(xué)與數(shù)學(xué)學(xué)院,福建 福州350118;3.福州三龍噴碼科技有限公司,福建 福州 350014)

        化工包裝袋上噴印的生產(chǎn)日期、批號等信息是產(chǎn)品不可或缺的一部分,對產(chǎn)品質(zhì)量管控起著重要作用,但化工包裝生產(chǎn)線常由于各種原因造成噴印信息模糊、發(fā)散或缺失。目前大部分生產(chǎn)線采用人工目視進行檢查,但隨著產(chǎn)能擴大,傳統(tǒng)的人工方法已經(jīng)無法滿足日常生產(chǎn)需求,迫切需要建立一種化工包裝袋噴印質(zhì)量自動檢測系統(tǒng)。

        隨著機器視覺技術(shù)研究的不斷深入,機器視覺檢測技術(shù)已在自動化檢測中扮演了重要角色。文獻[1]通過使用高效光譜圖匹配算法,實現(xiàn)了對字符的分割與識別。文獻[2]提出了基于語義分割網(wǎng)絡(luò)的OCR(Optical Character Recognition)文字識別方法。文獻[3]利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)體系結(jié)構(gòu),實現(xiàn)對單個單詞的識別。文獻[4]采用Halcon軟件開展日化瓶瓶底噴碼質(zhì)量檢測算法研究。文獻[5]基于Tesseract_OCR引擎開展紙箱讀碼、OCR字符視覺檢測研究?;跈C器視覺的化工包裝袋噴碼質(zhì)量檢測算法主要包含圖像預(yù)處理、圖像定位、字符分割、字符識別和字符比對5個部分,其算法流程如圖1所示。

        圖1 算法流程圖

        1 圖像預(yù)處理

        圖像質(zhì)量直接影響檢測算法設(shè)計和測量精度,因此在圖像分析前,需進行圖像預(yù)處理來增強圖像中的有用信息,為特征提取、分割等處理做準(zhǔn)備。其中,圖像濾波是圖像預(yù)處理中的重要環(huán)節(jié)。常見圖像濾波算法有均值濾波、中值濾波、高斯濾波和雙邊濾波等。

        均值濾波是將整個窗口范圍內(nèi)的像素值取平均值,雖然不能較好地保護圖像細(xì)節(jié),但對高斯噪聲表現(xiàn)較好。中值濾波是用非線性的方法,將窗口范圍內(nèi)的像素值進行排序并取用中心點像素值,能夠保護圖像尖銳的邊緣,對椒鹽噪聲表現(xiàn)較好。高斯濾波通過二維離散高斯函數(shù)采樣并歸一化取得加權(quán)系數(shù)后,對圖像進行加權(quán)平均,是一種線性平滑濾波,適用于消除高斯噪聲。雙邊濾波是將該點鄰域像素值的幾何空間距離及像素差值的加權(quán)平均值替換每個像素值,能夠較好地保存邊緣和降噪平滑[6-7]。根據(jù)生成采集圖像的特點,本文先采用中值濾波濾除一部分噪聲后,再采用高斯雙邊濾波進行處理,以便在衰減噪聲的同時有效地保持圖像邊緣信息。

        2 基于局部統(tǒng)計的可變閾值字符區(qū)域定位

        字符區(qū)域定位指從采集圖像中提取目標(biāo)對象區(qū)域。常見的字符區(qū)域提取方法可分為基于字符梯度、字符紋理和灰度直方圖3種方法[8-9]。由于工廠環(huán)境中的光照往往存在較大波動,且不同噴碼信息之間存在一定的差異,常用的邊緣檢測方法和基于全局均值的可變閾值法魯棒性差,易引入其它噪聲。因此,本文引入亮暗補償函數(shù),并在亮暗補償函數(shù)后再進行局部統(tǒng)計灰度模式,算法表示為

        (1)

        式中

        t′xy=m′xy-nxy

        (2)

        其中,m′xy表示以坐標(biāo)點(x,y)為中心局部領(lǐng)域Sxy內(nèi)所有像素點灰度值的高斯加權(quán)平均和;nxy=amxy,為點(x,y)局部領(lǐng)域的亮暗補償函數(shù);a為亮暗補償系數(shù);mxy為領(lǐng)域Sxy內(nèi)像素點灰度值均值。亮度高的區(qū)域a加大,亮度低的區(qū)域a減小,以此來減少閾值像素點灰度值f(x,y)與計算閾值t′xy之間的差值,從而減少圖像分割后的噪聲點。字符區(qū)域定位結(jié)果如圖2所示。

        圖2 基于局部統(tǒng)計的可變閾值字符區(qū)域定位

        3 基于改進連通域的字符分割

        字符分割是從包含多個字符的字符區(qū)域中分割只包含單個字符的子集圖像。常用的字符分割算法有投影法、連通域法和聚類分析法等[10-11]。投影法利用灰度投影直方圖的波峰和波谷特性來分割字符,根據(jù)投影方向的不同可分為垂直投影和水平投影。該算法對于圖像質(zhì)量要求較高,目標(biāo)區(qū)域外的噪點、字符變形等因素均會影響分割效果[12]。連通域法將是將圖像中具有相同像素值且像素點位置關(guān)系符合某種規(guī)則的區(qū)域進行字符分割,不適用于由離散點構(gòu)成的大字符噴碼[13-14]。實際應(yīng)用中,噴碼字符點與點的距離有可能大于字符之間的間隙大小,導(dǎo)致圖像閉運算后多個字符黏連無法被正確分割。如圖3所示為連通域法字符分割結(jié)果,圖中第二個字符P被錯誤分割,且由于字符D8和00字符存在黏連,導(dǎo)致無法對其進行正確分割。

        圖3 連通域法字符分割

        本文提出了一種改進連通域的動態(tài)字符分割算法,可實現(xiàn)字符分割。其動態(tài)分割偽代碼可表示為:

        Input:待處理圖像(src)。

        Output:文件夾下的單個字符圖像。

        {

        for(intj=0;j

        for(inti=0;i

        {統(tǒng)計每一列的黑像素點個數(shù)}

        if(相鄰區(qū)域黑色像素點不連續(xù)0){

        else{標(biāo)記最左和最右列為疑似分割位置}}

        計算每個疑似分割位置間隙,求取間隙眾數(shù)和字符寬眾數(shù)。

        for(inti=0;i<字符個數(shù);i++){

        if(字符寬和字符寬眾數(shù)相差較小)

        {分割位置正確,切割字符}

        else{

        if(字符寬約為字符寬眾數(shù)的倍數(shù)且相鄰間隙與眾數(shù)相近)

        {按眾數(shù)計算倍數(shù)位置,搜索前后1/4,1/2眾數(shù)區(qū)域,求最少黑色像素點位置并進行分割}

        if(字符寬小于字符寬眾數(shù)且相鄰間隙較小)

        {將當(dāng)前字符與下個字符合并進行分割}

        }}

        }

        改進連通域字符分割算法對字符定位區(qū)域重新進行字符分割的結(jié)果如圖4所示。算法能夠有效處理誤分割字符及字符因黏連造成的漏分割,并可根據(jù)每個分割字符的最小包圍矩形裁剪單個字符圖像。

        圖4 改進連通域法字符分割

        4 基于Tesseract_OCR引擎的字符識別與訓(xùn)練

        Tesseract是一款由HP實驗室研發(fā)并由Google優(yōu)化、維護的 OCR 引擎,可將各種格式的圖像轉(zhuǎn)化成超過60種語言(包括中文)的文本,并且支持用戶不斷訓(xùn)練字庫,以提高字符識別準(zhǔn)確率,是目前應(yīng)用較為廣泛的OCR引擎之一[15-17]。

        Tesseract-OCR引擎自帶的字庫對特定的字符識別率不高,因此需對圖像字符分割后的單個噴碼字符進行訓(xùn)練,生成訓(xùn)練數(shù)據(jù),從而提高單個字符識別準(zhǔn)確率,其具體步驟如下:

        步驟1選取tif格式的圖片作為樣本。將前期圖像分割后的同一個字符或數(shù)字的單個字符圖片合并成一張tif圖片。為提升訓(xùn)練效果,確保選取樣本圖像是每個字符或數(shù)字,并保證至少有50個樣本;

        步驟2生成并調(diào)整BOX文件。通過Tesseract的makebox命令定位并識別字符,生成BOX文件。再通過jTessBoxEditor工具矯正識別出來的字符,并調(diào)整Box文件;

        步驟3生成、合并訓(xùn)練文件。根據(jù)BOX文件和tif圖片進行特征提取和字庫訓(xùn)練,進而生成字符集文件,再通過聚類字符特征及合并訓(xùn)練文件來生成traineddataz格式的訓(xùn)練文件。

        以圖5和圖6的實驗為例,Tesseract-OCR引擎原始數(shù)據(jù)集將輸入圖像識別為“Ppit-TO35(L5E89)20201010D8007-806953”,其中4個字符識別錯誤,正確率為88.57%。使用訓(xùn)練數(shù)據(jù)集進行識別時,識別結(jié)果為“PPH-T035(L5E89)20201010D8007-B06953”,所有字符均識別正確。由實驗可知,訓(xùn)練數(shù)據(jù)集的識別效果優(yōu)于引擎原始的數(shù)據(jù)集。

        圖5 原始數(shù)據(jù)集字符識別結(jié)果

        圖6 訓(xùn)練數(shù)據(jù)集識別結(jié)果

        5 實驗結(jié)果與分析

        本文實驗選用CPU主頻2.0 GHz,內(nèi)存8 GB的PC機,以??低?HIKVISION)型號為MV-CE100-30GC的彩色 CMOS 千兆以太網(wǎng)工業(yè)相機和焦距為8~50 mm,光圈范圍為F1.4-C的中聯(lián)科創(chuàng)VM08050MP3鏡頭作為實驗平臺。本文實驗對象選用經(jīng)噴碼機噴印信息的包裝袋側(cè)面,需檢測的區(qū)域為800 mm×150 mm??紤]到檢測范圍較大、檢測目標(biāo)表面凹凸不平、包裝側(cè)面為圓弧形等特點,故選用兩個140 mm×20 mm的條形白色光源組合,照明方式為前景光直接照明。

        為驗證算法的有效性,在聚丙乙烯生產(chǎn)車間,搭建化工包裝袋噴印信息的質(zhì)量檢測測試平臺。將噴碼機的一組派碼信息與圖像識別字符進行逐一比對,若派碼信息與識別字符完全一致,則判定噴碼質(zhì)量合格;若一個字符不一致,則判定噴碼質(zhì)量不合格,并以正確判定噴碼質(zhì)量是否合格的樣本占總樣本的比例作為評價指標(biāo)。在生產(chǎn)線中使用該實驗平臺對1 000包聚丙乙烯包裝袋的噴碼質(zhì)量進行檢測。本文提出的檢測算法與目測校驗結(jié)果的對比如表1所示。

        表1 結(jié)果對比

        由表1可以看出,本文提出的檢測算法對噴碼質(zhì)量合格的44件產(chǎn)品進行了錯誤判斷,故噴碼質(zhì)量檢測算法的精確度為 95.6%。被錯誤判斷的44件產(chǎn)品中包裝袋的噴碼部分大部分存在比較明顯的皺褶,字符畸變較為嚴(yán)重,因此導(dǎo)致字符識別率降低。

        6 結(jié)束語

        本文運用均值濾波與高斯雙邊濾波算法對采集圖像進行預(yù)處理,并通過局部統(tǒng)計的可變閾值算法獲取字符區(qū)域。針對噴碼字符點與點的距離有可能大于字符之間的間隙大小,導(dǎo)致二值圖像閉運算后多個字符黏連形成連通域的現(xiàn)象,本文提出了一種改進連通域的動態(tài)字符分割算法。最后,將分割的字符圖像通過Tesseract_OCR引擎進行分類訓(xùn)練和識別。實驗結(jié)果表明,該算法對噴碼質(zhì)量檢測的實時性和準(zhǔn)確性較高,能夠滿足化工包裝袋噴碼質(zhì)量檢測的要求。本研究的不足之處在于數(shù)據(jù)訓(xùn)練的數(shù)據(jù)不夠,泛化能力不夠。此外,由于化工包裝袋存在褶皺,字符畸變較為嚴(yán)重,會降低本文提出的算法的精確度。因此,在之后的實驗中將進一步擴大訓(xùn)練數(shù)據(jù),并考慮加入卷積神經(jīng)網(wǎng)絡(luò)來提高算法的精確度。

        猜你喜歡
        噴碼字符識別包裝袋
        一種噴碼位置偏移的檢測方法及裝置設(shè)計
        包裝袋
        DOD 噴碼技術(shù)在激光切割行業(yè)的應(yīng)用
        基于安川工業(yè)機器人的鋼卷自動噴碼系統(tǒng)開發(fā)
        重型機械(2020年3期)2020-08-24 08:31:36
        由包裝袋變身的花盆
        全新70 微米噴嘴為制造商提供更多優(yōu)勢
        一種改進深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的英文字符識別
        儀表字符識別中的圖像處理算法研究
        賣萌的包裝袋
        基于CUDA和深度置信網(wǎng)絡(luò)的手寫字符識別
        国产成人福利在线视频不卡 | 无码AV高潮喷水无码专区线| 色综合999| 有码视频一区二区三区| 日本熟妇人妻xxxx| 成人a级视频在线观看| 亚洲av无码码潮喷在线观看| 久久精品国产自在天天线| 色avav色av爱avav亚洲色拍| 亚洲熟妇少妇69| 国产V日韩V亚洲欧美久久| 男女男生精精品视频网站| 99精品国产一区二区三区| 亚洲中字慕日产2020| 婷婷成人亚洲| 久久精品国产亚洲一级二级| 中文字幕人妻av四季| 少妇高潮惨叫久久久久电影69| 少女高清影视在线观看动漫| 亚洲欧美偷拍视频| 东风日产系列全部车型| 人妻熟女翘屁股中文字幕| 亚洲色欲色欲www在线观看| 日本亚洲欧美高清专区| 成人一区二区三区蜜桃| 狠狠cao日日橹夜夜十橹| 大陆极品少妇内射aaaaa| 精品免费一区二区三区在| 蜜桃久久综合一区二区| 国产精品女老熟女一区二区久久夜| 国产精品你懂的在线播放| 午夜a福利| 开心五月激情五月天天五月五月天 | 日本一区二区三区视频免费在线| 亚洲日韩一区精品射精| 国产精品无码Av在线播放小说| 麻豆av在线免费观看精品| 少妇高潮惨叫久久久久电影69| 欧美成人一区二区三区在线观看| 色琪琪一区二区三区亚洲区| av色综合网站|