亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Mask-RCNN的紙質(zhì)醫(yī)藥包裝鋼印字符識(shí)別

        2022-03-10 00:46:08周慶華曾小為
        關(guān)鍵詞:字符識(shí)別字符紙質(zhì)

        吳 彪,周慶華,曾小為

        (1.長(zhǎng)沙理工大學(xué)物理與電子科學(xué)學(xué)院,湖南 長(zhǎng)沙 410114; 2.納威爾智能科技有限公司,湖南 長(zhǎng)沙 410007)

        0 引 言

        鋼印字符是各類食品、藥品包裝以及工業(yè)機(jī)器外殼上面常有的出廠字符,作為一種動(dòng)態(tài)字符,它包括的信息主要有產(chǎn)品編號(hào)、出產(chǎn)日期和使用期限等[1]。相比較其他類型的字符,這種類型的字符壓印方便快捷,不會(huì)受外界污漬所影響,也不會(huì)隨著儲(chǔ)存時(shí)間的增加而脫落,是市面上各大生產(chǎn)線普遍使用的標(biāo)記方法。近年來(lái),由于GMP[2](Good Manufacture Practice of Medical Products, 藥品生產(chǎn)質(zhì)量管理規(guī)范)規(guī)定的嚴(yán)格實(shí)施,現(xiàn)代化醫(yī)藥產(chǎn)品包裝上鋼印字符的出廠質(zhì)量檢測(cè)與記錄成為了一大難題,它的獨(dú)特性使其在傳統(tǒng)光學(xué)字符識(shí)別(Optical Character Recognition, OCR)[3-4]系統(tǒng)中無(wú)法成為一種通用的識(shí)別字符。

        在最初的國(guó)內(nèi)外生產(chǎn)線上,檢測(cè)鋼印字符的過(guò)程通常是通過(guò)人工實(shí)現(xiàn)的。這種檢測(cè)方法不僅速度慢、精度差,而且需要花費(fèi)較大的成本,故在大規(guī)?,F(xiàn)代化自動(dòng)生產(chǎn)要求的普及下,人們找到了一種更加具有優(yōu)勢(shì)的識(shí)別系統(tǒng)——機(jī)器視覺(jué)檢測(cè)方法。機(jī)器視覺(jué)檢測(cè)方法[5]是目前最常用的一種自動(dòng)化檢測(cè)方法,它在解放大量勞動(dòng)力的同時(shí)還具有極高的精準(zhǔn)度和速度,被廣泛使用于工業(yè)生產(chǎn)檢測(cè)和識(shí)別中。

        常見(jiàn)的一些利用壓印模具而生成的凹凸字符如盲文字符、金屬柱面字符、金屬標(biāo)牌字符等的生產(chǎn)線中,機(jī)器視覺(jué)代替人工檢測(cè)的方法早已經(jīng)被證明是有效的[6],并且利用傳統(tǒng)的OCR就可以取得令人滿意的效果。然而對(duì)于一些紙質(zhì)醫(yī)藥包裝鋼印字符,由于其樣本成像后字符邊緣灰度跳變不明顯的特性,不能像以上壓印字符那樣被簡(jiǎn)單完整地識(shí)別出來(lái),故現(xiàn)在市面上存在的有關(guān)鋼印字符的質(zhì)量檢測(cè)設(shè)備只能通過(guò)模板匹配的方法做到字符的有無(wú)或缺失檢測(cè)。在一些文獻(xiàn)中,這種現(xiàn)象被稱為灰度噪聲[7],有時(shí)候也指樣品上的臟污或材料的上漆部分而產(chǎn)生的陰影。為了解決這種問(wèn)題,Horiuchi等[7]通過(guò)將測(cè)距儀系統(tǒng)用作觀測(cè)系統(tǒng)來(lái)識(shí)別壓印字符,這種類似3D建模的方法提升了一定的抗噪能力;李建美等[6]提出了使用水平投影結(jié)合連通域分析的方法對(duì)字符進(jìn)行分割,這種方法在一些灰度分布不均勻圖像中具有一定的適用性;張傳果等[1]使用一種先篩選鋼印字符區(qū)域再利用形態(tài)學(xué)優(yōu)化的方法成功實(shí)現(xiàn)了柱面壓印字符的識(shí)別。以上提到的方法雖解決了一些關(guān)于鋼印字符識(shí)別的問(wèn)題,但對(duì)于紙質(zhì)包裝鋼印字符這種特殊型的鋼印凹字符,它的字符與背景同色,圖像質(zhì)量較低,幾乎不能適用。

        因此,對(duì)于上述鋼印字符,本文搭建了在線檢測(cè)實(shí)驗(yàn)平臺(tái),設(shè)計(jì)一種基于深度學(xué)習(xí)的紙質(zhì)包裝鋼印字符識(shí)別系統(tǒng)。系統(tǒng)能對(duì)紙質(zhì)包裝的鋼印字符ROI(Region of Interest)圖像進(jìn)行精確的實(shí)例分割,在分割的同時(shí)一并輸出分割字符的標(biāo)簽屬性和數(shù)量,是一種全新的字符質(zhì)量檢測(cè)方法。

        1 系統(tǒng)結(jié)構(gòu)及原理

        如圖1所示,設(shè)計(jì)的紙質(zhì)包裝鋼印字符識(shí)別系統(tǒng)主要包含3個(gè)部分:光源照明、相機(jī)取圖和字符分割與識(shí)別。

        圖1 系統(tǒng)總體設(shè)計(jì)

        1.1 光源照明系統(tǒng)

        對(duì)于系統(tǒng)的光源,選擇了自上而下的低角度單傾斜入射LED條形光源[8](前光照明),光源的位置與紙質(zhì)包裝外殼運(yùn)動(dòng)的方向平行。在不同的環(huán)境下,通過(guò)調(diào)整入射角度θ使成像圖像的紋理從人眼視覺(jué)上達(dá)到最清晰。不同于單直入射光源與多環(huán)形入射光源的是,單傾斜入射光源不但能有效捕捉鋼印字符在壓印后產(chǎn)生的凹凸信息,還能極大突出靠近LED光源一邊的字符邊緣,對(duì)于數(shù)字0~9不同字符,能產(chǎn)生很明顯的視覺(jué)差異,更利于圖像的訓(xùn)練和識(shí)別。

        1.2 工業(yè)相機(jī)和鏡頭的選擇

        由于產(chǎn)品包裝的規(guī)模較小,鋼印字符也屬于細(xì)小的特征,并且不同于需要連續(xù)監(jiān)測(cè)的缺陷檢測(cè)項(xiàng)目,在項(xiàng)目中只需要單獨(dú)地通過(guò)觸發(fā)信號(hào)取圖,對(duì)幀率要求不高,所以選取了CMOS面陣相機(jī)。其具體型號(hào)為德國(guó)巴斯勒(Basler)acA1300-60gm黑白相機(jī),并以130萬(wàn)像素的分辨率獲取每秒60幀的1280×1024大小圖像,像素位深為12 bits。為保證取圖速率,使用了GigE Vision接口進(jìn)行圖像傳輸。

        分析其成像場(chǎng)景和原理,可知其工作距離u、焦距f、傳感器靶面尺寸Sensorsize的長(zhǎng)h或?qū)抳和視場(chǎng)范圍FOV的長(zhǎng)H或?qū)扸具有以下關(guān)系:

        (1)

        所選用相機(jī)的相關(guān)參數(shù)為:靶面芯片尺寸為7.2 mm×5.4 mm,視場(chǎng)大小為100 mm×80 mm,工作距離為150 mm,由此計(jì)算可知:

        (2)

        即所選取的鏡頭焦距應(yīng)至少滿足10.5 mm,由此選用了12 mm焦距的日本康標(biāo)達(dá)(Computar)鏡頭。

        2 紙質(zhì)鋼印字符識(shí)別算法

        本章主要介紹紙質(zhì)鋼印字符識(shí)別系統(tǒng)的結(jié)構(gòu)原理及實(shí)現(xiàn)。

        2.1 基于深度學(xué)習(xí)的字符識(shí)別

        對(duì)本項(xiàng)目中的紙質(zhì)鋼印進(jìn)行打光、取圖和分析后,發(fā)現(xiàn)傳統(tǒng)的字符識(shí)別方法是不適用的。圖2(a)中的樣本為一張鋼印質(zhì)量良好的圖片,通過(guò)人眼可以很輕松地將圖中的字符識(shí)別出來(lái),但是在經(jīng)過(guò)平滑濾波、圖像銳化、二值化等一系列形態(tài)學(xué)操作步驟后,卻無(wú)法較好地單獨(dú)將字符分割出來(lái)。在圖2(b)中,只有紙質(zhì)包裝盒左側(cè)的激光打碼字符的輪廓被完整描繪了出來(lái);圖2(c)中的Sobel算子圖像描繪出了部分字符的輪廓,但一些字符例如“2”“9”等則出現(xiàn)了較大的“斷層”;圖2(d)中的Otsu二值化圖像則幾乎不具有鋼印字符的分割效果。

        圖2 幾種傳統(tǒng)的分割方法

        由此發(fā)現(xiàn),這是因?yàn)樽址吘壍幕叶燃?jí)突變較小,其灰度直方圖并不具有明顯的雙峰或者多峰特性;并且醫(yī)藥包裝盒表面上中下3行的字符區(qū)域往往具有不同的灰度級(jí)別,再相比起字符旁邊的包裝外殼區(qū)域,灰度變化過(guò)小,常規(guī)的算子無(wú)法在精確單獨(dú)分離每個(gè)字符的同時(shí)還把每個(gè)紙質(zhì)包裝盒上的噪聲去除。原則上說(shuō),由于醫(yī)藥行業(yè)的特殊性,醫(yī)藥紙質(zhì)包裝相比其他行業(yè)的包裝更加干凈與光滑,但因?yàn)殇撚∽址a(chǎn)生的凹凸性讓光源的選擇傾向于出現(xiàn)灰度不均勻的斜入射光源,加之紙質(zhì)材料讓鋼印字符“無(wú)色差”的特性愈加突出,這些都是導(dǎo)致這種現(xiàn)象的根本原因。

        深度學(xué)習(xí)應(yīng)用于字符識(shí)別的典型例子當(dāng)屬LeNet-5和AlexNet[9-10]等CNN(Convolutional Neural Network)網(wǎng)絡(luò)的開(kāi)發(fā)。它自帶的卷積層和池化層能分別起到提取特征和數(shù)據(jù)降維的作用,RCNN[11]就是基于其發(fā)展而來(lái)的目標(biāo)檢測(cè)網(wǎng)絡(luò)。2018年,He等[12]提出了實(shí)例分割算法(Instance Segmentation)Mask-RCNN。同為目標(biāo)分割(Target Segmentation)中的小類,實(shí)例分割是一種區(qū)別于語(yǔ)義分割(Semantic Segmentation)的全新分割方式,是一個(gè)極具研究空間的熱門方向。它在語(yǔ)義分割的基礎(chǔ)上對(duì)每一類物體進(jìn)行更加精確和高質(zhì)量的分割,可以為分割的像素添加不同的標(biāo)簽。其常見(jiàn)的應(yīng)用有車輛識(shí)別、行人檢測(cè)、姿態(tài)識(shí)別以及場(chǎng)景識(shí)別等。

        本文采用的Mask-RCNN網(wǎng)絡(luò)的設(shè)計(jì)流程如下:

        1)圖片輸入,進(jìn)行網(wǎng)絡(luò)自帶的歸一化操作;

        2)加載預(yù)訓(xùn)練權(quán)值,將圖片輸入到采用合適層數(shù)的ResNet網(wǎng)絡(luò)中,以獲得對(duì)應(yīng)的feature map;

        3)對(duì)feature map中的每一點(diǎn)設(shè)置一定數(shù)量的ROI,由此可以獲取多個(gè)候選ROI;

        4)把步驟3中所有的候選ROI點(diǎn)輸入RPN網(wǎng)絡(luò)進(jìn)行二值分類(Foreground or Background)和BB回歸(Bounding-box Regression),并篩除一部分的候選ROI;

        5)對(duì)步驟4中篩選過(guò)后的ROI進(jìn)行ROI Align操作;

        6)對(duì)執(zhí)行步驟5操作過(guò)后余下的ROI進(jìn)行N類別分類、BB回歸并且生成Mask。

        對(duì)于訓(xùn)練中的每個(gè)ROI,Mask-RCNN的Loss函數(shù)如式(3)所示:

        L=Lmask+Lbox+Lcls

        (3)

        等式右邊的3個(gè)損失分別為分割損失(average binary cross-entropy loss)、回歸損失(bounding-box loss)和分類損失(classification loss)。

        當(dāng)網(wǎng)絡(luò)中的每一個(gè)特征圖單獨(dú)輸入mask分支并進(jìn)行一系列的轉(zhuǎn)置卷積、卷積的操作后,會(huì)輸出大小為12×m×m的特征圖,其中,12的意義表示為12種分割類別數(shù),也就是輸出的維度,這種方法可以有效地避免字符的類間競(jìng)爭(zhēng)現(xiàn)象,而m×m則表示特征圖feature map的尺寸,Lmask也被稱作平均二值交叉熵?fù)p失函數(shù),它會(huì)對(duì)分割圖片中的每一個(gè)目標(biāo)像素進(jìn)行回歸分類[13]。其中對(duì)每一個(gè)維度進(jìn)行二分類時(shí),所使用的函數(shù)為sigmoid激活函數(shù),由此可以判斷此類別是否分類正確。

        相比于Girshick等提出的Faster-RCNN[14],Mask-RCNN在其基礎(chǔ)上添加了FCN(Fully Convolutional Networks)[15]和ROI Align。其中ROI Align以線性插值算法代替了之前網(wǎng)絡(luò)中ROI Pooling[16]的量化操作。這種改進(jìn)是新的網(wǎng)絡(luò)能在分割準(zhǔn)確率上打敗舊網(wǎng)絡(luò)的關(guān)鍵所在,它很大程度地提升了像素級(jí)別的分割性能。

        2.2 自動(dòng)截取感興趣區(qū)域

        從工業(yè)相機(jī)獲取的圖像長(zhǎng)寬為1280×1024、大小為1.25 MB的BMP圖像,本文嘗試使用對(duì)整張圖像做標(biāo)記后的數(shù)據(jù)集進(jìn)行訓(xùn)練。發(fā)現(xiàn)不僅識(shí)別速度較慢(在裝有GPU為2080ti的PC上達(dá)到近1張/s的運(yùn)行速度),且效果不佳。為了保證識(shí)別速度與準(zhǔn)確性,本文去除了額外信息,只使用識(shí)別的ROI區(qū)域——包括鋼印字符在內(nèi)的整個(gè)紙質(zhì)醫(yī)藥包裝盒。在基于工業(yè)相機(jī)的最佳成像效果調(diào)試距離的情況下,設(shè)計(jì)一種適合本項(xiàng)目的ROI提取算法,以獲取包括包裝盒在內(nèi)的長(zhǎng)寬為1024×350的ROI圖片。

        由于當(dāng)一些基礎(chǔ)的圖像分割方法在圖像的灰度直方圖中不存在比較明顯的雙峰特性時(shí),很難取得滿意的分割效果[17-19],所以在研究整個(gè)數(shù)據(jù)集中圖片的特性后,對(duì)一些傳統(tǒng)的車牌識(shí)別定位方法[20-21]進(jìn)行了改進(jìn)。采用的算法包括Otsu二值化、Sobel邊緣檢測(cè)、垂直梯度、Canny算子、形態(tài)學(xué)閉操作、圖像連通域處理等。其原理如圖3所示,圖4為最終提取效果。

        圖3 自動(dòng)截取ROI算法原理圖

        鋼印字符原圖在經(jīng)過(guò)Otsu二值化后,保存了所有字符的大部分位置信息,但由于存在干擾的緣故,包裝盒部分的像素會(huì)與相機(jī)成像中的產(chǎn)品傳輸帶相連在一起,或者出現(xiàn)包裝盒邊緣丟失的情況,不利于分割,所以同時(shí)提取原圖的Sobel邊緣信息和Canny邊緣信息后,將3種二值化圖像疊加并進(jìn)行連通域去噪和形態(tài)學(xué)濾波[22]。經(jīng)試驗(yàn),選取合適的濾波器參數(shù)后,對(duì)得到的只包含字符和產(chǎn)品傳輸帶區(qū)域的二值化圖像進(jìn)行灰度投影分割,應(yīng)用上述算法得到從圖2(a)自動(dòng)截取的感興趣區(qū)域圖像如圖4所示。

        圖4 自動(dòng)截取感興趣區(qū)域示例

        2.3 數(shù)據(jù)集的創(chuàng)建

        本文所使用的圖片均來(lái)自長(zhǎng)沙納威爾智能科技有限公司的真實(shí)工業(yè)項(xiàng)目數(shù)據(jù),暫無(wú)法從互聯(lián)網(wǎng)上利用爬蟲(chóng)等技術(shù)獲取更多類似的數(shù)據(jù)集。受制于真實(shí)生產(chǎn)線數(shù)據(jù),暫時(shí)無(wú)法對(duì)每一種類別的字符進(jìn)行平均處理。共獲得了包括阿拉伯?dāng)?shù)字0~9、小數(shù)點(diǎn)在內(nèi)的11個(gè)種類的醫(yī)藥紙質(zhì)鋼印字符圖片。由此創(chuàng)建了總數(shù)量為200幅的訓(xùn)練數(shù)據(jù)集和165幅的測(cè)試集,其中訓(xùn)練集均為鋼印良好圖像,測(cè)試集則由100幅良好圖像和65幅不良圖像組成。每一幅大小為1024×350的訓(xùn)練圖片中包含了30個(gè)左右的字符。對(duì)訓(xùn)練集圖片中的每一個(gè)字符使用labelme工具進(jìn)行多邊形創(chuàng)建(create polygons),用肉眼尋找字符輪廓邊緣灰度跳變最明顯的位置進(jìn)行標(biāo)注,共計(jì)標(biāo)注了6000個(gè)左右的真值實(shí)例(Ground Truth Instances)訓(xùn)練目標(biāo),并生成需要訓(xùn)練的Mask數(shù)據(jù)。

        整個(gè)項(xiàng)目的流程如圖5所示。

        圖5 項(xiàng)目流程圖

        對(duì)原始圖像進(jìn)行預(yù)處理和歸一化后,輸入至訓(xùn)練好的Mask-RCNN網(wǎng)絡(luò)中進(jìn)行實(shí)例分割。由于在對(duì)生產(chǎn)線上的鋼印字符圖像進(jìn)行識(shí)別時(shí),每一批出廠產(chǎn)品包裝盒上的鋼印字符數(shù)是固定的,在這里提前設(shè)置閾值N為每一幅圖片的實(shí)例數(shù)。網(wǎng)絡(luò)分割完成后,當(dāng)實(shí)例數(shù)不等于N時(shí),判定其為鋼印不良品;當(dāng)實(shí)例數(shù)等于N時(shí),輸出鋼印字符的真實(shí)數(shù)值。

        3 實(shí)驗(yàn)評(píng)估

        使用完整的系統(tǒng)對(duì)從真實(shí)工業(yè)數(shù)據(jù)上獲取的圖片進(jìn)行識(shí)別實(shí)驗(yàn),以驗(yàn)證使用實(shí)例分割技術(shù)實(shí)現(xiàn)紙質(zhì)鋼印字符識(shí)別的可行性。

        3.1 Mask-RCNN網(wǎng)絡(luò)的訓(xùn)練

        網(wǎng)絡(luò)的訓(xùn)練是在搭載有Intel Core i7-6700處理器以及2080ti型11 GB顯存GPU的64位Windows7操作系統(tǒng)的PC上完成的。由于數(shù)據(jù)集的不同,訓(xùn)練時(shí)需對(duì)網(wǎng)絡(luò)各個(gè)參數(shù)進(jìn)行微調(diào)。其參數(shù)設(shè)置如表1所示。

        表1 網(wǎng)絡(luò)參數(shù)設(shè)置表

        將總類別數(shù)設(shè)為12個(gè),其中包含11種字符類別和1種背景類別;將IMAGE_MAX_DIM設(shè)為數(shù)據(jù)集圖片的最大邊長(zhǎng)1024,將IMAGE_MIN_DIM設(shè)為320,經(jīng)實(shí)驗(yàn),此參數(shù)最好設(shè)為64的倍數(shù),因?yàn)樵趫D像縮放Pad64模式下,不對(duì)應(yīng)的錯(cuò)誤設(shè)置可能會(huì)受到min_scale的影響而導(dǎo)致信息的丟失;由于每張所需識(shí)別圖片包含的實(shí)際鋼印字符數(shù)量為30個(gè)左右,為了保持訓(xùn)練速度,將最大實(shí)例個(gè)數(shù)MAX_GT_INSTANCES設(shè)為50;置信度閾值設(shè)為0.7,權(quán)值衰減系數(shù)設(shè)為0.0001,學(xué)習(xí)率設(shè)定為0.001,迭代輪數(shù)設(shè)定為200輪。

        設(shè)置好參數(shù)后,整個(gè)訓(xùn)練花費(fèi)了將近10 h,得到新的模型參數(shù)文件后,Tensorboard中的損失變化如圖6所示。

        圖6 損失曲線

        可以看到,隨著網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)的增加,網(wǎng)絡(luò)的Loss曲線不斷下降并趨于不變,而同時(shí)val_Loss曲線也不斷下降并趨于收斂,由此可知網(wǎng)絡(luò)的學(xué)習(xí)情況良好,參數(shù)設(shè)置符合實(shí)際訓(xùn)練要求。

        3.2 數(shù)據(jù)集測(cè)試與評(píng)估

        在測(cè)試集上對(duì)鋼印字符識(shí)別系統(tǒng)的實(shí)際識(shí)別率進(jìn)行測(cè)試和評(píng)估。同時(shí),為了驗(yàn)證所使用的Mask-RCNN網(wǎng)絡(luò)的有效性,與使用相同訓(xùn)練集訓(xùn)練后的Faster-RCNN網(wǎng)絡(luò)檢測(cè)方法的實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比。圖7為部分鋼印字符圖片在不同方法下的分割與識(shí)別效果,表2給出了2種不同識(shí)別方法在鋼印良好字符圖像測(cè)試集中的識(shí)別數(shù)據(jù)統(tǒng)計(jì)。從結(jié)果中可以看出,相比較Faster-RCNN目標(biāo)檢測(cè)網(wǎng)絡(luò),Mask-RCNN網(wǎng)絡(luò)不僅可以更好地分割出每個(gè)字符所在的像素區(qū)域,并可成功識(shí)別字符標(biāo)簽,準(zhǔn)確率也有著較大提升,而Faster-RCNN則存在較多字符識(shí)別丟失的情況,雖然識(shí)別速度上要優(yōu)于Mask-RCNN,卻不具有實(shí)用性。表3給出了本文所使用Mask-RCNN方法的詳細(xì)識(shí)別結(jié)果,經(jīng)過(guò)計(jì)算,識(shí)別一幅1024×350的圖片所花費(fèi)的時(shí)間少于0.5 s,達(dá)到了預(yù)期水準(zhǔn)。測(cè)試時(shí),將字符識(shí)別率設(shè)定為所有圖片中檢測(cè)正確的字符數(shù)與總字符數(shù)之比,測(cè)試結(jié)果表明,鋼印不良圖像的識(shí)別率為100%;對(duì)鋼印良好的圖像識(shí)別時(shí),存在字符樣本識(shí)別缺失的現(xiàn)象,其圖片識(shí)別率為87%,字符識(shí)別準(zhǔn)確率為99.51%。

        表2 不同網(wǎng)絡(luò)下字符識(shí)別效果

        表3 Mask-RCNN下字符識(shí)別結(jié)果

        圖7 部分鋼印字符識(shí)別圖

        對(duì)于這種良好圖像字符識(shí)別缺失的現(xiàn)象,筆者認(rèn)為是由于訓(xùn)練集過(guò)小而導(dǎo)致的,在所有的圖像數(shù)據(jù)中,訓(xùn)練集與測(cè)試集中良好圖像數(shù)量的比值為2 ∶1,小于最佳比例的7 ∶3,這使得測(cè)試集圖像中出現(xiàn)某些特征較特殊的良好字符樣本的概率增加了,所以增大訓(xùn)練集的大小能在一定程度上減少這種現(xiàn)象;而測(cè)試中不良字符圖像的檢測(cè)效果好于良好圖像的原因則是由于創(chuàng)建的訓(xùn)練集中沒(méi)有進(jìn)行鋼印不良字符的標(biāo)注,從而使得網(wǎng)絡(luò)在對(duì)鋼印缺失的字符像素區(qū)域進(jìn)行預(yù)測(cè)時(shí)的置信度要遠(yuǎn)小于所設(shè)置的0.7,所以不進(jìn)行缺失字符的分割,這種設(shè)定反而增加了鋼印不良字符圖像的檢測(cè)效果。

        參考了Mask-RCNN文獻(xiàn)[12]中的評(píng)估方式,采用各類別AP的平均值MAP(Mean Average Precision)評(píng)價(jià)標(biāo)準(zhǔn),以評(píng)估實(shí)例分割紙質(zhì)鋼印字符圖像的有效性。對(duì)默認(rèn)IoU=0.5,骨干網(wǎng)絡(luò)使用ResNet-101的情況下,使用Mask-RCNN模型對(duì)測(cè)試集良好圖像中隨機(jī)抽取的15幅圖像進(jìn)行實(shí)驗(yàn)測(cè)試,得到了99.7的MAP評(píng)估值。由此可知,使用Mask-RCNN網(wǎng)絡(luò)后的鋼印字符分割具有良好的性能。

        4 結(jié)束語(yǔ)

        針對(duì)市場(chǎng)上紙質(zhì)醫(yī)藥包裝鋼印字符的識(shí)別,本文設(shè)計(jì)了一種基于圖像處理和深度學(xué)習(xí)的鋼印字符識(shí)別系統(tǒng)。實(shí)驗(yàn)數(shù)據(jù)表明,系統(tǒng)能有效識(shí)別此類字符的出廠鋼印質(zhì)量,并捕捉其字符信息,其對(duì)鋼印不良字符圖像的檢測(cè)率為100%,對(duì)鋼印良好字符圖像的識(shí)別準(zhǔn)確率達(dá)到了99%以上。利用實(shí)例分割算法Mask-RCNN,系統(tǒng)很好地解決了以往由紙質(zhì)鋼印字符圖像的灰度分布不均及變化較小而導(dǎo)致的難以識(shí)別的問(wèn)題,但在識(shí)別速度上還有不足。下一步研究中將進(jìn)一步使用更小的感興趣區(qū)域、增加訓(xùn)練集的數(shù)量以及對(duì)網(wǎng)絡(luò)結(jié)構(gòu)做出更深層次的優(yōu)化,以實(shí)現(xiàn)更高的檢測(cè)效率。

        猜你喜歡
        字符識(shí)別字符紙質(zhì)
        尋找更強(qiáng)的字符映射管理器
        字符代表幾
        一種USB接口字符液晶控制器設(shè)計(jì)
        電子制作(2019年19期)2019-11-23 08:41:50
        消失的殖民村莊和神秘字符
        一種改進(jìn)深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的英文字符識(shí)別
        儀表字符識(shí)別中的圖像處理算法研究
        紙質(zhì)書(shū)與《北京是個(gè)好地方》
        紙質(zhì)讀物的困境與出路
        獨(dú)立書(shū)店浪漫的紙質(zhì)生活
        Coco薇(2016年1期)2016-01-11 03:00:59
        基于CUDA和深度置信網(wǎng)絡(luò)的手寫(xiě)字符識(shí)別
        亚洲一区二区国产一区| 在线视频中文字幕乱人伦| 久久久诱惑一区二区三区| 亚洲国产一区二区网站| 欧美黑人又大又粗xxxxx| 把插八插露脸对白内射| 精品人妻丰满久久久a| 国产成人av三级三级三级在线| 免费成人电影在线观看| 国产96在线 | 欧美| 亚洲国产精品中文字幕日韩| 99久久久69精品一区二区三区| 日韩综合无码一区二区| av香港经典三级级 在线| 国产又黄又爽又无遮挡的视频| 日韩黄色大片免费网站| 男女肉粗暴进来动态图| 国内a∨免费播放| 国产福利97精品一区二区| 日本一区二区三区四区在线视频| 国产欧美性成人精品午夜| 欧美日韩中文国产一区| 久久洲Av无码西西人体| 国产成人综合精品一区二区| 风流老熟女一区二区三区| 国产人成无码中文字幕| 91精品国产色综合久久不| 亚洲国产中文字幕视频| 中文字幕av无码一区二区三区| 亚洲va在线va天堂va四虎| 午夜免费观看一区二区三区| 久久婷婷五月综合97色一本一本| 无码少妇一级AV便在线观看| 一本久久a久久精品综合| 精品国产一区二区三区av| 成人黄色网址| 国产粉嫩高清| 在线播放草猛免费视频| 无码免费一区二区三区| 综合91在线精品| 久久综合激情的五月天|