亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LapSVM的物流編號(hào)圖像自動(dòng)識(shí)別算法

        2015-02-18 09:31:46曹炯清
        物流技術(shù) 2015年3期
        關(guān)鍵詞:字符分類器像素

        曹炯清

        (貴州電子信息職業(yè)技術(shù)學(xué)院 計(jì)算機(jī)科學(xué)系,貴州 凱里 556000)

        1 引言

        隨著物流需求的快速增長,物流企業(yè)的信息管理技術(shù)也需要不斷的提高。信息化管理需要記錄貨物各個(gè)時(shí)期的信息,還要對(duì)貨物進(jìn)行跟蹤。傳統(tǒng)的物流信息管理是以手工錄入為主,速度慢、效率低,不利于物流管理。如何快速實(shí)現(xiàn)自動(dòng)識(shí)別和信息獲取是目前物流企業(yè)所關(guān)注的重點(diǎn)之一。

        目前,條形碼識(shí)別和射頻識(shí)別相繼出現(xiàn),成為提高物流管理效率的主要方法。條形碼技術(shù)是通過快遞員對(duì)貨物標(biāo)簽上的條形碼進(jìn)行掃描,以獲取相應(yīng)的貨物信息,這是目前最主要的物流編號(hào)識(shí)別方法[1]。該方式成本低,方便易行,但是也存在著諸多缺陷,如條形碼的信息容量小,信息單一,需要人工干預(yù),識(shí)別的距離短等。而射頻識(shí)別技術(shù)利用一個(gè)相當(dāng)于內(nèi)存卡和發(fā)射器的芯片,該芯片記錄了產(chǎn)品的信息,能夠通過非接觸進(jìn)行識(shí)別[2]。該方法具有快速掃描、數(shù)據(jù)記憶容量大和安全等特點(diǎn),但是投入成本高。

        在物流運(yùn)輸過程中,許多物流企業(yè)主要通過識(shí)別貨物的物流編號(hào)來實(shí)現(xiàn)對(duì)貨物的提取、分析和配送工作[3],同時(shí)該編號(hào)還能記錄貨物的運(yùn)輸狀態(tài),便于企業(yè)和客戶對(duì)貨物進(jìn)行跟蹤和查詢,所以有越來越多的物流企業(yè)開始重視物流編號(hào)在物流管理和運(yùn)作中的作用。若能夠自動(dòng)識(shí)別物流編號(hào),同樣可以高效地獲取到貨物的運(yùn)輸信息。

        2 基于圖像處理的物流編號(hào)識(shí)別過程

        基于圖像處理的物流編號(hào)識(shí)別算法首先需要進(jìn)行圖像采集,以獲取物流訂單的編號(hào)。當(dāng)傳感器檢測到有貨物進(jìn)入拍攝區(qū)域時(shí),則給采集設(shè)備發(fā)信號(hào),設(shè)備接受到信號(hào)后,對(duì)貨物進(jìn)行拍照,獲取到物流編號(hào)圖像,如圖1所示。接著以采集得到的圖像為基礎(chǔ),對(duì)其進(jìn)行圖像預(yù)處理,如圖像去噪和二值化,之后對(duì)處理過的圖像上的數(shù)字字符進(jìn)行分割,將連續(xù)的字符圖像切分成為單個(gè)字符圖像。然后,對(duì)分割后的各個(gè)數(shù)字字符圖像進(jìn)行特征提取,將提取出的特征向量作為輸入,用來訓(xùn)練SVM分類器,訓(xùn)練好分類器之后,可以使用該分類器對(duì)新輸入的數(shù)字字符進(jìn)行分類識(shí)別,得到物流編號(hào)信息。整個(gè)過程可以自動(dòng)進(jìn)行,減少人工的干預(yù)。

        圖1 物流編號(hào)示意圖

        該算法過程主要包括圖像采集,圖像預(yù)處理,數(shù)字字符分割,字符特征提取,分類器訓(xùn)練與識(shí)別,其流程圖如圖2所示。

        2.1 物流編號(hào)圖像預(yù)處理

        在圖像的采集和傳輸過程中,由于受到采集設(shè)備的影響或者環(huán)境的變化,圖像會(huì)出現(xiàn)噪聲干擾的情況,圖像預(yù)處理階段能夠有效地消除噪聲的影響,恢復(fù)出有效的信息,增強(qiáng)信息識(shí)別的可靠性。預(yù)處理過程包括圖像去噪和圖像二值化。

        圖2 基于圖像處理的物流編號(hào)識(shí)別算法流程圖

        圖像去噪就是要將圖像包含的各種噪聲濾除掉,中值濾波是一種常用的非線性濾波方法,該方法用某像素的相鄰像素區(qū)域的灰度中值替代該像素的灰度值,主要作用就是將一些與周圍領(lǐng)域像素值相差較大的像素灰度值改為與鄰域像素值接近的灰度值,從而去除一些過亮或過暗的像素。中值濾波簡單易行,能夠有效保留圖像的邊緣信息,同時(shí)起到去除噪聲的作用,該算法的步驟如下:

        (1)使用一個(gè)3×3的模板,沿著行或列的方向移動(dòng);(2)每次移動(dòng)后,對(duì)模板內(nèi)的像素區(qū)域進(jìn)行排序;(3)用排序后得到的中值作為模板中心像素的灰度值。

        為了使后續(xù)的數(shù)字字符分割和單個(gè)字符識(shí)別有效進(jìn)行,在對(duì)圖像進(jìn)行去噪之后需要進(jìn)行二值化處理。圖像二值化的實(shí)質(zhì)就是閾值分割,首先要選定一個(gè)合適的閾值,將圖像中的每一個(gè)像素點(diǎn)與設(shè)定的閾值進(jìn)行對(duì)比,如果小于該閾值,則用0(黑色)來代替原始的像素灰度值;反之,如果大于該閾值,則用255(白色)進(jìn)行替代。該方法的公式表述如下:

        其中,T為預(yù)先設(shè)定的閾值,f(x,y)為去噪后的物流編號(hào)圖像,g(x,y)為二值化后的物流編號(hào)圖像。二值化后的圖像只有黑白兩種顏色,能夠有效地區(qū)分出背景和圖像的目標(biāo),本文中使用白色背景,黑色數(shù)字。

        2.2 數(shù)字字符分割

        數(shù)字字符分割就是將如圖1中的整個(gè)字符圖像中的每一個(gè)字符分割出來,形成單一的數(shù)字圖像,如果字符分割得不夠準(zhǔn)確,對(duì)后續(xù)的特征提取和識(shí)別會(huì)有很大的影響??爝f單上的物流編號(hào)中的數(shù)字大小一致,在一定程度上降低了分割的難度。

        字符分割的算法有很多種,最常用的辦法就是通過連通域進(jìn)行分割。通常情況下,每一個(gè)數(shù)字都能夠構(gòu)成一個(gè)連通域,只要能夠找到這個(gè)連通域的行與列的起點(diǎn)和終點(diǎn)位置,就可以確定數(shù)字的最小矩形,從而實(shí)現(xiàn)數(shù)字字符的分割。

        由于圖像采集時(shí)照相距離的不同導(dǎo)致拍攝到的數(shù)字圖片大小不同,因此對(duì)分割后的圖像進(jìn)行大小歸一化,使這些數(shù)字圖像成為大小一致的尺寸,利于特征提取時(shí)的標(biāo)準(zhǔn)一致。在進(jìn)行大小歸一化的過程中,不能改變數(shù)字的拓?fù)浣Y(jié)構(gòu),最大程度的減小數(shù)字字符的失真,確保識(shí)別的正確率。

        令v(x,y)為原始圖像,v′(x′,y′)為歸一化后的圖像,兩者坐標(biāo)的映射關(guān)系為;

        其中,width、width'分別為歸一化前后的圖像寬度,height、height′分別為歸一化前后的圖像高度,同時(shí),歸一化后(x′,y′)處的灰度值v′(x′,y′)與v(x,y)相等??梢钥闯?,歸一化后的點(diǎn)可能為原圖像的浮點(diǎn)數(shù)處,需要通過插值算法計(jì)算其像素值,此處通過雙線性插值法將圖像歸一化為同一尺寸。

        2.3 編號(hào)特征提取

        所謂的識(shí)別過程,重要就是依據(jù)特征進(jìn)行判斷,故在此之前,需要對(duì)數(shù)字符號(hào)特征進(jìn)行提取,得到特征向量,然后在特征空間中采取相應(yīng)的算法對(duì)待識(shí)別目標(biāo)的特征進(jìn)行判別,實(shí)現(xiàn)識(shí)別的目的。良好的特征應(yīng)該具備以下幾點(diǎn)要求:

        (1)可區(qū)分性:同類目標(biāo)的特征向量相似,不同類別的特征向量差異顯著;(2)可靠性:所用的特征易于提取,并且具有一定的抗干擾能力和魯棒性;(3)獨(dú)立性:各個(gè)特征之間彼此不相關(guān),具有獨(dú)立性;(4)數(shù)量少:特征向量的維度往往對(duì)分類器的計(jì)算復(fù)雜度有很大的影響,所以需要提取能夠保證分類最少的特征數(shù)。

        本文使用的是粗網(wǎng)格特征,該特征屬于局部特征,又稱為局部灰度特征。首先將數(shù)字字符圖像劃分為n×n個(gè)網(wǎng)格(如8×8),統(tǒng)計(jì)每個(gè)網(wǎng)格內(nèi)目標(biāo)像素(黑色像素)的數(shù)量,得到一個(gè)n2維的組網(wǎng)格特征向量,該特征向量表示目標(biāo)像素在網(wǎng)格中的多少,能夠很好的反映出數(shù)字的整體結(jié)構(gòu)分布情況,提取出的特征用于后面的識(shí)別分類過程。

        3 基于LapSVM的物流編號(hào)識(shí)別算法

        3.1 SVM原理簡介

        支持向量機(jī)(Support Vector Machines,SVM)是于1995 年由Vapnik 等人提出的一種機(jī)器學(xué)習(xí)方法,該方法是由統(tǒng)計(jì)學(xué)習(xí)方法發(fā)展而來,目的是在訓(xùn)練樣本集中找到一個(gè)最優(yōu)超平面,能夠?qū)深悩颖菊_地分開并且使得分類間隔最大。SVM能夠解決非線性、小樣本和高維數(shù)據(jù)等問題,并能夠推廣到函數(shù)擬合等機(jī)器學(xué)習(xí)的問題當(dāng)中,近年來得到廣泛的關(guān)注與應(yīng)用,如車牌字符識(shí)別[4-5]。

        (1)線性可分的情況。如果兩類樣本可以通過一個(gè)線性函數(shù)完全分開,則將這些樣本稱為線性可分的,反之,不能夠由一個(gè)線性函數(shù)分開的樣本成為線性不可分的。圖3給出線性可分與線性不可分的簡單實(shí)例。

        假設(shè)有一個(gè)線性可分的樣本數(shù)據(jù)集{ }( )xi,yi,i=1,…,n,樣本向量x∈Rd,類標(biāo)簽y∈{ }+1,-1 ,通常+1 為正例,-1 為反例。對(duì)樣本進(jìn)行分類就是要確定能使得分類間隔最大化的超平面,設(shè)其方程為:

        由點(diǎn)到面的距離公式可以得到樣本x與超平面間的距離,對(duì)f(x)進(jìn)行歸一化使得兩類樣本中距離超平面最近的樣本滿足|f(x)|=1,此時(shí)最近樣本到分類邊界的距離為:

        圖3 線性可分與線性不可分

        分類間隔就等于2 ‖w‖,則使得間隔最大與使‖w‖(或‖w‖2)最小等價(jià),對(duì)于所有樣本分類正確時(shí)還需要滿足一定的約束條件,則有:

        所求的分類面就是最優(yōu)超平面,那些使式(6)等號(hào)成立的樣本成為支持向量。圖4給出最優(yōu)分類面的示意圖。

        圖4 最優(yōu)分類面的示意圖

        根據(jù)拉格朗日乘數(shù)法可以得到以下的函數(shù)

        其中,αi>0 為拉格朗日系數(shù)。函數(shù)L(w,b,α)分別對(duì)w和b求偏導(dǎo)數(shù),令其為零,可以得到下面的形式:

        則可以得到最終的優(yōu)化問題:

        通過求解(9)可以得到最優(yōu)解α*,再根據(jù)α*求得w*和b*,并可以得到最優(yōu)分類判別函數(shù)

        將測試樣本x代入判別函數(shù)中就可以得到分類的結(jié)果。

        (2)線性不可分的情況。在樣本集為線性不可分時(shí),引入松弛變量ξi≥0,允許某些樣本點(diǎn)的函數(shù)間隔小于1,即在最大分隔區(qū)域內(nèi),此時(shí)得到新的目標(biāo)函數(shù)以及相應(yīng)的約束條件

        其中,C為懲罰參數(shù),相應(yīng)的最終優(yōu)化問題為

        同樣在求得α*、w*和b*后可以得到與式(10)形式相同的判別函數(shù)。

        (3)核函數(shù)。核函數(shù)的引入能夠解決低維空間的線性不可分問題,且在變換到高維空間后,并不需要知道變換的具體形式,因?yàn)榕袆e函數(shù)中只包括內(nèi)積運(yùn)算,所以只需要定義變換后的內(nèi)積運(yùn)算。統(tǒng)計(jì)學(xué)習(xí)理論中指出,只要核函數(shù)K(x,y)滿足Mercer 條件就可以作為某變換空間中的內(nèi)積進(jìn)行使用,也就是最優(yōu)判別函數(shù)表示為:

        常用的核函數(shù)有以下幾種:

        (1)線性核函數(shù):

        (2)多項(xiàng)式核函數(shù):

        (3)高斯核函數(shù):

        (4)Sigmoid核函數(shù):

        支持向量機(jī)先通過非線性變換將輸入數(shù)據(jù)集投影到高維空間中,再在這個(gè)高維空間內(nèi)對(duì)最優(yōu)線性分類面進(jìn)行求解,此過程中不需要知道非線性變換的具體形式,只需知道核函數(shù)即可。

        3.2 基于LapSVM的多分類算法

        SVM 模型能夠獲得較高的識(shí)別,但是需要較多的訓(xùn)練樣本。半監(jiān)督學(xué)習(xí)是最近機(jī)器學(xué)習(xí)中的一個(gè)熱點(diǎn),它能同時(shí)利用標(biāo)記樣本與未標(biāo)記樣本的信息,在極少標(biāo)記樣本的情況下,獲得準(zhǔn)確的識(shí)別結(jié)果。其原理如下:首先用未標(biāo)記樣本構(gòu)造一個(gè)Laplacian正則項(xiàng):

        其中cij代表樣本xi,xj的相似程度。將公式(18)加入(9),得到:

        這就構(gòu)成了LapSVM分類器。

        SVM 的提出是用于解決二分類問題,而物流編號(hào)識(shí)別屬于多分類問題。目前,使用SVM進(jìn)行多分類的方法主要有:一對(duì)一(One against one)、一對(duì)多(One against the others)和SVM決策樹法(SVM decision tree)。由于一對(duì)多算法簡單且易實(shí)現(xiàn),所以本文選用一對(duì)多方法進(jìn)行物流編號(hào)的識(shí)別。

        一對(duì)多方法就是將某一類的樣本與其它剩余類別的樣本劃為兩個(gè)類別,在這兩類中構(gòu)建超平面,在這種分類算法中,需要構(gòu)建多個(gè)SVM 分類器,每一個(gè)分類器用于將某一類與其他類進(jìn)行分類,將多分類問題轉(zhuǎn)換為多個(gè)二分類問題。

        物流編號(hào)識(shí)別當(dāng)中的數(shù)字為0-9,共有10個(gè)類別,故需要構(gòu)造10個(gè)SVM分類器。訓(xùn)練之前,需先提取數(shù)字字符的粗網(wǎng)格特征,用于訓(xùn)練分類器。在訓(xùn)練第i 個(gè)分類器時(shí),將屬于該類的樣本標(biāo)記為+1,不屬于該類的樣本標(biāo)記為-1。訓(xùn)練時(shí)需先選定核函數(shù)K(x,y)和懲罰參數(shù)C,將訓(xùn)練樣本代入SVM 算法中,得到相應(yīng)的判別函數(shù)f(x)。進(jìn)行數(shù)字字符識(shí)別時(shí),將提取得到的特征向量輸入到每一個(gè)分類器當(dāng)中,循環(huán)檢查每個(gè)分類器的輸出。當(dāng)某個(gè)分類器的輸出為1時(shí),則輸入的數(shù)字字符屬于該類別;若所有輸出均為-1,則拒絕識(shí)別該數(shù)字。在識(shí)別過程中遇到多個(gè)分類器輸出為1時(shí),則該數(shù)字屬于第一個(gè)輸出為1的分類器的類別。

        在每類標(biāo)記樣本取成不同數(shù)目的情況下,測試SVM 和LapSVM 對(duì)1 000 個(gè)物流編號(hào)圖像的識(shí)別結(jié)果,得到結(jié)果見表1。

        從結(jié)果可以看出:在極少標(biāo)記樣本的情況下,LapSVM 能夠取得準(zhǔn)確的識(shí)別,識(shí)別正確率遠(yuǎn)高于SVM。

        表1 物流編號(hào)圖像識(shí)別正確率(%)

        4 結(jié)論

        物流編號(hào)中包含了貨物的運(yùn)輸信息,便于客戶和企業(yè)對(duì)貨物進(jìn)行跟蹤,本文提出的基于圖像處理的物流編號(hào)識(shí)別算法,對(duì)采集到的物流編號(hào)圖像進(jìn)行預(yù)處理和數(shù)字字符分割,對(duì)分割后的各個(gè)圖像提取特征,獲得特征向量,用于訓(xùn)練LapSVM分類器,使用訓(xùn)練好的分類器進(jìn)行編號(hào)的分類與識(shí)別。該算法簡潔高效,能夠降低人工干預(yù),提高自動(dòng)識(shí)別效率。

        [1]楊長勇.條形碼技術(shù)在物流生產(chǎn)過程中應(yīng)用探索[J].信息通信,2011,(3):68-69.

        [2]謝勇,王紅衛(wèi),李再進(jìn).基于電子標(biāo)簽的物流路徑跟蹤系統(tǒng)研究[J].物流技術(shù),2005,(12):27-30.

        [3]黃孝平,林雯.基于計(jì)算機(jī)視覺圖像的物流編號(hào)智能識(shí)別技術(shù)[J].網(wǎng)絡(luò)與信息化,2013,32(3):449-451.

        [4]高珊,劉萬春,朱玉文.基于SVM的車牌字符分割和識(shí)別方法[J].微電子學(xué)與計(jì)算機(jī),2005,22(6):34-36.

        [5]王曉光,王曉華.一種基于SVM的車牌漢字的有效識(shí)別方法[J].計(jì)算機(jī)工程與應(yīng)用,2004,(24):208-209.

        猜你喜歡
        字符分類器像素
        趙運(yùn)哲作品
        藝術(shù)家(2023年8期)2023-11-02 02:05:28
        尋找更強(qiáng)的字符映射管理器
        像素前線之“幻影”2000
        字符代表幾
        一種USB接口字符液晶控制器設(shè)計(jì)
        電子制作(2019年19期)2019-11-23 08:41:50
        “像素”仙人掌
        消失的殖民村莊和神秘字符
        BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
        中文在线天堂网www| 国产精品久久免费中文字幕| 亚洲国产亚综合在线区| 国产女人的高潮国语对白| 波多野吉衣av无码| 久久久国产精品ⅤA麻豆百度 | 女同性恋精品一区二区三区| 国产免费人成网站在线播放| 精品人妻av一区二区三区四区| 无码精品一区二区三区在线| 一本色道无码道在线观看| 7777精品久久久大香线蕉| 美女精品国产一区二区三区| 国产专区亚洲专区久久| 综合偷自拍亚洲乱中文字幕| 首页 综合国产 亚洲 丝袜| 亚洲毛片网| 亚洲区福利视频免费看| 国产的自拍av免费的在线观看| 亚洲爆乳精品无码一区二区三区| 欧美日韩国产成人高清视频| 久久天堂av色综合| 一区二区三区精品亚洲视频| 国产精品自线一区二区三区| 人人妻人人狠人人爽天天综合网 | 青青草高中生在线视频| 亚洲国产成人av在线观看| 免费又黄又爽又猛的毛片| 国产一区二区丁香婷婷| 亚洲国产日韩一区二区三区四区| 人妻中文字幕乱人伦在线| 免费看泡妞视频app| 99久久久精品免费| 亚洲女同一区二区三区| 欧美午夜理伦三级在线观看| 蜜桃无码一区二区三区| av无码天堂一区二区三区| 精品在线亚洲一区二区三区 | 日本在线一区二区三区四区| 午夜免费观看日韩一级视频| 最新精品国偷自产在线|