亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于概率神經(jīng)網(wǎng)絡(luò)的手寫苗文識別研究

        2019-01-04 08:09:04曾水玲
        大理大學(xué)學(xué)報 2018年12期
        關(guān)鍵詞:識別率像素點灰度

        丁 李,曾水玲

        (1.吉首大學(xué)物理與機電工程學(xué)院,湖南吉首 416000;2.吉首大學(xué)信息科學(xué)與工程學(xué)院,湖南吉首 416000)

        湘西苗族創(chuàng)造了 3種苗文〔1〕,“板塘苗文”“老寨苗文”和“古丈苗文”〔2〕。方塊苗文是一種借源文字,與漢字的結(jié)構(gòu)和造字法上基本一致,造字法主要有形聲和會意,雙音符的不多,象形成分極少,大量地借用漢字標音。方塊苗文用來記錄和創(chuàng)作苗歌,苗歌主要是表達苗族人們在生產(chǎn)、生活、農(nóng)耕、風(fēng)俗傳統(tǒng)等各方面的情懷,留存下來的苗歌手稿有十幾萬字,為我們研究苗族的民族歷史、民族風(fēng)俗和民族文學(xué)提供了寶貴的文字資料。

        在信息化時代,專家需要將這些珍貴的苗文手寫文字的紙質(zhì)載體錄入進計算機進行保存和傳播,對于文字的識別方法,前人已經(jīng)探索出針對各種文字的識別體系〔3-7〕,而苗文方面,也有學(xué)者為苗文便于在計算機中生成和顯示,提出了方塊苗文動態(tài)構(gòu)造方法〔8〕。隨著數(shù)字化社會的發(fā)展,傳統(tǒng)的手寫紙質(zhì)載體需要轉(zhuǎn)型以適應(yīng)現(xiàn)代化需要。為更高效地進行苗文的錄入和傳播,開發(fā)關(guān)于苗文的光學(xué)字符識別(optical character recognition,OCR)成為可供選擇的方向。所以,開發(fā)針對于苗文的識別系統(tǒng)是十分迫切和重要的工作,傳統(tǒng)的投影識別法雖然能達到識別苗文的目的,但輸入的識別特征矩陣巨大,雖然訓(xùn)練效果不錯,但預(yù)測結(jié)果時,存在有過擬合的問題,使得系統(tǒng)的識別潛力沒有完全開發(fā)出來,本文工作一方面驗證PNN神經(jīng)網(wǎng)絡(luò)對于方塊苗文圖像識別工作的可用性,另一方面就是為了通過簡化特征矩陣的辦法來挖掘識別系統(tǒng)神經(jīng)網(wǎng)絡(luò)的潛在能力。

        1 文字圖像預(yù)處理

        手寫苗文文字樣本經(jīng)過掃描儀進入計算機后,因紙張的厚度、光潔度和取樣設(shè)備質(zhì)量的不穩(wěn)定都會造成錄入后的數(shù)字圖像文字畸變,形成粘連、筆畫中斷和圖像噪點等干擾,所以在進行文字識別之前,務(wù)必要對帶有噪聲的文字圖像進行處理。圖像預(yù)處理方法有許多經(jīng)驗成果〔9-10〕,其大體步驟包括文字圖像大小歸一化、灰度化、二值化、規(guī)范化等等。

        1.1 文字圖像灰度化通過外設(shè)采集的圖像通常為彩色圖像,彩色圖像會夾雜一些干擾信息,灰度化處理的主要目的就是濾除這些信息。定義在RGB空間的彩色圖像,圖像內(nèi)每一個像素點的顏色由Red、Green、Blue 3個分量共同決定?;叶然鋵嵸|(zhì)是將原本由三維描述的像素點,映射為一維描述的像素點?;叶然椒ㄓ蟹至糠?、最大值法、平均值法、加權(quán)平均法。加權(quán)平均法的權(quán)值是根據(jù)人體生理學(xué)角度(人眼對綠色最敏感,對藍色最不敏感)所提出的,具有最理想的灰度化效果,公式權(quán)值如下:

        本文采用加權(quán)平均法來處理原始圖像,處理結(jié)果見圖1。

        圖1 灰度化后的圖像

        1.2 文字圖像二值化經(jīng)過灰度處理的彩色圖像還須經(jīng)過二值化處理將文字與背景進一步分離開。所謂二值化,就是將彩色值圖像信號轉(zhuǎn)化成只有黑(0)和白(1)的二值圖像信號。二值化效果的好壞,會直接影響灰度文本圖像的識別率。二值化處理的具體經(jīng)驗有很多〔11-12〕,方法大致可以分為局部閾值二值化和整體閾值二值化。本文參考基于k中心點聚類的圖像二值化方法〔13〕,采用局部閾值二值化,將方塊苗文圖像分割為互不相交的若干個w×w的小窗口,在每個窗口中求得所轄像素的灰度平均值,經(jīng)添加懲罰項后作為初步閾值進行二值化處理,繼而對各小方塊進行二值化變換,各個閾值的計算公式如下:

        若塊內(nèi)的灰度值大于閾值T,則把該點的值置為1,否則將該點的值置為0,將圖像二值化能更進一步減少圖像中的信息量,減少無關(guān)信息的干擾。將灰度圖像二值化后結(jié)果見圖2。

        圖2 二值化處理后的結(jié)果

        1.3 規(guī)范化規(guī)范化主要分為位置規(guī)范化、大小規(guī)范化和筆畫細化處理,位置規(guī)范化和大小規(guī)范化在紙質(zhì)文字轉(zhuǎn)化為數(shù)字圖像時,就已規(guī)范化,每個單體文字圖像像素為長寬各130像素。對于細化方面,細化是指對于一個給定的模式圖像,抽取其“中心骨架”的過程,細化算法可分為非迭代算法和迭代算法,而迭代算法又分為串行算法和并行算法,本文的細化處理是在不破壞原有結(jié)構(gòu)配置和給定筆畫連接位置關(guān)系的基礎(chǔ)上,采取迭代掃描并刪減邊界像素點來完成。筆畫細化方法中經(jīng)典的有基于標記的并行細化算法〔14〕,改進的有自動矢量化算法〔15〕。細化后的文字消減了很多手寫字體的個性化特征,為特征提取創(chuàng)造了有利條件。

        在計算機圖像處理過程中,用黑底白字來處理矩陣更加方便,所以先將二值化后的圖像取反,取反后結(jié)果見圖3,之后再利用細化算法將其細化,具體方法:使用一個包含9個像素的3×3模板,9個像素點只取值0或1,因此模板有29=512種形式,給予每個模板一個編號0~511,編號等于模板中的像素加權(quán)和,像素權(quán)重見圖4。

        圖3 取反效果圖

        圖4 像素權(quán)重

        把模板分成8個方向,輪流使用8個方向的模板,消去最外層像素點,不斷循環(huán),直到剩下“骨架”為止。細化后結(jié)果見圖5。

        圖5 筆畫細化效果圖

        2 文字特征的提取

        特征提取即對某一模式的組測量值進行變換,以突出該模式具有的代表性特征的一種方法。常見的文字特征類型分為統(tǒng)計類特征和結(jié)構(gòu)類特征,統(tǒng)計類特征有像素點個數(shù)、灰度值統(tǒng)計類別等,而結(jié)構(gòu)特征是如邊緣、角、區(qū)域、脊等代表性特征。

        本文著重研究統(tǒng)計類特征中的像素特征,單個文字樣本的二值化矩陣通過規(guī)范化處理后,長和寬都為130像素,通過統(tǒng)計投影在行列的白點(1)數(shù)值個數(shù)能夠在一定程度上代表文字的特征屬性。

        2.1 經(jīng)典投影法經(jīng)典的特征提取投影法是將文字圖像左下角置于直角坐標系原點,統(tǒng)計圖像中各種特性的像素點分別在X、Y軸上的投影數(shù)量,再以兩坐標軸上的特征點數(shù)量來組成特征矩陣,此矩陣的維數(shù)至少等于圖像X、Y軸上像素之和,本文中經(jīng)典投影法的維數(shù)應(yīng)是X軸上130像素加Y軸上130像素再加上一個標志種類的特征,一共261維特征向量。具體步驟如下:

        1)對方塊苗文圖像的X軸和Y軸平均劃分成n=130份。

        2)統(tǒng)計x=1的直線與方塊苗文二維表達式f(x)的交點個數(shù)rx1,統(tǒng)計x=2直線與f(x)的交點個數(shù)rx2,依次循環(huán),直到統(tǒng)計到rx130停止。

        3)依照步驟2)統(tǒng)計ry1到ry130。

        4)構(gòu)建特征矩陣:T130=[I,rx1,rx2,…,rx130,ry1,ry2,…,ry130],其中I為類別標識,定義為文字的類別。

        2.2 改進后的投影法相對于文字的特征提取來說,圖像沒有其他圖像那么復(fù)雜,像素點中的信息相對更加簡化,采用經(jīng)典投影法不但浪費計算機資源,甚至可能取得相反的效果即因系統(tǒng)過擬合導(dǎo)致識別率更低。針對方塊苗文的像素特點,本文將傳統(tǒng)的投影法特征提取加上一個對像素的組別劃分,不僅能簡化特征維數(shù),更能減少資源的浪費。

        在歸一化后的方塊苗文圖像上,像素為130×130的圖像,為了能夠無余量完全劃分,本文采用最大公約數(shù)的劃分方式,即根據(jù)130長寬的像素點,將其橫縱軸的130像素點平均分成65組(2像素點為一組)、26組(5像素點為一組)、13組(10像素點為一組)和2組(65像素點為一組)4種劃分方式。見圖6。分組后統(tǒng)計每個組內(nèi)的白點(1)個數(shù),即可組成特征向量。具體步驟如下:

        前3步與上述步驟相同,不再贅述。

        4)設(shè)2個像素點為一組,計算Rx1=rx1+rx2,Rx2=rx3+rx4,…,Rx65=rx129+rx130,以及Ry1=ry1+ry2,Ry2=ry3+ry4,…,Ry65=ry129+ry130。

        5)構(gòu)建特征矩陣T65=[I,Rx1,Rx2,…,Rx65,Ry1,Ry2,…,Ry65],其中I為類別標識,定義為文字的類別。

        5像素點一組則以此類推,只須計算Rx1=rx1+rx2+rx3+rx4+rx5,Ry1=ry1+ry2+ry3+ry4+ry5以及統(tǒng)計T26=[I,Rx1,Rx2,…,Rx26,Ry1,Ry2,…,Ry26]即可。

        根據(jù)上述步驟,最終得到T130,T65,T26,T13,T2共5種特征矩陣。

        圖6 各種像素組的分類

        3 實驗及結(jié)果分析

        為了驗證普通投影識別法的可用性和改進后的投影法具有更加優(yōu)秀的識別性能,下面利用上述所抽取的各種特征矩陣,結(jié)合PNN神經(jīng)網(wǎng)絡(luò),進行對比分析實驗。

        3.1 PNN神經(jīng)網(wǎng)絡(luò)方塊苗文識別系統(tǒng)的建立概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural networks,PNN)是一種基于Bayes分類規(guī)則與Parzen窗的概率密度函數(shù)估計方法發(fā)展而來的并行算法。這是一種訓(xùn)練快速、結(jié)構(gòu)簡潔的人工神經(jīng)網(wǎng)絡(luò)。

        PNN神經(jīng)網(wǎng)絡(luò)是一種基于徑向基函數(shù)網(wǎng)絡(luò)發(fā)展而來的一種前饋型神經(jīng)網(wǎng)絡(luò),它的理論依據(jù)是貝葉斯決策理論,其作為徑向基網(wǎng)絡(luò)的一種,比較適合模式分類。PNN的層次模型見圖7。

        圖7 概率神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)

        3.2 PNN神經(jīng)網(wǎng)絡(luò)與特征向量的結(jié)合PNN神經(jīng)網(wǎng)絡(luò)共分4層,即輸入層、模式層、求和層和輸出層。

        輸入層接收來自訓(xùn)練樣本的特征,本文的特征向量是由預(yù)處理后樣本圖像的橫縱坐標上投影的白點(1)的數(shù)目組成,根據(jù)像素分組的不同,特征向量維數(shù)也不同,比如2像素組,將第一行與第二行中總的白點(1)個數(shù)統(tǒng)計在一起,作為一個特征值,由于文字圖像為130×130像素圖,即對于行來說就有65個特征項,將縱向特征項也加入進來,就有130個特征項,最后還須加入一列表類別的標志量,則2像素組的特征向量即為131維向量,其他向量組以此類推。將特征向量傳遞給網(wǎng)絡(luò),其神經(jīng)元的數(shù)量和樣本矢量數(shù)量相同。

        模式層計算輸入特征向量與訓(xùn)練中各個模式的匹配關(guān)系,模式層神經(jīng)元個數(shù)等于各個類別訓(xùn)練樣本數(shù)之和,該層每個模式單元的輸出為

        式中Wi為輸入層到模式層連接的權(quán)值,δ為平滑因子。

        圖8 PNN網(wǎng)絡(luò)訓(xùn)練結(jié)果及誤差圖

        第三層是求和層,是將屬于某類的概率累計,從而得到文字類別的估計概率密度函數(shù)。求和層單元的輸出與各類基于內(nèi)核的概率密度的估計成比例,通過輸出層的歸一化處理,即能得到各類的概率估計。

        輸出層神經(jīng)元是一種競爭神經(jīng)元,每一個神經(jīng)元對應(yīng)一個文字的類別,輸出層神經(jīng)元個數(shù)等于參與分類的文字類別總數(shù),它接收從求和層輸出的各類概率密度函數(shù),概率密度函數(shù)最大的那個神經(jīng)元輸出為1,即所對應(yīng)的那一類即為待識別的文字模式類別,其他輸出神經(jīng)元值全為0。

        3.3 網(wǎng)絡(luò)的訓(xùn)練預(yù)測以及結(jié)果分析選取樣本庫中400個手寫苗文字體共10種文字,其中300個作為訓(xùn)練樣本,100個作為測試樣本。在MATLAB中通過 net=newpnn(p_train,t_train,spread)函數(shù)進行概率神經(jīng)網(wǎng)絡(luò)的創(chuàng)建,其中p_train和t_train為抽取出的特征矩陣,多次測試后spread數(shù)值選取1.5能夠很好地保證PNN網(wǎng)絡(luò)神經(jīng)元的一部分對輸入向量所覆蓋的區(qū)間產(chǎn)生響應(yīng),接著利用y=sim(net,p_train)函數(shù)進行已知數(shù)據(jù)的網(wǎng)絡(luò)訓(xùn)練,利用y2=sim(net,p_test)進行未知數(shù)據(jù)的預(yù)測,net是構(gòu)建的PNN神經(jīng)網(wǎng)絡(luò),p_train和p_test分別是訓(xùn)練特征矩陣和預(yù)測的未知特征矩陣,網(wǎng)絡(luò)的訓(xùn)練結(jié)果和預(yù)測結(jié)果見圖8~9。

        圖9 PNN網(wǎng)絡(luò)預(yù)測結(jié)果

        從圖8可知PNN網(wǎng)絡(luò)的訓(xùn)練效果很好,訓(xùn)練預(yù)測值和實際值基本完全吻合,誤差圖上的訓(xùn)練誤差更是為0,這得益于spread值的正確選擇,過大或過小都會導(dǎo)致訓(xùn)練出現(xiàn)誤差。

        從圖9可知,橫坐標為樣本編號,縱坐標為文字種類編號,在100個預(yù)測樣本中,錯誤個數(shù)為8個。

        經(jīng)過多次測試運行,統(tǒng)計出平均識別率,得到在不同像素分類情況下PNN的識別率。見表1。除此之外,在以上結(jié)論的前提下(10像素組擁有最佳的識別效果)與PNN神經(jīng)網(wǎng)絡(luò)相似的BP神經(jīng)網(wǎng)絡(luò)以及LVQ神經(jīng)網(wǎng)絡(luò)也使用相同的特征矩陣進行了識別工作,與其進行了橫向?qū)Ρ?。為了對比的公平,BP神經(jīng)網(wǎng)絡(luò)和LVQ神經(jīng)網(wǎng)絡(luò)將采用相同的10像素組特征矩陣進行訓(xùn)練和分類。

        表1 經(jīng)典組與各個像素分組的識別率(%)

        對于BP神經(jīng)網(wǎng)絡(luò)而言,10像素組的特征矩陣與PNN相同,是一個27維的特征向量,所以BP神經(jīng)網(wǎng)絡(luò)輸入端設(shè)置為27個輸入神經(jīng)元,輸出端和PNN神經(jīng)網(wǎng)絡(luò)一樣設(shè)置為10個神經(jīng)元(10個文字種類)至于隱含層,根據(jù)經(jīng)驗公式取10較為穩(wěn)定,學(xué)習(xí)率取0.1,在和PNN相同的400個文字樣本庫中選擇300個進行網(wǎng)絡(luò)訓(xùn)練,剩下100個作為測試樣本,根據(jù)以上主要參數(shù)進行BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建、訓(xùn)練和識別。

        對于LVQ神經(jīng)網(wǎng)絡(luò)而言,同樣是在400個樣本中選擇300個進行網(wǎng)絡(luò)訓(xùn)練,100個作為測試樣本,輸入依然是27維特征向量,輸出為10個種類的文字,迭代次數(shù)設(shè)置1 000,學(xué)習(xí)率設(shè)置0.01,訓(xùn)練目標最小誤差設(shè)置0.06,根據(jù)以上主要參數(shù)進行LVQ神經(jīng)網(wǎng)絡(luò)的構(gòu)建、訓(xùn)練和識別。

        最終的對比見圖10。

        圖10 改進前后的PNN神經(jīng)網(wǎng)絡(luò)以及其他神經(jīng)網(wǎng)絡(luò)的識別率對比

        從表1中的結(jié)果來看,經(jīng)典組有83.45%的識別率,說明PNN神經(jīng)網(wǎng)絡(luò)的預(yù)測功能用于方塊苗文的識別是可行的。從其他分組的結(jié)果來看,130×130的樣本圖像大小下,實驗了130像素的所有公約數(shù)分組,網(wǎng)格從密集到稀疏,識別率逐漸升高,10像素組達到最優(yōu),之后識別率又下降到最低,從表中看出表現(xiàn)最好的10像素組的識別率比經(jīng)典組的識別率高4.85%,具有很可觀的提升幅度,說明此種像素分類優(yōu)化方案是可行的。圖10中與其他兩種神經(jīng)網(wǎng)絡(luò)的橫向?qū)Ρ葋砜矗琍NN神經(jīng)網(wǎng)絡(luò)本身的識別效果是優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和LVQ神經(jīng)網(wǎng)絡(luò)的,通過此種優(yōu)化方案,挖掘出PNN神經(jīng)網(wǎng)絡(luò)更多的識別分類潛力。

        4 結(jié)論與展望

        對于湘西方塊苗文的計算機識別分類,本文基于OCR技術(shù)、圖像提取處理技術(shù)、PNN神經(jīng)網(wǎng)絡(luò)以及MATLAB軟件,針對提取的特征矩陣維數(shù)過大導(dǎo)致的限制了分類器的識別率問題,提出一套能提升分類器工作效果的解決方案——進行像素的分組,并探究了在不同像素組分類的情況下,PNN神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)果和識別率的提升幅度,得到了最適合的像素組分類方式即10像素組分類方式,最大化平衡計算機資源與系統(tǒng)工作效率之間的關(guān)系。在接下來的工作中,我們一方面會繼續(xù)苗文正確率提升的研究,并解決識別率高低起伏較大的缺點,探索更加具有代表性的文字特征提取方案;另一方面也會在優(yōu)化計算機系統(tǒng)的識別工作效率上進一步探索,改進分類算法來提高文字的識別效率。

        猜你喜歡
        識別率像素點灰度
        采用改進導(dǎo)重法的拓撲結(jié)構(gòu)灰度單元過濾技術(shù)
        基于灰度拉伸的圖像水位識別方法研究
        基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
        計算機工程(2020年3期)2020-03-19 12:24:50
        基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系
        提升高速公路MTC二次抓拍車牌識別率方案研究
        基于canvas的前端數(shù)據(jù)加密
        基于最大加權(quán)投影求解的彩色圖像灰度化對比度保留算法
        基于逐像素點深度卷積網(wǎng)絡(luò)分割模型的上皮和間質(zhì)組織分割
        基于灰度線性建模的亞像素圖像抖動量計算
        高速公路機電日常維護中車牌識別率分析系統(tǒng)的應(yīng)用
        久久人人爽人人爽人人av东京热 | 一个人的视频免费播放在线观看 | 天天摸天天做天天爽水多 | 国内少妇自拍区免费视频| 国产精品欧美成人片| 精品人妻少妇丰满久久久免| 日韩精品成人一区二区在线观看| 老女人下面毛茸茸的视频| av日韩一区二区三区四区| 国产av一区二区三区传媒| 国产中出视频| 蜜桃视频中文字幕一区二区三区 | 制服丝袜中文字幕在线| 玖玖资源站无码专区| 青青草极品视频在线播放| 日本二区在线视频观看| 国产av旡码专区亚洲av苍井空| 免费观看又色又爽又黄的| 免费成人福利视频| 日本岛国视频在线观看一区二区| 久久综合噜噜激激的五月天| 久久九九国产精品怡红院| 亚洲AV无码精品一区二区三区l| 五十路在线中文字幕在线中文字幕| 无码专区一ⅴa亚洲v天堂| 好大好深好猛好爽视频免费| 中文字幕有码一区二区三区| 中文字幕乱码一区在线观看| 日产精品久久久一区二区| 中文字幕av日韩精品一区二区| 开心五月婷婷综合网站| 手机av在线中文字幕| 伊人久久大香线蕉亚洲五月天| 国产精品丝袜在线不卡| 丰满少妇av一区二区三区| 欧美牲交a欧美牲交aⅴ| 1717国产精品久久| 搡老女人老妇女老熟妇69| 不卡一区二区视频日本| 性生交大全免费看| 天堂69亚洲精品中文字幕|