亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        模糊聚類算法下的手寫體數(shù)字識別

        2016-04-11 14:58:05姜琴
        電腦知識與技術(shù) 2016年4期
        關(guān)鍵詞:模糊聚類手寫體算法

        姜琴

        摘要:在對數(shù)字樣本進(jìn)行篩選的過程中,需要使用到手寫體數(shù)字識別的過程,用聚類源的形式來對篩選的結(jié)果進(jìn)行歸納,再經(jīng)過對模糊關(guān)系矩陣的構(gòu)建,就能夠開始時模糊聚類了。實踐證明,該方法具有非常搞得有效性,能夠?qū)ν饨绲母蓴_有很強(qiáng)的抵制作用,不僅準(zhǔn)確率和識別率都有所提高,而且還消除了傳統(tǒng)算法下單因子因素帶來的局限性的影響,具有非常高的實踐意義。

        關(guān)鍵詞:模糊聚類;算法;手寫體;數(shù)字識別

        中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)04-0175-02

        在針對模式識別的研究領(lǐng)域中,無約束手寫體識別一直是長久以來一直研究的一個話題,在傳統(tǒng)的形式下,手寫數(shù)字能夠提供的樣本庫太少,一直成為了研究突破的一個瓶頸,運(yùn)用無約束手寫體數(shù)字識別一直是評判算法質(zhì)量及效果的一個非常具有影響力的檢測方式。國內(nèi)外的科研人員對這類問題開展可研究工作,也有著不同的算法建議。不過以最終結(jié)果來看,被廣泛應(yīng)用的識別算法有統(tǒng)計法、神經(jīng)網(wǎng)絡(luò)法、聚類分析法。這些算法具體來說,有Bagging算法、Adaboost算法、誤差反向傳播算法、支持向量機(jī)。自組織映射和徑向基函數(shù)。經(jīng)過實踐證明,這些算法在實踐過程中給用戶帶來了完美的影響,具有非常高質(zhì)量的識別效果。然而,這些算法也存在這局限性,如果在其他領(lǐng)域例如對支票、統(tǒng)計報表、銀行票據(jù)等文件的識別當(dāng)中,它們的質(zhì)量和精確率就很難得到保證,難以完成識別目的。

        1 識別系統(tǒng)的構(gòu)建

        模糊聚類是目前采用率最高的一種的一種手寫體識別方法,但是在實踐過程中,也有著自己的優(yōu)勢和局限,優(yōu)勢就是它的模糊性和容錯率非常高,對識別質(zhì)量有一定的保障,但是它的劣勢也比較突出,在實踐應(yīng)用中出現(xiàn)了下列一些問題。例如,第一,在對模糊關(guān)系矩陣進(jìn)行識別的過程中,具有難確定的基本特點(diǎn)。第二,模糊聚類在識別過程中,其識別對象往往異常龐大,這就造成了在模糊關(guān)系矩陣當(dāng)中,存在的階數(shù)較高,導(dǎo)致了其識別過程選喲非常高的計算量。針對這一局限性,一般在模糊聚類的手寫體數(shù)字識別過程中,會采用BP神經(jīng)網(wǎng)絡(luò)來進(jìn)行輔助識別,它的原理是在模糊聚類識別過程中,BP神經(jīng)網(wǎng)絡(luò)協(xié)助其對特征因素也進(jìn)行篩選,有些不符合的條件被排除開外,降低了計算幅度,這就提高了計算速度,對聚類的效果和質(zhì)量有了極大的保證。之所以會取得如此明顯的變化,這是因為BP神經(jīng)網(wǎng)絡(luò)自身就有著非常高的對外界的適應(yīng)能力,在對樣本進(jìn)行篩選的練習(xí)中能夠?qū)颖具M(jìn)行分析,最終得出相應(yīng)的規(guī)律,如果識別因素具有交叉性,那么BP神經(jīng)網(wǎng)絡(luò)模式下的模糊聚類識別就具有非常高的篩選作用,其提供的數(shù)據(jù)能夠很好地指導(dǎo)以后的模糊聚類識別。一般情況下,高效率的模糊聚類都是與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行有效的聯(lián)系,其原理就是,第一步:先給出一定的數(shù)字樣本,BP網(wǎng)絡(luò)對給出的樣本進(jìn)行訓(xùn)練。第二步,模糊聚類分析方法的使用倆完成對矢量數(shù)據(jù)的歸類工作。通過這兩步,可以完成數(shù)字識別的具體工作。識別系統(tǒng)流程是先輸出樣本,再對樣本進(jìn)行預(yù)處理,BP神經(jīng)網(wǎng)絡(luò)在處理過程中提取這些樣本的特征,然后在其學(xué)習(xí)下提取標(biāo)準(zhǔn)特征完成特征篩選工作。這些標(biāo)準(zhǔn)特征完成模糊關(guān)系矩陣之后,進(jìn)行模糊聚類,最后進(jìn)行識別輸出。

        2 模糊聚類條件下的手寫體數(shù)字識別方法

        1)預(yù)處理

        由于識別方法的不同,預(yù)處理的項目和要求也會不盡相同,具有一定的差異性,在設(shè)計識別系統(tǒng)的過程中,預(yù)處理的過程一共由三部分組成,依次是二值化、歸一化、平滑。第一步,在識別之前,要對樣本的整體閾值進(jìn)行確定,因此可以采用閾值法來確定閾值,閾值法是在灰度直方圖的基礎(chǔ)上建立起來的。第二步,需要對數(shù)字或文字的尺寸進(jìn)行規(guī)定,規(guī)定的方法主要是采用外框歸一化,按照一定的比例,將數(shù)字的外界邊框縮小或者是放大,以滿足文字的規(guī)定尺寸。第三步,也就是平滑的過程,也就是對二值數(shù)字點(diǎn)進(jìn)行掃描,一般都采用三乘三的輔助矩形進(jìn)行掃描工作。平滑過程還需要做到一步工作,就是將矩陣最重型的被平滑的像素X0從“0”變成“1”,或者是從“1”變成“0”。這一工作主要是根據(jù)輔助矩陣中的像素0,1的分布來完成的。

        2)特征提取

        通過模糊聚類與BP神經(jīng)網(wǎng)絡(luò)的結(jié)合來完成特征提取,就首先需要進(jìn)行定義并提取出6種基本特征,依次為端點(diǎn)、分店、交叉點(diǎn)、直線、弧和圓。采用一定的結(jié)構(gòu)特征組合。如果規(guī)定起始點(diǎn)只有一種,那就是端點(diǎn),線段有兩種,那就是直線和弧;終點(diǎn)有三種,那就是端點(diǎn)、分點(diǎn)和交叉點(diǎn)。按照這種邏輯對線段的結(jié)構(gòu)特征進(jìn)行分析,可以發(fā)現(xiàn)結(jié)構(gòu)特征具有6各組合,以此是第一種,端點(diǎn)加直線加端點(diǎn);第二種,端點(diǎn)加弧加端點(diǎn);第三種。端點(diǎn)加直線加交叉點(diǎn);第四種是端點(diǎn)加弧加交叉點(diǎn);第五種低端點(diǎn)加直線加分點(diǎn)。第六種是端點(diǎn)節(jié)哀弧加分點(diǎn)。這時候我們需要增加一個定義,那就是V,它來對這些組合進(jìn)行表示,它包括{0,1,-1,2,-2,3,-3},當(dāng)v是零的情況下表示這個區(qū)域內(nèi)沒有圖像信息。下一步,我們把圖像分為三乘三的區(qū)域,對特征矢量進(jìn)行構(gòu)造S1,S1包含著九個不同的特征向量,他們的端點(diǎn)位置特征都具有不同性,端點(diǎn)的位置特征有這幾種情況{0,1,-1,2,-2,3,-3}。這就表示在不同的位置具有一條與其位置相似的一條曲線。直線和弧在交叉點(diǎn)的指向上具有四種不同的方向,依次是上下左右四種。

        3)BP識別器特征篩選

        BP神經(jīng)網(wǎng)絡(luò)作為一種學(xué)習(xí)算法,具有反向傳播的特性,它主要被應(yīng)用于前向多層神經(jīng)網(wǎng)絡(luò)。通過對其特征的選取的過程進(jìn)行總結(jié)會得出結(jié)論,造成這些特征的因素很可能是其中存在著一定的相互交叉現(xiàn)象。因為BP網(wǎng)絡(luò)在多層的情況之下會具有一些特點(diǎn)例如自動學(xué)習(xí)的特性、容錯性、分類能力較強(qiáng)并能夠并行處理,將它作用于對手寫體數(shù)字識別訓(xùn)練具有非常高的現(xiàn)實意義。在本文當(dāng)中,BP網(wǎng)絡(luò)一共有三層,輸入層具有十五個輸出點(diǎn),與特征矢量的十五個分量一一對應(yīng)。它的輸出層也具有十個輸出點(diǎn)。在BP網(wǎng)絡(luò)對數(shù)字樣本進(jìn)行訓(xùn)練之后,可以將學(xué)習(xí)的結(jié)果歸納入聚類源,通過公式Y(jié)=f(x)=(1-e-x)-1來對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,這個公式是輸入輸出的轉(zhuǎn)化公式,具有一定的實踐意義。另一方面,設(shè)置N是每次修正權(quán)值的步長,權(quán)值的取值要符合一定的標(biāo)準(zhǔn),必須得經(jīng)過嚴(yán)格的控制,

        當(dāng)取值太小或者取值太大都會影響結(jié)論的正確性。如果取值太大的話,在網(wǎng)絡(luò)的輸出過程中會出現(xiàn)震蕩現(xiàn)象,在最終收斂的過程中會出現(xiàn)阻礙作用。如果取值太小的化,會導(dǎo)致訓(xùn)練的時間太長,如果當(dāng)前網(wǎng)絡(luò)狀態(tài)的變化在誤差曲面的平坦區(qū)域內(nèi),可能會導(dǎo)致訓(xùn)練的時間更加長。

        4)模糊聚類分析

        模糊聚類分析主要由兩個階段組成一個是構(gòu)造模糊相似矩陣,另一個則是聚變。在構(gòu)造模糊相似矩陣過程中,設(shè)論域U={u1,u2,u3……un},其中有n個待識別的手寫體數(shù)字,這些數(shù)字每一個都有不同的向量值邊式與其一一對應(yīng),當(dāng)ui={ui1,ui2,ui3……uim}(i=1,2,3,……n)。通過對這些取值進(jìn)行標(biāo)準(zhǔn)化存放,可以得到一個矩陣,這個矩陣有n行m列。通過數(shù)量積法對矩陣標(biāo)準(zhǔn)化可以得到模糊相似矩陣R(rij)nxm,其中可以得出

        當(dāng)相似矩陣構(gòu)造完成后就是聚類,可以應(yīng)用直接聚類法,通過從模糊相似矩陣出發(fā),可以求出聚類圖。第一步,是構(gòu)建相似類,第二步是得出等價分類,第三步將所有的樣本歸為一類。

        3 結(jié)果分析

        通過對某印刷體的測試片段進(jìn)行提取,按照以上的方式來對每一個手寫體數(shù)字進(jìn)行特征提取特征向量,可以得出U={u1,u2,u3,u4,……,u115}的論域,論域中包含著一百一十五各待識別手寫體數(shù)字,這些數(shù)字中,它們每一個的特征矢量都是十五位,將這些待識別的手寫體數(shù)字作為輸入樣本,將它通過BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)之后,可以得到一個十維的輸出向量,將這些向量中的每一個數(shù)字的特征矢量進(jìn)行模糊聚類分析。如下圖所示,利用該BP神經(jīng)網(wǎng)絡(luò),我們將n的初始值設(shè)為0.15,為了達(dá)到分析識別目的,需要對初始值的值進(jìn)行不斷的調(diào)減,讓初始值逐漸變小,而調(diào)減的方法是利用退火函數(shù)n(1)=Cx(1-t/tm)、通過調(diào)減之后,可以將定勢態(tài)因子進(jìn)行調(diào)整,將其定值為0.175,BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)結(jié)束的條件是網(wǎng)絡(luò)的均方根ERMS=0.1。提供參數(shù)M=50.0,可以得出標(biāo)準(zhǔn)模式相似矩陣,通過模糊聚類之后,可以得出三十九種分類結(jié)果。當(dāng)取值為0.135時,分類效果最好。

        4 總結(jié)

        通過實驗結(jié)果,可以發(fā)現(xiàn)模糊聚類條件下的手寫體數(shù)字識別具有非常高的正確率,能夠達(dá)到百分之九十八,識誤率可以達(dá)到百分之一點(diǎn)六,拒誤率是百分之一點(diǎn)七,具有百分之九十六的可靠程度。因此,我們可以得出結(jié)論,利用模糊聚類來對手寫體數(shù)字識別結(jié)合BP神經(jīng)網(wǎng)絡(luò)能更加的增加識別的有效性,與傳統(tǒng)的統(tǒng)計識別比起來,可靠性、正確率有了明顯的提高。

        參考文獻(xiàn):

        [1] 葉佩,江濤. 基于BP特征篩選的模糊聚類手寫體數(shù)字識別[J]. 武漢理工大學(xué)學(xué)報,2007(6):128-130.

        [2] 洪沛霖,張佑生,邢燕. 基于改進(jìn)模擬退火算法的手寫體數(shù)字識別[J]. 計算機(jī)技術(shù)與發(fā)展,2007(9):15-17+20.

        [3] 柳回春,馬樹元,吳平東,等. 基于結(jié)構(gòu)特征的手寫體數(shù)字識別算法[J]. 計算機(jī)工程,2002(11):28-29.

        [4] 黃心曄,王茂祥,富煜清,等. 基于結(jié)構(gòu)分析的手寫體數(shù)字識別算法[J]. 電子工程師,1999(11):23-25.

        [5] 陳軍勝. 組合結(jié)構(gòu)特征的自由手寫體數(shù)字識別算法研究[J]. 計算機(jī)工程與應(yīng)用,2013(5):179-184+194.

        [6] 王松,蘇輝,夏紹瑋. 無約束手寫體數(shù)字識別的預(yù)處理算法[J]. 模式識別與人工智能,1997(3):243-250.

        [7] 盛積德,常勝江,陳戍,等. 用于手寫體數(shù)字識別的視覺與神經(jīng)網(wǎng)絡(luò)混合算法[J]. 光電子·激光,2001(12):1280-1283.

        [8] 李云峰,胡文平. SVM多類分類算法及其在手寫體數(shù)字識別中的應(yīng)用[J]. 物流工程與管理,2012(7):131-134.

        猜你喜歡
        模糊聚類手寫體算法
        哐當(dāng)(外一首)
        哐當(dāng)(外一首)
        淺談小學(xué)英語字母手寫體與印刷體的教學(xué)
        披著書法外衣的手寫體
        中國篆刻(2019年6期)2019-12-08 15:56:23
        基于MapReduce的改進(jìn)Eclat算法
        Travellng thg World Full—time for Rree
        進(jìn)位加法的兩種算法
        基于MATLAB回采巷道圍巖分類可視化系統(tǒng)開發(fā)及應(yīng)用
        模糊聚類在區(qū)域環(huán)境質(zhì)量評價中的運(yùn)用
        公路貨運(yùn)樞紐布局方法研究
        科技視界(2016年13期)2016-06-13 10:14:21
        亚洲精选自偷拍一区二| 亚洲一区二区三区av无码| av色综合久久天堂av色综合在| 看黄a大片日本真人视频直播| 亚洲精品第一国产综合亚av| 日产精品久久久久久久性色| a级黑人大硬长爽猛出猛进| 国产在线不卡AV观看| 国产精品每日更新在线观看| 美女一区二区三区在线观看视频| 一区二区三区日韩蜜桃| 无码国产精成人午夜视频一区二区 | av国产自拍在线观看| 成年网站在线91九色| 999精品无码a片在线1级| 无码人妻一区二区三区在线视频| Y111111国产精品久久久| AV在线中出| 日本最新在线一区二区| 国产一区二区三区日韩在线观看| 亚洲自偷自拍另类第1页| 国产成人无码a区在线观看视频 | 午夜视频一区二区三区在线观看| 亚洲国产精品一区二区成人片国内| 无码国产精品久久一区免费| 国产午夜精品久久久久免费视| 国产亚洲欧美日韩国产片| 国产黄色污一区二区三区| 一本色道久久亚洲精品| 粗大的内捧猛烈进出小视频| 欧美人与动人物姣配xxxx| 国产91第一页| 亚洲av一二三四又爽又色又色| 青青草视频在线观看精品在线 | 成人区人妻精品一区二区不卡网站| 五十路熟妇亲子交尾| 在线播放中文字幕一区二区三区| 国产丝袜美腿嫩模视频诱惑| 亚洲av无码专区国产乱码4se| 无码视频在线观看| 黑人大荫道bbwbbb高潮潮喷|