亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于客觀聚類的手寫數(shù)字識(shí)別方法

        2019-09-23 07:12:18胡超芳
        關(guān)鍵詞:偶極子手寫子集

        王 娜,胡超芳

        (1 a.天津工業(yè)大學(xué)電氣工程與自動(dòng)化學(xué)院自動(dòng)化系;b.天津市電工電能新技術(shù)重點(diǎn)實(shí)驗(yàn)室,天津 300387;2 a.天津大學(xué)微光機(jī)電系統(tǒng)技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室;b.電氣自動(dòng)化與信息工程學(xué)院自動(dòng)化系,天津 300072)

        0 引言

        作為數(shù)據(jù)驅(qū)動(dòng)工具之一,聚類是一種處理高維特征數(shù)據(jù)的有效手段,且基于劃分的聚類算法已廣泛應(yīng)用于手寫數(shù)字的識(shí)別[7]。但傳統(tǒng)的劃分聚類的初始聚類個(gè)數(shù)和聚類中心先驗(yàn)未知,需要經(jīng)驗(yàn)或試湊確定,具有較多主觀性;且聚類過程易受噪聲或者數(shù)據(jù)分布影響,降低結(jié)果的準(zhǔn)確性[8]。為此,引入一種新的基于客觀聚類的手寫數(shù)字識(shí)別方法——客觀聚類分析方法[9],它具有對(duì)數(shù)據(jù)中噪聲和不規(guī)則形狀的魯棒性,可以確保上述聚類結(jié)果的準(zhǔn)確性,且通過對(duì)模板數(shù)據(jù)集的一次聚類,獲得代表性聚類個(gè)數(shù)和聚類中心,用來代替模板集識(shí)別分類,不僅避免了傳統(tǒng)模板匹配法需要將待識(shí)別數(shù)據(jù)與模板數(shù)據(jù)集逐個(gè)比較的繁瑣過程,而且約簡(jiǎn)了模板集、降低了計(jì)算量。通過對(duì)隨機(jī)手寫的數(shù)字在變形和添加噪聲等情況下的識(shí)別,并與其他手寫數(shù)字識(shí)別方法如Hopfield神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和粗糙集等,以及傳統(tǒng)模板匹配法相比較,驗(yàn)證了本方法的有效性[5]。

        1 手寫數(shù)字識(shí)別問題描述

        手寫體數(shù)字識(shí)別一般包括圖像預(yù)處理、特征提取、分類這3個(gè)步驟,其基本原理如圖1所示。

        如圖1所示,其中預(yù)處理去除數(shù)字圖像的噪聲,并灰度化處理讀入圖像;采用降維方法提取數(shù)字圖像的結(jié)構(gòu)和統(tǒng)計(jì)特征,相比結(jié)構(gòu)特征,統(tǒng)計(jì)特征對(duì)噪聲不敏感,具有較好的穩(wěn)定性,故可用于噪聲較多的任意手寫數(shù)字識(shí)別中。為此,本文采用一種統(tǒng)計(jì)特征法—5×5模板提取特征法[5]來對(duì)任意輸入的手寫體數(shù)字進(jìn)行模板集的構(gòu)造和輸入數(shù)字特征向量的提取。其步驟如下:

        1)找到每個(gè)手寫樣本的起始位置,在此附近搜索該樣本的寬度和高度,將每個(gè)樣本的長(zhǎng)度和寬度5等分,構(gòu)成5×5的均勻小區(qū)域,如圖2所示。

        2)對(duì)每一小區(qū)域內(nèi)的黑像素個(gè)數(shù)進(jìn)行統(tǒng)計(jì),除以該小區(qū)域的面積總數(shù),即得特征值,如圖3所示。

        圖1 手寫數(shù)字識(shí)別的基本步驟Fig.1 Basic steps of handwriting digital recognition

        圖2 對(duì)樣本分成5×5區(qū)域Fig.2 Dividing the handwriting digital into a five times five area

        圖3 5×5模板特征值示意圖Fig.3 Diagram of eigenvalue for the template of five times five

        2 基于客觀聚類的手寫數(shù)字識(shí)別

        采用模板匹配法進(jìn)行數(shù)字識(shí)別時(shí),首先,模板樣本集中可能包含冗余的噪聲數(shù)據(jù),導(dǎo)致樣本集整體數(shù)據(jù)的準(zhǔn)確度下降,從而影響分類結(jié)果;其次,模板數(shù)據(jù)的維數(shù)較高且個(gè)數(shù)較多時(shí),每個(gè)模板數(shù)據(jù)都要與待識(shí)別的樣本進(jìn)行一次距離測(cè)度的計(jì)算,計(jì)算量極其龐大,也帶來識(shí)別效率的降低。為此,引入客觀聚類分析方法來克服原始數(shù)據(jù)集中噪聲數(shù)據(jù)的影響,提高分類精度,并選出代表性數(shù)據(jù)來約簡(jiǎn)模板數(shù)據(jù)集,降低計(jì)算量。

        2.1 客觀聚類分析

        客觀聚類分析方法分為兩個(gè)階段:偶極子劃分和凝聚層次聚類。偶極子劃分為后續(xù)的凝聚層次聚類提供初始聚類對(duì)象;此外原始數(shù)據(jù)集被偶極子劃分為相似分布的子集,在子集上進(jìn)行凝聚層次聚類,并將距離聚類中心遠(yuǎn)的數(shù)據(jù),一般為噪聲和邊界點(diǎn)放置到最后聚類,從而能夠有效降低其對(duì)最終聚類結(jié)果準(zhǔn)確度的影響。凝聚層次聚類的聚類對(duì)象為偶極子劃分的4個(gè)子集,并利用改進(jìn)一致性準(zhǔn)則來評(píng)判不同子集之間聚類結(jié)果的一致性,并選擇一致性程度最高的聚類結(jié)果作為最終結(jié)果。

        2.1.1 偶極子劃分

        偶極子劃分過程分為初始子集生成、相似度排序、訓(xùn)練和測(cè)試子集生成[9]。

        1)初始子集生成

        2)相似度排序

        對(duì)O中的元素,按照偶極子值由小到大依次排列,形成新的偶極子集On。

        3)訓(xùn)練子集和測(cè)試子集生成

        從On中取出前N/2個(gè)包含不重復(fù)樣本的偶極子,將每個(gè)偶極子中距離數(shù)據(jù)集中點(diǎn)zr近的元素構(gòu)成訓(xùn)練子集ZA={zA1,…,zAN/2},其中每個(gè)元素按照距離遠(yuǎn)近排列。同理對(duì)每個(gè)偶極子中距離zr遠(yuǎn)的元素,得到訓(xùn)練子集ZB={zB1,…,zBN/2}。最后,從On中剩余的偶極子中再取出前N/2個(gè)包含不重復(fù)樣本的偶極子,形成測(cè)試子集Zc和ZD。

        由上述偶極子劃分機(jī)制可知,其根據(jù)選定的參考聚類中心將原始數(shù)據(jù)集劃分為不同的數(shù)據(jù)子集,在劃分過程中按照偶極子對(duì)之間的相似性進(jìn)行排序,使得在后續(xù)的凝聚層次聚類中,距離參考中心最遠(yuǎn)的偶極子對(duì),大多為噪聲數(shù)據(jù)點(diǎn)最后進(jìn)行聚類中心的合并,而距離聚類中心最近的偶極子對(duì)最先進(jìn)行聚類,從而有效降低了這些噪聲點(diǎn)對(duì)聚類過程的影響,確保了聚類結(jié)果的準(zhǔn)確性。

        2.1.2 凝聚層次聚類

        偶極子劃分后,分別在子集A、B及C、D上進(jìn)行凝聚層次聚類,選擇相對(duì)不相似性測(cè)度作為每次聚類時(shí)聚類合并相似性程度的評(píng)判。相對(duì)不相似性測(cè)度定義為[10]

        (1)

        (2)

        本文采用改進(jìn)一致性準(zhǔn)則克服噪聲和分布的影響,提高聚類結(jié)果的魯棒性,改進(jìn)一致性準(zhǔn)則定義為

        (3)

        最后,將指標(biāo)BLnewAB和BLnewCD比較,由最低值確定最終聚類數(shù)和聚類中心,其中BLnewAB和BLnewCD分別由子集A、B和C、D按照式(3)得到。

        由上述偶極子劃分和凝聚層次聚類的步驟描述可知,偶極子分類初始劃分了數(shù)據(jù)子集,并利用相似性排序法將噪聲點(diǎn)和邊界點(diǎn)對(duì)后續(xù)凝聚層次聚類的影響降低,從而為凝聚層次聚類提供了準(zhǔn)確的初始聚類結(jié)果;而凝聚層次聚類利用改進(jìn)一致性準(zhǔn)則評(píng)判不同子集之間聚類結(jié)果的一致性,避免了單一聚類過程易受數(shù)據(jù)分布影響而導(dǎo)致聚類結(jié)果準(zhǔn)確度下降的問題,提高了聚類結(jié)果選擇的客觀性,進(jìn)而增強(qiáng)了聚類結(jié)果的精確性。

        2.2 手寫數(shù)字識(shí)別算法步驟描述

        3 仿真研究

        首先,獲得數(shù)字0的模板庫Z0,其表達(dá)式為130×25維矩陣:

        (4)

        圖4 偶極子劃分后的訓(xùn)練子集和測(cè)試子集the dipole partitioning

        給定聚類數(shù)c∈{2,…,64},利用相對(duì)不相似性測(cè)度進(jìn)行聚類的合并,在聚類數(shù)為3時(shí)得到最小一致性準(zhǔn)則值0.048,其對(duì)應(yīng)聚類中心為

        (5)

        并取該聚類中心CenterAB0作為數(shù)字0模板樣本集的代表,其由3個(gè)1×25維行向量組成,有效實(shí)現(xiàn)對(duì)訓(xùn)練子集A、B的約簡(jiǎn)。同理獲得數(shù)字1,2,…,9的模板樣本集聚類中心,分別為CenterAB1,…,CenterAB9:

        (6)

        (7)

        (8)

        (9)

        (10)

        (11)

        (12)

        (13)

        (14)

        在手寫數(shù)字輸入軟件的模板中在線輸入數(shù)字0如下:

        圖5 數(shù)字0的手寫在線輸入示意圖Fig.5 Online input diagram for the handwriting digital zero

        圖6 數(shù)字0變形后的手寫在線輸入示意圖Fig.6 Online-input diagram for the distortion of handwriting digital zero

        (15)

        由式(15)可見,在線輸入數(shù)字0與已知模板集中數(shù)字0的距離最近,為0.303,故應(yīng)把其歸為0類。

        (16)

        圖7 數(shù)字0變形后的手寫輸入示意圖Fig.7 Online-input diagram for the distortion of handwriting digital zero

        (17)

        (18)

        表1 隨機(jī)手寫數(shù)字0輸入下本方法與其他數(shù)據(jù)驅(qū)動(dòng)方法比較

        在手寫數(shù)字分類軟件模板[5]中隨機(jī)輸入29個(gè)數(shù)字0,本方法與其他數(shù)據(jù)驅(qū)動(dòng)及模板匹配法比較如表1和表2所示。由表1和表2可見,對(duì)于任意輸入的手寫數(shù)字0,模板匹配法比其他數(shù)據(jù)驅(qū)動(dòng)方法具有更高的識(shí)別精度。在其他數(shù)據(jù)驅(qū)動(dòng)方法中,精度最低的是勢(shì)函數(shù)法,為24.14%,最高的是Bayes匹配法,為69%。其他模板匹配法中精度最低的是基于類中心的歐幾里德距離法,為72.41%;最高的是使用PCA的最近鄰模板匹配法,為96.55%,而上述本方法識(shí)別精度為100%,說明本方法具有對(duì)變形及含噪聲數(shù)據(jù)更強(qiáng)的魯棒性,并且避免了支持向量機(jī)、Hopfiled神經(jīng)網(wǎng)絡(luò)等需要參數(shù)的初始設(shè)置和調(diào)節(jié)的過程,也避免了PCA最近鄰模板匹配和夾角余弦距離法的PCA降維步驟,計(jì)算簡(jiǎn)單,易于實(shí)現(xiàn),識(shí)別精度更高;另外本方法采用客觀聚類分析對(duì)模板集聚類,利用聚類中心代表原始模板集,大大降低了計(jì)算量,提高了在線識(shí)別的效率。

        同理依次隨機(jī)輸入9個(gè)手寫數(shù)字1,圖像如圖8所示。

        表2 隨機(jī)手寫數(shù)字0輸入下本方法與其他模板匹配法比較

        圖8 按順序1-9依次輸入隨機(jī)手寫數(shù)字1示意圖Fig.8 Diagram of inputting the random handwriting digital one in turn in the order of one to nine

        本方法與其他方法比較如表3和表4所示[5]。由表3和表4可見,本方法與其他數(shù)據(jù)驅(qū)動(dòng)和模板匹配法相比,仍具有更高的識(shí)別精度,簡(jiǎn)單易行。

        表3 隨機(jī)手寫數(shù)字1輸入下本方法與其他數(shù)據(jù)驅(qū)動(dòng)方法比較

        表4 隨機(jī)手寫數(shù)字1輸入下本方法與其他模板匹配法比較

        此外,通過每個(gè)數(shù)字均隨機(jī)輸入30個(gè)樣本,對(duì)于其他手寫輸入數(shù)字2,3,…,9,本方法與其他方法的識(shí)別精度比較如表5所示。

        表5 隨機(jī)手寫數(shù)字2-9輸入下本方法與其他模板匹配法比較

        由表5可見,本方法與其他模板匹配法相比,除對(duì)數(shù)字9的識(shí)別精度略低,為30%外,對(duì)其他數(shù)字2~8的識(shí)別精度均為最高,最高為100%,說明本方法具有較高的識(shí)別精度。并且,本方法采用模板集的聚類中心代表整個(gè)模板集,避免了傳統(tǒng)的最近鄰模板匹配法需要將待識(shí)別樣本與模板集反復(fù)比較導(dǎo)致的繁瑣計(jì)算量,提高了算法的計(jì)算效率。

        4 結(jié)論

        本文將客觀聚類分析與模板匹配法相結(jié)合,提出了一種新的手寫數(shù)字識(shí)別方法。該方法在無數(shù)據(jù)先驗(yàn)知識(shí)下,通過啟發(fā)式自組織產(chǎn)生聚類,并利用聚類中心代替原始模板集,一方面具有對(duì)數(shù)據(jù)分布和噪聲的較強(qiáng)魯棒性,從而提高了識(shí)別精度;另一方面也約簡(jiǎn)了原始模板集,降低了計(jì)算的復(fù)雜性,提高了識(shí)別效率,對(duì)隨機(jī)手寫輸入數(shù)字0-9在變形和加入噪聲等情況下的識(shí)別結(jié)果驗(yàn)證了所提方法的有效性。

        猜你喜歡
        偶極子手寫子集
        手寫比敲鍵盤更有助于學(xué)習(xí)和記憶
        由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
        我手寫我心
        拓?fù)淇臻g中緊致子集的性質(zhì)研究
        基于DDS的正交偶極子聲波測(cè)井儀快檢裝置研究
        化工管理(2021年7期)2021-05-13 00:46:12
        抓住身邊事吾手寫吾心
        關(guān)于奇數(shù)階二元子集的分離序列
        弧形寬帶印刷偶極子5G天線的設(shè)計(jì)
        基于集成學(xué)習(xí)的MINIST手寫數(shù)字識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:08
        每一次愛情都只是愛情的子集
        都市麗人(2015年4期)2015-03-20 13:33:22
        精品一区二区av天堂色偷偷| 午夜无码亚| 天堂av一区二区在线| 一本一道久久精品综合| 日产亚洲一区二区三区| 91久久精品国产91久久| 男女后进式猛烈xx00动态图片 | 97国产精品麻豆性色| 日本久久久免费观看视频| 中国少妇内射xxxx狠干| 99在线播放视频| 亚洲综合一区二区三区蜜臀av| 美女人妻中出日本人妻| 亚洲精品无人区| 99国产小视频| 国产精品久久婷婷六月| 亚洲精品久久国产精品| 国产av精国产传媒| 亚洲午夜看片无码| 白白色最新福利视频二| 天堂中文官网在线| 亚洲人成7777影视在线观看| 亚洲妇女av一区二区| 亚洲美女av一区二区在线| 野外少妇愉情中文字幕| 国产在线不卡免费播放| 国产一级黄色片一区二区| 中文字幕精品一区二区精品| 精品一品国产午夜福利视频| 蜜桃一区二区三区自拍视频| 亚洲一区二区免费在线观看视频| 桃花影院理论片在线| 欧美伊人亚洲伊人色综| 亚洲成人av在线播放不卡| 久久久久人妻精品一区三寸| 一个人看的www免费视频中文| 国产精品亚洲一区二区三区正片| 白白白在线视频免费播放| 99久久国产福利自产拍| 麻豆国产成人AV网| gg55gg国产成人影院|