亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        手寫體數(shù)字的K-最近鄰法識別研究

        2018-12-27 11:35:58黃金海
        無線互聯(lián)科技 2018年20期
        關(guān)鍵詞:手寫體正確率準確率

        黃金海

        (桂林電子科技大學(xué) 信息科技學(xué)院,廣西 桂林 541004)

        在模式識別領(lǐng)域,對手寫體數(shù)字的識別,是許多從事圖像處理、機器學(xué)習(xí)研究人員的入門練習(xí)。其實現(xiàn)方法已經(jīng)有許多成功的案例,王一木等[1]提出自組織映射簡化算法在硬件電路上以并行運算實現(xiàn)的手寫數(shù)字識別。邵虹等[2]提出基于投影定位及數(shù)字結(jié)構(gòu)特征的方法識別發(fā)票印刷體數(shù)字。幸堅炬等[3]提出概率神經(jīng)網(wǎng)絡(luò)實現(xiàn)mnist數(shù)據(jù)集數(shù)字的識別,并有較高的準確率。李瓊等[4]提出在特征空間中確定SVM最優(yōu)核方法實現(xiàn)手寫數(shù)字的識別。以上實現(xiàn)方法都采用不同的算法實現(xiàn),本文以成功識別手寫數(shù)字為出發(fā)點,提出在pyqt5環(huán)境中以K-最近鄰(K-Nearest Neighbor,KNN)分類器算法實現(xiàn)手寫體數(shù)字的識別。

        1 KNN算法原理

        在機器學(xué)習(xí)分類方法中,KNN是無監(jiān)督學(xué)習(xí)中最簡單、易理解的分類算法。該思想是Cover和Hart在1968年的研究工作中提出的,它根據(jù)距離函數(shù)計算待分類樣本X和每個訓(xùn)練樣本間的距離(作為相似度),選擇與待分類樣本距離最小的K個樣本作為X的K個最近鄰,最后以X的K個最近鄰中的大多數(shù)樣本所屬的類別作為X的類別[5]。

        KNN算法大致包括如下3個步驟。

        (1)算距離:給定測試對象,計算它與訓(xùn)練集中的每個對象的距離。

        (2)找鄰居:圈定距離最近的K個訓(xùn)練對象,作為測試對象的近鄰。

        (3)做分類:根據(jù)這K個近鄰歸屬的主要類別,來對測試對象分類。

        因此,最為關(guān)鍵的就是距離的計算。一般而言,定義一個距離函數(shù)d(x,y),需要滿足以下幾個準則。

        d(x,y)=0

        d(x,y)≥0

        d(x,y)=d(y,x)

        d(x,k)+d(k,y)≥d(x,y)

        距離計算有很多方法,本文以歐幾里得距離(Euclidean distance)實現(xiàn)手寫體數(shù)字的識別。其計算公式如下:

        2 手寫體數(shù)字圖像識別流程

        手寫數(shù)字的原始圖像,可以有多種獲取方法,本文以畫圖面板寫出任意0~9的數(shù)字,并按順序以jpg格式命名數(shù)字圖像作為手寫體數(shù)字的初始樣本圖像。圖1中列舉了每個數(shù)字的兩種手寫體樣本。

        當(dāng)讀入數(shù)字樣本圖片時,首先對數(shù)字樣本進行圖像預(yù)處理,預(yù)處理過程包括將圖片灰度化、縮放為與訓(xùn)練集同等尺寸大小32×32格式、將32×32圖片二值化并保存為txt文件。接著K值取3對新保存的txt樣本訓(xùn)練;訓(xùn)練完成后根據(jù)KNN多數(shù)分類法則識別顯示。流程如圖2所示。

        圖2 識別流程

        3 數(shù)據(jù)處理

        樣本的數(shù)據(jù)處理包含數(shù)字的訓(xùn)練和識別兩部分。數(shù)字的訓(xùn)練集和測試集分別是常用的trainingDigits和testDigits。由于數(shù)據(jù)集是已經(jīng)二值化的txt文本格式,需要將32×32的測試集與訓(xùn)練集分別轉(zhuǎn)換為1×1 024的一維向量,把測試集中每一個樣本分別與訓(xùn)練中每個樣本進行歐幾里得距離計算,計算結(jié)果按KNN原理分類提取各個樣本標簽,分別完成預(yù)測數(shù)字和真實數(shù)字的比較。當(dāng)K值分別取3,5,7,9時,其運算的正確率如表1所示。

        表1 不同K值正確率

        從表1中可知,當(dāng)K取3時,正確率最高,達到98.99%。K取取值越大,正確率均略有下降。

        4 測試分析

        經(jīng)過上述數(shù)據(jù)處理分析,測試集與訓(xùn)練集的比較結(jié)果有高達97%以上的正確率,那么輸入前文所述的20個測試樣本,以pyqt5作為顯示界面,與訓(xùn)練集中的所有樣本進行KNN運算,其測試結(jié)果如圖3所示。

        圖3 KNN手寫體數(shù)字測試圖

        由圖3可知,手寫體數(shù)字的KNN算法識別準確率與測試集的準確率有較大差距,20個樣本中15個正確,錯誤率高達25%。這表明,KNN算法在手寫體數(shù)字識別中的應(yīng)用研究仍有待提高。

        5 結(jié)語

        手寫體數(shù)字的KNN算法執(zhí)行效率并不高,識別準確率的提高需要更多訓(xùn)練樣本集,如mnist數(shù)據(jù)集。但是,數(shù)據(jù)樣本集越多,運算的時間就會越長,其效率也會越低。工程應(yīng)用中人們都希望識別能力既高效準確率又高,技術(shù)人員可以嘗試其他算法模型來完善識別效果。

        猜你喜歡
        手寫體正確率準確率
        哐當(dāng)(外一首)
        哐當(dāng)(外一首)
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
        2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
        門診分診服務(wù)態(tài)度與正確率對護患關(guān)系的影響
        基于大數(shù)據(jù)下的手寫體識別的設(shè)計與研發(fā)
        披著書法外衣的手寫體
        中國篆刻(2019年6期)2019-12-08 15:56:23
        高速公路車牌識別標識站準確率驗證法
        生意
        国产大全一区二区三区| 一区视频免费观看播放| 不打码在线观看一区二区三区视频 | 二区久久国产乱子伦免费精品| 加勒比特在线视频播放| 美女黄频视频免费国产大全 | 亚洲av福利院在线观看| 国产精品久久久久影院| 国产精品主播视频| av网站在线观看二区| 男女视频在线观看一区| 国语精品一区二区三区| 好紧好爽免费午夜视频| 国产精品福利视频一区| а的天堂网最新版在线| 日本老熟妇五十路一区二区三区 | 欧美三级一区| 国产人妖在线免费观看| 黄片视频免费观看蜜桃| 麻豆果冻传媒在线观看| 亚洲自拍愉拍| 国产丝袜长腿在线看片网站| 成人精品一区二区三区电影| 97免费人妻在线视频| 国产激情一区二区三区在线蜜臀 | 亚洲一区二区日韩精品在线| 国产aⅴ无码专区亚洲av麻豆| 高清国产日韩欧美| 一级a免费高清免在线| 国产成人无码a区在线观看导航| 日日躁夜夜躁狠狠久久av| 国产精品不卡无码AV在线播放 | 亚洲综合网国产精品一区| 97成人碰碰久久人人超级碰oo| 在线av野外国语对白| av在线不卡免费中文网| 亚洲性无码一区二区三区| 日韩高清毛片| 国产精品高清免费在线| 含紧一点h边做边走动免费视频 | 一区二区三区手机看片日本韩国|