亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        光學(xué)符號識別

        2020-07-04 18:24:19任昭孫海冰彭淑芹
        科學(xué)與財(cái)富 2020年14期

        任昭 孫海冰 彭淑芹

        摘 要: 本文針對光學(xué)符號識別問題,對數(shù)據(jù)進(jìn)性分類統(tǒng)計(jì)處理,建立歐幾里得相似度模型,ROC模型評判法對模型進(jìn)行檢驗(yàn),同一坐標(biāo)對應(yīng)若干個字符,所以考慮坐標(biāo)所對應(yīng)的數(shù)字是坐標(biāo)域,分析不同位置統(tǒng)一字母的數(shù)據(jù)存在可能性差異,同一字符在同一位置區(qū)域的數(shù)據(jù)具有較高的相似性,篩選同一區(qū)域的若干字符,再通過其余特征屬性建立模型可以識別相關(guān)字符。接著觀察待測字符的數(shù)字信息中的位置信息,找到與待測字符相同的位置區(qū)域,建立歐幾里得相似度模型,將篩選出的屬性與待測字符的相應(yīng)屬性的數(shù)據(jù)通過歐幾里得相似度計(jì)算公式進(jìn)行計(jì)算,得到多組歐幾里得距離(距離越小,相似度越高),選擇不同的閾值,計(jì)算低于閾值的字符頻數(shù),最終選擇頻數(shù)最大的字符作為識別結(jié)果。

        關(guān)鍵詞:歐幾里得距離 ;相似度;ROC模型誤差檢驗(yàn)

        [abstract]Problem based on optical character recognition, the data into classification statistical processing, Euclidean similarity model is set up, the ROC model test evaluation method on the model, the same coordinates corresponding to several characters, so consider the coordinates of the figures are coordinates domain, analysis unified data possible differences, different position data of the same characters in the same location area has high similarity, screening of several of the characters of the same area again through the rest of the attributes set up model can identify the related characters. Then watch for the character of digital information, location information in finding and characters of the same location area under test, Euclidean similarity model is set up, will select attributes and characters of the corresponding property of the under test data by Euclidean similarity calculation formula to calculate, get more groups of Euclidean distance (the smaller the distance, the higher the similarity), choose a different threshold, the calculation of characters is lower than the threshold frequency, frequency of maximum character is chosen as the final recognition result.

        [Key words]:? euclidean distance? similarity? ROC model error test

        一、問題分析及模型建立

        1.1 問題分析

        通過分析字符的特征屬性知,字符所在矩形區(qū)域的水平豎直位置和高寬度是描述字符所在位置和大小的,其余則是表述字符本身具體形狀的特征屬性,用于識別字符。將屬性分為兩類,位置屬性和特征屬性。

        觀察每一個字母的若干數(shù)據(jù),再按照水平位置和豎直位置分類,發(fā)現(xiàn)同一類字符在不同位置區(qū)域的偽屬性值存在可能性差異,同一類字符在同一未知區(qū)域的偽屬性值具有高度相似性;在檢測字符時(shí),可以考慮先從位置坐標(biāo)出發(fā),先尋找坐標(biāo)相同或者相近的區(qū)域,再進(jìn)行識別。

        1.2對屬性進(jìn)行分類

        字符所在矩形區(qū)域的水平位置和豎直位置與其矩形區(qū)域的高度和寬度是確定字符所在位置和大小的屬性。矩形區(qū)域的黑色像素?cái)?shù)等屬性表示字符本身的具體形狀,用于識別字符。

        表示字符所在矩形位置大小的特征屬性有四個,表示字符矩形區(qū)域的特征屬性的有12個。相關(guān)數(shù)據(jù)表面發(fā)現(xiàn)這些數(shù)據(jù)都具有幾乎相同的屬性域________________。

        字符的特征屬性:

        i.從識別字符本身形狀出發(fā),考慮后面12個屬性區(qū)域,求出每個字符的不同屬性在每個屬性值區(qū)域(0-15之間)的頻數(shù),通過計(jì)算每一幅圖偽屬性值的極差,判斷波動差別比較大的屬性。本文還選擇提取每一個字母的平均偽屬性值,繪制平均偽屬性值圖像,觀察不同字符平均偽屬性值的走勢也具有一定辨識度,兩種方法結(jié)合選擇出最具有辨識度的屬性。

        ii.計(jì)算出12幅圖的極差(12個極差),在第一種方式中選擇極差大的前10個屬性,作為暫時(shí)確定的恰當(dāng)?shù)奶卣?。再?jì)算第二種方法的12幅圖的極差(12個極差),選擇前10個極差大的屬性,作為第二種方法暫時(shí)的恰當(dāng)特征屬性。

        1.3 模型建立

        1.3.1 基本思路

        對于識別字符而言,首先進(jìn)行數(shù)據(jù)預(yù)處理,然后對圖片進(jìn)行分割。對圖像數(shù)據(jù)進(jìn)行訓(xùn)練和識別,本文選取每個區(qū)域內(nèi)任意70%的數(shù)據(jù)進(jìn)行識別字符,剩余30%數(shù)據(jù)進(jìn)行檢驗(yàn)。

        1.3.2歐幾里得相似度距離公式

        其中一個區(qū)域?yàn)槔幼鼋忉屨f明,假設(shè)選擇剩下百分之三十的數(shù)據(jù)的其中一個數(shù)據(jù),先觀察該數(shù)據(jù)的位置信息,提取同區(qū)域字符,在進(jìn)行相似度計(jì)算,在同區(qū)域中尋找最好的相似度對應(yīng)的字符作為最終識別字符。

        二、結(jié)果及結(jié)果分析

        ii. 將計(jì)算出來的所有數(shù)值進(jìn)行比較,在小于該閾值的范圍中頻數(shù)最多的字母,得到的字母即為識別結(jié)果。計(jì)算得到的預(yù)測正確率為92.3%。

        三、模型的改進(jìn)與推廣

        3.1 模型評價(jià)

        3.1.1 模型的優(yōu)點(diǎn)

        1、先將圖像進(jìn)行分區(qū),計(jì)算不同特征屬性的不同字母的最大頻數(shù)下的為屬性值和平均偽屬性值,使得模型的可視化界面形象逼真。

        2、歐幾里得算法計(jì)算方便,分區(qū)后結(jié)合實(shí)際分析,使得模型更貼近實(shí)際,通用性好,推廣性強(qiáng)。

        3、篩選出的70%的訓(xùn)練數(shù)據(jù)和30%檢驗(yàn)數(shù)具有隨機(jī)性,可以較好反映數(shù)據(jù)信息。

        3.1.2 模型的缺點(diǎn)

        1、影響精確度的因素較多,不能全面考慮,結(jié)果與實(shí)際有一定偏差。

        2、光學(xué)數(shù)據(jù)集在收集過程中由于其他未考慮因素導(dǎo)致識別準(zhǔn)確,例如,儀器誤差,環(huán)境因素等,結(jié)果又偏差。

        3.2 模型優(yōu)化

        對每個屬性根據(jù)其重要性賦予權(quán)重,加權(quán)之后的歐幾里得距離可以表示為:

        對于識別字符,各個屬性對精確度的影響程度可用層次分析法和熵權(quán)法進(jìn)行量化,算出的歐幾里得距離更具有實(shí)際意義,能夠反映各個變量在數(shù)據(jù)中的不同作用,從而使模型到達(dá)優(yōu)化的目的。

        參考文獻(xiàn):

        [1] 盧暢暢,寧少文,唐德昌.光學(xué)字符識別技術(shù)(OCR)的研究于應(yīng)用[J].中國戰(zhàn)略新興產(chǎn)業(yè),2018(28):1-3.

        [2] 肖堅(jiān).基于學(xué)習(xí)的OCR字符識別[J].計(jì)算機(jī)時(shí)代,2018(07):48-51.

        [3] 田學(xué)東. 光學(xué)公式識別技術(shù)研究[D].河北大學(xué),2007.

        激情第一区仑乱| 男女动态91白浆视频| 五月激情综合婷婷六月久久| 精品无码国产一区二区三区av | 亚洲精品区二区三区蜜桃| 国产不卡在线播放一区二区三区| 久久亚洲av无码精品色午夜 | 国产精品成人久久一区二区| 伊人久久大香线蕉av色婷婷色| 波多野42部无码喷潮在线| 国产精品久久久久久麻豆一区| 亚洲AV无码一区二区水蜜桃| 精品高清一区二区三区人妖| 国产精品久久久久9999| 蜜桃av噜噜一区二区三区| 无码国产日韩精品一区二区| 久久国产精品免费专区| 亚洲 欧美 国产 制服 动漫| 夜夜揉揉日日人人| 中文字幕日韩人妻高清在线| 日本九州不卡久久精品一区 | 蜜桃tv在线免费观看| 国产人妖直男在线视频| 天天做天天爱夜夜夜爽毛片 | 在线中文字幕乱码英文字幕正常 | 亚洲一区二区女搞男| 99精品国产综合久久久久五月天| 午夜国产精品久久久久| 一区视频免费观看播放| 真实国产精品vr专区| 无码国产亚洲日韩国精品视频一区二区三区| 亚洲综合网一区二区三区| 邻居美少妇张开腿让我爽了一夜| 国产女人高潮叫床免费视频| 波多野结衣在线播放一区| 亚洲成生人免费av毛片| 精品国产精品三级精品av网址| 欧洲熟妇色xxxx欧美老妇多毛网站| 中文亚洲成a人片在线观看| 在线视频色系中文字幕| 一边吃奶一边摸做爽视频|