亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        對維吾爾語手寫體在線計算機(jī)識別技術(shù)的幾點探討

        2017-03-27 13:56:46阿衣蘇魯·依拉洪
        電腦知識與技術(shù) 2017年3期
        關(guān)鍵詞:手寫體維吾爾語探討

        阿衣蘇魯·依拉洪

        摘要:維吾爾語是以單詞為基礎(chǔ)的黏連語,字母由于在單詞中的作用相異而有不同的書寫規(guī)則。當(dāng)前手寫技術(shù)的進(jìn)步依然滯后于漢文、英文等。筆者在解析維吾爾語構(gòu)造、組詞特征與錄入行為等的前提下,歸納了黏連語對手寫輸入識別的作用,并且討論了維吾爾語手寫識別體系與有關(guān)重要技術(shù),通過對這部分技術(shù)的闡述,筆者期待在解析、證實的前提下,讓維吾爾語手寫體為大眾所熟知。

        關(guān)鍵詞:維吾爾語;手寫體;電腦;識別技術(shù);探討

        中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)03-0166-02

        維吾爾語手寫體網(wǎng)上電腦識別技術(shù)是自動化的,電腦自動把待識別模式納入到識別工作中。模式識別在字符辨認(rèn)、指紋辨別、神態(tài)辨別、話語辨別等領(lǐng)域已經(jīng)開始普及使用。而書面識別也是模式識別的其中一種。伴隨電腦科技的日新月異,數(shù)字圖像處置與解析也已經(jīng)滲透到了科技行業(yè)。[1]漢字識別通過超過20年的發(fā)展,獲得了令人矚目的成就,完成了對各類文本圖片的漢文自動識別,這類研究成績已經(jīng)受到了世界范圍的關(guān)注。而維吾爾語的識別工作才起步而已。

        1 維吾爾語特征簡介

        維吾爾語是我國56個民族的民族語言的其中一種,維吾爾語包含32個字母,當(dāng)中包括8個元音、24個輔音,通常能夠?qū)懗?28個種類的詞語;每一個字母根據(jù)存在的位置的差別能夠劃定為后連形式、前后連模式、前連模式、獨(dú)立模式等四類,維吾爾語單詞是一類粘連性字符,由這部分字符組成連體段,字母互為聯(lián)系的水平線被稱為基線。此外,一部分維吾爾語字母主體一樣,用上下附加題的方位來區(qū)別字符。[2]

        2 維吾爾語手寫體辨別的特點

        維吾爾語是由單詞構(gòu)成的,和阿拉伯文相近,寫作模式是由右至左,字母粘連。當(dāng)前,對維吾爾語的手寫識別存在兩類解讀辦法。其一,直觀地對整個單詞實施整詞識別,這類模式的優(yōu)勢較為明顯,然而必須累積大批的單詞;其二,先完成單詞的切分,在對切分后的單獨(dú)字符實施識別。[3]

        維吾爾語包含32個字母,其是:

        并且,每一個字母存在多類模式:

        1) 分成四類模式的一共有24個字母:

        例如:都表述的是同一個字母,一共96個。

        2) 分成八類模式的總共只有2個字母:

        例如,表述的是一個字母,加起來16個。

        3) 有兩類模式的字母加起來有6個:

        例如:表述的是同一字母,加起來12個。

        4) 字符模式通常包含等四類。

        其模式能夠達(dá)到128種。

        為便于聯(lián)機(jī)識別,筆者將全部維吾爾字母寫法、字符依照其功能劃定為若干種,在抽樣練習(xí)階段分類裝存。

        1) 簡易字符。最為常見的維吾爾字母字符,比如隸屬這一種。

        2) 繁雜操作符

        右端、上端、下端都可以出現(xiàn)有著一定筆畫的維吾爾字母字符,比如等。

        3) 兩類字母音節(jié)字符

        輔音部分與元音部分構(gòu)成兩種字體。比如:等。

        4) 三種字母音節(jié)

        舉例說明:等,數(shù)量繁多。[4]

        3 維吾爾語手寫體網(wǎng)上甄別的過程分析

        3.1 預(yù)處置

        預(yù)處置是手寫的基本元素,對提升辨認(rèn)率來講至為關(guān)鍵。

        3.1.1 幾何處置

        預(yù)處置階段,最為重要的方法是清除噪音,排除硬件缺陷和手寫抖動,再模式化寫出的字體。目前,運(yùn)用頻率最高的是緩沖、過濾、另行抽取樣本與標(biāo)準(zhǔn)化技術(shù)。

        1)將單獨(dú)點與臨近的三點實施均衡配對,并對點的連接序列間的間距實施再次采樣,進(jìn)而緩解線訊息的硬度。

        2)手寫體痕跡的平行垂直問題,使手寫體能夠達(dá)到書寫標(biāo)準(zhǔn),再利用切比雪夫第二類別紙在過濾設(shè)備中過濾,用來規(guī)整筆跡,以清除時空抽樣引發(fā)的噪聲。

        3)使用過濾設(shè)備緩解并縮減多余部分,采用同樣的模式對符號樣本進(jìn)行采集,再利用頂點刪除的形式讓手寫體更為準(zhǔn)則化。[5]

        3.1.2 基線探測

        大多數(shù)基線勘探模式均是以幾何理論為基礎(chǔ)的,從離線或印刷體的運(yùn)用模式離析出來的。這類邏輯模式解析了手寫體表層構(gòu)造,以判斷檢索基線的筆跡有關(guān)點,幾何理論中最為常見即是直方圖映射。

        3.1.3 處置字體中的延緩部分

        在維吾爾語手寫階段,延緩筆劃分布在字符的上部或下部,可以利用一種非常規(guī)的連接筆劃連接延緩筆劃與維吾爾語,參考分支界定學(xué)說中的雙圖形學(xué)說來完成相連或字體的改變,并將不同的字符分隔。[6]此外,借鑒阿拉伯語手寫體辨別的模式,形成直觀串法來調(diào)節(jié)秩序。在這部分詞語的秩序內(nèi),延緩筆畫是根據(jù)相異的測序?qū)懗傻?,字符的模糊掩蓋潛藏于特征載體內(nèi),在手寫階段,利用延緩筆劃映射學(xué)說來整合延緩筆劃。該映射學(xué)說要經(jīng)歷兩個階段,即檢驗延緩筆劃與在適當(dāng)?shù)耐ㄟ^處理的點序列字符中,完成延緩筆劃的書寫。

        3.2 特點提煉

        特點提煉的初衷是,通過萃取與換算錄入訊息有關(guān)的特點或數(shù)據(jù)來獲取字符類別劃分標(biāo)準(zhǔn),粘連體字符表率性的錄入信息繁多,包括視覺描述符,比如遮擋位置、凹陷方位與環(huán)等。幾何描述符也開始逐漸普及,比如切線、相連角、相對速率、筆劃長與位置、連續(xù)點的間距等。

        另外,錄入信息的坐標(biāo)也能夠完成萃取——比如曲線運(yùn)轉(zhuǎn)速率與角速率。在阿拉伯文手寫體識別階段,一部分研發(fā)專家萃取了字體特征的神經(jīng)生理學(xué)與生理力學(xué)的方程組參數(shù),描述的是手寫體的曲線運(yùn)轉(zhuǎn)狀態(tài)。此外,F(xiàn)reeman鏈碼的分成三個部分:長筆畫、短筆畫、抬筆。特征矢量最重要的是方向碼,描述的是切分狀態(tài)下的筆劃,每類筆畫的長度、斜率與坐標(biāo)軸等。

        3.3 切分

        切分法包括整體法與分析法,此處只介紹分析法。

        在分析法中,對一類字符高效識別的前提是識別單元是精準(zhǔn)的,而不正確的切分讓識別缺乏價值。最初利用外在切分學(xué)說的是內(nèi)杰爾等專業(yè)人士參考阿拉伯手寫體辨別準(zhǔn)則實現(xiàn)的,手寫體由一些基礎(chǔ)知覺特征編碼與整體知覺特征編碼組成。利用網(wǎng)絡(luò)手寫體的beta橢圓理論,并使用模糊集知識來檢測其基本特征,并利用遺傳換算理論來檢測其特征,這類切分學(xué)說相關(guān)的觀念來自凹凸性理論,為了避免形成長度不達(dá)標(biāo)的分段,在分段線譜的長度中參考了臨界指標(biāo),而分段曲線長度揭示了結(jié)構(gòu)曲線的分段線性段的總長度,并且將筆劃細(xì)分成四類字母。其步驟包括:隨意分解、強(qiáng)化分解、連接連續(xù)接頭與定位分解點。

        4 結(jié)束語

        綜上,維吾爾語是新疆維吾爾地區(qū)的官方語言其中一種,當(dāng)前的手寫科技較為落后,筆者在對中英語、阿拉伯語等手寫識別科技解讀的前提下,從維吾爾語的文字構(gòu)造、組詞特征與錄入習(xí)慣等特點入手,探討了維吾爾語手寫體在線電腦識別科技,為新疆地區(qū)民眾使用電子設(shè)施提供了一定的參考。

        參考文獻(xiàn):

        [1] 吾加合買提·司馬義,艾斯卡爾·艾木都拉.基于中心距離特征的聯(lián)機(jī)手寫維吾爾文全形態(tài)字母識別研究[J].電腦知識與技術(shù),2014(13):3097-3099,3103.

        [2] 姜志威,丁曉青,彭良瑞,等.低數(shù)據(jù)資源條件下基于結(jié)構(gòu)信息共享的無切分維文文檔識別字符建模[J].電子與信息學(xué)報,2015,(9):2103-2109.

        [3] 高麗娟,邢喜民,楊紹富,等.新源、和靜交界Ms6.6地震前庫爾勒地震臺部分異常識別和分析[J].內(nèi)陸地震,2014,28(1):22-29.

        [4] 金劍,田淑芳,焦?jié)櫝?,?基于地物光譜分析的WorldView-2數(shù)據(jù)巖性識別:以新疆烏魯克薩依地區(qū)為例[J].現(xiàn)代地質(zhì),2013,27(2):489-496.

        [5] 侯愛萍,陳新勇.基于基因信息圖譜的傳統(tǒng)聚落景觀研究——以新疆吐魯番麻扎村維吾爾族聚落為例[J].新疆大學(xué)學(xué)報:自然科學(xué)版,2016,33(2):235-240,252.

        [6] 努爾艾力·喀迪爾,彭良瑞,哈力木拉提,等.一種基于HMM和統(tǒng)計語言模型的維吾爾文及阿拉伯文識別方法[J].計算機(jī)應(yīng)用與軟件,2015,32(1):171-174.

        猜你喜歡
        手寫體維吾爾語探討
        哐當(dāng)(外一首)
        哐當(dāng)(外一首)
        西夏文楷書和草書手寫體探微
        披著書法外衣的手寫體
        中國篆刻(2019年6期)2019-12-08 15:56:23
        統(tǒng)計與規(guī)則相結(jié)合的維吾爾語人名識別方法
        新財務(wù)會計制度下醫(yī)院成本核算的探討與實踐分析
        芻議小學(xué)足球教學(xué)的訓(xùn)練教學(xué)方法
        體育旅游產(chǎn)業(yè)的特征及發(fā)展策略探討
        商(2016年27期)2016-10-17 07:16:17
        稅收籌劃的效應(yīng)問題
        商(2016年27期)2016-10-17 06:19:58
        維吾爾語話題的韻律表現(xiàn)
        一本大道久久东京热无码av| 亚洲国产精品国自产拍av| 国产又色又爽无遮挡免费软件| 51看片免费视频在观看| 欧美极品少妇性运交| 日韩精品电影在线观看| 四川老熟妇乱子xx性bbw| 亚洲国产精品特色大片观看完整版| 男女超爽视频免费播放| 欧美日韩国产亚洲一区二区三区 | 乱中年女人伦av一区二区| 欧美精品免费观看二区| 国产高潮精品久久AV无码| www.91久久| 91青青草在线观看视频| 人妻熟女中文字幕av| 亚洲综合日韩一二三区| 亚洲av无码一区二区一二区| 亚洲成av人片在线观看麦芽| 中文字幕无码不卡免费视频| 亚洲色AV天天天天天天| 91麻豆精品激情在线观最新| 成人av毛片免费大全| 一区二区和激情视频| 少妇性饥渴无码a区免费| 久久久精品2019免费观看| 国产成人无码精品久久99| 一区二区三区婷婷中文字幕| 国产自拍三级黄片视频| 亚洲人妻调教中文字幕| 国模冰莲自慰肥美胞极品人体图| 亚洲精品国产成人无码区a片| 亚洲AV无码日韩综合欧亚| 亚洲sm另类一区二区三区| 亚洲人成欧美中文字幕| 无码专区久久综合久中文字幕| 精品人妻免费看一区二区三区| 亚洲精品不卡av在线免费 | а中文在线天堂| 少妇被搞高潮在线免费观看| 亚洲av乱码一区二区三区人人|