亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        續(xù)筆行為的數(shù)字化采集、判斷及修繕實驗研究

        2018-07-27 12:34:40靜,杰,
        實驗室研究與探索 2018年7期
        關(guān)鍵詞:正確性筆畫準確率

        王 靜, 姜 杰, 李 藝

        (南京師范大學(xué) 教育科學(xué)學(xué)院, 南京210024)

        0 引 言

        續(xù)筆是指書寫者在漢字書寫過程中,有意識、有目的地對已完成的筆畫進行再次延長、覆蓋、連接等加工或修飾的書寫行為[1],這多屬于書寫者對已書寫漢字,在正確性、工整性意義上的再次糾正,反映了其對所寫漢字的重新認識。續(xù)筆現(xiàn)象不只在學(xué)生群體中出現(xiàn),語文老師在批改書寫作業(yè)或辦公人員書寫文稿時,也經(jīng)常對某些不恰當或不美觀的筆畫進行續(xù)筆、修繕。這種常見的續(xù)筆行為在“紙—筆”書寫介質(zhì)中較容易識別,但在數(shù)字化書寫采集介質(zhì)下,往往不能將其進行有效識別,卻直接判斷為該字書寫錯誤。對此,在數(shù)字化手寫平臺智能識別用戶的續(xù)筆行為并作為正確的行為接受下來,顯得非常有價值。

        在目前提出的手寫漢字書寫自動評價方法中,中國發(fā)明專利“手寫漢字筆畫相交離的規(guī)范性判定方法和裝置”[2]公開了一種通過比較手寫漢字筆段的交接離關(guān)系與標準漢字筆段的交接離關(guān)系,進而判斷手寫漢字書寫是否規(guī)范,該方法首先獲取用戶書寫的漢字筆畫,再根據(jù)拐點提取筆畫中的筆段,最后判斷筆段間的交接離關(guān)系;專利“一種漢字書寫形態(tài)美觀度的計算機評估方法”[3]通過漢字書寫形態(tài)進行筆劃分解與參數(shù)化,然后使用圖像處理和人工智能的方法獲得漢字書寫形態(tài)與其美觀度間的潛在關(guān)系,進而對人工給定的漢字書寫樣本的美觀度評分;專利“書寫漢字結(jié)構(gòu)規(guī)范性評價的方法和裝置”[4]通過獲得橫向?qū)ΨQ參數(shù)差值、縱向?qū)ΨQ參數(shù)差值、緊湊對稱參數(shù)差值和分布向量參數(shù)差值,根據(jù)監(jiān)督分類機器學(xué)習(xí)機制,利用上述4種差值對所述書寫漢字進行結(jié)構(gòu)規(guī)范性評價。

        上述方法雖然在某些方面對手寫漢字書寫質(zhì)量給出一定效度的評價,但這些方法并沒有實現(xiàn)對用戶書寫過程中出現(xiàn)的續(xù)筆現(xiàn)象進行判斷和識別。本研究克服現(xiàn)有技術(shù)的不足,提出“標記—整合”識別漢字筆畫續(xù)筆的方法,該算法區(qū)別于以往基于圖像格式的脫機漢字處理方式,收集觸摸屏上漢字筆畫的點集以及點集的時間戳保存在xml文件中[5],通過筆畫點集之間距離、方位的判斷,智能識別數(shù)字化手寫平臺上的續(xù)筆行為,并將互為續(xù)筆關(guān)系的筆畫進行整合,以使書寫的漢字通過正確性判斷,進而在工整性上更滿足書寫者的需求。

        1 續(xù)筆類型

        Liu[6]將漢字結(jié)構(gòu)劃分為5個層次,其中筆段位于最底層,是構(gòu)成漢字的最小單位,描述了整個漢字的重要的結(jié)構(gòu)特征信息,并具有方向、長度等屬性,筆段間的拓撲結(jié)構(gòu)也有多種。而續(xù)筆行為,主要發(fā)生在筆段間,因此本研究將從筆段間相連的拓撲結(jié)構(gòu)、筆段間相連方向入手,對續(xù)筆情形分類判斷。

        1.1 筆段間相連的拓撲結(jié)構(gòu)

        筆段間相連的拓撲結(jié)構(gòu)主要包括“鄰”“疊”“交”[7-8],因此續(xù)筆關(guān)系中筆段相連包括相鄰、相疊、相交等3種類型?!跋噜彙奔磧蓚€筆段的徑跡點首尾距離小于某個閾值且兩筆段的夾角余弦值小于某個閾值;“相疊”即兩個筆段的徑跡點中有若干對距離小于某給定閾值的點且兩筆段的夾角余弦值小于某個閾值;“相交”即兩個筆段的徑跡相互交叉[9],判斷方法如下:

        (3) 判斷兩個筆段相交的方法:i筆段的端點p1、p2分散在j筆段端點p3、p4連線的兩側(cè)。令d1=p3p1×p3p4,d2=p3p2×p3p4,d3=p1p3×p1p2,d4=p1p4×p1p2,并滿足d1×d2p0&d3×d4p0,則i和j筆段相交。

        1.2 筆段相連的方向

        漢字每一筆畫的入筆、運筆、收筆,以入筆之勢,造就筆畫之形[10],運筆過程中蘊含著漢字筆畫的時序特征,因此漢字筆段、筆畫書寫帶有方向性,規(guī)范書寫是i筆畫的末筆段與i+1筆畫的首筆段相接,但續(xù)筆現(xiàn)象存在較多反向連接。因此根據(jù)續(xù)筆中不同筆段間相連的方向,續(xù)筆類型又分為筆段間頭頭相連、頭尾相連、尾頭相連、尾尾相連以及包含與被包含關(guān)系。

        根據(jù)筆段間相連的拓撲結(jié)構(gòu)、連接方向,續(xù)筆類型分為5大類14小類,如表1所示。

        2 “標記—整合”算法解決續(xù)筆問題

        2.1 標準漢字筆畫類型編碼庫建立

        趙學(xué)軍等[11-14]學(xué)者使用向右、右上、向上、左上、向左、左下、向下、右下8個方向表示筆畫走向,如圖1所示。本研究借鑒此劃分方式,通過記錄手寫漢字筆畫時從起筆到收筆留下的徑跡,根據(jù)徑跡上相鄰兩點所成直線與水平線之間夾角的余弦值cosθ,再結(jié)合不同筆畫類型的走向偏移角度,把平面坐標系分成8個走向,用8個阿拉伯數(shù)字表示[1],其中不存在從右向左

        圖1 平面坐標系的8個走向

        以及從下向上書寫的筆畫走向,因此去除走向編號5、7,只有1~4,6,8這6個方向,如圖2所示,對于復(fù)雜筆畫,拆分成若干個走向獨立的筆段,由筆段走向碼組合成筆畫類型編碼。

        圖2 走向碼的角度劃分

        走向碼表示筆段的傾斜度,對于單筆段筆畫如“橫”“豎”“撇”“捺”等可以唯一確定其位置,但對于多筆段筆畫如“撇點”“橫折撇”等,筆段間連接方向不同導(dǎo)致筆畫類型不同。如表2中,續(xù)筆判斷時僅依靠與標準漢字走向碼匹配,是不能準確識別續(xù)筆行為,例“谷”字中相連的撇和捺因與“女”中撇點的走向碼相同,有可能被識別為續(xù)筆;“又”中的多筆段筆畫“橫折撇”與“原”中的單筆段筆畫“橫”和“撇”也是類似。

        表2 無連接方向的走向碼及其例字

        鑒于無連接方向的走向碼在續(xù)筆判斷中存在不足,在很大程度上導(dǎo)致續(xù)筆判斷準確率下降,因此本算法在走向碼基礎(chǔ)上添加筆段連接方向,用h表示筆段頭部,e表示筆段尾部,添加之后結(jié)果如表3所示,上述問題迎刃而解。

        2.2 筆段間續(xù)筆關(guān)系的識別

        筆段間續(xù)筆關(guān)系的判斷是“標記—整合”算法的關(guān)鍵步驟,依據(jù)筆段間拓撲結(jié)構(gòu)的判斷方法,將當前筆畫所有筆段的點集依次與之前筆畫的筆段進行距離及方位判斷,根據(jù)點集計算結(jié)果,判斷兩筆段間的拓撲結(jié)構(gòu),進而在筆段層次上添加標記,具體算法如下:

        輸入用戶書寫漢字點集信息類

        輸出筆段間續(xù)筆關(guān)系判斷后標記添加后的信息類

        表3 無連接方向的走向碼及其例字

        (1) 在當前筆畫i的徑跡記錄中提取筆段集合[15-16],記為{Si1,Si2,…,Sin},其中Sij是筆畫i的筆段。

        (2) 倒敘比較。從集合{Si1,Si2,…,Sin}中依次取出筆段Sij與i-1筆畫的筆段集合{Si-1(1),Si-1(2),…,Si-1(n)}中筆段Si-1(j)依次比較判斷,直到與集合{Sstart1,Sstart2,…,Sstartn}中所有筆段比較完成。

        (4) 若兩筆段存在續(xù)筆關(guān)系,則分別根據(jù)Pstart、Pend坐標計算cosθ,據(jù)此得出兩筆段走向碼,若走向碼相同,則進行標記,方便將走向碼整合時去除相同走向碼。

        (5) 在筆段Sij類中不僅標注續(xù)筆類型,而且要存儲與之有續(xù)筆關(guān)系的筆畫序號i以及筆段序號j,方便真續(xù)筆之間筆畫融合。

        (6) 當前筆畫i的所有筆段{Si1,Si2,…,Sin}遍歷完成,進行下一筆畫判斷,依次循環(huán),直到該漢字所有筆畫的全部筆段續(xù)筆關(guān)系判斷完成。

        2.3 判斷真?zhèn)卫m(xù)筆

        若筆畫i與筆畫j的筆段間存在相鄰或相疊或相交的拓撲結(jié)構(gòu),則判斷筆畫i與筆畫j有續(xù)筆關(guān)系,并添加標記。但是如圖3的“谷”中的“撇”和“捺”不存在續(xù)筆關(guān)系,但這兩筆畫判斷為相鄰,則會添加續(xù)筆標記。所以續(xù)筆有真?zhèn)沃郑杞柚鷺藴蕽h字筆畫類型編碼庫,區(qū)分真續(xù)筆與偽續(xù)筆,具體算法描述如下:

        (1) 已判斷筆段Sij是筆段Sji的續(xù)筆,若Sij與Sji是

        圖3 “谷”中的偽續(xù)筆關(guān)系

        同走向筆段,則將Sij的走向碼刪除,表明此續(xù)筆意義在于對上一筆畫的延長。

        (2) 若Sij與Sji是異走向筆段,則表明Sij與Sji所在的筆畫連接將構(gòu)成新筆畫類型,需與標準筆畫類型編碼庫進行比對。

        (4) 根據(jù)筆段連接方向,調(diào)整筆段Sij所在筆畫i的走向碼與筆段Sji所在筆畫j的走向碼連接順序,中間用連接碼將兩筆畫走向碼連接成一個筆畫s的走向碼。

        (5) 將筆畫s的走向碼與標準漢字筆畫類型編碼庫Q進行比對,若s∈Q,則在筆段Sij類中添加真續(xù)筆標記;若s?Q,則在筆段Sij類中添加偽續(xù)筆標記。

        經(jīng)過上述3個步驟,可基本識別書寫漢字的續(xù)筆行為,并標記有續(xù)筆關(guān)系的筆畫序號及筆段序號,如圖4所示,漢字的第1個筆畫記為0筆畫,“半”字的前5個筆畫無續(xù)筆行為則標記為false,第6個筆畫存在續(xù)筆關(guān)系,則為true,并對續(xù)筆發(fā)生的位置進行簡要說明,如“半”字的5筆畫0筆段與4筆畫的0筆段存在續(xù)筆關(guān)系。根據(jù)續(xù)筆判斷結(jié)果,可進一步將含續(xù)筆關(guān)系的兩筆段點集融合,合并成一個完整筆畫。

        圖4 續(xù)筆測試平臺

        2.4 含續(xù)筆關(guān)系的筆畫整合

        當書寫者完成該漢字,先進行續(xù)筆行為判斷,若某筆畫的筆段上存在真續(xù)筆標記,則進行筆畫點集整合[18-19],將兩個互為續(xù)筆的筆畫拼接成一個完整筆畫加入到漢字筆畫集中,再送入正確性階段進行整字的正確性判斷,具體判斷算法如下:

        (1) 若筆畫i的某筆段上含有真續(xù)筆標記,則根據(jù)續(xù)筆類型將兩筆畫點集融合,合成一個完整筆畫。

        (2) 筆段相鄰。根據(jù)筆段連接方向,將筆畫i與筆畫j的連接筆段點集整合。

        (3) 筆段相疊。根據(jù)疊點位置,去除兩筆段重疊部分,將筆畫i與筆畫j的其余部分點集整合。

        (4) 筆段相交。根據(jù)交點位置,截取筆畫i有效部分以及筆畫j有效部分進行點集整合。

        (5) 將整合后的筆畫加入筆畫集合{S1,S2,…,Si},將另兩個筆畫在筆畫集合中進行刪除。

        (6) 將判斷及修繕完成的筆畫集作為該漢字完整的筆畫信息。

        3 實驗與分析

        為驗證本文提出的“標記—整合”算法的有效性,代碼開發(fā)完成后,以南京市某小學(xué)三年級某班的全體同學(xué)為實驗對象,收集大量基于觸摸屏的漢字書寫信息,捕獲學(xué)生在無意識書寫狀態(tài)下的續(xù)筆行為,并對其進行續(xù)筆判斷處理,將修繕后的漢字輸送到下一邏輯環(huán)節(jié)判斷其正確性,最后統(tǒng)計續(xù)筆行為判斷的準確率。

        3.1 實驗說明

        3.1.1實驗前期調(diào)研與相關(guān)說明

        因小學(xué)低年級的學(xué)生對于平板的操作以及觸摸屏寫字力度把握有一定的難度,且識字數(shù)量較少,無法客觀體現(xiàn)小學(xué)生真實的漢字書寫水平,而小學(xué)階段中年級的學(xué)生已經(jīng)有了一定的漢字儲備量,對于平板操作也較熟悉,因此本次實驗選取了南京市某小學(xué)三年級一個班的學(xué)生作為實驗對象,該班共有45名同學(xué),大約4/5的學(xué)生表示在日常生活中經(jīng)常使用觸摸屏的各種操作,有較少數(shù)學(xué)生表示對觸摸屏寫字不熟悉,對于那些沒有觸摸屏?xí)鴮懡?jīng)驗的學(xué)生,經(jīng)簡單指導(dǎo),已迅速掌握操作步驟,可順利參與實驗。

        3.1.2實驗材料

        本次實驗選擇三年級上冊學(xué)習(xí)過的唐代詩人張繼的《楓橋夜泊》作為實驗材料,包含“月落烏啼霜滿天,江楓漁火對愁眠。姑蘇城外寒山寺,夜半鐘聲到客船”共28個漢字。

        選擇該詩作為實驗材料,可使學(xué)生在練習(xí)、鞏固該詩的基礎(chǔ)上進行有意義實驗,并且詩中的漢字不僅涵蓋了多種基本筆畫:橫、豎、點、提、撇、捺,還包含有大量的常見筆畫,如:豎鉤、橫鉤、豎彎鉤、橫折鉤、撇折、橫撇等等,這些筆畫在常用漢字庫中出現(xiàn)次數(shù)頻繁,基本囊括了可能出現(xiàn)續(xù)筆問題的各種筆畫或結(jié)構(gòu)。總的來說,這首詩包含的標準筆畫類型豐富,難易程度適中,能夠較客觀地反映學(xué)生平時的書寫習(xí)慣。

        3.1.3實驗工具

        選擇SANXING SM-P600帶有觸控筆的10.1英寸平板電腦作為本次實驗的測試設(shè)備,Android版本為4.3,安裝漢字書寫軟件,打開《楓橋夜泊》這首詩的字庫集,依次書寫28個漢字(見圖5),書寫完每個漢字后,點擊“寫的怎么樣”判斷按鈕,系統(tǒng)首先判斷該字中是否存在續(xù)筆行為,再對判斷修繕后的漢字的正確性進行正誤判斷。

        圖5 軟件書寫界面

        3.2 實驗開展過程

        為收集大量書寫數(shù)據(jù),發(fā)現(xiàn)小學(xué)生在無意識書寫行為中出現(xiàn)的續(xù)筆問題,本續(xù)筆實驗共持續(xù)5 d,周一到周五,時間連續(xù),每人每天書寫28個漢字。在學(xué)生書寫過程中,研究者與語文老師配合在現(xiàn)場隨時指導(dǎo)學(xué)生進行觸摸屏操作、書寫漢字操作、保存漢字信息操作,盡最大可能地保證書寫數(shù)據(jù)的回收。實驗全部進行完之后,將發(fā)放的設(shè)備收回,并將漢字數(shù)據(jù)從服務(wù)器中獲取,對保存的漢字書寫圖片認真觀察、每個漢字xml文件中的時序點集進行計算并認真分析,統(tǒng)計書寫時續(xù)筆行為的識別率及修繕成功率。

        3.3 數(shù)據(jù)統(tǒng)計

        期望共有6 300個漢字書寫信息,但在實驗過程中有個別學(xué)生存在漢字漏寫或沒有按照要求對書寫信息進行保存,導(dǎo)致最終采集的漢字書寫數(shù)據(jù)6 158個,其中續(xù)筆行為達658次,真續(xù)筆行為達503次,續(xù)筆類型主要集中在筆畫“橫”“豎”“撇”“捺”的延長以及筆畫“橫鉤”“豎鉤”“豎彎鉤”中筆段“鉤”的補充,續(xù)筆數(shù)量主要是1或2次,含有3次續(xù)筆關(guān)系的漢字較少,超過3次更是極少數(shù),本次實驗續(xù)筆行為現(xiàn)象的統(tǒng)計如圖6所示。

        從圖6可以看出,隨著實驗時間的延長,續(xù)筆現(xiàn)象發(fā)生越來越頻繁。因小學(xué)生每天書寫的漢字相同,實驗起初兩天時間內(nèi),學(xué)生一直在熟悉并習(xí)慣于在觸摸屏上書寫漢字,對漢字本身的筆畫、結(jié)構(gòu)也熟練掌握。在接下來的書寫過程中,學(xué)生不僅保證漢字書寫的正確性,而且越來越追求漢字的美觀、工整,在此較高需求的基礎(chǔ)上,續(xù)筆現(xiàn)象發(fā)生頻繁。因此也可總結(jié)出續(xù)筆行為的發(fā)生多源于學(xué)生對漢字的“優(yōu)劣”判斷以及有“向好”的愿望,是漢字書寫過程中的有價值信息。

        圖6 實驗期間含續(xù)筆關(guān)系的漢字數(shù)量

        收集書寫過程中的漢字信息,捕獲續(xù)筆行為,統(tǒng)計續(xù)筆判斷的準確率K以及修繕筆畫后的正確性通過率P,統(tǒng)計結(jié)果如表4所示。

        表4統(tǒng)計了實驗材料中續(xù)筆頻率較高的漢字、判斷準確率以及修繕后正確性通過率,從收集的數(shù)據(jù)可以看出《楓橋夜泊》這首詩的續(xù)筆情況集中發(fā)生在“橫”“豎”“撇”“捺”“點”等簡單筆畫的完善加工,主要是對筆畫的某個筆段進行延長修飾,復(fù)雜筆畫如楓字中的“橫折彎鉤”、對字中的“豎鉤”、眠字中的“戈鉤”以及愁字中的“臥鉤”發(fā)生的次數(shù)也較多,根據(jù)每個字中含有續(xù)筆關(guān)系的漢字正確性通過率,續(xù)筆行為判斷準確率在80%以上,修繕后正確性通過率也在73%以上。

        表5中統(tǒng)計了在實驗期間發(fā)生續(xù)筆次數(shù)較多的學(xué)生以及其書寫的續(xù)筆類型舉例、續(xù)筆準確率統(tǒng)計,從表中的續(xù)筆漢字舉例可知學(xué)生的續(xù)筆行為與其書寫習(xí)慣有關(guān),例如學(xué)生1書寫時“橫”筆畫普遍較短,需再添加一筆將其進行延長;學(xué)生5書寫時“鉤”筆段常忘記,所以“橫折彎鉤”“豎鉤”等筆畫容易產(chǎn)生續(xù)筆行為;學(xué)生7書寫時筆段連接處易產(chǎn)生中斷,最后需再補一筆將兩者進行連接。在每位同學(xué)的續(xù)筆行為中,續(xù)筆判斷準確率在80%以上,修繕準確率平均在75%以上。

        因?qū)嶒灢牧现忻總€漢字的續(xù)筆判斷準確率以及每位同學(xué)的續(xù)筆識別準確率都在80%以上,修繕準確率在73%以上,通過橫向比較和縱向比較,表明本文提出的“標記—整合”算法能有效識別漢字書寫過程中的續(xù)筆行為并在很大程度上對其修繕成功,提高了觸摸屏漢字書寫的正確性通過率。

        表4 頻率較高的漢字續(xù)筆情形

        4 結(jié) 語

        本文根據(jù)筆段間的拓撲結(jié)構(gòu)以及筆段相連方向,對續(xù)筆行為分類,提出“標記—整合”算法,該算法首先判斷筆段間拓撲結(jié)構(gòu)并添加相應(yīng)標記,再與標準漢字筆畫編碼庫進行比對,最后將含續(xù)筆關(guān)系的兩筆畫點集整合,作為完整筆畫添加到該漢字筆畫集合中。通過實驗驗證,本算法識別續(xù)筆行為準確率達80%以上,因此“標記—整合”算法可很好地解決漢字書寫質(zhì)量智能測評系統(tǒng)上的續(xù)筆行為。但較復(fù)雜筆畫的續(xù)筆判斷較復(fù)雜,迭代次數(shù)多,再加上走向碼判斷局限性,所以正確性通過率有待提高,判斷續(xù)筆行為的算法需要改進。

        表5 續(xù)筆次數(shù)較多的同學(xué)續(xù)筆判斷準確率統(tǒng)計

        猜你喜歡
        正確性筆畫準確率
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
        2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
        筆畫相同 長短各異
        ——識記“己”“已”“巳”
        有趣的一筆畫
        一種基于系統(tǒng)穩(wěn)定性和正確性的定位導(dǎo)航方法研究
        找不同
        高速公路車牌識別標識站準確率驗證法
        一筆畫
        淺談如何提高水質(zhì)檢測結(jié)果準確性
        久久青青热| 女厕厕露p撒尿八个少妇| 女人18毛片a级毛片| 久久综合亚洲色hezyo国产 | 第一九区另类中文字幕| 国产精品高清网站| 少妇愉情理伦片高潮日本| 婷婷五月综合激情| 亚洲一区二区久久青草| 91青青草免费在线视频| 亚洲综合视频一区二区 | 寂寞少妇做spa按摩无码| 老熟妇乱子伦av| 手机看片福利日韩| 成激情人妻视频| 国产熟女露脸大叫高潮| 午夜一区二区三区观看 | 亚洲一区二区三区中文字幂| 人体内射精一区二区三区| 美女爽好多水快进来视频| 日韩一级137片内射视频播放| 日本最新一区二区三区视频观看| 2020无码专区人妻系列日韩| 性夜夜春夜夜爽aa片a| 精选二区在线观看视频| 国产高清视频在线不卡一区| 国产免费久久精品99久久| 男人边吻奶边挵进去视频| 99久久超碰中文字幕伊人| 国产精品亚洲精品日韩动图| 青青草成人在线播放视频| 无码小电影在线观看网站免费| 欧美两根一起进3p做受视频| 激情五月天伊人久久| 色偷偷亚洲av男人的天堂| 手机在线观看日韩不卡av| 亚洲欧美日韩国产精品一区二区| 国产成人精品午夜福利| 国产人成在线免费视频| 国产真实一区二区三区| 亚洲欧美日韩另类精品一区|