手寫漢字評(píng)價(jià)方法研究進(jìn)展

2022-01-25 18:54:00李成城

計(jì)算機(jī)工程與應(yīng)用 2022年2期

肖雪，李成城

內(nèi)蒙古師范大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院，呼和浩特 010022

互聯(lián)網(wǎng)的不斷發(fā)展、創(chuàng)新以及與教學(xué)領(lǐng)域的融合，給教學(xué)設(shè)備帶來許多新的機(jī)遇。如今人們已經(jīng)積累了豐富的計(jì)算機(jī)輔助教學(xué)經(jīng)驗(yàn)，教學(xué)體系也在逐步完善。盡管計(jì)算機(jī)輔助教學(xué)設(shè)備發(fā)展得非常迅速，但也存在許多問題[1]，如計(jì)算機(jī)輔助手寫漢字的書寫質(zhì)量評(píng)價(jià)軟件不充足、資源共享度不高，缺乏書寫質(zhì)量評(píng)價(jià)的相關(guān)研究等。

目前“提筆忘字”的現(xiàn)象普遍存在，這將成為傳統(tǒng)文化丟失的先兆。為了提高書寫水平，教育部對(duì)小學(xué)生的書寫要求下發(fā)相關(guān)文件[2]，而手寫漢字的指導(dǎo)工作主要由教師完成，教師對(duì)學(xué)生的手寫漢字進(jìn)行評(píng)價(jià)時(shí)會(huì)存在以下兩方面的缺點(diǎn)[3]：（1）評(píng)測(cè)專家具有極強(qiáng)的主觀性。如教師對(duì)相同書寫水平的手寫漢字打分時(shí)，會(huì)受到經(jīng)驗(yàn)、耐心等自身因素影響，導(dǎo)致分值出現(xiàn)不同程度的偏差。（2）教師不能及時(shí)對(duì)學(xué)生的手寫漢字作品做出反饋。在實(shí)際生活中，受書法課程時(shí)間以及教師精力的限制，學(xué)生作品無法隨時(shí)得到評(píng)價(jià)，容易產(chǎn)生書寫錯(cuò)誤的累積。而手寫漢字書寫質(zhì)量評(píng)價(jià)的計(jì)算機(jī)輔助教學(xué)設(shè)備，可以克服傳統(tǒng)手寫漢字評(píng)價(jià)中存在不公正和反饋不及時(shí)等問題，提高教學(xué)質(zhì)量。教師可以把更多精力和時(shí)間放在教學(xué)與輔導(dǎo)階段，極大提高了工作效率。

在教學(xué)領(lǐng)域，一個(gè)高效的計(jì)算機(jī)輔助書寫質(zhì)量評(píng)價(jià)設(shè)備具有以下三種特點(diǎn)：（1）改變傳統(tǒng)手寫漢字評(píng)價(jià)方法。（2）改正人工評(píng)價(jià)時(shí)容易出現(xiàn)主觀性和精力有限等問題。（3）找出手寫漢字中存在的不規(guī)范問題，有助于學(xué)生書寫規(guī)范漢字，實(shí)現(xiàn)及時(shí)評(píng)價(jià)[3]。此外，手寫漢字評(píng)價(jià)技術(shù)在反饋形式與反饋內(nèi)容方面已成為數(shù)據(jù)到文本生成、自動(dòng)問答、字形匹配以及圖形輔助等技術(shù)發(fā)展的支持或潛在支持部分。如手寫漢字與模板漢字產(chǎn)生的數(shù)據(jù)差可實(shí)現(xiàn)數(shù)據(jù)型文本的自動(dòng)生成；學(xué)生對(duì)手寫漢字的評(píng)價(jià)提出問題，利用自動(dòng)問答解決問題；通過手寫漢字評(píng)價(jià)產(chǎn)生的筆畫數(shù)據(jù)，利用字形匹配以及圖形輔助等內(nèi)容，可以使反饋形式更加生動(dòng)、形象有較好的用戶體驗(yàn)，有助于學(xué)生充分理解評(píng)價(jià)含義。由此可見，手寫漢字評(píng)價(jià)具有重要的研究意義與開發(fā)價(jià)值。

初期手寫漢字的特征提取主要在漢字結(jié)構(gòu)方面[4]，這類方法只能解決手寫漢字的整體規(guī)范性問題。為了解決以上問題，研究者開始嘗試提取手寫漢字的細(xì)節(jié)特征進(jìn)行書寫質(zhì)量評(píng)價(jià)，實(shí)驗(yàn)證明此想法在書寫質(zhì)量評(píng)價(jià)的準(zhǔn)確性方面確實(shí)有了很大的提升，但手寫漢字的特征提取始終依賴專家的先驗(yàn)知識(shí)獲取，既費(fèi)時(shí)又耗力。隨著深度學(xué)習(xí)的發(fā)展，研究者正在試圖利用深度學(xué)習(xí)的方法解決書寫質(zhì)量評(píng)價(jià)不全面的問題，它不但能夠提取一般特征，而且還能獲取到一些人工無法獲取的隱藏特征，有利于手寫漢字的評(píng)價(jià)。但基于深度學(xué)習(xí)的手寫漢字評(píng)價(jià)方法目前處于剛剛起步狀態(tài)，還需要研究者不斷深入的鉆研。

1 文獻(xiàn)統(tǒng)計(jì)及相關(guān)概念

1.1 文獻(xiàn)統(tǒng)計(jì)

文中對(duì)手寫漢字評(píng)價(jià)的參考文獻(xiàn)進(jìn)行收集整理，以書寫評(píng)判（handwriting evaluation）、水平評(píng)測(cè)（level assessment）、書寫質(zhì)量（handwriting quality）、計(jì)算機(jī)評(píng)價(jià)（computer evaluation）等作為關(guān)鍵詞，輸入Google scholar、ACM digital library、IEEE xplore digital library以及Springer link等途徑查找，通過閱讀文獻(xiàn)標(biāo)題以及摘要等涵蓋論文重要信息部分對(duì)論文進(jìn)行篩選，并對(duì)收集到53篇手寫漢字評(píng)價(jià)的文獻(xiàn)進(jìn)行統(tǒng)計(jì)分析，得到圖1的結(jié)果。

圖1 文獻(xiàn)分布情況Fig.1 Literature distribution

由圖1可知，超過70%的文章發(fā)表于2009年之后，從2011年期間起，發(fā)表關(guān)于手寫漢字評(píng)價(jià)文章的數(shù)量正在逐步增加，占總數(shù)量50%左右。最初利用基于規(guī)則的方法對(duì)手寫漢字進(jìn)行評(píng)價(jià)，隨著機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展以及手寫漢字可提取的特征越多，利用機(jī)器學(xué)習(xí)以及特征相似度的手寫漢字評(píng)價(jià)方法在近幾年呈現(xiàn)上升趨勢(shì)。

根據(jù)目前統(tǒng)計(jì)的文章，手寫漢字評(píng)價(jià)相關(guān)的綜述性文章較少。僅有安維華[5]總結(jié)了計(jì)算機(jī)輔助漢字教學(xué)的相關(guān)研究，其中包括數(shù)字化演示、書寫規(guī)范性評(píng)測(cè)以及書寫水平評(píng)測(cè)等任務(wù)，并且著重介紹書寫規(guī)范性評(píng)測(cè)中的即時(shí)評(píng)價(jià)和事后評(píng)價(jià)，未涉及到評(píng)價(jià)方法原理的介紹，也未對(duì)反饋形式做出具體分析。

1.2 書寫質(zhì)量評(píng)價(jià)相關(guān)概念和一般框架

手寫漢字的書寫質(zhì)量評(píng)價(jià)不僅包括書寫規(guī)范性評(píng)價(jià)，還包括書寫美觀、筆畫質(zhì)量、結(jié)構(gòu)、章法等多方面的評(píng)價(jià)[3]。傳統(tǒng)手寫漢字的書寫質(zhì)量評(píng)價(jià)是指，教師對(duì)學(xué)生書寫作品做出評(píng)分并對(duì)書寫細(xì)節(jié)提出改正建議，通常評(píng)價(jià)的準(zhǔn)確性容易受教師主觀性的影響。計(jì)算機(jī)輔助手寫漢字的書寫質(zhì)量評(píng)價(jià)是指，利用計(jì)算機(jī)對(duì)各類手寫漢字進(jìn)行評(píng)分及評(píng)價(jià)。相對(duì)而言，傳統(tǒng)手寫漢字評(píng)價(jià)與計(jì)算機(jī)輔助的手寫漢字評(píng)價(jià)，二者具有極大的共通性。傳統(tǒng)手寫漢字評(píng)價(jià)通過教師的經(jīng)驗(yàn)以及觀察手寫漢字整體結(jié)構(gòu)、筆畫等細(xì)節(jié)與模板漢字對(duì)應(yīng)部分進(jìn)行對(duì)比給出評(píng)價(jià)。計(jì)算機(jī)輔助手寫漢字的書寫質(zhì)量評(píng)價(jià)，通過計(jì)算機(jī)提取出手寫漢字的特征與模板漢字的特征進(jìn)行比對(duì)，相似度越高則手寫漢字的書寫質(zhì)量水平越高。書寫質(zhì)量評(píng)價(jià)的一般框架如圖2所示。

圖2 書寫質(zhì)量評(píng)價(jià)一般框架Fig.2 General framework for handwriting quality

根據(jù)計(jì)算機(jī)評(píng)價(jià)手寫漢字的時(shí)間不同，可將手寫漢字的書寫質(zhì)量評(píng)價(jià)分為即時(shí)評(píng)價(jià)和事后評(píng)價(jià)兩種（表1給出了兩種評(píng)價(jià)的對(duì)比）。

表1 評(píng)價(jià)對(duì)比Table 1 Evaluation and comparison

1.2.1 即時(shí)評(píng)價(jià)

即時(shí)評(píng)價(jià)是指用戶每完成漢字的一個(gè)筆畫，系統(tǒng)就立即與模板漢字的相應(yīng)筆畫進(jìn)行相似度計(jì)算，評(píng)判筆畫的正確性（形狀正確性與位置正確性），并提出修改意見，為漢字的規(guī)范性奠定基礎(chǔ)。及時(shí)發(fā)現(xiàn)手寫漢字的錯(cuò)誤并且給予反饋是非常重要的。有些教學(xué)系統(tǒng)根據(jù)即時(shí)評(píng)價(jià)獲得手寫漢字的筆畫、筆序、部件相對(duì)位置等基本信息后，用于檢測(cè)書寫錯(cuò)誤并評(píng)估書寫質(zhì)量[6-7]。也有一些教學(xué)系統(tǒng)對(duì)手寫漢字信息進(jìn)行歸納，將手寫漢字以動(dòng)畫等另一種形式展示指導(dǎo)，加深學(xué)生的記憶[8-9]。

在即時(shí)評(píng)價(jià)中信息的雙向展示非常重要[10]。學(xué)者進(jìn)行實(shí)踐練習(xí)的同時(shí)及時(shí)得到反饋，是加深印象的關(guān)鍵。然而，如何全面地發(fā)現(xiàn)手寫漢字問題，并且突出顯著錯(cuò)誤的反饋也是研究者致力解決的問題。

為了解決輸入字符與模板字符進(jìn)行匹配時(shí)，因漢字結(jié)構(gòu)復(fù)雜和書寫風(fēng)格差異較大等原因?qū)е虏荒軠?zhǔn)確找到筆跡錯(cuò)誤位置的問題。胡智慧等人[11]設(shè)計(jì)出一套實(shí)時(shí)評(píng)測(cè)與反饋的漢字書寫質(zhì)量系統(tǒng)，該系統(tǒng)通過屬性關(guān)系圖實(shí)現(xiàn)即時(shí)檢測(cè)筆畫信息，對(duì)筆畫與筆畫之間的關(guān)系（相鄰、相交、相接）、筆畫順序以及筆畫類型（橫、豎、撇等）及時(shí)作出反饋評(píng)價(jià)，并利用剪枝策略提高評(píng)測(cè)速率。但這套系統(tǒng)僅對(duì)以筆畫為基礎(chǔ)的漢字進(jìn)行匹配評(píng)價(jià)，忽略了手寫漢字結(jié)構(gòu)因素（對(duì)稱性、勻稱性等）的影響。目前存在大量即時(shí)評(píng)價(jià)的書寫質(zhì)量評(píng)價(jià)系統(tǒng)，它們主要關(guān)注筆畫和筆順的特征，忽略了字體結(jié)構(gòu)對(duì)書寫質(zhì)量的影響，而筆畫、筆順等特征只能證明此手寫漢字是否可識(shí)別，手寫漢字結(jié)構(gòu)的判斷卻是書寫質(zhì)量的一種衡量標(biāo)準(zhǔn)（可以評(píng)價(jià)手寫漢字）[12]。莊崇彪等人[13]根據(jù)計(jì)算機(jī)可識(shí)別出手寫漢字常見的十一種錯(cuò)誤，引入單筆畫框（局部特征）以及多筆畫框（全局特征）的概念，制定出筆畫、筆畫間特征以及特征分類的規(guī)則，該算法可以對(duì)筆勢(shì)、多筆畫等特征進(jìn)行正誤和工整評(píng)判。但筆畫起始點(diǎn)位置工整性的判斷，并不能代表筆段是否書寫工整。現(xiàn)實(shí)生活中，初學(xué)者及一些具有獨(dú)特書寫風(fēng)格的學(xué)者并不能按照標(biāo)準(zhǔn)筆段進(jìn)行書寫，所以該算法只能進(jìn)行初步的工整性評(píng)價(jià)，并且識(shí)別手寫漢字錯(cuò)誤的數(shù)量由制定的規(guī)則決定。

即時(shí)評(píng)價(jià)主要關(guān)注手寫漢字的局部特征，能夠及時(shí)發(fā)現(xiàn)手寫漢字的首發(fā)錯(cuò)誤并作出反饋，訓(xùn)練書寫者對(duì)漢字筆畫等基礎(chǔ)結(jié)構(gòu)的掌握。但即時(shí)評(píng)價(jià)會(huì)頻繁打斷書寫者的學(xué)習(xí)過程，與書寫者的交互形式不是很友好，影響其對(duì)整體漢字的認(rèn)識(shí)。

1.2.2 事后評(píng)價(jià)

事后評(píng)價(jià)是指對(duì)書寫完成的漢字一次性指出書寫質(zhì)量中存在的問題并給出反饋意見。事后評(píng)價(jià)的主要技術(shù)是特征比對(duì)[14-15]與反饋指導(dǎo)[16]。特征匹配是指目標(biāo)圖像或特征在數(shù)據(jù)庫(kù)中利用相似性搜索匹配結(jié)果。反饋指導(dǎo)是指根據(jù)匹配結(jié)果給出反饋意見（筆畫數(shù)目是否正確、筆畫之間的比例等關(guān)系）。事后評(píng)價(jià)的方法主要關(guān)注手寫漢字的全局特征，有利于書寫者對(duì)整體漢字的認(rèn)識(shí)，卻存在書寫錯(cuò)誤積累（初學(xué)者常見錯(cuò)誤），無法及時(shí)提醒書寫者首發(fā)錯(cuò)誤的問題，所以事后評(píng)價(jià)比較適合有一定基礎(chǔ)的書寫者。

事后評(píng)價(jià)的一般步驟為：（1）提取手寫漢字的特征，特征包括部件（筆畫、關(guān)鍵點(diǎn)等）、整體（骨架、章法布局等）；（2）特征匹配；（3）根據(jù)匹配相似度結(jié)果給出規(guī)范性指導(dǎo)。也可將步驟（1）和步驟（2）在圖像處理中一起實(shí)現(xiàn)。其中閆文耀等人[17]針對(duì)現(xiàn)實(shí)生活中手寫漢字存在連筆、個(gè)性化書寫風(fēng)格等問題導(dǎo)致手寫漢字分割困難，提出基于圖像紋理的書寫質(zhì)量評(píng)價(jià)方法。該方法通過Gabor對(duì)全局特征進(jìn)行提取，利用支持向量機(jī)的統(tǒng)計(jì)學(xué)習(xí)方法對(duì)書寫質(zhì)量進(jìn)行評(píng)價(jià)。在CHAED數(shù)據(jù)集下，手寫漢字的書寫質(zhì)量評(píng)價(jià)準(zhǔn)確率達(dá)到了95%。其優(yōu)點(diǎn)是放棄了分割的過程，避免由分割失誤對(duì)評(píng)價(jià)結(jié)果產(chǎn)生誤差。但是此評(píng)價(jià)結(jié)果只有優(yōu)秀和一般兩種，不能具體指出手寫漢字特征錯(cuò)誤位置及原因。

1.3 評(píng)價(jià)指標(biāo)

手寫漢字的評(píng)價(jià)指標(biāo)主要由反饋指導(dǎo)的形式?jīng)Q定。目前關(guān)于手寫漢字的反饋指導(dǎo)形式主要有：文字評(píng)價(jià)、評(píng)分以及圖形輔助三種。在書寫質(zhì)量評(píng)價(jià)的一般框架下，不同手寫漢字評(píng)價(jià)方法需要依據(jù)手寫漢字的字體、評(píng)價(jià)結(jié)果以及數(shù)據(jù)規(guī)模大小的不同進(jìn)行改進(jìn)，為了驗(yàn)證手寫漢字評(píng)價(jià)效果，可參考以下評(píng)價(jià)指標(biāo)。

1.3.1 人工評(píng)價(jià)

當(dāng)反饋指導(dǎo)的形式為文字評(píng)價(jià)時(shí)，好的文字評(píng)價(jià)指標(biāo)應(yīng)該滿足：（1）準(zhǔn)確性。從評(píng)價(jià)文本的內(nèi)容來看，評(píng)價(jià)文本能正確體現(xiàn)手寫漢字的缺點(diǎn)以及對(duì)缺點(diǎn)的分析。（2）流暢性。由于評(píng)價(jià)文本是基于自然語(yǔ)言進(jìn)行描述，因此文本需要語(yǔ)法正確并且流暢，方便書寫者閱讀理解。（3）相似性。生成的評(píng)價(jià)文本與參考評(píng)價(jià)文本之間的相似度越高表明模型的訓(xùn)練效果越好。

人工評(píng)價(jià)時(shí)，將得分項(xiàng)設(shè)為1~5（1為最低等級(jí)，5為最高等級(jí)），研究者會(huì)邀請(qǐng)有一定經(jīng)驗(yàn)的教師閱讀評(píng)價(jià)文本進(jìn)行打分。不同教師存在個(gè)性、認(rèn)真態(tài)度、評(píng)價(jià)經(jīng)驗(yàn)等差異性導(dǎo)致評(píng)分存在偏差，可通過金字塔方法[18]解決以上問題。雖然人工評(píng)價(jià)的成本較高，但此評(píng)估方法依舊是當(dāng)前研究工作中重要的一部分。

1.3.2 自動(dòng)評(píng)價(jià)

（1）BLEU

BLEU（bilingual evaluation understudy）指標(biāo)用于比較生成文本與參考文本之間n元詞組的重合程度，其中共有四元詞組，BLEU-1代表一元詞組，以此類推。BLEU指標(biāo)的取值越高（n元詞組重合程度越高），生成文本質(zhì)量越高，其公式如下：

其中，Wn表示權(quán)重，pn表示精度，BP是懲罰因子。

（2）METEOR

METEOR（metric for evaluation of translation with explicit ordering）指標(biāo)在考慮詞性的同時(shí)還擴(kuò)充了同義詞集。在評(píng)價(jià)生成文本流暢度時(shí)應(yīng)用了chunk，每個(gè)chunk的平均長(zhǎng)度越長(zhǎng)，生成文本與參考文本的語(yǔ)序越一致。其公式如下：

其中，c表示生成文本的長(zhǎng)度，r表示參考文本的長(zhǎng)度，m為參考文本中能夠被匹配的一元組數(shù)量，pen為懲罰因子（懲罰生成文本與參考文本詞序差距過大），其計(jì)算公式為：

其中，#chunk是指chunk的數(shù)量，chunk是指既在輸出文本中相鄰又在真實(shí)文本中相鄰的一元組聚集而成的單位。

（3）ROUGE

ROUGE（recall-oriented understudy for gisting evaluation）指標(biāo)可以分為ROUGE-N和ROUGE-L。其中，ROUGE-N主要用于計(jì)算兩個(gè)句子之間n元詞組的重合率，ROUGE-L計(jì)算最長(zhǎng)公共子序列的重合率。其公式為：

其中，Countmatch(gramn)表示生成文本與參考文本中同時(shí)出現(xiàn)n-gram的個(gè)數(shù)，count(x)表示x出現(xiàn)的次數(shù)，{RefSummaries}是參考文本。

ROUGE-L的計(jì)算公式如下：

其中，X表示輸出文本，Y表示真實(shí)文本，m表示生成文本的長(zhǎng)度，n表示輸出文本的長(zhǎng)度。

（4）CIDER

CIDER（consensus-based image description evaluation）指標(biāo)通過度量生成文本與參考文本之間的相似性來判定質(zhì)量。利用TF-IDF的余弦夾角對(duì)每個(gè)參考句子與生成句子之間的相似度進(jìn)行度量。其公式如下所示：

其中，gn(ci)和gn(sij)是TF-IDF向量，ci是生成文本的句子，參考文本句子集合si={si1,si2,…,sim}，當(dāng)使用了長(zhǎng)度不同的n元詞組時(shí)，存在以下公式：

2 手寫漢字評(píng)價(jià)方法

為了實(shí)現(xiàn)手寫漢字的準(zhǔn)確評(píng)價(jià)，研究人員不斷利用各種方法實(shí)現(xiàn)手寫漢字評(píng)價(jià)，其正在成為不需要教師參與就可以自動(dòng)生成評(píng)價(jià)的可行技術(shù)。現(xiàn)有的技術(shù)可分為以下幾種方法：基于規(guī)則、基于特征相似度計(jì)算、基于模糊矩陣以及基于機(jī)器學(xué)習(xí)。這些方法存在各自的優(yōu)缺點(diǎn)，具體情況如表2所示。

表2 手寫漢字評(píng)價(jià)方法Table 2 Classification of handwritten Chinese character evaluation methods

2.1 基于規(guī)則的方法

基于規(guī)則的方法是根據(jù)理論描述成分與成分之間的結(jié)構(gòu)關(guān)系和意義關(guān)系，并應(yīng)用其中的關(guān)系對(duì)事物進(jìn)行分析。將基于規(guī)則的方法與手寫漢字結(jié)合，領(lǐng)域?qū)＜覐母髯圆煌慕嵌瘸霭l(fā)，制定不同的規(guī)則對(duì)手寫漢字進(jìn)行評(píng)測(cè)[19]。此方法遵循以下步驟：首先從手寫漢字中找到可以描述手寫漢字特征的表示，然后通過決策樹等不同的算法對(duì)特征表示進(jìn)行判斷，進(jìn)而得到手寫漢字的書寫質(zhì)量評(píng)價(jià)。這是一種最基礎(chǔ)的手寫漢字評(píng)價(jià)方法，而對(duì)每種筆畫制定規(guī)則限制了它在大規(guī)模數(shù)據(jù)下的評(píng)價(jià)任務(wù)。

莊崇彪等人[13]利用單筆畫框、多筆畫框以及筆段八方向編碼對(duì)筆畫特征以及筆畫間特征制定了規(guī)范性規(guī)則，通過閾值對(duì)特征的限制實(shí)現(xiàn)等級(jí)分類。實(shí)驗(yàn)結(jié)果表明此方法只對(duì)規(guī)范的漢字特征提取效果較好，并且書寫錯(cuò)誤類型判斷是否全面由規(guī)則決定，這限制了評(píng)價(jià)的準(zhǔn)確性與多樣性。

特征描述的貼切程度對(duì)書寫質(zhì)量評(píng)價(jià)的準(zhǔn)確性起到?jīng)Q定作用，特征描述越詳細(xì)評(píng)價(jià)效果越好。韓睿方等人[20]為了提高識(shí)別手寫漢字中錯(cuò)誤的效率，利用決策樹實(shí)現(xiàn)手寫漢字筆畫關(guān)鍵點(diǎn)之間的距離差以及筆段的水平傾角、彎曲程度等細(xì)節(jié)的不同等級(jí)分類。該方法通過收集50個(gè)不同學(xué)歷的人書寫的手寫漢字筆畫，每個(gè)筆畫采集10~20次，在此數(shù)據(jù)集上進(jìn)行測(cè)評(píng)，結(jié)果顯示宏觀特征的評(píng)判效果達(dá)到了100%的召回率，微觀特征評(píng)判效果的準(zhǔn)確率與召回率都在80%以上。Tan[21]提出了低整數(shù)編碼對(duì)原始筆畫特征和字符特征進(jìn)行表示，可識(shí)別出手寫漢字筆畫類型、順序等問題。與韓睿方提出的方法相比，此方法對(duì)筆畫等特征的評(píng)判要求較低，并且缺少漢字結(jié)構(gòu)的評(píng)價(jià)，更適合初學(xué)者練習(xí)手寫漢字。

這種基于規(guī)則的方法是手寫漢字評(píng)價(jià)最初成功的方法，為接下來的研究奠定了堅(jiān)實(shí)的基礎(chǔ)。此方法雖然簡(jiǎn)單但存在局限性：第一，需要對(duì)數(shù)據(jù)庫(kù)里每一個(gè)手寫漢字（筆畫）制定規(guī)則。若出現(xiàn)一個(gè)從未出現(xiàn)的漢字（筆畫），需要添加新的規(guī)則，并且新添加的規(guī)則容易與前面制定的規(guī)則發(fā)生沖突。手寫漢字評(píng)價(jià)廣泛地應(yīng)用于中小學(xué)等不同人群，其需要的數(shù)據(jù)不同，并且不斷要求有新字出現(xiàn)，而字庫(kù)卻相對(duì)固定，所以基于規(guī)則的方法無法滿足所有用戶的需求。第二，規(guī)則的覆蓋性較差。有些手寫漢字的筆畫、結(jié)構(gòu)書寫復(fù)雜，手寫漢字的規(guī)則很難總結(jié)全面，這也是這類方法進(jìn)行書寫質(zhì)量評(píng)價(jià)結(jié)果不理想的原因。

2.2 基于特征相似度計(jì)算的方法

這類方法主要受到文字識(shí)別研究的啟發(fā)[22]。在評(píng)價(jià)手寫漢字時(shí)，手寫漢字與模板漢字之間的差異大小，由特征相似度決定。該方法主要執(zhí)行以下步驟：（1）提取手寫漢字的特征。（2）與模板漢字特征進(jìn)行相似度計(jì)算，以相似度高低作為評(píng)價(jià)書寫質(zhì)量的指標(biāo)。

漢字大多結(jié)構(gòu)復(fù)雜，在一定程度上限制了手寫漢字進(jìn)行相似度計(jì)算的速率，在保證特征信息完整的情況下，如何快速地進(jìn)行相似度計(jì)算是提高書寫質(zhì)量評(píng)價(jià)效率的關(guān)鍵步驟。不同手寫漢字特征，相似度計(jì)算的速率不同。在書法字檢索中[23]，利用骨架以及輪廓特征與數(shù)據(jù)庫(kù)中的漢字進(jìn)行特征相似度計(jì)算實(shí)現(xiàn)檢索，骨架特征相比輪廓特征檢索的時(shí)間減少了70%，提高了檢索效率，實(shí)現(xiàn)在較大規(guī)模的漢字集中能夠快速完成特征匹配問題。手寫漢字特征包含能夠描述手寫漢字特性、結(jié)構(gòu)、整體等的特征，進(jìn)行評(píng)價(jià)時(shí)不僅需要考慮不同特征組合對(duì)評(píng)價(jià)的影響，還應(yīng)該考慮特征自身特點(diǎn)對(duì)評(píng)價(jià)的影響。鄧學(xué)雄等人[24]將局部和整體特征一起作為評(píng)價(jià)手寫漢字的粒度，他們認(rèn)為初學(xué)者進(jìn)行臨帖練習(xí)效果的好壞由臨帖字體與原帖字體之間的相似度決定，并且利用PS工具提取手寫漢字的筆畫（局部特征），分別利用數(shù)學(xué)形態(tài)細(xì)化法以及圖像投影的方法提取手寫漢字的骨架特征和章法布局（整體特征），對(duì)手寫漢字的局部特征以及整體特征與模板漢字相應(yīng)部分進(jìn)行歐氏距離計(jì)算，由相似度決定書寫質(zhì)量。但此方法的缺點(diǎn)是：（1）適用于初學(xué)者。毛筆字練習(xí)者初期臨摹原貼中字的形態(tài)、結(jié)構(gòu)等，后期應(yīng)在初期的基礎(chǔ)上不斷創(chuàng)新，形成具有風(fēng)格的字體。而漢字風(fēng)格特征是一種附著在骨架特征上的輪廓形態(tài)特征[25]，所以骨架相似度計(jì)算并不適合后期的學(xué)習(xí)。（2）不適用于數(shù)據(jù)量大的毛筆字臨帖評(píng)價(jià)。此方法中筆畫的提取是利用PS工具，對(duì)數(shù)據(jù)量較大的手寫漢字進(jìn)行評(píng)價(jià)時(shí)，提取筆畫特征將花費(fèi)大量時(shí)間。其中李牧[26]認(rèn)為鄧學(xué)雄的算法沒有考慮到筆畫簡(jiǎn)單的疊加進(jìn)行相似度計(jì)算的結(jié)果將受到結(jié)構(gòu)信息的影響。為了筆畫特征不受旋轉(zhuǎn)、形狀區(qū)域平移的影響，李牧利用Hu矩進(jìn)行筆畫的相似度計(jì)算。而吳楚洲[27]認(rèn)為李牧在進(jìn)行骨架相似度計(jì)算時(shí)，很難取到不同骨架相同的對(duì)應(yīng)點(diǎn)，所以將骨架進(jìn)行米字格或九宮格的劃分，與模板漢字相同區(qū)域內(nèi)的骨架利用Hu矩進(jìn)行相似度計(jì)算。該方法對(duì)書寫等級(jí)較低的用戶來說，臨摹時(shí)容易出現(xiàn)手寫漢字筆畫與模板漢字對(duì)應(yīng)筆畫不在同一區(qū)域內(nèi)的缺點(diǎn)。

在以上實(shí)驗(yàn)中模板漢字是事先提供的，不存在檢索模板漢字的過程，也不需要考慮識(shí)別模板漢字的計(jì)算速率。而在現(xiàn)實(shí)生活中，進(jìn)行考試等評(píng)估工作時(shí)不允許提供模板漢字，而平時(shí)的書寫練習(xí)可以提供模板漢字，所以將書寫質(zhì)量評(píng)價(jià)系統(tǒng)設(shè)置為考試模式和練習(xí)模式才具有廣泛的適用性。邵榮棠[28]對(duì)書法字檢索效率低以及如何全面評(píng)價(jià)手寫漢字問題進(jìn)行解決，設(shè)計(jì)出練習(xí)模式的評(píng)價(jià)系統(tǒng)。解決方法主要包括四個(gè)步驟：首先，提出一種改進(jìn)的書法字雙層檢索方法提高手寫漢字識(shí)別的準(zhǔn)確率，從數(shù)據(jù)庫(kù)中快速查找出手寫漢字的模板漢字。接著，針對(duì)檢索出的模板漢字提出基于Z-S算法改進(jìn)的單像素化處理算法，得到手寫漢字整體骨架特征并且進(jìn)行相似度計(jì)算。然后，對(duì)處理完成的書法字骨架進(jìn)行九宮格的切分，利用Hu矩對(duì)切分出的骨架與模板漢字對(duì)應(yīng)九宮格區(qū)域內(nèi)的骨架進(jìn)行相似度計(jì)算，得到筆段特征相似度值。最后，通過計(jì)算手寫漢字到邊框的距離與手寫漢字的整體布局得到布局特征相似度。此方法有效利用手寫漢字特征，實(shí)現(xiàn)在不影響特征信息的前提下對(duì)特征進(jìn)行處理，加快特征相似度計(jì)算的效率，但忽略了筆畫的對(duì)比信息，對(duì)手寫漢字的評(píng)價(jià)信息未能達(dá)到具體精細(xì)并且其評(píng)價(jià)指標(biāo)較少不能得到客觀評(píng)價(jià)。

該方法雖然實(shí)現(xiàn)簡(jiǎn)單卻有較多的缺點(diǎn)：（1）手寫漢字的特征選擇代表了當(dāng)前手寫漢字的特性，如果沒有充分考慮手寫漢字特征僅將幾個(gè)特征進(jìn)行計(jì)算，就會(huì)造成手寫漢字評(píng)價(jià)不全面。這是此類方法結(jié)果不理想不可避免的原因。（2）手寫漢字特征提取的效果影響評(píng)價(jià)結(jié)果。如手寫漢字骨架提取效果影響全局特征，而骨架提取過程中毛刺的產(chǎn)生是不可避免的，所以將骨架的毛刺去除至光滑或只存在較少的毛刺對(duì)手寫漢字的評(píng)價(jià)是至關(guān)重要的。

2.3 基于模糊矩陣的方法

手寫漢字評(píng)價(jià)不能僅局限于與模板漢字對(duì)比，其書寫風(fēng)格也應(yīng)該被接納。由于每個(gè)人的書寫習(xí)慣以及學(xué)習(xí)背景不同，所以手寫漢字具有其自身的特點(diǎn)。而模糊矩陣恰好可以實(shí)現(xiàn)在不忽略每種手寫漢字風(fēng)格的基礎(chǔ)上，進(jìn)行相似度計(jì)算。這類方法將需要評(píng)判的特征構(gòu)成模糊子集，選取適合當(dāng)前特征的隸屬度函數(shù)進(jìn)行計(jì)算得到隸屬度，由當(dāng)前手寫漢字隸屬度與模板漢字隸屬度之間的相似度決定手寫漢字評(píng)價(jià)。特征的選擇對(duì)手寫漢字是否可以得到全面評(píng)價(jià)起到關(guān)鍵作用[29]。易于提取的手寫漢字大小、重心等全局特征對(duì)手寫漢字只起到了宏觀范圍的指導(dǎo)，全局特征與局部特征相結(jié)合才會(huì)較全面地評(píng)價(jià)手寫漢字。

王耀等人[30]首先對(duì)52個(gè)大小寫英文字母構(gòu)建模式庫(kù)，將模板字母的比例質(zhì)量、位置質(zhì)量、大小質(zhì)量以及筆畫質(zhì)量的分析參數(shù)進(jìn)行存儲(chǔ)，然后針對(duì)不同特征選擇不同的函數(shù)進(jìn)行模糊化得到隸屬度，最后與模板字母隸屬度進(jìn)行相似度計(jì)算，根據(jù)閾值的劃分得到不同的評(píng)價(jià)。該方法對(duì)250個(gè)不同書寫形狀“A”的書寫質(zhì)量進(jìn)行評(píng)價(jià)，實(shí)驗(yàn)結(jié)果表明其最高有效率達(dá)到97.8%。此方法僅適用于構(gòu)成元素較少的書寫體中，而漢字?jǐn)?shù)目眾多且結(jié)構(gòu)復(fù)雜，對(duì)每個(gè)漢字建立模式庫(kù)是不現(xiàn)實(shí)的，所以此方法不適用于手寫漢字的書寫質(zhì)量評(píng)價(jià)中。樊亮[31-32]發(fā)現(xiàn)學(xué)者在觸摸屏上進(jìn)行書寫時(shí)，因書寫能力不同產(chǎn)生筆力均勻、筆力過輕和筆力過重三種現(xiàn)象，并且利用模糊數(shù)學(xué)實(shí)現(xiàn)筆力模糊評(píng)價(jià)。該方法首先根據(jù)書寫特點(diǎn)建立8種關(guān)鍵點(diǎn)類型，然后通過高斯函數(shù)得到手寫漢字每個(gè)筆畫關(guān)鍵點(diǎn)的隸屬度，與模板漢字關(guān)鍵點(diǎn)隸屬度進(jìn)行相似度計(jì)算，最后根據(jù)隸屬度的貼近程度得到手寫漢字的等級(jí)評(píng)價(jià)。與王耀提出的方法相比，該方法并沒有存儲(chǔ)所有模板漢字關(guān)鍵點(diǎn)的分析參數(shù)，而是將模板漢字與手寫漢字一起利用算法得到隸屬度，避免了存儲(chǔ)筆畫數(shù)據(jù)帶來數(shù)據(jù)臃腫的缺點(diǎn)，具有更廣泛的應(yīng)用性。但筆力僅是書寫質(zhì)量中的一部分，還需要其他指標(biāo)（大小、比例、傾斜等）的分析才可以得到較全面的手寫漢字評(píng)價(jià)[33]。

書寫質(zhì)量區(qū)間是評(píng)價(jià)的最重要部分，以上方法都是研究者設(shè)置書寫質(zhì)量區(qū)間，區(qū)間范圍的設(shè)置難免會(huì)存在主觀性。而葛佳敏[34]首先利用模糊概率分布可以解決多值分析的問題，得到每個(gè)分類值的權(quán)重和每個(gè)特征的期望值。然后利用模糊綜合評(píng)價(jià)將不同特征期望值在模型中計(jì)算，進(jìn)而得到整個(gè)字的期望值。最后將期望值與得到的期望值范圍進(jìn)行比較，得出手寫漢字的評(píng)價(jià)。其中，期望值范圍指手寫漢字整體期望值在某一值以上時(shí)書寫質(zhì)量較為規(guī)范。這種方法不再需要人為設(shè)置評(píng)價(jià)標(biāo)準(zhǔn)，也不需要大量的模板漢字作為參照對(duì)象，使評(píng)價(jià)結(jié)果具有公正客觀性。

對(duì)于書寫質(zhì)量區(qū)間的設(shè)置，王求真等人[35]的算法具有較好的效率。其主要針對(duì)評(píng)價(jià)手寫漢字時(shí)常見的幾種問題：（1）字形結(jié)構(gòu)復(fù)雜。（2）不同的書寫風(fēng)格。（3）筆畫模糊不規(guī)范等等，提出模糊分析方法。該算法的基本思路為：首先根據(jù)聯(lián)機(jī)設(shè)備獲得手寫漢字的局部特征（關(guān)鍵點(diǎn)）和全局特征（比例、大小和位置等）的信息，分別利用高斯法和統(tǒng)計(jì)實(shí)驗(yàn)進(jìn)行模糊化。

手寫漢字的特征向量模糊計(jì)算如以下公式所示[24]：

其中，式（14）中xs表示當(dāng)前手寫漢字的特征向量（除重心外），as為特征分布的中心，b和c分別為分布情況圖范圍的最大值與最小值。式（15）為手寫漢字重心的模糊計(jì)算，其中xw表示當(dāng)前手寫漢字的重心特征向量，x與y分別為當(dāng)前手寫漢字重心的橫坐標(biāo)與縱坐標(biāo)，xˉ與yˉ分別為模板漢字重心的橫坐標(biāo)與縱坐標(biāo)。

最后與模板漢字相應(yīng)的特征進(jìn)行相似度計(jì)算，其中筆畫特征相似度計(jì)算的公式為：

A、B分別代表手寫漢字和模板漢字，表示手寫漢字A中第i筆畫的模糊度。

結(jié)構(gòu)特征值進(jìn)行相似度計(jì)算的公式為：

其中，μai表示手寫漢字A中結(jié)構(gòu)質(zhì)量的3個(gè)指標(biāo)（大小、比例、位置）模糊度集合。根據(jù)獲得的筆畫相似度和結(jié)構(gòu)相似度通過權(quán)值分配的方法得到手寫漢字的評(píng)分，若手寫漢字的筆畫和結(jié)構(gòu)與模板漢字對(duì)應(yīng)部分的相似度任意一項(xiàng)小于0.5，則取其中最小值作為評(píng)價(jià)分?jǐn)?shù)。

研究者通過收集200個(gè)常見漢字進(jìn)行500次隨機(jī)書寫并進(jìn)行實(shí)驗(yàn)，結(jié)果表明其準(zhǔn)確率最高可達(dá)90.42%。其中書寫質(zhì)量閾值的設(shè)置來源于統(tǒng)計(jì)模板漢字區(qū)間分布，但區(qū)間選擇只選取統(tǒng)計(jì)模板的高頻區(qū)間，使評(píng)價(jià)不能達(dá)到絕對(duì)的公正客觀。

這類研究充分利用手寫漢字特征，如手寫漢字的關(guān)鍵點(diǎn)、重心和筆畫等，其評(píng)價(jià)的效果也隨著特征信息的增加而不斷變好，但其本質(zhì)是忽略手寫漢字的細(xì)節(jié)與模板漢字進(jìn)行相似度計(jì)算，雖然解決了手寫漢字風(fēng)格描述困難的問題，但對(duì)于一些難以區(qū)分的漢字（如“士”“土”，其各自的模糊矩陣非常相似）需要定量分析才可以解決。并且每種特征應(yīng)該選取合適的隸屬函數(shù)，若提取出多種不同屬性的特征，其隸屬函數(shù)的選擇與構(gòu)建是一個(gè)相當(dāng)繁瑣且耗時(shí)的事情，所以隸屬函數(shù)的泛化是解決此問題的關(guān)鍵。

2.4 基于機(jī)器學(xué)習(xí)的方法

機(jī)器學(xué)習(xí)是研究計(jì)算機(jī)模擬人類學(xué)習(xí)的科學(xué)，主要學(xué)習(xí)如何利用有效信息，從數(shù)據(jù)中獲取隱藏的、可理解的知識(shí)。在手寫漢字評(píng)價(jià)任務(wù)中，利用機(jī)器學(xué)習(xí)從大量數(shù)據(jù)中學(xué)習(xí)手寫漢字特征與評(píng)價(jià)之間的關(guān)系，避免人工評(píng)價(jià)效率低、具有主觀性等缺點(diǎn)。

2.4.1 基于深度學(xué)習(xí)的方法

深度學(xué)習(xí)是一種數(shù)據(jù)驅(qū)動(dòng)的端到端的方法，其通過學(xué)習(xí)樣本數(shù)據(jù)內(nèi)在規(guī)律，組合低層特征形成高層特征，用來發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示，更能夠刻畫數(shù)據(jù)的內(nèi)在信息，其在各個(gè)領(lǐng)域都有很多成果[36]。在手寫漢字評(píng)價(jià)任務(wù)中，運(yùn)用深度神經(jīng)網(wǎng)絡(luò)自動(dòng)對(duì)手寫漢字中隱藏的特征進(jìn)行挖掘，在模板漢字中查找與輸入漢字特征最相近的模板漢字，對(duì)其進(jìn)行排序，繼而實(shí)現(xiàn)手寫漢字評(píng)價(jià)，其一般流程如圖3所示。

圖3 基于深度學(xué)習(xí)的手寫漢字評(píng)價(jià)方法Fig.3 Handwritten Chinese character evaluation method based on deep learning

這些方法可以高效地代替人工提取特征，尤其在大規(guī)模的數(shù)據(jù)集上改變傳統(tǒng)筆畫、部件間距等繁雜的特征提取過程，可以更深層次地挖掘手寫漢字的特征信息，使手寫漢字評(píng)價(jià)結(jié)果的準(zhǔn)確率提高。常用的深度學(xué)習(xí)技術(shù)包括卷積神經(jīng)網(wǎng)絡(luò)（convolutional neural network，CNN）、BP神經(jīng)網(wǎng)絡(luò)（BP neural network，BPNN）等。

（1）基于BP神經(jīng)網(wǎng)絡(luò)的方法

以上方法大多利用歐氏距離進(jìn)行相似度計(jì)算，而歐氏距離的計(jì)算容易受到特征結(jié)構(gòu)、旋轉(zhuǎn)等因素的影響，并且如何找到不同骨架的對(duì)應(yīng)點(diǎn)也是值得考慮的地方。而人工神經(jīng)網(wǎng)絡(luò)可以通過自身的訓(xùn)練學(xué)習(xí)規(guī)則，并不需要事先指定輸入與輸出之間的關(guān)系，就可以得到最接近期望的結(jié)果，可避免特征結(jié)構(gòu)、旋轉(zhuǎn)等因素的影響以及找不準(zhǔn)對(duì)應(yīng)點(diǎn)帶來的誤差。

其中BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程由正向傳播和反向傳播組成，正向傳播過程輸出的結(jié)果與實(shí)際期望不相符時(shí)，則轉(zhuǎn)入反向傳播。反向傳播通過誤差分?jǐn)偟乃枷?，使誤差沿梯度方向下降。正向傳播與反向傳播是周而復(fù)始地進(jìn)行的，是權(quán)值不斷調(diào)整以及網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程，直到輸出的誤差減少到可接受的程度或達(dá)到預(yù)先設(shè)置的學(xué)習(xí)次數(shù)為止，其中BP神經(jīng)網(wǎng)絡(luò)模型如圖4所示。

圖4 BP神經(jīng)網(wǎng)絡(luò)模型圖Fig.4 BP neural network model diagram

其中前向傳播首先根據(jù)屬性的個(gè)數(shù)設(shè)置輸入層神經(jīng)單元的個(gè)數(shù)，除了輸入層外其他各層的輸入值為上一層輸出值與各自權(quán)重wij乘積后累加的結(jié)果加上偏置θj，每個(gè)結(jié)點(diǎn)的輸出值等于輸入值在激活函數(shù)f(?)的作用下作變換，則前向傳播輸出層的計(jì)算過程如下式所示：

因最初神經(jīng)網(wǎng)絡(luò)的權(quán)重和偏置都是隨機(jī)獲取，因此需要根據(jù)網(wǎng)絡(luò)的輸出層調(diào)整網(wǎng)絡(luò)的權(quán)重值和偏置值縮小差異。逆向傳播過程如公式（21）所示：

其中，Ej表示第j個(gè)結(jié)點(diǎn)的誤差值，Oj表示第j個(gè)結(jié)點(diǎn)的輸出值，Wjk表示當(dāng)前層的結(jié)點(diǎn)j到下一層結(jié)點(diǎn)k的權(quán)重值，Ek表示下一層結(jié)點(diǎn)k的誤差率。

權(quán)重值和偏置值調(diào)整公式如下所示：

其中，λ∈(0,1)，表示學(xué)習(xí)率。

BP神經(jīng)網(wǎng)絡(luò)因其具有較強(qiáng)的自適應(yīng)性和自學(xué)習(xí)能力，以及能夠以任意精度逼近任何非線性連續(xù)函數(shù)使其很好地求解內(nèi)部機(jī)制復(fù)雜的問題，而被應(yīng)用于手寫漢字評(píng)價(jià)中，將手寫漢字中提取的特征作為BP神經(jīng)網(wǎng)絡(luò)輸入值，通過學(xué)習(xí)輸入數(shù)據(jù)的隱藏規(guī)則輸出手寫漢字的評(píng)價(jià)。

為了手寫漢字的書寫質(zhì)量評(píng)價(jià)效果更優(yōu)秀，實(shí)驗(yàn)采用了神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)計(jì)算方法相結(jié)合的方法。手寫漢字的特征值越詳細(xì)，BP神經(jīng)網(wǎng)絡(luò)對(duì)手寫漢字進(jìn)行評(píng)價(jià)的效果以及反饋越好。一些研究人員借助聯(lián)機(jī)工具，獲取到更多可利用的手寫漢字信息[37]。例如，根據(jù)筆畫的起點(diǎn)和端點(diǎn)、筆勢(shì)的走向、筆畫的像素點(diǎn)集合等，這些信息在圖像處理過程中較難獲取，并且通常都會(huì)對(duì)手寫漢字評(píng)價(jià)是否全面起到關(guān)鍵作用。

黃峰[38]利用聯(lián)機(jī)設(shè)備獲取到每個(gè)手寫漢字的關(guān)鍵點(diǎn)以及筆畫端點(diǎn)坐標(biāo)等信息，通過外包矩陣以及重心的距離比值等方法得到手寫漢字的筆畫、部件特征，將其作為BP神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練，從而構(gòu)建了手寫漢字評(píng)價(jià)模型。Sun等人[39]通過3個(gè)4層的BP神經(jīng)網(wǎng)絡(luò)，分別對(duì)全局特征、布局特征以及混合特征進(jìn)行美感分析，并且使用支持向量機(jī)對(duì)全局特征進(jìn)行分類，這種方法更多專注于手寫漢字的全局特征，不能滿足漢字書寫質(zhì)量評(píng)價(jià)的細(xì)節(jié)需求。耿曉艷等人[40]利用三層BP神經(jīng)網(wǎng)絡(luò)分別構(gòu)建了四個(gè)評(píng)價(jià)模型，對(duì)9項(xiàng)（復(fù)雜度、形態(tài)結(jié)構(gòu)特征、黑像素總數(shù)等）特征進(jìn)行不同組合作為輸入值，得到11個(gè)角度的手寫漢字評(píng)價(jià)，該方法只對(duì)標(biāo)準(zhǔn)體的漢字具有較好的評(píng)價(jià)效果。

以上方法進(jìn)行手寫漢字的書寫質(zhì)量評(píng)價(jià)時(shí)，其準(zhǔn)確性與運(yùn)行速率將受到BP神經(jīng)網(wǎng)絡(luò)和手寫漢字特征兩方面的影響。

BP神經(jīng)網(wǎng)絡(luò)方面：（1）因BP神經(jīng)網(wǎng)絡(luò)需要解決復(fù)雜的非線性化問題，權(quán)值是通過局部改善的方法逐漸調(diào)整，從而權(quán)值容易收斂于局部極小點(diǎn)，使手寫漢字評(píng)價(jià)的訓(xùn)練結(jié)果達(dá)不到最優(yōu)效果。（2）BP神經(jīng)網(wǎng)絡(luò)對(duì)初始權(quán)值非常敏感，而隨機(jī)獲取的不同初始化權(quán)值極易出現(xiàn)收斂于不同局部極小值的情況，導(dǎo)致每次訓(xùn)練得到不同結(jié)果。相同手寫漢字在同一評(píng)測(cè)規(guī)則下評(píng)分結(jié)果應(yīng)該保持一致，而BP神經(jīng)網(wǎng)絡(luò)的運(yùn)算結(jié)果并不滿足以上評(píng)分條件。（3）BP神經(jīng)網(wǎng)絡(luò)算法本質(zhì)為梯度下降法，調(diào)整權(quán)值的方向由誤差與權(quán)值的一階導(dǎo)數(shù)決定，而在BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中，慣性因子是固定的，這導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)的收斂速度達(dá)不到理想狀態(tài)，并且為了保證BP神經(jīng)網(wǎng)絡(luò)的收斂性，學(xué)習(xí)率必須小于某一閾值，這同樣導(dǎo)致收斂速度不理想，影響手寫漢字評(píng)價(jià)的運(yùn)行速度。

手寫漢字特征方面：目前并沒有總結(jié)出可以完全描述手寫漢字特點(diǎn)的特征值，而是將獲得的信息全部進(jìn)行手寫漢字評(píng)價(jià)，但有些手寫漢字特征的信息包含在其他組合手寫漢字特征中[41]。例如手寫漢字的重心、面積和長(zhǎng)寬比數(shù)值的組合特征就可得出手寫漢字距離各邊框的長(zhǎng)度，特征提取時(shí)就可以忽略被包含的特征，所以分析出一組可得到手寫漢字全面評(píng)價(jià)的特征是非常重要的。該方法為了獲得更多有用信息，得到較全面的評(píng)價(jià)使用了聯(lián)機(jī)設(shè)備，而在生活中每個(gè)人擁有聯(lián)機(jī)設(shè)備是不現(xiàn)實(shí)的。為了廣泛普及手寫漢字評(píng)價(jià)，如何在不使用聯(lián)機(jī)設(shè)備的情況下，高效、準(zhǔn)確地提取出手寫漢字特征，獲得更多有價(jià)值信息是值得去研究的。

（2）基于卷積神經(jīng)網(wǎng)絡(luò)的方法

卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)在計(jì)算機(jī)視覺領(lǐng)域取得了巨大的成功，其不僅具有表達(dá)效果隨著網(wǎng)絡(luò)層數(shù)的增加而增加的優(yōu)點(diǎn)，而且無需手動(dòng)選取特征。在手寫漢字評(píng)價(jià)中，之前所有方法都需要人工參與提取特征，算法只是根據(jù)特征進(jìn)行分類或預(yù)測(cè)，因此人工提取的特征才對(duì)書寫質(zhì)量評(píng)價(jià)的性能起到了關(guān)鍵作用。特征提取不僅需要專業(yè)知識(shí)而且還花費(fèi)大量人力。目前，因手寫漢字結(jié)構(gòu)復(fù)雜，局部特征的提取效果較差并且提取的特征數(shù)量有限等問題在一定程度上限制了評(píng)價(jià)的全面性，而卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)似乎打破了這種僵局[42]。

典型的卷積神經(jīng)網(wǎng)絡(luò)通常包括卷積、池化以及全連接三種基本操作，對(duì)圖像不斷進(jìn)行卷積和池化運(yùn)算，在保留圖片重要信息的前提下提取圖片的抽象特征。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖5所示。

圖5 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Convolutional neural network structure

卷積層（convolutional layer）是卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算的核心。卷積層利用不同尺度的卷積核對(duì)輸入數(shù)據(jù)進(jìn)行卷積運(yùn)算，當(dāng)前層的特征是利用激活函數(shù)將輸出值進(jìn)行非線性變換得到，如式（26）所示：

池化層（pooling layer）主要對(duì)卷積層的特征進(jìn)行降維，將像素矩陣大小降為原來尺寸的1/n，可減少計(jì)算數(shù)量，避免由特征數(shù)量過多造成溢出現(xiàn)象，其公式如下所示：

全連接層（full connection layer）實(shí)現(xiàn)了特征到類別的轉(zhuǎn)換，用于綜合前向提取的特征，可以將卷積層或池化層中具有類別區(qū)分性的局部信息進(jìn)行整合。每個(gè)神經(jīng)元的輸出公式如下所示：

其中，wki表示第k層與前i層的連接強(qiáng)度，bk表示偏置，f(?)表示激活函數(shù)。

Dropout層也是卷積神經(jīng)網(wǎng)絡(luò)的常用結(jié)構(gòu)，其通過隨機(jī)減少單元之間的連接，在整體網(wǎng)絡(luò)中隨機(jī)采樣一個(gè)網(wǎng)絡(luò)并且更新采樣網(wǎng)絡(luò)的參數(shù)，提高網(wǎng)絡(luò)的泛化能力。

卷積神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)從圖片中提取特征，通過卷積層自行抽取圖像的形狀、圖形的拓?fù)浣Y(jié)構(gòu)以及圖片內(nèi)部一些人工無法提取的復(fù)雜結(jié)構(gòu)特征，避免了傳統(tǒng)算法中特征提取和數(shù)據(jù)重建過程，所以將其應(yīng)用在手寫漢字評(píng)價(jià)上可提高特征提取的質(zhì)量。其中莊子明[43]提出利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行手寫漢字評(píng)價(jià)，主要利用以下三部分對(duì)手寫漢字的美觀度進(jìn)行評(píng)價(jià)：CNN網(wǎng)絡(luò)提取手寫漢字特征值；CNN網(wǎng)絡(luò)監(jiān)督信號(hào)；相似度檢索以及美感評(píng)分。其思路為將手寫漢字與具有分?jǐn)?shù)的手寫漢字?jǐn)?shù)據(jù)庫(kù)進(jìn)行相似度檢索，根據(jù)檢索出具有分?jǐn)?shù)的手寫漢字確定輸入手寫漢字的分?jǐn)?shù)，手寫漢字相似度檢索包括：特征提取和特征的距離計(jì)算，其中特征提取的網(wǎng)絡(luò)圖如圖6[43]所示。

圖6 手寫漢字特征提取CNN網(wǎng)絡(luò)Fig.6 Handwritten Chinese character feature extraction CNN network

在手寫漢字特征提取CNN網(wǎng)絡(luò)中，研究者構(gòu)造了基于maxout結(jié)構(gòu)的特征提取CNN網(wǎng)絡(luò)，包括4個(gè)卷積層、4個(gè)池化層、4個(gè)maxout層、1個(gè)dropout層、1個(gè)全連接層以及2個(gè)不同的損失層。

卷積層和全連接層使用了ReLU激活函數(shù)，其公式如下所示：

在卷積神經(jīng)網(wǎng)絡(luò)中，不同激活函數(shù)適用的網(wǎng)絡(luò)類型以及領(lǐng)域不同，而激活函數(shù)的選取一般由經(jīng)驗(yàn)或?qū)嶒?yàn)決定，但由于經(jīng)驗(yàn)可能出現(xiàn)不準(zhǔn)確的情況，實(shí)驗(yàn)的驗(yàn)證時(shí)間較長(zhǎng)，所以激活函數(shù)的選擇成了難點(diǎn)。而兩個(gè)或兩個(gè)以上的maxout單元可以很好地逼近任意一個(gè)連續(xù)函數(shù)，使其不僅能在后向傳遞梯度時(shí)避免梯度消失/溢出等問題，還能阻止ReLU函數(shù)存在單元失活的問題，并且maxout單元還可以學(xué)習(xí)隱含單元之間的關(guān)系和激活函數(shù)，避免非線性激活函數(shù)引起的單元非活性化。Maxout的提出解決了激活函數(shù)選擇困難的問題，但maxout存在激活值不稀疏的缺點(diǎn)，限制了分類精度，而ReLU函數(shù)不僅可以增加網(wǎng)絡(luò)的稀疏性并且可以緩解過擬合問題。

Dropout能夠訓(xùn)練共享參數(shù)的單元模型，并且均衡這些單元模型，避免在訓(xùn)練過程中出現(xiàn)過擬合現(xiàn)象，提高模型特征學(xué)習(xí)能力。Dropout在后向傳播中更新不同訓(xùn)練子集上的不同模型，而傳統(tǒng)模型在激活函數(shù)的限制下都是總體訓(xùn)練，不能滿足dropout理想的總體分塊訓(xùn)練。Maxout利用自身的單元連續(xù)線性分段特性和特征子空間池化作用，將dropout根據(jù)掩碼的不同選擇使梯度變化傳播到網(wǎng)絡(luò)的最底層，從而確保模型中每個(gè)參數(shù)都可進(jìn)行dropout訓(xùn)練，促進(jìn)了dropout優(yōu)化并且提高了dropout快速近似模型平均技術(shù)的準(zhǔn)確性。所以在圖6中maxout、dropout以及ReLU函數(shù)結(jié)合使用可有效地提高各自性能，在保留圖片重要信息的前提下多次卷積和池化運(yùn)算可以提取圖片的抽象特征，用于特征的距離計(jì)算。

根據(jù)不同漢字書寫圖像提取的特征值相似度較低這一特征設(shè)置了漢字識(shí)別監(jiān)督信號(hào)；相同漢字書寫圖像提取的特征值相似度較高這一特征設(shè)置了漢字驗(yàn)證監(jiān)督信號(hào)。漢字識(shí)別監(jiān)督信號(hào)和漢字驗(yàn)證監(jiān)督信號(hào)這兩方面組成了監(jiān)督信號(hào)。

漢字識(shí)別監(jiān)督信號(hào)以及漢字驗(yàn)證監(jiān)督信號(hào)的損失函數(shù)如以下公式[43]所示：

其中，式（30）中X、Y分別表示樣本集合以及樣本分?jǐn)?shù)類標(biāo)號(hào)，W表示卷積網(wǎng)絡(luò)的參數(shù)。表示為第i個(gè)樣本前向傳遞到softmax層第j個(gè)單元的概率值，m為批處理參數(shù)，l{?}為指示性函數(shù)。式（31）中x1和x2表示為一個(gè)批處理中的所有圖像。Z表示這對(duì)手寫漢字圖像是否為同一個(gè)字。表示這對(duì)手寫漢字特征值的距離。

該網(wǎng)絡(luò)總體損失函數(shù)為：

其中，λ表示兩個(gè)損失函數(shù)的平衡系數(shù)。

在相似度檢索和美感評(píng)分部分中，利用余弦距離計(jì)算提取出手寫漢字的特征值與k類預(yù)先訓(xùn)練好的模板漢字特征之間的距離，得到k個(gè)概率值，則手寫漢字的分?jǐn)?shù)為概率值最大的模板漢字分?jǐn)?shù)。

余弦距離的計(jì)算如下所示：

其中，x1和x2分別表示不同手寫漢字的特征向量。

實(shí)驗(yàn)在收集的109 655張小學(xué)生手寫漢字上進(jìn)行測(cè)評(píng)，結(jié)果表明手寫漢字的美感評(píng)分總體準(zhǔn)確率可以達(dá)到95.78%。

上述基于神經(jīng)網(wǎng)絡(luò)的方法在手寫漢字評(píng)價(jià)任務(wù)上取得了較好的效果。運(yùn)用深度學(xué)習(xí)的方法自動(dòng)學(xué)習(xí)手寫漢字中的特征，避免人工提取特征過程中的誤判，并且深度學(xué)習(xí)的分布表示隨著數(shù)據(jù)量的增加而變好。目前需要人工特征提取的方法存在以下兩種缺點(diǎn)：（1）在不使用聯(lián)機(jī)設(shè)備的情況下，獲取到手寫漢字的特征僅限于重心、邊距和筆畫等，對(duì)手寫漢字進(jìn)行全面評(píng)價(jià)任面臨一系列困難。（2）手寫漢字評(píng)價(jià)系統(tǒng)最受初學(xué)者的歡迎，但初學(xué)者在進(jìn)行漢字書寫時(shí)，將每一個(gè)筆畫當(dāng)做繪畫處理并沒有體現(xiàn)出漢字的結(jié)構(gòu)化，而手寫漢字的結(jié)構(gòu)化也是書寫質(zhì)量的評(píng)價(jià)標(biāo)準(zhǔn)之一[44]。所以初學(xué)者的手寫漢字很容易出現(xiàn)筆畫與模板漢字筆畫差距較大導(dǎo)致筆畫匹配問題。筆畫匹配主要通過尋找手寫漢字相對(duì)模板漢字筆畫的不同幾何變換參數(shù)來判斷[45]，對(duì)不規(guī)范漢字筆畫的匹配存在主觀性的閾值限定。因此，利用深度學(xué)習(xí)進(jìn)行手寫漢字評(píng)價(jià)可有效解決人工提取特征困難以及筆畫匹配等缺點(diǎn)，所以深度學(xué)習(xí)將推動(dòng)手寫漢字評(píng)價(jià)發(fā)展。

2.4.2 基于機(jī)器學(xué)習(xí)的其他方法

除了以上基于深度學(xué)習(xí)的方法，手寫漢字的書寫質(zhì)量評(píng)價(jià)還涌現(xiàn)出其他方法。其中祁亨年等人[46]提出利用概率分布計(jì)算漢字的對(duì)稱性、勻稱性以及緊湊性，以此作為書寫結(jié)構(gòu)的評(píng)價(jià)指標(biāo)，利用支持向量機(jī)對(duì)手寫漢字進(jìn)行三種不同級(jí)別的分類。此方法可在宏觀上對(duì)手寫漢字進(jìn)行評(píng)測(cè)，較難對(duì)手寫漢字的筆畫、部件等細(xì)節(jié)形成指導(dǎo)意見，并且用分?jǐn)?shù)的方式對(duì)書寫質(zhì)量進(jìn)行評(píng)價(jià)，用戶無法知道手寫漢字的錯(cuò)誤位置以及如何改正。溫麗敏[47]在書法審美評(píng)價(jià)中提出將手寫漢字的筆段端點(diǎn)、筆段拐點(diǎn)和運(yùn)筆力度節(jié)奏三個(gè)特征以及其他信息輸入EMD（earth mover’s distance）模型進(jìn)行相似度的計(jì)算，得到手寫漢字評(píng)價(jià)。黃峰[38]利用“質(zhì)點(diǎn)—彈簧”能量模型（mass spring method，MSM）對(duì)手寫漢字進(jìn)行評(píng)測(cè)，此模型可以容易地識(shí)別出手寫漢字與模板漢字的變形程度。通過計(jì)算手寫漢字特征值與模板漢字特征值之間的能量差實(shí)現(xiàn)手寫漢字的評(píng)價(jià)。實(shí)驗(yàn)結(jié)果說明在相同數(shù)據(jù)集、冗余度為10的情況下，彈性網(wǎng)格評(píng)價(jià)效果的一致率為92.14%，BP神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)效果的一致率為93.21%?！百|(zhì)點(diǎn)—彈簧”能量模型的評(píng)價(jià)效果較低的原因是利用手寫漢字的特征值比BP神經(jīng)網(wǎng)絡(luò)少，僅利用筆畫的起點(diǎn)、終點(diǎn)等信息很難判斷筆畫變形的原因，所以生成指導(dǎo)意見的效果也沒有BP神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)效果好。

2.5 小結(jié)

以上方法促進(jìn)了手寫漢字評(píng)價(jià)的發(fā)展。這些方法遵循以下步驟：（1）利用不同的方法提取手寫漢字特征。（2）特征匹配。（3）特征相似度計(jì)算。基于規(guī)則的方法依賴專業(yè)領(lǐng)域人工制定規(guī)則，通過規(guī)則匹配識(shí)別各種手寫漢字特征，此方法雖然在研究者制定的數(shù)據(jù)集上收獲較高的提取效果，但構(gòu)建這些規(guī)則不僅耗時(shí)耗力，難以概括所有規(guī)則，而且可移植性較差?；谔卣飨嗨贫鹊姆椒▽?duì)手寫漢字的規(guī)范性起點(diǎn)要求比較高，其中字體大小對(duì)書寫質(zhì)量評(píng)分影響較大，而無法體現(xiàn)手寫漢字本質(zhì)的評(píng)分。模糊矩陣的方法更適合評(píng)價(jià)具有獨(dú)特風(fēng)格的手寫漢字。這兩種方法相比規(guī)則的方法，在特征提取方面不但可以更簡(jiǎn)便地提取結(jié)構(gòu)復(fù)雜的筆畫等特征，并且提取特征的質(zhì)量有了很大的提升。基于神經(jīng)網(wǎng)絡(luò)的方法相比其他方法，具有兩大優(yōu)勢(shì)：（1）卷積神經(jīng)網(wǎng)絡(luò)可以從圖片中學(xué)習(xí)更復(fù)雜的特征；（2）可以處理大規(guī)模數(shù)據(jù)。其缺點(diǎn)是在網(wǎng)絡(luò)訓(xùn)練的過程中，可能會(huì)忽視手寫漢字中重要的特征，所以重要特征還需要人工提取與卷積神經(jīng)網(wǎng)絡(luò)一同進(jìn)行評(píng)價(jià)。并且基于深度學(xué)習(xí)的手寫漢字評(píng)價(jià)需要擁有樣本豐富且數(shù)據(jù)量較大的數(shù)據(jù)集，而現(xiàn)實(shí)中這樣的數(shù)據(jù)集十分稀少，大部分研究者自己構(gòu)建數(shù)據(jù)集。這樣造成了面對(duì)同一任務(wù)時(shí)因數(shù)據(jù)集的不同而無法對(duì)比各種方法的效果。

3 反饋形式

近年來，大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)為傳統(tǒng)的手寫漢字評(píng)價(jià)方法帶來了巨大變革，其可以在花費(fèi)極少的人力、物力以及財(cái)力的基礎(chǔ)上，完成手寫漢字評(píng)價(jià)。手寫漢字評(píng)價(jià)的核心問題是通過特征值之間的差距完成評(píng)價(jià)，因此本質(zhì)上可以看做手寫漢字的特征值差異與評(píng)價(jià)的映射問題。而如何將手寫漢字的評(píng)價(jià)在內(nèi)容以及視覺上反饋給用戶已經(jīng)成為數(shù)據(jù)到文本生成、字形匹配以及圖形輔助等技術(shù)發(fā)展的支持部分[4]，其關(guān)系如圖7所示。

圖7 手寫漢字評(píng)價(jià)反饋形式Fig.7 Feedback form of handwritten Chinese character evaluation

3.1 數(shù)據(jù)到文本生成

數(shù)據(jù)到文本生成是文本生成任務(wù)中重要的一類，主要利用給定的數(shù)據(jù)庫(kù)、電子表格以及專家系統(tǒng)知識(shí)庫(kù)等數(shù)據(jù)，生成貼近事實(shí)、描述流暢的相關(guān)文本[48]。數(shù)據(jù)到文本生成可以作為手寫漢字評(píng)價(jià)任務(wù)的輔助技術(shù)：將手寫漢字與模板漢字特征之間的差值作為輸入，旨在生成貼近事實(shí)的文本描述數(shù)據(jù)。其目標(biāo)是實(shí)現(xiàn)計(jì)算機(jī)與人類有效的溝通，加深用戶對(duì)手寫漢字評(píng)價(jià)的理解，實(shí)現(xiàn)評(píng)價(jià)自動(dòng)撰寫，有效減少教師的工作。

現(xiàn)如今，數(shù)據(jù)到文本的生成任務(wù)主要利用基于規(guī)則和模板的方法，因其具有極強(qiáng)的可控性和可解釋性，容易確保輸出文本的準(zhǔn)確性[49]。其中Gkatzia等人[50]針對(duì)天氣預(yù)報(bào)的生成，利用不確定信息推薦準(zhǔn)則與模擬專家的方式提出了兩種基于規(guī)則的方法。此方法中模板的抽取離不開人工特征，并且生成內(nèi)容的多樣性與流暢性也存在問題。

基于神經(jīng)網(wǎng)絡(luò)模型主要依靠數(shù)據(jù)驅(qū)動(dòng)，不需要較多的人工干預(yù)，也容易產(chǎn)生流暢的文字描述，但無法掌控內(nèi)容生成，難以確保輸出文本同輸入數(shù)據(jù)中的信息吻合[51]。其中文獻(xiàn)[52]改變了原有模型中沒有明確模擬文本生成順序的弊端，而將端到端的訓(xùn)練模型分為了內(nèi)容規(guī)劃、句子規(guī)劃以及表面實(shí)現(xiàn)三種模塊，文本生成效果有了很大的提升，但此方法無法充分利用數(shù)據(jù)結(jié)構(gòu)的信息，對(duì)具體數(shù)值推理存在巨大問題。針對(duì)以上問題，許曉泓等人[53]對(duì)內(nèi)容規(guī)劃進(jìn)行改進(jìn)，采用基于Transform的內(nèi)容規(guī)劃用于上下文數(shù)據(jù)信息的推理，并且通過生成指引序列控制輸出文本的流暢性。實(shí)驗(yàn)結(jié)果說明，改進(jìn)的內(nèi)容規(guī)劃使性能有了較大的提高。

相比基于規(guī)則的數(shù)據(jù)到文本生成方法，數(shù)據(jù)驅(qū)動(dòng)的方法不需要專家參與，生成的文本可能與領(lǐng)域無關(guān)，但需要大規(guī)模的數(shù)據(jù)集進(jìn)行訓(xùn)練數(shù)據(jù)，數(shù)據(jù)的訓(xùn)練質(zhì)量影響訓(xùn)練結(jié)果。將其應(yīng)用于手寫漢字評(píng)價(jià)中，存在手寫漢字與模板漢字特征之間的差值數(shù)據(jù)選擇由計(jì)算機(jī)進(jìn)行挑選，生成的文本不一定滿足復(fù)雜數(shù)據(jù)的問題。例如，在一章手寫漢字中找到一個(gè)整體書寫質(zhì)量最差的漢字，則其筆畫或字體大小等某一特征一定存在分?jǐn)?shù)較差的問題，而這并不代表其所有特征在這一章中是最差的。

3.2 字形匹配

字形匹配是指將手寫漢字的筆畫與模板漢字的筆畫進(jìn)行匹配，找到一個(gè)筆畫數(shù)量最多的匹配集合，集合找到手寫漢字筆畫集合中的交叉關(guān)系與模板漢字筆畫集合中的交叉關(guān)系是一致的，以上就完成了手寫漢字筆畫與模板漢字筆畫之間的對(duì)應(yīng)關(guān)系。將字形匹配與手寫漢字評(píng)價(jià)相結(jié)合，字形匹配可以結(jié)合圖形輔助以圖的方式出現(xiàn)，使用戶更加了解自己書寫漢字的缺點(diǎn)，增強(qiáng)用戶體驗(yàn)感。Hu等人[54]利用屬性關(guān)系圖表示漢字，建立漢字筆畫之間的空間關(guān)系模型，并利用容錯(cuò)圖匹配筆畫和部件關(guān)系的錯(cuò)誤。劉穎濱等人[55]提出在三維空間建立高斯混合型模型，利用三維空間可以充分定義字形信息，改善字形匹配的效果。Chen等人[56]根據(jù)輸入筆畫順序關(guān)鍵信息、筆畫之間全局結(jié)構(gòu)關(guān)系以及對(duì)歸類的筆畫與模板漢字匹配等問題進(jìn)行反饋，輔助教師進(jìn)行手寫漢字評(píng)價(jià)。

該類方法只適用于小范圍的數(shù)據(jù)集，很難接受變形較大的手寫漢字。例如，對(duì)于手寫漢字的初學(xué)者，他們對(duì)手寫漢字的書寫僅是模仿，下筆的力度也不能靈活掌握，這會(huì)產(chǎn)生想象不到的筆畫形變，這時(shí)字形匹配的效果也達(dá)不到想要的效果，所以字形匹配的方法還需要研究者進(jìn)一步探索。

3.3 圖形輔助

規(guī)范且易于理解的反饋形式具有更好的用戶體驗(yàn)感。現(xiàn)有的手寫漢字評(píng)價(jià)反饋形式主要有以下幾種：評(píng)價(jià)文本、打分、圖形輔助等。評(píng)價(jià)文本可以直接將手寫漢字的缺點(diǎn)以文本的形式展示出來，但表現(xiàn)形式不夠直觀，不易用戶理解，并且對(duì)于一部分閱讀經(jīng)驗(yàn)不足的用戶來說，并不能全部理解評(píng)價(jià)文本的內(nèi)容。評(píng)價(jià)以打分或等級(jí)的形式出現(xiàn)，只是通過這種方法評(píng)價(jià)用戶的手寫漢字達(dá)到規(guī)范的程度，用戶無法知道手寫漢字的具體錯(cuò)誤、如何修改等信息，用戶體驗(yàn)較差，如圖8（a）所示[56]。圖形輔助的手寫漢字評(píng)價(jià)可以利用幾何圖形在圖中標(biāo)注出手寫漢字具體不規(guī)范的位置，如圖8（b）所示[57]，圖中將模板漢字與用戶書寫的漢字疊加展示并且使用動(dòng)物圖片提供更多的視覺反饋，激勵(lì)用戶更好地認(rèn)識(shí)漢字。與文本生成和字形匹配這兩種方式相比，圖形輔助這種方式更加直觀，具有較好的用戶體驗(yàn)。

圖8 評(píng)價(jià)的反饋方式Fig.8 Feedback mode of evaluation

以上三種方式都是靜態(tài)的反饋形式，在規(guī)范性指導(dǎo)方面還不夠具體。例如無法與用戶交流書寫錯(cuò)誤如何改正，并提供正確的修改事例。所以在圖像輔助方面還需要借助各種動(dòng)畫技術(shù)以及自動(dòng)問答技術(shù)的支持，對(duì)手寫漢字的評(píng)價(jià)進(jìn)行反饋指導(dǎo)和改進(jìn)指導(dǎo)，這樣才能加強(qiáng)用戶體驗(yàn)，充分發(fā)揮計(jì)算機(jī)的輔助作用。

4 問題與挑戰(zhàn)

近年來研究者針對(duì)手寫漢字評(píng)價(jià)進(jìn)行了大量研究工作并且獲得了不錯(cuò)的研究成果，但仍存在許多要解決的問題，目前關(guān)鍵問題如以下幾點(diǎn)：

（1）數(shù)據(jù)來源匱乏

手寫漢字的書寫質(zhì)量評(píng)價(jià)系統(tǒng)需要一個(gè)大規(guī)模且樣本豐富的數(shù)據(jù)集。而目前手寫漢字的數(shù)據(jù)集大多關(guān)于手寫漢字識(shí)別，缺少對(duì)每個(gè)漢字的評(píng)價(jià)以及分?jǐn)?shù)。也有一部分?jǐn)?shù)據(jù)集數(shù)據(jù)樣本數(shù)量較少，這給研究帶來了一定的困難。例如孫榕鞠等人整理的CHAED字庫(kù)，它包括30個(gè)人書寫10種不同字體的100個(gè)漢字，由33個(gè)專業(yè)人士對(duì)此數(shù)據(jù)集進(jìn)行評(píng)分。此數(shù)據(jù)集中手寫漢字種類數(shù)量較少，無法全部代表復(fù)雜的漢字，并且評(píng)價(jià)的反饋形式只有評(píng)分，這對(duì)生成一個(gè)完備的評(píng)價(jià)存在一定困難。

目前研究者的數(shù)據(jù)集根據(jù)反饋形式大多自行采集，收集和整理這些數(shù)據(jù)需要花費(fèi)大量的人力、物力以及財(cái)力。例如黃峰[38]的數(shù)據(jù)是通過收集某三年級(jí)學(xué)生手寫漢字集成，每個(gè)學(xué)生需要書寫8遍具有28個(gè)漢字的樣本，還需要專家在每個(gè)實(shí)驗(yàn)樣本中隨機(jī)挑選20個(gè)漢字進(jìn)行評(píng)分。沒有全面且公開的手寫漢字評(píng)分?jǐn)?shù)據(jù)集，很難對(duì)不同方法進(jìn)行效果比較，給手寫漢字書寫質(zhì)量評(píng)價(jià)的研究和發(fā)展帶來困難。面對(duì)數(shù)據(jù)來源困難可參考自然語(yǔ)言處理或計(jì)算機(jī)視覺領(lǐng)域的數(shù)據(jù)擴(kuò)建方法，利用半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)構(gòu)建以及遷移學(xué)習(xí)等方法都可以作為解決該問題的方法。而如何將遷移學(xué)習(xí)應(yīng)用在手寫漢字評(píng)價(jià)中，還需要進(jìn)一步研究。

（2）脫機(jī)手寫漢字筆序難判斷

根據(jù)計(jì)算機(jī)最終得到手寫漢字的信息不同，可將其分為聯(lián)機(jī)手寫漢字[58]和脫機(jī)手寫漢字[59]。聯(lián)機(jī)手寫漢字是指直接在電子屏等電子儀器上書寫，可以實(shí)時(shí)檢測(cè)筆畫的順序以及筆畫總數(shù)等多種信息，較容易提取漢字的多種特征值。脫機(jī)手寫漢字是指沒有電子屏等電子儀器的參與，計(jì)算機(jī)得到的只有手寫漢字圖片信息。脫機(jī)手寫漢字相比聯(lián)機(jī)手寫漢字提取的漢字特征值比較少，所以評(píng)價(jià)的效果不如聯(lián)機(jī)手寫漢字的評(píng)價(jià)好。

規(guī)范的漢字書寫要求筆序必須書寫正確。成授昌[60]提出手寫漢字的統(tǒng)一、對(duì)稱等方面都與筆序相關(guān)，正確的書寫順序可以提高手寫漢字的書寫質(zhì)量和書寫速度，所以筆序?qū)σ?guī)范的漢字書寫是非常重要的。教師在“三筆一畫”與小學(xué)生的語(yǔ)文考試中，手寫漢字的筆序也占一定的分?jǐn)?shù)。聯(lián)機(jī)手寫漢字較容易獲得筆序等信息，所以評(píng)價(jià)手寫漢字筆序的效果較好[61]。因脫機(jī)手寫漢字進(jìn)行手寫漢字評(píng)價(jià)時(shí)，得到的只有手寫漢字圖片，所需要的信息只能利用圖片處理等技術(shù)得到，筆序等信息無法在圖片上體現(xiàn)。為了得到手寫漢字筆序相關(guān)信息，有研究者利用規(guī)則的方法判斷手寫漢字的正確筆序，卻得不到書寫者的筆序信息。所以如何評(píng)判脫機(jī)手寫漢字中筆序的正確性，還具有一定的挑戰(zhàn)難度。

（3）手寫漢字的筆畫拆分難

筆畫質(zhì)量是書寫質(zhì)量評(píng)價(jià)中重要的評(píng)估項(xiàng)之一。而手寫漢字的筆畫拆分過程是一個(gè)十分困難的過程。筆畫與筆畫之間的關(guān)系有：相接、相交、相離[18]。筆畫相離的手寫漢字比較容易進(jìn)行筆畫拆分，但漢字大部分都具有結(jié)構(gòu)復(fù)雜、筆畫數(shù)較多的特點(diǎn)，其中存在大量的相接、相交、相離關(guān)系，僅解決相離問題是不能完成筆畫的拆分過程。

目前關(guān)于脫機(jī)手寫漢字筆畫拆分的解決方法之一[38]是，利用PS工具圈出所要提取的手寫漢字筆畫。此方法雖然提取的效果較好，但如果評(píng)價(jià)的書法字?jǐn)?shù)據(jù)量大時(shí)，則需要花費(fèi)大量的時(shí)間拆分筆畫。除此之外，朱欣蔚等人[62]利用PBOD算法找出手寫漢字的交叉區(qū)域以及端點(diǎn)區(qū)域，將手寫漢字的端點(diǎn)區(qū)域以及交叉區(qū)域在無向圖中表示出來，利用規(guī)則對(duì)各區(qū)域進(jìn)行組合實(shí)現(xiàn)拆分筆畫。但PBOD算法只對(duì)規(guī)范漢字進(jìn)行筆畫提取的效果較好，卻無法較好地分離不規(guī)范漢字的筆畫。關(guān)于聯(lián)機(jī)手寫漢字的筆畫拆分方法是筆段的拆分與合并[63]，該方法需要提前建立大量的工作：建立32種不同筆畫的筆畫庫(kù)，對(duì)難以區(qū)分的筆畫通過建立規(guī)則以正確區(qū)分筆畫。該方法利用拐點(diǎn)將筆畫分為筆段，對(duì)于初學(xué)者來說，由于手寫漢字中存在變形較大的筆畫，對(duì)筆畫的分段存在劃分不準(zhǔn)確的情況，致使筆畫編碼錯(cuò)誤，所以該方法對(duì)初學(xué)者的筆段提取精確率不高。

雖然在光學(xué)字符識(shí)別（optical character recognition，OCR）領(lǐng)域還有許多關(guān)于筆畫提取的成果[64]（如細(xì)化的方法、區(qū)域分解法等），但這些方法允許結(jié)果有一定的誤差，且對(duì)每個(gè)手寫漢字提取筆畫計(jì)算時(shí)間過長(zhǎng)[65]。所以如何快速、準(zhǔn)確地得到筆畫的特征值是一個(gè)值得去思考的問題。

（4）手寫漢字評(píng)價(jià)的標(biāo)準(zhǔn)量化困難

評(píng)價(jià)標(biāo)準(zhǔn)是評(píng)價(jià)的核心，用來規(guī)定當(dāng)前手寫漢字中筆畫等特征達(dá)到不同范圍的對(duì)應(yīng)分值準(zhǔn)則。研究者對(duì)手寫漢字的評(píng)價(jià)關(guān)注點(diǎn)從對(duì)稱性、勻稱性等描述手寫漢字全局的特征，逐步轉(zhuǎn)到筆畫、部件等描述手寫漢字局部的特征，評(píng)價(jià)手寫漢字的書寫質(zhì)量效果在不斷地改善，但評(píng)價(jià)手寫漢字的特征越細(xì)致，其評(píng)價(jià)標(biāo)準(zhǔn)范圍的選取越嚴(yán)格。

不同研究者對(duì)同一等級(jí)的手寫漢字制定規(guī)則時(shí)具有主觀性，所以會(huì)制定出不同的規(guī)則[3]，不同的規(guī)則導(dǎo)致對(duì)同一等級(jí)的手寫漢字評(píng)價(jià)不同，這在手寫漢字的書寫質(zhì)量評(píng)價(jià)中是不合理的。為了初學(xué)者獲得自信，有些研究者制定的規(guī)則范圍較為寬松[66]，也有一些研究者針對(duì)不同學(xué)習(xí)背景的人群，分別制定出較難和簡(jiǎn)單兩個(gè)等級(jí)的評(píng)價(jià)標(biāo)準(zhǔn)，這種評(píng)價(jià)標(biāo)準(zhǔn)更適合應(yīng)用于大眾[56]。但因不同研究者對(duì)規(guī)范的定義不一致，即使不同的系統(tǒng)都選擇簡(jiǎn)單的評(píng)價(jià)指標(biāo)，也存在評(píng)價(jià)分?jǐn)?shù)不同的現(xiàn)象。為了解決以上問題，葛佳敏[34]利用模糊概率分布和模糊綜合評(píng)價(jià)方法結(jié)合得到一個(gè)期望值范圍，解決了傳統(tǒng)評(píng)價(jià)方法簡(jiǎn)單、具有主觀性的單一評(píng)價(jià)標(biāo)準(zhǔn)的問題。此方法中評(píng)價(jià)標(biāo)準(zhǔn)制定的數(shù)據(jù)來源于模板漢字和機(jī)器人書寫的漢字，由此得到的期望值范圍并不適用于所有書寫質(zhì)量評(píng)價(jià)。所以如何獲得一個(gè)適合大眾、具有專業(yè)性的評(píng)價(jià)標(biāo)準(zhǔn)還是值得去思考的。

5 結(jié)束語(yǔ)

目前關(guān)于手寫漢字書寫質(zhì)量評(píng)價(jià)方法的研究比較少，處于剛剛起步的狀態(tài)，還有許多地方需要改進(jìn)。這項(xiàng)技術(shù)的發(fā)展必將促進(jìn)計(jì)算機(jī)輔助書寫教學(xué)的進(jìn)步[5]。文中對(duì)近幾年的研究做了總結(jié)，其中包括手寫漢字的相關(guān)概念、評(píng)價(jià)方法、評(píng)價(jià)難點(diǎn)以及反饋形式等部分。由于傳統(tǒng)的手寫漢字評(píng)價(jià)方法需要大量人力資源，研究者逐漸把目光轉(zhuǎn)移到神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)方法上，神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)方法的出現(xiàn)為手寫漢字評(píng)價(jià)提供了許多新思路，但目前只是處于剛剛起步的狀態(tài)，由此可以預(yù)見，手寫漢字的評(píng)價(jià)方法還有很大的發(fā)展空間需要繼續(xù)去研究。

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放