漢字是起源于圖畫的表意文字,不僅有記錄語言的實用屬性,在字體演變和實用書寫的過程中還表現(xiàn)出特有的審美屬性。國家明確將書法教育納入學校美育體系,書寫規(guī)范美觀的漢字是師范生應具備的文化素養(yǎng)。如何使書法教學達到理想的效果?在知識講授之外,對學生進行書寫訓練的過程性評測與指導不可或缺。但是,有限的師資力量與繁重的批閱工作之間的矛盾使面向全體學生的書寫質量評測難以落到實處。近年來,智能終端和智能軟件已經(jīng)廣泛應用于教育領域,成為教師教書育人的智能助手[]。人工智能技術在漢字書寫評測領域也不斷取得新的進展,極大地推動了該領域的自動化進程。本研究嘗試利用人工智能與數(shù)字化技術手段設計漢字硬筆楷書智能評測系統(tǒng),實現(xiàn)對師范生硬筆楷書作業(yè)質量的自動評測。該系統(tǒng)依據(jù)楷書的普遍審美原則,通過在線模擬教師評分,對學生漢字書寫的美觀程度給予等級評定。
一、漢字書寫質量的美學智能評測
對手寫漢字的美觀程度進行智能評測是一項極具挑戰(zhàn)性的任務。計算機評測書寫質量的相關研究主要分為基于特征工程的美學評測和基于深度學習的美學評測[2]。基于特征工程的美學評測引人人類書法藝術審美的先驗知識,挖掘書法字體筆畫結構的內在特征,力求有效地將人類的思維邏輯轉化為機器的運算邏輯。此研究路線的優(yōu)點是具有較強的可解釋性。如孫榕鞠(Sun-RongJu)等[3根據(jù)書法字體的結構和筆畫組合設計了22個全局特征和部件組合特征,實現(xiàn)對手寫漢字的無參照美學評估。但手寫字體的多樣性與審美感知的模糊性使基于人類經(jīng)驗設計的美學特征存在一定局限,極可能遺漏漢字圖像中隱藏的美學信息,從而限制模型預測的性能。
深度學習是含多隱藏層、多感知器的一種網(wǎng)絡結構,能更抽象、更深層次描述物體的屬性和特征[4]。在書法圖像領域,深度學習算法在實現(xiàn)字體風格轉換[5-、處理書法筆畫分割任務上取得了不錯的效果[7-8],而基于深度學習的書法美學質量自動評測的研究與應用還較少。有研究者結合人工書法美學特征和深度學習算法提出了一種基于深度學習的書法美學評估模型用于小學生軟筆臨摹作業(yè)的評測;利用卷積神經(jīng)網(wǎng)絡(ConvolutionalNeuralNetwork,簡稱CNN)對小學生的硬筆書法作品的美觀程度給予好、中、差分類[。研究顯示,通過訓練大規(guī)模數(shù)據(jù),深度網(wǎng)絡模型能有效學習到數(shù)字圖像中的隱藏信息,較好地表征與挖掘書寫字體的美學特征。但上述研究運用的訓練和測試樣本僅來自小學生的書寫,訓練和評測數(shù)據(jù)量少,應用范圍有限。本研究采用師范生的硬筆楷書作業(yè)為訓練樣本,嘗試以新一代卷積神經(jīng)網(wǎng)絡作為分類模型,通過數(shù)據(jù)集的訓練對硬筆楷書的書寫質量進行無參照的美學等級分類。
二、書寫樣本的性質與分級標準
(一)書寫樣本的性質
本研究的書寫樣本來自某高校師范生開展書寫技能訓練時提交的作業(yè)。該實踐活動要求學生通過臨摹和練習,自主進行漢字書寫訓練,具體要求如下。
1.以楷書為書寫字體
楷書具有法度,可作楷模,經(jīng)過長期使用被證明兼具實用性和藝術性,也是基礎教育教學活動中最常使用的字體。因此,學生均被要求進行硬筆楷書的書寫訓練。
2.自主選擇書寫內容
書法藝術是對前人的審美標準和經(jīng)驗高度依賴的藝術樣式,建議學生在書寫訓練中根據(jù)興趣選取適用于硬筆臨摹的古代書法作品(或這些書法作品的硬筆臨摹字帖)、現(xiàn)代硬筆書法字帖進行臨摹練習。最后上交的作業(yè)可以臨摹,也可以脫離字帖書寫,對書寫的內容和風格不做統(tǒng)一要求。
3.統(tǒng)一紙張和書寫工具
為了便于計算機對圖片進行處理,學生使用統(tǒng)一印制的紅色邊框無底紋的方格紙進行練習,每頁165個字,最后以“頁”為單位評定等級。書寫時使用鋼筆或0.7毫米中性水筆。
(二)書寫質量分級標準
機器評測模型需依據(jù)人對字體的審美感知進行美學質量的自動分級,因此建立合理的分級標準是重點也是難點。東漢蔡邕在《九勢》中表達了他對字體結構的認識:“凡落筆結字,上皆覆下,下以承上,使其形勢遞相映帶,無使字背。”即一字之中點畫的聯(lián)系和安排必須遵循一定的規(guī)律。唐代歐陽詢在《三十六法》中要求真書字體結構勻稱適宜,力求均衡之美。歷代對書法的審美感知和幾千年積累下來的書法技巧,為后人學習和評判書法提供了標準參照,也為我們在美學上對硬筆書寫作業(yè)進行質量分級提供了理論依據(jù)。
楷書結構嚴謹、筆畫工整,相較其他字體,其美學標準更易形成共識。本研究的書寫樣本在性質上屬于漢字書寫而非書法創(chuàng)作,這使得我們可以用相對明確和客觀的標準從書寫技法的層面展開評測。用筆與結構是書法藝術的兩大核心技巧。硬筆在結構造型上的審美與毛筆高度一致,但用筆相對簡單。因此,在制定書寫質量等級標準時以結構為主,用筆為輔,分別從比例、重心、筆畫間距、筆畫形態(tài)和行筆、提按筆等維度制訂層次特征分明的標準參照體系。
在評測方式上,出于可操作性和準確性的考量,兼顧美學評測和達標評定兩方面需求,嘗試將書寫樣本的質量分成優(yōu)、中、差三個等級。等級在中等以上者,可視作師范生漢字書寫達標測試合格。
三、漢字硬筆楷書智能評測系統(tǒng)的設計與應用
本研究的目標是開發(fā)一個硬筆楷書智能評測系統(tǒng),從美學角度評估學生漢字書寫的質量。為此我們設計并實施了一個多階段實驗流程,具體步驟如下。
(一)數(shù)據(jù)集的建立
1.樣本數(shù)據(jù)來源
選取的樣本主要來自某高校師范生自主訓練過程中提交的硬筆書寫作業(yè),能較全面反映該校師范生的書寫面貌。教師已經(jīng)對每一頁作業(yè)按優(yōu)、中、差進行分級。因學生書寫作業(yè)中優(yōu)等的樣本總數(shù)偏少,書寫風格較為單一,所以適當增加了一些古代書法作品的硬筆臨摹樣本和現(xiàn)代書法家的硬筆作品樣本,希望涵蓋多樣的優(yōu)秀楷書風格。
優(yōu)等級選取了30份學生作業(yè),以及歷史上經(jīng)典書法作品趙孟頫《道德經(jīng)》、鐘紹京《靈飛經(jīng)》、歐陽詢《九成宮》、文征明《落花詩》、褚遂良《雁塔圣教序》的硬筆臨摹優(yōu)秀作品,現(xiàn)代書法家田英章的楷書作品。中等與差等的樣本來自100份學生的書寫作業(yè),每個等級各50份。
2.漢字樣本截取
所有原始的書寫樣本先掃描成分辨率為1200×1800 的JPG圖片。由于學生書寫時使用紅色邊框方格紙,所以先采用目標檢測網(wǎng)絡(YouOnlyLookOnceversion5,簡稱YOLOv5),通過深度學習算法識別作業(yè)紙上的漢字,預測其邊界框并將其準確地截取出來。綜合考量模型的性能指標后,為實現(xiàn)精確率和召回率的最佳平衡,將模型的置信度閾值設定為0.7,以最大限度地識別并截取出每一個完整的漢字。
3.漢字樣本標注
教師對學生作業(yè)的等級評測是以整頁漢字的書寫質量為打分依據(jù),但這些漢字并非都在同一個水平等級,所以需要對截取后的單個漢字樣本進行再次標注。
這些漢字由3個專家評判,意見不一致時取人多一方的評判意見。對“一”“二”“十”等筆畫數(shù)少、結構簡單的漢字,選取有典型級別特征的樣本,適當減少相同漢字出現(xiàn)的頻率。
4.數(shù)據(jù)預處理
針對裁剪獲得的樣本圖片,在常規(guī)處理之外特別實施以下數(shù)據(jù)處理策略:縮放圖像。選取圖像并將其縮放至 224×224cm 的尺寸。實際場景中學生書寫的字體大小不一,裁剪后可能出現(xiàn)各種尺寸和比例,通過統(tǒng)一圖像尺寸,可以增強模型識別的準確性。
水平翻轉:以 50% 的概率執(zhí)行圖像水平翻轉,進一步豐富訓練數(shù)據(jù)集的多樣性。此步驟有助于模型學習到更加全面的漢字特征以保持良好的識別能力。
(二)漢字書寫質量評測
為確定使用哪種模型,我們比較了4種模型架構。結果顯示,在處理小規(guī)模數(shù)據(jù)集時,它們均能帶來令人滿意的性能。然而,隨著數(shù)據(jù)量的增加,準確率出現(xiàn)明顯差異。其中,新一代卷積神經(jīng)網(wǎng)絡(ConvolutionalNext,簡稱ConvNeXt)在測試集上的識別準確率最為理想。
ConvNeXt是一種新型卷積神經(jīng)網(wǎng)絡模型,它通過改進和優(yōu)化網(wǎng)絡結構,有效提高了圖像識別的準確性和效率,更適用于大規(guī)模圖像數(shù)據(jù)的處理和分析。此外,ConvNeXt對圖像中的平移、旋轉和縮放變化具有更強大的適應性?;谄鋬?yōu)越的性能,漢字硬筆楷書智能評測系統(tǒng)最終選擇該模型對書寫樣本進行識別和分類。具體流程如下:
1.數(shù)據(jù)集分配
數(shù)據(jù)集是決定漢字硬筆楷書智能評測系統(tǒng)性能的關鍵因素。經(jīng)過標注和選擇,納入數(shù)據(jù)集的漢字共有21255個,其中訓練集的漢字16380個,測試集的漢字4875個。訓練集優(yōu)、中、差3類樣本的漢字種類分別為1795、1643、1488個,能較全面覆蓋各種結構的漢字。
2.模型訓練
在官方卷積神經(jīng)網(wǎng)絡(ConvNeXt)(基礎版)預訓練模型基礎上,將截取后的漢字書寫樣本輸入到ConvNeXt進行訓練,最后得出每個字的評測等級。
3.模型測試
模型訓練完成后,使用測試集數(shù)據(jù)測試評測的準確率。結果顯示,模型識別總準確率達 90.11% ,但不同等級的準確率存在差異。通過測試集的混淆矩陣圖可以發(fā)現(xiàn),模型對優(yōu)等的識別準確率最高,達到98% ,對中等的識別準確率達到 89.2% ,對差等的識別準確率達到 85.5%c
(三)對整頁書寫作業(yè)進行評分
評測模型是以單個漢字為單位進行質量評測,而實際卻需要對整頁漢字的書寫質量進行評級。為此,我們嘗試通過計算一頁漢字,即165個漢字的平均分來實現(xiàn)單字評測到整體評級的轉換。
1.對標注過等級的漢字樣本按“優(yōu)”1分、“中”0.50分的規(guī)則進行賦分,計算出某一頁漢字書寫質量的平均分。
2.從優(yōu)、中、差3個等級中各選取20份有代表性的作業(yè)為樣本,將機器算出的整頁漢字的平均分與專家對整頁漢字的書寫質量評級進行對比,去除不合理分值,最終確定評判整頁漢字書寫等級時采用的分值區(qū)間。
經(jīng)過對比,優(yōu)等的作業(yè)分值集中在 0.51~1 之間,其中評分為 *0.51 、0.67”的兩份作業(yè)評分明顯偏低,其余較為合理,分值集中在 0.74~1 之間。中等作業(yè)的評分中,分值為 *0.98* 的作業(yè)存在評分偏誤,分數(shù)明顯偏高,其余較為合理,分值集中在 0.39~0.77 之間。差等的評分中,分值為‘ ?0.51?° 的作業(yè)書寫質量偏低,評分偏高,去除這一分值,差等作業(yè)的分值在 ?0.00~0.36W 之間。最后,綜合考慮分值的分布與專家意見,確定以“頁”為單位評級時3個等級的分值區(qū)間,見下頁表5。
四、對漢字硬筆楷書智能評測系統(tǒng)的分析與討論
(一)評測系統(tǒng)表現(xiàn)出較高可信度
對漢字書寫質量進行美學智能評測并非易事,手寫字體風格的多樣性和細節(jié)部分優(yōu)缺點的復雜性使字體線條在平衡與倚側、整齊與錯落、疏散與緊密等方面的規(guī)律難以明確與統(tǒng)一,這也是基于人工特征提取的智能評測在研究中面臨的難點。漢字硬筆楷書智能評測系統(tǒng)采用基于深度學習的方法,評測模型經(jīng)過訓練后能按照優(yōu)、中、差3個等級對單個漢字的書寫質量進行分級,分類識別的總準確率達到 90.11% ,各等級的準確率均達到 85% 以上。這表明漢字硬筆楷書智能評測系統(tǒng)在漢字書寫的美學質量評測方面取得了不錯的效果,基本具備對不同風格的硬筆楷書字體進行分類評測的能力。實際應用場景中,為了對書寫作業(yè)進行整體評測,漢字硬筆楷書智能評測系統(tǒng)通過一定的計算方法完成了從單字評測到整頁漢字綜合評測的轉換,可以較好地實現(xiàn)機器智能與人類感知的聯(lián)通。
(二)尚需提升模型泛化能力和評測穩(wěn)定性
模型分類識別的依據(jù)是它所接收到的分類標注信息,樣本數(shù)據(jù)是否完善,分類標注是否合理都將影響模型的決策能力。測試集的評測結果顯示,優(yōu)等級中,字體較小或書寫風格獨特的漢字被誤判的比例較高;比較3個等級,中等級與差等級的識別錯誤率明顯高于優(yōu)等級。這些現(xiàn)象可能與數(shù)據(jù)集樣本類型不夠全面,中等與差等字體特征不易把握,專家判斷等級過渡區(qū)域字體時確定性不夠有關。要提高模型的泛化能力及在不同等級的評測中保持穩(wěn)定性能,還需補充不同類型的書寫樣本,根據(jù)學生書寫的實際情況形成更易于把握和操作的等級方案。
五、結語
將人工智能技術應用于漢字書寫質量的美學評測是書寫評測方式的根本性變革。漢字硬筆楷書智能評測系統(tǒng)基于真實的任務場景,利用卷積神經(jīng)網(wǎng)絡的深度學習,從美學的角度對硬筆楷書手寫字體進行了無參照的質量分級評測并取得了較為理想的結果。雖然優(yōu)、中、差3個級別在評測的精細度上尚有欠缺,但這一探索為人工智能應用于漢字書寫質量的美學評測提供了新的思路和實踐參照。
當前,還存在因數(shù)據(jù)規(guī)模有限、樣本類別不夠全面、評測標準搖擺等因素導致的評測偏誤,模型分類預測的性能還有繼續(xù)提升的空間,但漢字硬筆楷書智能評測系統(tǒng)的表現(xiàn)有理由使我們相信,在未來的書法教學中,智能評測有望成為有效的教學輔助手段,為學生的書寫練習提供即時的反饋與指導。漢字不僅是記錄語言的符號,還蘊含著美的規(guī)律,將人工智能技術與書法理論、書法教育相結合,讓機器也能“讀懂”文字之美,既是一種探索,更是一種可能。
參考文獻
[1]王運武、李雪婷等.人工智能助推教師隊伍建設:新訴求、潛能 與應用場域[J].數(shù)字教育,2022,8(6):13-19.
[2]孫銘蔚.智能書法美學評測算法的研究及應用[D].長沙:中南 大學,2022.
[3]SUNRZ,LIANZH,TANGYM,etal.Aestheticvisual quality evaluation of chinese hand writings [C].Proceedings ofthe 24th International Conference on Artificial Intelligence. IJCAI,2015:2510-2516.
[4]G.E.HINTON,R.R.SALAKHUTDINOV.Reducingthe dimensionalityofdatawithneural networks[J].Science,2oo6,313 (5786):504-507.
[5]QIN MX,CHENX.Restore the incomplete calligraphy based on style transfer[C].Proceedingof the 38th Chinese Control Conference, 2019:8812-8817.
[6] SONG Y,YANG F,LIT.Chinese calligraphy generation based on involution[J].Electronics,2022,11(14):2201.
[7]張巍,張筱,萬永菁.基于條件生成對抗網(wǎng)絡的書法字筆畫分割 [J].自動化學報,2022,48(7):1861-1868.
[8]BIFK,HANJH.SSGAN:generative adversarial networks for the strokesegmentationofcalligraphic characters[J].TheVisual Computer, 2022,38:2581-2590.
[9]QIANGXX,WU M H,LUO LM.Research on hard-tipped
(責任編輯 李強)
Design and Application of a Deep LearningBased Intelligent Evaluation System for Hard Pen Regular Script Chinese Characters
HuZhidana,WangZhijuna,WangMeng^,SuChenb (a.SchooloboolalellderieJgansityui 214122)
Abstract:Aesthetic evaluation of handwriten Chinese characters presents a significant challenge in the fieldofintelligentanalysis.Inthis study,a graded evaluationdataset wasconstructed usinghard-penregularscript (Kaishu)practiceasignmentscompletedbypre-serviceteachers inreal-worldtrainingscenarios.Anext-generation convolutionalneuralnetwork wasapplied toperformdeeplearning onthe dataset,enablingthedevelopmentof an intelligent evaluation system for handwritten Chinese characters inregular script.This system enables referencefreeclassification-based assssmentofhard-penregularscriptfrom anaesthetic perspective.The modelachieved an overall accuracy of 90.11% inclassifying test data into three levels: excellent,average,and poor.Thisresearch providesnew insights and practical references forapplyingartificial inteligence totheaesthetic assssmentof handwriting quality in Chinese character writing.
Keywords:deep learning;hard-penregular script;intelligent evaluation; classificationandrecognition