鄧學(xué)雄, 李京陶, 李 牧
(華南理工大學(xué)設(shè)計(jì)學(xué)院,廣東 廣州 510006)
毛筆書法臨帖的計(jì)算機(jī)評價(jià)
鄧學(xué)雄, 李京陶, 李 牧
(華南理工大學(xué)設(shè)計(jì)學(xué)院,廣東 廣州 510006)
針對書法初學(xué)者學(xué)習(xí)的特點(diǎn),基于計(jì)算機(jī)輔助技術(shù),根據(jù)適用于初學(xué)者的書法水平評價(jià)標(biāo)準(zhǔn),提出相似度的算法。將初學(xué)者的臨帖作品通過掃描或拍照后輸入計(jì)算機(jī),利用計(jì)算機(jī)圖像處理技術(shù)進(jìn)行臨帖作品預(yù)處理。通過圖像骨架、不變矩、灰度投影等方法,對臨帖字體的結(jié)體特征、點(diǎn)畫形態(tài)和章法布局的特征進(jìn)行描述。對臨帖字體與原碑帖字體進(jìn)行相似度計(jì)算,實(shí)現(xiàn)對書法初學(xué)者臨帖作品綜合評價(jià)的輔學(xué)系統(tǒng)。
計(jì)算機(jī)應(yīng)用;書法教育;毛筆書法;臨帖;計(jì)算機(jī)評價(jià)
中國的各種古代藝術(shù)門類中,最具標(biāo)志性,最能集中地、典型地、鮮明地、持續(xù)而廣泛地表現(xiàn)民族精神和時(shí)代精神的藝術(shù),非書法莫屬[1]。我國教育部下發(fā)的《中小學(xué)書法教育指導(dǎo)綱要》文件為書法教育實(shí)現(xiàn)提供了有力保障,但當(dāng)代書法教育在普及過程中仍存在諸多問題如:缺少書法學(xué)習(xí)氛圍、師資力量薄弱,教學(xué)資源匱乏以及學(xué)生對書法藝術(shù)缺乏興趣等,使得書法教育的發(fā)展舉步維艱。
參照中國書畫等級考試標(biāo)準(zhǔn)(書法類)[2]可知,書法學(xué)習(xí)的初級階段,是以模仿能力為主要考核標(biāo)準(zhǔn)的。而書法學(xué)習(xí)的模仿能力是由學(xué)習(xí)者的臨帖字體與原碑帖字體的相似度決定。其中,“碑”源于古代碑石上的字為書法名家所書,字跡可供后人取法,后人將碑石上的字用薄紙、焦墨捶拓下來再經(jīng)裝裱;而“帖”原是指書法家的墨跡真筆,“碑帖”合為一辭,用來泛指供學(xué)習(xí)書法取法的范本。“臨帖”是指書法練習(xí)者將字帖置于案前,觀察字的形態(tài)、結(jié)構(gòu)、筆劃,領(lǐng)會其精神,并下筆仿寫。
本研究的目的是實(shí)現(xiàn)計(jì)算機(jī)輔助評價(jià)臨帖字體與原碑帖字體相似度,給書法初學(xué)者提供練習(xí)效果的評價(jià),指引其下一步的學(xué)習(xí)。目前,在漢字筆畫特征提取和輪廓回復(fù)方面的研究,馬小虎等[3]、He和Yan[4]、陳睿等[5]、王建平等[6]已實(shí)現(xiàn)提取漢字筆畫特征,趙琪等[7]在輪廓恢復(fù)方面亦作了深入研究,并已取得成效。此外,使用漢字圖像的彈性網(wǎng)絡(luò)特征[8]、Gaber特征[9]、和梯度特征[10]以及Kato等[11]使用方向元素特征這些方法進(jìn)行漢字識別均能達(dá)到較好的漢字識別效果。這些研究成果對于本研究中的書法字特征提取有著重要的參考作用,為進(jìn)一步提出書法字相似度算法打下堅(jiān)實(shí)的基礎(chǔ)。
結(jié)合書法學(xué)習(xí)步驟和各階段要求,本研究選取用于評價(jià)書法初學(xué)者臨帖效果的標(biāo)準(zhǔn),利用計(jì)算圖形學(xué)、數(shù)字圖像處理技術(shù),從結(jié)體特征、點(diǎn)畫形態(tài)、章法布局三方面,通過深入探討書法字特征提取與相似度算法,判斷臨帖作品的“形似”程度,構(gòu)建一個(gè)書法輔助教學(xué)平臺,完成評價(jià)臨帖作品的繁瑣任務(wù),減少書法教師的工作量之余,還能暫時(shí)彌補(bǔ)部分書法教師在專業(yè)能力上的欠缺。此外,本系統(tǒng)的界面遵循娛樂化規(guī)則設(shè)計(jì),目的寓教學(xué)于娛樂,激起青少年學(xué)習(xí)書法藝術(shù)的熱情,進(jìn)而推動書法教育的蓬勃發(fā)展。
書法練習(xí)者的臨帖字體與原碑(原帖)字體是通過掃描或拍照后以圖像格式文件輸入計(jì)算機(jī)的。首先要對輸入的字體圖像進(jìn)行預(yù)處理,如進(jìn)行二值化[12]、去噪處理等。然后將字體的二值圖像進(jìn)行剪切、縮放,得到像素大小相同的正方形圖像。圖 1所示為原碑字體的預(yù)處理過程。至于原帖和臨帖字體是白底(或灰底)黑字,預(yù)處理時(shí)不需要第三步的“反色”。
圖1 原碑字體的預(yù)處理
(1) 圖像二值化、去噪:將輸入到計(jì)算機(jī)臨帖字體和原碑帖字體進(jìn)行二值化處理,即圖像分割。對字體與背景進(jìn)行識別,本研究采用迭代法進(jìn)行圖像二值化處理。同時(shí),對二值圖像進(jìn)行區(qū)域面積的計(jì)算,刪除面積特小的區(qū)域,以去除圖像中的斑點(diǎn)、劃痕等噪聲。
(2) 圖像裁剪縮放:將去噪處理后的圖像通過剪切、縮放,使原碑(原帖)字體和臨帖字體的二值化圖像大小相同(如像素為 128×128),以便于下一步特征提取和相似度計(jì)算。
參考書法臨帖的要求和書法初級考試標(biāo)準(zhǔn)[2],對書法初學(xué)者臨帖作品質(zhì)量的綜合評價(jià)主要從結(jié)體特征、點(diǎn)畫形態(tài)和章法布局三方面進(jìn)行。深入探討特征提取與相似度算法,獲取評價(jià)的依據(jù)。
2.1 結(jié)體特征
2.1.1 書法字骨架提取
圖像的中軸部分亦即圖像骨架,最能夠反映出圖像的結(jié)構(gòu)特征,本研究提出計(jì)算書法字圖像骨架的相似度的算法,對臨帖字體與原碑帖字體在結(jié)體特征方面進(jìn)行相似度的評價(jià)。
提取圖像骨架,需對二值圖像進(jìn)行細(xì)化處理,將二值圖像的骨架提取出來,同時(shí)盡可能保持圖像細(xì)小部分的連通性,進(jìn)而達(dá)到突出形狀特征和減少冗余信息的目的[6]。本研究采用數(shù)學(xué)形態(tài)學(xué)細(xì)化法[13]提取書法字骨架。
細(xì)化算法中,為保證細(xì)化后圖像的連通性,如圖2(e)所示,可以借助中心像素點(diǎn)的八鄰域情況來判斷如何確定一個(gè)像素點(diǎn)是否應(yīng)該被刪除。
設(shè)置一個(gè)5×5鄰域模板S,如圖2(c)。模板各點(diǎn)為S[i, j](0≤i≤4,0≤j≤4),中心點(diǎn)為S[2, 2],如圖2(b)。將模板S各位置上的點(diǎn)賦值,黑點(diǎn)為1,白點(diǎn)為0,模板S的中心像素點(diǎn)需要同時(shí)滿足以下4個(gè)條件[14],即當(dāng)中心像素點(diǎn)不為內(nèi)部點(diǎn)、孤立點(diǎn)、線端點(diǎn)和邊界連通點(diǎn)這4種中的任何一種情況時(shí),才能被刪除:
(1) 2≤N(S[2,2])≤6;
(2) T(S[2,2])=1;
(3) S[1,2]×S[2,1]×S[2,3]=0同時(shí)T(S[1,2])≠1;
(4) S[1,2]×S[2,1]×S[3,2]=0同時(shí)T(S[2,1])≠1。
根據(jù)以上原理,書法單字二值圖像的骨架提取過程如下:
① 書法單字圖像裁剪時(shí),預(yù)留出寬度為2像素的白邊,循環(huán)處理圖像中的所有像素。
② 若當(dāng)前像素點(diǎn)為白色,則重復(fù)執(zhí)行①。
③ 若當(dāng)前像素點(diǎn)為黑色,則定義一個(gè)模板S,設(shè)模板S中心與當(dāng)前像素點(diǎn)重合。如圖2(a)所示為一個(gè)書法字的二值圖像,其上方(小正方形)區(qū)域的放大圖如圖2(b)所示。以該區(qū)域第一個(gè)黑點(diǎn)為中心設(shè)置5×5共25個(gè)像素的區(qū)域,如圖2(c);得到5×5的結(jié)構(gòu)元素模板S,如圖2(d)。
④ 模板S覆蓋的位置,像素為黑點(diǎn),則在模板S對應(yīng)的結(jié)構(gòu)元素置為1,像素為白點(diǎn)置0。
⑤ 通過對中心像素點(diǎn)8鄰域(如圖2(e))和16鄰域(如圖2(f))的判斷,如果模板S同時(shí)滿足 4個(gè)條件,則刪除中心像素點(diǎn),將其填充為白色。圖2(c)的中心像素點(diǎn)沒有同時(shí)滿足4個(gè)條件,則不能刪除。
⑥ 循環(huán)①~⑤,直到處理完圖像中所有像素點(diǎn)。
⑦ 將⑥中得到的結(jié)果作為下一輪掃描的對象,循環(huán)①~⑥,直到?jīng)]有需要?jiǎng)h除的像素點(diǎn)。
圖3(a)為第一輪細(xì)化的結(jié)果,大部分邊界點(diǎn)被刪除,目標(biāo)區(qū)域縮小了一圈。圖3(b)~(d)分別為第二、三、四輪細(xì)化的結(jié)果,黑色區(qū)域不斷從外部向內(nèi)部腐蝕。圖3(e)為多輪細(xì)化的最終結(jié)果,區(qū)域的寬度信息已經(jīng)除去,僅剩寬度為 1像素的骨架細(xì)線。此方法提取書法字骨架提取結(jié)果如表 1所示,基本實(shí)現(xiàn)書法字的結(jié)構(gòu)特征表達(dá),所提取結(jié)果用于下一步的骨架相似度計(jì)算。
圖2 5×5結(jié)構(gòu)元素
表1 書法字骨架提取結(jié)果
2.1.2 骨架相似度計(jì)算
如圖4(a)為經(jīng)提取的臨帖字體骨架(淺色)和原碑帖字體骨架(深色),先求出兩者的差異度,然后根據(jù)差異度判斷兩者在結(jié)體特征方面的相似度。差異度是指臨帖字體骨架上某個(gè)像素點(diǎn)與原碑帖字體骨架中對應(yīng)的像素點(diǎn)之間的距離[13]。
(1) 本研究是采用人工設(shè)定適當(dāng)區(qū)域(如圖4(a)的矩形),在臨帖字體骨架上取任意點(diǎn)m(x1, y1)(如圖4(b)),則m與原碑帖字體骨架上任意點(diǎn)n(x2, y2)之間的距離為:
(2) 計(jì)算 m點(diǎn)與這個(gè)區(qū)域內(nèi)另一個(gè)骨架上各點(diǎn)的距離,取與m點(diǎn)距離最小的n′點(diǎn),定義dmn′為m點(diǎn)到另一個(gè)骨架的距離dmin,如圖4(c)所示。
(3) 用臨帖字體骨架每個(gè)像素點(diǎn)與原碑帖字體骨架對應(yīng)點(diǎn)之間的距離之和表示兩字體骨架的差異度:
式中的 i和 j分別為書法字骨架圖像的寬度和高度。
因差異度和相似度成反比,故距離之和的倒數(shù)能夠反映出兩個(gè)骨架的相似度λ:
其中,sum是臨帖字體骨架上像素點(diǎn)總數(shù)。
表2為臨帖字體與原碑帖字體骨架的比較實(shí)驗(yàn),其中將骨架相似度λ換算為百分制的分?jǐn)?shù)S1。當(dāng)S1越高表示骨架相似度越接近,得到的評價(jià)就越好。
2.2點(diǎn)畫形態(tài)
圖4 書法字骨架差異計(jì)算示意圖
表2 書法字體結(jié)體特征相似度計(jì)算結(jié)果
點(diǎn)畫形態(tài)的相似度是描述筆畫的形狀特征,描述的方法應(yīng)不受形狀區(qū)域平移、旋轉(zhuǎn)的影響。Hu[15]提出的利用7個(gè)幾何不變矩來描述圖像的形狀特性,這種方法可以有效排除點(diǎn)畫中的結(jié)構(gòu)信息,適用于描述點(diǎn)畫形狀。
本研究使用“套索”的工具,通過交互方式分別選取臨帖字體和原碑帖字體的對應(yīng)筆畫(如圖 5“容”字中的撇),然后將所選的筆畫分別進(jìn)行不變矩計(jì)算。當(dāng)兩者對應(yīng)的矩相差越小,則臨帖筆畫和原碑帖筆畫的相似度就越高。
實(shí)驗(yàn)結(jié)果如表3所示,將不變矩平均誤差值的倒數(shù)設(shè)為M,并換算成百分制的分?jǐn)?shù)S2。當(dāng)S2越高表示點(diǎn)畫形態(tài)的相似度就越接近,評價(jià)就越好。
圖5 不變矩計(jì)算
表3 字體點(diǎn)畫形態(tài)相似度計(jì)算結(jié)果
2.3 章法布局
將臨帖字體和碑帖字體進(jìn)行圖像二值化后,處理成白底黑字的書法字圖像。再將該圖像向豎直方向(圖6(a))和水平方向(圖6(b))進(jìn)行投影,在直方圖中得到的空白區(qū)域長度分別為行距和字距離。根據(jù)臨帖和碑帖行距和字距的對比,作為章法布局的相似度。
實(shí)驗(yàn)結(jié)果如表4所示,μ1、μ2分別是行距和字距的相似度,S3為換算成百分制的分?jǐn)?shù),當(dāng)S3越高表示章法布局相似度越接近,評價(jià)就越好。
圖6 書法字圖像投影圖
表4 書法字章法布局相似度計(jì)算結(jié)果
本研究采用Visual Studio 2010作為系統(tǒng)集成開發(fā)環(huán)境,使用C#語言進(jìn)行系統(tǒng)編程。當(dāng)輸入原碑帖和臨帖作品圖像(如掃描件或照片),經(jīng)過圖像預(yù)處理后,即可進(jìn)行章法布局、單字結(jié)體特征和點(diǎn)畫形態(tài)的評價(jià),如圖7(a)~(c)所示。評價(jià)系統(tǒng)綜合這三方面相似度算法結(jié)果,得出臨帖書法作品的平均分、平均等級以及綜合評語,如圖 7(d)所示。書法練習(xí)者可根據(jù)評價(jià)結(jié)果,較為全面地了解自己的學(xué)習(xí)狀況,為進(jìn)一步練習(xí)提供參考。
圖7 書法臨帖的計(jì)算機(jī)評價(jià)
本研究是針對書法初學(xué)者早期對臨帖“形似”要求較高的特點(diǎn),以及依據(jù)《中國書法等級考試標(biāo)準(zhǔn)》的基本內(nèi)容而展開的。借助計(jì)算機(jī)圖像識別技術(shù),對臨帖字體和原碑帖字體的相似程度作出判別和評價(jià)。在字體結(jié)構(gòu)、筆畫形態(tài)和章法布局三方面提出了相似度的算法,實(shí)現(xiàn)了對書法初學(xué)者臨帖效果進(jìn)行評價(jià)的計(jì)算機(jī)輔學(xué)系統(tǒng)。近年來,隨著國學(xué)熱,以及教育部出臺的《關(guān)于中小學(xué)開展書法教育的意見》與《中小學(xué)書法教育指導(dǎo)綱要》等,有些高校還開設(shè)了書法專業(yè),書法教育受到重視,書法愛好者不斷增多。本研究結(jié)合傳統(tǒng)文化和現(xiàn)代科技,在計(jì)算機(jī)輔助書法學(xué)習(xí)方面開展了初步的嘗試。當(dāng)然,還有眾多技術(shù)問題有待于進(jìn)一步地研究和完善。此外,書法學(xué)習(xí)是一個(gè)非常復(fù)雜的思想過程,它包含著非常豐富的文化內(nèi)涵。如果把書法字體僅限于在“形”的相似顯然是遠(yuǎn)遠(yuǎn)不夠的,還需要探討書法字體的很多屬性。
[1] 湯大民. 中國書法簡史[M]. 南京: 南京師范大學(xué)出版社, 2012: 1-10.
[2] 吳慧平. 中國書畫等級考試攻略[M]. 合肥: 安徽美術(shù)出版社, 2009: 1.
[3] 馬小虎, 潘志庚, 張福炎. 基于筆畫描述的樣條漢字庫以及應(yīng)用[J]. 計(jì)算機(jī)學(xué)報(bào), 1996, 19(3): 81-88.
[4] He Rong, Yan Hong. Stroke extraction as pre-processing step to improve thinning results of Chinese characters [J]. Pattern Recognition Letters, 2000, 21(8): 817-825.
[5] 陳 睿, 唐 雁, 邱玉輝. 基于筆畫段分割和組合的漢字筆畫提取模型[J]. 計(jì)算機(jī)科學(xué), 2003, 30(10): 74-77.
[6] 王建平, 錢自拓, 王金玲. 基于數(shù)學(xué)形態(tài)學(xué)的圖像漢字筆畫細(xì)化和提取[J]. 合肥工業(yè)大學(xué)學(xué)報(bào), 2005, 28(11): 1431-1435.
[7] 趙 琪, 薛環(huán)振, 張顯俊. 基于統(tǒng)計(jì)模型的書法筆畫輪廓恢復(fù)[J]. 計(jì)算機(jī)應(yīng)用研究, 2010, 27(10): 3977-3978.
[8] 劉 偉, 朱寧波, 何浩智. 基于彈性網(wǎng)格模糊特征的手寫體漢字識別方法[J]. 中文信息學(xué)報(bào), 2007, 21(3): 117-121.
[9] Ge Yong, Huo Qiang, Feng Zhidan. Offline recognition of handwritten Chinese characters using Gabor features, CDHMM modeling and MCE training [C]//Proceeding of IEEE International Conference on Acoustics, Speech and Signal Processing 2002, 2002: 1053-1056.
[10] Liu Chenglin. High Accuracy handwritten Chinese character recognition using quadratic classifiers with discriminative feature extraction [C]//Proceedings of 18th International Conference on Pattern Recognition, 2006: 942-945.
[11] Kato N, Suzuki M, Omachi S, Aso H, Nemoto Y. A Handwritten character recognition system using directional element feature and asymmetric mahalannobis distance [J]. IEEE Trans. on Pattern Analysis and Machine Intelligence, 1999, 21(3): 258-262.
[12] 朱 虹. 數(shù)字圖像處理基礎(chǔ)與應(yīng)用[M]. 北京: 清華大學(xué)出版社, 2013: 1-79.
[13] 俞 凱. 計(jì)算機(jī)書法若干關(guān)鍵技術(shù)研究[D]. 杭州: 浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 2010.
[14] 聯(lián) 駿. 圖像編程精髓[M]. 北京: 電子工業(yè)出版社, 2006: 6-7.
[15] Hu Mingkuei. Visual pattern recognition by moment invariants [J]. IEEE Transactions on Information Theory, 1962, 8(1): 179-187.
Computer Evaluation of Imitation in Chinese Calligraphy
Deng Xuexiong, Li Jingtao, Li Mu
(School of Design, South China University of Technology, Guangzhou Guangdong 510006, China)
For the characteristics of calligraphy learning beginners, on the base of computer aided technologies, according to the evaluation standard of calligraphy towards beginners, algorithms of calligraphy similarity are proposed. Calligraphy imitations are fed into computer by scanning or taking pictures and preprocessed by utilizing computer image processing technology. By means of making Image skeleton, invariant moment and gray projection algorithm, feature extractions of imitation fonts is made, from the aspect of structure feature, stipple form and writing rules, respectively. Similarity calculation of imitation fonts and original fonts is also completed, and the auxiliary learning system that provides comprehensive assessment of calligraphy imitations for beginners is realized.
computer application; calligraphy education; brush calligraphy; imitation; computer evaluation
TP 391
A
2095-302X(2014)06-0899-06
2014-02-27;定稿日期:2014-05-05
鄧學(xué)雄(1957-),男,廣東三水人,教授,碩士。主要研究方向?yàn)橛?jì)算機(jī)圖形學(xué)、CAD、工程圖學(xué)、計(jì)算機(jī)藝術(shù)等。E-mail:dengxuexiong@263.net