亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于神經(jīng)網(wǎng)絡(luò)的漢字質(zhì)量量化評價(jià)模型

        2014-10-15 07:39:00耿曉艷許維勝吳繼偉
        關(guān)鍵詞:評價(jià)模型

        耿曉艷,許維勝,吳繼偉

        (同濟(jì)大學(xué)電子與信息工程學(xué)院,上海 201804)

        0 引言

        傳統(tǒng)的漢字字庫制作采用人工手寫的方法[1-2],即由造字專家按照統(tǒng)一的風(fēng)格及筆形規(guī)范逐字書寫,然后將字稿掃描到電腦,形成點(diǎn)陣字庫,再進(jìn)行數(shù)字化擬合,將點(diǎn)陣圖形抽象成數(shù)字信息,最后進(jìn)行人工修字,并按照需求,整合為不同格式的字庫。這種方法工作量大,耗時(shí)久,成本高,且易受到人為因素的影響,因而現(xiàn)有的漢字字庫制作技術(shù)已不能適應(yīng)信息產(chǎn)業(yè)日益發(fā)展的需求。

        近年來,一些關(guān)于個(gè)性字庫的研究,如陳禹伶[3]將手寫體樣本字與標(biāo)準(zhǔn)字進(jìn)行識別,然后對標(biāo)準(zhǔn)字進(jìn)行圖像變換,生成具有手寫字特征的“我”體字庫,但沒有考慮字體的品質(zhì)評價(jià)問題,故生成的字庫與期望有較大的差距。ZHOU Bao-yao等[4]針對個(gè)性化手寫體漢字提出樣本字復(fù)用的方法,首先在標(biāo)準(zhǔn)印刷體漢字圖像的基礎(chǔ)上建立漢字部首組合模型,即采用水平、垂直和封閉式分類器對標(biāo)準(zhǔn)漢字進(jìn)行分割,并根據(jù)視覺相似性對部首分類,然后采用該模型將輸入的手寫體樣本字分割并生成其他漢字。潘志庚等[5]提出了一種使用Fourier級數(shù)描述漢字輪廓,通過對不同字形的風(fēng)格進(jìn)行復(fù)合,生成具有多種風(fēng)格的字形的方法,但也未涉及字體的品質(zhì)評價(jià)問題。

        針對傳統(tǒng)字庫制作中需要人工干預(yù)構(gòu)字結(jié)果這一弊端,本文依據(jù)造字專家對于漢字質(zhì)量的評判方法,抽象漢字的相關(guān)美學(xué)屬性特征,并依此建立神經(jīng)網(wǎng)絡(luò)模型。通過學(xué)習(xí)造字專家對個(gè)例漢字的評判結(jié)果,獲取漢字品質(zhì)的量化評判標(biāo)準(zhǔn),從而實(shí)現(xiàn)對所有構(gòu)字結(jié)果進(jìn)行計(jì)算機(jī)自動美學(xué)評價(jià),提升字庫中漢字的質(zhì)量。

        1 提取屬性

        1.1 漢字書寫規(guī)則

        造字專家采用人工手寫的方法造字,必然有一系列的關(guān)于字體品質(zhì)的評價(jià)準(zhǔn)則,按照這樣的準(zhǔn)則生成的漢字被認(rèn)為是符合專業(yè)審美要求的。標(biāo)準(zhǔn)整字滿足的基本書法規(guī)則有:

        (1)滿收虛放,即字體外圍較滿的漢字要內(nèi)收,較虛的漢字要外放。另外,內(nèi)白大的漢字應(yīng)適當(dāng)縮小,這樣才能使字體的視覺大小一致。如圖1所示,第一組的“口”、“田”、“圍”3個(gè)字實(shí)際大小相同,但看起來“口”字較大,“圍”字最小;第二組將“口”字和“田”字做了適當(dāng)?shù)目s小,看起來就更加協(xié)調(diào)了。

        (2)黑白均勻,即漢字整體的黑白比例協(xié)調(diào)。

        (3)重心穩(wěn)定,上緊下松,左右平衡。因人有視錯(cuò)覺,即視覺中心比絕對中心要高一點(diǎn),故為使字體的中心在視覺中心上,就要上部緊湊下部寬松,這樣才符合視覺審美[6-7]。

        圖1 字體內(nèi)白對視覺效果的影響

        1.2 定義影響漢字質(zhì)量的屬性

        用計(jì)算機(jī)對構(gòu)字結(jié)果進(jìn)行評價(jià),需要將上述標(biāo)準(zhǔn)和要求量化,具體可以通過漢字的相關(guān)屬性來表征。本文利用Matlab環(huán)境,采用圖像處理的方法,提取可能影響字體質(zhì)量的屬性特征,并經(jīng)實(shí)驗(yàn)測試,確定了以下對漢字品質(zhì)有重要影響的屬性[8-11]。

        (1)外接矩形的寬(Width)和高(Height),反映漢字最基本的大小和比例。

        (2)水平重心(W_X)和豎直重心(W_Y)。設(shè)c(i,j)表示漢字點(diǎn)陣,則重心的計(jì)算方法如下:

        其中,I表示外接矩形的寬,J表示外接矩形的高。

        (3)中心,即外接矩形的中心,包括水平中心(G_X)和豎直中心(G_Y)。

        (4)黑像素占外接矩形的比例(WAR),計(jì)算公式如下:

        (5)復(fù)雜度,定義為黑白像素的變化次數(shù),包括水平復(fù)雜度(CompX)和豎直復(fù)雜度(CompY)。

        (6)滿虛度,設(shè)漢字點(diǎn)陣c(i,j)到外接矩形上、下、左、右 4 個(gè)方向的距離分別為 dT(i,j)、dB(i,j)、dL(i,j)和 dR(i,j),則整字的滿虛度定義為:

        (7)為了更細(xì)致地表示漢字的黑白,將外接矩形等分為左上、右上、左下和右下4部分,分別計(jì)算每一部分的黑像素比例(WARLT、WARRT、WARLB和WARRB)。

        (8)為充分反映漢字邊界的滿虛程度,計(jì)算外接矩形上、下、左、右各四分之一部分的黑像素比例(WARL、WARR、WART、WARB)。

        (9)形態(tài)結(jié)構(gòu)特征,取外接矩形的上三分之二部分、從上到下的中間三分之二部分和下三分之一部分,分別求出各自的左、右滿虛度(ShapeT_L、ShapeT_R、ShapeTBM_L、ShapeTBM_R、ShapeB_L、ShapeB_R);同理,取外接矩形的左三分之二部分、從左到右的中間三分之二部分和右三分之一部分,分別求出各自的上、下滿虛度(ShapeL_T、ShapeL_B、ShapeLRM_T、ShapeLRM_B、ShapeR_T、ShapeR_B)。

        2 構(gòu)建評價(jià)模型

        2.1 確定評價(jià)模型的輸入與輸出

        根據(jù)上文提出的書法規(guī)則,大小一致可以通過外接矩形的寬和高來衡量,滿收虛放和內(nèi)白大小決定了漢字的大小,反映到抽象的量,即復(fù)雜度、滿虛度和形態(tài)結(jié)構(gòu)特征決定了外接矩形的寬和高。整字的黑像素所占比例WAR可以體現(xiàn)漢字的黑白均勻,影響整字WAR的量有:外接矩形的寬和高、復(fù)雜度、黑像素總數(shù)、形態(tài)結(jié)構(gòu)特征以及滿虛度。為更精確地反映漢字的黑白均勻,將4等分外接矩形得到的WARLT、WARRT、WARLB和WARRB值作為表現(xiàn)黑白特點(diǎn)的量度,與整字的WAR類似,影響這4部分黑像素比例的因素有:外接矩形的寬和高、復(fù)雜度、整字的WAR、形態(tài)結(jié)構(gòu)特征以及滿虛度。重心穩(wěn)定,上緊下松,左右平衡,可以用漢字的重心和中心來表征,經(jīng)測試漢字的形態(tài)結(jié)構(gòu)特征和滿虛度可以較好地確定重心和中心。

        基于以上分析,本文利用改進(jìn)的三層BP神經(jīng)網(wǎng)絡(luò)分別構(gòu)建4個(gè)評價(jià)模型:SelEvaluWHNet、SelEvalu-WARNet、SelEvaluQuaWARNet、SelEvaluPosNet,其各自的輸入、輸出如圖2~圖4所示。

        圖3 SelEvaluWARNet評價(jià)黑白是否均勻

        圖4 SelEvaluQuaWARNet評價(jià)黑白是否均勻

        圖5 SelEvaluPosNet評價(jià)重心是否穩(wěn)定

        2.2 建立評價(jià)模型的BP網(wǎng)絡(luò)

        評價(jià)模型的搭建過程中使用到Matlab的神經(jīng)網(wǎng)絡(luò)工具箱,該工具箱提供了許多有關(guān)神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)、訓(xùn)練和仿真的函數(shù),用戶可根據(jù)需要調(diào)用相關(guān)函數(shù)[12]。下面介紹本文構(gòu)造評價(jià)模型的BP網(wǎng)絡(luò)所用的工具箱函數(shù)及具體的參數(shù)選擇。

        (1)利用 newff函數(shù)生成 BP網(wǎng)絡(luò)進(jìn)行初始化[13],其語法結(jié)構(gòu)為:

        其中,P、T分別表示輸入、輸出向量;Si表示第i層網(wǎng)絡(luò)的神經(jīng)元數(shù)目,N表示網(wǎng)絡(luò)的總層數(shù),設(shè)輸入、輸出神經(jīng)元個(gè)數(shù)分別為 m、n,由于本文采用三層BP網(wǎng)絡(luò),則根據(jù)經(jīng)驗(yàn)值取第一、第二隱層的神經(jīng)元個(gè)數(shù)為:

        PF是性能函數(shù),常用默認(rèn)的均方誤差mse;TFi表示第i層網(wǎng)絡(luò)的傳遞函數(shù);BTF表示訓(xùn)練函數(shù);BLF表示學(xué)習(xí)函數(shù)。TF、BTF和BLF的選取分別如下:

        這里,傳遞函數(shù)logsig為S型的對數(shù)函數(shù),可將輸入映射到區(qū)間(0,1)中;tansig為雙曲正切S形傳遞函數(shù),其返回值位于區(qū)間(-1,1)中;satlins為對稱飽和線性傳遞函數(shù)。學(xué)習(xí)函數(shù)選取默認(rèn)的梯度下降動量學(xué)習(xí)函數(shù)learngdm。

        為克服標(biāo)準(zhǔn)BP算法存在的收斂速度慢、易形成局部極小等缺陷,本文使用改進(jìn)的BP網(wǎng)絡(luò),即訓(xùn)練函數(shù)采用動量及自適應(yīng)lrBP的梯度訓(xùn)練遞減函數(shù)traingdx。增加動量項(xiàng),即從前一次權(quán)值調(diào)整量中取出一部分疊加到本次權(quán)值調(diào)整量中,有助于使網(wǎng)絡(luò)從誤差局部極小中跳出;自適應(yīng)改變學(xué)習(xí)率,可減小振蕩趨勢,提高網(wǎng)絡(luò)的訓(xùn)練速度[13-14]。

        (2)設(shè)置網(wǎng)絡(luò)的訓(xùn)練參數(shù)。

        收斂次數(shù) net.trainParam.epochs=200000。

        顯示間隔 net.trainParam.show=100。

        收斂誤差 net.trainParam.goal=igoal,igoal根據(jù)表1對4個(gè)評價(jià)網(wǎng)絡(luò)分別進(jìn)行設(shè)置。

        表1 評價(jià)網(wǎng)絡(luò)的收斂誤差

        3 測試結(jié)果及分析

        本文所提出的評價(jià)模型首先針對結(jié)構(gòu)較為簡單的上下、左右結(jié)構(gòu)的漢字進(jìn)行研究。影響評價(jià)結(jié)果的因素,除了評價(jià)模型本身,還與樣本字的選擇有很大關(guān)系,目前采用隨機(jī)選取的方式獲得樣本字,以839個(gè)標(biāo)準(zhǔn)字作為樣本進(jìn)行訓(xùn)練,并用另外隨機(jī)選取的271個(gè)標(biāo)準(zhǔn)字測試,根據(jù)測試結(jié)果分別統(tǒng)計(jì)各個(gè)屬性的標(biāo)準(zhǔn)誤差(標(biāo)準(zhǔn)誤差定義為各測量值誤差平方的平均值開平方),結(jié)果如表2所示。

        表2 測試結(jié)果中各屬性的標(biāo)準(zhǔn)誤差

        由表2可以得出,各屬性的標(biāo)準(zhǔn)誤差都在4.5%以內(nèi),證明該評價(jià)方法具有可行性。然后,隨機(jī)構(gòu)字300個(gè)對各屬性進(jìn)行評價(jià),經(jīng)統(tǒng)計(jì),外界矩形的寬Width誤差大于5%的結(jié)果有9個(gè),由于篇幅所限,現(xiàn)展示部分如圖6所示,其中左圖是待評價(jià)漢字,右圖是對比樣本字,余圖同理。

        圖6 Width誤差大于5%的待評價(jià)漢字與樣本字的對比

        外界矩形的高Height誤差大于5%的結(jié)果有5個(gè),展示部分如圖7所示。

        圖7 Height誤差大于5%的待評價(jià)漢字與樣本字的對比

        左上黑像素比例WARLT誤差大于5%的結(jié)果有2個(gè),如圖8所示。

        圖8 WARLT誤差大于5%的待評價(jià)漢字與樣本字的對比

        右上黑像素比例WARRT誤差大于5%的結(jié)果有3個(gè),包括圖8中的“鬠”,另外2個(gè)結(jié)果如圖9所示。

        圖9 WARRT誤差大于5%的待評價(jià)漢字與樣本字的對比

        右下黑像素比例WARRB誤差大于5%的結(jié)果有4個(gè),包括圖9中的“舮”和“駟”,另外2個(gè)結(jié)果如圖10所示。

        圖10 WARRB誤差大于5%的待評價(jià)漢字與樣本字的對比

        X方向中心G_X誤差大于5%的結(jié)果有1個(gè),即圖8中的“階”。

        X方向重心W_X誤差大于5%的結(jié)果有4個(gè),包括圖9中的“駟”和圖10中的“酐”,另外2個(gè)結(jié)果如圖11所示。

        圖11 造W_X誤差大于5%的待評價(jià)漢字與樣本字的對比

        Y方向重心W_Y誤差大于5%的結(jié)果有2個(gè),如圖12所示。

        圖12 W_Y誤差大于5%的待評價(jià)漢字與樣本字的對比

        另外,整字的黑像素比例WAR、左下黑像素比例WARLB和Y方向中心G_Y的誤差均小于5%。

        4 結(jié)束語

        通過上述研究,可以得出以下結(jié)論:

        (1)通過分析標(biāo)準(zhǔn)漢字滿足的基本書法規(guī)則,定義可能對漢字質(zhì)量產(chǎn)生影響的屬性特征,采用圖像處理方法提取獲得這些特征量,并經(jīng)實(shí)驗(yàn)測試,確定了其中對漢字品質(zhì)有重要影響的屬性。

        (2)采用改進(jìn)的三層BP神經(jīng)網(wǎng)絡(luò),建立起4個(gè)分別針對各項(xiàng)基本書法規(guī)則的評價(jià)模型。

        (3)針對隨機(jī)產(chǎn)生的待評價(jià)漢字,基于神經(jīng)網(wǎng)絡(luò)的漢字質(zhì)量量化評價(jià)模型能夠較準(zhǔn)確地反映出漢字的品質(zhì),為字體調(diào)整提供參考。該評價(jià)模型應(yīng)用于漢字字庫的制作過程中,將減少對于構(gòu)字結(jié)果的人工干預(yù),提升工作效率,進(jìn)而縮短制作周期,降低成本。

        (4)對于樣本字的選擇,目前采用隨機(jī)選取方式,雖然覆蓋范圍較大,但因?yàn)榛緯ㄒ?guī)則體現(xiàn)的是總體特征,若隨機(jī)將特殊漢字作為樣本字,學(xué)習(xí)精度就會受到很大影響,所以今后的工作將著重于樣本字的選擇方法,以進(jìn)一步提高評價(jià)模型的精度。

        [1]方正.如何制作電腦中文字庫[J].印刷質(zhì)量與標(biāo)準(zhǔn)化,1999(6):35-36.

        [2]夏自由.字庫知識淺談[J].印刷技術(shù),2006(13):64-66.

        [3]陳禹伶.基于部件融合的“我”體字庫的建立[D].綿陽:西南科技大學(xué),2008.

        [4]Zhou Bao-yao,Wang Wei-hong,Chen Zhang-hu.Easy generation of personal Chinese handwritten fonts[C]//Proceedings of the 2011 IEEE International Conference on Multimedia and Expo.2011:1-6.

        [5]潘志庚,馬小虎.基于Fourier級數(shù)描述器的多種漢字字形自動生成[J].軟件學(xué)報(bào),1996,7(6):331-338.

        [6]張璇.字體與版式設(shè)計(jì)[M].北京:清華大學(xué)出版社,2009.

        [7]樊建平.基于漢字結(jié)構(gòu)碼量化傳統(tǒng)書法規(guī)則知識方法的實(shí)現(xiàn)[J].中文信息學(xué)報(bào),1990,4(4):43-51.

        [8]孫燮華.圖像處理——原理與算法[M].北京:機(jī)械工業(yè)出版社,2010:195-211.

        [9]龔聲蓉,劉純平,等.數(shù)字圖像處理與分析[M].北京:清華大學(xué)出版社,2006:238-259.

        [10]譚軍,馮明帥,胡迎梅,等.基于筆畫形態(tài)與結(jié)構(gòu)的自動筆跡鑒定[J].廣東公安科技,2010(1):11-15.

        [11]Zhang Li-xin,Zhao Yan-nan,Yang Ze-hong,et al.Feature selection in recognition of handwritten Chinese characters[C]//Proceedings of the 2002 International Conference on Machine Learning and Cybernetics.2002:1158-1162.

        [12]羅成漢.基于Matlab神經(jīng)網(wǎng)絡(luò)工具箱的BP網(wǎng)絡(luò)實(shí)現(xiàn)[J].計(jì)算機(jī)仿真,2004,21(5):109-111.

        [13]張德豐.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2009:92-119.

        [14]韓力群.人工神經(jīng)網(wǎng)絡(luò)教程[M].北京:北京郵電學(xué)院出版社,2006:58-78.

        猜你喜歡
        評價(jià)模型
        一半模型
        SBR改性瀝青的穩(wěn)定性評價(jià)
        石油瀝青(2021年4期)2021-10-14 08:50:44
        中藥治療室性早搏系統(tǒng)評價(jià)再評價(jià)
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        基于Moodle的學(xué)習(xí)評價(jià)
        關(guān)于項(xiàng)目后評價(jià)中“專項(xiàng)”后評價(jià)的探討
        保加利亞轉(zhuǎn)軌20年評價(jià)
        色窝窝在线无码中文| 免费亚洲一区二区三区av| 国产精品女同久久久久电影院| 99精品一区二区三区无码吞精| 国产欧美va欧美va香蕉在线观 | 亚洲精品成人网站在线观看| 免费国产黄片视频在线观看| 国产成人av一区二区三| 日韩a级精品一区二区| 国产女人高潮视频在线观看| 亚洲婷婷丁香激情| 国产无套粉嫩白浆内精| 日韩亚洲精品中文字幕在线观看 | 亚洲av无码成人黄网站在线观看| 91精品91久久久久久| 亚洲成在人线天堂网站| 国色天香社区视频在线| 性欧美暴力猛交69hd| 亚洲一区二区三区在线观看播放| 国产午夜精品综合久久久| 久久婷婷五月综合97色直播| 性一乱一搞一交一伦一性| 亚洲色www无码| 亚洲婷婷久久播66性av| 国产综合色在线视频区| 综合久久给合久久狠狠狠97色| 亚洲AV无码一区二区一二区教师| 狼人精品剧情av在线观看| 成人网站在线进入爽爽爽| 免费a级毛片无码a| 亚洲美女国产精品久久久久久久久| 久久精品免费视频亚洲| 影视av久久久噜噜噜噜噜三级 | 在线观看免费a∨网站| 亚洲中文字幕无线乱码va | 岛国精品一区二区三区| 国产精品国产三级国产an不卡| 男人女人做爽爽18禁网站| 国产一级农村无码| 国产亚洲精品视频在线| 成人艳情一二三区|