亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        小篆文字的自動識別

        2016-02-23 04:50:39周明全
        計算機技術(shù)與發(fā)展 2016年3期
        關(guān)鍵詞:自動識別標(biāo)準(zhǔn)

        戴 瓊,周明全,付 倩

        (北京師范大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100875)

        小篆文字的自動識別

        戴 瓊,周明全,付 倩

        (北京師范大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100875)

        小篆是秦統(tǒng)一后使用的文字,是漢字發(fā)展的一個重大里程碑。在書法、碑文、石刻等有大量存在。但是由于與現(xiàn)代漢字差異較大,大多數(shù)人無法辨識這些小篆文字。文中提出了一種利用計算機對小篆文字自動辨識的方法。首先構(gòu)建標(biāo)準(zhǔn)以及小篆字體數(shù)據(jù)庫,然后將用戶需要識別的小篆文字圖片縮放至標(biāo)準(zhǔn)大小,隨后采用迭代最近點算法(ICP算法)與庫中的小篆文字進行匹配,最后計算其相似度,而得到的相似度最高文字,也就是識別的輸出結(jié)果,從而實現(xiàn)小篆字體的自動識別。該方法經(jīng)過大量實驗證明是有效的。

        小篆字體;ICP算法;相似度;自動識別

        1 概 述

        弘一法師曾這樣說過,學(xué)字“先由篆字學(xué)起”。為什么呢?“若不學(xué)篆書,不講究‘說文’,對于字學(xué)及文字起源,就不能明白”,“寫篆字也可以為寫隸書、楷書、行書的基礎(chǔ)”,“篆書是各種字的根本”[1]。

        篆書起源于西周末年,東周時在秦國一帶流行,至秦始皇時達到鼎盛,漢代開始衰退,逐漸向分書過渡。這三個時期的篆書風(fēng)格有較大差異。為了加以區(qū)別,人們把東周時的篆書稱為大篆(或稱籀書),秦始皇時的稱為小篆,漢代的稱為漢篆[2]。

        小篆是秦統(tǒng)一六國“書同文”后規(guī)范化的文字,是先秦篆書的最終規(guī)范,是漢字發(fā)展的一個重大里程碑。東周時代,諸侯力政,不統(tǒng)于王,各國文字一方面因為實用需要不斷簡化,另一方面,為了美觀,常添加各種裝飾性的筆畫,結(jié)果文字異形,訛體歧出。秦統(tǒng)一六國,秦始皇實行“書同文”政策,由丞相李斯厘定正體字,在原來秦使用的大篆基礎(chǔ)上吸收六國文字優(yōu)點并加以簡化規(guī)范[3-4]。其規(guī)范的根本點是對從甲骨文到金文以及戰(zhàn)國時期各種裝飾性誡文字所運用的曲線和結(jié)構(gòu)對稱性的提煉和凈化,也是對整個先秦時代人們審美趨向的總結(jié)升華。

        小篆在我國歷史上使用了千余年,自從漢朝通用隸書之后,小篆的應(yīng)用就日益減少。在漢末至六朝又出現(xiàn)了楷書,經(jīng)隋唐宋元明清一直沿用至現(xiàn)代。自從楷書通用以后,經(jīng)歷了一千多年的歷史,小篆就日漸從人們?nèi)粘I钪械?,其?yīng)用越來越少[2]。

        盡管如此,小篆的象征性和裝飾性在中國傳統(tǒng)藝術(shù)中發(fā)揮著巨大的作用并影響深遠。比如名山大川、風(fēng)景名勝、遺址古建、寺院道觀、文保單位、公私堂所等處的石碑、摩崖、對聯(lián)、匾額、中堂條幅以及鑄件等處,都會刻有篆字。它們醒目、大氣、莊重、權(quán)威,無數(shù)的碑額借助于小篆的象征性樹立起權(quán)威的象征性。又如篆刻,它是小篆被廣泛運用到印信中,并由此發(fā)展成的一門相對獨立的藝術(shù),由此也產(chǎn)生出一大批書法大家,如鄧石如、趙之謙等。再如秦磚漢瓦,是中國傳世文物中的一大項目,也是古代美術(shù)的一大類,上面也都刻有篆字,文字形式上較規(guī)范,內(nèi)容上實用性較強[5-6]。

        由此可以看出,即使在甲骨文三四千年后的現(xiàn)代,篆字(特別是小篆)的辨識依然具有其重要的意義,這關(guān)乎文史、美術(shù)與中華文明傳承。

        古代的書法、碑文、石刻等有大量的小篆,但由于與現(xiàn)代漢字差異較大,大多數(shù)人無法認(rèn)識這些小篆文字。因此有必要借助計算機技術(shù)幫助自動辨識。而對于自動識別,其結(jié)果就是找到在已建立的標(biāo)準(zhǔn)小篆字庫中與之相似度最大的字,則在計算相似度之前如何匹配當(dāng)前這兩個待比較的圖片是一個關(guān)鍵問題。如果將每一個圖片中的字的部分的像素點看作是退化的二維平面上的點云,則可以借助很多的方法來實現(xiàn)匹配。這些匹配方法一般是基于迭代的算法,通過定義一個誤差函數(shù)來反映點云重疊區(qū)域間的吻合程度。目前應(yīng)用最廣泛的方法是由Besl等[7]以及Chen等[8]提出的迭代最近點(Iterative Closest Point,ICP)算法,此類算法通過迭代的計算,使兩片點云上對應(yīng)點對的均方誤差最小。

        當(dāng)前,大多數(shù)工作是輸入現(xiàn)代漢字,可以輸出小篆文字。而對小篆文字自動辨識工作較少,西北大學(xué)針對瓦當(dāng)上小篆文字的識別展開研究,提出了一種基于神經(jīng)網(wǎng)絡(luò)的方法[9]和基于文字幾何結(jié)構(gòu)的方法[10]。文中提出了一種通過照片對小篆文字自動辨識的通用方法,通過建立小篆字庫計算字庫內(nèi)的字與輸入的字的相似度,實現(xiàn)小篆文字的自動辨識。

        2 小篆字庫的構(gòu)建

        在該系統(tǒng)中,對所建立的3 755個一級國標(biāo)漢字按照其在標(biāo)準(zhǔn)中出現(xiàn)的順序按阿拉伯?dāng)?shù)字建立索引,并將其對應(yīng)的書法漢字圖像一并入庫進行存儲以建立小篆字庫。每個小篆字圖片為600×600像素的二值圖片。圖1是一些字庫中的小篆字體的例子。

        圖1 標(biāo)準(zhǔn)小篆字體“北京師范大學(xué)”

        3 相似度的計算

        文中對于小篆字體的自動識別,基于相似度的計算,其中輸入的待識別圖片與標(biāo)準(zhǔn)小篆字庫中的小篆字圖片相似度最大的字即為輸出結(jié)果。第二節(jié)已經(jīng)介紹了建立的小篆標(biāo)準(zhǔn)字庫,其中的圖片大小為600×600,所以輸入的圖片經(jīng)過處理后應(yīng)該是與標(biāo)準(zhǔn)字部分基本重疊且大小同為600×600的圖片。相似度的計算介紹如下:

        若Pi,j是標(biāo)準(zhǔn)小篆字庫中當(dāng)前比較圖片(i,j)像素位置的顏色值,Qi,j是用戶輸入待識別圖片(i,j)像素位置的顏色值。其中i,j是圖片像素位置中的橫縱坐標(biāo),1≤i≤600,1≤j≤600。而Pi,j定義如下:

        Qi,j可以相似地定義。若K=600,則相似度可以由以式(1)計算得到。

        (1)

        在以上方程中分子部分為同為黑色(即同屬于字體)的像素個數(shù),分母為同為黑色或者顏色不同(一個屬于字體一個屬于背景)的像素個數(shù)??梢钥闯觯绻@兩個字完全匹配,則相似度為1;如果這兩個完全不匹配,則相似度為0。

        4 字體匹配

        小篆字體的自動識別,輸出的是相似度最大的字作為結(jié)果。上節(jié)已經(jīng)介紹了相似度的計算??梢钥闯觯瑸榱吮WC結(jié)果的正確性,待識別的圖片與字庫中的圖片的匹配是十分重要的。由于用戶輸入的圖片大小及其中字的方向大小位置都不是確定的,所以在計算其相似度大小之前,需要對輸入圖片進行處理,以致其圖片大小與標(biāo)準(zhǔn)圖片大小相同,且其中字的方向位置大小都與標(biāo)準(zhǔn)字盡可能一致。初始的圖片大小以及字的大小處理比較簡單,而更復(fù)雜的字的方向位置處理采用ICP算法來完成。

        4.1 初始匹配

        由于用戶輸入圖片的隨意性,它的圖片大小及其中字的大小方向位置都需要盡可能匹配標(biāo)準(zhǔn)字以達到一致。

        對于輸入字的大小調(diào)整,是根據(jù)它與標(biāo)準(zhǔn)字的最小包圍圓來調(diào)整的。雖然中國漢字是方塊字,但是由于輸入字的方向不定不能保證它的方向一定是豎直向上的,所以這里用包圍圓來調(diào)整更為妥當(dāng)。其中最小包圍圓的圓心是根據(jù)字體像素的平均位置來決定的,半徑則是字體像素部分與圓心的最大距離。最小包圍圓調(diào)整字體大小的結(jié)果見圖2和圖3。

        圖2 與標(biāo)準(zhǔn)字“京”初始匹配結(jié)果

        4.2 ICP算法匹配

        經(jīng)過初始處理以后,輸入圖片被處理為字體最小包圍圓與當(dāng)前標(biāo)準(zhǔn)字的相同,且圖片大小為標(biāo)準(zhǔn)的600×600,如此已經(jīng)保證了計算相似度的可行性,但是仍不能保證其精確性。因此采用了ICP算法[11]來進一步精確地匹配字體。ICP算法通過尋找初始處理后的輸入圖片字體像素點集以及標(biāo)準(zhǔn)字體像素點集的對應(yīng)匹配點之間的關(guān)系,計算兩個點集的變換參數(shù),以滿足給定的收斂精度,最終求得兩個點集之間的平移和旋轉(zhuǎn)參數(shù),來完成匹配過程。

        ICP算法用來解決多視點云間的對齊問題,前面已經(jīng)提到ICP算法的理論,現(xiàn)在介紹一下ICP算法的實現(xiàn)過程。ICP算法本質(zhì)上是基于最小二乘法的最優(yōu)匹配方法。該算法重復(fù)進行選擇對應(yīng)關(guān)系點對,計算最優(yōu)剛體變換這一過程,直到滿足正確匹配的收斂精度要求。

        ICP算法的目的是要找到待匹配點云數(shù)據(jù)與參考點云數(shù)據(jù)之間的旋轉(zhuǎn)參數(shù)R和平移參數(shù)T,使得兩點集數(shù)據(jù)之間滿足某種度量準(zhǔn)則下的最優(yōu)匹配。

        假設(shè)給定兩個點集X1和X2,ICP方法的匹配步驟如下所示:

        (1)搜索X2中的每一個點在X1點集中的對應(yīng)最近點;

        (2)求得使上述對應(yīng)點對平均距離最小的剛體變換,求得平移參數(shù)和旋轉(zhuǎn)參數(shù);

        (3)對X2使用上一步求得的平移和旋轉(zhuǎn)參數(shù),得到新的變換點集;

        (4)如果新的變換點集與參考點集滿足f(R,T)式的目標(biāo)函數(shù)要求,即兩點集的平均距離小于某一給定閾值,則停止迭代計算,否則新的變換點集作為新的X2繼續(xù)迭代,直到達到目標(biāo)函數(shù)的要求。

        而在(1)中,ICP搜索最近點的主要方法有:點對點最近點搜索算法[7]、點對面最近點搜索算法[13]、點投影最近點搜索算法[14]。這里把初始處理后的輸入圖片的像素點集以及標(biāo)準(zhǔn)字圖片的像素點集作為待匹配的兩個點云集,所以采用的是點對點最近點搜索算法。

        圖4是經(jīng)過初始處理的輸入圖片通過ICP算法精確匹配后的結(jié)果。

        圖4 ICP算法精確匹配

        5 自動識別

        文中對于輸入的一個小篆字體圖片的自動識別是通過輸入與小篆字庫中標(biāo)準(zhǔn)字逐個比較計算其相似度,最后得到其中相似度最大的字作為自動識別的結(jié)果,流程圖見圖5。

        圖5 自動識別算法流程圖

        具體來說,經(jīng)過以上匹配以后,得到了針對當(dāng)前標(biāo)準(zhǔn)字的匹配后的輸入處理結(jié)果。現(xiàn)在將匹配后的輸入結(jié)果與當(dāng)前標(biāo)準(zhǔn)字,根據(jù)第三節(jié)中介紹的相似度計算方法可以計算出針對當(dāng)前標(biāo)準(zhǔn)字的相似度。對于字庫中的所有標(biāo)準(zhǔn)字,總共能得到3 755個相似度結(jié)果,其中最大的相似度即為輸出結(jié)果。比如圖4的例子中,最終計算的相似度“京”要比“學(xué)”要小,實際上其最終的識別結(jié)果也是“學(xué)”,如圖6所示。

        圖6 自動識別結(jié)果

        6 結(jié)束語

        針對小篆文字辨識困難問題,文中提出了一種利用計算機對小篆文字的自動辨識方法。建立了一個標(biāo)準(zhǔn)小篆字庫。針對輸入的一個待識別小篆字體圖片,首先根據(jù)當(dāng)前標(biāo)準(zhǔn)字經(jīng)過初始處理得到標(biāo)準(zhǔn)圖片大小且字的大小大致相同的初始結(jié)果,然后對初始處理后的字與當(dāng)前標(biāo)準(zhǔn)字通過ICP精確匹配后調(diào)整它的位置與方向,最后計算其相似度。當(dāng)計算出輸入字與庫中所有字的相似度后,其中相似度最大的字即為其自動識別的結(jié)果。

        該方法基于一個小篆的一級漢字庫(包括3 755個字),因此目前可以辨識一級漢字庫范圍內(nèi)的小篆文字,但是以后可以很方便地擴展字庫,而且這種自動識別的方法對于其他字體的識別同樣有效。未來系統(tǒng)可以移植到移動設(shè)備如手機上,通過手機拍照,可以自動辨識小篆文字,也可以用于印的篆刻等。

        [1] 羅喜澤.小篆技法教程[M].成都:四川師范大學(xué)電子出版社,2010.

        [2] 沃興華.中國書法史[M].上海:上海古籍出版社,2001.

        [3] 沃興華.中國書法篆刻簡史[M].上海:上海古籍出版社,2010.

        [4] 高玉軍,劉慧杰,呂肖慶,等.小篆文本的在線編輯技術(shù)[J].計算機科學(xué),2007,34(12):241-243.

        [5] 趙昌智.中國篆刻史[M].上海:上海人民出版社,2006.

        [6] 林乾良,于良子.篆字辨識[M].杭州:西泠印社出版社,2009.

        [7]BeslPJ,MckayND.Amethodforregistrationof3-dshapes[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,1992,14(2):239-256.

        [8]ChenY,MedioniG.Objectmodelingbyregistrationofmultiplerangeimages[J].ImageandVisionComputing,1992,10(3):145-155.

        [9] 劉 磊.基于內(nèi)容的秦漢瓦當(dāng)小篆文字識別方法研究[D].西安:西北大學(xué),2015.

        [10] 周子駿.基于神經(jīng)網(wǎng)絡(luò)的瓦當(dāng)中小篆的識別方法[D].西安:西北大學(xué),2014.

        [11] 周春艷,李 勇,鄒崢嶸.三維點云ICP算法改進研究[J].計算機技術(shù)與發(fā)展,2011,21(8):75-77.

        [12] 金 濤,童水光,顏永年.逆向工程技術(shù)[M].北京:機械工業(yè)出版社,2003.

        [13]BergevinR,SoucyM,GagnonH,etal.Towardsageneralmulti-viewregistrationtechnique[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,1996,18(5):540-547.

        [14]RusinkiewiczS,LevoyM.EfficientvariantsoftheICPalgorithm[C]//Procofthirdinternationalconferenceon3-Ddigitalimagingandmodeling.[s.l.]:IEEE,2001:145-152.

        Automatic Recognition of Xiaozhuan Fonts

        DAI Qiong,ZHOU Ming-quan,FU Qian

        (College of Information Science and Technology,Beijing Normal University,Beijing 100875,China)

        Xiaozhuan is the language used Qin unified China,and is a major milestone in the development of Chinese characters.In calligraphy,inscriptions,stone carvings,it is abound.However,due to large differences with the modern Chinese characters,most people cannot recognize these Xiaozhuan text.An automatic identification method of Xiaozhuan text by using computer technology is presented.First,the standard and database for Xiaozhuan font is built.Secondly,the Xiaozhuan text image which users want to identify is scaled to the standard size,and then the image is matched with these characters in the standard database of Xiaozhuan font by iterative closest point algorithm (ICP algorithm).Finally,the similarity is computed and the highest similarity ward is selected,that is the output result of recognition.Therefore automatic recognition of Xiaozhuan font is achieved.A lot of experiments have shown this method is effective.

        Xiaozhuan fonts;ICP;similarity;automatic recognition

        2015-06-20

        2015-09-23

        時間:2016-02-18

        國家自然科學(xué)基金資助項目(61170203)

        戴 瓊(1970-),女,碩士生,研究方向為計算機應(yīng)用;周明全,教授,研究方向為計算機應(yīng)用。

        http://www.cnki.net/kcms/detail/61.1450.TP.20160218.1638.090.html

        TP301

        A

        1673-629X(2016)03-0001-04

        10.3969/j.issn.1673-629X.2016.03.001

        猜你喜歡
        自動識別標(biāo)準(zhǔn)
        中國自動識別技術(shù)協(xié)會
        2022 年3 月實施的工程建設(shè)標(biāo)準(zhǔn)
        船舶自動識別系統(tǒng)對船舶救助的影響
        水上消防(2019年3期)2019-08-20 05:46:08
        忠誠的標(biāo)準(zhǔn)
        美還是丑?
        自動識別系統(tǒng)
        特別健康(2018年3期)2018-07-04 00:40:18
        你可能還在被不靠譜的對比度標(biāo)準(zhǔn)忽悠
        金屬垃圾自動識別回收箱
        基于IEC61850的配網(wǎng)終端自動識別技術(shù)
        電測與儀表(2016年6期)2016-04-11 12:06:38
        一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長中的煩惱”
        專用汽車(2016年4期)2016-03-01 04:13:43
        日本在线一区二区在线| 熟女俱乐部五十路二区av| 91华人在线| 亚洲无人区乱码中文字幕| 国产精品妇女一区二区三区| 亚洲av午夜福利精品一区二区 | 又粗又粗又黄又硬又深色的| aⅴ精品无码无卡在线观看| 区久久aaa片69亚洲| 日韩av中出在线免费播放网站| 午夜视频在线观看日本| 久久亚洲中文字幕乱码| 老鲁夜夜老鲁| 国产色在线 | 日韩| 日产无人区一线二线三线新版| 久久久久人妻精品一区5555| 日本无吗一区二区视频| 亚洲国产精品成人一区二区在线| 亚洲自偷自拍另类第1页| 国产精品黄在线观看免费软件| 国产黑色丝袜在线观看视频| 日韩国产有码精品一区二在线| 美女午夜福利视频网址| 丰满人妻熟妇乱又伦精品软件| 亚洲人妻无缓冲av不卡| 国产三级国产精品三级在专区| 精品久久中文字幕系列| 国产精品人妻一码二码| 狠狠色噜噜狠狠狠97影音先锋| 国产av天堂亚洲国产av麻豆| 特级黄色大片性久久久| 97人伦色伦成人免费视频| a级国产乱理伦片在线播放| 国产精品无码专区综合网| 日本精品av中文字幕| 国产在线精品一区二区三区| 亚洲av无码一区二区三区观看| 美女胸又www又黄的网站| 99riav精品国产| 亚洲精品国产亚洲av| 芒果乱码国色天香|