楊玉婷,康厚良
東巴象形文字特征曲線提取算法研究
楊玉婷1,康厚良2
(1. 云南開放大學(xué)文化旅游學(xué)院,云南 昆明 650000;2.蘇州市職業(yè)大學(xué)體育部,江蘇 蘇州 215000)
東巴文是一種原始的圖畫象形文字,要提高東巴文字的識別率,準(zhǔn)確提取字符的特征曲線是關(guān)鍵?,F(xiàn)階段對東巴文字的檢索和識別研究大多仍停留在使用已有的、通用的及成熟的識別技術(shù),對東巴文字本身的分析和討論較少。因此,結(jié)合東巴象形文字的形態(tài)特征和結(jié)構(gòu)要素,給出了基于鏈碼的連通域優(yōu)先級標(biāo)記算法(CDPM),該算法通過擴(kuò)展Freeman鏈碼在邊緣檢測及曲線局部分割方面的功能,實(shí)現(xiàn)了使用一種算法完成輪廓型及結(jié)構(gòu)型兩種不同類型東巴字素的特征曲線提取,通過大量實(shí)驗(yàn)及與其他經(jīng)典邊緣檢測算法的比較表明,CDPM算法具有良好的通用性、可擴(kuò)展性及健壯性,并且準(zhǔn)確率達(dá)到了98.2%,從而為東巴文字的檢索和識別奠定堅(jiān)實(shí)的基礎(chǔ)。
CDPM算法;東巴象形文字;邊緣檢測;字符分割
東巴文是一種十分原始的圖畫象形文字[1],作為人類早期圖畫文字向象形文字、標(biāo)音文字過渡的文字形式,其既具有圖畫文字以圖表意,又具有現(xiàn)代文字使用簡單線條表意的特點(diǎn)[2]。2003年,使用東巴文撰寫的東巴古籍被聯(lián)合國教科文組織列入世界記憶遺產(chǎn)名錄[3]。
東巴文在檢索和識別方面的研究起步較晚,相關(guān)文獻(xiàn)較少且連貫性不強(qiáng)。其中,GUO等[4-7]給出了多種用于東巴象形文字識別的方法,LI等[8]提出了東巴文字識別的預(yù)處理系統(tǒng)。楊萌等[9]提出了基于神經(jīng)網(wǎng)絡(luò)的東巴文字識別算法,王海燕等[10-11]使用支持向量機(jī)的方法實(shí)現(xiàn)了對東巴文字的識別。另外,WANG等[12]提出了構(gòu)建納西東巴手稿語料和知識數(shù)據(jù)庫的設(shè)想,而YANG等[13]則基于鏈碼(chain code)在.Net平臺上實(shí)現(xiàn)了用于單個東巴字符的輸入與識別系統(tǒng)。
分析相關(guān)文獻(xiàn)可知,現(xiàn)階段對東巴文字的檢索和識別研究大多仍停留在使用已有的、通用的及成熟的識別技術(shù),對東巴字本身的分析和討論較少。分析東巴文字的結(jié)構(gòu),準(zhǔn)確提取能夠反映文字本質(zhì)特征的曲線,有利于提高東巴文字檢索和識別的準(zhǔn)確率,同時也有助于分析東巴文字的結(jié)構(gòu)和形態(tài)、比較東巴文與其他象形文字的演變過程等方面的研究。為了獨(dú)立分析不同文字的特征,將東巴文字的基本字素再細(xì)分為輪廓型字素和結(jié)構(gòu)型2類字素。輪廓型字素通過臨摹物體的外在形狀來表達(dá)實(shí)際含義,并且文字的線條細(xì)化后,輪廓特征仍非常明顯且閉合性好;而結(jié)構(gòu)型字素一般使用簡單的字符筆劃通過描繪事物的結(jié)構(gòu)或骨架來表達(dá)含義,文字的線條細(xì)化后能夠得到顯著的文字結(jié)構(gòu)或骨架特征,其中人形字最具代表性,見表1。
表1 東巴字素的分類
顯然,輪廓型字素的特征曲線應(yīng)為文字的外在輪廓,而結(jié)構(gòu)型字素的特征曲線應(yīng)為文字局部細(xì)化線條的有序組合。為了滿足2類東巴字素特征曲線提取的需求,結(jié)合東巴象形文字的形態(tài)特征和結(jié)構(gòu)要素,給出了基于鏈碼的連通域優(yōu)先級標(biāo)記算法(chain code based connected domain priority marking, CDPM),該算法通過擴(kuò)展Freeman鏈碼[14]在邊緣檢測及曲線局部分割方面的功能,實(shí)現(xiàn)了使用一種算法完成2種不同類型東巴字素的特征曲線提取,為東巴文字的檢索和識別奠定基礎(chǔ)。
CDPM算法的基本思想是:首先,確定字符特征曲線的提取方向?yàn)槟鏁r針方向;然后,將字符的起點(diǎn)作為參考點(diǎn),根據(jù)初始參考向量方向計(jì)算與參考點(diǎn)相鄰的8個鄰域點(diǎn)的權(quán)值,選擇權(quán)值最大的點(diǎn)作為特征點(diǎn);接著,以新的特征點(diǎn)作為參考點(diǎn),計(jì)算新的參考向量方向及與參考點(diǎn)相鄰的8個鄰域點(diǎn)的權(quán)值,重復(fù)上述操作,直到回到字符的起點(diǎn)或者完成字符所有終端點(diǎn)的遍歷為止。其中,對于輪廓型字素,當(dāng)算法回到字符起點(diǎn),說明字符的特征曲線提取完成;而對于結(jié)構(gòu)型字素,當(dāng)算法遍歷完字符的所有終端點(diǎn),說明已完成字符局部曲線的分割和排序。
統(tǒng)一起點(diǎn)使不同字符的特征曲線也能具有相同的對應(yīng)關(guān)系。假設(shè)給定的東巴字為,P(x,y)是所包含的像素點(diǎn),若設(shè)置始終位于坐標(biāo)的第一象限,則選取字符中距離坐標(biāo)原點(diǎn)最近的終端點(diǎn)或像素點(diǎn)作為特征曲線的起點(diǎn),則起點(diǎn)的選取步驟為:
(2) 細(xì)化文字線條,獲得包含個像素點(diǎn)的細(xì)化字符。由于東巴文字是使用“竹筆”書寫的,線條寬度基本一致,線條的細(xì)化不會對文字本身產(chǎn)生太大的影響;
(4) 若1,則將該終端點(diǎn)作為特征曲線的起點(diǎn);若1,則選取距離坐標(biāo)原點(diǎn)最近的終端點(diǎn)作為起點(diǎn);若1,說明具有閉合的外在輪廓,則選取中距離坐標(biāo)原點(diǎn)最近的像素點(diǎn)P作為起點(diǎn)。因此,特征曲線的起點(diǎn)1為
高中學(xué)生在生物學(xué)科中的核心素養(yǎng)體現(xiàn)高中學(xué)生在生物教學(xué)中核心素養(yǎng)的培養(yǎng),就是為了讓學(xué)生對生物學(xué)科的全面了解,也幫助學(xué)生情感態(tài)度的培養(yǎng)與形成.知識素養(yǎng)是培養(yǎng)學(xué)生核心素養(yǎng)的基礎(chǔ),而核心素養(yǎng)則是學(xué)生各個方面的培養(yǎng),情感態(tài)度的培養(yǎng)與價值觀的培養(yǎng)是建立在知識教育能力的培養(yǎng)之上.
圖1 CDPM算法的基本原理(以終端點(diǎn)P1為起點(diǎn),為 初始參考向量,按照逆時針方向提取字符輪廓)
表2 方向向量對點(diǎn)Pi的8個鄰接點(diǎn)優(yōu)先級的影響
圖2 包含單像素線條的輪廓型字素的特征曲線提取
結(jié)論1. 當(dāng)輪廓型字素中包含由單像素點(diǎn)組成的線條時,使用CDPM算法同樣能夠得到連續(xù)、按逆時針順序排列的特征曲線。
結(jié)構(gòu)型字素的特征曲線是局部細(xì)化線條的有序組合,為了驗(yàn)證CDPM算法能實(shí)現(xiàn)字符局部細(xì)化線條的分割并按照逆時針順序排列,使用圖3中的例子進(jìn)行說明。
由于存入交點(diǎn)隊(duì)列的候選像素點(diǎn)也是按照權(quán)值從大到小的順序存儲的,因此,若字符的骨架具有相似結(jié)構(gòu),則得到的分割結(jié)果及分割順序也應(yīng)具有相似性,如圖3(c)所示,由此可得結(jié)論2。
(a) 確定算法的起點(diǎn)和方向
(b) 使用CDPM算法進(jìn)行分割
(c) 按分割順序重新排列曲線,獲得字符的特征曲線 圖3 結(jié)構(gòu)型字素的骨架分割及排序
以(人)、(抖,裝模作樣)、(立)和(坐)為例,使用CDPM算法分割并按先后順序排列字符的局部骨架曲線,如圖4所示。顯然,第1行2個字符的第j~m條局部曲線與第2行2個字符的第k~n條局部曲線段不但形態(tài)相似,而且曲線段的排列順序也一一對應(yīng),說明結(jié)論2是正確的。
圖4 結(jié)構(gòu)型字素的骨架分割及排序?qū)嵗?/p>
2.5 復(fù)雜度分析
CDPM算法根據(jù)參考點(diǎn)和參考向量的方向來標(biāo)記參考點(diǎn)的8鄰域點(diǎn)的優(yōu)先級權(quán)值,選擇權(quán)值最大的鄰接點(diǎn)作為新的參考點(diǎn),并計(jì)算新的參考向量方向,繼續(xù)計(jì)算參考點(diǎn)的8鄰域優(yōu)先級權(quán)值,反復(fù)執(zhí)行上述過程直到遇到字符的終端點(diǎn)或回到起點(diǎn)為止。由于計(jì)算參考點(diǎn)的8鄰域點(diǎn)權(quán)值及查找最大權(quán)值點(diǎn)的計(jì)算在最壞情況下將執(zhí)行8次,若共有n個待測特征點(diǎn),則算法的時間復(fù)雜度為O(8×n)≈O(n)。因此,CDPM算法的時間復(fù)雜度是線性的。
3 實(shí)驗(yàn)分析
為方便測試,從1 591個東巴文字中為結(jié)構(gòu)型字素和輪廓型字素分別選取10類字符,每類包括數(shù)量不等的東巴字(表3)。
表3 輪廓型和結(jié)構(gòu)型字素的10種類型 類別結(jié)構(gòu)型(基本型)結(jié)構(gòu)型(擴(kuò)展型)類別輪廓型(基本型)輪廓型(擴(kuò)展型) 人魚蟲 蹲鳥 單手持物花 雙手持物手 右側(cè)偏移山 頭戴冠房屋 心水 植物祭祀 行走牲畜 坐山坡
其中,輪廓型字素包括魚蟲、鳥、花、手、山、房屋、水、東巴祭祀、牲畜和山坡等,結(jié)構(gòu)型字素包括人、蹲、單手持物、雙手持物、右側(cè)偏移、頭戴冠、心、植物、行走和坐等。并且,每種類型的東巴字都分為基本型和擴(kuò)展型。基本型中的東巴字基本保持了字素的原有特征,變異較少;而擴(kuò)展型一般是對基本型的擴(kuò)展,在形態(tài)上具有一定的變異。
3.1 基礎(chǔ)性測試
基礎(chǔ)性測試是將2種類型中的“基本型”作為測試對象,驗(yàn)證當(dāng)待測字符僅包含輪廓型或結(jié)構(gòu)型單素字的基本特征時,使用CDPM算法提取輪廓特征曲線或分割骨架曲線段的正確性。在使用CDPM算法提取字符特征曲線前,首先需要對東巴字符的圖片進(jìn)行二值化、筆畫線條細(xì)化和字符中離散綴加元素的去除等預(yù)處理操作。
圖5顯示了使用CDPM算法提取輪廓型字素(基本型)的輪廓特征曲線并按照逆時針順序排列的效果。其中,綠色的線條為文字的細(xì)化線條,而黑色線條為文字的輪廓特征曲線。通過測試,CDPM提取“基本型”輪廓特征曲線的準(zhǔn)確率為100%。
圖6顯示了使用CDPM算法實(shí)現(xiàn)結(jié)構(gòu)型字素(基本型)的骨架分割,且局部骨架曲線按照先后順序排列的效果。各局部曲線段排序時對應(yīng)的顏色順序?yàn)椋核{(lán)色、綠色、紅色、青綠色、桃紅色、黑色。當(dāng)局部曲線段超過6條時,重復(fù)上述顏色。對10種結(jié)構(gòu)型字素中的46個“基本型”字符的測試中,錯誤分割1個(紅框標(biāo)記),正確率為97.83%。發(fā)生錯誤的原因是,字符的2個組成部分在構(gòu)字中均為主成分,導(dǎo)致成分提取錯誤。
解法1:設(shè)u=,v=,則u2+v2=1且u≥0,v≥0,該曲線方程為四分之一圓,于是問題轉(zhuǎn)化為:y為何值時,直線u+v=y與該四分之一圓有交點(diǎn)。由圖1容易得到,y的取值范圍為,即為所求函數(shù)值域。
圖5 使用CDPM提取輪廓型(基本型)字素的特征曲線
圖6 使用CDPM提取結(jié)構(gòu)型字素(基本型)的特征曲線
3.2 擴(kuò)展性測試
擴(kuò)展性測試是將2種類型中的“擴(kuò)展型”作為測試對象。與“基本型”相比,“擴(kuò)展型”中的字符存在少量變異,而不同類型字符的變異又各不相同。其中,輪廓型字素的變異內(nèi)容包括:綴加離散或粘連元素(包括綴加點(diǎn)、線或字塊)、輪廓閉合不完全等。而結(jié)構(gòu)型的變異內(nèi)容包括:綴加離散或粘連元素、少量旋轉(zhuǎn)(≤60°)、平移及大幅度旋轉(zhuǎn)(>60°且<120°)等。
當(dāng)然,園方防止人流擁堵引發(fā)安全隱患的初衷是好的,只是方法過于簡單。其實(shí),游樂園門票不少都是網(wǎng)上預(yù)訂或團(tuán)購的,完全可以提前告知游客驗(yàn)票時持兒童票者須出示身份證件。此外,不少游樂園的廣告宣傳力度也很大,在推介游樂項(xiàng)目的同時,順帶講一下“驗(yàn)票須知”也非難事。兒童票與成人票相差幾百元,家長們算得清這筆賬,多半不會嫌麻煩。
圖7顯示了使用CDPM算法提取輪廓型字素(擴(kuò)展型)的輪廓特征曲線并按照逆時針順序排列的效果。其中,有2個字符(紅框標(biāo)記)由于輪廓閉合性不好,使用CDPM算法得到的結(jié)果不正確。因此,對于輪廓型單素字,當(dāng)字符的輪廓閉合性不好時,使用CDPM算法可能無法得到正確的特征曲線,對(擴(kuò)展型)輪廓型字素測試的正確率為95%。
圖7 使用CDPM提取輪廓型(擴(kuò)展型)字素的特征曲線
圖8顯示了使用CDPM算法實(shí)現(xiàn)結(jié)構(gòu)型字素(擴(kuò)展型)的骨架分割,并按照先后順序排列局部骨架曲線。其中,有6個字符(紅框標(biāo)記)得到的結(jié)果與其他同類型的字符不同,準(zhǔn)確率為87.17%。產(chǎn)生錯誤的原因是,CDPM算法一般選取距離坐標(biāo)原點(diǎn)最近的終端點(diǎn)作為起點(diǎn),當(dāng)左下角的字符線條存在較多變異(例如,發(fā)生大弧度的旋轉(zhuǎn),或者附加了較多具有粘連性的綴加線條或字塊)時,將對分割結(jié)果和局部骨架曲線的排列順序產(chǎn)生影響。
圖8 使用CDPM提取結(jié)構(gòu)型字素(擴(kuò)展型)的特征曲線
3.3 有效性實(shí)驗(yàn)
為進(jìn)一步驗(yàn)證CDPM算法的有效性,連續(xù)選取10組數(shù)據(jù),每組數(shù)據(jù)從1 591個東巴字符中隨機(jī)選取100個不重復(fù)的東巴字符作為測試對象。并且,分別采用基于Sobel算子[15]和Canny算子[16]的邊緣檢測算法與CDPM算法進(jìn)行比較,結(jié)果如圖9所示。
在法學(xué)詮釋學(xué)中,應(yīng)用體現(xiàn)的最為明顯。一個法律文本是在歷史中制定出來的,而且作為法律文本其必然具有普遍的約束力,然而在法律實(shí)踐中,每一個具體的案件都是特殊的。將一條法律應(yīng)用于某一個既定的法律場合,如執(zhí)行一個法律判決,就包含著對該法律條文的理解和解釋?!安徽撛鯓?,這意味著各種法律規(guī)范的每一次運(yùn)用(即得到公正的結(jié)果)都同時是對某一條既定法律之涵義的具體化和進(jìn)一步闡明。”[5]因此,將普遍化的法律文本應(yīng)用于某一具體的法律情境,就是對該法律文本的進(jìn)一步的理解和解釋,體現(xiàn)了理解、解釋和應(yīng)用的統(tǒng)一。
圖9 CDPM算法的通用性測試
通過測試,CDPM算法的平均準(zhǔn)確率為98.2%,而Sobel算子和Canny算子分別為58.2%和59.2%。后兩者準(zhǔn)確率較低的主要原因是,測試數(shù)據(jù)是從東巴字符庫中隨機(jī)選取的,其中所包含的結(jié)構(gòu)型字素和輪廓型字素的數(shù)量是隨機(jī)的,雖然Sobel算子和Canny算子能準(zhǔn)確提取輪廓型字素的特征曲線,但是對結(jié)構(gòu)型字素的特征曲線提取結(jié)果卻非常不理想,錯誤率較高,導(dǎo)致平均準(zhǔn)確率過低。說明,CDPM算法能夠更好的適應(yīng)不同類型東巴字素的特征曲線提取要求。
4 小 結(jié)
CDPM算法實(shí)現(xiàn)簡單,通過擴(kuò)展Freeman鏈碼在邊緣檢測及曲線局部分割方面的功能,滿足了輪廓型和結(jié)構(gòu)型兩類東巴字素特征曲線提取的需求,具有良好的通用性、可擴(kuò)展性及健壯性,并且當(dāng)字素中存在少量變異(字素中存在綴加、離散或粘連元素,少量旋轉(zhuǎn)(≤60°)及平移)時也能得出正確結(jié)果。但是,當(dāng)輪廓型字素中的字符輪廓閉合不完全,或者結(jié)構(gòu)型字素變異較大(大幅度旋轉(zhuǎn)(>60°且<120°)或粘連元素較多)時,所提取的字符特征曲線仍可能發(fā)生錯誤。因此,在后續(xù)的工作中還需對CDPM算法不斷改進(jìn)以提高特征曲線提取的準(zhǔn)確率。
參考文獻(xiàn)
[1] 和力民. 試論東巴文化的傳承[J]. 云南社會科學(xué), 2004(1): 83-87.
[2] 和金光. 納西族東巴文化研究發(fā)展趨勢[J]. 云南民族大學(xué)學(xué)報:哲學(xué)社會科學(xué)版, 2007, 24(1): 81-84.
[3] 戈阿干. 東巴文化攬勝[J]. 民族藝術(shù)研究, 1999, 12(2): 71-80.
[4] GUO H, ZHAO J Y, DA M J, et al. NaXi pictographs edge detection using lifting wavelet transform [J]. Journal of Convergence Information Technology, 2010, 5(5): 203-210.
[5] GUO H, ZHAO J Y. Research on feature extraction for character recognition of NaXi pictograph [J]. Journal of Computers, 2011, 6(5): 947-954.
[6] GUO H, JYIN J H, ZHAO J Y. Feature dimension reduction of Naxi pictograph recognition based on LDA [J]. International Journal of Computer Science, 2012, 9(1): 90-96.
[7] GUO H, ZHAO J Y. Segmentation method for NaXi pictograph character recognition [J]. Journal of Convergence Information Technology, 2010, 5(6): 87-98.
[8] LI X, GUO H, SUO G J, et al. The design and realization of NAXI pictograph character recognition preprocessing system [C]//International Workshop on Computer Science for Environmental Engineering and EcoInformatics. Heidelberg: Springer, 2011: 54-59.
[9] 楊萌, 徐小力, 吳國新, 等. 東巴象形文字識別方法[J]. 北京信息科技大學(xué)學(xué)報:自然科學(xué)版, 2014, 29(3): 72-76.
[10] 王海燕, 王紅軍, 徐小力. 基于支持向量機(jī)的納西東巴象形文字符識別[J]. 云南大學(xué)學(xué)報: 自然科學(xué)版, 2016, 38(5): 730-736.
[11] DA M J, ZHAO J Y, SUO G J, et al. Online handwritten Naxi pictograph digits recognition system using coarse grid [C]//International Workshop on Computer Science for Environmental Engineering and EcoInformatics. Heidelberg: Springer, 2011: 390-396.
[12] WANG H Y, WANG H J, CHEN X. Construction of corpus and knowledge database for Naxi dongba manuscripts based on internationally sharing platform [C]//Proceedings of the 6th International Asia Conference on Industrial Engineering and Management Innovation. Paris: Atlantis Press, 2015: 325-331.
[13] YANG L P, GUO H, ZHAO J Y, et al. The research on software of individual characters recognition about the Naxi pictographs based on.Net and chain code [J]. Procedia Engineering, 2012, 29: 4068-4072.
[14] FREEMAN H. Boundary Encoding and Processing [C]// Proceedings of Picture Processing and Psy-chopictorics. New York: Academic Press, 1970: 241-266
[15] KANOPOULOS N, VASANTHAVADA N, BAKER R L. Design of an image edge detection filter using the Sobel operator [J]. IEEE Journal of Solid-State Circuits, 1988, 23(2): 358-367.
[16] DING L J, GOSHTASBY A. On the Canny edge detector [J]. Pattern Recognition, 2001, 34(3): 721-725.
Research on the Extracting Algorithm of Dongba Hieroglyphic Feature Curves
YANG Yu-ting1, KANG Hou-liang2
(1. Culture and Tourism College, Yunnan Open University, Kunming Yunnan 650000, China;2. Spotrs Department, Suzhou Vocational University, Suzhou Jiangsu 215000, China)
Abstract: Dongba hieroglyphic is a kind of very primitive picture hieroglyphs. In order to increase the recognition rate of Dongba words, extracting the feature curves of glyphs is the key. At present, the retrieval and recognition of Dongba hieroglyphs still use the existing, universal and mature technology, and there is less analysis and discussion on the Dongba hieroglyphs themselves. Therefore, we analyze the shape and structure of the Dongba hieroglyphs in depth, and give a connected-domain priority marking algorithm based on chain codes. It extends the characteristic of Freeman chain code in edge detection and local segmentation of curves, and satisfies the requirements of contour and structure type of feature curve extraction. We use a large number of experiments and comparison with other classical edge detection algorithms to show that the CDPM algorithm has good versatility, scalability and robustness, and the accuracy reaches 98.2%. It lays a foundation for the retrieval and identification of Dongba hieroglyphs.
Keywords: CDPM algorithm; dongba hieroglyphic; edge detection; words partitioning
中圖分類號:TP 391
DOI:10.11996/JG.j.2095-302X.2019030591
文獻(xiàn)標(biāo)識碼:A
文章編號:2095-302X(2019)03-0591-09
收稿日期:2018-07-24;
定稿日期:2018-09-12
基金項(xiàng)目:云南省教育科學(xué)研究基金項(xiàng)目(2018JS748,2019J1152);國家社會科學(xué)基金項(xiàng)目(15BTY038)
第一作者:楊玉婷(1983-),女,云南昆明人,副教授,碩士。主要研究方向?yàn)閳D形圖像處理、計(jì)算機(jī)視覺等。E-mail:tudou-yeah@163.com
通信作者:康厚良(1979-),男,四川瀘州人,教授,碩士。主要研究方向?yàn)槊褡逦幕懊褡弩w育的傳承與保護(hù)。E-mail:kangfu1979110@163.com