亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        計算機漢字筆跡自動鑒別的基礎探討

        2009-01-01 00:00:00彭文慶
        大眾商務·下半月 2009年4期

        [摘要]漢字筆跡系統(tǒng)地反映了書寫人的遺傳、心理和生理特征、生活經歷與背景及所受的教育程度。對筆跡的認識不能僅僅局限于載體上筆跡的形態(tài)特征,必須從系統(tǒng)的角度,透過筆跡充分解讀筆跡形成的動作系統(tǒng),在動作系統(tǒng)中找尋能標志書寫人穩(wěn)定、特殊的習慣動作特征,這是今后計算機能夠正確地進行漢字筆跡自動鑒別、進一步提高鑒別可靠性的前提和基礎之一。其二是計算機技術的突破性進展,即人工智能的進一步實現(xiàn)。

        [關鍵詞]筆跡;筆記鑒定;書寫動作:計算機漢字筆跡離線鑒別

        中圖分類號:TPSI 文獻標識碼:A 文章編號:1009-283(2009)04-223-02

        在人類文明的發(fā)展進程中,出現(xiàn)了兩種文字記錄文明的方式,一種采用拼音文字,一種是非拼音文字。歷史上,比漢字更早的文字有兩河流域的釘頭文字以及古埃及的圣書文字,它們都不是拼音文字,現(xiàn)在早已滅絕了,所以目前漢字是最古老的象形文字。計算機漢字筆跡自動鑒別系統(tǒng)的最終建立是傳統(tǒng)筆跡鑒定走向自動化、現(xiàn)代化、科學化的重要標志。為了實現(xiàn)這一目標,務必對漢字筆跡有一個系統(tǒng)的認識。

        1 漢字與漢字筆跡的系統(tǒng)性

        筆跡學是建立在生理學、心理學、物理學、概率與統(tǒng)計學等基礎之上的人的動作協(xié)調、情緒、注意、思維、乃至個性和能力的信息表達。人們通過對該信息的解讀,可以在統(tǒng)計學的基礎之上,對書寫人的遺傳、生理與心理特征、生活經歷與背景進行推斷,并且透過對筆跡的解讀而得到書寫人書寫的動作系統(tǒng),在書寫動作系統(tǒng)中找尋能標志書寫人穩(wěn)定、特殊的書寫動作習慣特征,最終實現(xiàn)對書寫人進行同一認定。

        維特根斯坦在其《邏輯哲學論》中說過:“語句是現(xiàn)實的圖像?!睆哪撤N意義上,我們也可以說,漢字是世界的圖像,而且每一個漢字都是現(xiàn)實世界圖像的抽象反映。如果要對漢字進行系統(tǒng)化的進一步認識,必須了解漢字的起源及漢字的系統(tǒng)性,這是計算機筆跡鑒定的基礎。

        1.1 漢字的起源

        對于漢字的起源說法不一,自古以來爭議不斷。東漢的許慎在《說文解字》中,詳細闡述了“六書”這個漢字構造原理即:象形、指事、會意、形聲、轉注、假借。象形、指事、會意、形聲一般被認為是造字原理,而轉注和假借被認為是用字法則。從文字出現(xiàn)的首要功能來看,文字應該首先實現(xiàn)對聲音的記載,然后是對形態(tài)結構的記錄,在此基礎上形成的符合邏輯推理的“理”。在漢字的逐漸產生、演變過程中,可以簡略歸納為五個過程:聲、形、象、數(shù)、理。

        “聲”是任何一種語言的必要組成部分,“形”是漢字的第二個重要組成部分,“象”是創(chuàng)造漢字和《易》說理預事的主要方法,“數(shù)”概念是人類長期進化過程中逐漸形成的概念,“理”是“象、數(shù)”的擴展。

        漢字的創(chuàng)造是一個長期和漫長的過程,上述漢字演變的五個過程,并不是獨立的清晰可分的,或者對于每一個漢字來說都必須經過的。但上述的五個過程很可能是創(chuàng)造漢字的五種基本方法。

        1.2 對漢字的系統(tǒng)性認識

        (1)漢字的書寫動作實際上構成了立體的動態(tài)“三維圖”

        由于漢字書寫的特殊性,即漢字由五個種類基本筆畫按照一定的書寫次序構成,每一個筆畫都有起、行、收筆三個過程構成的運筆過程,而我們看到的漢字筆跡部分只是漢字整個書寫動作的一部分,整個漢字的書寫動作實際上構成了在一個三維空間內連續(xù)的起、行、收筆以及筆在空中停頓、滑行所組成的動態(tài)的三維立體圖。偽裝筆跡,包括模仿筆跡,恰恰是在應該連續(xù)的動態(tài)的三維立體圖中,出現(xiàn)不和諧的變形或者不應有的停頓,如改變字的筆順、結構,或者有停頓重描,或者整個字的三維軌跡在二維平面的形態(tài)相似而行筆中書寫力的變化、行筆速度、筆與紙張形成的夾角、筆在書寫過程中特有的停頓等三維方向上的差異很大。

        因此從書寫動作圖的構成角度來看筆跡鑒定,筆跡鑒定的本質就是鑒定人員從可見的筆跡形態(tài)出發(fā),符合邏輯地推出整個漢文形成的動態(tài)動作圖,再從千變萬化的動態(tài)動作圖中找出特征穩(wěn)定的動力定型或者說書寫習慣動作,根據(jù)對習慣動作特征的綜合評斷,進一步辨別書寫入并做出判斷的推斷過程。

        (2)漢文字特殊的基本動作組合,構成復雜的動作系統(tǒng)

        漢字由一個或兩個以上的構件以二維方式(歐語系是一維文字)在特定的空間、配置在一個正方塊內而組成,因此有方塊字的別稱。由筆畫構成漢字為獨體字,而由部件組成的漢字為合體字。

        我們應當注意的是,依照現(xiàn)代的系統(tǒng)學理論,由每個筆畫書寫的字根構成的第一層次系統(tǒng),由各個字根組成的漢字所構成的第二層次系統(tǒng)以及數(shù)個第二層次系統(tǒng)構成的整個漢文第三層次系統(tǒng)相互之間并不是孤立的,毫無聯(lián)系的。構成的漢字大系統(tǒng)也不是數(shù)個系統(tǒng)的簡單疊加,而是一個比任何數(shù)個子系統(tǒng)簡單疊加顯示更多復雜性的動作系統(tǒng)。因此,我們必須系統(tǒng)地、全方位地來研究筆跡學,這是今后計算機筆跡自動鑒別中必須要解決的第二大課題。

        2 現(xiàn)有計算機筆跡自動識別系統(tǒng)的種類

        現(xiàn)有計算機筆跡自動識別系統(tǒng)包括在線(聯(lián)機)筆跡自動鑒別系統(tǒng)和離線(脫機)筆跡自動鑒別兩大類。

        在線筆跡識別系統(tǒng)又稱實時筆跡鑒別系統(tǒng),其原理是利用與計算機聯(lián)機的書寫板將筆畫轉換為電信號,將書寫時以坐標點序列表示的筆尖運動軌跡信息輸入計算機,在線筆跡自動鑒別系統(tǒng)除了采集到筆跡的動態(tài)信息如:壓力、加速度、速度、筆順等幾種隨時間而變化的信號序列數(shù)據(jù),還可以采集到握筆角度、握筆壓力、筆在運動過程中與書寫承載表面的夾角變化等通常筆跡靜態(tài)鑒定無法感知到的信息,現(xiàn)階段在線式筆跡識別系統(tǒng)國外已經有成熟的應用。

        離線式筆跡自動鑒別系統(tǒng)是在筆跡形成之后,利用電子設備對筆跡進行圖像采集,對所采集的圖像采用適當?shù)乃惴ㄟM行處理后提取有效的筆跡特征,然后進行鑒別。由于我們面對的大多數(shù)是靜態(tài)的筆跡文本,尤其是需要鑒定的簽名筆跡也好,正文筆跡也好,都是靜態(tài)的,建立起離線式計算機漢字筆跡自動鑒別系統(tǒng)更具有實用價值。

        離線式筆跡鑒定的方法根據(jù)鑒定對象差異不同可分為兩大類,一類是文本無關(text independent),另一類是文本相關類(text dependent)。文本無關類是指所獲取的檢材文本與樣本文本的筆跡中與有沒有相同的單字無關,筆跡鑒定人員根據(jù)筆跡書寫風格特征、筆跡的布局特征、字符的形態(tài)特征等與字符類別無關的特征為基礎,對書寫人進行識別的技術。文本相關類是指書寫者書寫內容相同的文本,或者文本中有部分相同的單子,從檢材和樣本中選擇相同的單字(稱為特征字)進行比較而進行書寫人鑒別的技術。

        3 計算機筆跡自動識別的發(fā)展方向

        人工筆跡鑒定首先是選擇性地抽取人所觀察到筆跡的視覺特征開始,計算機則首先從筆跡形成后的筆跡圖開始。計算機仿照人在提取筆跡圖的特征中,由于漢字的系統(tǒng)表達模式和漢字的形成方式方式多樣,對漢字的系統(tǒng)研究也是角度不同,方法各異。常見的有神經網(wǎng)絡法、紋理分析法、偽動態(tài)法分析法等。以上方法的應用情況分別介紹如下:

        (1)神經網(wǎng)絡法。神經網(wǎng)絡法是模擬人腦高度復雜的、非線性的、并行處理信息處理模式的信息處理系統(tǒng)。人工神經網(wǎng)絡有以下特點:大規(guī)模的并行處理和分布式信息存儲,良好的自適應性、自組織性、自我學習能力,具有很強的聯(lián)想和容錯功能,以及可繼承性和增殖性。

        通常用于筆跡識別的人工神經網(wǎng)絡有:Hopfield神經網(wǎng)絡、前向多層神經網(wǎng)絡(如BP算法、RBF網(wǎng)絡法等)、ART網(wǎng)絡、自組織特征映射網(wǎng)絡、認知器模型等。神經網(wǎng)絡法雖然有很強的自組織聚類學習能力,但由于傳統(tǒng)的提取特征模式適用于漢字的識別系統(tǒng),針對筆跡鑒定的要求,比如筆跡特征的發(fā)現(xiàn)、提取、判讀需要更為精細、準確的算法,現(xiàn)有的神經網(wǎng)絡計算機還顯能力不足。

        (2)紋理分析法。紋理是具有能反射光線的物體的特有屬性,透明物體是不存在紋理的。物體通常具有表面光感和結構感兩種紋理特性。比如說磚墻、布匹、竹席等具有結構紋理,森林、土地具有表面光感紋理,人類用視覺來感受這類物的存在,用紋理對這類物進行識別。筆跡同樣具有紋理特征,不同人書寫的筆跡不同很大程度上就體現(xiàn)在紋理不同上,筆跡的一般特征和細節(jié)特征都不同程度地在紋理上有所體現(xiàn)。其中一般特征表現(xiàn)充分,而細節(jié)特征也有表現(xiàn)。紋理分析法的核心是把筆跡作為一種圖像紋理,利用計算機的圖形圖像紋理處理技術和數(shù)學方法對筆跡的紋理特征進行提取和鑒別,將筆跡鑒別問題轉化為紋理識別。

        紋理分析法中的紋理理論主要包括紋理合成和紋理分析兩部分,紋理合成一模型為基礎,分析則以模型的特征提取比較為基礎。紋理分析法分為統(tǒng)計分析法(如共生矩陣)、結構分析法(如紋理基元描述)、模型分析法(如馬爾科夫隨機場模型和分形模型)以及信號處理方法(一般采用小波濾波器和Gabor濾波器)。前三種紋理分析方法比較傳統(tǒng),都是基于統(tǒng)計和結構的,基本上都是在原圖上進行分析,不利于紋理圖像的多尺度紋理特征描述。把筆跡看做是一種紋理的信號,對紋理進行信號處理的方法是現(xiàn)在研究的熱門。

        (3)偽動態(tài)特征法。偽動態(tài)特征法是指在離線式筆跡鑒定的過程中,由于實時的筆跡動態(tài)特征已經消失,根據(jù)形成的筆跡靜態(tài)特征推斷筆跡的動態(tài)形成過程,稱為偽動態(tài)特征法。偽動態(tài)特征法是對動態(tài)特征的間接反映,因此是容易失真的。

        在現(xiàn)有的計算機自動筆跡鑒定中,一般是從兩個方面獲得筆跡的偽動態(tài)特征。一是從筆畫人手,研究筆畫的行筆方向和弧度,根據(jù)筆畫的行筆方向和弧度的變化推斷書寫人。另一個方面是對筆跡進行灰度化處理,對灰度化后的筆跡進行分析,高灰度化的筆畫意味著高筆壓,筆壓的變化通過灰度值的變化體現(xiàn)出來。筆壓的變化體現(xiàn)了一定的個體特征,可以進行人身識別。

        通過以上對現(xiàn)有的筆跡鑒定計算機系統(tǒng)地分析,我們感到無論是神經網(wǎng)絡法還是紋理分析法,與傳統(tǒng)的筆跡學鑒定理論相差甚遠。相對來說,除了偽動態(tài)特征法與傳繞筆跡鑒定理論相近外,或者說可以被筆跡鑒定專家接受外,所采用的圖像處理和模式識別算法要么只注重于采集圖的靜態(tài)特征,要么依據(jù)其算法得到的結論無法從筆跡學理論中得到合理的解釋,而只能作為輔助參考。因此,計算機人鼠系統(tǒng)學習、研究筆跡學基本理論,筆跡學專家了解計算機知識,共同組成研究團隊是計算機筆跡自動鑒別開發(fā)的重要前提和保障。

        国产成人无码18禁午夜福利p| 白嫩少妇在线喷水18禁| 精品一区二区三区久久| 欧美变态另类刺激| 国产精品亚洲综合一区在线观看| 亚洲AV无码国产精品色午夜软件| 天堂一区二区三区精品| 狠狠躁18三区二区一区| 7777精品伊人久久久大香线蕉| 在线国产视频精品视频| 91快射视频在线观看| 东京热人妻系列无码专区| 久久午夜无码鲁丝片直播午夜精品 | 久久久精品人妻一区二区三区蜜桃 | 亚洲一区二区三区在线高清中文| 亚洲自偷自拍另类第1页| 中文字幕爆乳julia女教师| 99国产精品无码专区| 亚洲国产精品久久久婷婷| 日本成本人片免费网站| 亚洲人成网站免费播放| 又粗又硬又黄又爽的免费视频| 日韩欧美国产丝袜视频| 日本精品av中文字幕| 久久精品国产亚洲av麻豆长发| 99久久免费看少妇高潮a片特黄| 亚洲人成在线播放a偷伦| 日韩中文字幕一区二区二区| 9 9久热re在线精品视频| 亚洲国产美女在线观看| 久久婷婷国产色一区二区三区| 日韩视频在线观看| 少妇精品久久久一区二区三区| 亚洲啊啊啊一区二区三区| 白白发在线视频免费观看2| 久久丫精品国产亚洲av不卡| 国产精品高潮av有码久久| 成人免费av高清在线| 国产农村妇女精品一二区| 国产成人综合久久久久久 | 亚洲一区二区三区少妇|