江波 史鳳波
摘 要:隨著科學(xué)信息技術(shù)的不斷發(fā)展,計算機技術(shù)也得到了快速地發(fā)展和廣泛地應(yīng)用,同時也促使模式識別技術(shù)在文字識別領(lǐng)域得到廣泛的應(yīng)用。近些年來,模式識別技術(shù)的發(fā)展和應(yīng)用也得到了廣大專家學(xué)者和社會的關(guān)注和重視。該文主要從模式識別技術(shù)的發(fā)展歷史和現(xiàn)狀出發(fā),對文字識別的基本原理進行闡述,對其統(tǒng)計決策及字句結(jié)構(gòu)等基礎(chǔ)識別方法及在文字識別領(lǐng)域的相關(guān)應(yīng)用進行研究分析和總結(jié),并對模式識別技術(shù)領(lǐng)域的前景和未來做出展望。
關(guān)鍵詞:文字識別 模式識別 應(yīng)用 科技信息技術(shù)
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1672-3791(2015)09(c)-0006-02
隨著高科技信息技術(shù)的快速發(fā)展,計算機技術(shù)在存取信息、輸出和高速運算等方面得到了不斷的完善和健全,但目前計算機的信息輸入還是主要依靠人工,文字識別中的模式識別技術(shù)主要是運用大腦識別機理通過計算機的模擬工作,從而構(gòu)造出一個完全能夠代替人工完成分類的識別等工作,以達到實現(xiàn)自動信息處理的機器系統(tǒng)的目的[1]。隨著人工智能、思維科學(xué)和計算機技術(shù)迅速發(fā)展,在文字識別領(lǐng)域的模式識別技術(shù)也在不斷的向更深、更高層次發(fā)展。模式識別主要是由模糊理論、統(tǒng)計、神經(jīng)網(wǎng)絡(luò)、句法結(jié)構(gòu)以及支持向量機識別等方法,筆者就文字識別領(lǐng)域的中模式識別的應(yīng)用原理做出分析。
1 模式識別系統(tǒng)的基本概念
人們在看到某個事物和現(xiàn)象時會不自覺的收集該事物或現(xiàn)象的相關(guān)信息,并將該信息與大腦中已經(jīng)儲存的信息進行匹配或比較后得出相應(yīng)的結(jié)果。對該事物或現(xiàn)象中所獲取到的時間及空間信息將其統(tǒng)稱為模式。而將模式中同一類別模式統(tǒng)稱為模式類[2]。當(dāng)需要將具體的樣本進行歸類時就叫做模式分別或模式識別。模式識別系統(tǒng)通常由四部分組成,分別為數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)的特征提取及選擇和分類決策。數(shù)據(jù)獲取指的是把輸入模式切換成適合計算機處理形式的一個過程。數(shù)據(jù)預(yù)處理主要是將多余的噪音去除,從中提取需要的信息,通過專業(yè)的輸入設(shè)備對殘缺的信息進行必要的修復(fù)和處理,以便于計算機提取特征,在通過數(shù)據(jù)獲取和預(yù)處理后輸入信息的數(shù)據(jù)維數(shù)較高,為了達到分類識別的目的,對原始數(shù)據(jù)進行處理過程中,通過相互的轉(zhuǎn)換從數(shù)據(jù)中提取出最原始的模式特征。原始數(shù)據(jù)空間又可以被稱為測量空間,而分類識別都是在一個稱為特征空間中進行的。所謂的模式識別系統(tǒng)指的是在測量空間模式中,維數(shù)由低向高的轉(zhuǎn)化的過程,這也是該系統(tǒng)通常采用的特診提取及特診選擇。文字算法是文字識別的關(guān)鍵和核心。
2 模式識別技術(shù)的應(yīng)用方法
2.1 統(tǒng)計識別
在數(shù)學(xué)決策理論的基礎(chǔ)上,產(chǎn)生了一種新的識別方法,也就是統(tǒng)計識別方法。在進行特征提取時,就可以采用統(tǒng)計識別的方法,這時可以將相應(yīng)的特征向量通過一個特征空間進行定義,全部的特征矢量都在這個特征空間內(nèi)。這個特征空間的點都能與各種對象及特征向量之間進行對應(yīng)。在分類階段中,通常采用統(tǒng)計決策的方法完成對特征空間信息的分類,以此來達到對各類特征對象識別的目的效果。隨著科學(xué)技術(shù)的進步,我國的統(tǒng)計識別技術(shù)已經(jīng)逐漸成熟,尤其是對特征提取的識別。
2.2 模糊識別
模糊識別的方法主要是采用模糊數(shù)學(xué)的原理、概念和方法解決分別識別中存在的問題。模糊識別根據(jù)識別事物邏輯思維與吸取大腦識別的特征,把計算機中的二位邏輯不斷地向連續(xù)邏輯進行相關(guān)的轉(zhuǎn)化。模糊識別的結(jié)果根據(jù)已經(jīng)被采用被識別對象所屬于的某個類別程度,也就是隸屬度得出結(jié)果,一個對象可以適應(yīng)于不同的類別或不同程度的類別。通常情況下,一個對象只可以對應(yīng)某一個類別。單模糊集理論就是將識別方法按模糊聚類法、擇近原則識別法或最大隸屬原則識別法分為多個類別[3]。
2.3 神經(jīng)網(wǎng)絡(luò)識別
20世紀50年代,一些相關(guān)技術(shù)人員對動物神經(jīng)系統(tǒng)的某些功能進行了研究分析,并對其進行模擬,他們通過使用計算機技術(shù)對大量的數(shù)據(jù)進行處理,從中實現(xiàn)了處理單元結(jié)點的建立,這種單元的出現(xiàn)為互聯(lián)拓撲網(wǎng)絡(luò)的建立提供了依據(jù),被稱之為人工神經(jīng)網(wǎng)絡(luò)[4]。人工神經(jīng)網(wǎng)絡(luò)可以將不同的處理單元進行互連成為一個網(wǎng)絡(luò),在進行識別分類的過程中,能夠通過網(wǎng)絡(luò)對人的神經(jīng)系統(tǒng)進行相關(guān)模仿,從而實現(xiàn)分類的效果。這種網(wǎng)絡(luò)識別方式相比于其它識別方法存在較大的差別,人工精神網(wǎng)絡(luò)對識別的對象不需要要求有過多的認識和分析,并且可以實現(xiàn)智能化處理。神經(jīng)網(wǎng)絡(luò)可以實現(xiàn)和模擬人認知過程中的形象思維、感知覺、分布式記憶、自組織與自學(xué)習(xí),同時神經(jīng)網(wǎng)絡(luò)識別方法和符號處理之間可以實現(xiàn)互補的作用,主要用于有處理需求且要考慮諸多條件和因素,信息模糊或不精準的信息處理。
2.4 句法結(jié)構(gòu)識別
句法識別是統(tǒng)計識別的基礎(chǔ)上進行的延伸和補充,統(tǒng)計識別主要是通過利用數(shù)值對圖像的主要特征進行相應(yīng)的描述,而句法結(jié)構(gòu)識別主要是通過符號的特征描述圖像。而句法結(jié)構(gòu)識別通過對語言學(xué)中句法層次結(jié)構(gòu)進行一定的模仿,通過利用分層描述的技術(shù)對圖像進行層次分解,從中獲得較為簡單的子圖像,這種識別方法體現(xiàn)出了識別對象各層次的信息。圖像識別的方法也是在統(tǒng)計方法的基礎(chǔ)上進行的延伸,而句法結(jié)構(gòu)識別方法的識別能力較圖像識別的識別能力明顯提升,句法結(jié)構(gòu)識別不在是單純的對象物進行歸類處理,對物體結(jié)構(gòu)和景物同樣具備識別能力。
2.5 支持向量機的模式識別
支持向量機的核心思想主要是在特征或樣本空間中打造一個最優(yōu)的超平面,而這個最優(yōu)超平面與各種類樣本集之間的距離最大,就是要使其達到最大的泛化能力。支持向量機具有泛化能力強、結(jié)構(gòu)相對簡單、全局最優(yōu)性等特點,關(guān)于支持向量機的模式識別在20世紀90年代中期提出后就得到了大量的專家和學(xué)者的重視,并得到了較為廣泛的認知和應(yīng)用[5]。支持向量機識別解決了函數(shù)估計和模式識別等問題。在數(shù)字圖像處理中具有尋找圖像像素的特征,可根據(jù)像素點的特征和周圍的環(huán)境檢測出其差異,并具備各像素點區(qū)分功能。
3 結(jié)語
隨著科技的進步和信息技術(shù)的發(fā)展,利用計算機技術(shù)對文字進行識別的應(yīng)用越來越廣泛,該文通過模式識別技術(shù)的幾種應(yīng)用方法進行了簡單分析,對其在統(tǒng)計識別、模糊識別、神經(jīng)網(wǎng)絡(luò)識別、句法結(jié)構(gòu)識別、支持向量機的模式識別的應(yīng)用上加以總結(jié)和歸納,從中了解到模式識別技術(shù)還具有巨大的發(fā)展空間,通過人們的不斷研究,模式識別技術(shù)不僅能夠更好的應(yīng)用到文字識別中,同時還能夠廣泛的應(yīng)用到其它領(lǐng)域中。
參考文獻
[1] 張俊玲,趙林.模式識別的方法與應(yīng)用[J].產(chǎn)業(yè)與科技論壇,2014(13):131-132.
[2] 高翔,邢玉娟.模式識別及其在圖像處理中的應(yīng)用[J].自動化與儀器儀表,2015(3):102-103.
[3] 羅笑玲,黃紹鋒,歐陽天優(yōu),等.基于多分類器集成的圖像文字識別技術(shù)及其應(yīng)用研究[J].軟件,2015,36(3):98-102.
[4] 崔志國,曾麗娟,李曉靜.創(chuàng)新技術(shù)與應(yīng)用模式提升勘驗系統(tǒng)應(yīng)用效率[J].警察技術(shù),2011(2):26-28.
[5] 李新良.模式識別理論的研究與應(yīng)用[J].北京電子科技學(xué)院學(xué)報,2011(4):75-79.