蔡艷婧,王則林
1.江蘇商貿(mào)職業(yè)學(xué)院 電子與信息學(xué)院,江蘇 南通 226011
2.南通大學(xué) 信息科學(xué)技術(shù)學(xué)院,江蘇 南通 226000
模式識別方法層出不窮,主要有:基于分類的統(tǒng)計模式識別[1]和句法模式識別[2]。基于認(rèn)識的放生模式識別[3]和基于自組織的協(xié)同模式識別[4];基于代數(shù)的子空間模式識別[5]等。它們在天氣預(yù)報、衛(wèi)星航空圖片解釋等方面得到了成功應(yīng)用[6]。但所有這些方法與人類的模式識別過程有較大差距。
特征反映的是系統(tǒng)的淺層表象(微觀層次),模式反映的是系統(tǒng)的核心本質(zhì)(宏觀層次),因?yàn)閰f(xié)作,宏觀層次的“模式”被賦予了新的屬性,凸顯出一種整合作用,而這種新的屬性在微觀層次的各個“特征”中是不存在的。計算機(jī)的元件速度非???,但識別圖像非常慢,以至無能為力。
模式識別在解決問題上存在一些不足。主要在于:特征抽取問題,特征抽取或圖像特征抽取沒有統(tǒng)一的、適用于所有問題的手段,特征抽取方法的優(yōu)劣無法準(zhǔn)確評判,分類器識別率、特征空間維數(shù)及樣本容量彼此間的關(guān)系還沒有一套成型的理論;結(jié)構(gòu)識別問題;缺乏構(gòu)建有效的基元協(xié)作機(jī)制;小樣本識別問題;特征空間與應(yīng)用無關(guān)問題,造成大量信息冗余,不能反映特定應(yīng)用的本質(zhì)特征等等。
受逼近論的啟發(fā),找一組基底(即,Agent),使輸入模式逼近所要識別的模式。這種表示可以突出某個側(cè)面的重要性。如小波系數(shù)可以清楚地提供信號奇異點(diǎn)的類型和位置。逼近的方式有兩種:線性逼近和非線性逼近。分布式模式識別框架采用非線性逼近的方式,設(shè)是輸入模式,我們預(yù)設(shè)的模型是:
對于分布式模式識別框架而言,關(guān)鍵的問題是Agent 之間的相互交流和協(xié)調(diào),共同完成任何單個Agent 均無法獨(dú)立完成的識別任務(wù)。通常這種交流和協(xié)調(diào)是建立在語義通信和知識推理之上的。因此語義通信協(xié)議和知識的邏輯推理研究構(gòu)成了分布式模式識別框研究核心內(nèi)容。
定義1:設(shè)為一向量集合,如果存在向量集合,使得內(nèi)積<,則稱為的廣義逆向量。
定理1:設(shè)表示的廣義逆向量,
由內(nèi)積性質(zhì)得:
定義2:設(shè)為一動力學(xué)系統(tǒng),ξu和ξs分別為系統(tǒng)的非穩(wěn)定模和穩(wěn)定模,稱ξu為系統(tǒng)的序參量。
定理2:設(shè)為一動力學(xué)系統(tǒng),ξs為系統(tǒng)的穩(wěn)定模,ξu為系統(tǒng)的非穩(wěn)定模,則ξu的演化滿足方程:,其中,λs為學(xué)習(xí)矩陣特征根,
設(shè)λj為L的特征值,對應(yīng)λj的特征向量,即。由矩陣函數(shù)譜分解定理得:
勢函數(shù)右端每一項(xiàng)的含義:λu為注意參數(shù),只有當(dāng)λu>0 時,模式才能被識別,否則不能識別。由于第一項(xiàng)為負(fù),所以當(dāng)增加時,V下降,當(dāng)增大到一定限度時,第三項(xiàng)占優(yōu),并且最終比第一項(xiàng)變化的更快,所以第一項(xiàng)和第三項(xiàng)相互作用表現(xiàn)出山谷。第二項(xiàng)能引起脊的形成,正是基于此,才實(shí)現(xiàn)了不同模式之間的區(qū)別。
用Matlab 進(jìn)行了仿真ORL 人臉庫的人臉識別實(shí)驗(yàn)。進(jìn)入系統(tǒng)后顯示如圖1 的主界面。
圖1 分布式模式識別仿真主界面Fig.1 Distributed pattern recognition simulation main interface
圖2 大高斯噪聲的識別結(jié)果Fig.2 Recognition results of large gaussian noise
系統(tǒng)主要由學(xué)習(xí),識別,輸入模式選擇,Agent 演化曲線等模塊組成。學(xué)習(xí)模塊完成標(biāo)準(zhǔn)模式的選擇,歸一化,正交化,降維,先驗(yàn)知識的選擇等;識別模塊可以完成單模式識別,多模式識別,識別率計算等;輸入模式選擇模塊分確定方式和交互方式,圖2 是大高斯噪聲的識別結(jié)果,演化2步完成識別。圖3 是重疊噪聲的識別結(jié)果,演化6 步完成識別。圖4 是放縮噪聲的識別結(jié)果,演化17 步完成識別。圖2-圖4 用PCA 方法識別是失敗的。
圖3 重疊噪聲的識別結(jié)果Fig.3 Recognition results of overlapping noises
圖4 編號為48 的人臉進(jìn)行識別的結(jié)果Fig.4 face recognition results of No.48
傳統(tǒng)模式識別方法研究以特征為基礎(chǔ),而分布式模式識別框架的注意力集中在整個特征網(wǎng)絡(luò)的活動上。因此,分布式模式識別框架考察的是模式的整體。表1 列出集中模式識別方法的對比。
表1 五種模式識別方法的對比Table 1 Comparison of five pattern recognition methods
在傳統(tǒng)模式識別中,以算法為基礎(chǔ),意味著整個系統(tǒng)以確定行方式工作,而分布式模式識別框架是以自組織+算法為基礎(chǔ),系統(tǒng)狀態(tài)是由確定性事件和偶然事件兩者共同確定的。
通常情況下,模式識別需要在分布式環(huán)境中進(jìn)行,但是統(tǒng)計、仿生、協(xié)同和子空間這四中模式識別又不支持分布式計算,這就導(dǎo)致需求之間的矛盾和問題。本文只是簡單地說明了分布式模式識別框架的基本思想,在后續(xù)的文章中,我們將討論分布式模式識別框架關(guān)鍵技術(shù)的設(shè)計和實(shí)現(xiàn)。