李 蕓,朱樹先,祝勇俊
(蘇州科技大學(xué) 電子與信息工程學(xué)院,江蘇 蘇州 215009)
隨著模式識別領(lǐng)域的不斷發(fā)展,身份識別驗證領(lǐng)域越來越多地應(yīng)用生物特征識別等方法。人臉與人體的其它生物特征(指紋、虹膜等)一樣與生俱來,它的唯一性和不易被復(fù)制的良好特性為身份鑒別提供了必要的前提。其中,人臉識別因其便捷性、非強(qiáng)制性、非接觸性、識別對象不易偽裝等特點,已廣泛應(yīng)用于金融、司法、公安、邊檢、醫(yī)療及眾多企事業(yè)單位等領(lǐng)域,在門禁考勤系統(tǒng)、檔案管理系統(tǒng)、電子護(hù)照及身份驗證、公安系統(tǒng)的罪犯身份識別、銀行和海關(guān)的監(jiān)控、信息安全和安全支付等領(lǐng)域有著重要應(yīng)用[1]。
徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于人臉識別領(lǐng)域,并取得很好的識別效果,其具有良好的學(xué)習(xí)能力和很強(qiáng)的泛化性能,被公認(rèn)為小樣本條件下模式識別性能最好的神經(jīng)網(wǎng)絡(luò)之一[2]。同時,RBF 神經(jīng)網(wǎng)絡(luò)在智能控制和故障檢測方面亦有較好的表現(xiàn)[3-4]。在模式識別方面,一般情況下,采用RBF神經(jīng)網(wǎng)絡(luò)作為分類器,所做的訓(xùn)練和識別為單類別識別,即每一類的樣本都具有相似的屬性特征。以人臉識別為例,單類別樣本是指每一類的人臉圖像都取自于同一個人,在這一類樣本中選取一部分作為訓(xùn)練樣本,一部分作為識別樣本,對該類進(jìn)行訓(xùn)練和識別。多類混疊樣本是指每一大類包含兩個或兩個以上的人臉圖像樣本,把不同的人臉作為一大類樣本進(jìn)行訓(xùn)練、識別的分類方法。針對基于隱層神經(jīng)元數(shù)目的增減、徑向基函數(shù)中心、 寬度以及輸出權(quán)值等參數(shù)的RBF 神經(jīng)網(wǎng)絡(luò)的優(yōu)化問題已成為當(dāng)前RBF 神經(jīng)網(wǎng)絡(luò)研究的一個熱點。趙文可[5]提出的一種彈性RBF 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化設(shè)計方法,基于神經(jīng)元的活躍度以及神經(jīng)元修復(fù)準(zhǔn)則,調(diào)整RBF 神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元的各參數(shù)以及隱含層與輸出層神經(jīng)元之間的連接權(quán)值。該算法解決了網(wǎng)絡(luò)結(jié)構(gòu)過大或過小的問題,同時在分類器訓(xùn)練過程中,能夠彈性適應(yīng)同類圖像的微小變化,從而提高分類器的識別準(zhǔn)確率。蒙西[6]提出的基于快速密度聚類的RBF 神經(jīng)網(wǎng)絡(luò)設(shè)計。該算法能夠基于快速密度聚類的方法以緊湊的網(wǎng)絡(luò)結(jié)構(gòu)和較快的收斂速度獲取較好的非線性映射能力。而本文提出的基于RBF 神經(jīng)網(wǎng)絡(luò)的多類混疊人臉識別方法,并沒有考慮如何通過修改隱層神經(jīng)元數(shù)目的增減、徑向基函數(shù)中心、寬度以及輸出權(quán)值等參數(shù)優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò),而是考慮能否犧牲部分識別率,換來與單類別人臉識別相比,更具有普遍性和實用性的多類混疊的人臉識別方法。
RBF 網(wǎng)絡(luò)是一個三層神經(jīng)網(wǎng)絡(luò),分為輸入層、隱含層和輸出層,如圖1 所示。假定輸入向量p∈Rn,表示p為一個n 維列向量。RBF 神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元的激勵函數(shù)選為高斯函數(shù),隱含層神經(jīng)元的個數(shù)為N,輸出向量p∈RM,是一個M 維的列向量,對于訓(xùn)練樣本而言,需要提供一個標(biāo)準(zhǔn)的期望輸出向量。例如,如果共分為三類,對第二類的訓(xùn)練樣本,它的期望輸出向量為最大元素所在的行數(shù)即為該樣本所屬的類別,即期望輸出則RBF 核函數(shù)可表示為(0 1 0)T。其中,T 表示轉(zhuǎn)置。對于測試樣本而言,輸出的列向量中哪一行的值最大,就表示輸出的是哪一類[7]。
式中,隱含層神經(jīng)元中的基函數(shù)用以實現(xiàn)從輸入向量到Ri(p)的非線性映射;p 是n 維輸入向量;ci是高斯函數(shù)中心;σi是該函數(shù)圍繞中心點的寬度;‖p-ci‖為輸入模式與中心向量之間的距離。
圖1 RBF 網(wǎng)絡(luò)的工作原理
輸出向量實現(xiàn)從Ri→Ol的線性映射,見下式
RBF 網(wǎng)絡(luò)的待定參數(shù)有基函數(shù)的中心向量ci,形狀參數(shù),隱含層與輸出層之間的權(quán)值w。ci和σi可通過經(jīng)驗預(yù)先獲得。
RBF 網(wǎng)絡(luò)所具有的優(yōu)異性能是在與其他廣泛應(yīng)用于模式識別的神經(jīng)網(wǎng)絡(luò)的比較基礎(chǔ)上得出的。其中,最典型的就是BP 神經(jīng)網(wǎng)絡(luò)。在單類別識別且不涉及多類混疊前提下,關(guān)于兩者性能的比較,本文作者已經(jīng)做了詳細(xì)的分析論證。與BP 神經(jīng)網(wǎng)絡(luò)相比,RBF 神經(jīng)網(wǎng)絡(luò)的各方面,諸如識別率、運算速度,穩(wěn)定性等性能遠(yuǎn)遠(yuǎn)優(yōu)于BP 神經(jīng)網(wǎng)絡(luò),由于本文所述方法在于既可用于單類別模式識別,又可用于多類別混疊識別,鑒于BP 神經(jīng)網(wǎng)絡(luò)在單類別模式識別方面的表現(xiàn)遠(yuǎn)不如RBF 神經(jīng)網(wǎng)絡(luò),故本文僅探討RBF 神經(jīng)網(wǎng)絡(luò)的優(yōu)點,而忽略對其他神經(jīng)網(wǎng)絡(luò)的比較[8]。
RBF 網(wǎng)絡(luò)所具有的優(yōu)異性能是和RBF 本身的性質(zhì)密不可分的。RBF 是一個典型的局部性核函數(shù),僅僅在測試點附近小領(lǐng)域內(nèi)對數(shù)據(jù)點有影響,它使用局部指數(shù)衰減的非線性函數(shù)(如高斯函數(shù))對非線性輸出映射進(jìn)行局部逼近。這使得在逼近非線性輸入輸出映射時,要達(dá)到相同的精度,RBF 網(wǎng)絡(luò)所需的參數(shù)相對少了許多,且具有極快的收斂速度。因此,RBF 網(wǎng)絡(luò)在泛化性和小樣本分類方面都具極佳的性能[9-11]。
本文以Matlab7.5 為開發(fā)平臺,神經(jīng)網(wǎng)絡(luò)工具箱為Matlab7.5 自帶。本實驗采用兩種方案來進(jìn)行訓(xùn)練和測試樣本集的選擇。方案一為多類混疊識別測試,方案二為單一類別識別測試。
本文假定以汽車或智能家居中的人臉自動識別系統(tǒng)為應(yīng)用背景,將訓(xùn)練和識別對象分為主人、客人和陌生人三類。選取ORL 人臉庫中的50 人,每人取10 張臉部圖像為研究樣本,共500 張人臉圖像。將上述的500 張人臉圖像分為5 組,目的是進(jìn)行5 次的訓(xùn)練和識別實驗。這樣,每次實驗以10 個人為一組,每組中選取2 個人劃分為第一類,即主人,選取3 個人劃分為第二類,即經(jīng)過主人授權(quán)允許進(jìn)入的客人,選取其余的5個人劃分為第三類,即陌生人或非法入侵者。從樣本劃分來看,在多類混疊方面具有隨機(jī)性和不確定性。
在訓(xùn)練樣本和測試樣本的選取方面,對于每個人的10 張人臉圖像中,取4 張作為訓(xùn)練樣本,6 張作為測試樣本。5 組人臉圖像共有300 張作為測試樣本,與通常所用的單一類別測試結(jié)果相比較,識別準(zhǔn)確度略有降低。在下面討論過第二種,即單一類別樣本的訓(xùn)練和測試和測試后將在表1 中對兩種測試結(jié)果進(jìn)行統(tǒng)一對照。
為了與前述的多類混疊識別方法相比較,方案二與方案一在樣本上選取一致,即神經(jīng)網(wǎng)絡(luò)的輸入變量是一樣的,只是輸出不同。例如,方案一訓(xùn)練的輸出是3 行1 列的列向量,代表3 類。而方案二的輸出是10 行1列的列向量,表示分為10 類,每一類是單一類別,也就是代表一個人。
同樣選取ORL 人臉庫中的50 人,每人取10 張臉部圖像為研究樣本,共500 張人臉圖像。將上述的500 張人臉圖像分為5 組,目的是進(jìn)行5 次的訓(xùn)練和識別實驗。這樣,每次實驗以10 個人為一組,這樣每組分為10 類。
在訓(xùn)練樣本和測試樣本的選取方面,對于每個人的10 張人臉圖像中,取4 張作為訓(xùn)練樣本,6 張作為測試樣本。5 組人臉圖像共有300 張作為測試樣本。實驗發(fā)現(xiàn),單一類別的識別率略微高于多類混疊識別方法。
表1 單一類別和多類混疊在識別性能上的比較
RBF 神經(jīng)網(wǎng)絡(luò)具有收斂速度快、識別精度高、穩(wěn)定性強(qiáng)、算法相對簡單等諸多優(yōu)點,在多層前向網(wǎng)絡(luò)類型中可作為首選。在模式識別領(lǐng)域中,對多類別混合后其性能是否退化尚未見有文獻(xiàn)進(jìn)行專門的討論。通過對多類混疊后的人臉圖像與單一類別的人臉圖像進(jìn)行試驗對比,發(fā)現(xiàn)經(jīng)過多類混疊后,與單一類別的識別相比,RBF 神經(jīng)網(wǎng)絡(luò)的識別性能在各組表現(xiàn)出的穩(wěn)定性等指標(biāo)沒有出現(xiàn)明顯的退化。從另一方面也證實了RBF 神經(jīng)網(wǎng)絡(luò)具有適應(yīng)性強(qiáng)、穩(wěn)定性好,在學(xué)習(xí)能力和泛化能力方面都有優(yōu)異的表現(xiàn)。