亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多模式LBP與深度森林的指靜脈識別

        2018-07-25 12:05:36劉廣東邱曉暉
        計算機技術與發(fā)展 2018年7期
        關鍵詞:深度特征

        劉廣東,邱曉暉

        (南京郵電大學 通信與信息工程學院,江蘇 南京 210003)

        0 引 言

        指靜脈識別是近年來興起的活體生物特征識別技術,其原理是基于人類手指中流動的血液可以吸收720~1 000 nm范圍內(nèi)的紅外線,從而得到指靜脈的清晰圖像。相較于傳統(tǒng)的生物識別方法,其自身存在獨特的優(yōu)點:特異性與唯一性。每個人的指靜脈圖像不同,同一人不同手指的靜脈圖像也不同,健康成年人的靜脈形狀不再發(fā)生變化;活體特征-指靜脈存在于身體內(nèi)部,被復制或者盜用的機會很小,受生理和環(huán)境因素的影響小,克服了皮膚表面異常、皮膚干燥、油污、灰塵等的影響,為指靜脈識別提供了理論依據(jù)。據(jù)公安部某研究所的專家團隊論證得出結論:指靜脈生物特征技術是目前最為安全、可靠的一種生物識別技術。

        近年來,研究者主要對指靜脈圖像的采集[1-3]與特征提取進行了研究。其中特征提取的研究最早主要集中于靜脈網(wǎng)絡的分割算法提取出靜脈骨架并采用模板匹配的方法進行識別[4],模板匹配利用圖像的整體信息但是計算量較大,宋顯華引入Hu不變矩法取得了很好的效果[5]?;陟o脈網(wǎng)絡的分布結構提取端點與分叉點[6]同樣受到了研究者的青睞,這類方法利用了靜脈網(wǎng)絡的局部信息。多尺度幾何特征[7]和二值特征[8]能夠提取豐富的局部紋理信息,適用于指靜脈等紋理描述的生物特征識別。使用空間投影變換等機器學習方法[9-12]獲取的指靜脈特征,通過訓練獲得降維后的具有較高描述能力的特征符合圖像處理與模式識別技術的潮流,具有自身獨特優(yōu)勢。但是針對深度學習進行指靜脈識別卻鮮有人提出,這是因為深度網(wǎng)絡模型的訓練需要大量的樣本,而目前指靜脈的權威數(shù)據(jù)庫難以達到需求。最近,深度森林模型的提取為解決這一問題提供了有效的解決途徑。深度森林的提出為解決小樣本的數(shù)據(jù)模型提供了可靠的途徑并且有效減少了訓練時間,同時文中提出了多模式LBP特征與深度網(wǎng)絡相結合的方式,并通過實驗進行驗證。

        1 指靜脈識別系統(tǒng)框架

        指靜脈識別系統(tǒng)主要包括:指靜脈圖像采集、指靜脈圖像預處理、指靜脈圖像特征提取、指靜脈圖像識別[13]。圖像采集設備在整個圖像識別系統(tǒng)中占有重要的地位,采集到的指靜脈圖像的質量直接影響整個識別系統(tǒng)的安全性、可接受性和正確性。指靜脈圖像的采集主要依據(jù)紅外成像理論,紅外波長在720~1 000 nm的近紅外LED光源照射到指靜脈表面時,紅外光線很容易透射過骨骼和肌肉組織,而手指血管中血紅蛋白可以充分吸收該波段的近紅外光線。在手指的另一側CMOS攝像頭可以拍攝到手指靜脈圖像。在圖像的預處理階段,主要是得到清晰有效的指靜脈區(qū)域,這部分包含的步驟主要是感興趣區(qū)域(ROI)的提取、尺寸歸一化、灰度歸一化,經(jīng)過上述處理后就可以得到大小統(tǒng)一且含有充分特征信息的指靜脈特征。文中特征提取部分采用多模式的LBP特征,包含基本的LBP特征、統(tǒng)一模式分塊直方圖特征,同時結合深度森林進行指靜脈的識別。

        2 LBP特征提取

        LBP(local binary pattern,局部二值模式)是一種能夠有效地描述圖像局部紋理特征的算子。LBP特征具有很強的分類能力、較高的計算效率并且對于單調的灰度變化具有不變性,這些特點使得它在很多圖像分類問題中得到了應用并且不斷被改進[14]。

        整個LBP的編碼過程如圖1左所示。

        圖1 多模式LBP算子

        用公式概括為:

        其中,(xc,yc)為所選鄰域中心像素點的坐標;(xi,yi)為鄰域像素點坐標;gi為中心像素的灰度值;gc為鄰域像素的灰度值。

        應用LBP算子的過程類似于濾波過程中的模板操作。逐行掃描圖像,對圖像中的每一個像素點,以該點的灰度作為閾值,對其周圍的3*3模板進行二值化,按照一定的順序將二值化的結果組成一個8位二進制數(shù),以此二進制數(shù)的值(0~255)作為該點的響應。在整個逐行掃描結束后會得到一個LBP響應圖像,圖1中LBP響應圖像的二進制編碼為01100111,對應的十進制編碼為103。

        統(tǒng)一模式LBP:

        對于一個局部二進制模式,在將其二進制位串視為循環(huán)的情況下,如果其中包含的從0到1或者從1到0的轉變不多于兩個,則稱這個局部二進制模式為統(tǒng)一化模式。統(tǒng)一化LBP模式能夠很好地解決基本LBP算子中那些受噪聲影響的轉變。對于采樣點數(shù)為P的原始LBP產(chǎn)生的二進制模式為2P種,而等價模式只有P(P-1)+3種,當P=8時,統(tǒng)一模式LBP的二進制模式僅有59種,見圖1右。

        在整個逐行掃描結束后會得到一個LBP響應圖像,這個響應圖像的直方圖稱為LBP統(tǒng)計直方圖或LBP直方圖,它常常作為后續(xù)識別工作的特征,因此也被稱為LBP特征。由于LBP直方圖大多是針對圖像中的各個分區(qū)分別計算的,對于一個普通大小的分塊區(qū)域,標準的LBP算子得到的二進制模式數(shù)目較多,而實際的位于該區(qū)域中的像素數(shù)目卻相對較少,這將會得到一個過于稀疏的直方圖,從而使直方圖失去統(tǒng)計意義。因此應該設法減少一些冗余的LBP模式,同時又保留足夠的具有重要描繪能力的模式。統(tǒng)一化模式的提出解決了上述問題,在隨后的LBP直方圖的計算過程中,只為統(tǒng)一化模式分配單獨的直方圖收集箱,而所有非統(tǒng)一化模式都被放入一個公用收集箱,這就使LBP的特征數(shù)目大大減少。一般來說,保留的統(tǒng)一化模式往往是反映重要信息的那些模式,而非統(tǒng)一化模式中過多的轉變往往是由噪聲引起的,不具有良好的統(tǒng)計意義[15]。

        3 深度森林

        近年來,深度學習網(wǎng)絡在許多領域取得了巨大的成功,尤其是在計算機視覺和語音識別方面。盡管深度神經(jīng)網(wǎng)絡優(yōu)勢突出,但是仍然存在明顯的缺點。首先,深度神經(jīng)網(wǎng)絡需要大量的樣本進行訓練,這樣就無法在小樣本訓練集上直接使用。同時,盡管在大樣本數(shù)據(jù)集上,許多實際任務由于缺少標記樣本(由于樣本標記需要耗費大量的資源),使得深度學習網(wǎng)絡在這些任務上的表現(xiàn)也不是很好。其次,深度學習網(wǎng)絡是非常復雜的模型,訓練處理的過程需要具有強大計算能力的設備,除了大公司以外,個人很難真正進入這一領域。更為重要的是,深度神經(jīng)網(wǎng)絡具有非常多的超參數(shù),學習表現(xiàn)嚴重依賴對這些參數(shù)的調節(jié)。舉例來說,即使一些作者使用卷積神經(jīng)網(wǎng)絡,他們也是根據(jù)不同的任務使用不同的學習模型,比如卷積層結構。這使得深度神經(jīng)網(wǎng)絡的訓練非常棘手,而且深層神經(jīng)網(wǎng)絡的理論非常困難,因為具有幾乎無限構型組合的干擾因素太多。

        研究者們普遍認識到,表征學習能力對于深度神經(jīng)網(wǎng)絡至關重要。值得注意的是,為了利用大量的訓練數(shù)據(jù),深度學習網(wǎng)絡需要很大的容納能力;這也是深度神經(jīng)網(wǎng)絡非常復雜的原因。gcForest是一種新的決策樹集合方法,該方法生成了一個深層森林集合,具有級聯(lián)結構,可以使gcForest進行表征學習。當輸入具有高維度時,可以通過多粒度掃描進一步增強其表征學習能力,使gcForest具有上下文或結構感知能力。此外,gcForest可以自適應地確定級聯(lián)層數(shù),自動設置模型復雜性,使gcForest即使在小規(guī)模數(shù)據(jù)上也能執(zhí)行良好,用戶可以根據(jù)可用的計算資源來控制訓練成本。gcForest具有比深層神經(jīng)網(wǎng)絡少得多的超參數(shù);更為重要的是,它的性能對于超參數(shù)設置具有健壯性,因此在大多數(shù)情況下,即使是來自不同域的不同數(shù)據(jù),也可以通過使用默認設置獲得出色的性能。這不僅使gcForest的訓練方便,而且使gcForest的訓練時間成本小于深層神經(jīng)網(wǎng)絡。

        gcForest采用級聯(lián)結構,其中級聯(lián)接收由其前一級別森林處理的特征信息,并將處理結果輸出到下一級。每層包含兩個隨機森林和兩個完全隨機森林,這是基于多樣性的考慮,每個層級都是集合的集合。每個隨機森林包含500棵樹,完全隨機森林是由1 000棵決策樹組成,每棵樹隨機選取一個特征作為分裂樹的分裂節(jié)點,然后一直生長,直到每個葉節(jié)點細分到只有1個類別或者不多于10個樣本。類似的,普通隨機森林由1 000棵決策樹構成,每棵樹通過隨機選取sqrt(d)(d表示輸入特征維度,即特征數(shù))個候選特征,然后通過gini分數(shù)篩選分裂節(jié)點。所以兩種森林的主要區(qū)別在于候選特征空間,完全隨機森林是在完整的特征空間中隨機選取特征來分裂,而普通隨機森林是在一個隨機特征子空間內(nèi)通過gini系數(shù)來選取分裂節(jié)點。注意,每個森林里的樹木數(shù)量是一個超參數(shù)。

        圖2 類矢量產(chǎn)生的說明

        圖2是每層森林中特征類矢量的產(chǎn)生過程:給定一個實例,每個森林將計算相關實例落葉的葉節(jié)點上不同類別的訓練實例的百分比,然后對同一森林中的所有樹進行平均,從而產(chǎn)生類分布的估計,其中虛線部分顯示實例遍歷到葉節(jié)點的路徑。

        為了方便起見,假設輸入的樣本包含三個類,估計的類分布形成一個類向量,然后將其與原始特征向量連接以輸入到下一級級聯(lián)。例如,假設有三個類,那么四個森林中的每一個將產(chǎn)生三維類向量;因此,下一級級聯(lián)將獲得12(3×4)增強特征。

        為了降低過度擬合的風險,每個森林產(chǎn)生的類矢量是通過k-折交叉驗證產(chǎn)生的。每個實例將被用作k-1次的訓練數(shù)據(jù),產(chǎn)生k-1個類向量,然后對其進行平均以產(chǎn)生最終類矢量作為下一級級聯(lián)的增強特征。獲得增強特征后,將對驗證集進行整體級聯(lián)性能評估,如果沒有顯著的識別率增長,訓練程序將終止;因此,gcForest能自動確定級聯(lián)電平的數(shù)量。與模型復雜度固定的大多數(shù)深度神經(jīng)網(wǎng)絡相反,gcForest通過適當?shù)亟K止訓練來自適應地決定其模型的復雜性。這使其能適用于不同規(guī)模的訓練數(shù)據(jù),不限于大規(guī)模訓練數(shù)據(jù)。

        4 實驗與分析

        實驗的數(shù)據(jù)集來自Sains Malymia大學的指靜脈數(shù)據(jù)集FV_USM,該數(shù)據(jù)庫共由兩部分組成,每一部分均包含2 952個樣本。這些樣本來自123個不同性別、不同年齡階段的志愿者,每個人分別采集雙手的食指和中指的圖片各6張,經(jīng)過預處理后得到統(tǒng)一的像素為100*300的樣本。

        另一個數(shù)據(jù)庫是由自己制作的采集設備采集得到,實驗樣本來自35位不同年齡段的人,按照正規(guī)的預處理流程制作標準的樣本。每個樣本的像素為280*120,但是制作好的樣本仍有微小的位移偏差,更符合實際情況,以驗證算法的魯棒性。

        實驗中分別將gcForest算法與其他典型的機器學習算法進行對比,結果見表1和表2。其中,用于訓練的樣本數(shù)量分別選擇3個樣本和4個樣本。decisiontree分類器[16]的最大深度設置為10,節(jié)點數(shù)目為100。支持向量機分類器[17]使用臺灣大學林智實驗室開發(fā)的LibSVM。FV_USM數(shù)據(jù)庫中C設置為0.031 25,g設置為0.000 488 281 24;自制數(shù)據(jù)庫上C設置為0.125,g設置為0.000 122 007 031 25。logistic regression分類器[18]設置為C=1.0,懲罰因子設置為l2范式。random forest分類器[19]最大深度設置為10,包含1 000棵樹。KNN分類器[20]中K的值設置為3。gcForest分類器中每層包含4個森林,其中兩個森林為完全隨機森林,兩個為隨機森林,每個森林包含500棵樹,增益準則選擇最小“gini”值,gcForest自動設置訓練級數(shù),當識別率不再有明顯增長時停止訓練過程。

        表1 不同算法在FV_USM上的識別率對比 %

        表2 不同算法在自制數(shù)據(jù)庫上的識別率對比 %

        從表1與表2可以看出,gcForest相比于其他算法取得了較高的識別率。

        提出的基于LBP特征的深度森林框架如圖3所示。

        圖3 基于LBP特征的深度森林框架

        將LBP基本響應圖像,分塊LBP統(tǒng)一模式的直方圖特征分別輸入到深度森林中,最終的實驗結果見表3。

        表3 不同LBP特征與深度森林結合 取得的識別率 %

        從表3可以看出,相較于LBP響應圖像,LBP直方圖能夠取得更好的識別效果。在兩個實驗數(shù)據(jù)庫上,基于統(tǒng)一模式LBP分塊直方圖特征比使用LBP響應圖像在識別效果上的提升更加顯著,在FV_USM數(shù)據(jù)庫上識別率提高了6.78%,在自制數(shù)據(jù)庫上識別率提高了4.07%。

        5 結束語

        提出了基于深度森林的指靜脈識別方法,并與經(jīng)典的機器學習識別器在性能上進行比較,結果表明基于深度學習模型改進的深度森林識別器比其他的分類器具有更好的表現(xiàn),與深度神經(jīng)網(wǎng)絡相比更適用于小規(guī)模數(shù)據(jù)集,具有更少的調節(jié)參數(shù),同時能夠自適應地優(yōu)化選取網(wǎng)絡層數(shù)。同時,將基本LBP響應圖像、統(tǒng)一模式LBP分塊直方圖特征與深度森林結合的方法在提取豐富的指靜脈紋理特征的基礎上結合深度學習的模型,進一步提高了深度森林的識別效果。相較于深度網(wǎng)絡等深度學習模型探索了基于深度學習模型用于圖像識別的新領域,實驗表明深度森林能夠在指靜脈圖像識別等圖像識別領域取得理想的效果。

        猜你喜歡
        深度特征
        抓住特征巧觀察
        深度理解一元一次方程
        新型冠狀病毒及其流行病學特征認識
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        深度觀察
        深度觀察
        深度觀察
        深度觀察
        抓住特征巧觀察
        少妇人妻在线伊人春色| 色一情一乱一伦一区二区三区| 久青草国产视频| 国产美女胸大一区二区三区| 午夜男女靠比视频免费| 黑人巨茎大战俄罗斯美女| 初尝黑人巨砲波多野结衣| 亚洲欧洲日产国码久在线| 国产爽快片一区二区三区| 射精区-区区三区| 夜夜嗨av一区二区三区| 中文字幕天天躁日日躁狠狠 | 亚洲AV无码一区二区三区ba| 成人短篇在线视频夫妻刺激自拍 | 免费无码一区二区三区蜜桃| 青青操国产在线| 在线视频一区二区观看| 亚洲女优中文字幕在线观看| 午夜无码伦费影视在线观看| 综合无码一区二区三区四区五区| 97自拍视频国产在线观看| 亚洲一区在线观看中文字幕| 国产欧美日韩综合精品二区| 久久婷婷综合色拍亚洲| 女优av性天堂网男人天堂| 亚洲熟妇丰满多毛xxxx| 久久99精品国产99久久| 国产成人精品人人做人人爽| 国产白色视频在线观看| 亚洲国产精品久久人人爱| 亚洲毛片网| 国产高清大片一级黄色| 在线观看人成视频免费| 中文无码制服丝袜人妻av| 不打码在线观看一区二区三区视频 | 无码熟妇人妻av在线影片最多| 精品国产aⅴ无码一区二区| 精品久久杨幂国产杨幂| 国产黄色三级一区二区三区四区| 国模无码一区二区三区| 国产亚洲欧美在线观看的|