史力民 李 碩 趙悅岑
(中國刑事警察學院痕跡檢驗技術(shù)系 遼寧 沈陽 110035)
足跡是犯罪現(xiàn)場遺留率、提取率最高的痕跡之一,在確定偵查方向和范圍、刻畫嫌疑人特征、串并各類案件等方面具有明顯優(yōu)勢[1]。以足跡對犯罪嫌疑人性別進行的分析一直以來都是基于以往總結(jié)的專家經(jīng)驗知識,即利用男女性在行走過程中產(chǎn)生的赤足或鞋底結(jié)構(gòu)形態(tài)特征、步態(tài)特征以及磨損特征的不同進行性別分析。對于穿鞋足跡的性別分析,往往根據(jù)鞋樣式種類、鞋底花紋特征的男女性差異即可做出分析判斷,而對于赤足足跡的性別分析,則是利用男女性赤足足型特征的差異來區(qū)分性別[2]。但隨著近些年女性罪犯增多,對于在人群中占較大比例的160cm~175cm身高段男女性,他們的赤足跡在長、寬等特征中易出現(xiàn)特征交叉,特征區(qū)分不明顯的情況,導致上述傳統(tǒng)的赤足跡性別分析方法在目前的實踐應用中分析準確率不高,分析效果不理想。
近年來,從圖像識別、語音識別到自然語言處理、無人駕駛等領域,各類優(yōu)秀的人工智能研究成果已紛紛落地應用,象征著計算機技術(shù)步入大數(shù)據(jù)、大計算、大決策的人工智能信息技術(shù)新時代。這也給足跡分析領域帶來了一個全新的思路:利用深度學習[3]的方法對足跡圖像進行自動分析識別。深度學習是人工智能下機器學習中一種基于對數(shù)據(jù)進行表征學習的方法,其不再需要人工對足跡特征進行提取、分析和判斷,而是將特征提取過程、分析識別過程交由神經(jīng)網(wǎng)絡,擺脫了足跡分析過程對于以往專家經(jīng)驗知識的依賴,更有效地提取已知特征和發(fā)現(xiàn)潛在特征,達到對足跡圖像完全自動化的分析識別。
深度學習主要通過深層的神經(jīng)網(wǎng)絡來模擬人大腦的學習過程,每層的神經(jīng)元接收更底層神經(jīng)元的輸入,通過輸入與輸出之間的非線性關系,將低層特征組合成更高層的抽象表示,并發(fā)現(xiàn)觀測數(shù)據(jù)的分布式特征。它是一個自動的無人工干預的過程,借鑒人腦的多層抽象機制來實現(xiàn)對顯示對象或數(shù)據(jù)(圖像、語音及文本等)的抽象表達,整合特征抽取和分類器到一個學習框架下,并利用分類器或者匹配算法對頂層的輸出單元進行分類識別。
卷積神經(jīng)網(wǎng)絡(CNN)是一種專門用來處理具有類似網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡,例如可以看作二維像素網(wǎng)格的圖像數(shù)據(jù)。本文選擇深度學習Caffe平臺下的AlexNet卷積神經(jīng)網(wǎng)絡對赤足足跡圖像進行性別自動分析研究。Caffe意為快速特征嵌入的卷積結(jié)構(gòu),由UC Berkeley BVLC實驗室發(fā)布的深度學習開源工具,是目前使用最為廣泛的深度學習實驗平臺之一。AlexNet是2012年ImageNet的冠軍網(wǎng)絡,它證明了CNN在復雜模型下的有效性,大幅提高了卷積神經(jīng)網(wǎng)絡在圖像識別方面的準確性,推動了有監(jiān)督深度學習的發(fā)展,是以后各種卷積神經(jīng)網(wǎng)絡的基礎,有著大網(wǎng)絡、速度快和防止過擬合的優(yōu)點[5]。
AlexNet網(wǎng)絡包括5個卷積層和3個全連接層,其中每一層又具有不同功能的子層。從總體看該模型的8層結(jié)構(gòu),其中輸入層不包括在內(nèi),layer1~layer5是卷積層,layer6~Output為全連接層,最后的一個輸出層也是全連接層,且能看作1000維輸出的softmax分類器,最后的優(yōu)化目標是最大化平均的多項logistic回歸[5]。每一個卷積層以及全連接層后緊跟的操作是 ReLU操作;Max pooling最大池化操作是緊跟在第一個norm1,norm2,以及conv5層;Dropout操作是在最后兩個全連接層。AlexNet網(wǎng)絡結(jié)構(gòu)如圖1所示。
圖1 AlexNet網(wǎng)絡結(jié)構(gòu)圖
本實驗的數(shù)據(jù)采集工作主要使用中國刑警學院足跡實驗室恒銳成趟足跡采集儀,該儀器實現(xiàn)了大幅面(4.8m×0.6m)、高精度的成趟足跡采集工作,利用了數(shù)字圖像技術(shù)重現(xiàn)現(xiàn)場足跡以及形象增強技術(shù)實現(xiàn)足跡特征及隱含信息的形象顯現(xiàn)。采集完成后生成以黑底為背景的足跡圖像,圖像信息豐富,清晰易處理。
實驗采集了中國刑事警察學院共112位本科生、研究生及干訓學員正常行走下的成趟赤足電子捺印樣本每人6幅,共672幅。
采集完成后利用MATLAB軟件將成趟赤足圖像分割成單枚赤足圖像,等比例縮放并填補空缺部位后,得到如圖2所示的256×256像素統(tǒng)一大小的jpg格式單枚赤足圖像。所有圖像處理完畢后,篩選掉部分重疊足跡、殘缺足跡,共得單枚赤足圖像2712幅,其中男性62人,共1457幅,女性50人,共1255幅,單人赤足圖像均在24幅以上。
圖2 圖像處理后所得單枚赤足圖像
訓練組樣本與測試組樣本按7:3的數(shù)量比例在樣本庫中隨機挑選,選取42位男性、35位女性的所有圖像樣本作為訓練組數(shù)據(jù),其余20位男性、15位女性的所有圖像樣本作為測試組數(shù)據(jù),保證訓練組與測試組沒有個體上的交集。重復以上隨機過程10次,產(chǎn)生10組不同數(shù)據(jù)集用于實驗。
本實驗在windows環(huán)境下采用CPU運行,為了在實驗中得到更多的訓練數(shù)據(jù),所有的圖像均被左右翻轉(zhuǎn)以便將數(shù)據(jù)集加倍。本實驗對實驗圖像采取有監(jiān)督的學習方法[6],實驗前對訓練組與測試組男女性實驗圖像全部進行分類標記,男性圖像樣本標記為0,女性圖像樣本標記為1,并對所有實驗圖像進行全局對比度歸一化。實驗過程中不斷使用訓練組樣本進行分析模型的訓練,并用已標記好的測試組樣本對訓練模型進行性別分析測試,得到分析準確率;通過誤差反向傳播和梯度下降算法,不斷迭代更新權(quán)重和偏置,當達到設定的迭代次數(shù)后,得到最終的分析模型及模型分析準確率。
為了在實驗中對AlexNet網(wǎng)絡設置合適的網(wǎng)絡參數(shù),實驗前隨機選取一組數(shù)據(jù)集進行預實驗,不斷調(diào)整網(wǎng)絡參數(shù)以優(yōu)化實驗結(jié)果,最終將預實驗最優(yōu)結(jié)果的網(wǎng)絡參數(shù)值確定為本次實驗的網(wǎng)絡參數(shù),詳細參數(shù)設置如表所示。神經(jīng)網(wǎng)絡的測試間隔為200次迭代,即每進行200次迭代訓練后利用測試組對模型準確率進行一次測試,訓練的基礎學習率為0.001,學習策略為步進,每迭代1000次學習率下降0.5倍,最大迭代次數(shù)為6000次,神經(jīng)網(wǎng)絡參數(shù)優(yōu)化算法為隨機梯度下降,輸入的圖像分批次處理,訓練圖像每批次處理的圖像數(shù)量為64幅,測試圖像每批次處理的圖像數(shù)量為32幅。
表 實驗所用AlexNet網(wǎng)絡參數(shù)設置
10組數(shù)據(jù)集實驗結(jié)果如圖3所示,其中x軸代表迭代次數(shù),雙y軸分別代表訓練模型準確率與損失函數(shù)值,10對同顏色折線分別代表每組數(shù)據(jù)集隨迭代次數(shù)的增加準確率與損失值的變化曲線。從圖中可以看出,隨著迭代次數(shù)增加,各數(shù)據(jù)集網(wǎng)絡模型迅速收斂,分析準確率迅速提升并伴隨著損失值的降低,網(wǎng)絡在2000次迭代后趨于穩(wěn)定。10組數(shù)據(jù)集訓練所得最終性別分析模型平均準確率為92.2%,其中準確率最高的分析模型為95.5%,最低的為87.3%。在損失函數(shù)方面,10組數(shù)據(jù)集最終訓練模型損失值相較于訓練之前,損失值平均降低0.49,其中最低損失值達到0.15。
本文以二分類的性別分析作為開端,對深度學習方法在足跡分析領域的應用進行了研究嘗試:應用卷積神經(jīng)網(wǎng)絡AlexNet對赤足圖像進行訓練、測試,各數(shù)據(jù)集訓練所得最終性別分析模型的平均準確率為92.2%,最高可達95.5%,準確率高于人工性別分析準確率。實驗表明,深度學習方法在赤足跡性別分析領域可以較好地應用。在今后的實際案件和研究實驗中,均可利用實驗所得模型對新收集的赤足跡圖像進行性別自動分析工作,避免人工特征提取與分析過程,有利于提高工作效率和進一步提升赤足跡性別分析準確率,從而為分析犯罪嫌疑人人身特點提供更有力的依據(jù)。
圖3 各數(shù)據(jù)集實驗數(shù)據(jù)折線圖
本文的實驗成果為下一步利用深度學習方法對案件現(xiàn)場赤足跡的性別分析研究奠定了實驗基礎,同時也為下階段對身高、體態(tài)、年齡等其他人身特點的分析、足跡的人身識別等方面的研究做了實驗準備。另外,本文的研究工作還存在著模型訓練時間較長、實驗圖像樣本比例不均衡、個別實驗參數(shù)有待優(yōu)化等問題,在接下來的研究工作中還有待提高。