姬瑞軍++王明月
摘 要:研究不同性別人群足底壓力分布對(duì)性別進(jìn)行分析識(shí)別,利用足底壓力步態(tài)分析系統(tǒng)對(duì)20名男性和20名女性正常行走的足底壓力分布數(shù)據(jù)進(jìn)行測(cè)量,提取足底各區(qū)壓強(qiáng)峰值特征,使用支持向量機(jī)對(duì)不同性別人群的足底壓強(qiáng)峰值進(jìn)行訓(xùn)練并進(jìn)行驗(yàn)證。結(jié)果表明:利用支持向量機(jī)對(duì)左足、右足及左右足的足底壓強(qiáng)峰值特征建立的數(shù)學(xué)模型對(duì)性別具有較好的分析識(shí)別能力,識(shí)別正確率在80%以上,為利用犯罪嫌疑人足跡所反映的步態(tài)特征分析性別提供了實(shí)驗(yàn)依據(jù)。
關(guān)鍵詞:支持向量機(jī) 性別 足底壓強(qiáng) 識(shí)別
中圖分類號(hào):TB391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2017)08(c)-0248-03
足跡作為犯罪現(xiàn)場(chǎng)出現(xiàn)率較高的一類痕跡物證,在分析犯罪嫌疑人人身特點(diǎn)中發(fā)揮了重要作用。由于不同性別人群在身體結(jié)構(gòu)和運(yùn)動(dòng)機(jī)能方面的差異從而導(dǎo)致其足跡中反映的步態(tài)特征具有各自的特點(diǎn),從而為利用足跡分析犯罪嫌疑人性別提供了依據(jù)[1]。當(dāng)前科研工作者除了利用傳統(tǒng)的足跡學(xué)理論對(duì)不同性別人群的步態(tài)特征進(jìn)行了研究外,還使用大量足底壓力測(cè)量系統(tǒng)對(duì)不同性別人群行走留下的足底壓力分布進(jìn)行了測(cè)量研究,并發(fā)現(xiàn)了不同性別人群行走留下足底壓力分布差異[2-5]。本文基于不同性別人群在身體結(jié)構(gòu)、運(yùn)動(dòng)機(jī)能方面的差異,通過Footscan足底壓力步態(tài)分析系統(tǒng)采集不同性別人群的足底壓力分布數(shù)據(jù),利用支持向量機(jī)進(jìn)行訓(xùn)練,并使用交叉驗(yàn)證的方法對(duì)不同性別人群的足底壓力分布數(shù)據(jù)進(jìn)行分析識(shí)別,為利用足跡分析性別提供實(shí)驗(yàn)依據(jù),豐富足跡學(xué)的理論基礎(chǔ),為刑事案件偵查提供強(qiáng)有力的線索。
1 支持向量機(jī)的原理
支持向量機(jī)簡(jiǎn)稱SVM,是90年代中期發(fā)展起來(lái)的基于統(tǒng)計(jì)學(xué)理論的一種機(jī)器學(xué)習(xí)方法,通過尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來(lái)提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,從而達(dá)到在統(tǒng)計(jì)樣本量較少的情況下,亦能獲得良好統(tǒng)計(jì)規(guī)律的目的。
支持向量機(jī)分為線性可分支持向量機(jī)、線性不可分支持向量機(jī)和非線性支持向量機(jī)。在不同性別人群足底壓力的分析識(shí)別中,足底壓力特征與性別之間存在比較復(fù)雜的非線性映射關(guān)系,在此本文主要詳細(xì)介紹非線性支持向量機(jī)的問題。對(duì)于線性不可分情況,SVM的主要思想是將輸入向量映射到一個(gè)高維的特征向量空間,并在該特征空間中構(gòu)造最優(yōu)分類超平面。
假設(shè)有訓(xùn)練樣本集(xi,yi),(i =1,2,…,l),x∈Rn,y∈{ ±1}是類別標(biāo)號(hào),超平面方程為:
g(x) =ωxi+b =0 (1)
在約束條件上加入一個(gè)非負(fù)的松弛變量ξi,這時(shí)最大間隔超平面成為廣義最優(yōu)分類超平面,對(duì)應(yīng)的優(yōu)化問題轉(zhuǎn)變?yōu)椋?/p>
min1/2(ω·ω) +C∑ξi
s.t yi(ω·xi +b) ≥1 -ξi,其中ξi ≥0,i =1,…,n (2)
式中,ω∈Rn是超平面的法向量,b是閾值,ξi是引入的松弛變量,C>0是懲罰因子。采用拉格朗日乘子方法和技巧,進(jìn)而求得優(yōu)化問題(2)的對(duì)偶規(guī)劃為:
max∑ai1/2∑∑aiajyiyjK(xixj)
s.t∑aiyi=0,0≤ai≤C,i=1,…,n (3)
式中,ai是拉格朗日乘子,K(xi,xj)是滿足Mercer條件的核函數(shù)。SVM的決策函數(shù)可以表示為:
f(x)=sgn[aiK(xi,xj)+b]
式中,sgn表示二值函數(shù),值為{-1,+1}。
2 應(yīng)用實(shí)例
2.1 實(shí)驗(yàn)對(duì)象
選取體態(tài)勻稱,年齡在22~26歲,無(wú)足部疾病史,行走運(yùn)動(dòng)正常的受試對(duì)象40名,其中男性20名、女性20名。
2.2 實(shí)驗(yàn)方法
本實(shí)驗(yàn)儀器采用比利時(shí)RSscan公司研發(fā)的Footscan足底壓力步態(tài)分析系統(tǒng),在受試對(duì)象完全熟悉實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)過程后,讓受試對(duì)象赤足正常行走狀態(tài)下走過足底壓力步態(tài)分析系統(tǒng)2m長(zhǎng),0.4m寬的測(cè)試平板,從而獲得至少一個(gè)左足一個(gè)右足的足底壓力圖像和相關(guān)足底壓力分布數(shù)據(jù),以此讓每名受試對(duì)象重復(fù)行走3次有效數(shù)據(jù)并記錄性別。
2.3 數(shù)據(jù)處理
為了對(duì)不同性別人的足底壓力進(jìn)行分析識(shí)別,利用Footscan足底壓力步態(tài)分析系統(tǒng)對(duì)采集的足底壓力分布圖像進(jìn)行自動(dòng)分區(qū),將足底分為第1趾區(qū)(T1)、第2-5趾區(qū)(T2-5)、第1跖區(qū)(M1)、第2跖區(qū)(M2)、第3跖區(qū)(M3)、第4跖區(qū)(M4)、第5跖區(qū)(M5)、足弓區(qū)(MF)、跟內(nèi)側(cè)區(qū)(HM)、跟外側(cè)區(qū)(HL)等10個(gè)區(qū)域(見圖1),并將每個(gè)人3次的左右足底各區(qū)峰值壓強(qiáng)數(shù)據(jù)導(dǎo)出求平均后輸入到SPSS Modeler 15.0軟件中建立左足、右足和左右足的SVM模型并驗(yàn)證。
2.4 構(gòu)建和驗(yàn)證SVM模型
將Footscan足底壓力步態(tài)分析系統(tǒng)對(duì)采集的足底壓強(qiáng)數(shù)據(jù)導(dǎo)出并將其導(dǎo)入SPSS Modeler15.0軟件,選擇“字段選項(xiàng)”選項(xiàng)卡中的“類型”節(jié)點(diǎn),設(shè)定性別為目標(biāo)變量,其他變量為輸入變量,然后利用“字段”選項(xiàng)卡中的“分區(qū)”節(jié)點(diǎn)將數(shù)據(jù)集按照7∶3的比例分為訓(xùn)練集和測(cè)試集,最后將“模型”選項(xiàng)卡中的SVM節(jié)點(diǎn)放置到流編輯區(qū)域,并進(jìn)行參數(shù)設(shè)定。設(shè)定停止標(biāo)準(zhǔn)為10-5,懲罰因子為8,松弛變量ε為0.1,核函數(shù)選擇RBF核函數(shù),在構(gòu)建并驗(yàn)證左足和右足SVM模型時(shí)設(shè)置RBF伽馬為0.4,在構(gòu)建并驗(yàn)證左右足SVM模型時(shí)設(shè)置RBF伽馬為0.2,最終構(gòu)建并驗(yàn)證左足、右足及左右足的SVM模型。
2.5 結(jié)果與分析
表1是將左足足底10個(gè)區(qū)域足底壓強(qiáng)峰值組成10維特征向量,性別作為分類變量輸入SPSS Modeler軟件進(jìn)行建模分析識(shí)別的結(jié)果。由表1可知,左足訓(xùn)練集識(shí)別正確的百分比為90%,測(cè)試集識(shí)別正確的百分比為80%,綜合訓(xùn)練集與測(cè)試集識(shí)別正確的百分比為87.5%??梢娮笞阕愕赘鲄^(qū)壓強(qiáng)峰值組成的10維的特征向量所建立的SVM模型具有較好的分析識(shí)別能力,可以為利用左足足底壓強(qiáng)峰值分析識(shí)別性別提供參考。endprint
表2是將右足足底10個(gè)區(qū)域足底壓強(qiáng)峰值組成10維特征向量,性別作為分析變量輸入SPSS Modeler軟件進(jìn)行建模分析識(shí)別的結(jié)果。由表2可知,右足訓(xùn)練集識(shí)別正確的百分比為83.3%,測(cè)試集識(shí)別正確的百分比為80%,綜合訓(xùn)練集與測(cè)試集識(shí)別正確的百分比為82.5%。可見右足足底各區(qū)壓強(qiáng)峰值組成的10維的特征向量所建立的SVM模型的分析識(shí)別能力與左足一樣,識(shí)別正確的百分比均較高,可以為利用右足足底壓強(qiáng)峰值分析識(shí)別性別提供參考。
表3是將左足和右足足底20個(gè)區(qū)域足底壓強(qiáng)峰值組成20維特征向量,性別作為分析變量輸入SPSS Modeler15.0軟件進(jìn)行建模分析識(shí)別的結(jié)果。由表3可知,左足和右足組成的訓(xùn)練集識(shí)別正確的百分比為93.3%,測(cè)試集識(shí)別正確的百分比為80%,綜合訓(xùn)練集和測(cè)試集識(shí)別正確的百分比為90%??梢娮笞愫陀易阕愕赘鲄^(qū)壓強(qiáng)峰值組成的20維的特征向量所建立的SVM模型對(duì)性別的分析識(shí)別能力得到明顯的提高,說(shuō)明左足與右足足底壓強(qiáng)峰值的組合特征更加體現(xiàn)了不同性別群體在足底壓強(qiáng)峰值方面的差異。
3 結(jié)論
本文通過Footscan足底壓力步態(tài)分析系統(tǒng)采集20名男性和20名女性足底壓力分布數(shù)據(jù),使用SPSS Modeler軟件應(yīng)用支持向量機(jī)對(duì)40名受試對(duì)象的足底壓強(qiáng)峰值進(jìn)行建模并對(duì)性別進(jìn)行分析識(shí)別,經(jīng)過實(shí)例可知,支持向量機(jī)可以應(yīng)用于不同性別人群的分析識(shí)別,并且在利用單足、雙足足底壓強(qiáng)峰值識(shí)別不同性別人群時(shí),均具有較好的識(shí)別正確率,識(shí)別正確率均可達(dá)到80%以上。支持向量機(jī)在不同性別人群足底壓力分析識(shí)別中的應(yīng)用為利用犯罪嫌疑人足跡所反映的步態(tài)特征分析性別提供了實(shí)驗(yàn)依據(jù),也從側(cè)面論證了利用犯罪嫌疑人足跡所反映的步態(tài)特征分析性別的科學(xué)性。同時(shí),更加有價(jià)值的論證有待增大實(shí)驗(yàn)樣本進(jìn)行進(jìn)一步的實(shí)驗(yàn)研究,進(jìn)而提高分析識(shí)別性別的正確率,為利用足跡分析性別提供更有力的理論支持。
參考文獻(xiàn)
[1] 史力民.足跡學(xué)[M].北京:中國(guó)人民公安大學(xué)出版社, 2007.
[2] 張思亮.中國(guó)正常成人足底壓力參數(shù)值范圍、分布特點(diǎn)及其影響因素的探討[D].廣州:中山大學(xué),2008.
[3] 趙麗.性別與BMI對(duì)中學(xué)生足底壓力的影響[J].廊坊師范學(xué)院學(xué)報(bào),2016,16(4):87-90.
[4] 袁剛.正常人足底壓力分布及其影響因素分析[J].中華物理醫(yī)學(xué)與康復(fù)雜志,2004,26(3):156-159.
[5] 張騰丹.青年大學(xué)生行走步態(tài)足底區(qū)域壓力特征變化的研究[J].遼寧警察學(xué)院學(xué)報(bào),2016(1):85-91.
[6] 張莉.支持向量機(jī)在高考成績(jī)預(yù)測(cè)分析中的應(yīng)用[J].中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),2017,47(1):1-9.
[7] 郝文寧.數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)嶒?yàn)指導(dǎo)書[M].北京:國(guó)防工業(yè)出版社,2016.endprint