何欣龍,王繼芬
(中國人民公安大學(xué) 刑事科學(xué)技術(shù)學(xué)院,北京102623)
車用保險(xiǎn)杠的檢測是司法鑒定研究中一項(xiàng)重要的工作。在交通肇事逃逸等相關(guān)案件中,常常會在受害人衣物、被撞車輛和肇事現(xiàn)場路面上發(fā)現(xiàn)并提取到車用保險(xiǎn)杠碎片。通過對其進(jìn)行檢驗(yàn)研究,執(zhí)法人員可以確定碎片的品牌等相關(guān)信息,進(jìn)而追溯其來源,從而鎖定(排除)嫌疑人和車輛,為事故責(zé)任認(rèn)定提供線索和有力證據(jù)。
目前,針對車用保險(xiǎn)杠的檢驗(yàn)研究主要集中于其材料性能和加工工藝方面[1-3]。DAVOODI等人[4]對客車保險(xiǎn)杠梁中環(huán)氧復(fù)合材料的力學(xué)性能展開了研究,結(jié)果表明,除沖擊強(qiáng)度較低外,材料在拉伸強(qiáng)度、楊氏模量、彎曲強(qiáng)度和彎曲模量等性能方面均優(yōu)于常用的玻璃片熱塑材料,這為混合天然纖維在車輛部件中尤其是保險(xiǎn)杠材料選擇方面提供了一定的借鑒。AGUNSOYE等人[5]借助掃描電子顯微鏡、機(jī)械測試和熱重分析方法研究了碳化椰殼納米粒子增強(qiáng)環(huán)氧復(fù)合材料的結(jié)構(gòu)和力學(xué)性能,從而為使用該復(fù)合材料作為汽車保險(xiǎn)杠的應(yīng)用新材料提供了可能性。在司法鑒定中,與保險(xiǎn)杠檢驗(yàn)鑒別相關(guān)的研究報(bào)道少之又少[6-7],利用快速檢測技術(shù)提高檢驗(yàn)鑒定效率、降低檢驗(yàn)鑒定成本,建立可靠的車用保險(xiǎn)杠樣本快速、準(zhǔn)確檢驗(yàn)方法,是一線執(zhí)法人員和鑒定人員關(guān)注的重點(diǎn)之一。紅外光譜作為一種常用的快速檢測技術(shù),在激光技術(shù)研究領(lǐng)域有著十分廣泛的應(yīng)用[8-12]。OUYANG等人[13]借助紅外光譜技術(shù)建立了醇類汽油的分析模型,實(shí)現(xiàn)了對樣品100%的定性判別。LIU等人[14]采用近紅外光譜結(jié)合偏最小二乘法建立了西紅柿成熟度的無損檢測模型,實(shí)驗(yàn)結(jié)果較為理想,這對西紅柿的快速、批量分選具有一定的實(shí)際意義。將紅外光譜分析技術(shù)用于保險(xiǎn)杠物證的檢驗(yàn)鑒別具有重要的實(shí)踐意義和參考價(jià)值。
本文中通過牛頓插值多項(xiàng)式、導(dǎo)數(shù)濾波等方法對車用保險(xiǎn)杠的紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理,使用判別分析建立車用保險(xiǎn)杠品牌的鑒別模型,對6種車用保險(xiǎn)杠樣本進(jìn)行識別,為快速、無損和準(zhǔn)確的鑒別肇事現(xiàn)場車用保險(xiǎn)杠碎片提供一定的借鑒。
實(shí)驗(yàn)樣本:從市場上收集的6種品牌共計(jì)40個不同型號的車用保險(xiǎn)杠樣本。表1中列舉了6種樣本的基本信息。
Table 1 The details of 6 kinds of samples
儀器及參量設(shè)置:紅外光譜儀(Nicolet 5700,Thermo Fisher Scientific公司),氘化三甘氨酸硫酸酯探測器(DTGS,Thermo Fisher Scientific公司),KBr分束器(Thermo Fisher Scientific公司)[6],OPUS光譜數(shù)據(jù)處理軟件(德國 Bruker公司)[7]。掃描次數(shù)為 32次[15],分辨率為 4cm-1,光譜采集范圍為 4000cm-1~400cm-1。每個樣本采集4次光譜曲線,取平均值作為實(shí)驗(yàn)數(shù)據(jù),實(shí)驗(yàn)溫度為(29±3)℃,相對濕度為57%。
在紅外光譜測量的過程中,往往由于儀器自身原因、光源條件、實(shí)驗(yàn)溫度等影響,存在基線漂移、高頻噪音等現(xiàn)象。提取有效光譜信息,建立穩(wěn)健、準(zhǔn)確的鑒別模型是應(yīng)用領(lǐng)域所關(guān)切的問題之一。常用的預(yù)處理方法有光譜求導(dǎo)和基線校準(zhǔn):光譜求導(dǎo)是一種有效的預(yù)處理方法,其能從重疊的吸收光譜中分離出各自的吸收峰,消除或降低背景吸收的干擾,提高光譜的分辨率、信噪比和檢測靈敏度[16],但求導(dǎo)階數(shù)的增加也會使得導(dǎo)數(shù)運(yùn)算中高頻噪聲不斷放大,使得信噪比降低;基線校準(zhǔn)分自動校準(zhǔn)和手動校準(zhǔn),相比較前者,后者依賴主觀經(jīng)驗(yàn),操作費(fèi)時費(fèi)力,實(shí)用性低,無法滿足一線執(zhí)法人員和鑒定人員快速檢測的需求。自動基線校準(zhǔn)主要有小波變換重構(gòu)、插值和中值濾波等方法,其操作簡單,實(shí)用性較高。此外,其它校準(zhǔn)方法還有基于背景估計(jì)[17]、基于形態(tài)學(xué)算子[18-19]和頻率域分析[20]等。常用的插值方法有拉格朗日插值多項(xiàng)式和牛頓插值多項(xiàng)式。相比較前者,后者計(jì)算簡單快速,具有繼承性和易變化節(jié)點(diǎn)的優(yōu)勢,即增加節(jié)點(diǎn)時計(jì)算只增加一項(xiàng),這在縮短實(shí)際的運(yùn)算時間方面占據(jù)很大優(yōu)勢。牛頓插值多項(xiàng)式基本原理為如下。
假設(shè)有函數(shù) f(x),x0,x1,x2,x3,…,xk是一系列互不相等的點(diǎn),1階差商定義為:
可求得 f(x)為:
同理,k階差商定義為:
可求得 f(x0,x1,x2,…,xk-1)為:
則牛頓差值多項(xiàng)式為:
插值余項(xiàng)為:
實(shí)驗(yàn)中采用基線校準(zhǔn)和光譜求導(dǎo)兩種預(yù)處理方法,考察并比較紅外全波段光譜、指紋光譜、牛頓多項(xiàng)式插值(1次項(xiàng)~6次項(xiàng))、1階導(dǎo)數(shù)、2階導(dǎo)數(shù)和3階導(dǎo)數(shù)等方法對分類模型的預(yù)測效果,進(jìn)而選出最優(yōu)預(yù)處理方法,開展對樣本的識別工作。
Bayes判別是一種較為有效的分類方法,其先通過計(jì)算樣本的先驗(yàn)概率,即根據(jù)先期樣本聚類結(jié)果計(jì)算出樣本特征的各種概率密度函數(shù),然后按照貝葉斯公式計(jì)算出后驗(yàn)概率,根據(jù)后驗(yàn)概率進(jìn)行判別分析,從而實(shí)現(xiàn)最小錯誤率意義上的優(yōu)化。
其基本思想為:設(shè) x={a1,a2,…,am}為一個待分類項(xiàng),每個a為x的一個特征屬性,則有類別集合:C=={y1,y2,…,yn},計(jì)算 P(y1x),P(y2x),…,P(ynx),如果:P(ykx)=max{P(y1x),P(y2x),…,P(ynx) },則 x∈yk。
各樣本的紅外光譜全波段和指紋區(qū)波段分類模型的預(yù)測結(jié)果見表2。由表2可知,基于指紋區(qū)波段建立的判別模型總體準(zhǔn)確率(80.0%)高于全波段模型(77.5%)。分析認(rèn)為,車用保險(xiǎn)杠是混合物,不同品牌的樣品會存在一定差異,這些差異會在其光譜信息中呈現(xiàn)出來,且主要集中反映在指紋區(qū)。測量過程中由于基線漂移等現(xiàn)象,全波段光譜中的冗余和噪聲信息遠(yuǎn)遠(yuǎn)多于指紋區(qū),這不僅會加大分類模型的計(jì)算復(fù)雜度,更會嚴(yán)重影響到其預(yù)測精度,因此削弱冗余和噪聲區(qū)間的影響尤為重要。指紋區(qū)由于冗余和噪聲信息較少,其分類模型的精度相對較高。基于此,實(shí)驗(yàn)中選擇紅外光譜指紋區(qū)波段開展基線校準(zhǔn)工作,以此提高模型的判別精度。
Table2 Predicted results under full and fingerprint spectra
表3為借助牛頓差值多項(xiàng)式進(jìn)行基線校準(zhǔn),得到的不同插值次數(shù)處理后各品牌樣本的預(yù)測結(jié)果。圖1為不同插值次數(shù)處理后的總體判別準(zhǔn)確率。由表3可知,在不同插值次數(shù)處理后,日產(chǎn)和福特品牌樣本的分類準(zhǔn)確率均較高,長安品牌樣本的分類準(zhǔn)確率均低于其它品牌樣本分類結(jié)果,奧迪品牌樣本在0次、1次、4次和5次插值處理后的分類準(zhǔn)確率最高(85.7%),別克樣本在5次插值處理后的分類準(zhǔn)確率最高(100%),本田品牌樣本在2次、4次和6次插值處理后的分類準(zhǔn)確率最高(83.3%)。結(jié)合圖1,4次牛頓插值多項(xiàng)式處理后的判別準(zhǔn)確率最高(85%),3次牛頓插值多項(xiàng)式處理后的判別準(zhǔn)確率最低(62.5%),5次和6次插值處理后的總體判別準(zhǔn)確率逐漸下降,這是因?yàn)椴逯荡螖?shù)升高會使其結(jié)果越偏離原函數(shù),出現(xiàn)龍格現(xiàn)象,即插值節(jié)點(diǎn)個數(shù)增加會使得兩個插值節(jié)點(diǎn)之間的插值函數(shù)并無法很好地逼近被插值函數(shù),加上高次插值計(jì)算量大,會產(chǎn)生嚴(yán)重的誤差積累,從而使得分類模型的精度和穩(wěn)定性降低。綜上所述,選擇4次牛頓插值多項(xiàng)式進(jìn)行基線校準(zhǔn),開展對樣本進(jìn)一步的識別工作。
Table 3 Predicted results after different polynomial order
Fig.1 The overall discriminant accuracy with different polynomial order
表4為在經(jīng)過4次牛頓插值多項(xiàng)式處理后,各品牌樣本在不同階求導(dǎo)下的分類準(zhǔn)確率情況。由表4可知,1階導(dǎo)數(shù)處理后分類準(zhǔn)確率最高(100%),2階導(dǎo)數(shù)(97.5%)和3階導(dǎo)數(shù)(95.0%)對識別準(zhǔn)確率的提高沒有1階導(dǎo)數(shù)效果明顯,經(jīng)求導(dǎo)后奧迪、別克和本田品牌的樣本均實(shí)現(xiàn)了100%的準(zhǔn)確區(qū)分,相比較1階和2階求導(dǎo),長安和福特品牌的樣本經(jīng)3階求導(dǎo)后分類準(zhǔn)確率反而降低,分析認(rèn)為隨著求導(dǎo)階數(shù)的增加,光譜中的噪聲信息也會不斷放大,從而使得分類準(zhǔn)確率降低?;诖?,選擇1階導(dǎo)數(shù)處理開展對樣本品牌光譜信息的判別工作,得到了判別函數(shù)摘要(見表5)。
Table 4 Predicted results after different derivative processing
Table 5 The details of discriminant function
表5中相關(guān)性表明了不同分組與各個函數(shù)之間的關(guān)聯(lián)性。相關(guān)性越強(qiáng),則組別在此維度上的差異越大。Wilks'Lambda是組內(nèi)平方和與總平方和之比,其值越小,說明某個量對于模型的影響越顯著。顯著性(significance,Sig)是對數(shù)據(jù)差異性的評價(jià),一般取值需小于0.05,當(dāng)其小于等于0.001時,表明數(shù)據(jù)具有高度統(tǒng)計(jì)學(xué)意義[21]。由表5可知,判別模型中構(gòu)建了5個判別函數(shù),前2個函數(shù)的Wilks'Lambda均為0,表明前2個函數(shù)對模型的影響十分顯著,Sig值分別為0和0.001,表明判別函數(shù)(discrimination function,DF)DF1和DF2對模型影響的顯著性十分高,能很好解釋各樣本的分類情況。綜上所述,選擇函數(shù)DF1和DF2作為判別函數(shù),構(gòu)建判別分類模型,得到了6種品牌樣本的空間分布圖(見表5)。
Fig.2 The discriminant spatial distribution of each sample
圖2 為6種品牌樣本的判別空間分布圖。由圖可知,6種品牌的樣本均實(shí)現(xiàn)了100%的準(zhǔn)確區(qū)分,其中,Buick和Audi品牌樣本在DF1判別軸上區(qū)分明顯,Honda和Audi品牌樣本在DF2判別軸上區(qū)分明顯,Nissan和Changan品牌樣本在DF1判別軸上實(shí)現(xiàn)了區(qū)分,Changan與Ford品牌樣本在DF2判別軸上實(shí)現(xiàn)了區(qū)分,由于DF1判別軸單位長度為5,故而使得Nissan和Changan品牌樣本之間的區(qū)分不是十分明顯。DF1判別函數(shù)為Z1=-3.247X1+24.887X2-6.496X3-19.919X4+22.019X5-9.167X6+6.406X7+…+4.284X28-9.55X29+5.326X30+1.187X31+4.044X32+0.068X33,DF2判別函數(shù)為 Z2=-4.051X1-10.771X2-0.491X3+4.132X4-5.425X5+8.273X6+1.942X7+…+6.657X27-1.947X28+2.797X29-3.637X30-4.78X31+7.378X32+0.277X33。如果想?yún)^(qū)分未知變量,只需要在判別函數(shù)中輸入其相應(yīng)值,在分布圖中會顯示出其位置,就能區(qū)別新數(shù)據(jù)屬于哪一類別。
借助紅外指紋光譜及其4次牛頓插值多項(xiàng)式、1階導(dǎo)數(shù)與判別分析對車用保險(xiǎn)杠進(jìn)行了識別與分類,不僅實(shí)現(xiàn)了量少、快速和無損檢驗(yàn)的目的,而且借助數(shù)學(xué)模型展開光譜模式識別,實(shí)現(xiàn)了對其更為合理和有效地鑒別。4次牛頓插值多項(xiàng)式處理后的判別準(zhǔn)確率最高(85%),3次牛頓插值多項(xiàng)式處理后的判別準(zhǔn)確率最低(62.5%),5次和6次插值處理后的總體判別準(zhǔn)確率逐漸下降,是因?yàn)椴逯荡螖?shù)升高會使其結(jié)果越偏離原函數(shù),出現(xiàn)龍格現(xiàn)象使得分類模型的精度和穩(wěn)定性降低。原始光譜、1階導(dǎo)數(shù)、2階導(dǎo)數(shù)和3階導(dǎo)數(shù)判別模型結(jié)合Bayes判別分類準(zhǔn)確率分別為85%,100%和97.5%和95.0%,分析認(rèn)為隨著求導(dǎo)階數(shù)的增加,光譜中的噪聲信息也會不斷放大,從而使得分類準(zhǔn)確率降低。選擇判別函數(shù)DF1和DF2作為判別軸構(gòu)建各樣本判別空間分布模型,6種品牌的樣本均實(shí)現(xiàn)了100%的準(zhǔn)確區(qū)分,實(shí)驗(yàn)結(jié)果理想,表明紅外指紋光譜結(jié)合4次牛頓插值多項(xiàng)式-1階導(dǎo)數(shù)-判別分析可有效實(shí)現(xiàn)對奧迪等6種品牌車用保險(xiǎn)杠的準(zhǔn)確區(qū)分,該方法為其它物證的分類識別提供了一種新的思路和參考。