付鈞澤,姜 紅*,李 意,滿 吉
(1.中國人民公安大學(xué) 偵查學(xué)院,北京 100038;2.北京華儀宏盛技術(shù)有限公司,北京 100024)
隨著煙民數(shù)量逐年增多,煙草消耗量越來越大,香煙的種類日益增多[1],在各類案件現(xiàn)場經(jīng)常能提取到香煙煙灰物證。通過對提取到的煙灰物證進(jìn)行檢驗,運(yùn)用多元統(tǒng)計方法建立分析模型,可以對香煙煙灰物證進(jìn)行快速識別[2]。香煙物證是法庭科學(xué)研究的重點問題,筆者已對香煙水松紙做過系統(tǒng)地研究[3-4]。MA等人[5]利用原子吸收法測定了卷煙煙灰中金屬元素,提出了先進(jìn)行灰化再微波消解的干濕結(jié)合前處理方法。CUI等人[6]采用電感耦合等離子體質(zhì)譜法(inductively coupled plasma mass sprctrometry,ICP-MS)對香煙中的微量元素進(jìn)行了準(zhǔn)確測定。PéREZBERNAL等人[7]利用電感耦合等離子體原子發(fā)射光譜法研究了14種微量元素在不同品牌香煙煙灰中的分布情況。HAN[8]利用激光誘導(dǎo)擊穿光譜技術(shù)測量了煙草和煙灰中一些金屬元素的含量。ZHAO等人[9]利用X射線衍射法對28種國產(chǎn)香煙煙灰中礦物成分進(jìn)行了研究。GARG等人[10]采用中子活化分析法對香煙煙灰中微量元素進(jìn)行了檢驗。WU等人[11]利用掃描電鏡/能譜法對25個不同的香煙煙灰樣品進(jìn)行了分析,結(jié)果表明同一品牌不同檔次、同一廠家不同品牌的香煙灰樣品中的元素種類和相對百分含量存在明顯差異。上述方法中,有的儀器設(shè)備價格昂貴,樣品制備復(fù)雜,最佳操作條件遴選過程周期較長、靈敏度較低。而X射線熒光光譜法具有分析時間短、分析元素廣、工作曲線線性范圍寬、對檢材無損且光譜干擾少等優(yōu)點,被廣泛應(yīng)用于冶金、化工等行業(yè)[12-16]。
本實驗中采用手持式能量色散型X射線熒光光譜儀對收集到的83個不同品牌、同一品牌不同系列的香煙煙灰樣品進(jìn)行檢驗,結(jié)合系統(tǒng)聚類的方法對樣品準(zhǔn)確分類,并通過回歸分析及判別分析法驗證其準(zhǔn)確性。取得了良好的實驗效果,可為案件現(xiàn)場香煙煙灰物證快檢提供借鑒。
OXFORD X-MET7500型熒光光譜儀(OXFORD公司);Poly-MHP透射膜、樣品盒;Rh為陽極靶,電壓為40kV,電流為50mA,測試時間為90s。
不同品牌、同一品牌不同系列的香煙煙灰樣本83個,見表1。
Table 1 Sample table of cigarette ash
continue
將收集到的煙灰樣品裝入樣品盒內(nèi),用Poly-MHP透射膜將裝有煙灰的樣品盒上端封住,在上述實驗條件下進(jìn)行檢測。借助SPSS24.0軟件,Zscore 標(biāo)準(zhǔn)化處理數(shù)據(jù)[17]。利用數(shù)理統(tǒng)計方法,對樣品進(jìn)行分析。
按照相似性將物理或抽象對象分類,各個類別由類似對象組成,這一過程稱為聚類。聚類分析是按照一定的相似性對樣品分類后,通過分析發(fā)現(xiàn)全局?jǐn)?shù)據(jù)的分布模式及樣品之間的相互關(guān)系[18]?,F(xiàn)將樣品數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后采用Ward法作為類間親疏程度的度量方法,平方歐氏距離作為個體間距離的計算方式。樣品經(jīng)過聚類分析后的分類結(jié)果見圖1。
Fig.1 Dendrogram of cluster results
如圖1所示,為了不使樣品分類類別過多,同時達(dá)到聚類分析的目的,取重新標(biāo)定距離為5,所有樣品被分為4類(見表2)。
Table 2 Classification results of tobacco ash samples
為了考察聚類結(jié)果的準(zhǔn)確性,借助多元線性回歸分析考察聚類結(jié)果分成的不同類別與各個元素變量之間的相互依賴的關(guān)系?;貧w分析是研究變量之間相關(guān)關(guān)系的一種統(tǒng)計方法,運(yùn)用十分廣泛,這種技術(shù)通常用于預(yù)測分析[19]?;貧w模型的相關(guān)參量方差分析結(jié)果見表3?;貧w模型的分析結(jié)果見表4。殘差直方圖見圖2。標(biāo)準(zhǔn)化殘差預(yù)期累積概率-累積目標(biāo)概率圖見圖3。
Table 3 Analysis of variance results
Table 4 Model summary
由表3可知,回歸模型的顯著性水平為0.000(預(yù)測變量:常數(shù)、鉛、鐵、鈷、鉀、鈦、鋯、鋅、銅、鈣、汞、錳、鋇、銣、鍶),其顯著性概率遠(yuǎn)遠(yuǎn)小于0.01,故說明該模型內(nèi)各個元素變量對類別變量的影響達(dá)到顯著性水平。
Fig.2 Histogram of residuals
Fig.3 Expected cumulative probability-cumulative probability of observation of standardized residual
R2代表著模型參量對因變量的解釋能力,不同模型可以直接用R2來判斷模型精確度的高低,其值越接近1,說明回歸直線對于觀測值的擬合效果越好。由表4可知,該回歸模型的調(diào)整后R=0.793,擬合度較好(預(yù)測變量同表3)。Durbin-Watson統(tǒng)計量的值為2.010,與臨界值(d=2)十分接近,在無自相關(guān)性的值域之中,認(rèn)定殘差獨(dú)立,通過檢驗。說明變量之間基本沒有自相關(guān)性,各個元素變量的獨(dú)立性較好[20]。
由圖2可知,標(biāo)準(zhǔn)化殘差直方圖呈一個倒扣的鐘形,左右兩側(cè)基本對稱。由圖3可知,標(biāo)準(zhǔn)化殘差的預(yù)期累積概率-累積目標(biāo)概率圖中散點大部分靠近斜線,綜合而言,殘差符合正態(tài)分布。根據(jù)以上殘差獨(dú)立性檢驗和殘差正態(tài)性檢驗的結(jié)果,認(rèn)為數(shù)據(jù)基本滿足線性回歸要求,所建立的模型可按照擬合質(zhì)量進(jìn)行預(yù)測,即通過2.1節(jié)中聚類分析得到的樣品類別與各元素之間可建立良好的擬合關(guān)系,說明聚類結(jié)果較為準(zhǔn)確。
判別分析是一種判斷個體所屬類別的統(tǒng)計分析手段[21-22],是根據(jù)已知對象的某些觀測值和其所屬類別來判斷未知對象所屬類別,因此可將判別分析與聚類分析相結(jié)合,建立判別模型對聚類分析結(jié)果進(jìn)行檢驗。將2.1節(jié)中聚類分析的結(jié)果作為已知類別,對樣品聚類結(jié)果進(jìn)行逐步判別分析,根據(jù)判別函數(shù)計算得出相對應(yīng)的得分, 樣品最終劃入得分最高的類中[23-24]。4個類別Wilk的Lambda檢驗判別結(jié)果見表5。
Table 5 Wilks Lambda result
由表5可知,軟件在判別過程中建立了3個判別函數(shù),函數(shù)1、2、3的顯著性水平均小于0.05,說明3個判別函數(shù)顯著成立,采用這3個函數(shù)得到的判別結(jié)果較好,判別函數(shù)的特征值見表6。
Table 6 Eigenvalue of discriminant function
表6中的方差百分比反映了典型函數(shù)所能解釋的方差變異程度(*表示分析中使用了前3種典型的判別函數(shù)),由函數(shù)1的方差百分比值為76.0%,函數(shù)2的方差百分比值為17.7%,函數(shù)3的方差百分比為6.3%,函數(shù)1所能解釋的信息遠(yuǎn)遠(yuǎn)比函數(shù)2及函數(shù)3多。所以選取函數(shù)1作為區(qū)分樣品的主要判別依據(jù)。函數(shù)1與函數(shù)2之間典型相關(guān)性系數(shù)分別為0.961和0.860,表示樣品在函數(shù)1和函數(shù)2這兩個維度上具有顯著差異。故選擇函數(shù)1和函數(shù)2作為函數(shù)判別軸建立聯(lián)合分布圖,結(jié)果見圖4。
Fig.4 Joint distribution of discriminant functions
由圖4可知,1代表第Ⅰ類樣品,2代表第Ⅱ類樣品,3代表第Ⅲ類樣品,4代表第Ⅳ類樣品。這4類樣品在函數(shù)1、函數(shù)2的判別軸上區(qū)分明顯。由于函數(shù)1是區(qū)分樣品的主要依據(jù),在函數(shù)1的維度上,4類樣本之間的差異性顯著,同一類的樣品均落在了同一區(qū)域。利用Fisher判別函數(shù)進(jìn)行回判,樣品回判正確率為100%,表明該判別模型對樣品的區(qū)分效果顯著。結(jié)果見表7。
Table 7 Sample back judgment output table
第Ⅰ類樣品的線性判別函數(shù)是:
Y1=-24.019-4.080X1+1.949X2+1.869X3+
4.030X4-6.936X5+1.422X6-0.246X7+
2.423X8+8.208X9-12.735X10-4.689X11-
1.304X12-6.957X13-8.006X14
(1)
第Ⅱ類樣品線性判別函數(shù)是:
Y2=-28.162+1.769X1-2.951X2-5.120X3-
5.183X4+12.992X5-1.291X6-2.038X7-
3.221X8-4.050X9+12.648X10+8.530X11+
1.592X12+1.760X13+0.106X14
(2)
第Ⅲ類樣品線性判別函數(shù)是:
Y3=-4.974+0.185X1+1.956X2+2.897X3+
0.348X4-3.235X5+0.961X6-0.348X7+
0.297X8+0.347X9-3.112X10-3.673X11-
1.666X12+0.935X13-0.415X14
(3)
第Ⅳ類樣品線性判別函數(shù)是:
Y4=-3.180+0.711X1-0.840X2-0.830X3-
0.307X4+0.927X5-0.568X6+0.588X7-
0.204X8-1.652X9+2.517X10+1.314X11+
0.785X12+1.174X13+2.344X14
(4)
(1)式~(4)式中的Y1~Y4分別為判別函數(shù)的因變量,X1~X14分別為判別函數(shù)的自變量。
表7顯示,100.0%的初始樣品被正確分類,利用判別模型預(yù)測的樣品類別與實際樣品類別完全一致,若要檢驗其它未知樣品的分類,只需將樣品元素含量輸入各變量中,就能直接在聯(lián)合分布圖上找到與之距離最近的分組質(zhì)心,進(jìn)而完成對未知樣品的準(zhǔn)確分類。
本實驗中利用X射線熒光光譜儀建立了一種鑒別香煙煙灰成分的方法,能夠?qū)ο銦煙熁覙悠愤M(jìn)行快速無損檢測。首先根據(jù)X射線熒光光譜數(shù)據(jù)對樣品進(jìn)行定性半定量分析初步歸類,而后利用SPSS軟件,采用Ward法對樣品進(jìn)行更為科學(xué)的聚類, 實現(xiàn)了對香煙煙灰樣品的種屬劃分。最后使用回歸分析和判別分析對聚類結(jié)果進(jìn)行評價,從而發(fā)現(xiàn)各元素與聚類分析產(chǎn)生的類別具有很強(qiáng)的擬合關(guān)系,再借助判別分析確定各類樣品之間質(zhì)心完全分離開來,判別情況良好,印證了系統(tǒng)聚類結(jié)果是準(zhǔn)確可靠的。同時建立了判別函數(shù)模型,借助Fisher函數(shù)進(jìn)行回判,得出的分類結(jié)果其歸類正確率為100%。利用該方法對現(xiàn)場提取到的未知香煙煙灰物證,可通過該判別模型進(jìn)行快速分類,從而提高煙灰物證的檢驗效率,為偵查提供幫助。