馬 梟,王 丹,姜 紅* ,滿 吉
(1.中國人民公安大學,北京 100038;2.北京華儀宏盛技術有限公司,北京 100123)
易拉罐產品已在日常生活中十分常見,易拉罐環(huán)作為易拉罐的組成成分之一,也廣泛分布于日常生活中。在案件現(xiàn)場常常能提取到犯罪嫌疑人丟棄的易拉罐環(huán),通過對易拉罐環(huán)樣本的檢驗分類,可為偵查破案提供線索,指明方向。但目前關于易拉罐的研究主要是在易拉罐的生產、工藝、原料方面,如陳強正等[1]從工藝條件方面分析了易拉罐環(huán)生產過程中劃模缺陷的產生原因并提出了預防措施。葉凱[2]在易拉罐的三道成形工藝上做出一定的優(yōu)化,使得生產所用鋁板的厚度降低了0.02 mm。但目前缺少對易拉罐環(huán)理化檢驗方面的研究。
因此,本實驗對易拉罐環(huán)樣本進行XRF分析,借助主成分分析和判別分析等方法,構建了易拉罐環(huán)樣本的判別模型,可將未知類別的易拉罐環(huán)樣本分類至已知的類別中,為偵查破案提供幫助。
本實驗所用儀器為英國牛津儀器集團X-MET8000手持式XRF光譜儀,設置檢測電壓為40kV、電流為60mA。
本實驗收集了不同品種的易拉罐環(huán)樣本共28個(樣品表略),利用無水乙醇對收集到的易拉罐環(huán)樣本進行擦拭,自然風干后進行檢測。將易拉罐環(huán)樣本放置于檢驗倉內,關閉艙門后設置掃描時間為80 s開始測量,重復此操作直至完成對所有樣本的測試。
根據實驗所得元素結果進行分析,易拉罐環(huán)樣本中Fe、Mn、Cu、Zn、Ni這5種元素含量較多,添加Fe、Mn和Cu可提高合金強度[3],Zn和Ni的加入可使得其延展性和沖擊性能得到提高[4]。因此本實驗可根據5種元素含量的差異對不同品種的易拉罐環(huán)樣本進行分類分析。
系統(tǒng)聚類作為一種廣泛使用的分類分析方法,可根據樣本數據之間的差異,提取出樣本之間的相似性和差異性,并根據不同的聚類方法和測量區(qū)間將樣本在不同層次上歸為一類[5]。由于本實驗所得樣本數據信息較為復雜,若直接進行分析分類,可能出現(xiàn)由于主觀因素引起的偏差。本著嚴謹的分析原則,選用系統(tǒng)聚類的方法對28個樣本數據進行處理,繪制譜系圖直觀描述樣本親疏分類情況見圖1。
由圖1可知,28個易拉罐環(huán)樣本被分為了5類,但第五類僅有24#一個樣本,復核測量所得元素數據后發(fā)現(xiàn)24#樣本Fe和Mn元素含量遠遠高于其余樣本,因此被單獨分為了一類。為了驗證系統(tǒng)聚類是否準確有效,對經過系統(tǒng)聚類被分為第三類即6#、9#、12#、14#、19#、26#樣本元素數據進行分析,6個樣本具體元素含量情況見表1。
圖1 28個易拉罐環(huán)樣本系統(tǒng)聚類譜系圖
由表1可知,第三類6個樣本Fe、Mn和Cu元素含量較多并且元素含量跨度較為接近,6個樣本Fe元素含量均在9500~12500區(qū)間內且分布較為均勻。通過觀察發(fā)現(xiàn)第三類樣本中Zn元素和Ni元素的含量較低,均未超過1000,部分樣本該兩種元素的含量為0。因此可分析得出該類樣本Fe、Mn和Cu元素含量較多且Zn和Ni元素的含量較低,因此被歸為了同一類。通過該方法可證實系統(tǒng)聚類分類效果較為良好,可在此基礎上對樣本數據進行進一步的分析。
表1 第三類樣本元素含量
根據前期系統(tǒng)聚類,已將28個樣本分為5類。本實驗的目的是為了通過已有的樣本數據構建能夠對未知類別樣本進行已知類別分類識別的模型[1],而判別分析可在已知分類情況下,通過計算提取特征值對樣本進行歸屬統(tǒng)計。因此進行判別分析模型的構建,將前期分類結果作為判別分析類別進行計算,判別函數摘要見表2。
表2 判別函數摘要
由判別函數摘要可知,根據樣本類別信息與數據特征計算出3個判別函數。觀察數據可知,前兩個判別函數累積百分比已經達到了85%,表明其對樣本特征有較強的解釋能力[1],此外一般情況下提取特征值大于1的判別函數,但第三個判別函數特征值僅為0.413且貢獻方差百分比僅為1.4%,因此只提取前兩個判別函數,繪制判別分布圖見圖2。
圖2 判別分布圖
由圖2可知,5類樣本在判別函數構成的平面空間內分布均勻,可直觀觀察到各類樣本之間的區(qū)別。并且經過交叉驗證后分類正確率達到了82.1%、原始分類正確率為96.4%,證明利用28個易拉罐環(huán)樣本所構建的判別分析模型不僅對已知類別樣本分類效果良好,并且對經過交叉驗證的可視為未知類別的樣本也能很好地分類[8],實現(xiàn)了對易拉罐環(huán)樣本分類的目的。
本實驗利用XRF將系統(tǒng)聚類與判別分析相結合,實現(xiàn)了對易拉罐環(huán)的成分檢驗與分類識別,最終交叉驗證正確率為82.1%,原始分類正確率為96.4%,表明這一系列方法所構建的判別模型能對易拉罐環(huán)進行有效的分類識別。