陳維娜,國中正,李開開,楊玉柱,楊 旭
1. 中國人民公安大學偵查學院,北京 100038 2. 司法部司法鑒定科學研究院,上海 200063
紙張鑒別是法庭科學領域研究的重要內容之一。 在所有紙張中,靜電復印紙因其紙品潔白、 平整,纖維細密且具有一定的抗靜電性,被廣泛應用于復印、 打印、 傳真中。 一些不法之徒利用靜電復印紙來偽造合同、 協(xié)議,印制反動宣傳品、 敲詐勒索信等,使靜電復印紙成為其從事違法犯罪活動的一種工具。 法庭科學文件檢驗從業(yè)人員通過對靜電復印紙的種類、 品牌等進行檢驗、 鑒別,不僅能夠判斷文件材料的真?zhèn)渭捌鋪碓?,還能縮小偵查范圍,為法庭訴訟提供證據。
靜電復印紙的主體成分是植物纖維,檢驗紙張中其他添加成分是區(qū)分不同廠商配方的關鍵。 通??墒褂眉t外光譜法[1-2]、 紫外光譜法[3-4]、 掃描電鏡與電子能譜儀檢驗法[5]、 X射線分析法[6]等對靜電復印紙的填料成分等進行定性及定量分析,但這些方法大多制樣復雜,且對紙張樣品有所損壞,在實際辦案中難以普及。
顯微共聚焦拉曼光譜技術將拉曼光譜分析技術與顯微分析技術相結合,具有無損檢驗、 無需制樣、 操作簡便、 所需樣本量少等優(yōu)點,適合對文件物證進行檢驗分析。 特別是近年來,隨著化學計量學方法的引入,通過對光譜數據的深度挖掘,在文件物質材料種類鑒別方面取得了較為豐碩的研究成果[7-10]。 但這些研究成果主要聚焦在文件上的墨水、 油墨、 印泥(油)等色料,缺乏對文件載體——紙張的分析,本工作利用顯微共聚焦拉曼光譜技術采集了靜電復印紙樣品的光譜數據,采用聚類分析進行了分類,并采用主成分分析對聚類分析的分類結果進行了驗證,以期建立一種更可靠、 更便捷的檢驗方法,實現不同品牌、 型號靜電復印紙的無損鑒別。
收集了不同品牌、 不同型號的靜電復印紙20種,紙品定量均為70 g·m-2,紙幅規(guī)格均為A4(297 mm×210 mm),編號Y1—Y20; 涉及15個品牌,12個生產廠家,詳細信息見表1。 同時收集思齊(SiQi)牌定性濾紙,常見無機填料碳酸鈣、 硫酸鋇等作為參照。
表1 不同品牌的復印紙Table 1 Different brands of copying paper
使用Renishaw公司Renishaw inVia Reflex激光顯微共聚焦拉曼光譜儀,選用10X目鏡、 50X物鏡和激光波長為785 nm的半導體激光器,光柵1 200 L·mm-1,激光功率衰減至10%,曝光時間為10 s,積分2次,掃描范圍: 500~2 000 cm-1。
1.3.1 拉曼光譜采集
依次將靜電復印紙、 定性濾紙樣品放于電控載物臺上,在顯微鏡下調焦清晰后進行采樣。 考慮到紙張的不均勻性,故隨機選擇每份樣品上的3個點作為采樣點,按照儀器工作條件采集拉曼光譜。 將碳酸鈣、 硫酸鋇等樣品均勻覆蓋在載玻片上后置于電控載物臺進行光譜取樣,儀器工作條件和操作過程同上。
1.3.2 光譜數據預處理
采用The Unscrambler X軟件對光譜數據進行平均濾波平滑處理,以消除噪聲的影響。 計算每次測量的3組數據的平均值,并使用LabSpec軟件采用多項式擬合法去除基線、 選擇高斯-洛倫茲混合函數進行峰位擬合,再通過Origin軟件繪制拉曼光譜圖進行光譜分析。
1.3.3 沃爾德系統(tǒng)聚類分析
系統(tǒng)聚類法是一種常見的無監(jiān)督分類方式,能使類間對象的異質性和類內對象的同質性最大化,從而達到物以類聚的目的; 同時可對傳統(tǒng)視覺分類方法起到良好的補充作用。 沃爾德系統(tǒng)聚類法基于方差分析的思想,以兩類合并為一類時所增加的離差平方和來計算類間距離; 先讓每個樣品自成一類,然后通過合并縮小一類,每縮小一類時離差平方和就要增大,選擇將離差平方和增加最小的兩類合并,直到所有的樣品歸為一類為止。 如果分類得當,則同類樣品間的離差平方和應較小,而類間的離差平方和應較大。 本實驗使用SPSS軟件對光譜數據進行聚類,聚類方法選用沃爾德法,測量區(qū)間為平方歐式距離,利用Z得分標準化處理進行分析,得到聚類集中計劃表和樹狀圖。
1.3.4 主成分分析
主成分分析法的中心思想是將數據降維,從而實現用低維數據代替高維數據的效果; 其基本原理是通過正交變換將相關變量轉換為線性不相關的變量,經過變換之后得到原始光譜的主成分,同時這些主成分基本能夠代替原始光譜的信息。 累計方差貢獻率決定主成分的個數,累積方差貢獻率的大小表示了當前選擇的所有主成分攜帶原數據的信息的比例,當累計方差貢獻率能夠提供原始變量的絕大部分信息時,即可根據方差貢獻率與主成分數關系圖來確定所需的主成分數。 本實驗使用SPSS軟件對光譜數據進行主成分分析,從相關性矩陣出發(fā),提取大于1的特征根與其所對應的主成分。 使用主成分分析法對特定波段的光譜數據進行有效降維,能夠得出各類紙張樣品在主成分特征空間中的獨立分布,從而驗證系統(tǒng)聚類的結果。
經預處理后,20種紙張樣品的拉曼光譜見圖1。 從圖1中可以看出,在波數500~2 000 cm-1的范圍內可見各紙張樣品的特征峰,主要集中在900~1 700 cm-1范圍內,分別位于714,892,1 092,1 119,1 143,1 343,1 385,1 470,1 510和1 600 cm-1等處; 不同樣品間的峰位相似,但峰強存在差異。
靜電復印紙主要由植物纖維、 填料、 膠料和色料4部分組成,其中植物纖維是基本成分,填料也占據較大份額。 為確定各品牌、 型號靜電復印紙樣品的主要成分,需要將靜電復印紙樣品的拉曼光譜與純纖維素成分的定性濾紙拉曼光譜、 碳酸鈣和硫酸鋇等常見無機填料的拉曼光譜進行比較分析,詳見圖2(a)—(d)。
圖1 20種復印紙樣品的拉曼光譜Fig.1 Raman spectra of 20 copy paper samples
圖2 (a)—(d)靜電復印紙樣品與定性濾紙、 碳酸鈣、 硫酸鋇的拉曼光譜圖采用表1中序號對樣品進行標號Fig.2 (a)—(d) Raman spectra of copy paper samples, qualitative filter paper, CaCO3 and BaSO4The samples are labeled with the serial numbers in Table 1
通過靜電復印紙與定性濾紙的拉曼光譜比較; 發(fā)現靜電復印紙樣品中富含纖維素成分,在1 092,1 119,1 143,1 343和1 385 cm-1等處出現特征峰。 復印紙與定性濾紙光譜的區(qū)別主要表現在714,892,1 470,1 510和1 600 cm-1等處出現的拉曼光譜峰; 其中1 510 cm-1對應苯環(huán)的不對稱伸縮振動,1 600 cm-1對應苯環(huán)的對稱伸縮振動,為木素的特征峰位,這說明復印紙樣品中除纖維素成分外還含有木素成分。
通過靜電復印紙與無機填料碳酸鈣、 硫酸鋇的拉曼光譜比較; 發(fā)現20種靜電復印紙樣品在714,892,1 087和1 470 cm-1等處附近出現特征峰,且紙張中的纖維素主峰1 092 cm-1與碳酸鈣主峰1 087 cm-1位置非常相近; 而在630和992 cm-1等處附近均未出現特征峰,這說明復印紙樣品中的填料成分均為碳酸鈣,而非硫酸鋇。
拉曼光譜分析結果表明,這20種不同品牌、 型號的靜電復印紙拉曼光譜反映相近,紙張中的主要物質成分為纖維素、 木素和碳酸鈣等,未見明顯差異,無法通過纖維、 填料的種類不同直接對復印紙進行種類鑒別。 不過上述檢驗反映出,雖然不同紙張樣品的光譜曲線存在交叉重疊現象,但其主要特征峰的強度、 面積等均存在一定差異,為進一步的鑒別分析提供了基礎。
在拉曼光譜中,植物纖維和碳酸鈣是靜電復印紙可檢測的主要成分,但二者的主峰過于接近、 相互交疊,不宜直接使用二者的峰強度比或峰面積比來對樣品種類進行進一步的區(qū)分。 考慮到系統(tǒng)聚類方法的優(yōu)勢,將經過預處理的拉曼光譜數據導入SPSS軟件中進行聚類分析。 通過測算不同聚類數目所對應的組內平方和,以組內平方和基本不再變化為依據確定聚類數目,得到聚類集中計劃表,繪制聚合系數隨分類數變化的散點圖,結果見圖3。
從圖3中可以看出,當聚類數大于4時,曲線變化趨勢開始變得平緩; 即當聚類數大于4時,所對應的組內平方和基本不再發(fā)生變化,因此將該點作為分類數,確定紙張樣品的聚類數目為4類。 20種不同品牌、 型號的紙張樣品聚類分析樹狀圖見圖4。
圖3 聚合系數隨種類數變化圖Fig.3 Curves showing the change of clusteringcoefficient with the number of categories
圖4 不同靜電復印紙樣品系統(tǒng)聚類樹狀圖Fig.4 The hierarchical clustering trees of differentelectrostatic copy paper samples
如圖4所示,當平均組間連接距離為2.5時,可將20種靜電復印紙樣品分為四類: 第Ⅰ類中包含10份樣品: Y11—Y20; 第Ⅱ類中包含3份樣品: Y7,Y9和Y10; 第Ⅲ類中包含6份樣品: Y1—Y6; 第Ⅳ類中僅有1份樣品: Y8。
考慮到靜電復印紙樣品的拉曼光譜圖主要特征峰集中在900~1 700 cm-1范圍內,故使用SPSS軟件對這一特定波段范圍內的光譜數據進行主成分分析,得到的總方差解釋見表2。
表2 不同靜電復印紙樣品主成分分析結果Table 2 Principal component analysis results of differentelectrostatic copy paper samples
由表2可知,在紙張樣品的17個主成分中,前兩個主成分累計方差貢獻率已達到84%,包含了絕大部分的光譜信息,基于前兩個主成分繪制樣品拉曼光譜數據的主成分得分圖,如圖5所示。
圖5 不同靜電復印紙樣品主成分得分圖Fig.5 The score chart of principal component analysisof different electrostatic copy papers samples
從圖5中可以看出,20種靜電復印紙樣品被分為四類,其中: 分類1中包含Y11—Y20共10份樣品; 分類2中包含Y7,Y9和Y10共3份樣品; 分類3中包含Y1—Y6共6份樣品; 分類4中僅包含Y8這1份樣品。 將主成分分析結果與系統(tǒng)聚類結果進行比較,發(fā)現運用沃爾德系統(tǒng)聚類得出的4種分類結果在主成分得分圖中區(qū)分明顯,第Ⅰ—Ⅳ類所包含的小類都能聚集在一塊,主成分分析結果與系統(tǒng)聚類分析結果相一致,分類結果準確、 合理。
使用顯微共聚焦拉曼光譜技術采集了20種不同品牌、 型號的靜電復印紙樣品光譜數據,經分析發(fā)現: 這些復印紙樣品中的主要成分均為纖維素、 木素及碳酸鈣填料,經系統(tǒng)聚類可將這些紙張樣品分成四類,并得到了主成分分析結果的驗證。
顯微共聚焦拉曼光譜技術結合化學計量法可對不同品牌、 型號的靜電復印紙樣品進行鑒別,彌補傳統(tǒng)的依據光譜曲線形態(tài)進行直接分類方法的不足之處。 整個分析過程對紙張樣品無損壞,操作簡便、 無需制樣,鑒別結果可用不同的統(tǒng)計分析方法相互印證,可靠、 有效。 綜上所述,該方法適合在法庭科學文件檢驗中推廣使用,為鑒別靜電復印紙、 確定文件真?zhèn)巍?推斷紙張來源提供數據支持和檢測方法。