袁緒政,李鵬妮,張紅,莊莉
(1.嘉興市皮毛和制鞋工業(yè)研究所,浙江桐鄉(xiāng) 314500;2.國(guó)家紡織服裝產(chǎn)品質(zhì)量檢驗(yàn)中心(浙江桐鄉(xiāng)),浙江 桐鄉(xiāng) 314500;3.桐鄉(xiāng)市質(zhì)量技術(shù)監(jiān)督事務(wù)中心,浙江 桐鄉(xiāng) 314500)
水貂屬于哺乳綱食肉目鼬科鼬屬動(dòng)物,野生狀態(tài)下有美洲水貂和歐洲水貂兩種,目前世界各國(guó)人工飼養(yǎng)的水貂均為美洲水貂后裔,共有11 個(gè)亞種[1]。水貂皮素有“軟黃金”之稱(chēng),是世界上珍貴裘皮,具有針毛挺直、靈活華麗、絨毛豐厚、保暖性強(qiáng)、皮板輕薄、柔韌結(jié)實(shí)等優(yōu)點(diǎn),已經(jīng)成為國(guó)際裘皮貿(mào)易的三大支柱產(chǎn)品之一[2]。依據(jù)中國(guó)皮革協(xié)會(huì)官方數(shù)據(jù),2020 年全國(guó)水貂取皮數(shù)量為931 萬(wàn)張,主要分布在山東省、遼寧省和黑龍江省[3],另外還有大量的進(jìn)口水貂通過(guò)丹麥、荷蘭等國(guó)際拍賣(mài)行進(jìn)入我國(guó)。
不同品種、品類(lèi)的貂毛皮價(jià)值差異較大,另外有些與貂毛皮極為相似的其他毛皮,如:黃狼皮、水獺皮、麝鼠皮等[4]常被不法分子用來(lái)“以次充好”、“以假當(dāng)真”。目前,貂毛皮的鑒別方法主要有感官法、PCR 法[5-6]、掃描電鏡法[7]、電子顯微鏡法[8]等。上述各種鑒別方法各有特色、也有不足,要么需要檢驗(yàn)人員對(duì)各種貂毛皮的特征性有深入了解,并具有豐富的實(shí)踐經(jīng)驗(yàn);要么需要價(jià)格高昂的設(shè)備投入,無(wú)法大規(guī)模推廣和應(yīng)用。
文章作者所在團(tuán)隊(duì)一直致力于易混毛皮的快速鑒別方法的研究,張紅[9-10]等綜合運(yùn)用了傅里葉紅外光譜、分別通過(guò)高斯分峰擬合和SPSS(Statistical Product and Service Solutions)的數(shù)據(jù)分析方法(主成分分析、分類(lèi)判別)研究了牛毛皮和馬毛皮的材質(zhì)鑒別問(wèn)題并取得了良好的效果。作為上述文獻(xiàn)的理論延伸和實(shí)踐應(yīng)用,本文將上述方法應(yīng)用于貂毛皮真假鑒別中,以期獲得一種快速、準(zhǔn)確、無(wú)損的數(shù)字化鑒別新方法。
1.1.1 試驗(yàn)材料
鞣制的貂毛皮:包括標(biāo)準(zhǔn)水貂(進(jìn)口標(biāo)準(zhǔn)水貂、國(guó)產(chǎn)標(biāo)準(zhǔn)水貂)共2 種;彩色水貂(十字貂、奶牛貂、紫貂、珍珠貂)共4 種。
鞣制的非貂類(lèi)毛皮:包括麝鼠皮、黃鼠狼、海貍鼠、水獺、艾鼬、青紫藍(lán)、馬毛皮、牛毛皮,共8 種。以上毛皮樣品均購(gòu)自桐鄉(xiāng)市鑫諾皮草有限公司。
正己烷(上海潤(rùn)捷化學(xué)試劑有限公司,分析純)等。
1.1.2 儀器設(shè)備
傅里葉變換紅外光譜儀(型號(hào):Nicolet IS 10,Thermo Fisher,配有鍺晶體的ATR 附件和OMNI 采樣器);掃描電鏡(型號(hào):SU-1500,日本日立公司);超聲波清洗器(型號(hào):SK2210LHC,上??茖?dǎo)超聲儀器有限公司)等。
1.2.1 試樣清潔及檢查
取毛皮樣品,采用正己烷作為有機(jī)溶劑,在工作頻率為35 kHz、工作溫度為60 ℃,工作時(shí)間為60 min 條件下超聲清洗2 次,取出真空干燥備用。并在使用前通過(guò)掃描電鏡觀察清潔程度,排除雜質(zhì)對(duì)后續(xù)紅外光譜測(cè)定的影響[10]。
1.2.2 紅外光譜采集及處理
在400~4000 cm-1范圍內(nèi)掃描樣品32 次,分辨率為4 cm-1,采用基線(xiàn)校正等預(yù)處理方法對(duì)譜圖進(jìn)行預(yù)處理,另存為csv 格式數(shù)據(jù)[10]。
1.2.3 基于Excel 函數(shù)的隨機(jī)數(shù)據(jù)的抽取
為保證數(shù)據(jù)分組的隨機(jī)性,需要對(duì)數(shù)據(jù)序號(hào)進(jìn)行隨機(jī)不重復(fù)的抽取,生成簡(jiǎn)單的隨機(jī)數(shù)很簡(jiǎn)單,比如Excel 中的RANDBETWEEN 函數(shù),但是這個(gè)函數(shù)生成的隨機(jī)數(shù)往往有很多重復(fù)的數(shù)據(jù),對(duì)于實(shí)際的數(shù)據(jù)分析帶來(lái)不便。
為解決上述問(wèn)題,提出如圖1 的基于Excel 函數(shù)的抽取流程。
圖1 基于Excel 函數(shù)的隨機(jī)數(shù)據(jù)的抽取Fig.1 Random data extraction based on Excel function
1.2.4 主成分分析法
主成分分析是利用降維的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)。通常把轉(zhuǎn)化成生成的綜合指標(biāo)稱(chēng)為主成分,其中每個(gè)主成分都是原始變量的線(xiàn)性組合,且各個(gè)主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能[11]。
通過(guò)SPSS 中“分析→降維→因子分析”來(lái)實(shí)現(xiàn)操作。
1.2.5 分類(lèi)判別法
判別分析是用于判別樣品所屬類(lèi)型的一種方法,它從已知的分類(lèi)情況中總結(jié)規(guī)律,并用以判斷新樣品所屬類(lèi)別。在分析之前就已知道我們研究的數(shù)據(jù)共分為幾個(gè)類(lèi)別,進(jìn)行判別分析的目的就是從現(xiàn)有已知類(lèi)別的樣本數(shù)據(jù)中訓(xùn)練出一個(gè)判別函數(shù)來(lái),以后再有未知類(lèi)別的數(shù)據(jù)進(jìn)入,就利用建立的函數(shù)來(lái)判別其類(lèi)別[12]。
通過(guò)SPSS 中“分析→分類(lèi)→判別”來(lái)實(shí)現(xiàn)操作。
14 種天然毛皮的紅外光譜圖見(jiàn)圖2,由圖可直觀地看出:14 種天然毛皮紅外光譜圖的主要特征峰無(wú)顯著差異,僅僅只是特征峰強(qiáng)度略有差別。因此,不對(duì)光譜圖進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析,僅僅通過(guò)肉眼對(duì)比譜圖的差異來(lái)進(jìn)行貂毛皮的材質(zhì)鑒別,不具有實(shí)際意義。
圖2 14 種毛皮紅外光譜圖立體對(duì)比Fig.2 Stereoscopic comparison of infrared spectra of 14 kinds of fur
2.2.1 主成分分析
選取120 組波數(shù)范圍在800~2100 cm-1的紅外譜圖(貂毛皮60 組,非貂毛皮60 組),采用SPSS進(jìn)行主成分分析,提取主成分,計(jì)算各主成分得分。
基于主成分分析過(guò)程中取特征值大于1 的規(guī)則,提取前8 個(gè)主成分見(jiàn)表1。由表1 可以看出,經(jīng)過(guò)主成分分析后得出前8 個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到99.8%,說(shuō)明這些主成分已經(jīng)能夠代表原變量所包含的信息,成功的將原來(lái)的2696 個(gè)波數(shù)變量降維到了8 個(gè)新的主成分變量。
依據(jù)林海明[13]的論證,主成分得分與SPSS 直接輸出的未旋轉(zhuǎn)因子得分之間的關(guān)系可以用式(1)表達(dá):
其中:式中λi為主成分特征根,見(jiàn)表1,由SPSS直接給出。
表1 主成分及其累積貢獻(xiàn)率表Tab.1 Principal components and their cumulative contribution rates
2.2.2 鑒別模型的建立
基于1.2.3 的方法,從2.2.1 的120 組數(shù)據(jù)中,隨機(jī)抽取100 組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)(實(shí)際抽取結(jié)果為52 組貂毛皮數(shù)據(jù)、48 組非貂毛皮數(shù)據(jù)),余下20組(8 組貂毛皮數(shù)據(jù)和12 組非貂毛皮數(shù)據(jù))作為驗(yàn)證數(shù)據(jù)。以各組的前8 個(gè)主成分得分為自變量,以貂毛皮(賦值為1)和非貂毛皮(賦值為2)為分組變量,采用SPSS 進(jìn)行判別分析。
依據(jù)軟件輸出,貂毛皮和非貂毛皮之間的典型判別函數(shù)為式(2):
其中xn為第n個(gè)主成分得分。
將已知的100 個(gè)樣本的各主成分得分代入已建立的典型判別函數(shù)y2(x),計(jì)算結(jié)果即為判別得分。以樣本編號(hào)為橫軸,y2(x)為縱軸,得貂毛皮和非貂毛皮判別函數(shù)回代驗(yàn)證結(jié)果如圖3 所示。由圖可見(jiàn),通過(guò)典型判別函數(shù)可以很好地將貂毛皮和非貂毛皮進(jìn)行區(qū)分,貂毛皮的判別得分<0,而非貂毛皮判別得分>0,分類(lèi)效果非常直觀。但也存在誤分的個(gè)案,52 組貂毛皮中有2 組被誤分,48組非貂毛皮中有1 組被誤分,因此典型判別函數(shù)分類(lèi)正確率為97.0%。誤分類(lèi)發(fā)生的原因可能是由于紅外數(shù)據(jù)采集過(guò)程中毛皮部位差造成的。動(dòng)物毛皮作為天然產(chǎn)物,其同一張皮的頭部、肩部、腹部、臀部都有較大的差異,相似的動(dòng)物其局部相似度更高,容易混淆。
圖3 貂毛皮和非貂毛皮典型判別函數(shù)分類(lèi)結(jié)果Fig.3 Classification results of typical discriminant functions of mink and non-mink fur
使用典型判別函數(shù)不可以直接確定分類(lèi),需要把所有的數(shù)據(jù)都計(jì)算好之后,才可以確定類(lèi)別的分類(lèi)條件,但Bayes 判別函數(shù)可以直接確定分類(lèi)。利用Excel 將已知的100 個(gè)樣本分別代入已建立貂毛皮分類(lèi)函數(shù)y3(x)和非貂毛皮分類(lèi)函數(shù)y4(x),比較計(jì)算結(jié)果的數(shù)值大小,數(shù)值較大者即為分類(lèi)結(jié)果。利用Excel 的函數(shù)IF,進(jìn)行數(shù)值比較,如果y3(x)>y4(x),返回結(jié)果“1(貂毛皮)”,否則返回結(jié)果“2(非貂毛皮)”。計(jì)算結(jié)果見(jiàn)表2。
由表2 可以看出,通過(guò)分類(lèi)函數(shù)可以直接確定分類(lèi),其100 組樣本計(jì)算的分類(lèi)結(jié)果與典型判別函數(shù)是一致的且個(gè)案序號(hào)也相同(見(jiàn)表2:樣本編號(hào)41、45、59),分類(lèi)正確率同樣為97.0%。兩種方法互為驗(yàn)證。
表2 Bayes 分類(lèi)函數(shù)計(jì)算結(jié)果Tab.2 Calculation results of Bayes classification function
2.2.3 鑒別效果的驗(yàn)證
判別函數(shù)的鑒別效果常用的驗(yàn)證方法有以下4種:
(1)自身驗(yàn)證法:拿訓(xùn)練數(shù)據(jù)直接預(yù)測(cè)驗(yàn)證。存在的問(wèn)題:對(duì)訓(xùn)練樣本預(yù)測(cè)好不代表對(duì)新樣本預(yù)測(cè)好;上一節(jié)中,分類(lèi)正確率97.0%,即為自身驗(yàn)證;
(2)樣本二分法,一般劃分2/3 為訓(xùn)練集,1/3 為驗(yàn)證集。為了減少樣本的浪費(fèi),本文取5/6 為訓(xùn)練集(100 組數(shù)據(jù)),1/6 為驗(yàn)證集(20 組數(shù)據(jù));
(3)外部數(shù)據(jù)驗(yàn)證:收集新的數(shù)據(jù)來(lái)驗(yàn)證,這是最客觀最有效的。存在的問(wèn)題:過(guò)程麻煩而且兩次收集的數(shù)據(jù)不一定是同質(zhì)的,故本文未采用;
(4)交叉驗(yàn)證——刀切法(10 分法,數(shù)據(jù)劃分為10 個(gè)集合,每次挑選1 個(gè)出來(lái)做驗(yàn)證集,其余9 個(gè)做訓(xùn)練集,可以做10 次,因?yàn)轵?yàn)證集可換10 種可能)。SPSS 軟件自帶此驗(yàn)證功能,通過(guò)“留一分類(lèi)”獲得此項(xiàng)結(jié)論。
根據(jù)以上描述,在自身驗(yàn)證法的基礎(chǔ)上,再通過(guò)樣本二分法及交叉驗(yàn)證對(duì)判別函數(shù)分類(lèi)效果進(jìn)行驗(yàn)證。將20 組驗(yàn)證數(shù)據(jù)(樣本編號(hào)101~120)和100 組訓(xùn)練數(shù)據(jù)放在一起,不預(yù)設(shè)分類(lèi),進(jìn)行預(yù)測(cè),同時(shí)勾選“留一分類(lèi)”進(jìn)行交叉驗(yàn)證。結(jié)果見(jiàn)表3 和表4。
表3 軟件輸出的20 組驗(yàn)證數(shù)據(jù)判別結(jié)果Tab.3 Discrimination results of 20 groups of verification data
由表3 可見(jiàn),20 組驗(yàn)證數(shù)據(jù),判別得分符合上節(jié)所述的“貂毛皮的判別得分<0,而非貂毛皮判別得分>0”,預(yù)測(cè)結(jié)果為:貂毛皮8 組、非貂毛皮12 組,鑒別正確率100%。由表4 可見(jiàn),全部100 組訓(xùn)練數(shù)據(jù),自身驗(yàn)證分類(lèi)正確率97.0%,與上節(jié)判別函數(shù)結(jié)果一致,交叉驗(yàn)證分類(lèi)正確率95.0%。綜上,鑒別模型用于貂毛皮真假鑒別效果良好。
表4 軟件輸出的120 組數(shù)據(jù)分類(lèi)結(jié)果(含交叉驗(yàn)證結(jié)果)Tab.4 Classification results of 120 groups of data (including cross validation results)
天然毛皮紅外光譜圖的主要特征峰無(wú)顯著差異,僅僅只是特征峰強(qiáng)度略有差別。因此,不對(duì)光譜圖進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析,僅僅通過(guò)肉眼對(duì)比譜圖的差異來(lái)進(jìn)行貂毛皮的材質(zhì)鑒別,不具有實(shí)際意義。文章基于紅外光譜,聯(lián)合主成分分析、分類(lèi)判別等SPSS 軟件方法進(jìn)行貂毛皮和易混非貂毛皮的材質(zhì)鑒定,成功建立了貂毛皮和非貂毛皮材質(zhì)鑒別模型。結(jié)果表明:主成分分析方法可以從大量光譜信息中提取有用的信息,成功地將原2696 個(gè)波數(shù)變量降維到8 個(gè)新的主成分變量,從而更容易抓住主要矛盾,揭示事物內(nèi)部變量之間的規(guī)律性,使問(wèn)題得到簡(jiǎn)化,提高分析效率;分類(lèi)判別分析方法得出了貂毛皮與非貂毛皮的典型判別函數(shù)y2(x)、貂毛皮分類(lèi)函數(shù)y3(x)和非貂毛皮分類(lèi)函數(shù)y4(x),所建立的典型判別函數(shù)、Bayes 分類(lèi)函數(shù)自身驗(yàn)證分類(lèi)正確率為97.0%、交叉驗(yàn)證分類(lèi)正確率95.0%,20 組驗(yàn)證數(shù)據(jù)分類(lèi)正確率為100%。紅外光譜聯(lián)合主成分分析用于貂毛皮真假鑒別效果良好。