周貫旭,萬婕,姜紅,周飛翔,倪婷婷,黃凱
基于隨機(jī)森林利用差分拉曼光譜對塑料食品包裝瓶的分類研究
周貫旭1,萬婕2,姜紅3,4*,周飛翔1,倪婷婷5,黃凱5
(1.中國人民公安大學(xué) 偵查學(xué)院,北京 100038;2.廣西警察學(xué)院,南寧 530000;3.萬子健檢測技術(shù)(北京)有限公司司法鑒定中心,北京 100141;4.食品藥品安全防范山西省重點(diǎn)實(shí)驗(yàn)室,太原 030006;5.南京簡智儀器設(shè)備有限公司,南京 210049)
建立一種快速無損的檢驗(yàn)塑料食品包裝瓶的分析方法,提供一種快速分類模型。利用差分拉曼光譜對100個塑料食品包裝瓶樣品進(jìn)行檢驗(yàn),根據(jù)樣品的差分拉曼特征峰可以對樣品進(jìn)行分類,樣品可被分成聚對苯二甲酸乙二醇酯和聚丙烯兩大類,對其中數(shù)目較多的第I類繼續(xù)根據(jù)樣品中所含填料的不同進(jìn)行分類。利用貝葉斯判別、多層感知器和隨機(jī)森林算法分別構(gòu)建分類模型對繼續(xù)分類結(jié)果進(jìn)行分析驗(yàn)證。第I類樣本可繼續(xù)被分為4類,貝葉斯判別結(jié)合留一交叉驗(yàn)證法分類正確率為71.7%,多層感知器神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練集和測試集分類正確率分別為100%和86.2%,隨機(jī)森林分類模型的訓(xùn)練集和測試集分類正確率分別為100%和96.5%。通過比較發(fā)現(xiàn),差分拉曼光譜與隨機(jī)森林算法相結(jié)合可以對塑料食品包裝瓶實(shí)現(xiàn)有效的分類。該方法簡單快速,樣品用量少且無損樣品,可為塑料食品包裝品的物證鑒定提供科學(xué)依據(jù)。
差分拉曼光譜;塑料食品包裝瓶;人工神經(jīng)網(wǎng)絡(luò);隨機(jī)森林算法
塑料食品包裝瓶存在于生活的方方面面。在許多案發(fā)現(xiàn)場,常常能夠提取到塑料食品包裝瓶的物證,對該未知信息的物證及碎片進(jìn)行檢驗(yàn)分析,并對其進(jìn)行準(zhǔn)確快速分類,有助于判斷該物證來源以及主要運(yùn)輸途徑??蔀閭刹槠瓢柑峁┚€索,縮小偵查范圍[1]。
目前用于塑料物證檢驗(yàn)的方法主要有紅外光譜法、X射線熒光光譜法、掃描電鏡/能譜法、拉曼光譜法、差分拉曼光譜法等方法。陳壯等[2]利用X射線熒光光譜對塑料包裝材料進(jìn)行了檢驗(yàn)。胡利芬等[3]利用掃描電鏡/能譜儀對汽車中擋封條進(jìn)行檢驗(yàn),分析其發(fā)白原因。楊思節(jié)等[4]利用拉曼光譜對海水中微塑料進(jìn)行了檢驗(yàn)。李錦等[5]利用差分拉曼光譜法對藥品塑料包裝瓶進(jìn)行了檢驗(yàn)。蘇東斌等[6]利用紅外光譜法對包括食品飲料包裝瓶在內(nèi)的塑料包裝材料進(jìn)行了檢驗(yàn)。差分拉曼光譜是一項(xiàng)新興技術(shù),它可以克服熒光干擾,有效消除干擾峰,保留純凈的拉曼特征峰[7],目前在檢驗(yàn)紙質(zhì)材料、毒物毒品、食品安全、塑料材料等領(lǐng)域有一定研究。筆者[8]利用差分拉曼光譜對紙質(zhì)快遞文件袋進(jìn)行檢驗(yàn),實(shí)現(xiàn)了紙張類物證的分類。田陸川等[9]差分拉曼光譜法對7種芬太尼類新精神活性物質(zhì)進(jìn)行了檢驗(yàn),實(shí)現(xiàn)了分類的目的。孫家政等[10]利用差分拉曼光譜法結(jié)合K-means對牙膏進(jìn)行檢驗(yàn),實(shí)現(xiàn)了快速分類。姜紅等[11]利用差分拉曼光譜法結(jié)合聚類分析對食品塑料包裝盒進(jìn)行檢驗(yàn),對樣本進(jìn)一步實(shí)現(xiàn)區(qū)分。利用差分拉曼結(jié)合化學(xué)計(jì)量學(xué)對塑料食品包裝瓶的相關(guān)研究尚未見報(bào)道。本實(shí)驗(yàn)采用便攜式差分拉曼光譜儀對收集到100個不同品牌的塑料食品包裝瓶樣品進(jìn)行檢驗(yàn),依據(jù)樣品的差分拉曼特征峰對其進(jìn)行分類,借助貝葉斯判別模型、多層感知器神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)森林模型對上述分類結(jié)果進(jìn)行驗(yàn)證,進(jìn)而優(yōu)選出最適合此類樣品的分類方法。
SEDRS Portable-BASE型便攜式差分拉曼光譜儀(南京簡智儀器設(shè)備有限公司);光源波長為785 nm;激光功率250 mW,積分時間3 s,測試波數(shù)范圍為250~2 800 cm?1。
來自不同品牌的塑料食品包裝瓶100個(樣品表略)。
分別剪取約0.5 cm×0.5 cm大小的樣品,用75%酒精棉進(jìn)行擦拭,待樣品晾干后,利用差分拉曼光譜儀在上述實(shí)驗(yàn)條件下,對實(shí)驗(yàn)樣品進(jìn)行測試。
重現(xiàn)性實(shí)驗(yàn):隨機(jī)選取10#樣品,對其同一部位進(jìn)行5次平行實(shí)驗(yàn);并對其左上、左下、右上、右下、中心5個部位進(jìn)行測試,并對2次實(shí)驗(yàn)分別計(jì)算相對標(biāo)準(zhǔn)偏差(Relative Standard Deviation,RSD)。
為驗(yàn)證儀器的精密度和樣品的均勻性,確保實(shí)驗(yàn)結(jié)果準(zhǔn)確可靠,對樣品進(jìn)行了重現(xiàn)性實(shí)驗(yàn)。10#樣品同一部位的RSD結(jié)果如表1所示,不同部位的RSD結(jié)果如表2所示。在10#樣品同一位置以及不同位置處的實(shí)驗(yàn)結(jié)果顯示相對標(biāo)準(zhǔn)偏差均低于10%,說明儀器具有較好的精密度,樣品的均勻性較好。因此,利用該實(shí)驗(yàn)方法對塑料食品包裝瓶進(jìn)行檢驗(yàn)結(jié)果準(zhǔn)確可靠。
表1 同一位置的RSD結(jié)果
Tab.1 RSD results at the same location
表2 不同位置的RSD結(jié)果
Tab.2 RSD results at different locations
將樣品的差分拉曼譜圖與已知塑料成分的拉曼譜圖進(jìn)行比較,通過查閱相關(guān)文獻(xiàn)可得,626、858、999、1 091、1 285、1 614、1 727 cm?1處特征峰可作為識別PET類塑料的拉曼特征峰,其中在1 727 cm?1對應(yīng)C=O的伸縮振動,在1614 cm?1對應(yīng)苯環(huán)的C?C的伸縮振動,在1 285 cm?1對應(yīng)CH2的彎曲振動,1 091 cm?1處的振動峰由苯環(huán)與?COOH間相連的3個碳原子間伸縮振動引起,在999 cm?1處對應(yīng)苯環(huán)的三角形環(huán)呼吸振動,在858 cm?1為1,4?二取代苯環(huán)的定位峰,在626 cm?1處的振動峰由苯環(huán)內(nèi)C?C對稱彎曲振動引起。399、529、810、842、973、1 147、1 330、1 459 cm?1處的特征峰可作為識別PP類塑料的拉曼特征峰,其中在1 459、1 330 cm?1處對應(yīng)CH2的彎曲振動,在1 147、973、810 cm?1處對應(yīng)C—C的伸縮振動,在842 cm?1處對應(yīng)CH3的彎曲振動,806 cm?1處和836 cm?1處的振動峰均由C—H間搖擺振動引起,836 cm?1處的振動峰由C—C非對稱伸縮振動引起[12?14]。通過比對拉曼位移,可將樣品初步分為兩大類,除3#樣品為聚丙烯(PP)類塑料外,其余都是聚對苯二甲酸乙二醇酯(PET)類塑料,將PET類劃分為第I大類,將PP類塑料劃分為第Ⅱ大類。
在生產(chǎn)過程中,生產(chǎn)廠家為滿足不同塑料的性能要求常常會添加不同的填料。常見的填料主要有如纖維素、滑石粉、硫酸鋇、碳酸鈣等。456、996、1 094、1 118、1 294、1 338、1 409 cm?1處特征峰,可作為識別纖維素的拉曼特征峰,464、790、1 048、1 096 cm?1處特征峰,可作為識別滑石粉的拉曼特征峰,461、619、988、1 138 cm?1處特征峰可作為識別硫酸鋇的拉曼特征峰,其281、710、1 085 cm?1可作為識別碳酸鈣的拉曼特征峰[15]。根據(jù)第I大類塑料內(nèi)的填料區(qū)別對其繼續(xù)分類,可將其分成4類,第I大類的分類結(jié)果見表3。
第Ⅰ-1、Ⅰ-2、Ⅰ-3、Ⅰ-4、Ⅱ類樣品的差分拉曼光譜圖見圖1。
第I大類樣品是PET類塑料。第I-2類中主要填料是碳酸鈣,?CO3在696 cm?1處會發(fā)生面內(nèi)彎曲,產(chǎn)生特征峰。在280、695、725 cm?1處特征峰與碳酸鈣在280、696、710 cm?1處特征峰相對應(yīng)。第I-3類中主要填料是滑石粉,其在788 cm?1處特征峰與滑石粉在790 cm?1處特征峰相對應(yīng)。第I-4類中主要填料是硫酸鋇,其在270 cm?1處的特征峰與硫酸鋇在277 cm?1處特征峰相對應(yīng)。Ⅱ類樣品是PP類塑料。
樣品在不同的拉曼位移處的峰強(qiáng)度差別較大,當(dāng)在做數(shù)據(jù)分析時,這些峰強(qiáng)度之間的差異會在整個分析過程使計(jì)算權(quán)重發(fā)生變化,進(jìn)而制造很多麻煩,故在數(shù)據(jù)分析前通過python中的sklearn.preprocessing函數(shù)對差分拉曼數(shù)據(jù)進(jìn)行z-score標(biāo)準(zhǔn)化,進(jìn)而保證數(shù)據(jù)之間具有可比性[16]。
鑒于人工進(jìn)行分類可能會存在誤差的情況,利用貝葉斯判別分析對分類結(jié)果進(jìn)行驗(yàn)證,以經(jīng)過z-score標(biāo)準(zhǔn)化后的變量為研究對象,建立貝葉斯判別函數(shù)[17]。判別函數(shù)的摘要統(tǒng)計(jì)見表4。
貝葉斯判別分析模型提取了3個判別函數(shù)[18],對模型的3個判別函數(shù)建繪制聯(lián)合分布散點(diǎn)圖(見圖2)。
表3 第I大類樣品分類結(jié)果
圖1 5類樣品的差分拉曼光譜圖
表4 判別函數(shù)的摘要統(tǒng)計(jì)
Tab.4 Summary statistics of discriminant function
由圖2可知,通過人工區(qū)分的第I-1~I(xiàn)-4類,在散點(diǎn)圖上相對分離,其中第I-3類和第I-4類的分類效果尤其顯著,其他2組組分離效果較好,可以證明人工分類具有一定的準(zhǔn)確性和科學(xué)性。通過貝葉斯判別模型的留一交叉驗(yàn)證法對分類結(jié)果進(jìn)行預(yù)測(見表5)。貝葉斯判別對原始已分組的分類正確率為95.9%,但通過留一交叉驗(yàn)證法對其進(jìn)行驗(yàn)證的正確率為71.7%,正確率突然下降,分析其原因可能是由于貝葉斯判別沒有劃分訓(xùn)練集與驗(yàn)證集而導(dǎo)致其在分類過程中造成過擬合現(xiàn)象。
人工神經(jīng)網(wǎng)絡(luò)是一種監(jiān)督學(xué)習(xí)算法的模型,其與貝葉斯判別不同之處便是對樣品劃分訓(xùn)練集與測試集,可以有效避免過擬合的現(xiàn)象,故通過建立多層感知器(Multilayer Perceptron,MLP)神經(jīng)網(wǎng)絡(luò)對第I大類的分類結(jié)果進(jìn)行檢驗(yàn)分析,同時建立對于未知樣本的分類模型。
以99個樣本的差分拉曼光譜數(shù)據(jù)為基礎(chǔ),對經(jīng)過預(yù)處理后的數(shù)據(jù)建MLP分類模型,將樣本按照70%和30%的比例劃分為訓(xùn)練集和測試集,即70個樣品作為訓(xùn)練集,29個樣本作為測試集[5]。在MLP模型對該類樣品的測試中,將每個樣品的波長作為輸入層神經(jīng)元,隱藏層層數(shù)設(shè)定為1層,其中隱藏層中包含3個神經(jīng)元,選擇雙曲正切函數(shù)為輸入函數(shù),令Softmax函數(shù)作為輸出層激活函數(shù)。MLP模型分類結(jié)果見表6,其中訓(xùn)練集的正確率為100%,測試集的正確率為86.2%,其總體正確率95.9%。
表5 貝葉斯判別模型分類結(jié)果
Tab.5 Classification results of Bayesian discriminant model
注:第1個數(shù)據(jù)表示預(yù)測值為I-1的數(shù)量占原始標(biāo)簽就為I-1數(shù)量的百分比,其他數(shù)據(jù)以此類推。
表6 MLP模型分類結(jié)果
Tab.6 Classification results of MLP model
注:第1個數(shù)據(jù)表示預(yù)測值為I-1的數(shù)量占原始標(biāo)簽就為I-1數(shù)量的百分比,其他數(shù)據(jù)以此類推。
隨機(jī)森林(Random Forest,RF)模型是一種基于自主重采樣技術(shù)的非線性數(shù)據(jù)處理技術(shù)算法,利用Bagging方法構(gòu)建回歸樹分類器。RF模型會在原始數(shù)據(jù)中隨機(jī)選擇部分變量,構(gòu)成若干個不同的回歸樹分類器,通過對每組數(shù)據(jù)建立決策樹模型,所有的決策樹組合成隨機(jī)森林模型,根據(jù)這些個不同的分類器模型的平均值確定最終的結(jié)果[19]。本文將42個樣本按照7∶3的比例劃分訓(xùn)練集和測試集,即70個樣本作為訓(xùn)練集,29個樣本作為測試集,建立RF分類模型,其中trees為最大決策樹數(shù)量,本文設(shè)置為200;p_train和t_train分別為99個高光譜樣本數(shù)據(jù)和該樣本所屬的類別;通過袋外數(shù)據(jù)(Out of Bag,OOB)對RF分類模型的誤差率進(jìn)行評價[20];minleaf是模型中的最小葉子數(shù),本文設(shè)置為1。分類結(jié)果見圖3,其中圖3a為訓(xùn)練集分類結(jié)果,圖3b為測試集分類結(jié)果。
圖3 隨機(jī)森林分類模型的樣本分類結(jié)果
從分類結(jié)果圖中可以看出,樣本在訓(xùn)練集中的分類準(zhǔn)確率是100%,70個樣本在訓(xùn)練集中得到了較好的分類,在測試集中,樣本的分類準(zhǔn)確率只有96.5%,只有第Ⅱ類中的一個樣本被誤判為第I類。通過RF誤差曲線(見圖4)可以看出,當(dāng)模型中決策樹數(shù)量較少時,模型整體的誤差率偏高,隨著決策樹的數(shù)量增加,模型的誤差率趨于平穩(wěn),處于0.09以下,表明該模型的誤差率偏低,模型泛化能力較強(qiáng)。MLP神經(jīng)網(wǎng)絡(luò)屬于數(shù)據(jù)饑餓性方法,當(dāng)數(shù)據(jù)量較小時容易存在類別不均衡的現(xiàn)象,容易導(dǎo)致模型的分類效果較差,而隨機(jī)森林模型屬于bagging類型,通過組合多個弱分類器來提高模型的準(zhǔn)確度和泛化能力。
圖4 隨機(jī)森林模型的誤差率曲線
通過差分拉曼光譜法對食品塑料包裝瓶進(jìn)行檢驗(yàn)分析,依據(jù)主要塑料成分不同,可將原樣品數(shù)據(jù)分為PET類和PP類,對PET類塑料進(jìn)行填料分析,可以將第I類(PET類)繼續(xù)分為4類。利用貝葉斯判別模型、MLP神經(jīng)網(wǎng)絡(luò)分類型和RF分類模型對分類結(jié)果分別進(jìn)行檢驗(yàn),其正確率為71.7%、87.1%和95.6%。隨機(jī)森林模型具有更高的準(zhǔn)確率,可以通過建立RF模型對未知樣品進(jìn)行檢驗(yàn)。在未來的研究工作中,將結(jié)合X射線熒光對塑料食品包裝瓶進(jìn)行更進(jìn)一步的分組,以至于達(dá)到區(qū)分每個樣品的目標(biāo)。該方法簡單快速,可以對塑料食品包裝瓶樣品進(jìn)行快速無損的檢測,為公安機(jī)關(guān)實(shí)際辦案提供幫助。
[1] 楊夢恩, 姜紅, 陳琿, 等. 差分拉曼光譜和統(tǒng)計(jì)學(xué)方法在食品包裝紙分類中的應(yīng)用[J]. 理化檢驗(yàn)-化學(xué)分冊, 2022, 58(11): 1303-1308.
YANG M E, JIANG H, CHEN H, et al. Application of Differential Raman Spectroscopy and Statistical Methods in Food Packaging Paper Classification[J]. Physical Testing and Chemical Analysis (Part B: Chemical Analysis), 2022, 58(11): 1303-1308.
[2] 陳壯, 姜紅, 羅鴻斌, 等. X射線熒光光譜法結(jié)合HCA-PCA-BPNN實(shí)現(xiàn)塑料快遞包裝袋識別分類[J]. 塑料工業(yè), 2022, 50(11): 138-144.
CHEN Z, JIANG H, LUO H B, et al. Identification and Classification of Plastic Express Bags by X-Ray Fluorescence Spectrometry Combined with HCA-PCA- BPNN[J]. China Plastics Industry, 2022, 50(11): 138-144.
[3] 胡利芬, 徐曉強(qiáng). 汽車擋風(fēng)條發(fā)白原因分析[J]. 塑料工業(yè), 2021, 49(7): 104-107.
HU L F, XU X Q. Reasons on the Whitening of the Wind Strip[J]. China Plastics Industry, 2021, 49(7): 104-107.
[4] 楊思節(jié), 馮巍巍, 蔡宗岐, 等. 基于拉曼光譜技術(shù)的海水微塑料快速識別技術(shù)研究[J]. 光譜學(xué)與光譜分析, 2021, 41(8): 2469-2473.
YANG S J, FENG W W, CAI Z Q, et al. Study on Rapid Recognition of Marine Microplastics Based on Raman Spectroscopy[J]. Spectroscopy and Spectral Analysis, 2021, 41(8): 2469-2473.
[5] 李錦, 姜紅, 楊俊, 等. 差分拉曼光譜結(jié)合人工神經(jīng)網(wǎng)絡(luò)對藥品塑料包裝瓶的分類研究[J]. 塑料工業(yè), 2022, 50(8): 101-107.
LI J, JIANG H, YANG J, et al. Classification of Plastic Pharmaceutical Packaging Bottles Based on Differential Raman Spectroscopy and ANN[J]. China Plastics Industry, 2022, 50(8): 101-107.
[6] 蘇東斌, 李開開, 高飛龍, 等. 紅外光譜結(jié)合化學(xué)計(jì)量學(xué)對塑料包裝材料的檢驗(yàn)[J]. 上海塑料, 2022, 50(4): 49-56.
SU D B, LI K K, GAO F L, et al. Inspection of Plastic Packaging Materials by Infrared Spectroscopy Combined with Chemometrics[J]. Shanghai Plastics, 2022, 50(4): 49-56.
[7] 付鈞澤, 姜紅, 劉峰, 等. 差分拉曼光譜結(jié)合系統(tǒng)聚類檢驗(yàn)香煙水松紙[J]. 化學(xué)研究與應(yīng)用, 2020, 32(11): 1973-1978.
FU J Z, JIANG H, LIU F, et al. Discrimination of Cigarette Tipping Paper by Differential Raman Spectroscopy Combined with System Clustering[J]. Chemical Research and Application, 2020, 32(11): 1973-1978.
[8] 周貫旭, 姜紅, 胡曉光, 等. 基于差分拉曼光譜法和化學(xué)計(jì)量學(xué)的紙質(zhì)快遞文件袋的分類研究[J/OL]. 理化檢驗(yàn)-化學(xué)分冊: 1-5[2023-09-23]. http://kns.cnki.net/ kcms/detail/31.1337.TB.20230828.1624.002.html.
ZHOU G X, JIANG H, HU X G, et al. Study on Classification of Paper Express Document Bags Based on Differential Raman Spectroscopy Combined with Chemometrics[J/OL]. Physical Testing and Chemical Analysis(Part B: Chemical Analysis): 1-5[2023-09-23]. http://kns.cnki.net/kcms/detail/31.1337.TB.20230828.1624.002.html.
[9] 田陸川, 姜紅, 楊俊, 等. 差分拉曼光譜檢驗(yàn)7種芬太尼類新精神活性物質(zhì)的研究[J/OL].中國測試: 1-11[2023-09-23]. http://kns.cnki.net/kcms/detail/51.1714. tb.20220831.1702.002.html.
TIAN L C, JIANG H, YANG J, et al. Detection of Seven New Psychoactive Substances of Fentanyl by Differential Raman Spectroscopy[J/OL]. China Measurement & Test: 1-11[2023-09-23]. http://kns.cnki.net/kcms/detail/ 51.1714.tb.20220831.1702.002.html.
[10] 孫家政, 姜紅, 劉新磊, 等. 差分拉曼光譜技術(shù)結(jié)合K-means聚類法對牙膏的快速分類[J]. 理化檢驗(yàn)-化學(xué)分冊, 2022, 58(1): 84-89.
SUN J Z, JIANG H, LIU X L, et al. Rapid Classification of Toothpaste by Differential Raman Spectroscopy Combined with K-Means Clustering Method[J]. Physical Testing and Chemical Analysis (Part B: Chemical Analysis), 2022, 58(1): 84-89.
[11] 姜紅, 田陸川, 王藝霖, 等. 差分拉曼光譜法結(jié)合聚類分析檢驗(yàn)食品塑料包裝盒[J]. 包裝工程, 2021, 42(15): 85-93.
JIANG H, TIAN L C, WANG Y L, et al. Differential Raman Spectroscopy Combined with Cluster Analysis for Inspection of Food Plastic Packaging Box[J]. Packaging Engineering, 2021, 42(15): 85-93.
[12] 陳麗萍, 唐宇璇, 姜紅, 等. 差分拉曼光譜對眼藥水塑料瓶的分類研究[J]. 包裝工程, 2023, 44(5): 196-202.
CHEN L P, TANG Y X, JIANG H, et al. Classification of Plastic Bottles of Eye Drops by Differential Raman Spectroscopy[J]. Packaging Engineering, 2023, 44(5): 196-202.
[13] 董鹍, 饒之帆, 楊曉云, 等. 幾種塑料的拉曼光譜檢測[J]. 塑料工業(yè), 2011, 39(6): 67-70.
DONG K, RAO Z F, YANG X Y, et al. Determination of Several Plastic by Raman Spectroscopy[J]. China Plastics Industry, 2011, 39(6): 67-70.
[14] 張愚若, 姜紅, 劉奎江, 等. 食品塑料包裝袋的拉曼光譜分析[J]. 上海塑料, 2020(1): 30-34.
ZHANG Y R, JIANG H, LIU K J, et al. Raman Spectroscopy Analysis of Food Plastic Packing Bags[J]. Shanghai Plastics, 2020(1): 30-34.
[15] 李錦, 姜紅, 思沐, 等. 手持式差分拉曼光譜對紙張物證的分類研究[J]. 化學(xué)研究與應(yīng)用, 2021, 33(10): 1883-1888.
LI J, JIANG H, SI M, et al. Research on Classification of Paper Evidence by Handheld Differential Raman Spectroscopy[J]. Chemical Research and Application, 2021, 33(10): 1883-1888.
[16] 陳壯, 姜紅, 郝丁成, 等. 基于K-means和簇內(nèi)誤差平方和的塑料快遞包裝袋X射線熒光光譜檢驗(yàn)[J]. 激光與光電子學(xué)進(jìn)展, 2022, 59(11): 1130001.
CHEN Z, JIANG H, HAO D C, et al. X-Ray Fluorescence Spectral Inspection of Plastic Express Packaging Bags Based on K-Means and Within-Cluster Sum of Squared Errors[J]. Laser & Optoelectronics Progress, 2022, 59(11): 1130001.
[17] ZHANG J, GAO P Y, WU Y, et al. Identification of Foodborne Pathogenic Bacteria Using Confocal Raman Microspectroscopy and Chemometrics[J]. Frontiers in Microbiology, 2022, 13: 874658.
[18] ZHANG J, JIANG H, DUAN B, et al. A Rapid and Nondestructive Approach for Forensic Identification of Cigarette Inner Liner Papers Using Shift-Excitation Raman Difference Spectroscopy and Chemometrics[J]. Journal of Forensic Sciences, 2021, 66(6): 2180-2189.
[19] 陳玥瑤, 夏靜靜, 韋蕓, 等. 近紅外光譜法無損檢測平谷產(chǎn)大桃品質(zhì)方法研究[J]. 分析化學(xué), 2023, 51(3): 454-462.
CHEN Y Y, XIA J J, WEI Y, et al. Research on Nondestructive Quality Test of Pinggu Peach by Near-Infrared Spectroscopy[J]. Chinese Journal of Analytical Chemistry, 2023, 51(3): 454-462.
[20] 姚銳, 惠萌, 李俊, 等. 基于隨機(jī)森林的局部放電特征提取和優(yōu)選研究[J]. 華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 48(4): 63-72.
YAO R, HUI M, LI J, et al. Feature Extraction and Optimal Selection Based on Random Forest for Partial Discharges[J]. Journal of North China Electric Power University (Natural Science Edition), 2021, 48(4): 63-72.
Classification of Plastic Food Packaging Bottles by Differential Raman Spectroscopy Based on Random Forest
ZHOU Guanxu1, WAN Jie2, JIANG Hong3,4*, ZHOU Feixiang1, NI Tingting5, HUANG Kai5
(1. College of Investigation, People's Public Security University of China, Beijing 100038, China; 2. Guangxi Police College, Nanning 530000, China; 3. Judicial Appraisal Center of Wanzijian Testing Technology Co., Ltd., Beijing 100141, China; 4. Shanxi Key Laboratory of Food and Drug Safety Prevention and Control, Taiyuan 030006, China; 5. Nanjing Jianzhi Instrument and Equipment Co., Ltd., Nanjing 210049, China)
The work aims to establish a fast and non-destructive analysis method for inspecting plastic food packaging bottles and provide a fast classification model. 100 plastic food packaging bottle samples were tested by differential Raman spectroscopy. The samples were classified based on their differential Raman characteristic peaks and divided into two categories of polyethylene terephthalate and polypropylene. The Class I samples in a larger number were further classified based on the different fillers contained. The classification model was constructed by Bayesian discriminant analysis, multi-layer perceptron, and random forest algorithm to analyze and verify the continued classification results.The Class I samples were further divided into four categories. The classification accuracy of Bayesian discriminant combined with left one cross validation method was 71.7%, the classification accuracy of the training and testing sets of the multi-layer perceptron neural network classification model was100% and 86.2%, respectively, and the classification accuracy of the random forest classification model0020was 100% and 96.5%. Through comparison, it was found that the combination of differential Raman spectroscopy and random forest algorithm could effectively classify plastic food packaging bottles.This method is simple and fast, requiring a small sample size but not damaging samples, which can provide scientific basis for the identification of physical evidence in plastic food packaging products.
differential Raman spectroscopy; plastic food packaging bottles; artificial neural network; random forest algorithm
TB484
A
1001-3563(2024)09-0164-07
10.19554/j.cnki.1001-3563.2024.09.021
2023-09-01
食品藥品安全防范山西省重點(diǎn)實(shí)驗(yàn)室開放課題資助(202204010931006);廣西警察學(xué)院校級科研重點(diǎn)項(xiàng)目(2021KYA05)