吳泳微,袁琨,*,王堅(jiān),張洋,王洋
基于塑料近紅外光譜的判別分類研究
吳泳微1,袁琨1,2*,王堅(jiān)2,張洋1,王洋1
(1. 中國計(jì)量大學(xué) 光學(xué)與電子科技學(xué)院,杭州 310018; 2. 彩譜科技(浙江)有限公司,浙江 臺州 318000)
為了回收可用于不同物品包裝的塑料,對不同塑料種類進(jìn)行識別分類。首先采集PP、PET、HDPE、TPE、PLA、PBT、TPU、POM-M90、PPO-GF20NC、TPB、PPS、ABS、PPO(natural)、SAN、POM-F20、PPO(white)16種塑料的近紅外光譜數(shù)據(jù),其次針對光譜數(shù)據(jù)采集時(shí)存在的噪聲問題,使用SG平滑濾波進(jìn)行了光譜數(shù)據(jù)預(yù)處理,之后利用主成分分析算法進(jìn)行光譜數(shù)據(jù)降維,減少待處理數(shù)據(jù)量,最后分別運(yùn)用無監(jiān)督聚類K-means算法和監(jiān)督聚類極大似然估計(jì)、Fisher判別式以及光譜角算法建立4類分類模型。K-means算法可以將PPO-GF20N、PLA和PPO(本色)與其他塑料粒子區(qū)分開,準(zhǔn)確率分別是100%、100%以及80%;Fisher判別式和極大似然估計(jì)法對POM-M90和POM-F20的識別準(zhǔn)確率為93%,其他塑料粒子識別準(zhǔn)確率均為100%;光譜角算法對PET的識別準(zhǔn)確率為80%,POM-F20的識別準(zhǔn)確率為47%,其余粒子的識別準(zhǔn)確率均大于90%。上述機(jī)器學(xué)習(xí)算法結(jié)合近紅外光譜成像技術(shù)建立分類模型可為常見塑料的鑒別研究提供參考。
塑料分類;近紅外;高光譜成像;主成分分析;聚類分析
塑料包裝在日常生活中被廣泛使用,回收包裝塑料再加工,制造新的再生塑料包裝,有助于減少環(huán)境污染、資源浪費(fèi)和能源消耗。近紅外光譜分析技術(shù)[1-2]可以按照光譜特征的差異,進(jìn)行定性判別和定量剖析[3-4],并以其特征性好、對樣品顏色不敏感、測樣速度快,可以對固體樣品直接進(jìn)行快速無損測量等特點(diǎn),故用于回收包裝塑料再加工之前的塑料分類工序[5-7]。
樣本為16種呈不同透明程度的乳白色塑料粒子,包括PP、PET、HDPE、TPE、PLA、PBT、TPU、POM-M90、PPO-GF20NC、TPB、PPS、ABS、PPO(natural)、SAN、PPO(white)、POM-F20。光譜儀選用近紅外成像光譜儀FS-25,采用8臺200 W鹵鎢燈作為光源,光譜范圍為900~1 700 nm,光譜分辨優(yōu)于10 nm,圖像分辨優(yōu)于320像素×256像素。
根據(jù)聚類算法的需求,采集了16種塑料粒子的混合高光譜圖像,其中一張圖中每種粒子有15粒,如圖1a所示;另一張圖每種粒子有5粒,如圖1b所示,共2張;不同種類塑料粒子單獨(dú)的高光譜圖像共16張,每一張圖中有5粒塑料粒子,如圖2所示。粒子不重復(fù)使用。
所有圖像測量完畢后,在18張近紅外高光譜圖像中,選擇一塊能夠代表樣本典型特征的感興趣區(qū)域(Region of Interest,ROI)內(nèi)的光譜數(shù)據(jù),即為選定區(qū)域內(nèi)所有像素點(diǎn)反射率數(shù)據(jù)的平均值,ROI區(qū)域的大小為5×5個(gè)像素點(diǎn)。
實(shí)驗(yàn)發(fā)現(xiàn),972.86 nm之前和1 678.49 nm之后的信號量較低,存在噪聲干擾,因此提取972.86~1 678.49 nm波段的光譜數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),共219個(gè)維度的高光譜數(shù)據(jù)。
圖1 16種塑料粒子混合的近紅外高光譜圖像
圖2 16種粒子單獨(dú)的近紅外高光譜圖像
在將樣本的光譜圖像數(shù)據(jù)用于聚類算法之前,使用SG濾波算法對所有近紅外高光譜圖像的光譜數(shù)據(jù)進(jìn)行預(yù)處理,濾波時(shí)窗口大小為5,采用3階多項(xiàng)式擬合。未進(jìn)行光譜預(yù)處理的16種塑料粒子中心點(diǎn)的光譜曲線如圖3a所示;使用SG平滑處理后,16種塑料粒子中心點(diǎn)的光譜曲線如圖3b所示。
由于所提取的光譜波段較多,而且含有大量的冗余信息,不利于下一步的數(shù)據(jù)分析,因此需要對采集到的光譜數(shù)據(jù)進(jìn)行主成分分析(Principal Component Analysis,PCA)[8-9]降維處理。表1展示了各個(gè)主成分的得分,其中列4表示的是主成分累計(jì)得分,通過列4可得前9個(gè)主成分,即可顯示原始圖像數(shù)據(jù)中99.9%的信息,從而認(rèn)定全光譜數(shù)據(jù)主成分分析的主成分?jǐn)?shù)為9個(gè)。在選取了主成分后,圖像數(shù)據(jù)維度從219個(gè)降到了9個(gè)。
表1 各主成分得分
Tab.1 Scores of each principal component
K-means算法需要在計(jì)算前預(yù)先告知樣本中的類別個(gè)數(shù)[10],其算法思想如圖4所示,根據(jù)給定的類別個(gè)數(shù)在數(shù)據(jù)中隨機(jī)設(shè)置初始聚類中心,之后計(jì)算每一個(gè)點(diǎn)與各個(gè)初始坐標(biāo)值之間的歐氏距離,并將其歸入與其最近的簇中心所在的分類中。在一次計(jì)算后,聚類中心的位置不在該類別所有樣本點(diǎn)的中心,針對該類別的所有樣本點(diǎn)重新計(jì)算一個(gè)聚類中心,并運(yùn)用迭代提升K-means聚類的準(zhǔn)確度。
將16種塑料粒子的2幅近紅外高光譜圖像,分別使用K-means算法進(jìn)行無監(jiān)督聚類。初始聚類中心設(shè)置為8個(gè),迭代次數(shù)設(shè)置為15次,可視化算法分析軟件顯示分類結(jié)果如圖5所示??芍獰o監(jiān)督聚類算法不能將16種塑料區(qū)分。按顏色分類,塑料粒子大致可以分為紫色、黑色和黃色3組。3組都包含多種塑料粒子,其余的塑料粒子無法區(qū)分。
圖4 K-means算法思想
圖5 第1次K-means聚類結(jié)果
分別對3組塑料粒子進(jìn)行采樣,再次應(yīng)用K-means算法進(jìn)行聚類,結(jié)果如圖6所示。PPO-GF20N、PLA和PPO(本色)可以被識別。
監(jiān)督聚類的思想是通過找出樣本中被標(biāo)記部分的規(guī)律,然后將剩余的樣本進(jìn)行分類。
極大似然估計(jì)是通過對已知的樣本數(shù)據(jù)進(jìn)行反演,從而得到最有可能得到該樣本數(shù)據(jù)的參數(shù)[11]。從直觀的角度來看,最大似然估計(jì)方法使用了訓(xùn)練集數(shù)據(jù)和分類標(biāo)記,計(jì)算每一個(gè)類別的最大似然判別函數(shù),將每個(gè)像素值帶入判別函數(shù)進(jìn)行計(jì)算,哪一個(gè)函數(shù)計(jì)算的結(jié)果最大,說明該數(shù)據(jù)(像素點(diǎn))屬于這個(gè)類別的概率最大。
Fisher判別式的基本思想是數(shù)據(jù)投影[12-14],它把組元數(shù)據(jù)投影到一定的方向上,目標(biāo)是讓在投影之后,不同種類之間的距離越大越好,同類之間的距離越小越好,利用方差對類間的距離進(jìn)行分析,得出判別函數(shù),從而對樣本進(jìn)行判別分類[15]。
光譜角分類的基本原則是,將每一個(gè)象元的光譜看成一個(gè)高維向量,用計(jì)算向量之間的cos值來對相似性進(jìn)行評估,cos值越接近1,2個(gè)光譜就越接近,屬于同一類型的可能性就越大,以此來辨別未知樣本[16]。
圖6 第2次K-means聚類分析
使用采集了16種塑料粒子各5粒的近紅外高光譜圖像作為監(jiān)督數(shù)據(jù),并使用ENVI軟件制作類別標(biāo)簽圖像,如圖7所示。另一張采集了16種塑料粒子各15粒的近紅外高光譜圖像作為未知粒子的圖像樣本,分別采用3種監(jiān)督聚類算法進(jìn)行分析,各類粒子的判別結(jié)果如圖8所示。
使用標(biāo)簽圖像對16張單個(gè)塑料粒子的圖像進(jìn)行監(jiān)督聚類,F(xiàn)isher判別式算法的分類結(jié)果如圖9所示。所有塑料粒子均能從背景中分離識別出來。
大部分塑料樣品在1 200、1 400和1 650 nm附近都有吸收峰,但不同塑料樣品在900~1 700 nm的光譜范圍上的吸收峰數(shù)量有所不同,如PP有2個(gè)吸收峰,POM-M90、HDPE、TPE、POM-F20、PP和PLA有3個(gè)吸收峰,其余塑料樣品有4個(gè)吸收峰。不同塑料樣品的特征波長也有所區(qū)別,因此在分類效果中都有良好的表現(xiàn)。
其中在光譜角算法下的POM-F20分類效果僅有47%,通過圖8的光譜角分類結(jié)果圖可見,一部分POM-F20與POM-M90混淆,POM-F20與POM-M90原材料都屬于聚甲醛,但是通過不同工藝和配方制成。由圖3可知,其光譜曲線非常相似,僅在特征波長上有略微差異,因此在混合分類中結(jié)果較差。
圖7 16種塑料粒子的標(biāo)簽圖像
圖8 3種監(jiān)督聚類算法的分類結(jié)果
圖9 16種塑料粒子單獨(dú)分類識別結(jié)果
統(tǒng)計(jì)結(jié)果如表2所示。通過表2中數(shù)據(jù)可知,無監(jiān)督聚類的K-means算法在無人為判別信息的前提下,通過2次重復(fù)聚類可以將PPO-GF20N、PLA和PPO(本色)與其他塑料粒子區(qū)分開,準(zhǔn)確率分別為100%、100%和80%。極大似然估計(jì)和Fisher判別式算法對14種塑料粒子的識別準(zhǔn)確率達(dá)到了100%,其中POM-M90和POM-F20的識別準(zhǔn)確率為93%。光譜角算法對12種塑料粒子的識別準(zhǔn)確率達(dá)到了100%,其中PPS和SAN的識別準(zhǔn)確率為93%,PET的識別準(zhǔn)確率為80%,對POM-F20的識別準(zhǔn)確率為47%。
表2 3種聚類算法的分類準(zhǔn)確率
Tab.2 Classification accuracy of 3 clustering algorithms %
本文基于近紅外光譜分析成像技術(shù),使用無監(jiān)督聚類和監(jiān)督聚類2種方法,對16種塑料顆粒進(jìn)行了分類和鑒別,并通過可視化算法分析軟件來顯示分類結(jié)果圖。K-means算法采用2個(gè)重復(fù)的聚類方法,可以從16種塑料中篩選出PPO-GF20N、PLA和PPO(natural)3種粒子。無監(jiān)督聚類算法的方式使用較為方便,但是無法對所選的16種塑料都進(jìn)行準(zhǔn)確的分類,在塑料種類上存在局限性。監(jiān)督聚類算法通過少量16種已知的塑料粒子的類別標(biāo)簽數(shù)據(jù)對應(yīng)的光譜信息,獲取了光譜特征和塑料種類之間的對應(yīng)關(guān)系,實(shí)現(xiàn)了對未知塑料粒子的分類識別。在混合塑料粒子的分類實(shí)驗(yàn)中,極大似然估計(jì)和Fisher判別式算法對14種塑料粒子的識別準(zhǔn)確率達(dá)到了100%,光譜角算法對12種塑料粒子的識別準(zhǔn)確率達(dá)到了100%。在單種塑料粒子的判斷實(shí)驗(yàn)中,F(xiàn)isher判別式可以將所有塑料粒子均能從背景中分離識別出來。本實(shí)驗(yàn)對推動(dòng)近紅外光譜技術(shù)在塑料回收分類應(yīng)用于塑料包裝領(lǐng)域起到了積極的作用。
[1] 葉靜. 應(yīng)用近紅外光譜分析技術(shù)檢測茶葉成分的研究[D]. 鎮(zhèn)江: 江蘇大學(xué), 2008.
YE J. Study on Detection of Tea Components by near Infrared Spectroscopy[D]. Zhenjiang: Jiangsu University, 2008.
[2] 褚小立. 化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù)[M]. 北京: 化學(xué)工業(yè)出版社, 2011: 259-261.
CHU X L. Molecular Spectroscopy Analytical Technology Combined with Chemometrics and Its Applications[M]. Beijing: Chemical Industry Press, 2011: 259-261.
[3] 杜婧. 基于NIR技術(shù)的PET/PVC廢舊塑料分離系統(tǒng)設(shè)計(jì)[D]. 杭州: 浙江大學(xué), 2011.
DU J. Design of PET/PVC Waste Plastic Separation System Based on NIR Technology[D]. Hangzhou: Zhejiang University, 2011.
[4] 張毅民, 王鵬, 白家瑞, 等. 基于近紅外光譜建立PE、PP和PET的識別分類模型[J]. 現(xiàn)代化工, 2016, 36(3): 182-186.
ZHANG Y M, WANG P, BAI J R, et al. Establishment of Identification and Classification Model of PE, PP and PET Based on near Infrared Spectroscopy[J]. Modern Chemical Industry, 2016, 36(3): 182-186.
[5] 尹鳳福, 閆磊, 韓清新, 等. 近紅外光譜(NIR)分選技術(shù)在塑料分選領(lǐng)域的應(yīng)用[J]. 環(huán)境工程, 2017, 35(12): 134-138.
YIN F F, YAN L, HAN Q X, et al. Review on Application of near Infrared Spectroscopy Technology (Nir) in Plastic Sorting[J]. Environmental Engineering, 2017, 35(12): 134-138.
[6] 趙清華. 基于主成分分析報(bào)廢車用塑料近紅外識別技術(shù)研究[D]. 上海: 上海交通大學(xué), 2014.
ZHAO Q H. Research on Near-Infrared Identification Technology of Plastics Used in Scrap Cars Based on Principal Component Analysis[D]. Shanghai: Shanghai Jiao Tong University, 2014.
[7] 張文杰, 焦安然, 田靜, 等. 卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)算法在塑料近紅外光譜分類中的模型應(yīng)用[J]. 分析測試學(xué)報(bào), 2021, 40(7): 1062-1067.
ZHANG W J, JIAO A R, TIAN J, et al. Convolutional Neural Network and Support Vector Machine Models for Plastic Classification by Near-Infrared Spectroscopy[J]. Journal of Instrumental Analysis, 2021, 40(7): 1062-1067.
[8] JIN J, TANG L, HRUSKA Z, et al. Classification of Toxigenic and Atoxi-Genic Strains of Aspergillus Flavus with Hyperspectral Imaging[J]. Computers and Electronics in Agriculture, 2009, 69(2): 158-164.
[9] CONDE O, AMADO M, GARCIA-ALLENDE P, et al. Evaluation of PCA Dimensionality Reduction Techniques in Imaging Spectroscopy for For-Eign Object Detection Algorithms and Technologies for Multispectral[C]// Defense and Security Symposium. Orlando, Florida, 2007: 6565.
[10] BARNALI B, SWARNAJYOTI P. Variable Precision Rough Set Based Unsupervised Band Selection Technique for Hyperspectral Image Classification[J]. Journal of Robotics & Machine Learning, 2020, 10(5): 414-416.
[11] 張愉, 何和平, 田葉. 基于同倫分析法的威布爾分布極大似然估計(jì)[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識, 2022, 52(11): 150-158.
ZHANG Y, HE H P, TIAN Y. Maximum Likelihood Estimation of Weibull Distribution Based on Homotopy Analysis Method[J]. Journal of Mathematics in Practice and Theory, 2022, 52(11): 150-158.
[12] 王瀟, 徐秋月, 黃本林, 等. Logistic回歸和Fisher判別分析模型在冠心病鑒別診斷中的臨床價(jià)值[J]. 臨床檢驗(yàn)雜志, 2022, 40(9): 662-666.
WANG X, XU Q Y, HUANG B L, et al. Differential Diagnosis of Coronary Heart Disease by Logistic Regression and Fisher Discriminant Analysis Model[J]. Chinese Journal of Clinical Laboratory Science, 2022, 40(9): 662-666.
[13] ALEXANDRAVERONICA L, MELINDA S, NORBERTBOTOND M, et al. Fault Type Diagnosis of the WWTP Dissolved Oxygen Sensor Based on Fisher Discriminant Analysis and Assessment of Associated Environmental and Economic Impact[J]. Applied Sciences, 2023, 13(4): 45-46.
[14] SHISIR M, HASAN M T, MOTIUR M R. Robust Despeckling: Robust Speckle Noise Reduction Method Using Multi-Scale and Kernel Fisher Discriminant Analysis[J]. Biomedical Engineering Advances, 2023, 5(1): 52-54.
[15] ASHWINI M. Potential Use of Sentinel-2 Data for Discrimination of Tectona Grandis L. Healthy and Non- Healthy Tree Species Using Spectral Angle Mapper[J]. Environmental Sciences Proceedings, 2022,22(1): 120-123.
[16] 邱琳, 劉敏, 王磊. 基于多尺度光譜角制圖的遙感影像單木樹冠提取方法[J]. 安徽農(nóng)業(yè)科學(xué), 2022, 50(21): 119-125.
QIU L, LIU M, WANG L. Multi-Scale Spectral Angle Mapper Method for Individual Tree Crown Delineation from Remote Sensing Image[J]. Journal of Anhui Agricultural Sciences, 2022, 50(21): 119-125.
Discriminative Classification of Plastics Based on Near-infrared Spectra
WU Yongwei1, YUAN Kun1,2*, WANG Jian2, ZHANG Yang1, WANG Yang1
(1. College of Optical and Electronic Technology, China Jiliang University, Hangzhou 310018, China; 2. Caipu Technology (Zhejiang) Co., Ltd., Zhejiang Taizhou 318000, China)
The work aims to identify and classify different types of plastics, in order to recover plastics that can be used to pack different items. Firstly, the near-infrared spectral data of 16 kinds of plastics including PP, PET, HDPE, TPE, PLA, PBT, TPU, POM-M90, PPO-GF20NC, TPB, PPS, ABS, PPO (natural colour), SAN, POM-F20 and PPO (white colour) were collected. Then, for the problem of noise in spectral data collection, the spectral data were pre-processed by the SG smoothing filtering, followed by dimensionality reduction of the spectral data with the principal component analysis algorithm to reduce the amount of data to be processed, and finally the four-class classification model was established by the K-means algorithm for unsupervised clustering and the great likelihood estimation for supervised clustering, the Fisher discriminant, and the spectral angle algorithm, respectively. The K-means algorithm could distinguish PPO-GF20N, PLA and PPO (native colour) from other plastic particles with an accuracy of 100%, 100%, and 80%, respectively. Fisher's discriminant and great likelihood estimation had an accuracy of 93% for the recognition of POM-M90 and POM-F20, and 100% for the recognition of all other plastic particles. Spectral angle algorithm had a recognition accuracy of 80% for PET, 47% for POM-F20, and an accuracy greater than 90% for the rest of the particles. The above machine learning algorithm combined with near-infrared spectral imaging technology can be used to establish a classification model, providing a reference for the identification research of common plastics.
classification of plastics; NIR; hyperspectral imaging; PCA; cluster analysis
O433.4
A
1001-3563(2024)09-0171-07
10.19554/j.cnki.1001-3563.2024.09.022
2023-09-05
中國浙江省重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2020C03095);浙江省高校基礎(chǔ)研究運(yùn)行專項(xiàng)資金(2020YW22)