蘇子越 趙珍玉 孫克強(qiáng) 王京力 巫瑩柱
(1.五邑大學(xué),廣東江門,529000;2.中山海關(guān)技術(shù)中心,廣東中山,528400)
隨著我國紡織業(yè)的發(fā)展,紡織品的原料成分檢測越發(fā)受到重視[1-2]。傳統(tǒng)的檢測方法,包括顯微鏡法、燃燒法、著色法等,能夠準(zhǔn)確檢測面料成分,但過程復(fù)雜,人為因素影響大且污染環(huán)境,不利于綠色可持續(xù)發(fā)展[3]。近紅外光譜分析技術(shù)(NIRS)主要用于800 nm~2 500 nm范圍電磁波的無損測量[4]。不同于質(zhì)譜、色譜分析技術(shù),該技術(shù)無需提純,已廣泛應(yīng)用于食品、農(nóng)業(yè)、醫(yī)藥、煉油與化工等領(lǐng)域[5-10]。
近紅外光譜的定性分析是利用已知類別的樣品建立近紅外光譜鑒別模型,再考察未知樣品是否屬于該類物質(zhì)的一種方法,主要用于物質(zhì)的聚類分析和判別分析[11]。黃晶等采用近紅外光譜法實(shí)現(xiàn)對6種麻纖維的鑒別,但未有對現(xiàn)有常見服裝用纖維進(jìn)行鑒別時(shí)可參考的波長選擇、閾值設(shè)定的研究報(bào)道[12]。本課題組在之前的工作中主要進(jìn)行了近紅外光譜技術(shù)在紡織產(chǎn)品檢測中應(yīng)用的相關(guān)研究[13-16],對提高分析準(zhǔn)確性、原料組分快速鑒別、測定樣品均勻性等方面進(jìn)行了針對性研究,討論了影響分析結(jié)果的相關(guān)因素,如織物組織結(jié)構(gòu)對預(yù)測結(jié)果的影響[17-20]。同時(shí)進(jìn)行了多組分混紡織物定量模型建立與優(yōu)化[21-27],并制定了一項(xiàng)對纖維定量分析系列標(biāo)準(zhǔn)進(jìn)行補(bǔ)充的行業(yè)標(biāo)準(zhǔn)[28],尤其是開發(fā)了高精度的三組分混紡織物定量分析模型[29]。上述研究表明近紅外光譜技術(shù)適用于紡織纖維含量檢測,為紡織纖維定性鑒別提供了快速、無損、綠色檢測的可能性。近紅外光譜定性分析方法是依靠已知樣品和未知樣品譜圖的比較來完成的,相較于定量模型,定性模型檢測的是未知種類的樣品,是后續(xù)進(jìn)行定量檢測的必要前提。
本研究基于近紅外光譜法,采用主成分分析結(jié)合聚類分析的方法,對14類常見服用纖維進(jìn)行定性鑒別,建立了鑒別模型,正判率達(dá)到100%,可以更加高效、便捷、環(huán)保地鑒定待測樣品的類別。
分別收集絲類蛋白質(zhì)、毛類蛋白質(zhì)、棉、麻、再生纖維素每類50個(gè)代表性樣品,聚酯纖維、錦綸、腈綸、丙綸、乙綸、氨綸、氯綸、維綸、醋酯纖維每類20個(gè)代表性樣品。置于恒溫恒濕環(huán)境中備用。
將樣品裝入近紅外專用的低羥值樣品瓶中進(jìn)行光譜的采集,裝樣厚度不得低于1 cm,樣品裝填密實(shí)并保證裝樣的密實(shí)程度一致。用TANGO-R型傅里葉變換近紅外光譜儀預(yù)熱至穩(wěn)定狀態(tài)后,經(jīng)積分球漫反射方式掃描得到近紅外光譜,考慮到各類纖維成分的差異性大,每條光譜信號掃描32次。
在近紅外光譜分析中,光譜的定性分析即用樣品光譜與標(biāo)準(zhǔn)光譜進(jìn)行比較,以此判斷樣品種類。因此,所建標(biāo)準(zhǔn)光譜集要穩(wěn)定可靠。近紅外光譜儀所采集的光譜包含了其他無關(guān)信息和噪聲,在用化學(xué)計(jì)量學(xué)方法中的主成分分析法選取特征峰時(shí),為消除光譜采集過程中引入的噪聲,需要進(jìn)行適當(dāng)?shù)墓庾V處理[30]。常用的方法有平滑處理、基線校正、多元散射校正和標(biāo)準(zhǔn)正態(tài)變量校正等[31-32]。本項(xiàng)工作采用一階導(dǎo)數(shù)和矢量歸一化相結(jié)合的方法對光譜進(jìn)行預(yù)處理,如圖1所示??梢钥闯?,導(dǎo)數(shù)光譜可有效地消除干擾,分辨重疊峰,提高分辨率和靈敏度。
圖1 聚酯、再生纖維素和氨綸的近紅外光譜圖及一階導(dǎo)數(shù)圖
14類常見服用纖維的近紅外平均光譜圖如圖2所示。這些近紅外光譜特征明顯,峰的個(gè)數(shù)和曲線走勢相似,難以直觀鑒別分類。因此,需要通過合適的方法分析光譜數(shù)據(jù)。波長選擇可以簡化模型,同時(shí)也剔除不相關(guān)或非線性變量,從而得到預(yù)測能力強(qiáng)、穩(wěn)健性好的校正模型[33]。常用方法主要有相關(guān)系數(shù)法、逐步回歸算法、間隔偏最小二乘法(iPLS)、遺傳算法等。逐步回歸算法是逐個(gè)選入對輸出結(jié)果有顯著影響的變量,并在選入新變量后逐個(gè)檢驗(yàn)以剔除不顯著變量,反復(fù)選入、檢驗(yàn)、剔除直至無法剔除和選入為止[34]。但如果將光譜儀采集的上千個(gè)數(shù)據(jù)直接輸入,會(huì)產(chǎn)生“過擬合”的分析模型,使其預(yù)測適應(yīng)能力大大下降。本研究采用逐步回歸分析算法選取了4 100 cm-1~5 150 cm-1和5 500 cm-1~7 850 cm-1兩個(gè)波 段建立了矯正模型,如圖2所示。
圖2 用于建模的波段選擇光譜圖
歐氏距離標(biāo)準(zhǔn)法屬于有監(jiān)督模式識別方法,通過計(jì)算樣品光譜與各類標(biāo)準(zhǔn)光譜的歐氏距離判斷樣品的類別[35]。同類別兩個(gè)樣品的歐氏距離如式(1)所示。
式中:D為歐式距離,a(k)和b(k)是光譜圖a和b在光譜波數(shù)k點(diǎn)的縱坐標(biāo)值。
根據(jù)結(jié)果得出決定鑒別模型的置信水平,從而確定鑒別模型適應(yīng)的閾值,如式(2)所示。
式中:DT為某一類樣品光譜分布的閾值,Dmax為這類樣品的最大歐氏距離,S0為這類樣品距離分布的標(biāo)準(zhǔn)偏差值,缺省值x選擇范圍在0.25~1.00之間。
x的大小決定了鑒別模型的置信水平。當(dāng)x取值過小時(shí),對同類物質(zhì)易發(fā)生誤判;當(dāng)x取值過大時(shí),對不同類物質(zhì)又易發(fā)生誤判。因此,在選擇x取值時(shí),應(yīng)確保同類樣品的光譜距離小于該閾值,而不同類的光譜距離大于該閾值[36]。在閾值選定后,建立鑒別模型。通過反復(fù)取值確定,當(dāng)x值為0.75時(shí)模型具有較高的置信水平,算法成立,如圖3所示。
通過式(1)、式(2)和圖3可以生成一個(gè)有定性鑒別匹配值的報(bào)告,其隨光譜距離的升序排列,其結(jié)果可以歸納為3種。第1種,待測樣品光譜與某一預(yù)設(shè)參考光譜的光譜距離小于閾值,而與其他參考光譜的距離大于閾值,鑒別結(jié)果為屬于某一已知類別;第2種,待測樣品光譜與所有預(yù)設(shè)參考光譜的光譜距離都大于閾值,鑒別結(jié)果為不屬于已知類別;第3種,待測樣品光譜與不止一個(gè)預(yù)設(shè)參考光譜的光譜距離小于閾值,鑒別結(jié)果為不確定。
利用已知特征值的驗(yàn)證集樣品對校正模型進(jìn)行驗(yàn)證,聚酯纖維、錦綸、腈綸、絲類蛋白質(zhì)、毛類蛋白質(zhì)、棉、麻、再生纖維素的測試數(shù)量均為100個(gè),正判數(shù)量為100個(gè);丙綸、乙綸、氨綸、氯綸、維綸、醋酯纖維的測試數(shù)量均為30個(gè),正判數(shù)量為30個(gè),所有纖維的正判率達(dá)到100%。該模型在對單一常用服用纖維的歸類鑒別中具有非常準(zhǔn)確的鑒別結(jié)果。
本研究基于近紅外光譜法,采用主成分分析結(jié)合聚類分析的方法,成功鑒別14類常見服用纖維。通過逐步回歸分析方法選擇了合適的波段(4 100 cm-1~5 150 cm-1和5 500~7 850 cm-1),并結(jié)合閾值選取建立了特定頻率范圍的鑒別模型。結(jié)果表明:所有纖維的正判率達(dá)到100%,成功實(shí)現(xiàn)14類常見服用纖維的定性鑒別。該項(xiàng)工作有望加入監(jiān)督檢測部門的日常工作,與傳統(tǒng)的檢測方式相輔相成,實(shí)現(xiàn)在海關(guān)及市場現(xiàn)場快檢或?qū)^貴重紡織品的高效、便捷、無損定性鑒別。