羅 峻,吳淑煥,聶鳳明,許 敏,范 偉,梁逸曾3
(1.廣州纖維產(chǎn)品檢測(cè)研究院,國(guó)家紡織品服裝服飾產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)中心(廣州),廣東 廣州 511447;2.湖南農(nóng)業(yè)大學(xué)生物科學(xué)技術(shù)學(xué)院,湖南 長(zhǎng)沙 410128;3.中南大學(xué)化學(xué)化工學(xué)院,湖南 長(zhǎng)沙 410083)
近紅外光譜與模型集群分析測(cè)定毛滌混紡織物成分含量
羅峻1,吳淑煥1,聶鳳明1,許敏1,范偉2,梁逸曾3
(1.廣州纖維產(chǎn)品檢測(cè)研究院,國(guó)家紡織品服裝服飾產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)中心(廣州),廣東 廣州 511447;2.湖南農(nóng)業(yè)大學(xué)生物科學(xué)技術(shù)學(xué)院,湖南 長(zhǎng)沙 410128;3.中南大學(xué)化學(xué)化工學(xué)院,湖南 長(zhǎng)沙 410083)
將近紅外光譜法和模型集群分析方法應(yīng)用于毛滌混紡織物成分含量的快速無(wú)損測(cè)定。以近紅外測(cè)量方法采集93個(gè)毛滌混紡織物的光譜信號(hào),利用光譜預(yù)處理消除信號(hào)漂移的影響,在模型集群分析基礎(chǔ)上,剔除異常樣本,篩選出30個(gè)關(guān)鍵波長(zhǎng),采用偏最小二乘法(PLS)建立滌綸含量的預(yù)測(cè)模型。所建立模型的訓(xùn)練集相關(guān)系數(shù)r2為0.9827、交互驗(yàn)證均方誤差(RMSECV)為3.26、預(yù)測(cè)均方根誤差(RMSEP)為3.34,預(yù)測(cè)結(jié)果令人滿(mǎn)意,適合于毛滌混紡織物中滌綸含量的快速、無(wú)損檢測(cè)。
近紅外光譜;模型集群分析;毛滌混紡織物;偏最小二乘法
當(dāng)前,我國(guó)的紡織品生產(chǎn)、出口和消費(fèi)均居世界第一。所以無(wú)論是政府監(jiān)管還是企業(yè)自檢自控,紡織品成分檢測(cè)的規(guī)模都非常巨大。然而,傳統(tǒng)的紡織品成分檢測(cè)方法如化學(xué)溶解法和顯微鏡法等,存在檢測(cè)時(shí)間長(zhǎng),檢測(cè)環(huán)境要求高、使用強(qiáng)酸強(qiáng)堿試劑,檢測(cè)成本高,需破壞樣品等缺點(diǎn),無(wú)法滿(mǎn)足各檢驗(yàn)監(jiān)督部門(mén),包括生產(chǎn)企業(yè)對(duì)紡織品進(jìn)行大量檢測(cè)的需求[1-4]。在這種情況下,部分不法企業(yè)擅自降低混紡面料中某些纖維成分的含量,偷工減料,以次充好,牟取不當(dāng)利潤(rùn),造成不良影響。由近期全國(guó)各地公布的質(zhì)量狀況分析結(jié)果可看出,不合格紡織品中成分及含量與實(shí)際不符的問(wèn)題最為嚴(yán)重[5]。
基于以上需求,研究和開(kāi)發(fā)一種快速、無(wú)損、環(huán)境友好的檢測(cè)方法具有很好的應(yīng)用前景。近紅外光譜(NIR)是一種無(wú)損分析技術(shù)[6],它將近紅外光譜信號(hào)與化學(xué)分析數(shù)據(jù),利用統(tǒng)計(jì)回歸方法建立預(yù)測(cè)模型,然后測(cè)量未知樣品的光譜來(lái)快速預(yù)測(cè)其成分含量[7-8]。質(zhì)檢部門(mén)可利用近紅外快速檢測(cè)技術(shù)進(jìn)行初步篩查,對(duì)于快檢不合格的情況,依法啟動(dòng)抽樣檢驗(yàn)程序,實(shí)現(xiàn)對(duì)紡織品企業(yè)、原材料加工廠、成衣加工廠以及批發(fā)零售終端等大批量的抽檢,充分保證國(guó)內(nèi)紡織品的質(zhì)量[9-10]。
當(dāng)前,已有關(guān)于近紅外光譜技術(shù)應(yīng)用于紡織品定量分析中的報(bào)道,但相關(guān)的研究主要集中在棉/滌、棉/氨等混紡織物[1,3,8-9],毛滌混紡織物報(bào)道較少。另外混紡織物近紅外光譜檢測(cè)的目標(biāo)在于建立一個(gè)有效可靠的預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)未知樣本的含量預(yù)測(cè)。在實(shí)際工作中,這個(gè)模型的建立并不容易,由于模型完全未知,建模需要進(jìn)行探索,并且需要解決異常樣本、干擾信息等問(wèn)題。傳統(tǒng)的一次性建模思路容易陷入模型欠擬合與過(guò)擬合的狀況。而新進(jìn)發(fā)展的模型集群分析打破了傳統(tǒng)一次性建模思路,力求最大限度地利用已有樣本信息,通過(guò)隨機(jī)采樣,從樣本空間、變量空間或是模型空間考察數(shù)據(jù)集的內(nèi)在性質(zhì),基于所得結(jié)果的統(tǒng)計(jì)分析可進(jìn)行異常樣品的檢測(cè)、關(guān)鍵波長(zhǎng)的篩選和模型的評(píng)價(jià)等[11-12]?;诖?,本研究共收集毛滌混紡織物樣本共93個(gè),建立了基于模型集群分析的毛滌混紡織物組分含量的近紅外光譜快速無(wú)損檢測(cè)方法。
1.1樣本
本實(shí)驗(yàn)研究的毛滌混紡織物樣本共計(jì)93個(gè),均為市場(chǎng)購(gòu)買(mǎi)成品樣本。成分含量按照標(biāo)準(zhǔn) FZ/T 01057系列進(jìn)行定性鑒別,按照國(guó)家標(biāo)準(zhǔn)GB/T 2910系列進(jìn)行成分含量定量分析。
1.2光譜信號(hào)的采集
信號(hào)采集來(lái)源為近紅外光譜儀(ANTARIS II,Thermo fisher),樣品采用漫反射方式測(cè)量,為保證樣品信號(hào)的代表性,每個(gè)樣品測(cè)量3次并取3次平均值作為其光譜信號(hào)數(shù)據(jù),信號(hào)采集時(shí)室內(nèi)溫度為20℃,濕度為60%。
1.3方法與原理
模型集群分析。模型集群分析的算法框架主要包括3個(gè)基本要素:1)通過(guò)隨機(jī)采樣獲取子數(shù)據(jù)集;2)針對(duì)每個(gè)子數(shù)據(jù)集,建立相應(yīng)子模型;3)從樣本空間、變量空間、參數(shù)空間或模型空間對(duì)所有建立的集群子模型的參數(shù)與結(jié)果進(jìn)行統(tǒng)計(jì)分析,獲取有用信息[13]。
應(yīng)用該算法框架可以進(jìn)行異常樣品的檢測(cè)、關(guān)鍵波長(zhǎng)的篩選和模型的評(píng)價(jià)。基于模型集群分析的異常樣本識(shí)別方法可克服不同異常樣本的掩蔽效應(yīng),有效識(shí)別光譜信號(hào)及化學(xué)分析數(shù)據(jù)的異常值。具體算法如下:采用隨機(jī)分組的方式,將樣本集分為70%的訓(xùn)練集和30%的測(cè)試集。采用訓(xùn)練集樣本建立回歸模型并對(duì)測(cè)試集樣本進(jìn)行預(yù)測(cè),重復(fù)該過(guò)程多次(本研究為3000次),可得每個(gè)樣本預(yù)測(cè)誤差的統(tǒng)計(jì)分布,計(jì)算每個(gè)樣本的殘差分布均值μ和標(biāo)準(zhǔn)偏差б并作圖,預(yù)測(cè)誤差分布的均值或偏差異常的樣本即被識(shí)別為異常樣本[14]。
基于模型集群分析的波長(zhǎng)篩選方法可顯著提高近紅外分析預(yù)測(cè)的準(zhǔn)確度。因?yàn)榻t外光譜數(shù)據(jù)的共線性非常嚴(yán)重,其波長(zhǎng)點(diǎn)數(shù)為幾百個(gè)至上千個(gè)。如此多的波長(zhǎng)點(diǎn)數(shù)不僅存在著信息的冗余,而且部分波長(zhǎng)的信號(hào)可能為干擾信息,對(duì)預(yù)測(cè)不利。因此,在建立預(yù)測(cè)模型時(shí)也需要對(duì)近紅外光信號(hào)進(jìn)行波長(zhǎng)的篩選。對(duì)于毛滌混紡織物的關(guān)鍵波長(zhǎng)篩選,我們?cè)O(shè)計(jì)了一種基于模型集群分析的新方法:MPA-PSO方法。PSO(粒子群優(yōu)化)是一種源于對(duì)鳥(niǎo)群捕食行為研究的進(jìn)化計(jì)算技術(shù)[15]。是一種基于疊代的優(yōu)化工具,系統(tǒng)初始化為一組隨機(jī)解,在解空間通過(guò)疊代搜尋最優(yōu)值。在PSO中,每個(gè)優(yōu)化問(wèn)題的潛在解都可以想象成D維搜索空間上的一個(gè)點(diǎn),可稱(chēng)之為“粒子”,所有的粒子都有一個(gè)被目標(biāo)函數(shù)決定的適應(yīng)值,每個(gè)粒子還有一個(gè)速度決定他們飛翔的方向和距離,然后粒子們就追隨當(dāng)前的最優(yōu)粒子在解空間中搜索。PSO方法實(shí)現(xiàn)較為簡(jiǎn)便,本研究基于模型集群分析框架,通過(guò)隨機(jī)采樣,獲得不同的子數(shù)據(jù)集,然后對(duì)每個(gè)數(shù)據(jù)集進(jìn)行PSO關(guān)鍵波長(zhǎng)篩選,根據(jù)選出波長(zhǎng)的頻率來(lái)確定最終關(guān)鍵波長(zhǎng)。
1.4數(shù)據(jù)處理
本文所采用的光譜信號(hào)處理及回歸等程序均在Matlab R2015b環(huán)境下運(yùn)行。
2.1樣本的劃分
在多元校正模型的建立及驗(yàn)證時(shí),需要將數(shù)據(jù)樣本劃分為訓(xùn)練集和獨(dú)立測(cè)試集。訓(xùn)練集用來(lái)優(yōu)化參數(shù)建立模型,獨(dú)立測(cè)試集不參與建模過(guò)程,僅用來(lái)驗(yàn)證模型的預(yù)測(cè)效果。本文采用Kenard-Stone樣本選擇方法,從總計(jì)93個(gè)毛滌織物樣本中篩選出具有代表性的80個(gè)樣本用于訓(xùn)練模型,13個(gè)樣本用于測(cè)試模型。
2.2光譜的預(yù)處理
在進(jìn)行混紡織物的近紅外光譜檢測(cè)時(shí),一般采用積分球漫反射的模式測(cè)量。測(cè)量過(guò)程中雖然盡量保持了環(huán)境條件的一致,但是混紡織物其表面結(jié)構(gòu)、平整性、厚度等不同因素會(huì)干擾光譜信息。從圖1中亦可以看出,近紅外信號(hào)的漂移非常嚴(yán)重,對(duì)近紅外光信號(hào)進(jìn)行適當(dāng)預(yù)處理可以干擾因素引起的信號(hào)漂移及旋轉(zhuǎn)等噪聲,從而提高信噪比,為建立預(yù)測(cè)模型提供有效信息。在本研究中,選擇5點(diǎn)2次多項(xiàng)式Savitsky-Golay一階微分法進(jìn)行處理,處理后光譜如圖2所示。對(duì)比圖1和圖2可看出,經(jīng)過(guò)預(yù)處理后,明顯消除了信號(hào)的整體漂移,強(qiáng)化了譜帶特征,處理后的光譜更適宜于預(yù)測(cè)模型的建立。
2.3異常樣本的檢測(cè)
依據(jù)模型集群分析的思路,為最大限度地利用已有訓(xùn)練集樣本信息,可通過(guò)隨機(jī)采樣,從樣本空間考察數(shù)據(jù)集的內(nèi)在性質(zhì),根據(jù)所得結(jié)果的統(tǒng)計(jì)分析進(jìn)行異常樣品的檢測(cè)。因此在本研究中,采用隨機(jī)分組方法對(duì)訓(xùn)練集重復(fù)進(jìn)行分組,每次取總數(shù)70%的樣本來(lái)回歸預(yù)測(cè)模型,30%進(jìn)行測(cè)試。重復(fù)3000次,每個(gè)樣本均得到多個(gè)預(yù)測(cè)值。計(jì)算多個(gè)預(yù)測(cè)值誤差的平均值與標(biāo)準(zhǔn)方差并繪圖,如圖3所示。可以看出,有樣本預(yù)測(cè)誤差均值明顯偏高,如13號(hào)樣本?;蚴穷A(yù)測(cè)誤差的方差較大,如34及77號(hào)樣本。經(jīng)驗(yàn)證,13號(hào)樣本為機(jī)織黑色布料,其表面具有裝飾嵌條,34號(hào)樣本為混色格子布料,77號(hào)樣本為呢料,表面起圈不平整。將此3個(gè)異常樣本剔除后建立回歸模型,并與全樣本預(yù)測(cè)模型作了比較,剔除后,交互驗(yàn)證均方根誤差(RMSECV)由全樣本的5.27降低到4.62,預(yù)測(cè)的準(zhǔn)確度明顯提高。
圖1 毛滌混紡織物的近紅外光譜圖
圖2 毛滌混紡織物的一階微分光譜圖
圖3 均值―方差分布圖
2.4關(guān)鍵波長(zhǎng)優(yōu)選
近紅外光譜信號(hào)存在較為明顯的信息冗余,因此通過(guò)優(yōu)選波長(zhǎng)可以提高模型的預(yù)測(cè)能力與適用性。本研究采用MPA-PSO法對(duì)毛滌混紡織物的關(guān)鍵波長(zhǎng)進(jìn)行篩選,PSO具有深刻的智能背景,同其他優(yōu)化算法比較,PSO簡(jiǎn)單易實(shí)現(xiàn)且沒(méi)有過(guò)多參數(shù)需要調(diào)整。運(yùn)行時(shí)首先設(shè)置粒子群搜索參數(shù):粒子種群大小為50,迭代次數(shù)為200,算法運(yùn)行10次,以F=Q2作為適應(yīng)度函數(shù),Q2為交互驗(yàn)證預(yù)測(cè)值和量測(cè)值的相關(guān)系數(shù)。重復(fù)選擇3000次后,對(duì)選出的波長(zhǎng)進(jìn)行統(tǒng)計(jì)分析,最終選擇頻率大于50%的30個(gè)波長(zhǎng)作為其關(guān)鍵波長(zhǎng)。30個(gè)關(guān)鍵波長(zhǎng)具體為:4 034,4 177,4204,4 281,4 756,4 968,4 972,4 975,5 095,5 099,5 103,5 295,6 044,6 113,6 117,6 144,6 198,8 632,8 748,8 751,9 118,9 280,9 338,9 507,9 608,9635,9696,9700,9800,9812cm-1。
利用30個(gè)關(guān)鍵波長(zhǎng)建立預(yù)測(cè)模型的結(jié)果表明,經(jīng)過(guò)波長(zhǎng)篩選后,預(yù)測(cè)誤差有所降低,關(guān)鍵波長(zhǎng)預(yù)測(cè)模型的交互驗(yàn)證均方差值為之前的70.4%。而且,波長(zhǎng)數(shù)量由原始的1557個(gè)減少到30個(gè),減少了數(shù)據(jù)處理的工作量,可見(jiàn)MPA-PSO法應(yīng)用于波長(zhǎng)篩選來(lái)處理近紅外信號(hào)可有效簡(jiǎn)化模型并提高校正模型的預(yù)測(cè)能力。
2.5模型建立與預(yù)測(cè)
采用未參與模型建立的獨(dú)立測(cè)試集樣本對(duì)模型的預(yù)測(cè)效果進(jìn)行測(cè)試和驗(yàn)證。首先采用預(yù)處理方法對(duì)樣本信號(hào)進(jìn)行處理,然后調(diào)用訓(xùn)練集樣本建立PLS模型,并對(duì)未參與建模的獨(dú)立測(cè)試集樣本進(jìn)行預(yù)測(cè),回歸模型的測(cè)試集相關(guān)系數(shù)為0.982 7,預(yù)測(cè)均方根誤差為3.34,交互檢驗(yàn)均方差為3.26,結(jié)果令人滿(mǎn)意。近紅外預(yù)測(cè)值與化學(xué)分析測(cè)定值之間的相關(guān)關(guān)系如圖4所示。
圖4 真實(shí)值與近紅外預(yù)測(cè)值之間的相關(guān)圖
基于近紅外光譜和模型集群分析對(duì)毛滌混紡織物中滌綸含量進(jìn)行了快速無(wú)損檢測(cè)研究,在模型集群分析框架下,剔除了一些異常樣本,并篩選出了關(guān)鍵波長(zhǎng),利用關(guān)鍵波長(zhǎng)進(jìn)行偏最小二乘回歸建模,預(yù)測(cè)誤差較小,表明近紅外光譜結(jié)合模型集群分析適合于毛滌混紡織物中纖維成分的快速、無(wú)損檢測(cè),而且能達(dá)到令人滿(mǎn)意的檢測(cè)精度,為今后混紡織物的快速無(wú)損檢測(cè)提供了新的選擇。
同時(shí),在本研究中注意到混紡織物樣品復(fù)雜度較大,成分含量跨度同樣較大,下一步計(jì)劃開(kāi)展分段動(dòng)態(tài)建模研究,以進(jìn)一步提高預(yù)測(cè)準(zhǔn)確率。
[1]桂家祥,耿響,要磊,等.基于近紅外光譜法的棉/滌混紡紡織物中棉含量快速檢測(cè)[J].紡織學(xué)報(bào),2012,33(4):55-59.
[2]王京力,耿響,桂家祥.基于近紅外光譜法快速檢測(cè)滌氨織物的纖維含量[J].上海紡織科技,2013,41(5):45-48.
[3]鐘浩,楊偉江.運(yùn)用近紅外光譜定量分析紡織面料成分的可行性探討[J].中國(guó)纖檢,2008(2):46-47.
[4]馮紅年,甘彬,金尙忠.棉滌混合紡織面料含量的近紅外光譜檢測(cè)[J].激光與紅外,2005,35(10):768-770.
[5]虞學(xué)鋒.服裝產(chǎn)品纖維成分含量項(xiàng)目質(zhì)量狀況分析[J].中國(guó)纖檢,2014(10):28-29.
[6]陸婉珍.現(xiàn)代近紅外光譜分析技術(shù)[M].北京:中國(guó)石化出版社,2006.
[7]梁逸曾.白灰黑復(fù)雜多組份分析體系及其化學(xué)計(jì)量學(xué)算法[M].長(zhǎng)沙:湖南科學(xué)技術(shù)出版社,1996:32-36.
[8]王動(dòng)民,金尙忠,陳華才,等.棉-滌混紡面料中棉含量的近紅外光譜分析[J].光學(xué)精密工程,2008,16(11):2051-2054.
[9]朱洪亮,楊萌,張琦.棉/氨混紡織物氨綸含量快速分析方法研究[J].中國(guó)纖檢,2011(24):54-58.
[10]耿響,桂家祥,要磊,等.近紅外光譜快速檢測(cè)技術(shù)在紡織領(lǐng)域的應(yīng)用[J].上海紡織科技,2013,41(4):25-27.
[11]王京力,桂家祥,耿響,等.近紅外光譜檢測(cè)用纖維含量樣品準(zhǔn)確度研究[J].上海紡織科技,2013,41(9):51-54.
[12]柴金朝,金尙忠.光譜預(yù)處理對(duì)棉滌混紡面料近紅外定量模型的影響[J].中國(guó)計(jì)量學(xué)院學(xué)報(bào),2008,19(4):325-328.
[13]梁逸曾,許青松.復(fù)雜體系儀器分析-白灰黑分析體系及其多變量解析方法[M].北京:化學(xué)工業(yè)出版社,2012.
[14]CAO D S,LIANG Y Z,XU Q S.A new strategy of outlierdetection for QSAR/QSPR[J].Journal of Computational Chemistry,2009,31(3):592-602.
[15]KHAJEH A,MODARRESS H,ZEINODDINI-MEYMAND H.Application of modified particle swarm optimization as anefficient variable selection strategy in QSAR/QSPR studies[J].Journal of Chemometrics,2012,26(11-12):598 -603.
(編輯:徐柳)
Study on rapid determination of polyester content in polyester/wool based on near infrared spectroscopy and model population analysis
LUO Jun1,WU Shuhuan1,NIE Fengming1,XU Min1,F(xiàn)AN Wei2,LIANG Yizeng3
(1.Guangzhou Fibre Product Testing and Research Institute,Guangzhou 511447,China;2.College of Bioscience and Biotechnology,Hunan Agricultural University,Changsha 410128,China;3.College of Chemistry and Chemical Engineering,Central South University,Changsha 410083,China)
Near-infrared spectroscopy as a rapid,non-destructively testing technique,has been widely used in the fiber product testing field.93 polyester/wool samples were collected.Model population analysis method was employed to detect the outlier and select key variables after preprocessingthespectrabySavitsky-Golayderivativemethod.Partialleastsquares(PLS)calibration models were established by the optimal conditions to predict the content of polyester. Correlation coefficient of determination r2,root-mean-square error of cross-validation(RMSECV)and root-mean-square error of prediction(RMSEP)were used to evaluate the quality of the model. The best models showed satisfactory predictions as measured by the r2,RMSECV and RMSEP values:0.982 7,3.26 and 3.34.The prediction results were better than the whole spectra The results showed that the method was suitable for the fast and reliable determination of the content of polyester in polyester/wool product.
near-infrared spectroscopy;model population analysis;polyester/wool;PLS
A
1674-5124(2016)08-0044-04
10.11857/j.issn.1674-5124.2016.08.009
2015-12-28;
2016-02-19
國(guó)家自然科學(xué)基金項(xiàng)目(21275164);國(guó)家質(zhì)檢總局科技計(jì)劃項(xiàng)目(2013QK290);廣州市海珠區(qū)科技計(jì)劃項(xiàng)目(2013-cg-08)
羅峻(1983-),男,廣東廣州市人,博士,主要從事紡織品檢測(cè)新技術(shù)研發(fā)、新型檢測(cè)儀器研發(fā)工作。
范偉(1983-),男,河北邢臺(tái)市人,博士,主要從事光譜分析與化學(xué)計(jì)量學(xué)研究。