朱 華,吳 珽,房桂干,梁 龍,朱北平,佘光輝*
1. 南京林業(yè)大學(xué)林學(xué)院,江蘇 南京 210037 2. 南京林業(yè)大學(xué)林業(yè)資源高效加工利用協(xié)同創(chuàng)新中心, 江蘇 南京 210037 3. 中國(guó)林業(yè)科學(xué)研究院林產(chǎn)化學(xué)工業(yè)研究所, 江蘇 南京 210042
近年來(lái)宏觀政策對(duì)進(jìn)口廢紙配額的限制,影響了國(guó)內(nèi)紙漿生產(chǎn)市場(chǎng),制漿造紙?jiān)隙倘钡男蝿?shì)越發(fā)嚴(yán)峻。與此同時(shí),草漿因污染重,運(yùn)輸成本高等原因產(chǎn)量增速緩慢,本應(yīng)得到大力發(fā)展的木漿,因天然林禁伐,生態(tài)林保護(hù)等原因,年進(jìn)口比例超過(guò)了50%的警戒線。因此,加大國(guó)內(nèi)速生林發(fā)展投入,合理選擇培育樹(shù)種,科學(xué)規(guī)劃提高利用質(zhì)量已成為增加國(guó)產(chǎn)優(yōu)質(zhì)木漿產(chǎn)量,填補(bǔ)制漿造紙?jiān)隙倘钡奈ㄒ怀雎穂1]。桉樹(shù)作為南方人工速生林主要培育樹(shù)種,有著輪伐期短,年生長(zhǎng)量高的優(yōu)勢(shì),在兩廣、海南、云南等地區(qū)廣泛種植。桉樹(shù)采伐后以木片原料的形式來(lái)到制漿生產(chǎn)線,而各批次木片因生長(zhǎng)來(lái)源情況,運(yùn)輸保存時(shí)間的不同,化學(xué)成分存在著較大的差異,這些差異對(duì)桉木漿生產(chǎn)的藥品用量,能耗以及成漿質(zhì)量有很大影響。其中,綜纖維素/纖維素決定了木漿的得率,而一些含量較少的抽出物也起著重要的作用,如苯醇抽出物可用于表征制漿過(guò)程中的樹(shù)脂沉積物障礙,且與紙漿著色返黃相關(guān);1%NaOH抽出物則與原料腐朽變質(zhì)程度有關(guān)。因此,研究木片原料抽出物含量的快速測(cè)定技術(shù),擺脫傳統(tǒng)抽出物含量測(cè)定的繁瑣耗時(shí),根據(jù)各批次木片抽出物含量情況實(shí)時(shí)調(diào)整制漿用藥水平和電耗,有利于木漿生產(chǎn)提質(zhì)降耗目標(biāo)的實(shí)現(xiàn)。
近紅外光譜作為高效,無(wú)損的分析方法,在農(nóng)業(yè)生產(chǎn)[2],生物化學(xué)[3]等方面都得到了廣泛的應(yīng)用。制漿造紙行業(yè)中分析檢測(cè)項(xiàng)目多,測(cè)試步驟繁瑣,前人嘗試運(yùn)用近紅外技術(shù)實(shí)現(xiàn)原料鑒別分類(lèi)[4],卡伯值預(yù)測(cè)[5]的智能化控制,已取得一定成果。而在制漿原料抽出物分析方面,因取樣難度大,抽出物含量較低且成分復(fù)雜,光譜信息干擾嚴(yán)重,基于近紅外光譜的傳統(tǒng)回歸算法對(duì)其擬合建模效果往往不佳。本研究以廣泛種植的速生桉——尾巨桉雜交品系(DH32-29,DH32-26,DH33-27)為研究對(duì)象采集近紅外光譜,通過(guò)多種建模算法對(duì)比分析,發(fā)現(xiàn)傳統(tǒng)的偏最小二乘法適用于建立苯醇抽出物分析模型,而在分析1%NaOH抽出物時(shí),采用LASSO算法壓縮建?;貧w系數(shù),可以更有效的解決光譜數(shù)據(jù)共復(fù)線性問(wèn)題,得到更加精確的分析模型。在此基礎(chǔ)上結(jié)合遺傳算法篩選特征波長(zhǎng)變量,提高了模型的預(yù)測(cè)性能和穩(wěn)健性,實(shí)現(xiàn)了廣西速生桉中苯醇抽出物、1%NaOH抽出物含量的快速分析測(cè)定。
選擇廣西速生尾巨桉雜交品系三個(gè)主要品種(DH32-29,DH32-26,DH33-27),由金華林業(yè)原料林基地提供,引種自廣西東門(mén)林場(chǎng),樹(shù)齡均為6年。每個(gè)品種在樹(shù)干不同部位截取48個(gè)圓盤(pán)為樣本,去皮,經(jīng)切片機(jī)切割后置于空氣中充分平衡水分,用粉碎機(jī)將木片磨成木粉,經(jīng)振動(dòng)篩篩分出粒徑40~60目之間的木粉,同樣平衡水分后作為樣品,共計(jì)144個(gè)。每個(gè)品種以含量梯度法按3∶1的比例篩選12個(gè)樣品作為驗(yàn)證集;其余108個(gè)樣品作為訓(xùn)練集,用于速生桉苯醇抽出物、1%NaOH抽出物模型的建立。
所使用近紅外光譜儀器應(yīng)能適應(yīng)制漿造紙生產(chǎn)線復(fù)雜環(huán)境,成本低廉且結(jié)構(gòu)簡(jiǎn)單,易于組裝搭建,因此選用上海復(fù)享光學(xué)股份有限公司的全息光柵分光(陣列檢測(cè)器)近紅外光譜儀NIR2500,采集速生桉樣品的近紅外漫反射光譜。設(shè)定儀器參數(shù)如下:光譜范圍900~2 500 nm,信噪比為6 800∶1,波長(zhǎng)點(diǎn)數(shù)為256個(gè)。采集光譜時(shí),取3~4 g木粉樣品置于底部為石英玻璃的上置式樣品杯中,并用250 g砝碼壓住木粉樣品以保證樣品緊實(shí)度的一致性,光源經(jīng)光纖探頭從樣品杯底部照射樣品。每個(gè)樣品重復(fù)取樣3次,取其平均光譜作為該樣品代表性光譜。
用傳統(tǒng)實(shí)驗(yàn)室方法(GB/T 2677.6—1994,GB/T 2677.5—1993)測(cè)定全部144個(gè)速生桉樣品的苯醇抽出物和1%NaOH抽出物含量,每個(gè)樣品測(cè)3組平行數(shù)據(jù),以平均值作為樣品測(cè)定值。
選擇了常見(jiàn)的光譜預(yù)處理方法分別與偏最小二乘法(PLS),LASSO法,支持向量機(jī)法(SVR)和人工神經(jīng)網(wǎng)絡(luò)法(ANN)結(jié)合建模,得出兩種抽出物含量分析的最優(yōu)建模方法,并通過(guò)遺傳算法(genetic algorithm, GA)進(jìn)行波段選擇,進(jìn)一步優(yōu)化模型。
其中LASSO法在近紅外光譜分析中應(yīng)用較少,該算法主要原理是通過(guò)增加約束條件,令回歸系數(shù)的絕對(duì)值之和小于可調(diào)整的常數(shù),并最小化殘差平方和,將次要項(xiàng)、干擾項(xiàng)的回歸系數(shù)壓縮為零,從而使得所建模型更為準(zhǔn)確。
設(shè)有P個(gè)自變量x1,x2,…,xp和因變量y,滿足
y=α+β1x1+β2x2+…+βpxp+ε
(1)
式中α是常數(shù)項(xiàng),β1,β2,…,βp是回歸系數(shù),ε是隨機(jī)誤差項(xiàng)。
對(duì)回歸系數(shù)的絕對(duì)值和進(jìn)行懲罰
(2)
(3)
三種速生桉共計(jì)144個(gè)樣本的抽出物含量如表1所示。其中DH32-26樣本的苯醇抽出物含量較高,分布在1.07%~5.01%之間,DH32-29和DH33-27的苯醇抽出物含量分布沒(méi)有顯著差異,均分布在0.85%~3.96%之間。DH32-26和DH33-27的1%NaOH抽出物含量較低,分布在11.65%~16.92%之間,DH32-29的1%NaOH抽出物含量分布較寬,約11.61%~20.16%。速生桉樣本的兩種抽出物含量分布較寬,據(jù)此可建立有代表性的分析模型。
表1 樣品含量分布情況Table 1 Content distribution of samples
控制實(shí)驗(yàn)室溫度(20±0.5)℃,采集全部速生桉樣品的近紅外光譜,如圖1所示,橫坐標(biāo)表示波長(zhǎng),縱坐標(biāo)表示漫反射吸光度。速生桉樣品成分結(jié)構(gòu)復(fù)雜,除了含量較少的苯醇抽出物(包括樹(shù)脂、蠟、脂肪等),1%NaOH抽出物(無(wú)機(jī)鹽、糖、植物堿等)之外,還含有作為主成分存在的纖維素、半纖維素等多糖類(lèi)及芳香族高聚物。為降低無(wú)關(guān)信息影響,需對(duì)速生桉原始光譜進(jìn)行預(yù)處理。
圖1 速生桉樣品近紅外光譜
圖2 速生桉原始光譜的預(yù)處理(a):苯醇抽出物;(b):1%NaOH抽出物
表2 不同抽出物不同建模方法的模型評(píng)價(jià)Table 2 Evaluation of models for different extractives using different modeling methods
儀器的近紅外光譜區(qū)域?yàn)?00~2 500 nm,該區(qū)間包含一些無(wú)關(guān)或干擾信息,可能影響模型的精確度和穩(wěn)健性。因此采用遺傳算法(genetic algorithm, GA)結(jié)合相應(yīng)的建模方法分別篩選出光譜中與苯醇抽出物和1%NaOH抽出物有較強(qiáng)相關(guān)性的波長(zhǎng)變量,以期建立更加穩(wěn)健的分析模型。對(duì)256個(gè)波長(zhǎng)點(diǎn)分別進(jìn)行二進(jìn)制編碼,以“1”代表該波長(zhǎng)點(diǎn)被選中,以“0”代表該波長(zhǎng)被剔除,設(shè)定篩選波長(zhǎng)數(shù)目范圍為5~200,種群規(guī)模100,進(jìn)化代數(shù)500,交叉概率0.8,變異概率0.1。
表3 不同波段所建抽出物模型評(píng)價(jià)Table 3 Evaluation of models for extractives developed from different bands
圖3 測(cè)定值-預(yù)測(cè)值散點(diǎn)分布(a):苯醇抽出物;(b):1%NaOH抽出物
利用近紅外技術(shù)結(jié)合多種預(yù)處理方法和化學(xué)計(jì)量學(xué)算法,建立了廣西速生桉木的抽出物分析模型并通過(guò)遺傳算法對(duì)模型進(jìn)行了優(yōu)化。確定了建立苯醇抽出物分析模型的方法為:平滑、MSC、一階導(dǎo)數(shù)預(yù)處理,1 345.0~1 821.4和2 127.8~2 241.3 nm近紅外波段參與建模,建模方法為偏最小二乘法。建立1%NaOH抽出物分析模型的方法為:平滑、矢量歸一化、一階導(dǎo)數(shù)預(yù)處理,1 138.2~2 363.0 nm區(qū)間波段參與建模,LASSO法建立模型。針對(duì)廣西速生桉抽出物進(jìn)行近紅外分析,模型性能較好,能夠滿足原料抽出物快速分析測(cè)定的要求;同時(shí)創(chuàng)新性的在近紅外光譜建模分析中引入LASSO算法,為有效解決光譜數(shù)據(jù)的共復(fù)線性問(wèn)題提供了更多的選擇。