段宏偉,郭 梅,朱榮光,牛其建
1. 江蘇大學(xué)農(nóng)業(yè)工程學(xué)院,江蘇 鎮(zhèn)江 212013 2. 江蘇大學(xué)現(xiàn)代農(nóng)業(yè)裝備與技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 鎮(zhèn)江 212013 3. 石河子大學(xué)機(jī)械電氣工程學(xué)院,新疆 石河子 832003
隨著化石能源價(jià)格不斷攀升,生物質(zhì)能利用價(jià)值愈發(fā)受到各國(guó)能源部門關(guān)注。生物質(zhì)炭化成型燃料因清潔衛(wèi)生、 灰渣可回收利用等優(yōu)點(diǎn)已成為我國(guó)主推清潔能源之一。熱值(CV)是熱效率、 燃燒設(shè)備熱平衡、 燃料品質(zhì)計(jì)算的重要指標(biāo),主要通過(guò)氧彈量熱儀測(cè)量反應(yīng)物與生成物的焓差計(jì)算得到,然而該方法難以滿足工業(yè)生產(chǎn)實(shí)時(shí)監(jiān)測(cè)要求。
激光誘導(dǎo)擊穿光譜(LIBS)是一種利用激光在焦平面直接燒蝕樣品表面產(chǎn)生等離子體時(shí)發(fā)射的原子或離子光譜進(jìn)行檢測(cè)的新興技術(shù)[1]。該技術(shù)在農(nóng)業(yè)原料等生物質(zhì)復(fù)雜基體特性精確定量分析方面仍面臨挑戰(zhàn)。Song等[2]研究結(jié)果表明X自變量特征提取法可以去除復(fù)雜基體LIBS譜線中大量無(wú)信息變量和多重共線性變量,從而提升定量模型預(yù)測(cè)性能。
目前常規(guī)特征變量提取方法為X(光譜)自變量特征提取類型法,如競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算采樣法、 遺傳算法和回歸系數(shù)法等[2-4],上述方法主要依據(jù)不同采樣光譜波段組合構(gòu)建模型的交互驗(yàn)證均方根誤差(RMSECV)進(jìn)行特征光譜提取。由于該類方法所對(duì)應(yīng)回歸模型主要為線性偏最小二乘回歸(PLSR),而秸稈炭中主要包含金屬元素原子/離子譜線和非金屬元素原子/分子譜線,因此X自變量特征提取法僅能篩選出符合朗伯比爾線性定律的大部分金屬元素LIBS特征光譜。
為提取與秸稈炭CV緊密相關(guān)的非金屬元素LIBS特征譜線,本研究提出一種Y(濃度∶熱值)因變量特征提取法,主要對(duì)秸稈炭CV與元素濃度進(jìn)行相關(guān)性分析,通過(guò)相關(guān)性顯著分析獲取大部分非金屬元素最佳組合譜線。研究基于XY雙變量特征提取策略精確獲取秸稈炭CV敏感特征元素變量,采用遺傳算法優(yōu)化及自適應(yīng)增強(qiáng)的人工神經(jīng)網(wǎng)絡(luò)算法(GA-BP-Adaboost)構(gòu)建秸稈炭CV非線性LIBS定量分析模型,為秸稈炭燃料品質(zhì)評(píng)價(jià)以及工業(yè)現(xiàn)場(chǎng)過(guò)程分析提供一種可靠的分析策略。
LIBS系統(tǒng)燒蝕源為一臺(tái)調(diào)Q的Nd∶YAG固體激光器,激發(fā)波長(zhǎng)為1 064 nm,最大頻率為2 Hz,脈沖延遲為10 ns,最大激發(fā)能量為100 mJ。激光聚焦后法線入射到樣品表面并引發(fā)等離子體,相對(duì)于水平方向呈45°的準(zhǔn)直鏡接收等離子體信號(hào)至光纖傳輸通道。光纖出口連接7通道電荷耦合光譜儀,光譜儀分辨率為0.05 nm,檢測(cè)波長(zhǎng)范圍為187~980 nm。
在本研究中,針對(duì)激光脈沖能量波動(dòng)對(duì)譜線強(qiáng)度影響問(wèn)題,將激光能量設(shè)為30 mJ,單點(diǎn)激光重復(fù)燒蝕次數(shù)設(shè)為3,單點(diǎn)光斑大小設(shè)為200 μm。為了避免軔致輻射,探測(cè)器相對(duì)于激光脈沖的延遲時(shí)間設(shè)為0.7 μs。
79個(gè)秸稈炭樣品采購(gòu)于南京智融聯(lián)科技有限公司,包含水稻秸稈炭和玉米秸稈炭。樣品經(jīng)過(guò)45 ℃烘箱干燥后,利用刀片式粉碎機(jī)粉碎過(guò)75 μm篩后放入自封袋備用。樣品中N,C,S,H和O采用元素分析儀測(cè)定[5],K,Na,Ca,Mg,Pb,Cr,Cu,Zn和P元素含量采用ICP-MS測(cè)定[6],CV采用氧彈量熱儀測(cè)定[7],實(shí)驗(yàn)結(jié)果如表1所示。
表1 CV和主要元素含量統(tǒng)計(jì)結(jié)果Table 1 Statistical results of CV and main element content
定量分析模型一般形式為Y=KX+B,其中X和Y分別為自變量和因變量,所對(duì)應(yīng)特征變量提取方法可以分類為X自變量特征提取法和Y因變量特征提取法。本研究所采用的XY雙變量特征提取法流程如圖1所示。
首先采用Y因變量特征提取法獲取與秸稈炭CV相關(guān)的C和O等非金屬元素譜峰波段組合,通過(guò)CV與秸稈炭元素濃度之間相關(guān)性分析,選取相關(guān)性極顯著(p<0.01)元素分析線展寬波段作為特征變量。采用回歸系數(shù)法(RC)作為X自變量特征提取法,通過(guò)設(shè)定不同回歸系數(shù)閾值篩選特征變量,并構(gòu)建不同特征變量組合的線性偏最小二乘回歸(PLSR)模型,依據(jù)模型RMSECV(交互驗(yàn)證均方根誤差)值選取最優(yōu)金屬元素譜線組合作為提取結(jié)果。由于所提取特征包含線性和非線性變量,最終構(gòu)建秸稈炭CV的非線性精確定量分析模型。
圖1 XY雙變量特征提取策略Fig.1 XY bivariate feature extraction strategy
遺傳算法優(yōu)化及自適應(yīng)增強(qiáng)的人工神經(jīng)網(wǎng)絡(luò)算法(GA-BP-Adaboost)[8]是一種非線性人工神經(jīng)網(wǎng)絡(luò)改進(jìn)模型,一方面采用遺傳算法(GA)優(yōu)化邊界函數(shù)參數(shù)w和b值,另一方面采用多個(gè)弱預(yù)測(cè)器對(duì)數(shù)據(jù)集中每個(gè)樣本進(jìn)行訓(xùn)練并不斷調(diào)整樣本權(quán)重D,同時(shí)為每個(gè)弱預(yù)測(cè)器分配權(quán)重alpha以計(jì)算最終強(qiáng)預(yù)測(cè)器結(jié)果。相關(guān)計(jì)算公式分別為式(1)—式(3)
(1)
(2)
Errori=Errori+(0,Di, j)
(3)
式中,i和j分別為弱預(yù)測(cè)器和樣本序號(hào),Error為每個(gè)弱預(yù)測(cè)器所有樣本權(quán)重總和。若某個(gè)樣本被準(zhǔn)確預(yù)測(cè)(小于相對(duì)誤差率閾值),則該樣本權(quán)重降低,式(2)中alpha符號(hào)取負(fù),所對(duì)應(yīng)Error值不變(+0);若某個(gè)樣本未能準(zhǔn)確預(yù)測(cè)(大于相對(duì)誤差率閾值),則該樣本權(quán)重升高,式(2)中alpha符號(hào)取正,所對(duì)應(yīng)Error值變大(+Di, j)。
模型效果主要由均方根誤差(RMSE)、 平均相對(duì)誤差(ARE)和相對(duì)標(biāo)準(zhǔn)誤差(RSD)來(lái)評(píng)價(jià)[9-10],計(jì)算公式如式(4)—式(6)所示。RMSECV越小,則建模效果越好;RSDP和AREP越小,則模型預(yù)測(cè)精度越高。
(4)
(5)
(6)
圖2 LIBS譜線Fig.2 LIBS spectral analysis
與非金屬元素和重金屬元素相比較,營(yíng)養(yǎng)型金屬元素K,Ca,Na和Mg發(fā)射線強(qiáng)度較大。原因可能是營(yíng)養(yǎng)型金屬元素的電離能較小,更容易發(fā)生能級(jí)躍遷至激發(fā)態(tài),單位體積內(nèi)處于激發(fā)態(tài)的原子數(shù)更多,譜線強(qiáng)度更大。又由于K,Na,Ca,Mg和Cr參與農(nóng)作物生理生長(zhǎng)作用過(guò)程,其LIBS分析線可能會(huì)對(duì)秸稈炭CV表現(xiàn)出更高敏感性。
首先采用Y因變量特征提取法獲取與CV具有顯著相關(guān)性的特征元素譜峰波段,結(jié)果如表2所示。CV與C,O,H和Na元素濃度相關(guān)性較大且相關(guān)系數(shù)呈現(xiàn)極顯著性(p<0.01);與Ca,K和Cr元素濃度相關(guān)性相對(duì)較低且相關(guān)系數(shù)呈現(xiàn)顯著性(p<0.05);而與S,Mg,Zn,Pb,N,Cu和P元素濃度無(wú)相關(guān)性。由于秸稈炭中C,O和H主要以碳單質(zhì)、 芳香環(huán)、 羧基、 醚鍵和硅氧鍵等形式存在[13],能夠顯著提升秸稈炭CV。因此,選取C,O,H和Na元素的LIBS譜峰波段作為Y因變量特征提取結(jié)果。
采用X自變量特征提取法獲取全波段PLSR模型回歸系數(shù)較大值作為CV特征變量,結(jié)果如圖3(a)所示。當(dāng)回歸系數(shù)閾值分別設(shè)為15×10-5,10×10-5,5×10-5,4×10-5,3×10-5,2×10-5和1×10-5時(shí),其所構(gòu)建PLSR模型的RMSECV結(jié)果如圖3(b)所示。結(jié)果表明:隨著閾值逐漸減小,RMSECV值先減小后增大。原因可能是:當(dāng)RMSECV降低時(shí),CV模型中線性相關(guān)性元素Ca,Cr,Mg和K的分析線光譜逐漸被選中;當(dāng)RMSECV升高時(shí),CV模型中非線性相關(guān)性元素光譜和噪聲信息逐漸被選中。當(dāng)閾值為4×10-5時(shí)RMSECV降至最小值0.61,所選取49個(gè)特征變量數(shù)為X自變量特征提取結(jié)果。
表2 CV與元素相關(guān)性分析Table 2 Correlation analysis between CV and elements
圖3 回歸系數(shù)法閾值選取 (a): 全波段PLSR模型回歸系數(shù);(b): 不同回歸系數(shù)閾值模型結(jié)果Fig.3 Threshold selection of regression coefficient method (a): Full band PLSR model regression coefficient; (b): Model results with different regression coefficient thresholds
綜上所述,XY雙變量特征提取法獲取的CV特征變量結(jié)果如圖4(a)所示。Y因變量特征提取法主要包括C,O,H和Na元素分析線展寬波段,X自變量特征提取法主要包括Ca,Cr,Mg和K元素分析線光譜,并且二者無(wú)交集。分別構(gòu)建X單變量、Y單變量和XY雙變量特征PLSR模型,由圖4(b)得出雙變量特征模型的RMSECV值最小,表明XY雙變量特征提取法能夠成功獲取CV特征變量。然而由于該方法獲取了大量非線性特征變量,有必要構(gòu)建非線性多元回歸模型以提升模型預(yù)測(cè)性能。
圖4 XY雙變量特征提取結(jié)果 (a): XY雙變量特征提取結(jié)果;(b): 三種特征變量模型效果比較Fig.4 XY bivariate feature extraction results (a): XY bivariate feature extraction results; (b): Comparison of three feature variable model
在構(gòu)建GA-BP-Adaboost特征模型前,需要提前采用GA和Adaboost對(duì)BP-ANN模型參數(shù)進(jìn)行尋優(yōu)以構(gòu)建較為穩(wěn)健的非線性特征模型。相關(guān)參數(shù)設(shè)置:GA參數(shù)中迭代次數(shù)為20,種群規(guī)模為20;Adaboost參數(shù)中弱預(yù)測(cè)器個(gè)數(shù)設(shè)為20,雙隱含層數(shù)均為1,輸入層、 隱含層和輸出層傳遞函數(shù)分別為tansig,tansig和purelin; 訓(xùn)練函數(shù)為trainbr,學(xué)習(xí)速率和學(xué)習(xí)目標(biāo)均設(shè)為0.01。
對(duì)于GA-BP部分,當(dāng)交叉概率設(shè)為0.8~0.95,步長(zhǎng)為0.05,變異概率設(shè)為0.05~0.5,步長(zhǎng)為0.05時(shí),所對(duì)應(yīng)平均適應(yīng)度值如圖5(a)所示。當(dāng)變異概率逐漸減小,交叉概率逐漸增大時(shí),平均適應(yīng)度值呈現(xiàn)降低趨勢(shì)。當(dāng)變異概率和交叉概率分別為0.1和0.95時(shí),平均適應(yīng)度降至最小值80.98。又由于適應(yīng)度函數(shù)為預(yù)測(cè)絕對(duì)誤差和,適應(yīng)度越小表明模型預(yù)測(cè)越準(zhǔn)確。對(duì)于BP-Adaboost部分,由于20個(gè)弱預(yù)測(cè)器模型對(duì)每個(gè)訓(xùn)練樣本的相對(duì)誤差率(RE)范圍為0~7.15%,將RE閾值設(shè)為0.05~0.30,步長(zhǎng)為0.05,結(jié)果如圖5(b)所示。觀察得出,隨著RE值增大,AREP和RSDP值總體呈現(xiàn)先減小后增大趨勢(shì)。因此,將變異概率、 交叉概率和RE值分別設(shè)為0.1,0.95和0.01用于進(jìn)一步的GA-BP-Adaboost模型構(gòu)建。
圖5 GA和Adaboost參數(shù)優(yōu)化 (a): GA參數(shù)優(yōu)化;(b): Adaboost參數(shù)優(yōu)化Fig.5 Optimization of GA and Adaboost parameters (a): GA parameter optimization; (b): Adaboost parameter optimization
將所提取特征變量數(shù)據(jù)經(jīng)主成分分析(閾值參數(shù)設(shè)為99.93%),并基于優(yōu)化后的參數(shù)構(gòu)建GA-BP-Adaboost模型,將模型結(jié)果與線性PLSR模型效果相比較,結(jié)果如圖6所示。與PLSR特征模型相比較,GA-BP-Adaboost特征模型中大部分樣本(1~3,5,7~17,19,20)的預(yù)測(cè)值與測(cè)定值更為接近,AREP和RSDP分別降低了0.82%和0.91%。結(jié)果表明:非線性GA-BP-Adaboost模型效果較優(yōu),原因可能是XY雙變量特征提取法獲取了大量非線性特征變量,而神經(jīng)網(wǎng)絡(luò)模型通過(guò)多個(gè)神經(jīng)元的深度訓(xùn)練能夠較好地實(shí)現(xiàn)非線性特征變量的擬合。與Song等[2]所構(gòu)建CV特征模型結(jié)果相比較,本研究所構(gòu)建PLSR和GA-BP-Adaboost模型的RSDP值分別下降了0.34%和1.25%。原因可能是:Song等采用了一種集成變量選擇法,即將回歸系數(shù)法、 套索法、 競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算采樣法、 遞歸加權(quán)偏最小二乘法、 顯著性多元相關(guān)法、 最小冗余最大相關(guān)性選取的6個(gè)變量子集分別構(gòu)建PLSR模型,根據(jù)RMSECV值選取前3個(gè)變量子集合并作為最終集成變量特征提取結(jié)果。然而該方法所選用的特征提取方法均屬于X自變量特征提取法,僅能提取符合朗伯比爾線性定律的金屬元素譜線,無(wú)法提取與CV相關(guān)的C和O等非金屬元素特征譜線。因此,將XY雙變量特征提取法與GA-BP-Adaboost非線性多元回歸模型相結(jié)合能夠顯著提升傳統(tǒng)X自變量特征模型效果,可以用于秸稈炭CV精準(zhǔn)預(yù)測(cè)。
圖6 模型預(yù)測(cè)結(jié)果Fig.6 Model prediction results
針對(duì)傳統(tǒng)X自變量特征提取方法在LIBS定量分析秸稈炭CV過(guò)程中缺陷問(wèn)題,提出了一種XY雙變量特征提取法。首先分析了秸稈炭CV與各元素含量之間相關(guān)性,基于相關(guān)性顯著性分析結(jié)果選取與CV相關(guān)的Y型特征變量,主要包含C,O,H和Na元素分析線展寬波段;同時(shí)通過(guò)篩選多變量線性模型回歸系數(shù)閾值獲取與CV相關(guān)的X型特征變量,主要包含Ca,Cr,Mg和K元素分析線光譜。進(jìn)一步采用所提取特征變量構(gòu)建秸稈炭CV非線性神經(jīng)網(wǎng)絡(luò)模型,其AREP和RSDP值明顯低于相關(guān)文獻(xiàn)報(bào)道的特征模型結(jié)果。結(jié)果表明:XY雙變量特征提取法結(jié)合GA-BP-Adaboost模型可以用于秸稈炭CV精確定量預(yù)測(cè)分析。