李超 陳勛 張立新 馬心雨 黃英來
(東北林業(yè)大學(xué),哈爾濱,150040)
竹子(Bambusoideae)是地球上生長最快、用途最廣的植物,是一種豐富的可持續(xù)資源。竹林約占世界森林總面積的1%,全球共有3 150萬hm2的竹林,其中60%集中在中國、印度和巴西等快速發(fā)展的國家。我國竹子資源豐富,材質(zhì)優(yōu)異,生長快,有顯著的經(jīng)濟(jì)、生態(tài)和社會(huì)效益,可以代替木材作為建筑材使用[1]。建筑材的力學(xué)強(qiáng)度決定了建筑的承載力和牢固性,所以本試驗(yàn)以展平竹為研究對(duì)象展開分析?,F(xiàn)有的力學(xué)性能檢測(cè)方法一般是傳統(tǒng)的彎曲機(jī)械測(cè)量法,通過機(jī)械彎曲得到評(píng)價(jià)竹材產(chǎn)品性能最重要的兩個(gè)力學(xué)性能指標(biāo)——斷裂模量(MOR)和彈性模量(MOE)。這種方法雖然準(zhǔn)確可靠,但它耗時(shí)、具有破壞性,并且造成了材料浪費(fèi)。因此提出一種可靠、準(zhǔn)確和快速的計(jì)算機(jī)判別竹材力學(xué)強(qiáng)度的方法,對(duì)竹材的分析有重要的指導(dǎo)意義。
近紅外光譜技術(shù)(NIR)是現(xiàn)在國際上公認(rèn)的最有應(yīng)用價(jià)值的分析技術(shù)之一,在分析竹材的物理性能方面前途廣闊。近紅外光譜主要是由于分子振動(dòng)的非諧振性使分子振動(dòng)從基態(tài)向高能級(jí)躍遷時(shí)產(chǎn)生的,記錄的主要是含氫基團(tuán)振動(dòng)的倍頻和合頻吸收,不同基團(tuán)或不同化學(xué)環(huán)境中的近紅外吸收波長與強(qiáng)度都有明顯差別,所以近紅外光譜具有豐富的結(jié)構(gòu)和組成信息[2]。20世紀(jì)80年代后,計(jì)算機(jī)技術(shù)飛速發(fā)展,使得近紅外光譜技術(shù)開始慢慢地應(yīng)用于實(shí)際問題中,近紅外光譜也可以結(jié)合現(xiàn)代計(jì)算機(jī)技術(shù)、光譜分析技術(shù)、數(shù)理統(tǒng)計(jì)以及化學(xué)計(jì)量學(xué)等多個(gè)領(lǐng)域,其獨(dú)特性得到日益廣泛的應(yīng)用。發(fā)展到現(xiàn)在,近紅外光譜儀器越來越小型化,相關(guān)技術(shù)越來越成熟,逐漸應(yīng)用在農(nóng)業(yè)生產(chǎn)、石油化工、食品制藥、林業(yè)應(yīng)用等許多方面[3]。例如,李耀翔[4]等利用近紅外光譜結(jié)合非線性偏最小二乘法對(duì)落葉松(Larixgmelinii(Rupr.) Kuzen)密度進(jìn)行了精準(zhǔn)預(yù)測(cè);江澤慧[5]等分別對(duì)杉木(Cunninghamialanceolata(Lamb.) Hook.)的3個(gè)切面采集近紅外光譜進(jìn)行研究,最終得到基于橫切面的密度預(yù)測(cè)精度最高;Tham et al.[6]應(yīng)用電容法與近紅外光譜法對(duì)實(shí)木的密度和含水量進(jìn)行了預(yù)測(cè);Hwang et al.[7]使用近紅外光譜技術(shù)對(duì)韓國的建筑常用樹木松樹進(jìn)行了分類識(shí)別。在竹材的研究中,有很多學(xué)者采用近紅外方法進(jìn)行分析,孫柏玲等[8]通過不同偏最小二乘法對(duì)慈竹(Neosinocalamusaffinis)纖維素結(jié)晶度進(jìn)行建模分析,模型的相關(guān)系數(shù)達(dá)到0.88;Yang et al.[9]建立了偏最小二乘模型對(duì)竹子組分中纖維素、木聚糖和木質(zhì)素進(jìn)行預(yù)測(cè),模型相關(guān)系數(shù)達(dá)到了0.994、0.990和0.996,能夠很好地對(duì)竹材的不同部位進(jìn)行區(qū)分;劉君良等[10]用反向區(qū)間偏最小二乘法優(yōu)選光譜區(qū)間建立了慈竹密度、抗彎強(qiáng)度和順紋抗拉強(qiáng)度模型,其相關(guān)系數(shù)分別為0.85、0.88、0.88;莫軍前等[11]采集3種不同溫度熱處理的毛竹試件的近紅外光譜,利用偏最小二乘法對(duì)竹材進(jìn)行分類,建立抗彎強(qiáng)度預(yù)測(cè)模型,其MOR和MOE預(yù)測(cè)模型的決定系數(shù)別分為0.82和0.55。本文對(duì)經(jīng)高溫軟化后展平的竹板進(jìn)行了多點(diǎn)、多面的近紅外光譜數(shù)據(jù)采集,使用深度學(xué)習(xí)和淺層學(xué)習(xí)模型相結(jié)合的方法,對(duì)展平竹的力學(xué)性能做出預(yù)測(cè),由于傳統(tǒng)的力學(xué)性能檢測(cè)方法耗時(shí)耗力,且具有破壞性,基于近紅外光譜建立竹材力學(xué)性能預(yù)測(cè)模型,近紅外光譜采集方法簡便且快速,能夠?qū)崿F(xiàn)對(duì)竹材的力學(xué)強(qiáng)度進(jìn)行無損、快速預(yù)測(cè)的目的。
深度置信網(wǎng)絡(luò)(DBN)是一種深度網(wǎng)絡(luò)模型,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,它的優(yōu)點(diǎn)主要體現(xiàn)在可以通過逐層預(yù)訓(xùn)練對(duì)網(wǎng)絡(luò)里每個(gè)神經(jīng)元中參數(shù)的初值進(jìn)行優(yōu)化,避免了由于隨機(jī)初始化參數(shù)與理想結(jié)果偏差過大而導(dǎo)致的局部最優(yōu)值的風(fēng)險(xiǎn)。輸入特征經(jīng)過多層網(wǎng)絡(luò)模型的計(jì)算進(jìn)行多次特征變換之后,會(huì)得到更加準(zhǔn)確的特征。但是在多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,模型復(fù)雜度高,難以收斂,深度置信網(wǎng)絡(luò)解決了這一難題,通過逐層預(yù)訓(xùn)練避免了對(duì)多層神經(jīng)網(wǎng)絡(luò)直接進(jìn)行訓(xùn)練所帶來的高復(fù)雜度的問題[12]。局部支持回歸向量(LSVR)是對(duì)每一個(gè)測(cè)試樣本分別構(gòu)造單獨(dú)的模型,并且選用不同的局部訓(xùn)練樣本構(gòu)造模型,很好地改善了近紅外分析法中模型非線性度不夠的缺點(diǎn),是當(dāng)前淺層學(xué)習(xí)中預(yù)測(cè)能力較為準(zhǔn)確的模型[8]。
根據(jù)以上背景,本文將深度置信網(wǎng)絡(luò)與局部支持向量回歸相結(jié)合,建造DBN_LSVR預(yù)測(cè)模型,并根據(jù)算法原理與實(shí)驗(yàn)條件合理的設(shè)置整體網(wǎng)絡(luò)模型的參數(shù),用于竹材力學(xué)性能的預(yù)測(cè)。
本文采用的竹材是毛竹(Phyllostachysheterocycla(Carr.) Mitford cv. Pubescens),通過對(duì)毛竹進(jìn)行展平加工得到平直狀的竹片,竹片尺寸為長2 m、寬140 mm、厚8 mm,再經(jīng)過對(duì)其表面拋光,得到厚度為6 mm的板材。
由于竹子的結(jié)構(gòu)與木材不同,竹干為空心圓柱形,不能通過鋸切直接得到大而平的表面板,要對(duì)竹子進(jìn)行展平加工,加工過程如圖1所示,將一定長度范圍內(nèi)的原竹開槽處理后,先對(duì)其進(jìn)行高溫軟化處理,軟化使竹簡的展開槽增大并具有了暫時(shí)的塑性,然后將竹簡在機(jī)械壓力的作用下展成平直狀的竹片。相對(duì)于原竹材,竹展平板的靜曲強(qiáng)度和彈性模量都有所下降,但展平竹板的力學(xué)性能符合質(zhì)量要求,基本不影響其后續(xù)的加工利用[13]。
圖1 扁平化竹材生產(chǎn)工藝
本試驗(yàn)采用的展平竹為2 m(長)×140 mm(寬)×8 mm(厚)的板材。因含水率高,需經(jīng)干燥后再加工。先將展平竹長度切削至1 280 mm,如圖2所示。展平竹的硬度較高,不適宜機(jī)器直接縱向切削,試驗(yàn)采用刨光機(jī)對(duì)展平竹2面刨光。刨光后再次進(jìn)行砂磨,砂磨至厚度為6 mm。此時(shí)紅色消去,竹節(jié)仍舊清晰可見。從切削好的試件中選出500個(gè)樣本作為試驗(yàn)樣本。由于試驗(yàn)材料是展平竹板,厚度小,竹板在受力過程中主要是切向平面受力,縱向平面對(duì)竹材的力學(xué)性能影響小,因此在展平竹板的力學(xué)性能研究中,只考慮展平竹板切向平面的力學(xué)性能。
圖2 展平竹板材
試驗(yàn)選用美國Ocean Optical公司生產(chǎn)的光譜儀收集近紅外光譜。光譜儀配有光纖探針,其波長范圍為900~1 700 nm,分辨率為3.0 nm。通過直徑約5 mm的光纖探針獲得實(shí)驗(yàn)所用展平竹的NIR光譜。在環(huán)境溫度、濕度相對(duì)穩(wěn)定的條件下采集光譜數(shù)據(jù)。測(cè)定固體樣品的NIR光譜時(shí),一般要測(cè)定樣品不同面的光譜以減少測(cè)定誤差并獲得可靠的信息,有時(shí)可以進(jìn)行光譜的重復(fù)測(cè)定以提高光譜圖的信噪比,信噪比就是光譜數(shù)據(jù)中信號(hào)與噪聲的比例,信噪比越大,光譜數(shù)據(jù)的噪聲越小。
SPEC View 7.1用于收集和記錄光譜,在實(shí)驗(yàn)中采集竹材切向采集面的紅外光譜數(shù)據(jù),對(duì)于每個(gè)掃描點(diǎn),收集30次掃描并將其平均為單個(gè)光譜。如圖3所示,采集樣本切向采集面上的8個(gè)光譜,這樣的8個(gè)光譜作為這一樣本的光譜數(shù)據(jù),在竹材力學(xué)性能的預(yù)測(cè)模型中作為影響因子使用。近紅外光譜的測(cè)量過程如圖4所示。
圖3 探頭光譜采集點(diǎn)示意圖
圖4 近紅外光譜測(cè)量過程
由于光譜數(shù)據(jù)除了純光譜之外還包含基線漂移、噪聲等信號(hào),與此同時(shí)存在著因樣本自身因素以及環(huán)境等因素帶來的譜線偏移,采集到的光譜數(shù)據(jù)需要經(jīng)過處理之后才能使用[14]。在近紅外光譜數(shù)據(jù)的處理中,采用了Savitzky-Golay平滑濾波的方法,核心思想是通過k階多項(xiàng)式擬合某個(gè)長度窗口中的數(shù)據(jù)點(diǎn),然后得到擬合結(jié)果在離散化之后,S-G濾波實(shí)際上是移動(dòng)窗口的加權(quán)平均算法,但其加權(quán)系數(shù)不是簡單的常數(shù)窗口,而是通過滑動(dòng)窗口中給定高階多項(xiàng)式的最小二乘擬合[15]。
彈性模量(MOE)與靜曲強(qiáng)度(也叫斷裂模量MOR)是兩種典型的力學(xué)性能常量,它們可以有效反應(yīng)木材的力學(xué)性能。
本次試驗(yàn)采用萬能試驗(yàn)機(jī),對(duì)單元材料試驗(yàn)樣本分別進(jìn)行4點(diǎn)彎曲試驗(yàn),采集其MOR、MOE分別記錄。竹材力學(xué)性能參數(shù)如表1所示,500個(gè)樣本的力學(xué)性能的數(shù)據(jù)統(tǒng)計(jì):彈性模量均值5 424 MPa、彈性模量最大值9 462 MPa、彈性模量最小值3 704.17 MPa、斷裂模量均值82.48 MPa、斷裂模量最大值132.15 MPa、斷裂模量最小值26.44 MPa。
表1 試件力學(xué)性能參數(shù)
深度學(xué)習(xí)在回歸預(yù)測(cè)領(lǐng)域的研究相比于分類問題研究較少,當(dāng)前主流的深度學(xué)習(xí)回歸預(yù)測(cè),其隱藏層層數(shù)一般設(shè)置2到3層。原因主要有兩個(gè),一是如果模型的層數(shù)增多,模型內(nèi)部和模型外部設(shè)置的參數(shù)也會(huì)增多,所需的數(shù)據(jù)量將會(huì)變多。二是當(dāng)構(gòu)建大多數(shù)結(jié)構(gòu)化的數(shù)據(jù)集時(shí),已經(jīng)預(yù)先進(jìn)行了特征的選擇,所以不需要使用層數(shù)很多的模型對(duì)特征進(jìn)行高度抽象。本文中單一板材近紅外光譜和力學(xué)性能數(shù)據(jù)量較少,因此綜合考慮,只選取了有兩個(gè)隱藏層的深度置信網(wǎng)絡(luò)學(xué)習(xí)特征。
本文的模型采用的深度置信網(wǎng)絡(luò)是由多個(gè)受限玻爾茲曼機(jī)層和一層BP神經(jīng)網(wǎng)絡(luò)構(gòu)成的一種深度網(wǎng)絡(luò)模型[16]。使用多個(gè)隱藏層的網(wǎng)絡(luò)模型能夠?qū)斎胩卣鬟M(jìn)行多次特征變換,得到更有效的特征[17],逐層預(yù)訓(xùn)練有效地避免了對(duì)多層神經(jīng)網(wǎng)絡(luò)直接進(jìn)行訓(xùn)練所帶來的高復(fù)雜度的問題,深度置信網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。
基于DBN_LSVR的單一板材的MOR與MOE預(yù)測(cè)過程如下:
(1)近紅外光譜預(yù)處理。將近紅外光譜數(shù)據(jù)進(jìn)行歸一化與去噪處理。
(2)設(shè)置DBN輸入層節(jié)點(diǎn)個(gè)數(shù)即影響因子數(shù)為16,輸出節(jié)點(diǎn)個(gè)數(shù)設(shè)置為2,隱藏層設(shè)置為2層,每層節(jié)點(diǎn)個(gè)數(shù)為8個(gè)。
(3)逐層預(yù)訓(xùn)練。使用訓(xùn)練集的數(shù)據(jù)對(duì)DBN的兩個(gè)RBM逐個(gè)進(jìn)行無監(jiān)督學(xué)習(xí),讓每個(gè)RBM的參數(shù)達(dá)到局部最優(yōu)。
(4)有監(jiān)督微調(diào)。將輸出層與訓(xùn)練完成的兩個(gè)RBM組成一個(gè)4層的BP神經(jīng)網(wǎng)絡(luò),對(duì)其進(jìn)行有監(jiān)督訓(xùn)練,并將誤差逐層反向傳播,調(diào)整各層參數(shù),直至收斂。
(5)提取出第二個(gè)隱藏層的特征。訓(xùn)練好的DBN對(duì)數(shù)據(jù)集的影響因子進(jìn)行特征學(xué)習(xí),令最后一個(gè)隱藏層的數(shù)據(jù)為得到的新特征。
(6)構(gòu)建預(yù)測(cè)模型。使用新特征和LSVR構(gòu)建竹材力學(xué)性能預(yù)測(cè)模型,對(duì)預(yù)測(cè)集進(jìn)行預(yù)測(cè)。
流程如圖6所示。
v0為輸入數(shù)據(jù),V0為輸入層,H為隱藏層,W為兩層之間的連接權(quán)重,Y為輸出層,y為輸出值,BP為深度置信網(wǎng)絡(luò)中的BP神經(jīng)網(wǎng)絡(luò),RBM1為深度置信網(wǎng)絡(luò)中的RBM模型,n為網(wǎng)絡(luò)中的總層數(shù)。
圖6 DBN-LSVR預(yù)測(cè)流程圖
為了檢驗(yàn)預(yù)測(cè)模型對(duì)竹材力學(xué)性能預(yù)測(cè)能力以及模型的泛化能力,本文使用已經(jīng)構(gòu)建的預(yù)測(cè)模型對(duì)預(yù)測(cè)集樣本進(jìn)行預(yù)測(cè)。使用平均絕對(duì)誤差(EMA)、均方根誤差(ERMS)作為發(fā)生程度的評(píng)價(jià)指標(biāo),表達(dá)公式如下所示:
為驗(yàn)證DBN_LSVR預(yù)測(cè)模型的預(yù)測(cè)效果,將DBN_LSVR預(yù)測(cè)模型與DBN、LSVR、BP3種預(yù)測(cè)模型的預(yù)測(cè)效果進(jìn)行對(duì)比,根據(jù)模型的預(yù)測(cè)值和真實(shí)值,分別計(jì)算幾種模型的平均絕對(duì)誤差和均方根誤差,比較模型平均絕對(duì)誤差和均方根誤差的大小來檢驗(yàn)?zāi)P偷牧W(xué)性能預(yù)測(cè)能力。
鑒于試驗(yàn)數(shù)據(jù)采集過程中存在系統(tǒng)噪聲和測(cè)量噪聲,而噪聲的存在不利于后續(xù)數(shù)據(jù)分析,因此本文采用Savitzky-Golay平滑濾波對(duì)光譜數(shù)據(jù)的測(cè)量值進(jìn)行濾波。如圖7所示,給出了一個(gè)竹材樣本取的3個(gè)點(diǎn)的波長—吸光度曲線,當(dāng)波長范圍在1 400~1 700 nm時(shí),由于近紅外光譜受到噪聲干擾,光譜信號(hào)強(qiáng)度出現(xiàn)嚴(yán)重的“毛刺”現(xiàn)象。利用Matlab的sgolayfilt函數(shù),設(shè)置多項(xiàng)式階次為3,窗口框長度為7,在相同波長范圍下、同一竹材經(jīng)S-G濾波處理后得到的近紅外光譜曲線如圖8所示,相較于濾波前,近紅外光譜的輪廓更加清晰,吸收峰更加明顯,這有利于后續(xù)預(yù)測(cè)模型的分析。
圖7 原始光譜圖
將每個(gè)竹材的8個(gè)光譜數(shù)據(jù)堆疊成高維矩陣作為數(shù)據(jù)集的原始數(shù)據(jù)部分,將對(duì)應(yīng)力學(xué)數(shù)據(jù)作為數(shù)據(jù)集的標(biāo)簽,進(jìn)而組成竹材的近紅外光譜數(shù)據(jù)集。本文采集了500組近紅外光譜數(shù)據(jù),隨機(jī)抽取330個(gè)樣本組成訓(xùn)練集,170個(gè)樣本組成測(cè)試集。
使用DBN_LSVR預(yù)測(cè)模型對(duì)單一板材的MOR與MOE進(jìn)行預(yù)測(cè),將預(yù)測(cè)值與真實(shí)值進(jìn)行對(duì)比,繪制出真實(shí)值曲線和預(yù)測(cè)值曲線,比較兩條曲線的擬合效果,試驗(yàn)結(jié)果如圖9所示。
圖8 預(yù)處理后的光譜
圖9 模型預(yù)測(cè)值與真實(shí)值對(duì)比
從圖9可以看出,對(duì)于測(cè)試集樣本,DBN_LSVR預(yù)測(cè)值與實(shí)際值擬合較好,預(yù)測(cè)值曲線與真實(shí)值曲線擬合較好,可以較為有效地對(duì)展平竹的力學(xué)性能進(jìn)行預(yù)測(cè)。
為了進(jìn)一步驗(yàn)證DBN_LSVR對(duì)竹材的MOR與MOE的預(yù)測(cè)能力,將該預(yù)測(cè)方法的預(yù)測(cè)結(jié)果與DBN、LSVR、BP等模型進(jìn)行對(duì)比試驗(yàn),使用均方根誤差、平均絕對(duì)誤差對(duì)各個(gè)模型的預(yù)測(cè)能力進(jìn)行評(píng)價(jià)(表2和表3)。
表2 平竹MOR預(yù)測(cè)誤差
表3 平竹MOE預(yù)測(cè)誤差
根據(jù)表2、表3可以看出,通過預(yù)測(cè)模型誤差的對(duì)比,DBN_LSVR模型的平均絕對(duì)誤差和均方根誤差明顯小于其他幾種模型的預(yù)測(cè)誤差,DBN-LSVR模型的預(yù)測(cè)效果較好,這說明構(gòu)建深度學(xué)習(xí)建立預(yù)測(cè)模型的預(yù)測(cè)效果較好,模型的預(yù)測(cè)數(shù)據(jù)較為準(zhǔn)確,對(duì)特征進(jìn)行學(xué)習(xí)可以有效地降低預(yù)測(cè)誤差。DBN_LSVR是所有模型中預(yù)測(cè)誤差最低的,因?yàn)樵撃P褪褂肈BN進(jìn)行特征的自動(dòng)提取,學(xué)習(xí)到的新特征優(yōu)于原特征,并使用新特征在LSVR進(jìn)行建模,充分發(fā)揮LSVR的優(yōu)勢(shì),提高預(yù)測(cè)準(zhǔn)確率。
計(jì)算預(yù)測(cè)模型的相關(guān)系數(shù),MOR和MOE預(yù)測(cè)模型的相關(guān)系數(shù)分別為0.85和0.80,預(yù)測(cè)效果較好,模型的預(yù)測(cè)值與真實(shí)值吻合較好,由此可知,利用該預(yù)測(cè)模型可以預(yù)測(cè)單一板材的MOR、MOE。
針對(duì)現(xiàn)有主流竹材力學(xué)性能彎曲機(jī)械測(cè)量檢測(cè)方法耗時(shí)、且具有破壞性的問題,本文提出了一種基于近紅外光譜的DBN_LSVR竹材力學(xué)強(qiáng)度無損預(yù)測(cè)方法。
首先,對(duì)竹材進(jìn)行展平加工獲得展平竹,并對(duì)每個(gè)展平竹進(jìn)行8點(diǎn)紅外光譜數(shù)據(jù)采集和彈性模量、斷裂模量測(cè)試。其次,針對(duì)實(shí)驗(yàn)過程中系統(tǒng)噪聲和測(cè)量噪聲擾動(dòng)嚴(yán)重的問題,對(duì)紅外光譜數(shù)據(jù)進(jìn)行Savitzky-Golay平滑濾波,并以濾波后紅外光譜數(shù)據(jù)作為主體,彈性模量和斷裂模量作為標(biāo)簽,構(gòu)建近紅外光譜竹材力學(xué)性能數(shù)據(jù)集。最后,在上述數(shù)據(jù)集的基礎(chǔ)上,分別構(gòu)建DBN_LSVR深層神經(jīng)網(wǎng)絡(luò)進(jìn)行彈性模量、斷裂模量性能預(yù)測(cè)。選用DBN的原因是其多隱藏層可以對(duì)特征進(jìn)行更好的學(xué)習(xí),選用LSVR的原因是其泛化能力強(qiáng),從而進(jìn)行更精準(zhǔn)的預(yù)測(cè)。
基于DBN_LSVR的深層神經(jīng)網(wǎng)絡(luò)模型對(duì)竹材MOR和MOE的均方根預(yù)測(cè)誤差分別為716.23、17.54,平均絕對(duì)預(yù)測(cè)誤差分別為524.40、16.82;MOR和MOE預(yù)測(cè)模型的相關(guān)系數(shù)分別為0.85和0.80。實(shí)驗(yàn)結(jié)果表明DBN_LSVR預(yù)測(cè)模型相較于單獨(dú)使用DBN、LSVR、BP神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)效果更優(yōu),可有效預(yù)測(cè)竹材的力學(xué)性能。本文提出的預(yù)測(cè)方法在不對(duì)竹材造成破壞的基礎(chǔ)上,縮短了判別竹材物理性能的時(shí)間和成本,為竹材力學(xué)性能的理論分析提供了技術(shù)支持。