何 拓 劉守佳 陸 楊 張永剛 焦立超 殷亞方
(中國林業(yè)科學(xué)研究院木材工業(yè)研究所 中國林業(yè)科學(xué)研究院木材標(biāo)本館 北京 100091)
隨著全球森林資源貿(mào)易量劇增,以《瀕危野生動植物物種國際貿(mào)易公約》(Convention on International Trade in Endangered Species of Wild Fauna and Flora,CITES)管制物種為代表的木材貿(mào)易成為全球關(guān)注的焦點(diǎn)(Lewisetal., 2015; Brancalionetal., 2018)。截至2019年,CITES已將超過500種木材樹種列入附錄進(jìn)行管制(焦立超等, 2019)。我國是CITES的締約國之一,也是全球最大的木材進(jìn)口國, 2019年木材進(jìn)口量1.14億m3,同比增長1.72%, 木材缺口持續(xù)增加,木材資源對外依存度超過50%(王登舉, 2019),我國的木材貿(mào)易,特別是以CITES附錄所列黃檀屬(Dalbergiaspp.)、紫檀屬(Pterocarpusspp.)和古夷蘇木屬(Guibourtia spp.)等樹種為代表的瀕危珍貴木材進(jìn)口貿(mào)易受到國際社會廣泛關(guān)注; 同時,《國家重點(diǎn)保護(hù)野生植物名錄(第一批)》也將降香黃檀(Dalbergiaodorifera)、黑黃檀(Dalbergiacultrate)和印度紫檀(Pterocarpusindicus)等樹種列入名錄進(jìn)行保護(hù)。但在利益的驅(qū)動下,瀕危珍貴木材及木制品在貿(mào)易流通環(huán)節(jié)中非法走私、以假充真和以次充好等現(xiàn)象時常發(fā)生,給國際履約執(zhí)法和我國林產(chǎn)品產(chǎn)業(yè)發(fā)展帶來了嚴(yán)峻挑戰(zhàn)。因此,實(shí)現(xiàn)木材樹種的科學(xué)識別,是我國提升CITES履約執(zhí)法能力、加強(qiáng)林產(chǎn)品產(chǎn)業(yè)鏈監(jiān)管以及保障木材安全的重要科學(xué)途徑。
“種”是木材分類的基本單元,位于分類單位“屬”之下。傳統(tǒng)木材解剖學(xué)方法通過宏觀和微觀構(gòu)造特征對木材進(jìn)行分類和識別,一般只能確定到“屬”的水平(Wiedenhoeftetal., 2019),無法滿足國際履約執(zhí)法和國內(nèi)市場監(jiān)管需求。近年來發(fā)展的DNA條形碼(Jiaoetal., 2018)、近紅外光譜(Kanayamaetal., 2019)、氣相色譜質(zhì)譜聯(lián)用(Zhangetal., 2019a)和實(shí)時直接分析質(zhì)譜(Deklercketal., 2019; Zhangetal., 2019b)等方法,雖然有望實(shí)現(xiàn)木材“種”的識別,但構(gòu)建完善可靠的木材相應(yīng)分類特征(DNA序列、化學(xué)指紋圖譜等)參考數(shù)據(jù)庫需耗費(fèi)大量人力財力; 而且,受限于測試手段和裝置,上述方法仍無法在口岸現(xiàn)場等場景下對大批量木材樣本進(jìn)行快速高效識別,大大限制了其發(fā)展和應(yīng)用。因此,亟待開展其他木材識別方法研究,彌補(bǔ)現(xiàn)有方法手段的缺陷和不足,以實(shí)現(xiàn)木材在“種”水平的自動精準(zhǔn)識別。
隨著計算機(jī)技術(shù)的快速發(fā)展,圖像分類為木材樹種精準(zhǔn)快速識別提供了新的思路(劉子豪等, 2013)。不同于木材DNA序列和化學(xué)指紋圖譜等分類特征,木材構(gòu)造特征可通過圖像形式便捷獲取,且構(gòu)建木材構(gòu)造特征圖像分類特征庫更加省時省力。但值得注意的是,木材構(gòu)造特征圖像屬于細(xì)粒度圖像范疇(鄧旭冉等, 2019),具有不同樹種間特征差異小、同一樹種內(nèi)特征差異大的特點(diǎn),采用傳統(tǒng)圖像識別方法難以解決木材關(guān)鍵識別特征自動提取和精準(zhǔn)分類的問題。近年來快速發(fā)展起來的深度學(xué)習(xí)方法(LeCunetal., 2015)可通過多層卷積神經(jīng)網(wǎng)絡(luò)深度解析圖像大數(shù)據(jù),自動提取識別特征,實(shí)現(xiàn)圖像準(zhǔn)確快速分類,為木材識別新技術(shù)的發(fā)展奠定了前期基礎(chǔ)。
本研究以瀕危珍貴黃檀屬和紫檀屬樹種為主要研究對象,在建立木材構(gòu)造特征圖像數(shù)據(jù)集的基礎(chǔ)上,通過構(gòu)建基于不同卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,實(shí)現(xiàn)木材識別特征的自動提取和精準(zhǔn)分類,以期為木材“種”的自動精準(zhǔn)識別提供新思路,為我國提升CITES履約執(zhí)法能力、加強(qiáng)林產(chǎn)品產(chǎn)業(yè)鏈監(jiān)管以及保障木材安全提供科技支撐。
木材標(biāo)本來源于巴西圣保羅技術(shù)研究所木材標(biāo)本館(BCTw)、中國林業(yè)科學(xué)研究院木材標(biāo)本館(CAFw)、美國林產(chǎn)品實(shí)驗(yàn)室木材標(biāo)本館(MADw和SJRw)和巴西圣保羅林業(yè)研究所木材標(biāo)本館(SPSFw),包含15種黃檀屬和11種紫檀屬木材共417份。其他木材樣本采集自廣東省東莞魚珠木材交易市場(YZ),包含13種黃檀屬和9種紫檀屬木材共110份。試驗(yàn)?zāi)静臉悠穪碓春蛿?shù)量信息如表1所示。
1) 木材樣品表面處理: 對木材樣品橫切面進(jìn)行砂光,使砂光后的樣品表面光滑、無砂光痕跡,且導(dǎo)管、軸向薄壁細(xì)胞等未被堵塞或破壞。
表1 木材標(biāo)本館(He et al., 2020a)和木材市場的樣品及其構(gòu)造特征圖像來源和數(shù)量基本信息Tab.1 The information of wood samples and collected anatomical images from wood collections(He et al., 2020a) and market
2) 木材構(gòu)造特征圖像采集: 利用iWood專業(yè)圖像采集裝置對砂光后的木材樣品橫切面采集8位圖RGB圖像,圖像采集分辨率為2 048像素×2 048像素。圖像采集區(qū)域覆蓋樣品整個橫切面,且互不重疊,可充分代表木材橫切面不同類型的構(gòu)造特征。
3) 木材構(gòu)造特征圖像數(shù)據(jù)集建立: 從采集的圖像中刪除存在缺陷和質(zhì)量較低的圖像,并對保留的圖像添加標(biāo)簽,建立圖像數(shù)據(jù)集Rosewood-26。采集自417份木材標(biāo)本的10 237幅圖像用于模型訓(xùn)練和驗(yàn)證,采集自110份木材樣本的550幅圖像用于模型泛化能力(模型對未知樣本的識別能力)測試。
構(gòu)建AlexNet(Krizhevskyetal., 2012; Heetal., 2020a)、VGG16(Simonyanetal., 2014)、DenseNet-121(Iandolaetal., 2014)和ResNet-50(Heetal., 2015)4種卷積神經(jīng)網(wǎng)絡(luò)模型。模型基本架構(gòu)包括卷積層(convolution layer)、池化層(pooling layer)和全連接層(fully-connected layer),其中,卷積層和池化層用于自動提取特征,全連接層用于分類識別。在卷積層與全連接層之間,進(jìn)行線性整流激活函數(shù)(rectified linear unit, ReLU)、局部響應(yīng)規(guī)一化(local response normalization, LRN)、池化(pooling)和隨機(jī)抑制(dropout)等操作,以防止網(wǎng)絡(luò)訓(xùn)練過程中出現(xiàn)訓(xùn)練集模型識別精度高而測試集模型識別精度低的過擬合問題。
在卷積神經(jīng)網(wǎng)絡(luò)每個卷積層和前2個全連接層后均使用ReLU作為激活函數(shù):
f(x)=max(0,x)。
(1)
ReLU函數(shù)定義了神經(jīng)元線性變換后的非線性輸出結(jié)果,對進(jìn)入神經(jīng)元的來自上一層神經(jīng)網(wǎng)絡(luò)的輸入向量x,使用線性整流激活函數(shù)的神經(jīng)元會輸出max(0,x)至下一層神經(jīng)元或作為整個神經(jīng)網(wǎng)絡(luò)的輸出。ReLU函數(shù)的優(yōu)點(diǎn)是可以緩解梯度消失問題,加快網(wǎng)絡(luò)訓(xùn)練速度(Nairetal., 2010),與Sigmoid等其他非線性激活函數(shù)相比,ReLU函數(shù)更加簡單快速。
LRN模仿了生物神經(jīng)系統(tǒng)的“側(cè)抑制”,即被激活的神經(jīng)元會抑制相鄰神經(jīng)元。在ReLU函數(shù)后加入LRN的目的是調(diào)節(jié)神經(jīng)元的響應(yīng),使響應(yīng)值較大的神經(jīng)元變得相對更大,同時抑制相鄰響應(yīng)較小的神經(jīng)元,從而提高模型泛化能力。LRN計算方法如下:
(2)
池化在降低特征圖譜(feature map)維度和減少參數(shù)的同時,一定程度上保留了樣本主要特征,起到防止過擬合的作用。池化是一種下采樣方法,通常包括最大池化(max pooling)和平均池化(mean pooling)2種方式,本研究采用最大池化方式,保留更顯著的圖像特征,以更好地防止過擬合。
圖1 原始圖像預(yù)處理流程(以印度紫檀圖像為例)Fig.1 The flow diagram of the original image pre-processing(Pterocarpus indicus as an example)
隨機(jī)抑制是在神經(jīng)網(wǎng)絡(luò)前向訓(xùn)練過程中,保持輸入不變,隨機(jī)選擇一部分隱層神經(jīng)元進(jìn)行運(yùn)算并保留記錄,從而在反向傳播時更新這些神經(jīng)元對應(yīng)的參數(shù)(Hintonetal., 2012)。本研究中,Dropout層設(shè)置在前2個全連接層后,以解決全連接層的過擬合問題。
圖2 木材構(gòu)造特征原始圖像和均衡處理后圖像塊樣本數(shù)量分布Fig.2 The quantity distribution of original anatomical images and the patches after balance processing
1.4.1 圖像預(yù)處理 對于圖像分辨率為2 048像素×2 048像素的高維RGB數(shù)據(jù),若直接使用原始數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,不僅運(yùn)算量大、模型訓(xùn)練耗時長,而且各類別樣本數(shù)據(jù)差異較大,不平衡的訓(xùn)練樣本會影響模型訓(xùn)練精度,容易出現(xiàn)過擬合問題。因此,本研究在模型訓(xùn)練前對原始數(shù)據(jù)進(jìn)行2種預(yù)處理(Heetal., 2020a): 1) 截取圖像塊并縮小,首先從原始圖像中截取1 200像素×1 200像素圖像塊,然后將其縮小為227像素×227像素圖像塊作為最終訓(xùn)練圖像,以極大降低數(shù)據(jù)維度(圖1); 2) 數(shù)據(jù)集劃分,在保證圖像塊重疊率小于20%的條件下,對于樣本數(shù)量較多的類別,從每個圖像樣本中截取較少圖像塊,對于樣本數(shù)量較少的類別,從每個圖像樣本中截取較多圖像塊。樣本原始圖像和均衡處理后圖像塊的樣本數(shù)量分布如圖2所示,經(jīng)均衡處理的樣本數(shù)量方差從0.025 064減小至0.00 557。預(yù)處理后,采集于26種木材標(biāo)本的10 237幅原始圖像擴(kuò)充為132 265個圖像塊樣本,隨機(jī)選取其中30 896、3 871和3 829個圖像塊樣本分別作為訓(xùn)練集、驗(yàn)證集和測試集。
1.4.2 模型訓(xùn)練 基于谷歌開放數(shù)據(jù)集ImageNet對模型進(jìn)行預(yù)訓(xùn)練后,微調(diào)模型參數(shù),利用木材構(gòu)造特征圖像數(shù)據(jù)集Rosewood-26對模型進(jìn)行遷移學(xué)習(xí)(Panetal., 2010)。采用隨機(jī)梯度下降(stochastic gradient descent,SGD)方法加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練,每次讀取400個圖像塊樣本,每265次迭代完成一輪(epoch)樣本訓(xùn)練,設(shè)置基礎(chǔ)學(xué)習(xí)率(learning rate)、動量(momentum)和權(quán)值衰減(weight decay)等參數(shù),用于獲得較快梯度下降速度并控制模型復(fù)雜度以防止過擬合。
1.4.3 模型測試 模型測試分2個步驟: 1) 采用3 829個圖像塊樣本對模型進(jìn)行測試,輸出混淆矩陣(confusion matrix),并將每類測試樣本單獨(dú)輸出,得到所有誤判樣本,用于進(jìn)一步分析模型的樹種識別能力; 2) 采用收集自交易市場的木材樣品圖像樣本對模型進(jìn)行進(jìn)一步測試,計算模型識別精度,評價模型泛化能力。
比較本研究構(gòu)建的4種卷積神經(jīng)網(wǎng)絡(luò)模型,AlexNet模型僅5層,結(jié)構(gòu)最簡單,模型訓(xùn)練時間最短,但模型識別精度最低; VGG16和DenseNet-121模型識別精度較高,但2種模型分別具有最多的權(quán)重數(shù)量和最長的訓(xùn)練時間,不利于模型參數(shù)調(diào)節(jié)和優(yōu)化,且消耗較多算力資源; ResNet-50模型深度雖達(dá)50層,但其權(quán)重數(shù)量最少,訓(xùn)練時間相對較短,識別精度最高(表2)。深度學(xué)習(xí)模型網(wǎng)絡(luò)層數(shù)對模型性能具有重要影響,網(wǎng)絡(luò)層數(shù)增加后模型可進(jìn)行更加復(fù)雜的特征提取任務(wù),理論上能夠獲得更好的識別結(jié)果,但模型準(zhǔn)確度也可能出現(xiàn)飽和甚至下降現(xiàn)象(Penningtonetal., 2017)。ResNet-50模型利用殘差學(xué)習(xí)解決了模型精度退化問題,近年來在圖像識別領(lǐng)域得到了廣泛應(yīng)用。Ravindran等(2020)構(gòu)建ResNet-34模型對10種楝科(Meliaceae)木材進(jìn)行識別,模型最佳精度為82.7%; 本研究構(gòu)建的ResNet-50模型對26種瀕危珍貴木材的識別精度達(dá)98.33%,顯著高于已有報道結(jié)果。因此,本研究優(yōu)選ResNet-50模型進(jìn)行黃檀屬和紫檀屬樹種木材的分類與識別。
表2 不同卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)和分類精度Tab.2 Parameters and accuracy of various convolutional neural networks
ResNet-50模型輸出的混淆矩陣如圖3所示。在15種黃檀屬木材中,僅有交趾黃檀1幅圖像被誤判為印度紫檀,而在11種紫檀屬木材中,無任何圖像被誤判為黃檀屬,ResNet-50模型在“屬”水平的分類精度接近100%。在“種”水平上,有9種黃檀屬木材(賽州黃檀、絨毛黃檀、東非黑黃檀、降香黃檀、奧氏黃檀、微凹黃檀、印度黃檀、亞馬遜黃檀和危地馬拉黃檀)和3種紫檀屬木材(檀香紫檀、非洲紫檀和染料紫檀)的分類精度達(dá)100%。在黃檀屬木材中,約8.6%的海南黃檀木材被誤判為黃檀,約5.7%的黃檀木材被誤判為印度黃檀,比較海南黃檀、黃檀誤判圖像與真實(shí)樹種圖像,海南黃檀、黃檀和印度黃檀3種木材在構(gòu)造特征上具有較高相似性,采用傳統(tǒng)木材解剖學(xué)方法也難以鑒別。在紫檀屬木材中,安哥拉紫檀、安達(dá)曼紫檀、刺猬紫檀、印度紫檀、大果紫檀和囊狀紫檀6種木材的分類結(jié)果相互混淆,藥用紫檀和羅氏紫檀也出現(xiàn)相互混淆現(xiàn)象。檀香紫檀和染料紫檀木材構(gòu)造特征極為相似,傳統(tǒng)木材解剖學(xué)方法難以將二者準(zhǔn)確鑒別(梅萍等, 2017; Zhangetal., 2019a; 2019b),而本研究構(gòu)建的ResNet-50模型可以成功鑒別檀香紫檀和染料紫檀。在11種紫檀屬木材中,印度紫檀的分類精度最低(93.28%),該樹種分別被誤判為安哥拉紫檀、安達(dá)曼紫檀、刺猬紫檀、大果紫檀和囊狀紫檀。印度紫檀樹種存在較大的種內(nèi)變異性,不同木材樣本呈現(xiàn)多樣性構(gòu)造特征,與同屬其他樹種的木材構(gòu)造特征容易產(chǎn)生混淆(李桂蘭, 2007)。
圖3 采用ResNet-50模型識別15種黃檀屬和11種紫檀屬樹種木材的混淆矩陣Fig.3 Confusion matrix for image classification of 15 Dalbergia species and 11 Pterocarpus species generated by ResNet-50 model
基于構(gòu)建的深度卷積神經(jīng)網(wǎng)絡(luò)模型ResNet-50,本研究開發(fā)了iWood木材自動識別系統(tǒng)(殷亞方等, 2019),用于現(xiàn)場環(huán)境下木材樹種的識別。通過將采集自交易市場木材樣品的110幅圖像上傳至服務(wù)器測試發(fā)現(xiàn),樣品在“屬”和“種”水平的識別精度分別為91.8%和77.3%。雖然該結(jié)果低于測試集的識別精度,但仍表明ResNet-50模型對未知樣本具有較好識別能力,模型未出現(xiàn)明顯過擬合。傳統(tǒng)木材解剖學(xué)方法可以識別木材到“屬”,但難以實(shí)現(xiàn)“種”的準(zhǔn)確識別,且需要專業(yè)人員長期的木材鑒定訓(xùn)練和知識經(jīng)驗(yàn)積累,耗費(fèi)大量人力物力; 相較而言,基于本研究建立的木材構(gòu)造特征圖像數(shù)據(jù)集構(gòu)建的深度卷積神經(jīng)網(wǎng)絡(luò)模型ResNet-50在“屬”水平的木材識別能力與專業(yè)鑒定人員相當(dāng),且識別速度快。同時,本研究首次采用市場來源的木材樣品構(gòu)造特征圖像數(shù)據(jù)集對模型的泛化能力進(jìn)行測試評價,雖然ResNet-50模型在“種”水平的識別精度僅為77.3%,但隨著木材構(gòu)造特征圖像數(shù)據(jù)集的不斷擴(kuò)充以及模型性能的持續(xù)優(yōu)化,模型識別精度有望進(jìn)一步提升,以應(yīng)用于海關(guān)執(zhí)法、木材貿(mào)易和質(zhì)量監(jiān)督檢驗(yàn)等領(lǐng)域,為木材樹種自動精準(zhǔn)識別提供新的途徑。
作為一種可再生生物材料,木材具有生物體普遍存在的天然復(fù)雜性,其構(gòu)造特征通常在種間和種內(nèi)均表現(xiàn)出較明顯的變異性(Heetal., 2020b)。由于在采集、保存和交換等方面存在的局限性,通過木材標(biāo)本無法獲取木材種內(nèi)所有變異特征,因此傳統(tǒng)木材解剖學(xué)方法難以實(shí)現(xiàn)“種”的準(zhǔn)確識別(姜笑梅等, 2010)?;谀静臉?gòu)造特征圖像的深度學(xué)習(xí)方法為木材“種”的準(zhǔn)確識別提供了新思路,木材變異性的構(gòu)造特征可通過圖像形式便捷獲取,突破了傳統(tǒng)木材識別方法依賴實(shí)物標(biāo)本和組織切片獲取木材構(gòu)造特征的局限性。
卷積神經(jīng)網(wǎng)絡(luò)可實(shí)現(xiàn)大數(shù)據(jù)量圖像的有效降維,并保留圖像關(guān)鍵特征,近年來在圖像分類領(lǐng)域得到廣泛應(yīng)用。本研究從正確定名的15種黃檀屬和11種紫檀屬木材標(biāo)本上采集10 237幅木材橫切面構(gòu)造圖像建立木材構(gòu)造特征圖像數(shù)據(jù)集Rosewood-26,為卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練和測試奠定了數(shù)據(jù)基礎(chǔ); 構(gòu)建的AlexNet、VGG16、DenseNet-121和ResNest-50 共4種卷積神經(jīng)網(wǎng)絡(luò)模型對26種瀕危珍貴木材的分類精度分別為93.85%、98.00%、96.00%和98.33%,其中ResNet-50模型分類精度最高。值得注意的是,本研究采用的木材樹種類別及其圖像數(shù)量與深度學(xué)習(xí)領(lǐng)域的大規(guī)模數(shù)據(jù)集(如ImageNet)相比還遠(yuǎn)遠(yuǎn)不足,不同卷積神經(jīng)網(wǎng)絡(luò)模型的分類精度未呈現(xiàn)明顯差異,今后在構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型時,應(yīng)進(jìn)一步綜合考慮模型深度、權(quán)重數(shù)量和訓(xùn)練時間等因素,以實(shí)現(xiàn)卷積神經(jīng)模型性能的最優(yōu)化(Pavindranetal., 2019)。
本研究分別從中國、美國和巴西4個木材標(biāo)本館采集木材標(biāo)本橫切面構(gòu)造特征圖像,建立包含15種黃檀屬和11種紫檀屬木材的高質(zhì)量圖像數(shù)據(jù)集Rosewood-26,該圖像數(shù)據(jù)集包含各樹種不同個體的構(gòu)造特征信息,盡可能多地覆蓋了木材樹種的種內(nèi)變異性,以保證構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)模型具有較好的魯棒性和泛化能力(胡明越, 2019)。同時,為了推動深度學(xué)習(xí)方法在木材圖像識別領(lǐng)域的應(yīng)用,國內(nèi)外木材標(biāo)本館正在采用統(tǒng)一標(biāo)準(zhǔn)進(jìn)行木材標(biāo)本數(shù)字化,建立涵蓋樹種變異性的木材構(gòu)特征圖像數(shù)據(jù)共享平臺,為構(gòu)建更為精準(zhǔn)高效的深度學(xué)習(xí)模型提供盡可能豐富的數(shù)據(jù)資源。未來通過深入開展木材信息學(xué)研究,實(shí)現(xiàn)木材圖像特征可視化,進(jìn)一步揭示樹木木質(zhì)部關(guān)鍵構(gòu)造特征的種間變異規(guī)律,將為木材分類與識別奠定理論基礎(chǔ),為木材“種”水平的自動精準(zhǔn)識別提供科學(xué)依據(jù)(何拓等, 2020; 2021a)。
木材現(xiàn)場快速識別是木材樹種識別領(lǐng)域長期存在的科技難題,傳統(tǒng)木材解剖學(xué)方法一般只能確定到“屬”的水平,同時隨著社會經(jīng)濟(jì)快速發(fā)展和社會分工越來越精細(xì)化,具有豐富經(jīng)驗(yàn)的木材鑒定專業(yè)人員數(shù)量越來越少,木材樹種現(xiàn)場識別領(lǐng)域面臨技術(shù)和人員雙重缺失的嚴(yán)峻挑戰(zhàn)(Wiedenhoeftetal., 2019; Heetal., 2020a; 何拓等, 2021b)。本研究通過專業(yè)圖像采集裝置采集26種瀕危珍貴木材標(biāo)本橫切面構(gòu)造特征圖像,建立木材構(gòu)造圖像數(shù)據(jù)集Rosewood-26,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,最終成功開發(fā)了iWood木材自動識別系統(tǒng)。該系統(tǒng)可實(shí)現(xiàn)木材構(gòu)造特征圖像采集、圖像數(shù)據(jù)集管理、模型管理以及在線或離線識別等功能。基于卷積神經(jīng)網(wǎng)絡(luò)模型開發(fā)的iWood木材自動識別系統(tǒng),是一種端對端的圖像識別模式,用戶目前可通過圖像采集裝置獲取待檢木材樣品的橫切面構(gòu)造特征圖像并上傳至系統(tǒng),系統(tǒng)即可快速輸出樹種識別結(jié)果,有望解決包括海關(guān)、貿(mào)易和質(zhì)檢在內(nèi)的木材樹種識別應(yīng)用領(lǐng)域檢測手段和專業(yè)鑒定人員長期缺乏的難題。
本研究采集15種黃檀屬和11種紫檀屬瀕危珍貴樹種木材橫切面構(gòu)造特征圖像建立圖像數(shù)據(jù)集Rosewood-26,構(gòu)建AlexNet、VGG16、DenseNet-121和ResNet-50 共4種卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行木材樹種識別,其中ResNet-50模型識別精度最高(98.33%),對9種黃檀屬和3種紫檀屬木材的識別精度達(dá)100%,并可成功鑒別構(gòu)造特征極為相似的檀香紫檀和染料紫檀; 基于ResNet-50模型構(gòu)建的木材自動識別系統(tǒng)iWood,在“屬”和“種”水平的識別精度分別為91.8%和 77.3%?;诰矸e神經(jīng)網(wǎng)絡(luò)的木材計算機(jī)視覺識別方法,從覆蓋木材構(gòu)造特征變異性的圖像大數(shù)據(jù)中自動提取關(guān)鍵識別特征并進(jìn)行精準(zhǔn)分類,解決了傳統(tǒng)木材解剖學(xué)方法難以識別木材到“種”的難題,突破了新興木材識別技術(shù)(DNA條形碼、化學(xué)指紋圖譜)難以建立參考數(shù)據(jù)庫的局限,為木材在“種”水平的自動精準(zhǔn)識別提供了新的思路。本研究建立的基于卷積神經(jīng)網(wǎng)絡(luò)的木材識別系統(tǒng)iWood適用于海關(guān)執(zhí)法、木材貿(mào)易和質(zhì)量監(jiān)督等多場景下的木材自動精準(zhǔn)識別,能夠?yàn)槲覈嵘鼵ITES履約執(zhí)法能力、加強(qiáng)林產(chǎn)品產(chǎn)業(yè)鏈監(jiān)管以及保障木材安全提供科技支撐。
建議今后借助國際林業(yè)研究組織聯(lián)盟(IUFRO)、國際木材解剖學(xué)家協(xié)會(IAWA)和木材標(biāo)本國家創(chuàng)新聯(lián)盟(NIAWC)等國內(nèi)外平臺,形成木材標(biāo)本及其數(shù)據(jù)共享網(wǎng)絡(luò),建立完整覆蓋木材構(gòu)造特征種內(nèi)中間變異的圖像數(shù)據(jù)庫,為木材圖像智能識別奠定數(shù)據(jù)基礎(chǔ)。同時,在對木材樣本、圖像數(shù)據(jù)集、深度學(xué)習(xí)模型及其參數(shù)體系深入研究以及識別系統(tǒng)測試應(yīng)用的基礎(chǔ)上,制定木材計算機(jī)視覺識別方法標(biāo)準(zhǔn),推動木材自動精準(zhǔn)識別技術(shù)的推廣應(yīng)用。