羅佳杰 王寶 張馨嫣 蔡耀儀 吳浩粼 陽(yáng)波
摘? 要: 結(jié)合卷積降噪自編碼器與隨機(jī)森林算法,提出一種新型的卷積降噪自編碼器-隨機(jī)森林(CDAE-RF)模型,并基于可見(jiàn)-近紅外光譜數(shù)據(jù)集來(lái)識(shí)別蘋(píng)果樹(shù)種。首先,通過(guò)網(wǎng)格式搜索、平行實(shí)驗(yàn)的方法優(yōu)化了L1范數(shù)等參數(shù),提高了模型的魯棒性;然后,對(duì)比實(shí)驗(yàn)分析了CDAE-RF、主成分分析-隨機(jī)森林模型(PCA-RF)、K最近鄰分類算法等方法在不同噪聲水平下光譜識(shí)別的準(zhǔn)確性和魯棒性。實(shí)驗(yàn)結(jié)果表明,相對(duì)于傳統(tǒng)算法,新提出的CDAE-RF模型識(shí)別準(zhǔn)確率達(dá)97.92%,在加噪情況下具有更高的魯棒性。CDAE-RF模型降低了隨機(jī)森林算法對(duì)噪聲的敏感性,提高了噪聲光譜圖像識(shí)別的準(zhǔn)確性,為地物波譜識(shí)別提供了一種新的方法。
關(guān)鍵詞: 可見(jiàn)-近紅外光譜; 蘋(píng)果果樹(shù)品種鑒別; 卷積降噪自編碼器; 隨機(jī)森林算法
中圖分類號(hào):TP391.4? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1006-8228(2022)05-01-05
A study on identification model of apple tree varieties based on
convolutional denoising autoencoder
Luo Jiajie Wang Bao Zhang Xinyan Cai Yaoyi Wu Haolin ?Yang Bo
Abstract: Combining the convolutional denoising autoencoder and random forest algorithm, a new convolutional denoising autoencoder-random forest (CDAE-RF) model is proposed to identify apple varieties based on the VIS-NIR spectrum data. Firstly, the L1 norm and other parameters are optimized through grid search or parallel experiments in order to improve the robustness of the model; then, under different noise level, the accuracy and robustness of the proposed CDAE-RF model, principal component analysis-random forest model (PCA-RF) and K-nearest neighbor classification algorithm are analyzed by comparative experiments. Experimental results show that compared with traditional algorithm, the accuracy of the proposed CDAE-RF model is as high as 97.92%, and has higher robustness when noise increases. The CDAE-RF model reduces the sensitivity of random forests algorithm to noise, improves the accuracy of noise spectral identification, and provides a new method for feature spectral identification.
Key words: VIS-NIR spectrum; identification of apple tree varieties; convolutional denoising autoencoder; random forest algorithm
引言
在農(nóng)業(yè)管理和資源勘探等活動(dòng)中,常常需要使用遙感技術(shù)對(duì)蘋(píng)果樹(shù)種進(jìn)行識(shí)別。例如,李子藝[1]運(yùn)用地物波譜儀采集到的可見(jiàn)-近紅外光譜數(shù)據(jù)結(jié)合遙感研究了對(duì)南疆蘋(píng)果和梨等常見(jiàn)果樹(shù)蘋(píng)果進(jìn)行分類,檀博軒[2]研究了運(yùn)用遙感影像對(duì)阿克蘇地區(qū)果樹(shù)果林進(jìn)行面積測(cè)算,姬興輝[3]使用遙感技術(shù)研究了贛南油茶種植區(qū)域適宜性。他們的研究重點(diǎn)是光譜成像技術(shù),沒(méi)有對(duì)光譜分析技術(shù)做系統(tǒng)研究,其算法簡(jiǎn)單,魯棒性差。
將隨機(jī)森林算法與降噪自編碼器結(jié)合起來(lái),可成為改善光譜分析魯棒性的一種方法。自編碼器是一種基于神經(jīng)網(wǎng)絡(luò)的無(wú)監(jiān)督學(xué)習(xí)模型,具有良好的非線性特征提取能力[4]。隨機(jī)森林是一種基于集成學(xué)習(xí),包含多個(gè)決策樹(shù)的機(jī)器學(xué)習(xí)分類器,其對(duì)特征值的縮放和各種變換具有更穩(wěn)定的表現(xiàn),對(duì)無(wú)關(guān)特征是魯棒的[5]。鄭淋文[6]等人將深度稀疏自編碼器結(jié)合支持向量機(jī)用于ECG特征提取;宋輝[6]等人將卷積降噪自編碼器用于地震數(shù)據(jù)去噪,優(yōu)化模型魯棒性;武崢[7]等人證明了將稀疏降噪自編碼器用于特征提取結(jié)合隨機(jī)森林算法能夠進(jìn)一步提高隨機(jī)森林算法的分類性能。
為了提高地物波譜識(shí)別模型的準(zhǔn)確率和魯棒性,本文改進(jìn)了原有的經(jīng)典自編碼器,設(shè)計(jì)出一種卷積降噪自編碼器,并與隨機(jī)森林算法結(jié)合提出了一種基于可見(jiàn)-近紅外光譜(地物波譜)的蘋(píng)果果樹(shù)種分類模型。本文可分為兩大部分,即改進(jìn)模型的設(shè)計(jì)與實(shí)驗(yàn)驗(yàn)證部分。實(shí)驗(yàn)驗(yàn)證部分主要是進(jìn)行了模型優(yōu)化和模型評(píng)價(jià)。首先,將數(shù)據(jù)分別進(jìn)行五種常見(jiàn)的光譜預(yù)處理,并采用CDAE-RF模型進(jìn)行訓(xùn)練,選出了準(zhǔn)確率最高的光譜處理方式;然后,通過(guò)網(wǎng)格式參數(shù)搜索,平行實(shí)驗(yàn)的方式優(yōu)化了CDAE-RF模型;最后,將不同強(qiáng)度的噪聲引入數(shù)據(jù)集,用CDAE-RF模型對(duì)其進(jìn)行訓(xùn)練,并與傳統(tǒng)的卷積自編碼器、PCA-RF模型、K最近鄰分類算法、支持向量機(jī)和隨機(jī)森林算法進(jìn)行對(duì)比,得出CDAE-RF模型特征提取性能好,魯棒性強(qiáng)的結(jié)論。
1 算法設(shè)計(jì)
1.1 卷積降噪自編碼器
傳統(tǒng)的自編碼器采用密集連接的人工神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行特征提取。為了能高效提取序列信息,本文使用了改進(jìn)的自編碼器做特征提取。采用深度可分離卷積[8]提取特征,相較于普通的一維卷積,能反映空間軸與軸之間的特征信息,更好地提取序列特征;引入批處理標(biāo)準(zhǔn)化層[9],可以很好的解決梯度消失或梯度爆炸問(wèn)題,使訓(xùn)練能夠更好的收斂;采用堆棧式自編碼器[10]結(jié)構(gòu),使提取的特征表達(dá)能力更強(qiáng)。借鑒降噪自編碼器[11]的設(shè)計(jì)思想,在每一個(gè)深度可分離一維卷積模塊的末尾加入了Dropout[12]層,降低缺失值等異常數(shù)據(jù)對(duì)其的影響;在訓(xùn)練過(guò)程中引入一定范圍的高斯噪聲,降低模型對(duì)噪聲的敏感性。
本文提出的CDAE-RF模型由卷積降噪自編碼器與隨機(jī)森林算法構(gòu)成,數(shù)據(jù)首先經(jīng)過(guò)卷積降噪自編碼器進(jìn)行特征提取,從2151維降到231維。然后將特征數(shù)據(jù)輸入隨機(jī)森林算法進(jìn)行分類處理。其中卷積降噪自編碼器部分(以下簡(jiǎn)稱CDAE)結(jié)構(gòu)如圖1所示。
CDAE由編碼器網(wǎng)絡(luò)和解碼器網(wǎng)絡(luò)組成。編碼器網(wǎng)絡(luò)由兩個(gè)深度可分離卷積(Depthwise separable convolution)模塊組成,接受形狀為(batchsize,2151,1)的三維張量作為輸入。每個(gè)深度可分離卷積模塊有4層。首先,數(shù)據(jù)經(jīng)過(guò)采用tanh函數(shù)作為激活函數(shù),使用0.0001的L1范數(shù)進(jìn)行正則化的一維深度可分離卷積層進(jìn)行數(shù)據(jù)蒸餾,同時(shí)填充到輸入數(shù)據(jù)大小;然后,經(jīng)過(guò)批處理標(biāo)準(zhǔn)化層進(jìn)行批處理標(biāo)準(zhǔn)化(Batch Normalization);其次,進(jìn)入最大池化層進(jìn)行三倍下采樣操作;最后,在訓(xùn)練過(guò)程中隨機(jī)斷開(kāi)25%的與下一卷積層的連接。按照數(shù)據(jù)處理的順序,兩個(gè)模塊的過(guò)濾器個(gè)數(shù)和卷積窗口大小分別是32,5和64,5。從數(shù)據(jù)輸入,到兩個(gè)卷積模塊數(shù)據(jù)處理結(jié)束,數(shù)據(jù)維度呈2151-717-239變化,深度加深到64層。
在編碼器完成編碼之后,中間由一個(gè)一維卷積層對(duì)數(shù)據(jù)深度進(jìn)行降維,最后得到(batchsize,239,1)的中間隱層數(shù)據(jù),完成降維操作,隨后數(shù)據(jù)接入解碼器。解碼器和編碼器的結(jié)構(gòu)基本對(duì)稱,每個(gè)模塊中只是最大池化層換為了上采樣層,對(duì)數(shù)據(jù)進(jìn)行兩次三倍上采樣,數(shù)據(jù)維度由239-717-2151變化,最后連接一個(gè)一維卷積層將深度降到1,獲得與輸入數(shù)據(jù)維度大小相同的輸出數(shù)據(jù)。通過(guò)定義合適的誤差函數(shù),使數(shù)據(jù)經(jīng)過(guò)CDAE網(wǎng)絡(luò)前后信息損失最小,而其中的編碼器尾部輸出的壓縮數(shù)據(jù)則包含了濃縮后數(shù)據(jù)的豐富特征。
1.2 算法流程
本文提出的CDAE-RF模型由卷積降噪自編碼器與隨機(jī)森林算法構(gòu)成。類比經(jīng)典的降維+機(jī)器學(xué)習(xí)模型的結(jié)構(gòu),CDAE可以理解成一種改進(jìn)的數(shù)據(jù)降維方式。數(shù)據(jù)首先經(jīng)過(guò)卷積降噪自編碼器進(jìn)行特征提取,從2151維降到231維,然后將特征數(shù)據(jù)輸入隨機(jī)森林算法進(jìn)行分類處理。具體步驟如下。
步驟一 對(duì)輸入的光譜數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,盡量消除基線漂移等情況。以預(yù)處理后的數(shù)據(jù)作為訓(xùn)練集。
步驟二 訓(xùn)練卷積降噪自編碼器網(wǎng)絡(luò),實(shí)現(xiàn)一個(gè)近似恒等的映射,使得輸入輸出數(shù)據(jù)之間的差別盡可能小,此時(shí)神經(jīng)網(wǎng)絡(luò)中保留了盡可能多的關(guān)于數(shù)據(jù)的信息。
步驟三 凍結(jié)編碼器權(quán)重,讓訓(xùn)練數(shù)據(jù)通過(guò)編碼器從2151維降到231維。
步驟四 將編碼器處理后的數(shù)據(jù)輸入隨機(jī)森林進(jìn)行訓(xùn)練。至此,CDAE-RF模型訓(xùn)練完畢。
步驟五 對(duì)于測(cè)試數(shù)據(jù),依次經(jīng)過(guò)數(shù)據(jù)預(yù)處理,訓(xùn)練好凍結(jié)權(quán)重的編碼器,隨機(jī)森林得到最終結(jié)果。
2 實(shí)驗(yàn)方法
2.1 數(shù)據(jù)集
本次實(shí)驗(yàn)采用中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所于2015年采集的“蘋(píng)果品種標(biāo)準(zhǔn)葉片圖像和光譜數(shù)據(jù)集”[13](以下簡(jiǎn)稱數(shù)據(jù)集)。數(shù)據(jù)集的采集地點(diǎn)是隸屬中國(guó)農(nóng)業(yè)科學(xué)院果樹(shù)研究所的果樹(shù)種質(zhì)資源圃,共采集了174種蘋(píng)果品種的葉片數(shù)據(jù),能夠代表國(guó)內(nèi)種植蘋(píng)果的絕大多數(shù)品種。
數(shù)據(jù)集由蘋(píng)果葉片的圖像數(shù)據(jù)和可見(jiàn)-近紅外光譜數(shù)據(jù)兩部分?jǐn)?shù)據(jù)組成,本次實(shí)驗(yàn)采用其可見(jiàn)-近紅外光譜數(shù)據(jù)進(jìn)行研究。其可見(jiàn)-近紅外光譜數(shù)據(jù)的采集儀器是美國(guó)ASD公司生產(chǎn)的ASD FieldSpec3系列地物波譜儀。原始數(shù)據(jù)經(jīng)其配套軟件粗處理導(dǎo)出后,每個(gè)樣本共有350nm~2500nm波段的2151個(gè)透射率數(shù)據(jù)。
通常,受光程差異、漫反射和光散射、樣本顆粒的大小等噪聲信息的影響,采集的光譜往往會(huì)有一定的基線漂移和傾斜等,需要進(jìn)行矯正。在數(shù)據(jù)使用前,依次進(jìn)行Savitzky-Golay卷積平滑與最大最小歸一化兩種數(shù)據(jù)預(yù)處理[14]。
2.2 模型調(diào)參
模型調(diào)參包括CDAE模型調(diào)參與隨機(jī)森林調(diào)參兩個(gè)部分。
首先是CDAE模型的調(diào)參。L1懲罰項(xiàng)系數(shù)以及神經(jīng)網(wǎng)絡(luò)層與層之間連接隨機(jī)斷開(kāi)的概率(即Dropout比率)是CDAE-RF模型的重要參數(shù)。它們相互影響,共同控制著模型的容差能力和魯棒性,但是與模型的容差能力和魯棒性之間又非簡(jiǎn)單線性關(guān)系。為優(yōu)化模型,在L1懲罰項(xiàng)系數(shù)1e-5~0.1,dropout比率為0~0.5的范圍內(nèi),以網(wǎng)格參數(shù)搜索的方法確定最佳參數(shù)。
然后是隨機(jī)森林模型的調(diào)參。在隨機(jī)森林算法中,子樹(shù)數(shù)量的多少將影響模型的計(jì)算復(fù)雜度及準(zhǔn)確率。顯然,隨著子樹(shù)數(shù)量的增加,隨機(jī)森林算法的分類性能也隨之提高。 但增加到一定程度后,會(huì)趨于穩(wěn)定。 在性能相差不大的情況下,應(yīng)該用盡可能少的子樹(shù),因?yàn)樽訕?shù)越多,算法運(yùn)行的時(shí)間就越長(zhǎng),模型的泛化能力也會(huì)有所降低。為了確定CDAE-RF模型最佳的子樹(shù)個(gè)數(shù),取子樹(shù)為1~100,其他參數(shù)相同的CDAE-RF模型進(jìn)行對(duì)比測(cè)試,確定最佳子樹(shù)數(shù)量。
2.3 模型評(píng)估
為了比較CDAE-RF模型及其他模型的特征提取能力及進(jìn)行分類的準(zhǔn)確率,選取CAE-RF,PCA-RF,隨機(jī)森林算法,支持向量機(jī)和K最近鄰分類算法與之進(jìn)行對(duì)比。其中CAE-RF即卷積自編碼器-隨機(jī)森林模型,其結(jié)構(gòu)與CDAE-RF類似,不同之處在于其前端特征提取結(jié)構(gòu)為卷積自編碼器。卷積自編碼器是在卷積降噪自編碼器的基礎(chǔ)上去掉Dropout層和設(shè)計(jì)公式中L1范數(shù)懲罰項(xiàng)的自編碼器,相比CDAE模型結(jié)構(gòu)更簡(jiǎn)單。以此類推,PCA-RF模型即將主成分分析作為前端特征提取。其結(jié)構(gòu)也與CDAE-RF模型類似,不同之處在于將主成分分析用于特征提取后,再將數(shù)據(jù)輸入隨機(jī)森林算法。CAE-RF,CDAE-RF,PCA-RF,隨機(jī)森林算法四者相互對(duì)比,可以探究CDAE作為前端特征提取的能力;CDAE-RF,隨機(jī)森林算法,支持向量機(jī)和K最近鄰分類算法四者相互對(duì)比,可以探究CDAE-RF相對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)模型進(jìn)行學(xué)習(xí)的能力。在模型的評(píng)價(jià)指標(biāo)上,由于該數(shù)據(jù)集為一個(gè)平衡的數(shù)據(jù)集,每一類的數(shù)據(jù)相差不大。因此,準(zhǔn)確率(Accuracy)即衡量的正確分類的比例將被用于模型的對(duì)比評(píng)價(jià)。
2.4 魯棒性測(cè)試
在實(shí)際光譜的測(cè)量時(shí),經(jīng)常會(huì)有大量的噪聲干擾,而隨機(jī)森林算法對(duì)噪聲非常敏感。為了降低隨機(jī)森林算法對(duì)輸入數(shù)據(jù)噪聲的敏感性,可以在數(shù)據(jù)輸入隨機(jī)森林分類器前加上卷積降噪自編碼器先對(duì)數(shù)據(jù)進(jìn)行降噪和降維處理。為了探究CDAE-RF模型在不同噪聲條件下的魯棒性,先給數(shù)據(jù)分別加上40db,35db,30db,25db,20db,15db,10db,7db,5db的高斯分布的白噪聲,然后在加噪的情況下,與隨機(jī)森林算法、PCA-RF模型和CAE-RF模型三個(gè)類似模型進(jìn)行對(duì)比。通過(guò)隨機(jī)森林算法、PCA-RF模型、CAE-RF模型與CDAE-RF模型的對(duì)比,可以探究在加噪情況下卷積降噪自編碼器和其他幾種經(jīng)典特征提取方法在降低隨機(jī)森林敏感性的效果。
3 結(jié)果與討論
3.1 模型調(diào)參
為了確定CDAE模型L1范數(shù)和Dropout比率的最佳參數(shù),采用網(wǎng)格式搜索的方式在Dropout率為0-40%,L1范數(shù)為1e-5~0.1的范圍內(nèi)進(jìn)行模型優(yōu)化,相關(guān)結(jié)果可見(jiàn)圖2。其中橫坐標(biāo)表示L1的值,縱坐標(biāo)表示Dropout的值,黑點(diǎn)表示數(shù)據(jù)點(diǎn),顏色表示準(zhǔn)確率。顏色越白,準(zhǔn)確率越高。當(dāng)L1范數(shù)為0.003,Dropout比率為30%時(shí),模型準(zhǔn)確率最高,確定其為最佳參數(shù)。
為了確定最佳的子樹(shù)個(gè)數(shù),設(shè)計(jì)99個(gè)子實(shí)驗(yàn),選取隨機(jī)森林子樹(shù)個(gè)數(shù)從1到100的不同CDAE-RF模型進(jìn)行對(duì)比,在相同光譜數(shù)據(jù)集上訓(xùn)練并測(cè)試,相關(guān)結(jié)果可見(jiàn)圖3。用光滑的曲線擬合實(shí)驗(yàn)所得準(zhǔn)確率數(shù)據(jù),圖3中實(shí)心點(diǎn)為實(shí)際準(zhǔn)確率數(shù)據(jù),虛線為擬合的趨勢(shì)線。當(dāng)子樹(shù)數(shù)量為29時(shí),曲線趨于與x軸平直,認(rèn)為此時(shí)模型性能隨著子樹(shù)數(shù)量增多而無(wú)顯著變化,確定最佳子樹(shù)數(shù)量為29。
3.2 模型評(píng)估
為了比較CDAE-RF模型及其他模型的特征提取能力及進(jìn)行分類的準(zhǔn)確率,在同一光譜數(shù)據(jù)集上訓(xùn)練并測(cè)試,相關(guān)實(shí)驗(yàn)結(jié)果可見(jiàn)圖4。對(duì)比CAE-RF,CDAE-RF,PCA-RF和隨機(jī)森林算法四種模型的準(zhǔn)確率,自編碼器類模型(即CDAE-RF和CAE-RF)明顯好于其他模型,能夠有效濃縮數(shù)據(jù)集中的數(shù)據(jù)特征。PCA-RF模型沒(méi)有能有效的提取特征,還對(duì)數(shù)據(jù)特征造成了損傷,其準(zhǔn)確率低于隨機(jī)森林算法。引入L1范數(shù)及Dropout層的CDAE-RF模型提取特征能力優(yōu)于普通的CAE-RF模型,準(zhǔn)確率最佳。對(duì)比CDAE-RF,隨機(jī)森林算法,支持向量機(jī)和K最近鄰分類算法四種模型的準(zhǔn)確率,隨機(jī)森林算法在2151維的高維度地物波譜數(shù)據(jù)上,相較于支持向量機(jī)和K最近鄰分類算法準(zhǔn)確率更高。在數(shù)據(jù)特征進(jìn)一步濃縮之后,CDAE-RF模型的準(zhǔn)確率要比隨機(jī)森林算法更高。
3.3 魯棒性測(cè)試
在加噪情況下對(duì)比卷積降噪自編碼器和其他幾種經(jīng)典特征提取方法在降低隨機(jī)森林敏感性方面的效果,相關(guān)結(jié)果可見(jiàn)圖5。在無(wú)噪聲加入的情況下,隨機(jī)森林算法、PCA-RF模型、CAE-RF模型與CDAE-RF模型初始準(zhǔn)確率都相差不大,但是在噪聲加入后,其魯棒性各不相同。隨機(jī)森林模型對(duì)噪聲非常敏感,在噪聲下下降速度最快。傳統(tǒng)的主成分分析只能實(shí)現(xiàn)降維,不能抗噪,隨著噪聲強(qiáng)度的增強(qiáng),準(zhǔn)確率同隨機(jī)森林一樣下降速度很快。引入L1范數(shù)及Dropout層,經(jīng)過(guò)抗噪設(shè)計(jì)的CDAE-RF模型比普通的CAE-RF模型具有更好的魯棒性,在不同噪聲下準(zhǔn)確率始終比其高3%-5%。實(shí)驗(yàn)結(jié)果表明,CDAE-RF模型明顯有著更高的魯棒性,在隨機(jī)森林前加入卷積降噪自編碼器能夠顯著降低隨機(jī)森林對(duì)噪聲的敏感性。
4 結(jié)束語(yǔ)
本文將卷積降噪自編碼器引入光譜分析中,結(jié)合隨機(jī)森林提出了一種CADE-RF模型用于地物波譜分類,實(shí)現(xiàn)了蘋(píng)果果樹(shù)樹(shù)種識(shí)別。研究結(jié)果表明,該模型具有優(yōu)秀的特征提取能力,能夠有效濃縮數(shù)據(jù)集中的數(shù)據(jù)特征,提取非線性特征,相較于卷積自編碼器-隨機(jī)森林模型,主成分分析-隨機(jī)森林模型和隨機(jī)森林算法具有更佳的性能;具有更強(qiáng)的學(xué)習(xí)能力,相較于隨機(jī)森林算法,支持向量機(jī)和K最近鄰分類算法準(zhǔn)確率更高;具有更好的魯棒性,能夠使抑制輸入的數(shù)據(jù)在各個(gè)方向上的擾動(dòng),降低隨機(jī)森林模型對(duì)噪聲的敏感性。CDAE-RF模型提高了對(duì)噪聲光譜圖像識(shí)別的準(zhǔn)確性,為地物波譜識(shí)別提供了一種新的方法,同時(shí)也為降低隨機(jī)森林算法對(duì)噪聲的敏感性提供了一種思路。
參考文獻(xiàn)(References):
[1] 李子藝.基于冠層光譜數(shù)據(jù)的南疆盆地主栽果樹(shù)樹(shù)種遙感
分類研究[D].新疆農(nóng)業(yè)大學(xué),2015
[2] 檀博軒.基于遙感影像的阿克蘇地區(qū)林果種植面積測(cè)算
方法研究與實(shí)現(xiàn)[D].塔里木大學(xué),2020
[3] 姬興輝.基于遙感的贛南油茶種植區(qū)域適宜性評(píng)價(jià)研究[D].
江西理工大學(xué),2015
[4] Friedman J, Hastie T, Tibshirani R. The elements of
statistical learning[M]. New York: Springer series in statistics,2001
[5] 鄭淋文,周金治,黃靜.深度稀疏自編碼器在ECG特征提取中的
應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2021:1-13
[6] 宋輝,高洋,陳偉,張翔.基于卷積降噪自編碼器的地震數(shù)據(jù)
去噪[J].石油地球物理勘探,2020,55(6):1210-1219,1160-1161
[7] 武崢,丁沖,景英川.基于稀疏降噪自編碼器的隨機(jī)森林模型[J].
統(tǒng)計(jì)與信息論壇,2019,34(8):27-33
[8] Szegedy C, Vanhoucke V, Ioffe S, et al. Rethinking the
inception architecture for computer vision[C]//Proceedings of the IEEE conference on computer vision and pattern recognition,2016:2818-2826
[9] Ioffe S, Szegedy C. Batch normalization: Accelerating deep
network training by reducing internal covariate shift[C]//International conference on machine learning. PMLR,2015:448-456
[10] Zabalza J, Ren J, Zheng J, et al. Novel segmented stacked
autoencoder for effective dimensionality reduction and feature extraction in hyperspectral imaging[J].Neurocomputing,2016,185:1-10
[11] Vincent P, Larochelle H, Lajoie I, et al. Stacked
denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion[J]. Journal of machine learning research,2010,11(12)
[12] Baldi P, Sadowski P J. Understanding dropout[J].
Advances in neural information processing systems,2013,26:2814-2822
[13] 夏雪,李壯,吳定峰,等.蘋(píng)果品種標(biāo)準(zhǔn)葉片圖像和光譜數(shù)據(jù)
集[J].中國(guó)科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版),2016(1):43-48
[14] 第五鵬瑤,卞?;?,王姿方,等.光譜預(yù)處理方法選擇研究[J].
光譜學(xué)與光譜分析,2019,39(9):2800-2806
收稿日期:2021-10-20
基金項(xiàng)目:國(guó)家自然科學(xué)基金青年基金(No.61903138); 湖南省自然科學(xué)基金青年基金(No.2020JJ5366); 湖南省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(No.S202010542084)
作者簡(jiǎn)介:羅佳杰(2001-),男,湖南衡陽(yáng)人,本科生,主要研究方向:機(jī)器學(xué)習(xí),人工智能。
通訊作者:陽(yáng)波(1976-),男,湖南婁底人,博士,教授,主要研究方向:傳感器、機(jī)器人、人工智能。