姬江濤,李鵬閣,金 鑫*,馬 淏,李明勇
1.河南科技大學農(nóng)業(yè)裝備工程學院,河南 洛陽 471003 2.機械裝備先進制造河南省協(xié)同創(chuàng)新中心,河南 洛陽 471003
穴盤苗的培育和移栽是蔬菜生產(chǎn)的重要環(huán)節(jié),也是農(nóng)業(yè)增收、確保農(nóng)產(chǎn)品供給安全的精耕細作重要農(nóng)藝措施。目前國內(nèi)工廠化育苗的形式正在逐漸推廣,溫室大棚在進行番茄穴盤苗培育過程中,考慮到不同季節(jié)條件下的大田移栽環(huán)境,適宜的番茄秧苗培育苗齡也會發(fā)生改變,其中春季移栽的適宜苗齡為55~60 d。為了提高培育效率,需先將種子播種在較高密度的穴盤內(nèi),經(jīng)過一段時間生長后,幼苗間會出現(xiàn)互相擠占生長空間的情況,導致其生長緩慢和發(fā)育失衡,所以需要在它們生長至適當?shù)娜~面積指數(shù)時,將其移栽到較低密度的穴盤中[1]。在該育苗期移栽的過程中,還需對其健壯程度進行評判,篩選剔除不合格的幼苗和補入優(yōu)苗,以保證最終移栽期的幼苗質(zhì)量。因此,需要建立育苗移栽期幼苗的健壯度評價指標和實現(xiàn)其快速檢測。
傳統(tǒng)的壯苗指標包括株高、莖粗、鮮重、干重等單項指標及其組合而成的(莖粗/株高+根重/冠重)×苗干重、莖粗/株高×苗千重/莖的復合指標,應用廣泛但主要以形態(tài)指標為基礎且穴盤育苗密度大、營養(yǎng)面積小和根際環(huán)境變化大,這同傳統(tǒng)育苗方式相比有很大差異,使得評價結(jié)果難以體現(xiàn)實際情況[2]。葉綠素是葉片進行光合作用,積累有機物的重要化學色素指標,作為主要的光合作用場所,葉片的葉綠素含量與幼苗的質(zhì)量評價關系密切[3-4]。因此結(jié)合形態(tài)指標和色素指標,對育苗移栽期的番茄苗進行健壯度評價的結(jié)果更加全面和準確。
檢測體現(xiàn)健壯特征各項指標的手段主要包括機器視覺和光譜檢測,相關的研究較為廣泛。楊斯等[5]利用機器視覺識別快速分析和判斷苗高信息,所得苗高結(jié)果的平均測量誤差為2.30 mm, 平均測量相對誤差為7.69%;丁永軍等[6]利用線性四點內(nèi)插法估測番茄葉片葉綠素含量,根據(jù)4個波段(670,700,740和780 nm)的葉片反射率計算紅邊位置,所建模型效果良好,其相關系數(shù)r為0.875;David等[7]在395~885 nm波長范圍內(nèi)對冷脅迫幼苗進行掃描,并用支持向量機(SVM)建立了分類模型,結(jié)果顯示,以590和873 nm為特征波長的分類效果較佳。以上研究表明可見-近紅外光譜技術(shù)在番茄幼苗元素含量檢測和環(huán)境脅迫方面具有重要意義,但針對春季育苗移栽期的番茄穴盤苗,能反映多信息融合的健壯度指標的光譜檢測尚未見報道。
以春季育苗移栽期番茄苗為研究對象,測定了多個單項指標,利用數(shù)學分析的方法篩選出了代表性強,評價效果較好的兩項指標,并建立了綜合評價指數(shù);對樣品進行光譜檢測,分別用全波段和特征波段光譜變量與秧苗評價值建立了定量分析模型,旨在為春季育苗移栽期穴盤苗健壯度的快速檢測提供科學依據(jù)。
番茄穴盤育苗于2020年12月—2021年2月在河南洛陽誠研辣椒研究所溫室大棚環(huán)境中培養(yǎng),白天溫度控制在20~25 ℃,夜間溫度控制在10~15 ℃。選用的番茄品種為毛粉802,種子經(jīng)消毒處理后,采用一孔一種的播種方法,將其播種于4個72孔穴盤中,穴盤育苗基質(zhì)為包含泥炭、椰糠和珍珠巖的混合基質(zhì)(比例為3∶1∶1)。番茄秧苗日歷苗齡為45 d時,處于育苗移栽期,此時穴盤中有276株幼苗(缺苗12株),對其進行各項指標的測定和光譜檢測。對番茄葉片光譜反射率的采樣使用海洋光學USB4000光纖光譜儀,其波長范圍為200~1 100 nm,光譜間隔為0.21 nm,試驗選擇在晴朗無云或少云的天氣進行,用OceanView軟件對光譜數(shù)據(jù)進行采集。
按照以下順序采集所需數(shù)據(jù):將番茄苗取出洗凈并用濾紙擦干,用直尺測定株高;用游標卡尺測定莖粗;采用萬分之一電子天平稱量全株鮮質(zhì)量;將光譜儀預熱30分鐘后采集光譜數(shù)據(jù);每個活體樣本由多個葉片組成;光譜儀探頭垂直向下,距葉片2 cm左右;每次采集目標光譜前后進行參考板校正,每點反復測量3次取平均值作為該樣本光譜測量結(jié)果。用分光光度法測定葉綠素a、葉綠素b和總?cè)~綠素含量;用葉綠素儀測定葉片葉綠素相對含量SPAD;最后將整株裝于信封袋內(nèi)置于鼓風干燥箱105 ℃殺青30 min,80 ℃下烘至恒質(zhì)量,并稱量其全株干質(zhì)量。
試驗數(shù)據(jù)采用SPSS 26.0進行分析處理,光譜預處理和特征變量的選擇是基于MATLAB 2019b實現(xiàn)的,評價值的定量分析模型基于Python語言的TensorFlow框架實現(xiàn),繪圖工作在Origin 2019上完成。
試驗采集的各評價指標均為定量指標,其中株高為區(qū)間型指標,即它在某一范圍內(nèi)時,秧苗質(zhì)量較佳,偏離這一范圍不論是過長或是偏少都不利于秧苗質(zhì)量。其他指標均為極大型指標,即這些指標沒有明顯的上下限,隨著指標的增長與秧苗質(zhì)量成正相關。
為了構(gòu)建評價指標體系,便于后續(xù)分析,需要對各指標進行一致化和歸一化處理。其中,先將區(qū)間型指標轉(zhuǎn)化為極大型指標[式(1)],然后將其他各極大型指標進行向量歸一化處理[式(2)],得到每個秧苗各單項指標的評價值。
M=max{a-min{xi},max{xi}-b}
(1)
(2)
(3)
指標xi與其他指標的復相關系數(shù)Ri越大,則說明它們之間的共線性關系越強,重復信息越多,則該指標的權(quán)重也就應該越小。
(4)
(5)
由表1可知,干質(zhì)量和總?cè)~綠素的權(quán)重較大,即這兩個指標所包含的信息量較多,可以結(jié)合起來反映春季育苗移栽期的番茄苗健壯程度。其他指標的權(quán)重指數(shù)較為接近且均明顯低于前兩項,可能是因為在育苗期間溫室大棚的水分、溫濕度、光照、養(yǎng)分等統(tǒng)一苗期管理中,由經(jīng)驗對傳統(tǒng)的壯苗指標予以干預,如為防止徒長施加矮壯素等,使得它們差異較小,對健壯苗的評判結(jié)果貢獻度低。
表1 春季育苗移栽期番茄苗單項指標權(quán)重系數(shù)
根據(jù)上述各項指標評價值和權(quán)重的確定,每株番茄健壯度的評價值V可表示如式(6)
(6)
圖1 春季育苗移栽期番茄苗健壯度評價值
作為對秧苗評價值V影響最大的兩個因素:干質(zhì)量和總?cè)~綠素,若僅用這兩項指標來反映春季育苗移栽期番茄苗健壯度,則該簡化后的秧苗評價值Vs可表示為式(7)
(7)
將簡化后的秧苗評價值Vs與評價值V進行對比分析,如圖2所示??梢钥闯鰞烧呔€性度高,決定系數(shù)R2=0.920,即簡化后的秧苗評價值Vs可以很好的表征春季育苗移栽期番茄苗的健壯度。
圖2 番茄簡化評價值在評價值范圍內(nèi)的分布
將樣本簡化后的秧苗評價值Vs作為分類依據(jù),將番茄苗分為三種類型:優(yōu)質(zhì)苗、合格苗,劣質(zhì)苗,對其進行聚類劃分,同時,應考慮育苗移栽的實際情況,對其進行優(yōu)化,以避免因標準過高而導致的資源浪費。分類結(jié)果如表2所示,分類樣本情況如圖3所示,其中圖3(a)為所培育72穴穴盤苗的整體情況,圖3(b),(c)和(d)分別為基于該分類依據(jù)所篩選出的優(yōu)質(zhì)苗,合格苗和劣質(zhì)苗?;谠撘罁?jù)的分類結(jié)果相對于傳統(tǒng)經(jīng)驗,對健壯程度的劃分更加精細。
表2 番茄苗的品質(zhì)分類結(jié)果
圖3 春季育苗移栽期番茄苗分類情況
在構(gòu)建了春季育苗移栽期番茄穴盤苗的評價體系的基礎上,為了獲取其健壯度信息,可以發(fā)揮光譜的無損檢測優(yōu)勢,用化學計量學的方法構(gòu)建光譜數(shù)據(jù)與反映秧苗品質(zhì)的兩個重要指標及秧苗評價值Vs的定量分析模型,以實現(xiàn)質(zhì)量鑒別。樣本的原始光譜曲線如圖4(a)所示,是典型的綠色植物光譜曲線,可以清晰的看出圖像兩端有較大噪聲。將光譜信號兩端噪聲較大的波段截掉后,得到的光譜曲線如圖4(b)所示。為了消除由于顆粒分布不均勻及顆粒大小不同產(chǎn)生的散射對光譜的影響,增強有用的光譜信息,采用多元散射校正(MSC)的預處理方法,得到的光譜曲線如圖4(c)所示。
圖4 春季育苗移栽期番茄苗的光譜
利用競爭性自適應重加權(quán)算法(CARS)和無信息變量消除-連續(xù)投影算法(UVE-SPA)對番茄苗的光譜特征進行重要波長的選擇,可以減少冗余的光譜特征信息, 便于構(gòu)建高效的健壯苗檢測模型,并提高后期數(shù)據(jù)分析的計算速率。
CARS是通過選擇模型中回歸系數(shù)絕對值大的波長,去掉權(quán)重小的波長,再經(jīng)內(nèi)部交互驗證選出RMSECV值最低的子集,可有效的找到最優(yōu)波長組合[8]。經(jīng)過多次試驗的結(jié)果如圖5所示,得到最佳迭代次數(shù)為25次,并據(jù)此篩選出了58個光譜重要波長,作為簡化后番茄苗評價值的判別依據(jù)。
圖5 CARS算法挑選特征波長的過程
采用UVE算法對全波長下的2 604個光譜變量進行選擇,UVE中產(chǎn)生的隨機變量個數(shù)同樣設置為2 604個,決定被選變量的閾值選擇標準為隨機變量穩(wěn)定性最大值的99%,閾值外的波長變量將被保留作為特征波長[9]。經(jīng)過UVE的變量選擇,得到了240個波長,可以看出經(jīng)UVE選擇得到的特征波長數(shù)量仍較為龐大,因此采用SPA對其選擇后的波長變量做進一步選擇。驗證集經(jīng)過多元線性回歸分析(MLR),得到了最小的驗證標準偏差(RMSEV),其對應的變量即為所需的光譜重要波長。最終選擇結(jié)果為104個特征波長。
通過CARS和UVE-SPA兩種方式選擇出的特征波長在全譜中的分布情況如圖6和圖7所示??梢钥闯?,兩種方法得出的結(jié)果在450~520,620~720和750~950 nm波段下分布較為類似,后者較前者多篩選出的特征波長大部分集中于530~610 nm波段。其中450~520,530~610和620~720 nm三個波段與組成秧苗評價值的葉綠素含量相關性很強,這與丁永軍[10]等的研究結(jié)果吻合;750~950 nm波段與秧苗評價值中干質(zhì)量相關性較強,這與王洋等人研究結(jié)果相似[11]:干物質(zhì)在可見光波段作用不明顯,在近紅外-短波紅外區(qū)域影響較大,干物質(zhì)含量越高,葉片反射能力越弱。
圖6 CARS挑選的特征波長在全波段的分布
圖7 UVE-SPA挑選的特征波長在全波段的分布
采用SPXY算法進行樣本集劃分[12],相較于傳統(tǒng)的KS算法,它以光譜變量為x變量,秧苗評價值為y變量,利用兩種變量同時計算樣品間距離以保證最大程度表征樣本分布,有效地覆蓋多維向量空間,增加了樣本間的差異性和代表性。最終以2∶1的比例將樣本集劃分為建模集和預測集,其中建模集樣本有184個,預測集樣本有92個,保證了訓練集中的樣本按照空間距離分布均勻。樣本間距離表示如式(8)
(8)
把所有的樣本都看作建模集候選樣本, 依次從中挑選樣本進建模集。首先選擇距離最遠的兩個樣本進入建模集,其后通過計算剩下的每一個樣品到建模集內(nèi)每一個已知樣品的距離,找到擁有最大最小距離的待選樣本放入建模集,以此類推,直到達到所要求的樣本數(shù)目。樣本集劃分的結(jié)果見表3,可以看出建模集樣本的秧苗評價值涵蓋了預測集樣本的秧苗評價值范圍,且平均值和標準偏差均接近,表明樣品集劃分合理。
表3 樣本集劃分
由于秧苗評價值在光譜曲線上的響應會受多種因素影響,而簡單的線性回歸模型很難處理非線性、隨機性等復雜的問題,因此在模型的選擇上應考慮非線性模型。選擇LS-SVM和CNN兩種非線性模型,并通過比較分析選取最優(yōu)組合。
最小二乘支持向量機(1east squares support vector machine,LS-SVM)是對SVM的改進,它能有效的處理回歸問題,在解決小樣本、非線性和高維模式識別等問題中優(yōu)勢顯著[13]。其優(yōu)勢主要表現(xiàn)在將經(jīng)典SVM中復雜的二次優(yōu)化問題改為了解線性方程組的問題,降低了復雜度,從而大大加快計算速度,在LS-SVM算法模型中,通過選擇合適核參數(shù)σ和懲罰系數(shù)γ,可以實現(xiàn)模型復雜度和模型準確度的平衡折中。本研究選擇徑向基函數(shù)(RBF)作為核函數(shù),并用網(wǎng)格搜索和交互驗證法自優(yōu)化模型的σ和γ。
卷積神經(jīng)網(wǎng)絡(convolutional neural networks, CNN)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡,其中U-Net網(wǎng)絡模型因其結(jié)構(gòu)優(yōu)勢應用廣泛。它基于全卷積網(wǎng)絡進行改進,不需要大量的樣本和計算資源,就可以利用數(shù)據(jù)增強對一些比較少樣本的數(shù)據(jù)進行訓練[14-15]?;赨-Net網(wǎng)絡進行改造,最終建立的模型結(jié)構(gòu)如圖8所示。
圖8 基于U-Net模型的卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)
結(jié)構(gòu)左側(cè)部分為收縮路徑,可視為有4個子模塊的編碼器,每個子模塊有兩個卷積核(核函數(shù)為ReLU,大小為1×3,填充為0,步長為1)組成的卷積層,用于特征提取,后加一個最大池化層(大小為1×2,步長為2)實現(xiàn)下采樣,降低數(shù)據(jù)維度。除此之外,卷積過濾器的深度從64逐層增長到1 024,使得每一次降采樣都會增加一倍的通道數(shù)。右側(cè)為擴展路徑,與收縮路徑組成類似,可視為實現(xiàn)上采樣的解碼器,以恢復數(shù)據(jù)維度。特別的是,各模塊完成一次反卷積后,就會將收縮路徑中對應步驟的特征圖進行修剪,使其數(shù)據(jù)尺寸能與反卷積的結(jié)果拼接,以完成特征融合。為了適應回歸需求,將U-Net原網(wǎng)絡中最后用于輸出的卷積層(大小為1×1)替換成了兩個全連接層,使其最終的輸出為秧苗評價值。訓練過程中,設置學習率為10-3,訓練次數(shù)為1 000次。
將預處理后的光譜數(shù)據(jù)和提取特征波長后的光譜數(shù)據(jù)分別作為模型的輸入,且所建立光譜模型優(yōu)劣采用以下參數(shù)進行評估:建模和預測集的相關系數(shù)(r),建模均方根誤差(root mean square error for calibration,RMSEC)以及預測均方根誤差(root mean square error for prediction,RMSEP)。所建模型的相關系數(shù)越高,均方根誤差越低,說明模型效果越好。同時,RMSEC和RMSEP的絕對值的差越小,表明所建立的模型的穩(wěn)定性越好,魯棒性越強。所得結(jié)果如表4所示。
表4 不同光譜變量的各模型效果對比
由表4可以看出,基于全波段建立的LS-SVM和CNN模型,建模集和預測集的結(jié)果差于其他經(jīng)CARS和UVE-SPA預處理后波段所建模型,可能是由于太多無用的波段信息對建模產(chǎn)生了干擾,從而降低了最終回歸的準確率。CNN模型整體比LS-SVM模型的建模效果好,說明訓練的光譜信息數(shù)據(jù)量較大時,神經(jīng)網(wǎng)絡的非線性回歸效果更好。經(jīng)CARS篩選出的特征波段數(shù)比UVE-SPA的波段數(shù)少46個,但在CNN模型的回歸結(jié)果中,基于UVE-SPA預處理的建模集和預測集,r,RMSEC, RMSEP的表現(xiàn)效果均好于CARS的預處理結(jié)果,說明,CARS相對于UVE-SPA在簡化光譜變量輸入的同時,過濾了一部分重要波段信息,導致模型精度下降。
上述分析可知,對于采集的春季移栽期番茄穴盤苗可見光-近紅外光譜信息,采用UVE-SPA-CNN模型對光譜數(shù)據(jù)和秧苗評價值的回歸分析效果最好,該模型既保留了原始光譜大量的有用信息,又將輸入變量由2 604個降為104個波長信息,建模速度快且精度高。其中建模集和的相關系數(shù)rc和建模均方根誤差RMSEC分別為0.988和0.085,預測集的相關系數(shù)rp和預測均方根誤差RMSEP分別為0.946和0.025。
以春季育苗移栽期番茄穴盤苗為研究對象,采集了形態(tài)數(shù)據(jù)和光譜信息,用葉綠素和干質(zhì)量兩種因素建立了能表征秧苗健壯度的定量模型—秧苗評價值Vs,并利用CARS和UVE-SPA方法對光譜數(shù)據(jù)進行降維, 選取特征波長, 在此基礎上,對比分析了LS-SVM和CNN兩種不同非線性回歸模型對秧苗評價值的反演精度, 得出如下結(jié)論:
(1)簡化后的秧苗評價值Vs與評價值V的相關系數(shù)r高達0.920,表明簡化后的秧苗評價值Vs可以很好的表征春季育苗移栽期番茄苗的健壯度。
(2)CARS相對于UVE-SPA能夠提取更少的特征波數(shù),但同時也喪失了更多的有用波段,導致后續(xù)回歸效果變差。
(3)CNN模型的反演精度高于LS-SVM,且整體上UVE-SPA-CNN模型的效果最好,其建模集和預測集的相關系數(shù)r分別為0.988和0.946,均方根誤差RMSE分別為0.037和0.025。可為直接利用光譜數(shù)據(jù)獲取融合了多種因素的番茄秧苗評價值,從而判別其健壯度提供科學依據(jù)。