馮文康,梁忠偉,劉曉初,謝鑫成,趙 傳,蕭金瑞
(1.廣州大學機械與電氣工程學院,廣州 510006;2.廣州大學廣東省太陽能智能灌溉裝備科技創(chuàng)新中心,廣州 510006;3.廣東工業(yè)大學機電工程學院,廣州 510006)
1.1.1 土壤樣本采樣和質地測定
土壤樣品采集地點在嶺南地區(qū)廣東省廣州市(22°26′~23°56′N,112°57′~114°3′E),地處亞熱帶沿海,屬海洋性亞熱帶季風氣候,是中國光、熱和水資源最豐富的地區(qū)之一,年平均氣溫22.3℃,年降雨量約為1 720 mm,雨熱同期,氣候適宜,土壤肥沃,農產品豐富。廣州的番禺區(qū)、南沙區(qū)、黃埔區(qū)等各區(qū)的50個采樣地點在圖1中標記,每個采樣點采集20個樣品,共1 000個樣品,每個樣品取250 g±10%,在去除地表存在的所有植被后,使用標準泥鏟從休耕農田的土壤表層(0~15 cm)收集樣本,保持樣品之間距離d(d>200 m),以確保采集樣品之間合理的獨立性,采樣點有水稻田、菜園、旱田、甘蔗地、芭蕉地。樣品被收集在有標簽的密封袋里,然后運回廣州大學-廣東省太陽能智能灌溉裝備科技創(chuàng)新中心實驗室進行處理[18]。在實驗分析前,所有樣品在光照強度1.5×104Lux,風速16 m/s條件下24 h風干,研磨后通過孔徑為2 mm的篩網,得到篩選樣本。土壤是砂粒、粉砂和黏粒的混合物,而土壤類型是按照其砂粒(0.05~2 mm)、粉粒(0.002~0.05 mm)和黏粒(<0.002 mm)所占百分比不同而定義的。土壤顆粒采用比重法[19]測定,計算出顆粒在土壤樣本的占比。美國農業(yè)部土壤質地分類標準[20]采用三角坐標圖解法。等邊三角形的三條邊分別代表黏粒、粉粒及砂粒的含量(%),對土壤質地類型進行分類。如圖2中紅點A位于粉壤土區(qū)域,其中砂粒5%、粉砂70%和黏粒25%。
圖1 土壤采樣點的地理位置Fig.1 Geographical location of soil sampling points
圖2 美國土壤質地分類三角坐標圖Fig.2 Triangular coordinates of USDA soil texture classification
1.1.2 土壤圖像采樣
在土壤圖像采集中,照明條件極大影響成像任務的質量,為了減小自然光亮度等其他因素的影響,設計并制作了一體化的圖像采集裝置[21],如圖3所示,具體包括:成像盒(12 cm×8 cm×5 cm)、相機、方形支架(4 cm×4 cm×2 cm)、直流電源適配器、照明LED燈泡(2 W,12 V)以及變光開關控制器;其中,成像盒為長方體,頂部有圓形窗口,圓形窗口用于放置相機,盒體內壁均涂為黑色;所述相機放置在盒體的圓形窗口上,用于為土壤樣本進行拍照;方形支架位于盒體底部,用于固定土壤樣本;照明LED燈泡位于盒體內部,照明燈由白色LED條組成,LED條水平黏貼于盒體的內壁,用于為土壤樣本進行拍照時提供補光;開關控制器位于盒體外側,與照明LED燈電連,用于控制照明LED燈的亮度,在對土壤樣本進行拍照時提供100 lm和200 lm等強度光;直流電源適配器(輸出電壓12 V,電流500 mA)與LED燈連接,位于盒體外部,用于為照明LED燈供電。
圖3 土壤樣本圖像采集裝置Fig.3 Image acquisition device
在本文中,紋理特征和顏色特征作為土壤圖像分析的特征[22,23]。紋理是反映土壤圖像的一種顯著性特征,紋理特征提取由Haralick特征局部二值模式計算得來,采用統(tǒng)計類中的haralick特征和局部二值模式(Local binary pattern,LBP)對土壤圖像紋理特征提取。Haralick特征算法被用于紋理量化圖像表面結構組織[24]。紋理特征由Haralick特征使用4個灰度共生矩陣[22-25]來計算總共13個紋理特征向量,土壤圖像像素之間相鄰從左到右h=0°、左對角線h=45°、上到下h=90°和右對角線h=135°計算出4個矩陣,根據4個矩陣計算其13個統(tǒng)計量,可有效消除土壤圖片旋轉帶來的不同結果。
局部二值模式(LBP)算法[25]是計算土壤圖像紋理特征的方法,如圖4(a)所示土壤照片像素圖,本文選用圓形領域的LBP算子,16個像素采樣點,每個圓的像素點半徑設置為2,圖4(b)是土壤圖像處理后的紋理效果圖。在中心的像素點,與相鄰的8個像素進行比較,若周圍的像素值大于中心像素標為1,否則標為0;如在3×3領域內的8個點可產生8位二進制,即是該中心像素的LBP值,圖4(c)是LBP直方圖統(tǒng)計出的26個特征向量。
圖4 LBP處理后土壤圖像Fig.4 Soil image after LBP treatment
顏色特征是土壤圖像的一個重要特征,由顏色直方圖[26]和Hu矩[27]特征組合。Hu矩是具有平移、旋轉和尺度不變性的土壤圖像的顏色特征,利用圖像變換的常量中心矩計算出Hu矩,用7維特征向量表示。這組矩的前6個Hu矩特征對平移、縮放、旋轉和反射是不變的,而第7個Hu矩的符號因土壤圖像反射而改變。
顏色直方圖是圖像廣泛采用的顏色特征,特別適于描述那些難以進行自動分割的圖像。因此本文選用HSV直方圖作為土壤圖像的顏色特征,將圖像的RGB顏色空間轉換為HSV分量并計算顏色直方圖的數值,然后統(tǒng)計H、S、V 3個通道的直方圖并進行歸一化,歸一化后將3個維度的直方圖數據進行拼接,每個通道256個維度特征,共256×6組數據,然后縮放到512個維度特征。
脂肪酸(fatty acid)是油脂(甘油三酯)的主要組成單元[1],其結構是末端含有羧基的長碳氫鏈,一般根據碳鏈的飽和程度分為飽和脂肪酸和不飽和脂肪酸,極少數特殊油脂的脂肪酸可能含有羥基、環(huán)氧基等。是自然界中最常見的有機物之一,廣泛存在于動植物或微生物等的油脂中。在日常生活中,脂肪酸產品被廣泛用于化妝品、洗滌劑、肥皂、工業(yè)脂肪酸鹽、涂料、油漆、橡膠等領域,不愧為油脂工業(yè)的3大中間體之首[2]。脂肪酸羧基的反應最常見的自然是中和皂化成鹽等,在上篇已經講述[3],這里主要講述羧酸的酯化、酰鹵化、酸酐化、過氧化、脫羧等反應,由于a-H的活性是受到羧酸的影響,故該反應也放在本文中稍加講解。
圖5是基于CNN-RF模型結合3種組合(顏色特征、紋理特征、顏色特征+紋理特征)方法對土壤樣本的黏粒、粉粒和砂粒百分比進行回歸預測,519個顏色特征和39個紋理特征累積產生總共558個全局特征。這些全局特征與CNN提取的512維特征一起輸入RF中,土壤質地類型是由砂粒、粉粒和黏粒的不同含量比例確定。
圖5 基于CNN-RF模型結合圖像特征方法Fig.5 Image feature method based on CNN-RF model
為對土壤質地圖像進行可靠識別,考慮到平臺計算能力和圖像清晰度運算要求準則,圖像分辨率采用256×256像素可以有效滿足土壤質地圖像計算速度和信息表達清晰度等多項要求。因此該研究將采集獲得的土壤質地圖片調整到256×256像素分辨率,輸入到CNN-RF模型中。模型中第一個卷積塊和第二個卷積塊的卷積層的通道數分別為48和128,第三個卷積層的通道數為192,第三個卷積塊中卷積層的通道數為128。除第一個卷積層的卷積核大小為11×11外,其余卷積核大小均為3×3。卷積塊處理完后得到輸入圖像的高維特征,將其展平送入到線性塊中得到512維的特征向量。其中線性塊中Dropout層的概率參數取0.9,第一個線性層中全連接層為4 608維度,第2個線性層中全連接層為512維度,通過隨機森林(500決策樹)輸出并對土壤樣本中的黏粒、粉粒和砂粒百分比含量進行回歸預測。
由于傳統(tǒng)CNN方法有許多不同的預訓練結構,這些結構被標記數據成功訓練,如1 000個不同的類組成的Image Net。由于這類網絡提取的特征是針對特定數據進行分類的,因此這類網絡結構不能直接用于土壤圖像的分類。另外,Softmax作為卷積神經網絡分類器同時會導致泛化能力不足的問題。綜合上述問題,本文結合卷積神經網絡與隨機森林的算法模型。通過CNN提取512維特征,這些特征要與機器學習提取的特征輸入到RF中,在土壤樣本圖片上,既要預測土壤質地,黏粒、粉粒和砂粒的百分含量,還要根據這些進行土壤質地分類。所以既有回歸預測也有分類,故選用RF進行分類[28]。機器學習算法提取出來的558×1與CNN提取出來的特征一起輸入到RF模型分類器。算法流程見圖6?;貧w預測圖像中砂粒、粉粒和黏粒的百分比進而進行土壤質地分類。得到土壤質地預測混淆矩陣,來驗證模型的可靠性、準確性。
圖6 結合機器學習算法的CNN-RF模型Fig.6 CNN-RF model combined with machine learning algorithm
平均絕對誤差(MAE)和均方根誤差(RMSE)相當于L1范數和L2范數,評估預測和真實的接近程度,其值越小越好。判定系數(R2),其取值范圍[0,1],越接近于1越好。
土壤是由黏粒、粉粒和砂粒不同含量比例混合而成,由3個預測值通過土壤質地三角圖,得到黏土、粉黏土、壤砂土、砂黏壤土、砂黏土、砂壤土、粉壤土、粉黏壤土、黏壤土、壤土、砂土和粉土等土壤類型。提取混淆矩陣來評估土壤質地識別性能。這個矩陣中的值代表了的提出模型識別的實際土壤種類。主對角線上的數值表明樣品的分類正確,而非對角元素上的數值表明樣品的分類錯誤。通過使用混淆矩陣推導出幾個統(tǒng)計指標如下所示。
準確度(Accuracy)是表示所有樣本中完全預測對的占比,精密度(Precision)是所有預測為正確的樣本中,實際為正確的樣本的占比,靈敏度(Sensitivity)是所有正確例中預測為正確例占比,特異性(Specificity)是所有不正確類中預測為不正確類占比,AUC(Area Under Curve)曲線(AUC curves)是靈敏度與特異性和的一半,用來評估給定算法的性能,AUC的值接近于1越好。靈敏度參數表示模型如何檢測正確樣本,特異性參數表示模型如何檢測不正確樣本,準確性參數定義了如何同時識別不正確和正確樣本。當前兩個參數增大時,模型精度提高,當前兩個參數減小時,精度減小。
式中:TP表示樣本為正確并正確預測;FP表明樣本呈正確,但預測錯誤;TN代表的是錯誤樣本,但分類正確;FN描述的樣本是不正確的,但不正確的預測。
本文實驗采用70%的土壤質地識別模型數據作為測試集訓練,另外30%的數據作為訓練集測試。該模型采用端對端的方式進行訓練和測試,使用Adam優(yōu)化器,學習率為0.001。具體的訓練步驟為:①初始化模型參數;②將訓練數據輸入到模型中并得到512維的輸出結果;③512維數據輸入到隨機森林中得到預測的損失;④通過優(yōu)化器反向傳播更新模型的參數;⑤重復上述②~④的步驟,直到第200輪結束。圖7為CNN-RF模型對土壤圖像的訓練和測試的損失函數,損失值顯示了在訓練過程中為每個圖像所做的誤差的總和,以找到最佳的權值作為模型參數。從圖7可以看出,由于該函數在訓練集和測試集上都呈下降趨勢,CNN-RF模型經過了良好的訓練,并收斂為正確的聚類分類。這個模型是收斂的,這對于CNN-RF土壤質地識別模型來說是符合邏輯的,當這個代價函數最小化到其最小值時,就可以實現準確的分類。
圖7 CNN-RF土壤質地識別模型進行訓練和測試數據的損失函數Fig.7 Loss function of CNN-RF soil texture recognition model training and test data
CNN-RF模型預測黏粒、粉粒和砂粒的土壤識別驗證數據統(tǒng)計,該模型依然使用的3種組合特征(顏色特征、紋理特征、顏色特征+紋理特征),如表1所示。預測砂粒MAE值為3.39,RMSE值為3.73,R2值為0.99;粉粒MAE值為3.51,RMSE值為3.81,R2值為0.98;黏粒MAE值為3.41,RMSE值為3.77,R2值為0.99。MAE值和RMSE值越小,R2越接近于1,模型性能更優(yōu)。從結果可知,MAE值和RMSE值更小,R2更接近于1,CNN-RF模型(顏色+紋理特征模型)性能更好。
表1 不同圖像特征的CNN-RF模型Tab.1 CNN-RF models with different image features
圖8是CNN-RF土壤質地識別模型的判定系數R2圖;預測黏粒、粉粒和砂粒的R2分別是0.99、0.98和0.99。由此可知,CNN-RF模型的R2接近于1,性能優(yōu)良。
圖8 CNN-RF模型預測性能對比Fig.8 Comparison of prediction performance between RF and CNN-RF models
土壤的黏粒、粉粒和砂粒的真實值和預測值對比圖,由圖9可知,CNN-RF模型的預測值與真實值存在差異性較小,如序號10~50的樣品之間,進一步說明CNN-RF模型性能優(yōu)良。
圖9 CNN-RF模型的預測土壤黏粒、粉粒和砂粒含量Fig.9 Prediction of soil clay,silt and sand content by CNN-RF model
圖10是CNN-RF模型得出的結果?;煜仃囷@示土壤圖像的預測分布。圖中矩陣的主對角線上顏色加深的元素表示預測值與實際值相等?;煜仃囎鳛橐环N結果可視化工具,可以得到更高級的分類指標:Accuracy(精確度),Precision(精密度),Specificity(特異性),Sensitivity(靈敏度),AUC曲線。以上指標可以用來驗證CNN-RF算法性能。
圖10 CNN-RF土壤質地預測混淆矩陣Fig.10 CNN-RF soil texture prediction confusion matrix
表2是CNN-RF模型對土壤圖像識別的各種性能統(tǒng)計結果??芍狢NN-RF模型識別準確度為99.43%,精密度為96.66%,靈敏度為96.78%,特異性為99.69%,AUC曲線為98.23%。結果表明,這些參數都接近100%,該CNN-RF土壤質地識別模型性能較優(yōu)。
表2 CNN-RF模型預測土壤質地類型的性能結果 %Tab.2 Performance results of CNN-RF model for predicting soil texture types
土壤是由黏粒、粉粒和砂粒組成。對采集的土壤圖像進行灰度化、去噪處理。面向土壤圖像中提取其顏色特征和紋理特征。通過土壤圖像中局部二值模式(LBP)與Haralick特征計算出土壤圖像的紋理特征;并將圖像的RGB顏色空間轉換為HSV分量計算出土壤的顏色特征;卷積神經網絡(CNN)和隨機森林(RF)算法相結合為CNN-RF模型,基于CNNRF模型結合3種組合(顏色特征、紋理特征、顆粒特征+顏色特征)方法對土壤樣本中的黏粒、粉粒和砂粒百分含量進行回歸預測。
CNN-RF模型與其他傳統(tǒng)機器學習性能對比,VGG16-RF模型預測砂粒的MAE值為3.37,RMSE值為3.87,R2值為0.96,粉粒的MAE值為3.58,RMSE值為3.98,R2值為0.96,黏粒的MAE值為3.57,RMSE值為3.81,R2值為0.97(見表3)。VGG16的網絡相對于本研究的網絡更深,能夠容納的特征量更多,本應該具有更良好的性能,但在測試時指標卻低于簡單的網絡。是因為VGG網絡由于參數量更多,導致在訓練集出現了過擬合的現象,從而影響了測試集的指標結果;RF模型預測砂粒的MAE值為3.58,RMSE值為4.35,R2值為0.96,預 測粉 粒 的MAE值 為3.73,RMSE值 為4.40,R2值 為0.85,預 測黏 粒 的MAE值 為3.63,RMSE值 為4.61,R2值 為0.97;KNN模型預測砂粒的MAE值為3.76,RMSE值為4.61,R2值為0.94,預測粉粒的MAE值為3.79,RMSE值為4.63,R2值為0.84,預測砂粒的MAE值為4.06,RMSE值為4.62,R2值為0.94。而CNN-RF土壤質地識別模型(顏色特征+紋理特征)的性能是最優(yōu),預測砂粒MAE值為3.39,RMSE值為3.73,R2值為0.99;粉粒MAE值為3.51,RMSE值為3.81,R2值為0.98;黏粒MAE值為3.41,RMSE值為3.77,R2值為0.99。與傳統(tǒng)的機器學習算法相比,CNN之所以能有更好的表現,是因為它可以從更深層次上得到由各種邊、線、角組成的圖像,并捕捉圖像的內容??芍狢NN-RF模型(顏色+紋理特征)性能更好。
表3 CNN-RF模型性能與其他模型性能的對比Tab.3 Performance comparison between CNN-RF model and other models
本文對廣州的番禺區(qū)、增城區(qū)、黃埔區(qū)等不同區(qū)域進行1 000個土壤樣本采樣,提取土壤圖像中的顏色特征和紋理特征,通過CNN-RF模型進行土壤黏粒、粉粒和砂粒含量預測,根據土壤質地三角圖實現了土壤質地的高效精準識別。通過該模型采集總數據中700個數據用于訓練,另外300個用于土壤質地識別模型測試,每個訓練過程使用200個訓練周期。CNN-RF模型預測黏粒、粉粒和砂粒的土壤識別驗證數據統(tǒng)計,該模型模型使用3種組合(顏色特征、紋理特征、顏色特征+紋理特征),獲得準確度、精密度、靈敏度、特異性、AUC曲線下面積等重要統(tǒng)計參數分別為99.43%、96.66%、96.78%、99.69%、98.23%。通過與類似算法進行比較,可看出本文提出的CNN-RF土壤質地識別模型(顏色特征+紋理特征)在關鍵性能指標上最優(yōu),為廣州嶺南丘陵土壤的耕作和農作物質量提升提供可靠技術支撐。