馮繼克,鄭穎,李平,李艷翠,張自陽,郭曉娟
(1. 河南科技學(xué)院信息工程學(xué)院,河南新鄉(xiāng),453003; 2. 河南師范大學(xué)計算機(jī)與信息工程學(xué)院,河南新鄉(xiāng),453000;3. 河南科技學(xué)院生命科技學(xué)院,河南新鄉(xiāng),453003)
小麥?zhǔn)俏覈匾Z食作物之一,培育優(yōu)良品種對提高糧食產(chǎn)量有重要作用。籽粒是育種基礎(chǔ),提高籽粒識別準(zhǔn)確率可有效提高育種效率。目前,國內(nèi)外對小麥與類似谷物分類的識別研究主要通過數(shù)碼相機(jī)、傳感器、掃描儀、光譜儀等獲取RGB圖像或高光譜圖像,通過對圖像提取特征或直接使用圖像構(gòu)建神經(jīng)網(wǎng)絡(luò)模型進(jìn)行識別,識別準(zhǔn)確率大多能達(dá)90%以上[1-9]?;谔卣鞯淖蚜WR別方法在小麥、水稻、玉米和苦蕎等作物中均得到應(yīng)用。在小麥籽粒品種識別方面,孟惜等[10]提取了小麥的23個特征參數(shù),利用PSO算法優(yōu)化網(wǎng)絡(luò)后識別6個品種的小麥,平均識別準(zhǔn)確率增加至94.3%。馮麗娟等[11]提出了利用稀疏表示的方法識別4個小麥品種,與BP神經(jīng)網(wǎng)絡(luò)方法比較,稀疏表示方法對于4個小麥品種識別準(zhǔn)確率達(dá)到96.7%,比BP神經(jīng)網(wǎng)絡(luò)高2個百分點(diǎn)。何紅霞[12]提取了8類小麥的顏色特征、形態(tài)特征和紋理特征共37個參數(shù),使用粒子群算法對神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,分類準(zhǔn)確率達(dá)96.32%,均方根誤差0.443。劉飛[13]提取了小麥的4個形狀特征和6個顏色特征,使用顏色和形狀特征相結(jié)合,對3個品種、4個品種和5個品種的小麥籽粒識別準(zhǔn)確率分別達(dá)95.6%,93.3%和89.3%。張強(qiáng)[14]使用圖像處理軟件提取了苦蕎種子的28個特征參數(shù),對11個品種的苦蕎種子識別,取得較好的識別效果。馮曉星等[15]提取了5個品種稻谷的光譜信息和圖像特征共27個參數(shù),采用BP-ANN的分類效果較好。彭燦[16]對提取的玉米籽粒圖像特征,通過線性相關(guān)性分析篩選參數(shù),提高了系統(tǒng)識別效率。
由于對圖像提取特征進(jìn)行籽粒識別的方法需要提取的特征較多,數(shù)據(jù)維度較大,很多研究者對特征進(jìn)行融合、降維等處理以提高效率。李秀昊等[17]將提取的6個形狀特征參數(shù)和15個顏色特征參數(shù)融合,采用SVM分類器對稻谷進(jìn)行識別,識別準(zhǔn)確率達(dá)99.5%。付曉鵬[18]采集了44個品種的大豆種粒圖像并構(gòu)建數(shù)據(jù)集,提取了大豆種粒圖像的形狀、HSI顏色以及紋理3類特征參數(shù),并采用PCA對特征參數(shù)進(jìn)行降維,采用LWKNCN算法識別6種大豆種粒圖像,最高識別率為85.61%。李東[19]利用主成分分析方法對提取的4類水稻種子的10個自變量進(jìn)行數(shù)據(jù)分析與降維處理,運(yùn)用余弦相似度的方法對稻花香2號水稻進(jìn)行最終鑒別,識別正確率為88%。黃瓊等[20]利用貝葉斯分類器對經(jīng)過LDA降維處理后的水稻種子進(jìn)行識別,識別準(zhǔn)確率高達(dá)99.4%。馮曉星等[15]對提取稻谷的27個特征參數(shù)進(jìn)行PCA降維,使得稻谷識別更加高效。
結(jié)合籽粒識別和專家人工分辨發(fā)現(xiàn),小麥籽粒品種的識別準(zhǔn)確率僅與少數(shù)重要的特征關(guān)系較大。為判別影響品種識別的重要特征參數(shù)和提高識別效率,本文進(jìn)行基于特征選擇的小麥籽粒品種識別。首先采集農(nóng)大3416-18、內(nèi)樂288、衡水6632、百農(nóng)419、洛麥28和新麥26六個不同品種的小麥籽粒圖像,經(jīng)過預(yù)處理提取了小麥的顏色、紋理和形態(tài)共計28個特征參數(shù)。然后采用不同的分類器進(jìn)行識別,構(gòu)建不同的特征融合模型和對特征數(shù)據(jù)進(jìn)行降維處理,并對圖像進(jìn)行數(shù)據(jù)增強(qiáng)。通過多個試驗對比分析,篩選出影響小麥籽粒識別的重要特征,并確定適合小麥籽粒識別的模型,以達(dá)到快速并準(zhǔn)確識別小麥籽粒品種的目的。
本文小麥籽粒樣本均由河南科技學(xué)院生命科技學(xué)院提供,其獲取時間為2020年9—10月。選用農(nóng)大3416-18、內(nèi)樂288、衡水6632、百農(nóng)419、洛麥28和新麥26共6個品種的小麥種子作為試驗對象,圖1給出每個品種的圖片樣例。
(a) 農(nóng)大3416-18
為獲取清晰準(zhǔn)確的圖片,本文使用體視顯微鏡拍攝小麥種子圖片,拍攝時以黑色吸光絨布為背景,“體視顯微鏡”參數(shù)設(shè)置為放大倍數(shù)為1倍,2 688×1 520 的分辨率,自動白平衡(AWB)和寬動態(tài)平衡(WDR)選擇關(guān)閉,LED補(bǔ)光燈設(shè)置為中等,通過調(diào)整體視顯微鏡右側(cè)焦螺旋對小麥種子聚焦,在室內(nèi)自然光照和燈光條件下,完成小麥種子圖片拍攝。為保證籽粒完整性,每個品種小麥籽粒挑選出顆粒飽滿的種子1 100粒。小麥籽粒圖像采集考慮實(shí)際情況,圖片保存為PNG格式,圖片大小為2 688×1 520像素。拍攝采取單粒分角度拍攝,每粒小麥分別拍攝腹溝向上、腹溝朝前45°和腹溝向下3個角度的3張圖片,最后篩選出拍攝清晰、背景純的1 000粒小麥籽粒圖像,共計18 000張圖片。分別將小麥籽粒圖片分品種按角度進(jìn)行存儲。
本試驗采集的小麥籽粒圖像為RGB圖像,在實(shí)驗室拍攝過程中,圖像的獲取容易受拍攝器材、拍攝背景及光照等因素影響,形成圖像噪聲,影響識別精度。因此,在特征提取之前需要對原始圖像進(jìn)行去背景、濾波降噪和二值化等處理,以降低圖像噪聲,如圖2所示。
(a) RGB圖像
本文預(yù)處理過程及結(jié)果如下:原始圖像經(jīng)過去背景,如圖2(a)所示;灰度處理,將RGB圖像經(jīng)過灰度化得到小麥的灰度圖像,采用高斯濾波方法對灰度圖像增強(qiáng),以達(dá)到降低噪聲,保證邊緣的效果,如圖2(b)所示;圖像二值化,圖2(c)是對高斯濾波圖像進(jìn)行二值化處理后的圖像;獲取圖像邊緣,圖2(d)的邊緣圖像用于提取小麥的形態(tài)特征。
根據(jù)拍攝角度,將小麥圖片按腹溝向上、腹溝朝前45°和腹溝向下分別提取形態(tài)特征、顏色特征和紋理特征3方面共計28個參數(shù),不同品種、不同小麥籽粒之間有不同的參數(shù)值。將提取的特征按品種分角度保存成“.csv”文件。
1.3.1 小麥籽粒形態(tài)特征提取
小麥籽粒的形態(tài)特征是可以直接展現(xiàn)小麥外觀的重要參數(shù),本文選取面積A、周長C、長軸軸長L、短軸軸長W、離心率e1、外接矩形面積S1、慣性矩con、圓形度C1和矩形度R1共9個特征參數(shù)。6個品種小麥平均形態(tài)特征參數(shù)如表1所示。
表1 6個品種的小麥形態(tài)特征參數(shù)均值
可以看出,對比面積百農(nóng)419明顯區(qū)分于其他5個品種,并且不同品種小麥籽粒的其他形態(tài)特征參數(shù)均存在一定差異。因此,形態(tài)特征可用來識別不同小麥籽粒品種。
1.3.2 小麥籽粒顏色特征提取
顏色特征同樣是識別小麥籽粒品種信息的重要指標(biāo)。本文提取了RGB顏色模型的R、G、B分量,但是R、G、B分量受光照等因素影響較大,為降低客觀因素帶來的品種識別率誤差。同時提取了HSV模型中的色調(diào)H、飽和度S和亮度V。
顏色矩是一種有效表示顏色特征的方法,有一階矩(即均值,mean)、二階矩(即標(biāo)準(zhǔn)差,variance)和三階矩(即斜度,skewness)等,由于顏色信息主要分布于低階矩中,所以本文提取了一階矩、二階矩和三階矩用來表達(dá)小麥籽粒圖像的顏色分布。
6個品種小麥平均顏色特征參數(shù)如表2所示,由于受小麥本身色度及光照等影響,不同小麥之間的R、G和B均存在差異,同時不同品種之間的H、S和V及其分量也存在較大不同,因此顏色特征可以用來區(qū)分小麥品種。
表2 6個品種的小麥顏色特征參數(shù)均值
1.3.3 小麥籽粒紋理特征提取
本文采用灰度共生矩陣的方法提取了紋理特征中的逆方差I(lǐng)DM、能量ASM、熵ENT和對比度CON共4個特征參數(shù)。逆方差反應(yīng)紋理的清晰和規(guī)則程度,值越大,紋理越清晰,規(guī)律性越強(qiáng);能量是圖像的灰度分布和紋理粗細(xì)的度量值;熵表示該超像素塊的紋理復(fù)雜度;逆方差用來度量局部灰度相關(guān)性。6個品種小麥的平均紋理特征參數(shù)如表3所示。
表3 6個品種的小麥紋理特征參數(shù)均值
1.3.4 特征相關(guān)性分析
為分析提取到的特征之間的關(guān)聯(lián),本文采用相關(guān)系數(shù)的方法對特征參數(shù)進(jìn)行相關(guān)性分析。結(jié)果如圖3~圖5所示,分別為形態(tài)、顏色和紋理3個特征相關(guān)性熱力圖,顏色刻度條越淺,說明兩特征相關(guān)性越強(qiáng),相關(guān)系數(shù)越接近1或-1,表明正/反線性關(guān)系越強(qiáng),相關(guān)系數(shù)為0則表示兩個變量間沒有線性關(guān)系。
圖3 形態(tài)特征相關(guān)性熱力圖
圖4 顏色特征相關(guān)性熱力圖
圖5 紋理特征相關(guān)性熱力圖
由圖3可知周長和矩形度,短軸軸長和離心率,離心率和慣性矩刻度條顏色較深,其之間負(fù)相關(guān)性較弱。矩形度和短軸軸長相關(guān)性為-0.035,相關(guān)性較小。外接矩形面積和慣性矩相關(guān)性為0.97,其正相關(guān)性最大。
從圖4可以看出,R、G和B與亮度均存在較大負(fù)相關(guān)性,說明R、G和B顏色分量越大,亮度就越高。飽和度和亮度與其分量之間均存在較大正相關(guān)。從圖5可以看出,逆方差與熵之間存在較大負(fù)相關(guān)性,能量和熵存在較大正相關(guān)性。
本試驗用到了6個品種小麥籽粒特征數(shù)據(jù),剔除個別無效數(shù)據(jù),共保留17 997組特征數(shù)據(jù),將80%的小麥籽粒圖像特征參數(shù)作為訓(xùn)練集,10%的特征參數(shù)作為驗證集,剩余10%的特征參數(shù)作為測試集,將提取的小麥籽粒圖像的顏色、形態(tài)和紋理3方面共28個特征參數(shù),作為K近鄰(KNN)、貝葉斯(Bayes)、支持向量機(jī)(SVM)和隨機(jī)森林(Random Forest)的輸入數(shù)據(jù),實(shí)現(xiàn)小麥籽粒的品種識別。
具體的操作流程如下。
1) 隨機(jī)選取80%的特征參數(shù)作為訓(xùn)練集,10%的特征參數(shù)作為驗證集,剩余10%的特征作為測試集。
2) 提取小麥圖像的顏色、形態(tài)和紋理3方面共計28個特征參數(shù)。
3) 將28個特征參數(shù)進(jìn)行[0,1]歸一化處理,分別作為K近鄰、貝葉斯、支持向量機(jī)和隨機(jī)森林的輸入數(shù)據(jù)。
4) 訓(xùn)練K近鄰、貝葉斯、支持向量機(jī)和隨機(jī)森林分類模型。
5) 采用訓(xùn)練好的模型對測試集進(jìn)行測試,得到分類預(yù)測結(jié)果并作對比。
1.4.1 構(gòu)建不同特征融合模型
為了驗證不同特征對小麥籽粒品種識別的效果,本試驗將提取的小麥種子圖像的9個形態(tài)特征、4個紋理特征和15個顏色特征,以及兩兩特征和3個方面特征融合,構(gòu)建7個特征融合模型,即形態(tài)特征模型、紋理特征模型、顏色特征模型、紋理+顏色特征模型、紋理+形態(tài)特征模型、形態(tài)+顏色特征模型和紋理+形態(tài)+顏色特征模型,并對不同特征模型進(jìn)行識別結(jié)果比較。
1.4.2 構(gòu)建不同特征數(shù)據(jù)降維模型
為提升小麥籽粒品種識別效率和判別影響識別準(zhǔn)確率主要因素,采用機(jī)器學(xué)習(xí)軟件包sklearn庫中SelectKBest、PCA和LDA模型降維與原始數(shù)據(jù)集識別結(jié)果進(jìn)行對比,對28個特征參數(shù)進(jìn)行降維分析,分別選出前5個重要特征參數(shù)作為KNN分類器輸入數(shù)據(jù),以精確率、召回率和F1值等作評價指標(biāo),對降維數(shù)據(jù)結(jié)果進(jìn)行分析對比。
1.4.3 構(gòu)建數(shù)據(jù)增強(qiáng)模型
由于小麥籽粒圖像采集過程中容易受光照、背景和拍攝儀器等影響,為提升識別精確度,提高模型的泛化能力,經(jīng)過分析對比選取腹溝朝前45°這一角度原始圖像,采用python中PIL的ImageEnhance函數(shù),對亮度、色度、對比度和銳度進(jìn)行隨機(jī)增強(qiáng),數(shù)據(jù)增強(qiáng)的標(biāo)準(zhǔn)以不明顯影響原始圖像區(qū)分度為準(zhǔn),將原始數(shù)據(jù)擴(kuò)充4倍,并提取對應(yīng)特征參數(shù),作為分類器輸入?yún)?shù),對識別結(jié)果進(jìn)行分析。數(shù)據(jù)增強(qiáng)后圖像如圖6所示。
(a) 原始圖像
本文試驗均用到了農(nóng)大3416-18、內(nèi)樂288、衡水6632、百農(nóng)419、洛麥28和新麥26六個小麥籽粒品種特征數(shù)據(jù),因受隨機(jī)因子等因素影響,每次試驗結(jié)果存在一定不同,故任選取5次試驗結(jié)果平均值。
表4為28個原始特征參數(shù)歸一化處理后,在Bayes、SVM、Random Forest和KNN四個分類器上的識別結(jié)果,可以看出Random Forest分類器訓(xùn)練時間最短,僅0.035 s,遠(yuǎn)低于KNN分類器訓(xùn)練時間,但KNN分類器測試集識別準(zhǔn)確率高達(dá)91.02%,高出Bayes識別率18.12個百分點(diǎn),高出SVM識別率5.85個百分點(diǎn),高出Random Forest識別率7.55個百分點(diǎn)。同時,以分類結(jié)果的準(zhǔn)確率、精確率、召回率和F1值為評價指標(biāo),KNN模型均優(yōu)于其他3類模型,因此在本文提取的特征數(shù)據(jù)上,KNN模型較其他3個模型更適用于小麥籽粒品種分類。
表4 小麥籽粒原始數(shù)據(jù)集分類結(jié)果
原始特征共有形態(tài)、顏色、紋理3類28個特征參數(shù),本試驗將3類特征進(jìn)行組合構(gòu)建了7組特征融合模型,利用上述分類效果較好的KNN模型對其進(jìn)行分類識別,識別精確率結(jié)果如表5所示,其中平均識別率為單個特征模型的平均識別準(zhǔn)確率。
由表5可知,相比形態(tài)和紋理特征模型,在單個特征模型作為數(shù)據(jù)集用來識別時,顏色特征模型平均識別率達(dá)到89.13%,其中農(nóng)大3416-18識別精確率達(dá)96.2%。在兩個特征融合的識別率中,紋理+顏色特征模型平均識別率最高,達(dá)90.66%,高于紋理+形態(tài)特征模型34.52個百分點(diǎn)。紋理+形態(tài)+顏色三個特征融合模型平均識別率為91.02%,為7個特征融合模型識別準(zhǔn)確率最高。在所有品種識別精確率中,基于紋理+形態(tài)+顏色特征模型的洛麥28識別精確率最高,達(dá)97.0%,基于紋理特征模型農(nóng)大3416-18識別精確率最低,為26.0%,兩者相差71個百分點(diǎn)。
通過分析表5識別結(jié)果,可以看出基于不同特征融合的小麥籽粒品種識別中,紋理+形態(tài)+顏色特征模型平均識別率為91.02%,高于識別率最低的紋理特征模型47.88個百分點(diǎn)。與顏色特征融合的3個特征模型,平均識別率均達(dá)89%以上,遠(yuǎn)高于形態(tài)、紋理和紋理+形態(tài)特征融合模型的識別準(zhǔn)確率。由此可見,顏色特征在識別結(jié)果中貢獻(xiàn)度較大,鑒于個別特征參數(shù)的提取可能受拍攝條件、光照及拍攝儀器等外在因素影響,以下試驗將對特征參數(shù)做降維處理與分析。
表5 基于不同特征融合的小麥籽粒品種識別精確率
2.2.1 特征降維數(shù)據(jù)分析
由于LDA降維最多降到類別數(shù)k-1,即5維,因此試驗中降維模型均選取5維數(shù)據(jù)作對比。
利用sklearn.SelectKBest函數(shù)選取了model.scores_得分最高的前5個重要特征,分別為飽和度(S)、飽和度的三階矩(S斜度)、飽和度的二階矩(S標(biāo)準(zhǔn)差)、色調(diào)的三階矩(H斜度)和飽和度一階矩(S均值);經(jīng)過PCA降維后,選取了貢獻(xiàn)率最大前5個主成分,前5個主成分貢獻(xiàn)率累計87.57%,占比分別為39.87%、19.57%、17.64%、5.7%和4.79%。
如圖7(a)所示,經(jīng)PCA降維后的數(shù)據(jù),受拍攝角度影響,洛麥28、衡水6632和新麥26等同樣本內(nèi)比較分散。衡水6632、百農(nóng)419和農(nóng)大3416-18樣本之間分布距離較大,容易區(qū)分。其他品種之間既有分散又存在重合;經(jīng)過LDA降維后,前5個判別因子累計貢獻(xiàn)率將近100%,判別因子貢獻(xiàn)率分別為55.14%、20.79%、12.74%、7.34%和3.99%。
如圖7(b)所示,不同樣本之間重合度較大,農(nóng)大3416-18、衡水6632和新麥26之間既有少部分重合,同時其他樣本之間又較分散。
(a) PCA對特征降維
2.2.2 特征降維數(shù)據(jù)分類結(jié)果對比
經(jīng)過SelectKBest、PCA和LDA降維處理后,采用KNN分類模型進(jìn)行識別,如表6所示。
表6 特征降維數(shù)據(jù)分類結(jié)果
根據(jù)SelectKBest的model.scores_得分模型將原始28個特征降到5維,測試集識別準(zhǔn)確率下降到75.38%,但識別效率提升。經(jīng)過LDA降維處理后的識別結(jié)果,訓(xùn)練時間僅為0.87 s,較原始數(shù)據(jù)訓(xùn)練時間大大降低,同時也優(yōu)于其他兩個降維數(shù)據(jù)的訓(xùn)練時間。就識別準(zhǔn)確率來講,LDA方法測試集識別準(zhǔn)確率為86.19%,高于SelectKBest方法10.81個百分點(diǎn),高于PCA方法6.63個百分點(diǎn),但是就全部特征識別準(zhǔn)確率下降了4.83個百分點(diǎn)。依據(jù)訓(xùn)練時間、準(zhǔn)確率、精確率、召回率和F1評價結(jié)果,說明LDA降維模型具有一定的高效性和實(shí)用性。
2.3.1 不同角度小麥籽粒識別結(jié)果
本文試驗數(shù)據(jù)在拍攝時采用3個角度分別拍攝一個籽粒,本部分采用分角度試驗來考察不同角度對小麥籽粒識別結(jié)果的影響。表7為腹溝向上、腹溝朝前45°和腹溝朝下3個不同角度的識別結(jié)果,可以看出,腹溝朝前45°在測試集識別準(zhǔn)確率為91.83%,高于腹溝向上1.16個百分點(diǎn),高于腹溝朝下1.43個百分點(diǎn)。同時,在測試集的精確率、召回率和F1值3個評價指標(biāo)上,腹溝朝前45°均高于其他兩個角度的,因此在接下來試驗中選取腹溝朝前45°這一角度的小麥籽粒圖像作數(shù)據(jù)增強(qiáng)。
表7 不同角度小麥籽粒分類結(jié)果
2.3.2 原始數(shù)據(jù)與數(shù)據(jù)增強(qiáng)識別結(jié)果
腹溝朝前45°的小麥籽粒圖像共抽取5 999組特征數(shù)據(jù),但原始數(shù)據(jù)有17 997組。為避免數(shù)據(jù)過少,本部分采用圖像增加方法進(jìn)行試驗,數(shù)據(jù)增強(qiáng)方法如1.4.3節(jié)所述。數(shù)據(jù)增強(qiáng)4倍后共抽取29 995組特征數(shù)據(jù),在KNN模型分類結(jié)果如表8所示。
表8 數(shù)據(jù)增強(qiáng)前后分類結(jié)果
從表8可以看出,隨著數(shù)據(jù)量的增多,增強(qiáng)后的數(shù)據(jù)集運(yùn)算時間增加。在訓(xùn)練集識別上,增強(qiáng)后數(shù)據(jù)集識別準(zhǔn)確率達(dá)96.67%,高于其他兩個數(shù)據(jù)集識別準(zhǔn)確率。測試集中增強(qiáng)后數(shù)據(jù)集識別準(zhǔn)確率達(dá)94.26%,高于原始數(shù)據(jù)集3.24個百分點(diǎn),高于腹溝朝前45°單角度識別率2.43個百分點(diǎn)。增強(qiáng)后的數(shù)據(jù)集精確率、召回率和F1值均明顯優(yōu)于其他兩類數(shù)據(jù)集。因此通過數(shù)據(jù)增強(qiáng)的方法對小麥籽粒品種識別準(zhǔn)確率有一定提高。
1) 采集了6個市場推廣面積比較廣的小麥籽粒品種圖像,每個品種分別采集1 000粒,每粒分別采集腹溝向上、腹溝朝前45°和腹溝朝下3張圖像,每個品種采集了3 000張圖像,共計18 000張,構(gòu)建小麥籽粒圖像數(shù)據(jù)庫。提取小麥籽粒的顏色特征、形態(tài)特征和紋理特征共28個特征參數(shù)后,保留可用的17 997組特征數(shù)據(jù),用于小麥品種的識別。
2) 提取小麥籽粒的9個形態(tài)特征、15個顏色特征和4個紋理特征,構(gòu)建了形態(tài)特征模型、紋理特征模型、顏色特征模型、紋理+顏色特征模型、紋理+形態(tài)特征模型、形態(tài)+顏色特征模型和紋理+形態(tài)+顏色特征模型7個特征模型,采用KNN分類器對不同特征模型進(jìn)行識別結(jié)果比較,結(jié)果表明:基于紋理+形態(tài)+顏色特征模型,平均識別準(zhǔn)確率為91.02%,高于其他特征融合模型,其中基于紋理+形態(tài)+顏色特征模型的洛麥28識別率最高,達(dá)97.0%。
3) 針對小麥籽粒品種識別容易受光照等外在因素的影響,對提取的28個特征參數(shù)進(jìn)行降維處理與分析,利用SelectKBest函數(shù)方法選取前5個重要特征,分別為飽和度(S)、飽和度的三階矩(S斜度)、飽和度的二階矩(S標(biāo)準(zhǔn)差)、色調(diào)的三階矩(H斜度)和飽和度一階矩(S均值);采用LDA降維,前5個判別因子貢獻(xiàn)率累計接近100%,測試集識別準(zhǔn)確率達(dá)86.19%,模型訓(xùn)練時間0.87 s,極大提升了小麥籽粒識別效率。
4) 選取腹溝朝前45°小麥籽粒圖像進(jìn)行亮度、色度、對比度和銳度的隨機(jī)增強(qiáng),并對提取特征識別結(jié)果與原始3個角度和單角度識別結(jié)果分析對比,增強(qiáng)后數(shù)據(jù)集識別準(zhǔn)確率達(dá)94.26%,高于原始數(shù)據(jù)集3.24個百分點(diǎn),高于腹溝朝前45°單角度識別率2.43個百分點(diǎn)。提升了小麥籽粒品種識別模型的泛化能力,同時一定程度提高了小麥籽粒品種識別效果。