姚忠毅,任利峰
(吉林農(nóng)業(yè)科技學(xué)院,吉林 吉林 132101)
基于KNN-SVM算法的溫室番茄生長預(yù)測模型的設(shè)計與運用,能夠24 h實現(xiàn)對大棚番茄生長環(huán)境數(shù)據(jù)進行采集,并生成番茄生長預(yù)測模型。其中,番茄的生長觀察對于溫室大棚中番茄優(yōu)化管理和產(chǎn)量的提升有著至關(guān)重要的作用。其中,果實橫向直徑與縱向直徑是作物生長的關(guān)鍵因素[1-2]。生長模型是以系統(tǒng)分析和數(shù)學(xué)模擬來定量描述生物的生長和發(fā)育以及形態(tài)建成過程,反映生物內(nèi)外環(huán)境對生長發(fā)育的影響,是植物果實發(fā)育研究的重要內(nèi)容和手段[3-6]?;贙NN-SNM模型的大棚番茄生長預(yù)測模型的建立,對于我國大棚番茄種植起到了重要的數(shù)據(jù)及技術(shù)支撐。SVM算法模型和KNN算法模型在機器學(xué)習(xí)中充當著重要的組成部分。其中,SVM算法支持向量機,其核心算法十分強大;KNN算法模型則為最簡便的機器學(xué)習(xí)算法。通過二者的有機結(jié)合,使得在數(shù)據(jù)分析以及模型建立上,變得更加快捷、清晰。我國作為世界第一大番茄生產(chǎn)、出口國,對于番茄的科學(xué)種植迫在眉睫。
基于KNN-SNM模型的大棚番茄生長預(yù)測模型的建立,對于我國大棚番茄種植起到重要的數(shù)據(jù)及技術(shù)支撐。主要的實施方案分為:(1)SVM算法的設(shè)計與改進,SVM的基本原理是在高維空間中構(gòu)造一個最優(yōu)超平面,從而實現(xiàn)對數(shù)據(jù)的分類。使得采集的數(shù)據(jù)能夠得到更加靈活快速的分析。(2)對番茄生長數(shù)據(jù)進行采集,通過大棚中的溫度、濕度、空氣質(zhì)量、光照強度、土壤質(zhì)量等有關(guān)數(shù)據(jù)傳感器來采集大棚中的環(huán)境數(shù)據(jù)與番茄生長數(shù)據(jù),利用大棚中有關(guān)數(shù)據(jù)傳感器采集的數(shù)據(jù)為基礎(chǔ),并收集番茄生長的環(huán)境數(shù)據(jù),來判斷溫室番茄最適宜的生長環(huán)境。(3)大棚番茄生長預(yù)測模型的建立,對采集到的環(huán)境數(shù)據(jù)與番茄生長數(shù)據(jù)進行數(shù)據(jù)模擬,以溫度、濕度、光照強度、二氧化碳和生長天數(shù)為輸入,預(yù)測果實增量變化,通過設(shè)置多種環(huán)境參數(shù)梯度試驗,分析番茄果實直徑數(shù)據(jù)和莖直徑數(shù)據(jù)[7-8]。
(1)實現(xiàn)核函數(shù)緩存,皮爾遜相關(guān)系數(shù)是用來解釋2個隨機變量之間的線性相關(guān)程度,其值介于-1~1。設(shè)有2個變量X、Y,則X、Y之間的皮爾遜相關(guān)系數(shù)的關(guān)系如下:
(2)進行優(yōu)化誤差值求解,在SVM模型中,首先實現(xiàn)了核函數(shù)緩存,對開銷最大的核函數(shù)計算進行緩存,提升了20倍效率。然后,進行優(yōu)化誤差值求解:
(3)對算法進行分析改進,給g(x)求一個關(guān)于a的偏導(dǎo),若變化了步長delta,即所有樣本對應(yīng)的g(x)加上一個delta乘以針對的偏導(dǎo)數(shù)即可。每次成功更新一對以后,更新所有樣本對應(yīng)的g(x) 緩存,通過每次迭代更新g(x),避免了大量的重復(fù)計算。隱藏層即一個或多個包含若干神經(jīng)元的隱藏層,可以根據(jù)問題的復(fù)雜性選擇隱藏層的數(shù)量和大小。
綜合番茄溫室環(huán)境、精準性、測量范圍以及可靠性等因素選取以下幾種傳感器:土壤濕度傳感器、 二氧化碳濃度傳感器、空氣溫度傳感器。并進行如下分析,分為4個步驟:
(1)對大棚番茄與大棚內(nèi)溫度、濕度、二氧化碳濃度的數(shù)據(jù)進行傳感器采集。
(2)將各傳感器采集到的數(shù)據(jù)上傳到終端,分別進行識別與處理,保留有效數(shù)據(jù)并使用最小二乘法對異常數(shù)據(jù)進行處理及特征提取。
(3)采用主成分分析、多重共線性分析、回歸分析等統(tǒng)計分析結(jié)合的算法進行挖掘分析。
(4)利用 SVM 算法多傳感器數(shù)據(jù)與生長參數(shù)的關(guān)系進行數(shù)據(jù)融合,構(gòu)建生長模型。
針對當前大棚番茄數(shù)據(jù)收集過程中,可能會造成數(shù)據(jù)丟失或數(shù)據(jù)異常,需要對異常數(shù)據(jù)進行處理。同種傳感器的多點測量,對采集到的數(shù)據(jù)特征進行處理,增強其相關(guān)性。在綜合分析當前作物生長數(shù)據(jù)研究現(xiàn)狀,使用KNN算法進行長勢特征數(shù)據(jù)進行分析,并建立基于主要環(huán)境因子的大棚番茄不同時期生長模型。例如生成每日空氣相對濕度檢測模型,如圖1所示。
圖1 每日病蟲害檢測
經(jīng)上述方案的實施及優(yōu)化,通過數(shù)據(jù)可視化技術(shù),將大棚番茄生長預(yù)測模型以圖像形式展現(xiàn)出來,并結(jié)合KNN-SVM算法,實現(xiàn)隨時監(jiān)測、隨時生成的功能,并通過相關(guān)科學(xué)數(shù)據(jù)制定大棚番茄生長環(huán)境臨界點。超出或低于科學(xué)范圍值則立即生成模型圖,并進行報警,方便工作人員及時調(diào)控相關(guān)參數(shù),以使大棚番茄達到更高產(chǎn)和最佳質(zhì)量的理想狀態(tài)。
本文首先收集了豐富的番茄生長數(shù)據(jù),并對其進行了預(yù)處理和特征提取。然后,使用KNN算法對數(shù)據(jù)進行了分類,為番茄生長情況建立了相似性模型。接著通過SVM算法,構(gòu)建了一個高維的邊界,使得不同生長情況能夠被更準確地分類。研究結(jié)果表明,基于KNN-SVM算法的大棚番茄生長預(yù)測模型在準確性和穩(wěn)定性方面都取得了顯著的進展。在實際應(yīng)用中,希望該模型能夠為農(nóng)業(yè)生產(chǎn)提供更多的支持和指導(dǎo),促進作物的高效種植和生長。