姚忠毅,任利峰
(吉林農(nóng)業(yè)科技學(xué)院,吉林 吉林 132101)
基于KNN-SVM算法的溫室番茄生長(zhǎng)預(yù)測(cè)模型的設(shè)計(jì)與運(yùn)用,能夠24 h實(shí)現(xiàn)對(duì)大棚番茄生長(zhǎng)環(huán)境數(shù)據(jù)進(jìn)行采集,并生成番茄生長(zhǎng)預(yù)測(cè)模型。其中,番茄的生長(zhǎng)觀察對(duì)于溫室大棚中番茄優(yōu)化管理和產(chǎn)量的提升有著至關(guān)重要的作用。其中,果實(shí)橫向直徑與縱向直徑是作物生長(zhǎng)的關(guān)鍵因素[1-2]。生長(zhǎng)模型是以系統(tǒng)分析和數(shù)學(xué)模擬來(lái)定量描述生物的生長(zhǎng)和發(fā)育以及形態(tài)建成過(guò)程,反映生物內(nèi)外環(huán)境對(duì)生長(zhǎng)發(fā)育的影響,是植物果實(shí)發(fā)育研究的重要內(nèi)容和手段[3-6]?;贙NN-SNM模型的大棚番茄生長(zhǎng)預(yù)測(cè)模型的建立,對(duì)于我國(guó)大棚番茄種植起到了重要的數(shù)據(jù)及技術(shù)支撐。SVM算法模型和KNN算法模型在機(jī)器學(xué)習(xí)中充當(dāng)著重要的組成部分。其中,SVM算法支持向量機(jī),其核心算法十分強(qiáng)大;KNN算法模型則為最簡(jiǎn)便的機(jī)器學(xué)習(xí)算法。通過(guò)二者的有機(jī)結(jié)合,使得在數(shù)據(jù)分析以及模型建立上,變得更加快捷、清晰。我國(guó)作為世界第一大番茄生產(chǎn)、出口國(guó),對(duì)于番茄的科學(xué)種植迫在眉睫。
基于KNN-SNM模型的大棚番茄生長(zhǎng)預(yù)測(cè)模型的建立,對(duì)于我國(guó)大棚番茄種植起到重要的數(shù)據(jù)及技術(shù)支撐。主要的實(shí)施方案分為:(1)SVM算法的設(shè)計(jì)與改進(jìn),SVM的基本原理是在高維空間中構(gòu)造一個(gè)最優(yōu)超平面,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類。使得采集的數(shù)據(jù)能夠得到更加靈活快速的分析。(2)對(duì)番茄生長(zhǎng)數(shù)據(jù)進(jìn)行采集,通過(guò)大棚中的溫度、濕度、空氣質(zhì)量、光照強(qiáng)度、土壤質(zhì)量等有關(guān)數(shù)據(jù)傳感器來(lái)采集大棚中的環(huán)境數(shù)據(jù)與番茄生長(zhǎng)數(shù)據(jù),利用大棚中有關(guān)數(shù)據(jù)傳感器采集的數(shù)據(jù)為基礎(chǔ),并收集番茄生長(zhǎng)的環(huán)境數(shù)據(jù),來(lái)判斷溫室番茄最適宜的生長(zhǎng)環(huán)境。(3)大棚番茄生長(zhǎng)預(yù)測(cè)模型的建立,對(duì)采集到的環(huán)境數(shù)據(jù)與番茄生長(zhǎng)數(shù)據(jù)進(jìn)行數(shù)據(jù)模擬,以溫度、濕度、光照強(qiáng)度、二氧化碳和生長(zhǎng)天數(shù)為輸入,預(yù)測(cè)果實(shí)增量變化,通過(guò)設(shè)置多種環(huán)境參數(shù)梯度試驗(yàn),分析番茄果實(shí)直徑數(shù)據(jù)和莖直徑數(shù)據(jù)[7-8]。
(1)實(shí)現(xiàn)核函數(shù)緩存,皮爾遜相關(guān)系數(shù)是用來(lái)解釋2個(gè)隨機(jī)變量之間的線性相關(guān)程度,其值介于-1~1。設(shè)有2個(gè)變量X、Y,則X、Y之間的皮爾遜相關(guān)系數(shù)的關(guān)系如下:
(2)進(jìn)行優(yōu)化誤差值求解,在SVM模型中,首先實(shí)現(xiàn)了核函數(shù)緩存,對(duì)開(kāi)銷最大的核函數(shù)計(jì)算進(jìn)行緩存,提升了20倍效率。然后,進(jìn)行優(yōu)化誤差值求解:
(3)對(duì)算法進(jìn)行分析改進(jìn),給g(x)求一個(gè)關(guān)于a的偏導(dǎo),若變化了步長(zhǎng)delta,即所有樣本對(duì)應(yīng)的g(x)加上一個(gè)delta乘以針對(duì)的偏導(dǎo)數(shù)即可。每次成功更新一對(duì)以后,更新所有樣本對(duì)應(yīng)的g(x) 緩存,通過(guò)每次迭代更新g(x),避免了大量的重復(fù)計(jì)算。隱藏層即一個(gè)或多個(gè)包含若干神經(jīng)元的隱藏層,可以根據(jù)問(wèn)題的復(fù)雜性選擇隱藏層的數(shù)量和大小。
綜合番茄溫室環(huán)境、精準(zhǔn)性、測(cè)量范圍以及可靠性等因素選取以下幾種傳感器:土壤濕度傳感器、 二氧化碳濃度傳感器、空氣溫度傳感器。并進(jìn)行如下分析,分為4個(gè)步驟:
(1)對(duì)大棚番茄與大棚內(nèi)溫度、濕度、二氧化碳濃度的數(shù)據(jù)進(jìn)行傳感器采集。
(2)將各傳感器采集到的數(shù)據(jù)上傳到終端,分別進(jìn)行識(shí)別與處理,保留有效數(shù)據(jù)并使用最小二乘法對(duì)異常數(shù)據(jù)進(jìn)行處理及特征提取。
(3)采用主成分分析、多重共線性分析、回歸分析等統(tǒng)計(jì)分析結(jié)合的算法進(jìn)行挖掘分析。
(4)利用 SVM 算法多傳感器數(shù)據(jù)與生長(zhǎng)參數(shù)的關(guān)系進(jìn)行數(shù)據(jù)融合,構(gòu)建生長(zhǎng)模型。
針對(duì)當(dāng)前大棚番茄數(shù)據(jù)收集過(guò)程中,可能會(huì)造成數(shù)據(jù)丟失或數(shù)據(jù)異常,需要對(duì)異常數(shù)據(jù)進(jìn)行處理。同種傳感器的多點(diǎn)測(cè)量,對(duì)采集到的數(shù)據(jù)特征進(jìn)行處理,增強(qiáng)其相關(guān)性。在綜合分析當(dāng)前作物生長(zhǎng)數(shù)據(jù)研究現(xiàn)狀,使用KNN算法進(jìn)行長(zhǎng)勢(shì)特征數(shù)據(jù)進(jìn)行分析,并建立基于主要環(huán)境因子的大棚番茄不同時(shí)期生長(zhǎng)模型。例如生成每日空氣相對(duì)濕度檢測(cè)模型,如圖1所示。
圖1 每日病蟲(chóng)害檢測(cè)
經(jīng)上述方案的實(shí)施及優(yōu)化,通過(guò)數(shù)據(jù)可視化技術(shù),將大棚番茄生長(zhǎng)預(yù)測(cè)模型以圖像形式展現(xiàn)出來(lái),并結(jié)合KNN-SVM算法,實(shí)現(xiàn)隨時(shí)監(jiān)測(cè)、隨時(shí)生成的功能,并通過(guò)相關(guān)科學(xué)數(shù)據(jù)制定大棚番茄生長(zhǎng)環(huán)境臨界點(diǎn)。超出或低于科學(xué)范圍值則立即生成模型圖,并進(jìn)行報(bào)警,方便工作人員及時(shí)調(diào)控相關(guān)參數(shù),以使大棚番茄達(dá)到更高產(chǎn)和最佳質(zhì)量的理想狀態(tài)。
本文首先收集了豐富的番茄生長(zhǎng)數(shù)據(jù),并對(duì)其進(jìn)行了預(yù)處理和特征提取。然后,使用KNN算法對(duì)數(shù)據(jù)進(jìn)行了分類,為番茄生長(zhǎng)情況建立了相似性模型。接著通過(guò)SVM算法,構(gòu)建了一個(gè)高維的邊界,使得不同生長(zhǎng)情況能夠被更準(zhǔn)確地分類。研究結(jié)果表明,基于KNN-SVM算法的大棚番茄生長(zhǎng)預(yù)測(cè)模型在準(zhǔn)確性和穩(wěn)定性方面都取得了顯著的進(jìn)展。在實(shí)際應(yīng)用中,希望該模型能夠?yàn)檗r(nóng)業(yè)生產(chǎn)提供更多的支持和指導(dǎo),促進(jìn)作物的高效種植和生長(zhǎng)。