安徽省農(nóng)業(yè)信息中心 丁作坤
科大國創(chuàng)軟件股份有限公司 趙 龍 馮強(qiáng)中 周 源
在農(nóng)業(yè)生產(chǎn)過程中,如未及時(shí)掌握農(nóng)作物四情狀態(tài),則無法保證農(nóng)作物的產(chǎn)量,影響著農(nóng)業(yè)從業(yè)者的收入和農(nóng)產(chǎn)品市場(chǎng)的穩(wěn)定。隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,讓農(nóng)作物“四情”的智能監(jiān)管成為可能。通過IOT設(shè)備對(duì)農(nóng)田的環(huán)境、作物狀態(tài)等數(shù)據(jù)的采集,經(jīng)清洗后匯聚大數(shù)據(jù)中心。利用智能技術(shù)對(duì)歷史數(shù)據(jù)建模,構(gòu)建“四情”預(yù)測(cè)模型庫,實(shí)現(xiàn)對(duì)農(nóng)作物病蟲害識(shí)別、精準(zhǔn)施肥施藥、產(chǎn)量預(yù)估等智能應(yīng)用,保證了農(nóng)作物的健康發(fā)展。
我國是農(nóng)業(yè)大國,農(nóng)業(yè)始終是國民經(jīng)濟(jì)的基礎(chǔ)。通過利用現(xiàn)代信息技術(shù)改造傳統(tǒng)農(nóng)業(yè)、裝備農(nóng)業(yè),實(shí)現(xiàn)精準(zhǔn)智能農(nóng)業(yè),是實(shí)現(xiàn)農(nóng)業(yè)現(xiàn)代化的重要途徑。其中精準(zhǔn)智能農(nóng)業(yè)就是建立在高新技術(shù)基礎(chǔ)上的新型農(nóng)業(yè),其核心思想是利用物聯(lián)網(wǎng)技術(shù)集成先進(jìn)傳感器、無線通訊和網(wǎng)絡(luò)等高新技術(shù),對(duì)農(nóng)業(yè)資源環(huán)境、農(nóng)作物生長等的實(shí)時(shí)監(jiān)測(cè),獲取植物生長發(fā)育狀態(tài)、病蟲害、水肥狀況以及相應(yīng)生態(tài)環(huán)境的實(shí)時(shí)信息,進(jìn)行實(shí)時(shí)感知采集和實(shí)地視頻圖像采集,采用智能算法等算法建模分析,實(shí)現(xiàn)智能化對(duì)農(nóng)作物四情監(jiān)控管理,從而保證農(nóng)作物的健康成長和農(nóng)業(yè)的穩(wěn)定發(fā)展。
安徽省農(nóng)作物四情監(jiān)測(cè)系統(tǒng)是一套利用現(xiàn)代物聯(lián)網(wǎng)技術(shù)實(shí)時(shí)準(zhǔn)確掌握大田作物生物進(jìn)程和“四情”動(dòng)態(tài),并利用人工智能算法對(duì)農(nóng)作物生長趨勢(shì)預(yù)測(cè)、病蟲害識(shí)別、墑情預(yù)測(cè)、災(zāi)情影響面積預(yù)測(cè)的解決方案。該系統(tǒng)能對(duì)大田作物苗情、墑情、病蟲情、災(zāi)情以及作物各生育階段的長勢(shì)長相進(jìn)行動(dòng)態(tài)監(jiān)測(cè)和趨勢(shì)分析,并對(duì)病蟲害識(shí)別、墑情預(yù)測(cè)、災(zāi)情影響面積預(yù)測(cè),能高效調(diào)度指揮大田作物生產(chǎn)、田間管理和抗災(zāi)救災(zāi),實(shí)現(xiàn)農(nóng)業(yè)多源信息的智能采集、傳輸、在線智能分析和應(yīng)用,促進(jìn)農(nóng)業(yè)信息資源整合,強(qiáng)化農(nóng)產(chǎn)品質(zhì)量安全智能監(jiān)管,探索農(nóng)業(yè)物聯(lián)網(wǎng)應(yīng)用運(yùn)行機(jī)制和模式,帶動(dòng)農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)產(chǎn)業(yè)的發(fā)展和AI算法助力于農(nóng)業(yè)發(fā)展。
近年來,人工智能(Artificial Intelligence,AI)是各行各業(yè)的熱門話題,已成功應(yīng)用于金融、司法、農(nóng)業(yè)等眾多領(lǐng)域。其中在農(nóng)業(yè)大數(shù)據(jù)領(lǐng)域,人工智能常用的智能算法主要有數(shù)據(jù)挖掘和圖像識(shí)別算法。前者通過對(duì)數(shù)據(jù)的建模分析,可構(gòu)建異常檢測(cè)、時(shí)序預(yù)測(cè)、數(shù)據(jù)分類等智能應(yīng)用;后者主要通過對(duì)標(biāo)注的圖像數(shù)據(jù)進(jìn)行學(xué)習(xí),可實(shí)現(xiàn)對(duì)圖像分類、目標(biāo)檢測(cè)等智能化應(yīng)用。下面將重點(diǎn)介紹兩類智能技術(shù)。
數(shù)據(jù)挖掘是一門交叉學(xué)科,覆蓋了機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)程序設(shè)計(jì)、數(shù)學(xué)與算法、數(shù)據(jù)庫、市場(chǎng)營銷、數(shù)據(jù)可視化等領(lǐng)域的理論和實(shí)踐成果。其是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘包含四大類模型:分類、聚類、預(yù)測(cè)和關(guān)聯(lián)。建模過程主要包括:
(1)業(yè)務(wù)理解:根據(jù)對(duì)業(yè)務(wù)目標(biāo)的分析,將其轉(zhuǎn)換成數(shù)據(jù)挖掘中具體的模型類別;
(2)數(shù)據(jù)理解:通過相應(yīng)的工具分析數(shù)據(jù)的質(zhì)量,確定可用的數(shù)據(jù)并明確數(shù)據(jù)的表征;
(3)數(shù)據(jù)準(zhǔn)備:根據(jù)具體模型類別的應(yīng)用對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的處理,構(gòu)建相應(yīng)的數(shù)據(jù)集;
(4)模型建立:選擇合適的算法對(duì)數(shù)據(jù)集進(jìn)行建模,迭代優(yōu)化模型參數(shù),構(gòu)建知識(shí)模型;
(5)模型評(píng)估:應(yīng)用相應(yīng)的模型評(píng)估準(zhǔn)則來評(píng)估模型的準(zhǔn)確性、泛化能力;
(6)模型發(fā)布:當(dāng)模型評(píng)估符合業(yè)務(wù)需求時(shí),根據(jù)實(shí)際應(yīng)用場(chǎng)景將模型封裝部署,賦能業(yè)務(wù)生產(chǎn)。
以上數(shù)據(jù)挖掘建模的整理流程是不斷迭代更新的,當(dāng)模型評(píng)估不能滿足業(yè)務(wù)場(chǎng)景時(shí),需要從頭開始優(yōu)化更新模型,直到滿足業(yè)務(wù)場(chǎng)景需求。
圖像識(shí)別是機(jī)器學(xué)習(xí)廣泛應(yīng)用之一,是使用多層神經(jīng)網(wǎng)絡(luò)和海量數(shù)據(jù)的算法,對(duì)圖像做出各種處理、分析,經(jīng)過訓(xùn)練完成任務(wù),最后識(shí)別出我們所要研究的目標(biāo)。主要過程包括:
(1)圖像采集:通過提取待識(shí)別的物體的數(shù)字圖像并存儲(chǔ)在計(jì)算機(jī)內(nèi)。數(shù)字圖像主要借助于數(shù)字?jǐn)z像機(jī)、數(shù)碼相機(jī)等設(shè)備經(jīng)過采樣數(shù)字化得到的圖像,也包括一些動(dòng)態(tài)圖像,并可以將其轉(zhuǎn)化為數(shù)字圖像和文字、圖形、聲音一起儲(chǔ)存在計(jì)算機(jī)內(nèi),顯示在計(jì)算機(jī)的屏幕上。
(2)圖像預(yù)處理:針對(duì)原始數(shù)字圖像進(jìn)行系列預(yù)處理操作,方面下一步的特征提取與模型構(gòu)建。圖像預(yù)處理往往是指對(duì)原始數(shù)字圖像進(jìn)行各種變換,比如白化、去噪、增強(qiáng)、均值濾波、分割、二值化等,從而提高其在后續(xù)過程中的算法運(yùn)行效率。
(3)特征提?。焊鶕?jù)具體的圖像識(shí)別任務(wù),將數(shù)字圖像中的稠密的像素點(diǎn)值信息進(jìn)行空間特征提取,便于計(jì)算機(jī)理解圖像內(nèi)容。通常特征提取的方法為采用卷積核、池化等操作進(jìn)行圖像中形狀、顏色、紋理、尺寸信息等結(jié)構(gòu)性特征或全局特征。
(4)圖像識(shí)別:通過對(duì)數(shù)字圖像的重要特征提取成特征向量之后,即可應(yīng)用機(jī)器學(xué)習(xí)算法將圖像與相應(yīng)的標(biāo)簽進(jìn)行迭代訓(xùn)練,構(gòu)建相應(yīng)場(chǎng)景下的圖像識(shí)別模型,實(shí)現(xiàn)對(duì)未知圖像的智能識(shí)別。其中的機(jī)器學(xué)習(xí)算法包括支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等。
上述的圖像識(shí)別整體流程是不斷迭代反復(fù),直到達(dá)到理想的效果。近年來隨著深度學(xué)習(xí)的發(fā)展,上述流程中的特征提取和圖像識(shí)別都已融合在相應(yīng)深度學(xué)習(xí)算法中實(shí)現(xiàn),常用算法有VGG16、Inception V3等。
農(nóng)作物“四情”智能決策系統(tǒng)利用現(xiàn)代信息技術(shù)準(zhǔn)確掌握農(nóng)作物生育進(jìn)程和四情動(dòng)態(tài),對(duì)苗情、墑情、病蟲草情、災(zāi)情以及各生育階段的長勢(shì)長相進(jìn)行動(dòng)態(tài)監(jiān)測(cè)、智能趨勢(shì)分析、智能識(shí)別、產(chǎn)量預(yù)測(cè)等,對(duì)生產(chǎn)、田間管理和抗災(zāi)救災(zāi)進(jìn)行快捷高效的調(diào)度指揮,提高智能精細(xì)生產(chǎn)和田間智能管理的能力,及時(shí)發(fā)現(xiàn)生產(chǎn)中存在的問題,制定田管技術(shù)對(duì)策,提出田管意見或建議,更好地開展技術(shù)指導(dǎo),促進(jìn)農(nóng)業(yè)增產(chǎn)增收。
農(nóng)作物四情智能決策架構(gòu)主要分為數(shù)據(jù)層、算法層和應(yīng)用層,數(shù)據(jù)層主要采集四情相關(guān)的數(shù)據(jù),算法層為在針對(duì)應(yīng)用層所設(shè)計(jì)算法類,應(yīng)用層為基于數(shù)據(jù)層和算法層基礎(chǔ)上,進(jìn)行農(nóng)作物四情相關(guān)監(jiān)控指標(biāo)進(jìn)行智能化識(shí)別、預(yù)測(cè)等。
安徽省農(nóng)作物四情監(jiān)測(cè)系統(tǒng)通過對(duì)農(nóng)業(yè)相關(guān)數(shù)據(jù)的采集匯聚,并基于數(shù)據(jù)構(gòu)建智能化應(yīng)用賦能農(nóng)作物四情智能監(jiān)測(cè)。其中采集的數(shù)據(jù)主要包括農(nóng)業(yè)資源環(huán)境數(shù)據(jù)、農(nóng)業(yè)影像數(shù)據(jù)、農(nóng)業(yè)生產(chǎn)管理數(shù)據(jù)、農(nóng)作物本體數(shù)據(jù)、農(nóng)業(yè)災(zāi)害數(shù)據(jù)、地理信息數(shù)據(jù)、病蟲害數(shù)據(jù)等。采集的數(shù)據(jù)主要有兩種數(shù)據(jù)來源,一種是來自于物聯(lián)網(wǎng)設(shè)備、高清攝像頭設(shè)備對(duì)實(shí)時(shí)農(nóng)田的環(huán)境數(shù)據(jù)、影像數(shù)據(jù)的采集,另一種是從其他農(nóng)業(yè)系統(tǒng)的對(duì)接過來的生產(chǎn)管理數(shù)據(jù)、本體數(shù)據(jù)、災(zāi)害數(shù)據(jù)、地理數(shù)據(jù)等。對(duì)于采集到的各類涉農(nóng)數(shù)據(jù),通過定制化腳本對(duì)其進(jìn)行清洗、加工,構(gòu)建高質(zhì)量的農(nóng)業(yè)數(shù)據(jù)集并發(fā)布數(shù)據(jù)集市,用于后續(xù)的數(shù)據(jù)挖掘建模以及圖像識(shí)別的應(yīng)用。
對(duì)于采集到農(nóng)作物長勢(shì)長相、環(huán)境參數(shù)、農(nóng)作物影像以及其他人工監(jiān)測(cè)點(diǎn)相關(guān)參數(shù)的信息數(shù)據(jù)等為主要數(shù)據(jù)源,通過數(shù)據(jù)挖掘技術(shù)(回歸、分類、聚類、關(guān)聯(lián)分析等)和圖像識(shí)別技術(shù)(圖像分類、目標(biāo)檢測(cè)、圖像理解等),針對(duì)不同問題,采用相應(yīng)算法技術(shù),比如對(duì)于病蟲害識(shí)別,采用圖像識(shí)別中圖像分類或者目標(biāo)檢測(cè)算法進(jìn)行病蟲害進(jìn)行識(shí)別和診斷,利用回歸分析算法對(duì)大田施肥施藥等方面預(yù)估。
針對(duì)植物的病蟲害識(shí)別,融合病蟲害圖像、狀態(tài)數(shù)據(jù)等多模態(tài)信息,應(yīng)用圖像算法提取圖像特征,應(yīng)用人工特征工程提取狀態(tài)時(shí)序特征,融合兩者特征構(gòu)建后應(yīng)用機(jī)器學(xué)習(xí)算法對(duì)病蟲害進(jìn)行識(shí)別,當(dāng)預(yù)測(cè)誤差通過測(cè)試后發(fā)布模型,應(yīng)用農(nóng)作物生成過程中的病蟲害監(jiān)測(cè)與識(shí)別。
結(jié)合數(shù)據(jù)層和算法層,進(jìn)行農(nóng)作物四情相關(guān)監(jiān)控指標(biāo)進(jìn)行智能化決策實(shí)現(xiàn)流程,主要實(shí)現(xiàn)了對(duì)病蟲害識(shí)別和發(fā)展趨勢(shì)預(yù)測(cè)、施肥施藥預(yù)測(cè)、農(nóng)作物產(chǎn)量估量等應(yīng)用。
(1)病蟲害識(shí)別和發(fā)展趨勢(shì)分析
針對(duì)對(duì)于農(nóng)作物上病害蟲識(shí)別和診斷系統(tǒng),包含了小麥白粉病、小麥赤霉病、小麥麥蜘蛛、小麥紋枯病、小麥誘病、小麥吸漿病、小麥粘蟲、小麥蚜蟲等首先數(shù)據(jù)采集,一方面來說監(jiān)測(cè)點(diǎn)拍攝視頻圖像,進(jìn)行視頻圖像預(yù)處理,主要收集包含病蟲害農(nóng)作物圖片。利用圖像識(shí)別算法能夠?qū)焖偌皶r(shí)發(fā)現(xiàn)農(nóng)作物病蟲害,進(jìn)行識(shí)別以及統(tǒng)計(jì)單位面積內(nèi)密度;另一方面進(jìn)行人工周期性實(shí)地采調(diào)研的小麥苗情,并針對(duì)每種病蟲害統(tǒng)計(jì)相關(guān)指標(biāo)。比如:1)小麥白粉病:生育期、病株率、病葉率、病指、大標(biāo)面積占種植面積、主要發(fā)病品類;2)小麥赤霉?。翰∷肼?、病指、病穗率達(dá)3%以上面積占種植面積、主要發(fā)病品種;3)小麥麥蜘蛛:生育期、最高/平均每市行長螨量、達(dá)標(biāo)面積占種面積;4)小麥紋枯?。荷凇⒉≈曷?、侵莖率、病指、白穗率、達(dá)標(biāo)面積占種植面積、主要發(fā)病品種;5)小麥吸漿?。荷?、平均蟲口密度(頭/樣方)、最高蟲口密度(頭/樣方)、幼蟲盛期剝穗穗被害率(%)、幼蟲盛期剝穗百穗蟲頭量(頭)、幼蟲盛期剝穗穗粒被害率(%)、幼蟲盛期剝穗損失率(%);6)其他情況。在初步統(tǒng)計(jì)病蟲害數(shù)據(jù)集基礎(chǔ)上,通過數(shù)據(jù)挖掘技術(shù),對(duì)其發(fā)展趨勢(shì)分析。最后結(jié)合智能化識(shí)別病蟲害和周期性分析病蟲害發(fā)展趨勢(shì),實(shí)現(xiàn)對(duì)農(nóng)作物的病蟲害的智能監(jiān)測(cè)與預(yù)防,保障了農(nóng)作物的健康成長。
(2)精準(zhǔn)施肥施藥
一方面通過對(duì)農(nóng)作物生長環(huán)境的歷史數(shù)據(jù)(溫度、濕度、苗情)進(jìn)行分析,并結(jié)合專家知識(shí)和歷史施肥數(shù)據(jù),應(yīng)用智能算法構(gòu)建精準(zhǔn)施肥模型,可分析出具體區(qū)域是否需要施肥以及相應(yīng)的施肥處方。另一方面,通過采集農(nóng)田的視頻圖像數(shù)據(jù),應(yīng)用病蟲害圖像識(shí)別模型,識(shí)別出相應(yīng)的農(nóng)作物是否感染相應(yīng)的病蟲害,并應(yīng)用專家知識(shí)構(gòu)建病蟲害施藥知識(shí)圖譜,推薦相應(yīng)施藥藥房。通過結(jié)合實(shí)時(shí)采集數(shù)據(jù)與智能算法模型,可實(shí)現(xiàn)農(nóng)作物生成的精準(zhǔn)施肥施藥,保障農(nóng)作物穩(wěn)定生產(chǎn)。
(3)產(chǎn)量智能估算
對(duì)于農(nóng)作物產(chǎn)量估算,主要是從農(nóng)業(yè)氣象環(huán)境、農(nóng)作物成長數(shù)據(jù)、植被覆蓋指數(shù)、病蟲害識(shí)別及發(fā)展預(yù)測(cè)、施肥等信息進(jìn)行分析。首先利用實(shí)時(shí)遙感指數(shù)和高清攝像頭拍攝的農(nóng)田影像數(shù)據(jù),計(jì)算農(nóng)作物不同時(shí)間點(diǎn)的同比變化率、環(huán)比變化率,實(shí)現(xiàn)區(qū)域農(nóng)作物生長狀況的量化評(píng)估。其次利用植被覆蓋指數(shù)(NDVI)對(duì)農(nóng)作物的生長過程趨勢(shì)進(jìn)行建模,實(shí)現(xiàn)對(duì)生長趨勢(shì)進(jìn)行評(píng)估。其中NDVI=(NIR-R)/(NIR+R),NIR:近紅外波段的反射率值;R:紅波段的反射率值。然后對(duì)農(nóng)業(yè)氣象環(huán)境分析,在氣象觀測(cè)站點(diǎn)的觀測(cè)數(shù)據(jù)包含空氣濕度和溫度、太陽輻射、風(fēng)速、風(fēng)向、雨量等的基礎(chǔ)上,融入?yún)^(qū)域的歷史氣象數(shù)據(jù),應(yīng)用機(jī)器學(xué)習(xí)算法分析區(qū)域的氣象變化趨勢(shì),實(shí)現(xiàn)區(qū)域氣象評(píng)估。最后對(duì)農(nóng)業(yè)氣象災(zāi)害災(zāi)情指標(biāo)進(jìn)行統(tǒng)計(jì),其中包括受災(zāi)率、成災(zāi)率、絕收率、受災(zāi)面積和成災(zāi)面積變化、受災(zāi)強(qiáng)度指數(shù)變化;此外還分析農(nóng)業(yè)土壤不同層次濕度不同周期內(nèi)變化趨勢(shì)。再結(jié)合病蟲害信息和施肥等相關(guān)的數(shù)據(jù),分析農(nóng)作物產(chǎn)量和上述相關(guān)因子之間關(guān)系,通過數(shù)據(jù)挖掘建模流程構(gòu)建農(nóng)作物產(chǎn)量和影響因子之前的回歸模型,實(shí)現(xiàn)對(duì)當(dāng)季度農(nóng)作物趨勢(shì)分析和產(chǎn)量預(yù)估。
綜上所述,本文立足于安徽省農(nóng)作物四情智能監(jiān)測(cè)系統(tǒng),提出以數(shù)據(jù)層、算法層和應(yīng)用層為核心的農(nóng)作物四情智能決策體系。通過數(shù)據(jù)采集工具將農(nóng)田的環(huán)境數(shù)據(jù)、影像數(shù)據(jù)、病蟲害數(shù)據(jù)等進(jìn)行清洗、加工后發(fā)布數(shù)據(jù)集市;再應(yīng)用數(shù)據(jù)挖掘、圖像識(shí)別等智能技術(shù),結(jié)合實(shí)際應(yīng)用場(chǎng)景構(gòu)建病蟲害識(shí)別模型、精準(zhǔn)施肥施藥模型、產(chǎn)量估算模型等農(nóng)作物四情模型庫,賦能農(nóng)業(yè)生產(chǎn)。通過構(gòu)建農(nóng)作物四情智能監(jiān)測(cè)系統(tǒng),一方面實(shí)現(xiàn)對(duì)農(nóng)作物四情數(shù)據(jù)的實(shí)時(shí)采集與匯總,另一方面應(yīng)用模型能力對(duì)四情進(jìn)行智能監(jiān)測(cè)預(yù)判。隨著系統(tǒng)的應(yīng)用和數(shù)據(jù)資產(chǎn)的積累,后期將不斷豐富的農(nóng)作物四情智能化應(yīng)用并迭代更新模型,構(gòu)建智慧農(nóng)業(yè)AI能力生態(tài),全面提升農(nóng)業(yè)生產(chǎn)效率,促進(jìn)農(nóng)業(yè)的智能化發(fā)展。