劉智臣
(湖南生物機(jī)電職業(yè)技術(shù)學(xué)院,湖南 長沙 410000)
隨著農(nóng)業(yè)信息化的發(fā)展,現(xiàn)代信息技術(shù)的應(yīng)用已涵蓋農(nóng)業(yè)生產(chǎn)各個環(huán)節(jié),逐步呈現(xiàn)農(nóng)業(yè)生產(chǎn)平臺化、農(nóng)業(yè)資源共享化、農(nóng)業(yè)業(yè)務(wù)協(xié)同化等特點(diǎn),并產(chǎn)生了一些新模態(tài)的數(shù)字農(nóng)業(yè),圍繞數(shù)字農(nóng)業(yè)的建設(shè)是近年農(nóng)業(yè)發(fā)展的重要課題。因此,建立農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)平臺,加強(qiáng)數(shù)字技術(shù)與農(nóng)業(yè)生產(chǎn)、經(jīng)營、服務(wù)等體系的深度融合,需要借助新技術(shù)。在此背景下,農(nóng)業(yè)大數(shù)據(jù)技術(shù)逐步進(jìn)入農(nóng)業(yè)大舞臺,它能更好地利用農(nóng)業(yè)數(shù)字資源,助力數(shù)字農(nóng)業(yè)建設(shè),促進(jìn)現(xiàn)代高效農(nóng)業(yè)的發(fā)展[1-2]。
采集農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)是一項(xiàng)比較困難的工作,因?yàn)檗r(nóng)業(yè)數(shù)據(jù)包含面廣、數(shù)據(jù)源繁多,不僅包括農(nóng)業(yè)生產(chǎn)、科技信息、農(nóng)機(jī)裝備、市場供需、氣象災(zāi)害、病蟲害防疫防治、價格變化等一系列變動數(shù)據(jù),還包括農(nóng)作物生長所特有的數(shù)據(jù),因此農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)具有區(qū)域性、多樣性、差異性、動態(tài)性、不確定性等特點(diǎn)。由于農(nóng)業(yè)生態(tài)數(shù)據(jù)的采集需要貫穿于農(nóng)業(yè)生產(chǎn)鏈全過程中,因此面對大量的連續(xù)的結(jié)構(gòu)和非結(jié)構(gòu)化的數(shù)據(jù),如何快速獲取、準(zhǔn)確提煉、深入挖掘、安全存儲等問題需要被解決。另外,如何對獲取的農(nóng)業(yè)生產(chǎn)相關(guān)的環(huán)境、設(shè)施等數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析,構(gòu)建與自然災(zāi)害、環(huán)境、氣候等因素相關(guān)的預(yù)警系統(tǒng),加強(qiáng)農(nóng)業(yè)數(shù)據(jù)的管理、動態(tài)監(jiān)控與分析,為農(nóng)業(yè)生產(chǎn)者提供基于市場分析、風(fēng)險(xiǎn)規(guī)避的最佳生產(chǎn)指導(dǎo)方案,這些問題的解決均需要構(gòu)建穩(wěn)定有效的技術(shù)平臺支撐。
基于此,本文提出一種農(nóng)業(yè)大數(shù)據(jù)生產(chǎn)決策系統(tǒng),它通過物聯(lián)網(wǎng)采集各類農(nóng)業(yè)生產(chǎn)相關(guān)的數(shù)據(jù)[3-4],可對數(shù)據(jù)進(jìn)行存儲及關(guān)聯(lián)性分析[5],從而應(yīng)用于農(nóng)業(yè)生產(chǎn),為農(nóng)業(yè)生產(chǎn)者提供生產(chǎn)指導(dǎo)或方案。
系統(tǒng)總體目標(biāo)是構(gòu)建一個數(shù)據(jù)平臺,能夠持續(xù)采集農(nóng)業(yè)生產(chǎn)各個環(huán)節(jié)的基礎(chǔ)數(shù)據(jù),并提供外部數(shù)據(jù)指令或數(shù)據(jù),進(jìn)行關(guān)聯(lián)性分析。數(shù)據(jù)可以進(jìn)行實(shí)時分析,也可以存儲起來,用于以后分析處理。系統(tǒng)由采集子系統(tǒng)、存儲子系統(tǒng)和處理子系統(tǒng)三部分組成,其中,采集子系統(tǒng)用來獲取農(nóng)業(yè)生產(chǎn)各個環(huán)節(jié)的基礎(chǔ)數(shù)據(jù),存儲子系統(tǒng)用來存儲農(nóng)業(yè)基礎(chǔ)數(shù)據(jù),處理子系統(tǒng)用來清洗、分析和處理數(shù)據(jù),并給出生產(chǎn)指導(dǎo)。系統(tǒng)總體設(shè)計(jì)如圖1所示。
圖1 決策系統(tǒng)總體設(shè)計(jì)
采集子系統(tǒng)通過傳感器模塊獲取外部數(shù)據(jù)源的數(shù)據(jù),并將數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換后,再由傳輸控制模塊通過網(wǎng)絡(luò),傳送到存儲子系統(tǒng);存儲子系統(tǒng)通過存儲控制模塊將數(shù)據(jù)存放到外部存儲設(shè)備,也可以通過傳輸控制模塊將數(shù)據(jù)直接傳送給處理子系統(tǒng);處理子系統(tǒng)接收到這些數(shù)據(jù)后,會進(jìn)行關(guān)聯(lián)性分析,在分析過程中仍然可以接收其他輸入數(shù)據(jù),以便進(jìn)行進(jìn)一步的關(guān)聯(lián)性綜合分析;綜合分析得到的結(jié)果通過可視化模塊展現(xiàn)在人機(jī)交互界面上;用戶通過人機(jī)交互界面獲得相關(guān)農(nóng)業(yè)生產(chǎn)指導(dǎo)信息。
采集子系統(tǒng)用來捕獲外部數(shù)據(jù),這些數(shù)據(jù)主要包括農(nóng)業(yè)生產(chǎn)相關(guān)的環(huán)境、設(shè)備等數(shù)據(jù)。由于農(nóng)業(yè)生產(chǎn)數(shù)據(jù)范圍比較廣,而且環(huán)境復(fù)雜,因此系統(tǒng)采用基于Zigbee的物聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)數(shù)據(jù)采集。物聯(lián)網(wǎng)數(shù)據(jù)采集子系統(tǒng)的具體構(gòu)建如圖2所示。由于Zigbee網(wǎng)絡(luò)具有多跳、無中心、自組織的特點(diǎn),可用于構(gòu)建農(nóng)業(yè)生產(chǎn)環(huán)境下的數(shù)據(jù)采集網(wǎng)絡(luò),因此采集子系統(tǒng)使用Zigbee模塊互聯(lián)各個采集節(jié)點(diǎn),再利用STM32處理器作為采集節(jié)點(diǎn)的控制器。STM32功能強(qiáng)大,能夠外接如溫濕度、紅外、超聲、RFID等多種傳感器[6-7],并內(nèi)置了Zigbee無線傳輸模塊。在實(shí)際應(yīng)用中,可根據(jù)農(nóng)業(yè)數(shù)據(jù)采集區(qū)域的大小,設(shè)置不同數(shù)目的Zigbee采集節(jié)點(diǎn)。
圖2 數(shù)據(jù)采集子系統(tǒng)設(shè)計(jì)
采集節(jié)點(diǎn)通過Zigbee互聯(lián),最終將數(shù)據(jù)傳送給匯聚節(jié)點(diǎn)。匯聚節(jié)點(diǎn)使用ARM處理器實(shí)現(xiàn)傳輸相關(guān)的功能,包括網(wǎng)關(guān)的協(xié)議轉(zhuǎn)換功能,因此需要將Zigbee協(xié)議與其他無線協(xié)議進(jìn)行轉(zhuǎn)換。匯聚節(jié)點(diǎn)通過無線傳輸模塊連接到互聯(lián)網(wǎng),無線傳輸模塊可以選擇WIFI或者2G/3G/4G/5G等模塊,通過這些設(shè)計(jì)實(shí)現(xiàn),農(nóng)業(yè)數(shù)據(jù)將被采集上傳到互聯(lián)網(wǎng)。
數(shù)據(jù)采集完成后需要存放到存儲子系統(tǒng),存儲子系統(tǒng)最好單獨(dú)構(gòu)建,這樣有利于實(shí)現(xiàn)大數(shù)據(jù)的分析處理。在構(gòu)建存儲子系統(tǒng)時,可以搭建Hadoop集群采用分布式存儲系統(tǒng)[8-9],后續(xù)使用spark、python技術(shù)完成數(shù)據(jù)的分析處理;或者也可以直接采用商用化的存儲系統(tǒng),如阿里云,這樣不僅能專注于開發(fā)自己的數(shù)據(jù)分析系統(tǒng),還能降低成本并簡化數(shù)據(jù)存儲搭建工作;因此,存儲子系統(tǒng)采用了基于阿里云平臺的存儲服務(wù)方案。
數(shù)據(jù)存儲子系統(tǒng)通過存儲控制模塊將采集的數(shù)據(jù)按照指定格式存入存儲設(shè)備,數(shù)據(jù)采集子系統(tǒng)與存儲子系統(tǒng)通過傳輸控制模塊互聯(lián),處理子系統(tǒng)通過傳輸控制模塊與存儲子系統(tǒng)進(jìn)行數(shù)據(jù)交互,存儲控制模塊可將存儲設(shè)備中的數(shù)據(jù)提供給處理子系統(tǒng)用于數(shù)據(jù)分析和處理。
數(shù)據(jù)處理子系統(tǒng)通過傳輸控制模塊從數(shù)據(jù)存儲子系統(tǒng)獲得標(biāo)記后的數(shù)據(jù),可對它們進(jìn)行分析處理,通過可視化模塊將處理結(jié)果展現(xiàn)在人機(jī)交互界面上。數(shù)據(jù)分析模塊除了使用存儲設(shè)備中的數(shù)據(jù)外,還可以接收來自其他輸入設(shè)備的數(shù)據(jù),從而對數(shù)據(jù)進(jìn)行關(guān)聯(lián)性綜合分析。另外,處理子系統(tǒng)可對存儲子系統(tǒng)中的數(shù)據(jù)進(jìn)行修改,或?qū)⑻幚斫Y(jié)果存放到存儲子系統(tǒng)中,作為歷史參考數(shù)據(jù)。
數(shù)據(jù)分析模塊需要根據(jù)農(nóng)業(yè)生產(chǎn)的應(yīng)用需求,完成對數(shù)據(jù)的分析處理,需要綜合考慮環(huán)境、設(shè)備、生物生長、市場行情、價格變化等因素,從而分析出最佳的生產(chǎn)指導(dǎo)方案。在數(shù)據(jù)的綜合分析環(huán)節(jié),可以建立自己的數(shù)據(jù)模型加以訓(xùn)練,以便得到更精準(zhǔn)的結(jié)果。
整個系統(tǒng)完整的數(shù)據(jù)處理流程,如圖3所示。數(shù)據(jù)被采集完成后,如果當(dāng)前并未進(jìn)行實(shí)時數(shù)據(jù)分析,那么先進(jìn)行存儲;否則,提取數(shù)據(jù)后進(jìn)行實(shí)時數(shù)據(jù)分析。如果有外部輸入的指令或其他數(shù)據(jù),那么進(jìn)行關(guān)聯(lián)性綜合數(shù)據(jù)分析;也可以將指令或其他數(shù)據(jù)先存儲,以便后續(xù)分析使用。數(shù)據(jù)分析的結(jié)果可以選擇存儲起來,也可以選擇在人機(jī)交互界面實(shí)時展示。
圖3 數(shù)據(jù)處理流程
在整個數(shù)據(jù)處理流程中,數(shù)據(jù)的傳輸和存儲是兩個重要的環(huán)節(jié),需要設(shè)計(jì)相關(guān)的數(shù)據(jù)格式實(shí)現(xiàn)。采集的原始數(shù)據(jù)與分析處理后的數(shù)據(jù),也需要按照格式存放在不同的數(shù)據(jù)庫中。
1)數(shù)據(jù)傳輸格式。在數(shù)據(jù)傳輸過程中,需要考慮Zigbee網(wǎng)絡(luò)和無線互聯(lián)網(wǎng)絡(luò)的數(shù)據(jù)傳輸情況。Zigbee網(wǎng)絡(luò)屬于數(shù)據(jù)采集子系統(tǒng),是物聯(lián)網(wǎng)感知網(wǎng)絡(luò),它的數(shù)據(jù)傳輸格式如圖4所示,其中,每個匯聚節(jié)點(diǎn)控制一個采集或傳感器網(wǎng)絡(luò),并有一個唯一的絕對地址,用來標(biāo)識采集數(shù)據(jù)所屬的農(nóng)業(yè)生產(chǎn)區(qū)域;在傳感器網(wǎng)絡(luò)中,傳感器節(jié)點(diǎn)在該網(wǎng)絡(luò)范圍內(nèi),有唯一的相對地址。傳感器節(jié)點(diǎn)將采集到的數(shù)據(jù)先傳遞給匯聚節(jié)點(diǎn),然后由匯聚節(jié)點(diǎn)傳送到互聯(lián)網(wǎng)上。采集的數(shù)據(jù)必須標(biāo)識數(shù)據(jù)類型,比如溫度、濕度、轉(zhuǎn)角、距離等,明確是哪種生產(chǎn)設(shè)備,并給出采集的時間戳。校驗(yàn)和用來進(jìn)行數(shù)據(jù)正確性校驗(yàn)。數(shù)據(jù)狀態(tài)用來標(biāo)識該數(shù)據(jù)是初始采集數(shù)據(jù)還是分析處理后的數(shù)據(jù)等。
圖4 Zigbee數(shù)據(jù)傳輸協(xié)議格式
無線互聯(lián)網(wǎng)的實(shí)現(xiàn)方法有很多,如果采集距離不長、覆蓋范圍不廣,可以采用WIFI無線網(wǎng)絡(luò)連接;否則可以考慮采用2G3G4G5G等互聯(lián)技術(shù)[10]。互聯(lián)網(wǎng)的數(shù)據(jù)傳輸協(xié)議與圖4所示的格式差不多,但是不需要傳輸傳感器地址,而需要添加數(shù)據(jù)庫類型和名字字段,用來標(biāo)識其存放的位置,具體如圖5所示。
圖5 互聯(lián)網(wǎng)數(shù)據(jù)傳輸協(xié)議格式
2)數(shù)據(jù)存儲格式。按采集的初始數(shù)據(jù)、分析處理后的數(shù)據(jù)、指令或其他輸入數(shù)據(jù)三種狀態(tài)來設(shè)計(jì)數(shù)據(jù)庫,每種數(shù)據(jù)庫對應(yīng)存儲一種狀態(tài)的數(shù)據(jù),并配置不同的數(shù)據(jù)庫名字。這三個數(shù)據(jù)庫,均包含匯聚節(jié)點(diǎn)地址、數(shù)據(jù)類型、數(shù)據(jù)、數(shù)據(jù)狀態(tài)、設(shè)備類型、時間戳、數(shù)據(jù)庫名字及類型等字段,不同數(shù)據(jù)庫所對應(yīng)的字段配置值是不同的。處理子系統(tǒng)根據(jù)自己的應(yīng)用要求,分別從這三類數(shù)據(jù)庫中獲取數(shù)據(jù),進(jìn)行綜合數(shù)據(jù)分析。
為了驗(yàn)證以上設(shè)計(jì)思路的可實(shí)現(xiàn)性和正確性,可按圖6搭建環(huán)境進(jìn)行驗(yàn)證。
圖6 驗(yàn)證環(huán)境
采用蔬菜或水果大棚作為采集子系統(tǒng)的農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)采集區(qū)域,匯聚節(jié)點(diǎn)實(shí)現(xiàn)Zigbee和WIFI的數(shù)據(jù)協(xié)議轉(zhuǎn)換,最終通過5G校園網(wǎng)接入阿里云平臺(包含存儲子系統(tǒng)),而處理子系統(tǒng)也通過WIFI接入互聯(lián)網(wǎng),實(shí)現(xiàn)綜合數(shù)據(jù)分析處理[11-13]。以采集大棚內(nèi)的農(nóng)業(yè)基礎(chǔ)環(huán)境數(shù)據(jù)土壤溫濕度為例,將采集的數(shù)據(jù)顯示在處理子系統(tǒng)中的可視化人機(jī)交互界面上,如圖7所示。
圖7 農(nóng)業(yè)基礎(chǔ)環(huán)境數(shù)據(jù)溫濕度展示
測試結(jié)果證明,本文提出的農(nóng)業(yè)大數(shù)據(jù)生產(chǎn)決策系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)方案是正確可行的,通過物聯(lián)網(wǎng)采集農(nóng)業(yè)生產(chǎn)環(huán)節(jié)中的各類環(huán)境和設(shè)備數(shù)據(jù),供數(shù)據(jù)關(guān)聯(lián)性分析和展示;不足之處在于,數(shù)據(jù)綜合分析的模型尚未完整建立,后續(xù)還需要繼續(xù)深入研究。