趙立安,李修華,周永華,馬紹對,黃忠華,羅維鋼
(1.廣西大學(xué) 電氣工程學(xué)院,南寧 530004;2.南寧市灌溉試驗站,南寧 530001)
物聯(lián)網(wǎng)概念于1999年由美國麻省理工學(xué)院提出[1],之后物聯(lián)網(wǎng)技術(shù)得到了迅速的發(fā)展,在工業(yè),醫(yī)療,安全工程上得到了廣泛的應(yīng)用,農(nóng)業(yè)物聯(lián)網(wǎng)是物聯(lián)網(wǎng)應(yīng)用的重要發(fā)展方向之一,將物聯(lián)網(wǎng)技術(shù)應(yīng)用在農(nóng)業(yè)領(lǐng)域?qū)檗r(nóng)業(yè)的發(fā)展帶來了不可估量的推動力和無可限量的前景[2,3]。在農(nóng)業(yè)的生成過程產(chǎn)生的數(shù)據(jù)具有數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型繁多、價值密度低、產(chǎn)生數(shù)度快的特點[4]。所以在對生產(chǎn)過程中的大量數(shù)據(jù)分析是非常必要的。
在國外,韓國、以色列通過建設(shè)農(nóng)業(yè)物聯(lián)網(wǎng)科技創(chuàng)新服務(wù)體系,大大促進了農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)的研發(fā)、推廣和應(yīng)用[5],Yunseop等[6]通過無線傳感器網(wǎng)絡(luò)、差分全球定位等技術(shù)設(shè)計了一種可遠程監(jiān)測農(nóng)田現(xiàn)場數(shù)據(jù)并可實時控制的精密變量灌溉系統(tǒng),同時定點監(jiān)測6個農(nóng)場的田間土壤參數(shù),并以無線方式發(fā)送到基站以進行科學(xué)決策和精確控制。國內(nèi),夏于等[7]設(shè)計了一種基于物聯(lián)網(wǎng)的小麥苗情遠程診斷管理系統(tǒng),通過對遠程監(jiān)控節(jié)點動態(tài)數(shù)據(jù)的采集計算并進一步對小麥的生理生態(tài)特性、作物氣象災(zāi)害等指標分析融合,對小麥生長生產(chǎn)過程和主要氣象災(zāi)害進行精確監(jiān)測、快速準確診斷,提供綜合分析結(jié)果和生產(chǎn)管理調(diào)優(yōu)方案。吳秋明等[8]設(shè)計了一種為棉花灌溉決策與管理提供支持的基于物聯(lián)網(wǎng)的棉花智能化微灌系統(tǒng),并在新疆庫爾勒棉花智能化膜下滴灌示范區(qū)的實際應(yīng)用中取得了良好效果。張帆等[9]針對江西丘陵地區(qū)作物種植分布廣、布線和供電困難等特點,利用智能氣象站和高精度土壤溫濕度傳感器等設(shè)備建立了基于物聯(lián)網(wǎng)技術(shù)的土壤墑情監(jiān)測系統(tǒng),為農(nóng)田精準灌溉和節(jié)水、農(nóng)業(yè)抗旱減災(zāi)提供技術(shù)支持和決策參考。
雖然在國內(nèi)外對農(nóng)業(yè)物聯(lián)網(wǎng)的大數(shù)據(jù)分析都取得不錯了的進展,但是在農(nóng)業(yè)物聯(lián)網(wǎng)發(fā)展的過程中如何對生產(chǎn)過程中采集到的大量數(shù)據(jù)進行處理、分析和顯示,使其更好地為農(nóng)業(yè)服務(wù)仍然是急需解決的關(guān)鍵問題。本文通過在南寧市灌溉實驗站火龍果實驗田安裝農(nóng)田物聯(lián)網(wǎng)系統(tǒng),長期對實驗田空氣溫濕度,CO2濃度,光照強度,土壤水分,土壤溫度,以及影像進行監(jiān)測,對采集到的環(huán)境數(shù)據(jù)采用決策樹分類的方法進行數(shù)據(jù)挖掘分析,并結(jié)合當?shù)貧庀髷?shù)據(jù),為火龍果的種植管理提供科學(xué)依據(jù)。
物聯(lián)網(wǎng)系統(tǒng)主要由數(shù)據(jù)采集模塊、數(shù)據(jù)傳輸模塊、上位機遠程監(jiān)控模塊三部分組成,框架如圖1所示。數(shù)據(jù)采集模塊主要包含多個傳感器構(gòu)成的無線傳感器網(wǎng)絡(luò)模塊,影像采集模塊和電源模塊,無線傳感器模塊主要是用來獲取火龍果實驗田實時環(huán)境數(shù)據(jù),影像采集模塊主要用來拍攝火龍果實驗田的實時環(huán)境情況。之后通過數(shù)據(jù)傳輸模塊中ZigBee無線網(wǎng)絡(luò)技術(shù)和3G網(wǎng)卡分別將環(huán)境數(shù)據(jù)和圖片傳輸?shù)缴衔粰C中,最后通過上位機監(jiān)控平臺實時查看從火龍果實驗田返回的環(huán)境數(shù)據(jù)和影像圖片。
圖1 農(nóng)田物聯(lián)網(wǎng)監(jiān)控框架Fig.1 The monitoring framework of the farmland IoT
1.1.1數(shù)據(jù)采集模塊
無線傳感器模塊主要選用了DS18B20土壤溫度傳感器,MS-10土壤水分傳感器,SHT10_SHT11數(shù)字溫濕度傳感器,MH-Z14CO2濃度傳感器以及BH1750光照度傳感器,用來監(jiān)測火龍果實驗田的空氣溫濕度,CO2濃度,光照強度,土壤水分,土壤溫度。工業(yè)相機選用的是深圳市浩鑫網(wǎng)景網(wǎng)絡(luò)技術(shù)有限公司生產(chǎn)的NV201E工業(yè)攝像機。
電源模塊采用光伏供電,選用15 W最大輸出電壓18.5 V最大輸出電流1.08 A太陽能電池板,選用12V12AH膠體免維護蓄電池可長期在戶外使用,連續(xù)陰雨天也可以保證持續(xù)供電,采用的太陽能控制器是30A PWM Solar Panel Charge Controller,主要用來調(diào)節(jié)功率,提供電路保護功能防止反接、短路及過流。
1.1.2數(shù)據(jù)傳輸模塊
選用CC2530芯片作為傳感器節(jié)點,因為火龍果實驗田傳輸?shù)沫h(huán)境數(shù)據(jù)不大,利用ZigBee這種通信數(shù)據(jù)量不大、低數(shù)據(jù)傳輸率、低成本、低功耗而且具有安全可靠性的這種無線通信技術(shù),作為該無線傳感器網(wǎng)絡(luò)的組網(wǎng)通信方式最為合適的,而CC2530支持最新的ZigBee協(xié)議----ZigBee 2007/PRO,ZigBee 2007/PRO相對于以前的協(xié)議棧具有更好的互操作性、節(jié)點密度管理、數(shù)據(jù)負荷管理、頻率捷變等方面有重大進步,且具有支持網(wǎng)狀網(wǎng)絡(luò)和低功耗特點。使得運用CC2530設(shè)計出來的節(jié)點通信距離更遠,組網(wǎng)性能更穩(wěn)定可靠。作為與上位機之間通信的模塊選用的是GPRS和3G網(wǎng)卡。在火龍果實驗田總共安裝了5個傳感器節(jié)點,節(jié)點位置如圖2所示。
圖2 節(jié)點安裝位置Fig 2 Node installation location
1.1.3上位機遠程監(jiān)控模塊
本系統(tǒng)采用了服務(wù)器端分布式中間件,主要功能是銜接上位機客戶端(含手機監(jiān)控軟件、PC 監(jiān)控軟件、Web 監(jiān)測系統(tǒng)等)與下位機實現(xiàn)數(shù)據(jù)的上下行通信,以及數(shù)據(jù)格式解析、存儲,可部署在云端任意計算機;下位機硬件系統(tǒng)是 TCP/IP 協(xié)議中的客戶端,中間件計算端是服務(wù)器端。云端 Web 系統(tǒng),采用 Web Service 與中間件實現(xiàn)通信,采用 XML 技術(shù)與其他平臺交換數(shù)據(jù)與存儲數(shù)據(jù),并以網(wǎng)頁的方式將數(shù)據(jù)數(shù)字化、圖表化呈現(xiàn),可部署在云端任意計算機。數(shù)據(jù)查詢界面如圖3所示。
圖3 農(nóng)田物聯(lián)網(wǎng)遠程數(shù)據(jù)查詢主界面Fig.3 The remote access interface of the farmland IoT system
氣象數(shù)據(jù)來自中國氣象科學(xué)數(shù)據(jù)共享服務(wù)平臺提供的API接口,訪問API接口獲得返回的Json數(shù)據(jù),通過JAVA語言解析Json數(shù)據(jù)獲得實時的南寧氣象數(shù)據(jù),將解析的氣象數(shù)據(jù)提取研究需要的溫度、降雨量、氣壓、濕度等部分,通過Tomcat發(fā)布到服務(wù)器上,用于歷史和實時數(shù)據(jù)查詢,查詢界面如圖4所示。
圖4 農(nóng)田物聯(lián)網(wǎng)氣象數(shù)據(jù)查詢界面Fig.4 The meteorological data query interface of the farmland IoT system
1.3.1數(shù)據(jù)預(yù)處理
研究數(shù)據(jù)為2017年5月25日到6月16日火龍果實驗田安裝的5個傳感器節(jié)點(節(jié)點1~5)獲取的空氣溫度、空氣濕度、CO2濃度、光照強度、土壤水分、土壤溫度6種數(shù)據(jù)。各節(jié)點每隔10 min采集一次數(shù)據(jù)。
從傳感器采集的原始數(shù)據(jù)包含大量的冗余、錯誤、缺失的數(shù)據(jù),因此需要對原始數(shù)據(jù)進行清洗,也就是數(shù)據(jù)的預(yù)處理,主要包括缺失值和噪聲的處理。
針對缺失值的處理方法主要包括刪除法和插補法。通過分析本實驗數(shù)據(jù)發(fā)現(xiàn)獲取的傳感器節(jié)點數(shù)據(jù)缺失率較低且數(shù)據(jù)量巨大,因此采用刪除法對原始數(shù)據(jù)進行處理,處理速度快同時也能夠很好的保證樣本數(shù)據(jù)的統(tǒng)計功效。
針對數(shù)據(jù)噪聲常用的處理方法有回歸法、均值平滑法、離群點分析及小波去噪等。由于研究選取的樣本數(shù)據(jù)具有連續(xù)性的特點,采用差值法對原始數(shù)據(jù)進行去噪處理,通過計算連續(xù)監(jiān)測到的環(huán)境數(shù)據(jù)之間差值的絕對值大小,比較是否超出了正常數(shù)據(jù)的振蕩幅度,如果超出了就可以判定在這兩個連續(xù)獲取的數(shù)據(jù)之間存在一個異常點,分別將這兩個數(shù)據(jù)和相鄰的數(shù)據(jù)再做一次差值,如果又出現(xiàn)差值絕對值大小超過正常數(shù)據(jù)的振蕩幅度,就可以斷定這個數(shù)據(jù)是異常數(shù)據(jù)點,直接剔除異常數(shù)據(jù)。
1.3.2基于決策樹的數(shù)據(jù)挖掘分析
面對從火龍果實驗田獲取的大量環(huán)境數(shù)據(jù),需要對這些環(huán)境數(shù)據(jù)進行挖掘分析,提取出對管理者有用的數(shù)據(jù)和結(jié)論。決策樹在數(shù)據(jù)挖掘分析中能夠很好地處理類別型或連續(xù)型變量的分類預(yù)測,決策樹通過不斷的劃分數(shù)據(jù),是依賴變量的差別最大,最終目的是將數(shù)據(jù)分類到不同的組織或者分支中去。
決策樹運行流程圖如圖5所示,將訓(xùn)練樣本的原始數(shù)據(jù)放入決策樹的樹根,原始數(shù)據(jù)分成兩組,一組做訓(xùn)練組數(shù)據(jù)一組做測試組數(shù)據(jù),用訓(xùn)練組的數(shù)據(jù)建立決策樹,在每一個內(nèi)部節(jié)點采用信息論的方法來作為分割的依據(jù),使用測試組的數(shù)據(jù)來對決策樹進行修剪。通過不斷的循環(huán)分組,分割,修剪,直到內(nèi)部的節(jié)點全為樹葉節(jié)點,這時候決策樹完成了分類,可將每個分支的樹葉節(jié)點萃取出知識規(guī)律。
圖5 決策樹運行流程圖Fig.5 The decision tree operation flow chart
為了評價決策樹分類模型的可靠性,采用混淆矩陣(如表1所示)對分類結(jié)果進行評估,并采用正確率(Accuracy)、精度(Precision)作為分類模型的評價指標。
表1 二類問題的混淆矩陣Tab.1 Confusion matrix of two types of problems
TP(True Positive):指模型預(yù)測為正(1)的,并且實際上也的確是正(1)的觀察對象的數(shù)量。TN(True Negative):指模型預(yù)測為負的,并且實際上也的確是負的觀察對象的數(shù)量。FP(False Positive):指模型預(yù)測為正的,并且實際上也的確是負的觀察對象的數(shù)量。FN(False Negative):指模型預(yù)測為負的,并且實際上也的確是正的觀察對象的數(shù)量。
正確率是指模型能正確預(yù)測、識別1和0的對象數(shù)量與預(yù)測對象總值的對比,精度是指模型正確識別為正(1)的對象占模型識別為正(1)的觀察對象總數(shù)的比值。這兩個指標可以很好的反映分類模型的性能和預(yù)測能力。二者的計算放入如式(1)與式(2)所示。
(1)
(2)
2結(jié)果與討論
以6月3日的光照度數(shù)據(jù)為例,圖6顯示了采用差值法預(yù)處理前后的數(shù)據(jù)比較結(jié)果。由于本次采用的光照度傳感器的量程僅為1~65 535 lux,在中午太陽最強的時刻出現(xiàn)飽和。但火龍果是陽性植物,其光飽和點在20 000~25 000 lux左右,因此數(shù)據(jù)出現(xiàn)飽和不會明顯影響對火龍果生長環(huán)境的評價。從圖6(b)可以看出,預(yù)處理后的光照度曲線減少了大量毛刺,更加平滑。
圖6 6月3日光照強度曲線預(yù)處理前后對比圖Fig.6 The illuminance curves on June 3rd before and after pretreatment
火龍果植株根淺,但吸收能力強,如果土壤中含水量過大,會使火龍果吸收水分過多導(dǎo)致果裂,如果長時間田間積水會導(dǎo)致火龍果根部腐爛,對火龍果的正常生長產(chǎn)生影響。如圖7所示,火龍果實驗田6月6-10日土壤容積含水量變化圖,可以明顯的看出,在6日下午的2點20分土壤容積含水量升高,并且在接下來幾日,其容積含水量一直保持在35%~38%的水平,可能存在積水的現(xiàn)象。根據(jù)實驗田的圖像監(jiān)控系統(tǒng)拍攝的圖片(圖8),可以看出該時期火龍果實驗田的確出現(xiàn)積水現(xiàn)象,且根據(jù)氣象數(shù)據(jù)查詢平臺查詢的氣象數(shù)據(jù)得知,后續(xù)幾日的確處于連續(xù)降雨的天氣。由于本實驗田為水田改造而來,排水設(shè)施不到位,長時間的降雨使得火龍果實驗田的積水無法通過地面徑流及時排除,所以需要及時對火龍果實驗田進行人工排水,以保證實驗田的環(huán)境適合火龍果的生長。
圖7 6月6-10日火龍果實驗田土壤容積含水量曲線圖Fig.7 Soil moisture curve of the Pitaya field during June 6th-10th
圖8 物聯(lián)網(wǎng)系統(tǒng)獲取的6月10日當天的田間圖像Fig.8 The field image acquired on June 10th by IoT system
火龍果的生長受多方面環(huán)境因素的影響。已知火龍果生長最適宜的空氣溫度為25~35 ℃,在高于38 ℃時火龍果停止生長,高于40 ℃會對火龍果樹產(chǎn)生損害;最適宜的空氣濕度為60%~70%;由于火龍果是陽生植物,光飽和點在20 000~25 000 lux,白天光照大于8 000 lux為最佳,低于2 000 lux時對火龍果的生長會產(chǎn)生影響。只對單一環(huán)境數(shù)據(jù)進行統(tǒng)計分析,不能完全滿足管理者的需求。因此,本研究將空氣溫度、空氣濕度、光照強度這3個因素合并為一個整體,作為一個樣本來進行綜合分析。首先對訓(xùn)練樣本進行標記,樣本中任何一個因素超出火龍果生長適宜范圍時將其標記為“不適宜”,反之標記為“適宜”。然后采用決策樹分類的方法,將標記好的樣本數(shù)據(jù)作為決策樹的原始數(shù)據(jù),將原始數(shù)據(jù)分為訓(xùn)練集和測試集。實驗首先選取6月3-5日傳感器節(jié)點獲取的419條樣本數(shù)據(jù)進行標記,并作為決策樹分類模型的輸入。決策樹分類方法在MATLAB中實現(xiàn),其中隨機選取50%作為訓(xùn)練樣本,50%作為測試樣本。測試集的正確率如表2所示。
表2 決策樹測試集正確率統(tǒng)計結(jié)果Tab.2 The accuracy result of the testing set by decision tree
由上文提供的計算公式可得,模型的測試集正確率為0.990 4,精度為0.993 9。為了更好地驗證決策樹分類模型的可靠性,實驗還進一步選取了6月7-10日的358條傳感器節(jié)點數(shù)據(jù),對該決策樹模型進行了驗證,驗證結(jié)果的正確率為100%。實驗結(jié)果顯示,決策樹模型對火龍果實驗田環(huán)境適宜或者不適宜的預(yù)測具有很高的正確率和精度,管理者可以通過決策樹分類模型的預(yù)測結(jié)果實現(xiàn)對火龍果實驗田環(huán)境變化的預(yù)警,以更好的管理火龍果的生長,為火龍果的生長提供最適宜的生長條件。
通過在南寧灌溉實驗站搭建農(nóng)田物聯(lián)網(wǎng)系統(tǒng),對火龍果實驗田的空氣溫濕度、CO2濃度、光照強度、土壤水分、土壤溫度等參數(shù)進行了監(jiān)測采集。對獲取的大量原始數(shù)據(jù)進行數(shù)據(jù)清洗,將清洗后的數(shù)據(jù)采用圖表化呈現(xiàn),能夠有效地反映火龍果實驗田的生長環(huán)境變化,通過觀察火龍果生長環(huán)境的變化,能夠發(fā)現(xiàn)火龍果的生長環(huán)境是否發(fā)生異常變化。由于單一數(shù)據(jù)的觀察分析不能完全滿足管理者的需求,實驗采用決策樹方法對數(shù)據(jù)集進行“適宜生長”與“不適宜生長”的分類。選用6月3-5日傳感器節(jié)點的419原始數(shù)據(jù)進行了決策樹分類模型的建模及測試,測試集的正確率為0.990 4,精度為0.993 9,并采用6月7-10日的358條傳感器節(jié)點數(shù)據(jù),對該決策樹模型進行了驗證,驗證結(jié)果的準確率高達100%。可以得出,決策樹分類模型具有可行性,能夠很好地為作物生長環(huán)境變化提供科學(xué)的指導(dǎo)意見。
參考文獻:
[1]Biggs P,Srivastava L. ITU Internet reports 2005: the internet of things[M]. Geverna: International Telecommunication Union,2005.
[2]汪懋華. 物聯(lián)網(wǎng)農(nóng)業(yè)領(lǐng)域應(yīng)用發(fā)展對現(xiàn)代科學(xué)儀器的需求[J]. 現(xiàn)代科學(xué)儀器,2010,(3):5-6.
[3]鄭小芳,張鈞媛. 農(nóng)業(yè)物聯(lián)網(wǎng)發(fā)展模式淺析[J]. 中國電子科學(xué)研究院學(xué)報,2014,(3):250-254.
[4]李春輝. 大數(shù)據(jù)在農(nóng)業(yè)物聯(lián)網(wǎng)中的應(yīng)用研究[D]. 黑龍江齊齊哈爾:齊齊哈爾大學(xué),2015.
[5]肖黎,劉純陽. 發(fā)達國家農(nóng)業(yè)信息化建設(shè)的成功經(jīng)驗及對中國的啟示----以美日法韓四國為例[J]. 世界農(nóng)業(yè),2010,(11):16-20.
[6]Yunseop K,Evans R G, Iversen W M. Remote sensing and control of an irrigation system using a distributed wireless sensor network [J]. IEEE Transac. Instrument Measure, 2008,57(7):1 379-1 387.
[7]夏于,孫忠富,杜克明,等. 基于物聯(lián)網(wǎng)的小麥苗情診斷管理系統(tǒng)設(shè)計與實現(xiàn)[J]. 農(nóng)業(yè)工程學(xué)報,2013,(5):117-124.
[8]吳秋明,繳錫云,潘渝,等. 基于物聯(lián)網(wǎng)的干旱區(qū)智能化微灌系統(tǒng)[J]. 農(nóng)業(yè)工程學(xué)報,2012,(1):118-122.
[9]張帆,肖志鋒. 基于物聯(lián)網(wǎng)技術(shù)的江西丘陵地區(qū)土壤墑情監(jiān)測[J]. 農(nóng)業(yè)工程,2013,(5):53-54.