萬(wàn)姣,文杰,周文志,張琳琳
(南華大學(xué)計(jì)算機(jī)學(xué)院,湖南衡陽(yáng),421001)
丑橘又稱“丑八怪”[1],與其外表不同的是,丑橘味道極好,深受大眾青睞。但是對(duì)丑橘種植戶而言,卻充滿了諸多挑戰(zhàn):(1)栽培經(jīng)驗(yàn)和市場(chǎng)洞察力不足,同時(shí)缺乏技術(shù)和市場(chǎng)行情指導(dǎo)。(2)從種植到成熟的周期較長(zhǎng),且影響其生長(zhǎng)趨勢(shì)和結(jié)果的因素較多,種植戶很難精準(zhǔn)地估判其生長(zhǎng)情況,難以預(yù)測(cè)果實(shí)收成。(3)傳統(tǒng)丑橘種植過(guò)程中需要依賴大量的人力去做數(shù)據(jù)采集和監(jiān)測(cè)分析,但是我們無(wú)法保證所得結(jié)果的效率和準(zhǔn)確性。(4)遇到特殊天氣、病蟲害等突發(fā)狀況,缺乏應(yīng)對(duì)措施和專業(yè)指導(dǎo)。
基于上述困難,本項(xiàng)目將在智慧農(nóng)業(yè)的基礎(chǔ)上,采用大數(shù)據(jù)等技術(shù)設(shè)計(jì)一個(gè)專門針對(duì)丑橘種植的解決方案。
我國(guó)務(wù)農(nóng)人口數(shù)在不斷減少,且存在老齡化問(wèn)題日漸嚴(yán)重的趨勢(shì),如何提高農(nóng)業(yè)(尤其是種植業(yè))生產(chǎn)效率,維持我國(guó)龐大的農(nóng)業(yè)生產(chǎn)體系是關(guān)乎國(guó)計(jì)民生的一大要事。近年來(lái),無(wú)論是大數(shù)據(jù)還是機(jī)器學(xué)習(xí)等技術(shù)都取得了持續(xù)性的突破進(jìn)展,在諸多領(lǐng)域都得到了廣泛的應(yīng)用,種植業(yè)也不例外。我國(guó)包括世界上許多國(guó)家正在轉(zhuǎn)變生產(chǎn)模式,從原先的機(jī)械化生產(chǎn)轉(zhuǎn)變?yōu)樾畔⒒?,一系列的衍生品正是這一轉(zhuǎn)變的中間件。這些中間件利用大數(shù)據(jù)監(jiān)測(cè)挖掘海量種植業(yè)產(chǎn)品的數(shù)據(jù),并對(duì)其進(jìn)行分析和預(yù)測(cè),進(jìn)而推薦相應(yīng)的方案,大幅度提高了管理的精準(zhǔn)度,改善了種植物的生長(zhǎng)狀況,節(jié)省人力,增加產(chǎn)值,促使產(chǎn)業(yè)升級(jí),是智慧農(nóng)業(yè)中重要的一環(huán)。
可以想象,隨著5G 等技術(shù)的快速發(fā)展,通過(guò)對(duì)種植地連續(xù)多年各類信息數(shù)據(jù)(如氣象條件、土壤條件、種植行為、結(jié)果情況、市場(chǎng)需求及價(jià)格等)進(jìn)行采集監(jiān)測(cè)、統(tǒng)計(jì)分析、案例對(duì)比、深度挖掘計(jì)算等,未來(lái)大數(shù)據(jù)在種植業(yè)中的價(jià)值會(huì)更加顯著,并帶動(dòng)智慧種植業(yè)的發(fā)展[2]。
2.1.1 前臺(tái)設(shè)計(jì)
前臺(tái)是使用本系統(tǒng)的非管理人員操作端,功能模塊劃分如圖1 所示。
圖1 前臺(tái)設(shè)計(jì)圖
2.1.1.1 用戶管理模塊:用于個(gè)人管理用戶注冊(cè)、登錄和個(gè)人信息維護(hù)
(1)注冊(cè):用戶注冊(cè)本系統(tǒng)賬號(hào);
(2)登錄:用戶登錄系統(tǒng)可使用本系統(tǒng)絕大部分功能;
(3)個(gè)人信息維護(hù):用戶可對(duì)本人賬號(hào)信息進(jìn)行增刪查改。
2.1.1.2 數(shù)據(jù)監(jiān)測(cè)分析模塊:用于顯示丑橘的數(shù)據(jù)信息
(1)開通丑橘監(jiān)測(cè)分析功能:有需要的用戶開通該功能,享受丑橘生長(zhǎng)監(jiān)測(cè)、分析、預(yù)測(cè)、決策功能;
(2)查看丑橘生長(zhǎng)數(shù)據(jù):以圖表形式查看采集的丑橘數(shù)據(jù);
(3)查看數(shù)據(jù)分析結(jié)果:查看丑橘當(dāng)前生長(zhǎng)狀況聚類結(jié)果;
(4)查看預(yù)測(cè)結(jié)果:查看未來(lái)生長(zhǎng)情況預(yù)測(cè)結(jié)果;
(5)查看決策信息:查看基于數(shù)據(jù)分析、種植技術(shù)和行情動(dòng)態(tài)的建議。
2.1.1.3 種植技術(shù)學(xué)習(xí)模塊:用于用戶交流、學(xué)習(xí)丑橘種植技術(shù)和經(jīng)驗(yàn)
(1)觀看視頻課程:用戶觀看線上課程學(xué)習(xí);
(2)瀏覽新聞資訊:用戶瀏覽平臺(tái)資訊,掌握行情動(dòng)態(tài)和相關(guān)研究;
(3)發(fā)表種植經(jīng)驗(yàn):用戶發(fā)表種植心得,支持圖、文、視頻;
(4)點(diǎn)贊:用戶點(diǎn)贊自己欣賞的分享內(nèi)容;
(5)評(píng)論:用戶評(píng)價(jià)分享內(nèi)容。
2.1.2 后臺(tái)設(shè)計(jì)
后臺(tái)是本系統(tǒng)管理人員操作端,用于管理用戶及系統(tǒng)功能,功能模塊如圖2 所示。
圖2 后臺(tái)設(shè)計(jì)圖
2.1.2.1 用戶管理模塊:用于管理員管理系統(tǒng)所有用戶信息
注冊(cè):管理員注冊(cè)賬號(hào);
登錄:管理員登錄后臺(tái);
用戶信息:管理員增刪查改系統(tǒng)所有用戶賬號(hào)信息。
2.1.2.2 丑橘監(jiān)測(cè)分析模塊:
數(shù)據(jù)管理:管理丑橘數(shù)據(jù);
2.1.2.3 種植技術(shù)學(xué)習(xí)管理模塊:用于管理員管理種植技術(shù)學(xué)習(xí)模塊內(nèi)容
學(xué)習(xí)視頻信息管理:管理員增刪查改學(xué)習(xí)視頻及其信息;
新聞資訊管理:管理員增刪查改新聞資訊;
評(píng)論管理:管理員增刪查改評(píng)論信息。
2.2.1 數(shù)據(jù)庫(kù)概念結(jié)構(gòu)設(shè)計(jì)
項(xiàng)目采用E-R 圖來(lái)描述數(shù)據(jù)之間的關(guān)系,如圖3 所示。
圖3 系統(tǒng)E—R 圖
2.2.2 數(shù)據(jù)庫(kù)邏輯設(shè)計(jì)
根據(jù)需求及E-R 圖定義數(shù)據(jù)表,包括用戶表(userInfo)、丑橘數(shù)據(jù)表(uglyOrangeInfo)、視頻課程表(videoInfo)、新聞資訊表(newsInfo)、種植心得表(sharingInfo)、課程評(píng)論表(videoCommentInfo)、資訊評(píng)論表(newsCommentInfo)、視頻點(diǎn)贊表(video LikeInfo)、資訊點(diǎn)贊表(newsLikeInfo)、回復(fù)表(replyInfo),數(shù)據(jù)表格式如表1-表6 所示。
表1 用戶表(userInfo):定義普通注冊(cè)用戶、專家、管理員信息
表2 丑橘數(shù)據(jù)表(uglyOrangeInfo):定義采集的丑橘數(shù)據(jù)格式
表3 視頻課程表(videoInfo):定義視頻課程基本信息
表4 新聞資訊表(newsInfo):定義新聞資訊基本信息
表5 課程評(píng)論表(videoCommentInfo):定義課程評(píng)論數(shù)據(jù)格式(新聞資訊評(píng)論表結(jié)構(gòu)類似)
表6 回復(fù)表(replyInfo):定義回復(fù)信息數(shù)據(jù)格式
無(wú)線傳感器網(wǎng)絡(luò)由多個(gè)節(jié)點(diǎn)組成[3]。在丑橘的監(jiān)測(cè)區(qū)域中布置溫度、濕度、光照、酸堿度傳感器等,組成傳感節(jié)點(diǎn)群,這些采集的數(shù)據(jù)經(jīng)過(guò)多跳和網(wǎng)絡(luò)通信傳輸?shù)椒?wù)器,對(duì)數(shù)據(jù)進(jìn)行計(jì)算處理并存儲(chǔ),再通過(guò)終端可視化,為用戶提供接口。用戶通過(guò)獲取的信息進(jìn)行操作,或者直接通過(guò)設(shè)置使其智能完成任務(wù)[4]。架構(gòu)圖如圖4 所示。
圖4 無(wú)線傳感器網(wǎng)絡(luò)架構(gòu)圖
丑橘的各項(xiàng)數(shù)據(jù)豐富多維,其中包含了大量無(wú)用、不確定、不完整信息,既提高了處理成本,也極大地影響效率。利用hadoop 大數(shù)據(jù)處理框架和數(shù)據(jù)挖掘能夠在這些海量的數(shù)據(jù)中找到有用、有意義的信息,加以分析轉(zhuǎn)化為易于接受理解的知識(shí)[5]。處理過(guò)程如圖5 所示。
聚類采用Kmeans 算法,將沒(méi)有標(biāo)注的N 個(gè)丑橘數(shù)據(jù)樣本通過(guò)迭代的方式聚類為K 個(gè)簇,進(jìn)行數(shù)據(jù)處理前,K值未知,所以先進(jìn)行試驗(yàn)劃分,再結(jié)合先驗(yàn)知識(shí)確定K 值取4,將丑橘生長(zhǎng)狀況聚類為4 簇,分別對(duì)應(yīng)優(yōu)、良、中、差。這種方式易于理解,聚類的效果較好,處理大數(shù)據(jù)集的時(shí)候可以保持較好的伸縮性和高效率,但不足之處在于受初始簇中心點(diǎn)影響大、特殊值對(duì)模型影響結(jié)果較大,不適于發(fā)現(xiàn)大小差別懸殊的簇且時(shí)間復(fù)雜度較高。這是后續(xù)實(shí)驗(yàn)研究需要加以改進(jìn)的點(diǎn)。
機(jī)器學(xué)習(xí)中,決策樹反映對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系,可用于預(yù)測(cè)。資料[6][7][8][9][10]表示,丑橘適宜生長(zhǎng)溫度為18~25℃,溫度在-3℃左右的時(shí)候,會(huì)極大影響其生長(zhǎng);應(yīng)當(dāng)確保空氣濕度處于70%左右,同時(shí)年降雨量以1 300 mm 為宜,土壤含水量也應(yīng)當(dāng)保持在70%左右,一年當(dāng)中達(dá)到1 300~1 400 h 的日照總量,pH 值保持在5.5-7.0,根據(jù)生長(zhǎng)階段的不同,一年上肥次數(shù)在2~4 次左右。將采集的數(shù)據(jù)與各類的標(biāo)準(zhǔn)數(shù)據(jù)區(qū)間進(jìn)行對(duì)比,通過(guò)構(gòu)建決策樹預(yù)測(cè)不同路徑和節(jié)點(diǎn)處的丑橘生長(zhǎng)走向。
決策方面同樣依賴決策樹,根據(jù)文獻(xiàn)[11]中的數(shù)據(jù)格式定義無(wú)線傳感網(wǎng)絡(luò)采集的丑橘數(shù)據(jù),并對(duì)其進(jìn)行預(yù)處理,如表7 所示。
表7 采集丑橘數(shù)據(jù)格式
通過(guò)建模和模型預(yù)測(cè)進(jìn)行決策,流程如圖6 所示。
圖6 決策模型處理流程圖
大數(shù)據(jù)和機(jī)器學(xué)習(xí)等技術(shù)在丑橘種植中可以起到監(jiān)測(cè)、數(shù)據(jù)采集、預(yù)測(cè)、決策分析等作用,再結(jié)合互聯(lián)網(wǎng)信息系統(tǒng)解決種植戶缺乏經(jīng)驗(yàn)和技術(shù)指導(dǎo)、無(wú)法準(zhǔn)確判斷生長(zhǎng)狀態(tài)和趨勢(shì)等問(wèn)題,節(jié)省了人力物力,科學(xué)決策。未來(lái),大數(shù)據(jù)在丑橘及其他種植業(yè)的應(yīng)用會(huì)愈加廣泛、精準(zhǔn)有效。