薛文龍+蘇萬益
摘要:互聯(lián)網(wǎng)及移動互聯(lián)網(wǎng)的快速發(fā)展為農(nóng)民提供了便捷,越來越多的農(nóng)民學(xué)會了上網(wǎng),更學(xué)會了使用網(wǎng)絡(luò)為農(nóng)業(yè)生產(chǎn)提供服務(wù),網(wǎng)絡(luò)搜索各種農(nóng)業(yè)次生災(zāi)害的解決方案成為農(nóng)民使用上網(wǎng)查詢的首選。民眾的搜索日志對于搜索引擎來說只須要稍加處理,便能使用當(dāng)下流行的大數(shù)據(jù)技術(shù)為農(nóng)業(yè)生產(chǎn)提供服務(wù),本試驗提出基于用戶搜索行為的農(nóng)業(yè)安全預(yù)警模型,能夠比政府氣象部門提前3~15 d預(yù)報各區(qū)域即將發(fā)生的影響農(nóng)業(yè)生產(chǎn)的安全事件,既可以為農(nóng)民提供預(yù)警行為,又不需要政府投入巨額資金,為我國農(nóng)業(yè)發(fā)展作出貢獻(xiàn)。
關(guān)鍵詞:大數(shù)據(jù);農(nóng)業(yè)安全;互聯(lián)網(wǎng);網(wǎng)絡(luò)搜索;預(yù)警
中圖分類號: S126文獻(xiàn)標(biāo)志碼: A文章編號:1002-1302(2017)12-0188-04
隨著智能手機(jī)和“可穿戴”設(shè)備的出現(xiàn),人類自身產(chǎn)生的一些數(shù)據(jù)逐漸能夠被記錄和分析。以此為基礎(chǔ)的大數(shù)據(jù)技術(shù)快速發(fā)展,由此人類社會邁進(jìn)了一個以數(shù)據(jù)為基礎(chǔ)的新時代[1]。目前,國內(nèi)外有眾多的大數(shù)據(jù)在公共衛(wèi)生、科學(xué)計算、商業(yè)服務(wù)等領(lǐng)域的成熟應(yīng)用,只要深度發(fā)掘數(shù)據(jù)價值,就能使用數(shù)據(jù)巧妙地激發(fā)新產(chǎn)品的設(shè)計和新型服務(wù)的誕生。因此,大數(shù)據(jù)與某一行業(yè)的結(jié)合必能顛覆該行業(yè)的傳統(tǒng)思維[2],引來新思路,聯(lián)系到我國農(nóng)業(yè)安全預(yù)警方面與國外差距巨大,那么將大數(shù)據(jù)與農(nóng)業(yè)安全預(yù)警相結(jié)合,必能找到我國自主預(yù)警發(fā)展道路,能夠更加快速、高效、低成本地實現(xiàn)農(nóng)業(yè)安全預(yù)警[3]。
1我國農(nóng)業(yè)安全預(yù)警現(xiàn)狀
1.1國外現(xiàn)狀
國外在農(nóng)業(yè)安全預(yù)警方面發(fā)展較快,很多發(fā)達(dá)國家采用人工調(diào)查地面大面積樣方統(tǒng)計法,如美國國家農(nóng)業(yè)統(tǒng)計局(NASS)依靠收集到的人工觀測數(shù)據(jù),對種植意向、實際種植面積、自然災(zāi)害、作物單產(chǎn)及總產(chǎn)進(jìn)行預(yù)報預(yù)警工作;在收獲將近結(jié)束時,給出其實際總產(chǎn)量的評估結(jié)果。歐洲國家采用的是作物產(chǎn)量和生產(chǎn)情況報告制度,由匯報員在作物的生長期內(nèi)對作物的生長進(jìn)行觀察,然后對可能的單產(chǎn)及可能產(chǎn)生的自然災(zāi)害作出預(yù)報預(yù)警,收獲后對作物單產(chǎn)作出最終的報告。日本在農(nóng)業(yè)預(yù)警方面研究較為深刻,其研究包括:(1)利用作物環(huán)境參數(shù)進(jìn)行統(tǒng)計的氣象統(tǒng)計模式;(2)利用作物生理生態(tài)要素進(jìn)行產(chǎn)量預(yù)報的生態(tài)統(tǒng)計模式;(3)作物生長統(tǒng)計模式;(4)利用遙感技術(shù)大范圍獲取作物信息進(jìn)而進(jìn)行產(chǎn)量預(yù)報的模式。
1.2國內(nèi)現(xiàn)狀
中國人口眾多,糧食產(chǎn)量居于世界首位。糧食生產(chǎn)是國民經(jīng)濟(jì)的基礎(chǔ),農(nóng)業(yè)生產(chǎn)力水平將影響國計民生。如果能把農(nóng)業(yè)問題解決好,將極大地促進(jìn)中國的經(jīng)濟(jì)發(fā)展乃至社會穩(wěn)定。為了增加政府宏觀調(diào)控的可操作性,使農(nóng)業(yè)方面的宏觀調(diào)控與管理有規(guī)律可循,就須要對農(nóng)業(yè)安全發(fā)展趨勢進(jìn)行了解和判斷。因此,加強(qiáng)對農(nóng)業(yè)安全預(yù)警研究具有重要意義。
國內(nèi)也進(jìn)行了關(guān)于農(nóng)業(yè)安全預(yù)警系統(tǒng)的相關(guān)工作,取得了一些成績和成果。很多農(nóng)業(yè)安全預(yù)警系統(tǒng)的設(shè)計是將信息系統(tǒng)與預(yù)警系統(tǒng)進(jìn)行結(jié)合,偏重于農(nóng)業(yè)安全監(jiān)測和產(chǎn)量預(yù)報。與國際先進(jìn)水平相比,還有很大的距離。主要缺陷包括:過分注重信息系統(tǒng)的監(jiān)測應(yīng)用,基本上是一個監(jiān)測系統(tǒng),而不是預(yù)警系統(tǒng)。另外,功能不全、數(shù)據(jù)不可靠、數(shù)據(jù)處理及分析不是很精確。在目前的國際國內(nèi)背景下,農(nóng)業(yè)安全預(yù)警系統(tǒng)也在逐漸演變,出現(xiàn)了逐漸與大數(shù)據(jù)相結(jié)合的趨勢,本研究旨在應(yīng)用大數(shù)據(jù)解決農(nóng)業(yè)安全預(yù)警的基礎(chǔ)理論工作。
2基于用戶搜索行為的農(nóng)業(yè)安全預(yù)警
大數(shù)據(jù)的到來讓大家完全有能力改造傳統(tǒng)的預(yù)警方法,傳統(tǒng)預(yù)警方法既費時又費力,而且成本巨大,收效甚微[4]。本研究采用百度引擎,從百度上獲取影響農(nóng)業(yè)安全的關(guān)鍵詞在某一地市的搜索量,然后將收集到的查詢數(shù)據(jù)進(jìn)行處理,從而形成新的可用數(shù)據(jù)。結(jié)合圖形化方法,使用現(xiàn)代信息技術(shù)進(jìn)行處理,能夠?qū)⒅醒霘庀笈_公布的農(nóng)業(yè)安全數(shù)據(jù)與查詢數(shù)據(jù)按時空分布顯示出來,以此為依據(jù)進(jìn)行判斷查詢數(shù)據(jù)是否可以模擬農(nóng)業(yè)安全數(shù)據(jù),然后對數(shù)據(jù)進(jìn)行分析,找出與農(nóng)業(yè)安全有關(guān)的關(guān)鍵詞在百度上的搜索量在時空分布上的不同點。最后,利用搜索數(shù)據(jù)進(jìn)行農(nóng)業(yè)安全預(yù)警。使用這種預(yù)警方式可以預(yù)估影響農(nóng)業(yè)安全的作物傳染病、病蟲害等傳染情況和時空分布情況。為我國農(nóng)業(yè)安全預(yù)警工作提供大數(shù)據(jù)支持,為農(nóng)業(yè)發(fā)展作出應(yīng)有的貢獻(xiàn)。
2.1農(nóng)業(yè)安全預(yù)警可監(jiān)測數(shù)據(jù)分析
蝗蟲是一種食性復(fù)雜、易遷飛、暴發(fā)時會產(chǎn)生極其嚴(yán)重危害的害蟲。一旦發(fā)生蝗災(zāi)、蝗蟲大規(guī)模起飛,鋪天蓋地,發(fā)出如狂風(fēng)呼嘯和飛機(jī)轟鳴般的聲音,猶如雷霆萬鈞之勢,所到之處,農(nóng)作物、雜草甚至樹葉、樹皮都可能被吃光。據(jù)記載,在我國2 600多年的歷史長河中,暴發(fā)的重大蝗災(zāi)就有800多次,平均每2~3年就有1次區(qū)域性蝗災(zāi)發(fā)生,5~7年就有1次全國性的大規(guī)模蝗災(zāi)發(fā)生,對我國農(nóng)業(yè)造成不可估量的損失[5]。由于蝗災(zāi)對我國農(nóng)業(yè)造成了巨大的災(zāi)害,且政府相關(guān)部門目前并無重大措施對蝗災(zāi)進(jìn)行預(yù)警和防治。因此,本研究擬選取蝗災(zāi)作為預(yù)警研究對象進(jìn)行大數(shù)據(jù)研究,以期為政府部門和廣大農(nóng)民提供先期預(yù)警,達(dá)到降低農(nóng)業(yè)次生災(zāi)害對農(nóng)業(yè)本身的傷害。
本研究以百度引擎搜索數(shù)據(jù)作為監(jiān)測數(shù)據(jù)參與分析,選取關(guān)鍵詞為“蝗蟲”。對“蝗蟲”“旱災(zāi)”2個詞在百度指數(shù)上的搜索量進(jìn)行可視化比對處理,觀察二者相關(guān)性,以對蝗蟲災(zāi)害在我國的發(fā)展趨勢和分布特征進(jìn)行分析,判斷是否會對我國農(nóng)業(yè)造成大面積減產(chǎn)并給出預(yù)警信息。
根據(jù)蝗蟲特點及以往的研究成果,影響蝗災(zāi)的主要天氣因素是降水量與干旱情況,且研究結(jié)果表明干旱與蝗蟲同年發(fā)生的概率或相關(guān)性最大,其次為上一年發(fā)生干旱或先澇后旱,蝗蟲成片;蝗蟲災(zāi)害與水、旱災(zāi)害常此起彼伏,交替發(fā)生,由圖1可知它們之間的相關(guān)性。而本試驗選取的百度指數(shù)是以百度引擎搜索數(shù)據(jù)為基礎(chǔ)的一個大數(shù)據(jù)平臺,通過此平臺可以查詢每天某個詞在全國或者特定區(qū)域的搜索相對值,一段時期內(nèi)的走勢以及與其相關(guān)的新聞輿情變化,哪些人關(guān)注這些詞?這些人在哪里?同時這些人還搜索了哪些相關(guān)的詞?百度指數(shù)是網(wǎng)絡(luò)采樣的一種具體體現(xiàn),這里把搜索引擎當(dāng)成是采樣方,這樣每個在網(wǎng)上搜索的民眾所輸入的關(guān)鍵詞就是采樣樣本。不同的人在網(wǎng)上搜索后都會留下相應(yīng)的搜索痕跡,而這些搜索痕跡的搜索次數(shù)被搜索引擎記錄下來,經(jīng)過計算最終形成百度指數(shù)蝗蟲災(zāi)害作為一種農(nóng)業(yè)病蟲災(zāi)害,自帶地域?qū)傩裕鴱乃阉饕娴玫降臄?shù)據(jù)也具有地域?qū)傩?,從百度引擎獲取到的“蝗蟲”“降水量”“干旱”3個關(guān)鍵字?jǐn)?shù)據(jù)用可視化方法表達(dá)出來,進(jìn)而研究蝗災(zāi)的地域變化特征和聚集性。endprint
2.2蝗蟲災(zāi)害百度指數(shù)數(shù)據(jù)可視化
蝗蟲災(zāi)害作為一種農(nóng)業(yè)病蟲災(zāi)害,自帶地域?qū)傩裕鴱乃阉饕娴玫降臄?shù)據(jù)也具有地域?qū)傩?,從百度引擎獲取到的“蝗蟲”“降水量”“干旱”3個關(guān)鍵字?jǐn)?shù)據(jù)用可視化方法表達(dá)出來,進(jìn)而研究蝗災(zāi)的地域變化特征和聚集性。
2.3網(wǎng)絡(luò)搜索關(guān)鍵詞相關(guān)性分析
在蝗蟲災(zāi)害發(fā)生時,會運用網(wǎng)絡(luò)的人往往希望從搜索引擎獲取信息來提高對蝗蟲的認(rèn)知。普通農(nóng)民會使用模糊查詢對該病蟲害進(jìn)行相應(yīng)的搜索,這時人們搜索的關(guān)鍵詞很多,但往往又會集中在一些比較常見的關(guān)鍵詞上,如蝗蟲、蝗蟲的防治,將此類關(guān)鍵詞稱為普通關(guān)鍵詞。另外,由于部分農(nóng)民和農(nóng)業(yè)知識比較豐富的人員也可能使用引擎查詢蝗蟲災(zāi)害防治,他們使用的關(guān)鍵詞可能跟“蝗災(zāi)”相關(guān),如干旱、降水量等,將
此類關(guān)鍵詞稱為相關(guān)關(guān)鍵詞;最后,一些其他人員在網(wǎng)上搜索一些蝗蟲信息,如蝗蟲的習(xí)性等,將此類關(guān)鍵詞稱為其他關(guān)鍵詞。接下來對幾類關(guān)鍵詞按照公式(1)進(jìn)行求和計算。
type=∑ni=1Xim。(1)
式中:type表示關(guān)鍵詞類別;n表示關(guān)鍵詞數(shù)量;m表示周數(shù),該周數(shù)是每一個關(guān)鍵詞經(jīng)錯位調(diào)整達(dá)到最大時差相關(guān)性的周數(shù)。最后把這幾類關(guān)鍵詞加在一起,就得到了合成搜索指數(shù),計算過程如下:
type=type1+type2+type3。(2)
通過圖4分析可知,不同類別的關(guān)鍵詞在搜索量的區(qū)域分布量上有著驚人的相似之處,說明它們之間的相關(guān)性強(qiáng)。但是,關(guān)鍵詞的搜索量與蝗蟲災(zāi)害的嚴(yán)重程度之間的相關(guān)性不僅受到當(dāng)?shù)鼗葹?zāi)情況的影響,還會受到媒體、人員文化程度、經(jīng)濟(jì)發(fā)展水平等的影響,通過分析可以發(fā)現(xiàn),發(fā)達(dá)地區(qū)相關(guān)關(guān)鍵詞的搜索量遠(yuǎn)遠(yuǎn)高于不發(fā)達(dá)的地區(qū),但是在發(fā)達(dá)地區(qū)相關(guān)關(guān)鍵詞的搜索量同“蝗災(zāi)”之間的相關(guān)性卻不高、甚至遠(yuǎn)低于不發(fā)達(dá)地區(qū)。普通關(guān)鍵詞可以較好地描述發(fā)達(dá)地區(qū)的蝗災(zāi)發(fā)生情況,也適用于描述欠發(fā)達(dá)地區(qū)的蝗災(zāi)發(fā)生情況。其他關(guān)鍵詞在蝗災(zāi)發(fā)生區(qū)域周圍搜索的比率相對較高。3類關(guān)鍵詞的合成搜索指數(shù)與蝗災(zāi)發(fā)生區(qū)域有一定的相關(guān)性。
2.4利用用戶搜索數(shù)據(jù)進(jìn)行安全預(yù)警
2.4.1構(gòu)建預(yù)警模型本研究采用基于BP神經(jīng)網(wǎng)絡(luò)的搜索行為預(yù)警模型,模型圖如圖5所示,這是一個“輸入→處理→輸出”的過程。
輸入是3類搜索指數(shù)和1類合成指數(shù),輸出就是需要的5種預(yù)警結(jié)果。本試驗采用3層BP神經(jīng)網(wǎng)絡(luò)(輸入層、隱性層、輸出層)的網(wǎng)絡(luò)結(jié)構(gòu),輸入節(jié)點數(shù)是4,輸出節(jié)點數(shù)是5。
2.4.2搜索與合成指數(shù)歸一化處理本研究涉及的搜索及合成指數(shù)均是負(fù)指數(shù)。負(fù)指數(shù)是指指數(shù)值越小,越好的指標(biāo),在預(yù)警研究過程中,指數(shù)值越小代表越安全,危機(jī)等級就越小[6]。其若無量綱,則以最大值為基準(zhǔn),無量綱化處理方式如下:
Y=Yi-YminYmax-Ymin。(3)
式中:Y表示量化后的指數(shù)值;Yi表示指數(shù)的實際值;Ymin表示指數(shù)的最小值;Ymax表示指數(shù)的最大值。
2.4.3輸出及隱性層處理安全預(yù)警共分5個等級,分別是無蝗災(zāi)、個別區(qū)域蝗災(zāi)、一般蝗災(zāi)、較大蝗災(zāi)、重大蝗災(zāi)。輸出5個節(jié)點,每個節(jié)點的輸出狀態(tài)分別為00 001、00 010、00 100、01 000、10 000,分別對應(yīng)5個安全預(yù)警級別。隱性層節(jié)點數(shù)量采用公式(4)來確定。
X=x+y+λ。(4)
式中:x表示輸入層節(jié)點個數(shù);y表示輸出層節(jié)點個數(shù);λ表示1~10之間的常數(shù)。
2.4.4數(shù)據(jù)處理搜索指數(shù)及合成指數(shù)選擇2011年1月至2016年10月的數(shù)據(jù)作為處理樣本,以搜索次數(shù)為單位,1周為最小時間段,總共304周,這樣各個時間點的數(shù)據(jù)就有了可比性,原始數(shù)據(jù)見表1。
2.4.6結(jié)果分析據(jù)Matlab仿真訓(xùn)練結(jié)果顯示,實際輸出結(jié)果與期望輸出(00 010) 一致,發(fā)出預(yù)想的預(yù)警信號(00 010),表明此時蝗蟲災(zāi)害的預(yù)警等級處于輕度預(yù)警狀態(tài)。經(jīng)實踐證明,本試驗所研究的網(wǎng)基于用戶搜索行為的農(nóng)業(yè)安全預(yù)警設(shè)計是合理的、可行的。
3結(jié)束語
在建立用戶搜索數(shù)據(jù)的基礎(chǔ)上,構(gòu)建基于用戶搜索行為的預(yù)警模型,并通過蝗蟲災(zāi)害數(shù)據(jù)進(jìn)行仿真試驗,驗證此模型的有效性。試驗結(jié)果表明,此模型不僅理論上可行,實踐上也是可行的。
參考文獻(xiàn):
[1]孫忠富,杜克明,鄭飛翔,等. 大數(shù)據(jù)在智慧農(nóng)業(yè)中研究與應(yīng)用展望[J]. 中國農(nóng)業(yè)科技導(dǎo)報,2013,15(6):63-71.
[2]汪洋談大數(shù)據(jù)[EB/OL]. [2016-05-06]. http://miit.ccidnet.com/art/32661/ 20140114/5325641_1.html.
[3]許世衛(wèi). 農(nóng)業(yè)大數(shù)據(jù)與農(nóng)產(chǎn)品監(jiān)測預(yù)警[J]. 中國農(nóng)業(yè)科技導(dǎo)報,2014,16(5):14-20.
[4]張浩然,李中良,鄒騰飛,等. 農(nóng)業(yè)大數(shù)據(jù)綜述[J]. 計算機(jī)科學(xué),2014(增刊2):387-392.
[5]趙瑞瑩,楊學(xué)成. 農(nóng)業(yè)預(yù)警系統(tǒng)研究[J]. 生產(chǎn)力研究,2004(1):64-66.
[6]陳桂芬,曹麗英,王國偉. 加權(quán)空間模糊動態(tài)聚類算法在土壤肥力評價中的應(yīng)用[J].endprint