柴俊偉,陳金車,蘇士翔,張 鑫
(1.蘭州理工大學(xué) 電氣工程與信息工程學(xué)院,甘肅 蘭州 730050;2.蘭州大學(xué) 大氣科學(xué)學(xué)院,甘肅 蘭州 730000)
我國(guó)作為一個(gè)農(nóng)業(yè)大國(guó),農(nóng)業(yè)的發(fā)展對(duì)民生的改善極為重要。農(nóng)業(yè)發(fā)展的好壞取決于很多因素,如:環(huán)境、耕地、人力、原材料,還有政府的政策等。其中農(nóng)業(yè)原材料是很重要的一方面,農(nóng)業(yè)原材料是指農(nóng)業(yè)企業(yè)在生產(chǎn)過程中經(jīng)加工改變其形態(tài)或性質(zhì)并構(gòu)成產(chǎn)品主要實(shí)體的各種原料及主要材料、輔助材料,以種植業(yè)為例,種植業(yè)的農(nóng)業(yè)原材料包括種子、種苗、肥料、地膜、拌種農(nóng)藥等等。要想農(nóng)業(yè)飛速發(fā)展,實(shí)現(xiàn)致富,對(duì)于農(nóng)業(yè)原材料價(jià)格的發(fā)展趨勢(shì)的了解就十分重要。因此,如果能夠通過某種方法對(duì)它進(jìn)行預(yù)測(cè)就很有意義[1]。其實(shí)對(duì)于一些原材料的價(jià)格走向,一些經(jīng)驗(yàn)豐富的農(nóng)民都有自己的一套判斷方式,但這種方法更多的是依靠經(jīng)驗(yàn)、感覺來判斷的,具有不確定性。價(jià)格預(yù)測(cè)是依據(jù)市場(chǎng)經(jīng)濟(jì)規(guī)律,運(yùn)用科學(xué)的方法,對(duì)未來價(jià)格的變動(dòng)趨勢(shì)所進(jìn)行的分析和判斷[2],因此建立一種科學(xué)有效的預(yù)測(cè)價(jià)格方法是極其重要的。
近年來,機(jī)器學(xué)習(xí)算法飛速發(fā)展,這些算法具有自動(dòng)化、高效率、可塑性和普適性強(qiáng)等優(yōu)點(diǎn),可以通過學(xué)習(xí)從數(shù)據(jù)的獲得規(guī)律并且使用這些規(guī)律來對(duì)新的數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)。如今一些回歸預(yù)測(cè)能力較強(qiáng)的機(jī)器學(xué)習(xí)算法已經(jīng)運(yùn)用于一些農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)[3],具有代表性的有貝葉斯算法、人工神經(jīng)網(wǎng)絡(luò)算法(ANN,Artificial Neural Network)、隨機(jī)森林算法(RF,Random forest)以及支持向量機(jī)算法(SVM,Support Vector Machine)等。機(jī)器學(xué)習(xí)作為人工智能的一大核心技術(shù),近些年在農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)上已經(jīng)取得了許多成果。段青玲等人建立了基于時(shí)間序列遺傳優(yōu)化(genetic algorithm,GA)支持向量回歸(support vector regression,SVR)的水產(chǎn)品價(jià)格預(yù)測(cè)模型,該模型預(yù)測(cè)精度較高,為水產(chǎn)價(jià)格的預(yù)測(cè)提供了可行的方法[4];張順利等人針對(duì)蘋果價(jià)格數(shù)據(jù)隨時(shí)間變化的非平穩(wěn)性、季節(jié)性和周期性特征,提出一種基于長(zhǎng)短期記憶網(wǎng)絡(luò)(Long-short Term Memory,LSTM)的神經(jīng)網(wǎng)絡(luò)價(jià)格預(yù)測(cè)模型,該模型既沒有損失細(xì)節(jié)信息,也沒有損失整體趨勢(shì)的價(jià)格信息,提高了預(yù)測(cè)價(jià)格的準(zhǔn)確度[5]。
在眾多深度學(xué)習(xí)算法中BP神經(jīng)網(wǎng)絡(luò)的非線性能力強(qiáng)、具有高度自學(xué)習(xí)和自適應(yīng)能力,還具有將學(xué)習(xí)成果應(yīng)用于新知識(shí)的能力,而且容錯(cuò)能力強(qiáng)等優(yōu)點(diǎn),鑒于以上優(yōu)點(diǎn),用BP神經(jīng)網(wǎng)絡(luò)建立農(nóng)作物原材料價(jià)格預(yù)測(cè)模型具有良好的效果[6-7]。因此,本文引入BP神經(jīng)網(wǎng)絡(luò)建立4種常見農(nóng)業(yè)原材料的價(jià)格預(yù)測(cè)模型,以過去5個(gè)月的歷史價(jià)格數(shù)據(jù)作為自變量輸入模型對(duì)農(nóng)業(yè)原材料的價(jià)格進(jìn)行了預(yù)測(cè),從而達(dá)到更精確預(yù)測(cè)農(nóng)業(yè)原材料價(jià)格的目的,給政府部門制定種植制度和合理規(guī)劃農(nóng)業(yè)生產(chǎn)提供參考。
農(nóng)業(yè)原材料價(jià)格數(shù)據(jù)來源于和鯨社區(qū)官方網(wǎng)站,包括粗羊毛、細(xì)羊毛、椰干和棉花4種常見農(nóng)業(yè)原材料的逐月平均價(jià)格數(shù)據(jù),時(shí)間段為1990年4月至2017年6月,時(shí)間間隔為每個(gè)月一次。采用鄰域平均的方法將殘缺的價(jià)格數(shù)據(jù)進(jìn)行補(bǔ)齊。
BP神經(jīng)網(wǎng)絡(luò)[9]是目前使用范圍最為廣泛的一種人工神經(jīng)網(wǎng)絡(luò)模型,在這種人工神經(jīng)網(wǎng)絡(luò)模型中,誤差是反向傳播的。本文以1990年4月至2017年6月的農(nóng)業(yè)原材料價(jià)格數(shù)據(jù)為基礎(chǔ),選取了1990年4月至2009年2月的數(shù)據(jù)用來訓(xùn)練模型,2009年3月至2017年6月的數(shù)據(jù)用來進(jìn)行農(nóng)業(yè)原材料價(jià)格的測(cè)試,共計(jì)222條訓(xùn)練數(shù)據(jù),100條測(cè)試數(shù)據(jù)。用平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)來檢驗(yàn)農(nóng)業(yè)原材料價(jià)格的預(yù)測(cè)效果,其計(jì)算方法如公式(1)和(2)所示,預(yù)測(cè)準(zhǔn)確率的計(jì)算公式如公式(3)所示。其中,Pi為預(yù)測(cè)價(jià)格,pi為真實(shí)價(jià)格。
構(gòu)建預(yù)測(cè)模型時(shí),前222條數(shù)據(jù)用于訓(xùn)練,后100條數(shù)據(jù)用于測(cè)試?;贐P神經(jīng)網(wǎng)絡(luò)的農(nóng)業(yè)原材料價(jià)格預(yù)測(cè)模型構(gòu)建流程如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型構(gòu)建流程
用待預(yù)測(cè)月前5個(gè)月某種農(nóng)業(yè)原材料價(jià)格的歷史數(shù)據(jù)作為輸入變量,該月份的該農(nóng)業(yè)原材料價(jià)格數(shù)據(jù)作為輸出變量。分別構(gòu)建粗羊毛、細(xì)羊毛、椰干和棉花4種常見農(nóng)業(yè)原材料的價(jià)格預(yù)測(cè)模型。輸入層的節(jié)點(diǎn)數(shù)為5,輸出層的節(jié)點(diǎn)數(shù)為1。經(jīng)反復(fù)試驗(yàn),確定粗羊毛價(jià)格預(yù)測(cè)模型的中間層節(jié)點(diǎn)數(shù)為8,細(xì)羊毛價(jià)格預(yù)測(cè)模型的中間層節(jié)點(diǎn)數(shù)為10,椰干價(jià)格預(yù)測(cè)模型和棉花價(jià)格預(yù)測(cè)模型的中間層節(jié)點(diǎn)數(shù)分別為11和9。
圖2a-d分別表示粗羊毛、細(xì)羊毛、椰干和棉花4種常見農(nóng)業(yè)原材料價(jià)格預(yù)測(cè)值與真實(shí)值隨時(shí)間的變化。從圖中可以看出,粗羊毛、細(xì)羊毛、椰干和棉花價(jià)格預(yù)測(cè)值的曲線都能較好地反映真實(shí)值的變化趨勢(shì)和走向,預(yù)測(cè)值和真實(shí)值較為接近。
圖2 農(nóng)業(yè)原材料價(jià)格的預(yù)測(cè)值和真實(shí)值對(duì)比
農(nóng)業(yè)原材料價(jià)格預(yù)測(cè)結(jié)果的誤差分布如表1所示,4種農(nóng)業(yè)原材料價(jià)格預(yù)測(cè)的誤差都較小,預(yù)測(cè)準(zhǔn)確率都可以達(dá)到90%以上。其中棉花價(jià)格的預(yù)測(cè)準(zhǔn)確率最高,為94.63%;椰干價(jià)格的預(yù)測(cè)準(zhǔn)確率最低,為90.67%。BP神經(jīng)網(wǎng)絡(luò)對(duì)農(nóng)業(yè)原材料價(jià)格預(yù)測(cè)方面有較強(qiáng)的泛化能力。
表1 農(nóng)業(yè)原材料價(jià)格預(yù)測(cè)結(jié)果的誤差分析
本文利用BP神經(jīng)網(wǎng)絡(luò)對(duì)4種常見農(nóng)業(yè)原材料的價(jià)格進(jìn)行了預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果的誤差進(jìn)行了檢驗(yàn),評(píng)價(jià)該模型的預(yù)測(cè)性能。
(1)對(duì)于農(nóng)業(yè)原材料價(jià)格的預(yù)測(cè)而言,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的預(yù)測(cè)值與真實(shí)值之間有良好的線性對(duì)應(yīng)關(guān)系,因此將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于農(nóng)業(yè)原材料價(jià)格的預(yù)測(cè)是可行的。
(2)棉花價(jià)格的預(yù)測(cè)準(zhǔn)確率最高,為94.63%,粗羊毛和細(xì)羊毛緊隨其后,椰干價(jià)格的預(yù)測(cè)準(zhǔn)確率最低,為90.67%,這可能與椰干價(jià)格的波動(dòng)幅度較大有關(guān)。