胡克滿,胡海燕
(寧波職業(yè)技術(shù)學(xué)院 a電子信息工程學(xué)院,b科技與產(chǎn)學(xué)合作處,浙江 寧波 315800)
隨著人們生活水平的日益提高,人們對(duì)茶葉的需求也越來(lái)越大,茶葉與可可、咖啡被視為世界上三大最受歡迎的飲料。根據(jù)歷史記載,我國(guó)在很早之前,古人就對(duì)茶文化有一定的研究,《茶經(jīng)》等書(shū)籍是我國(guó)古人對(duì)茶文化進(jìn)行研究留下的寶貴精神財(cái)富。我國(guó)也是茶葉重要的生產(chǎn)國(guó)和出口國(guó)[1]。據(jù)統(tǒng)計(jì),2016年我國(guó)茶葉產(chǎn)量為243萬(wàn)t,比2015年增加了18.1萬(wàn)t[2]。我國(guó)茶葉生產(chǎn)地主要集中在亞熱帶地區(qū),自然氣候?qū)Σ枞~產(chǎn)量影響較大[3]。除了光照、雨水、溫度、濕度、土壤等自然因素,非自然因素也對(duì)茶葉產(chǎn)量有影響,例如:茶葉采摘面積、城市居民茶葉消費(fèi)價(jià)格指數(shù)、城鎮(zhèn)居民人均可支配收入指數(shù)等人為因素引起的茶葉需求供求關(guān)系,影響當(dāng)年的茶葉產(chǎn)量。無(wú)論對(duì)茶農(nóng)還是銷(xiāo)售商而言,每年茶葉的產(chǎn)量都是人們最為關(guān)注的因子之一。氣候因素不受人為控制,茶農(nóng)和銷(xiāo)售商的經(jīng)濟(jì)來(lái)源一定程度上受自然氣候的影響,隨著衛(wèi)星技術(shù)、計(jì)算機(jī)技術(shù)等的發(fā)展,目前國(guó)內(nèi)的氣象預(yù)報(bào)也越來(lái)越準(zhǔn)確,茶葉生產(chǎn)者可以根據(jù)天氣預(yù)報(bào)情況及時(shí)做出相應(yīng)的補(bǔ)救措施。非自然因素引起的供需關(guān)系是大多數(shù)人始料不及的,比如在過(guò)去幾年中曾發(fā)生的大蒜、綠豆等因非自然因素導(dǎo)致的供需關(guān)系失衡。如何根據(jù)當(dāng)年的非自然因素信息,對(duì)茶葉產(chǎn)量進(jìn)行有效預(yù)測(cè),從而避免不必要的經(jīng)濟(jì)損失具有一定的現(xiàn)實(shí)意義。
隨著計(jì)算機(jī)和數(shù)學(xué)的發(fā)展,有關(guān)預(yù)測(cè)模型倍受?chē)?guó)內(nèi)外專(zhuān)家學(xué)者關(guān)注。徐江等[4]證明了灰色理論在汽車(chē)造型預(yù)測(cè)中的可行性;LEE等[5]利用灰色理論對(duì)能源的消耗進(jìn)行了預(yù)測(cè);孔雪等[6]對(duì)灰色預(yù)測(cè)模型應(yīng)用現(xiàn)狀進(jìn)行了綜述。張彪等[7]利用BP神經(jīng)網(wǎng)絡(luò)對(duì)蘋(píng)果制干進(jìn)行了評(píng)價(jià);戶佐安等[8]運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對(duì)交通信息量進(jìn)行了預(yù)測(cè)。楊鋒等[9]運(yùn)用灰色神經(jīng)網(wǎng)絡(luò)模型對(duì)強(qiáng)力旋壓連桿的襯套屈服強(qiáng)度進(jìn)行了預(yù)測(cè);李彬楠等[10]運(yùn)用灰色理論和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)土壤中的水分特征曲線進(jìn)行了預(yù)測(cè)。綜上所述,無(wú)論是灰色理論還是BP神經(jīng)網(wǎng)絡(luò)都在預(yù)測(cè)模型中發(fā)揮了重要的作用,但是由于計(jì)算和預(yù)測(cè)茶葉產(chǎn)量的過(guò)程受到很多因素影響,目前未見(jiàn)有較好的預(yù)測(cè)模型報(bào)道。本研究通過(guò)對(duì)影響茶葉產(chǎn)量的諸多因素進(jìn)行分析,選取具有一定代表性的少量參數(shù)作為預(yù)測(cè)因變量。其中,自然因素包括平均光照時(shí)間、平均降水量、平均氣溫、平均濕度、土壤成分、蟲(chóng)害等,非自然因素包括人為茶葉采摘面積變化、城市居民茶葉消費(fèi)價(jià)格指數(shù)、城鎮(zhèn)居民人均可支配收入指數(shù)、茶葉認(rèn)知等,但是這些信息仍然屬于部分信息?;疑到y(tǒng)理論可以在部分信息已知的條件下進(jìn)行分析[11],因此可以利用該理論對(duì)茶葉產(chǎn)量進(jìn)行預(yù)測(cè)。神經(jīng)網(wǎng)絡(luò)的特征是具有適應(yīng)性和自學(xué)能力強(qiáng),文章將神經(jīng)網(wǎng)絡(luò)與灰色理論結(jié)合進(jìn)行優(yōu)化,從而提高預(yù)測(cè)茶葉產(chǎn)量的精確度。
灰色理論數(shù)學(xué)模型具有利用部分信息、計(jì)算簡(jiǎn)單等特征,是我國(guó)學(xué)者鄧聚龍教授提出的,將模型中無(wú)規(guī)律的數(shù)據(jù)進(jìn)行變換處理成為有序的序列?;疑碚摂?shù)學(xué)模型針對(duì)原始數(shù)據(jù)序列進(jìn)行累加,使得數(shù)據(jù)具有一定的規(guī)律性,再對(duì)其進(jìn)行曲線擬合[12]。令時(shí)間數(shù)據(jù)序列為x0:
(1)
灰度模型對(duì)時(shí)間數(shù)據(jù)序列x0做累加后獲得新的數(shù)據(jù)序列x1,x1中第t時(shí)刻的數(shù)據(jù)為原始時(shí)間數(shù)據(jù)序列x0的前t項(xiàng)數(shù)據(jù)之和,即:
(2)
根據(jù)獲得的新數(shù)據(jù)序列x1,構(gòu)建微分方程,得到
(3)
式中:a為發(fā)展灰數(shù),u為內(nèi)生控制灰數(shù)。
整理方程得到解為:
(4)
t=n,n-1,…,3,2。
(5)
由此可見(jiàn),灰色數(shù)學(xué)模型是將時(shí)間序列數(shù)據(jù)x0直接轉(zhuǎn)換成為微分方程,利用系統(tǒng)信息進(jìn)行模型量化,可以在獲得部分信息的情況下進(jìn)行估算,獲得預(yù)測(cè)值。
人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)近幾年來(lái)在人工智能方面得到廣泛的應(yīng)用,其主要特征為類(lèi)似人腦的神經(jīng)元網(wǎng)絡(luò)對(duì)信息進(jìn)行處理,按照一定的規(guī)律構(gòu)建模型,輸入層與輸出層之間以不同方式組成復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),具有自適應(yīng)性和自學(xué)習(xí)能力的特征。待處理的數(shù)據(jù)信息從輸入層輸入,通過(guò)隱含層的計(jì)算處理到輸出層輸出結(jié)果,任何一層的神經(jīng)元裝填及其數(shù)據(jù)計(jì)算結(jié)果都會(huì)影響后面一層的數(shù)據(jù)處理結(jié)果。通常在輸出層和預(yù)期的結(jié)果進(jìn)行比較,根據(jù)誤差反向傳播多次迭代直至達(dá)到誤差允許范圍內(nèi),或者完成設(shè)定的迭代次數(shù)[13]。BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。預(yù)測(cè)函數(shù)的自變量為神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),函數(shù)的因變量為神經(jīng)網(wǎng)絡(luò)計(jì)算結(jié)果的輸出值。因此,神經(jīng)網(wǎng)絡(luò)構(gòu)成的函數(shù)映射關(guān)系為由n個(gè)函數(shù)自變量從輸入層輸入,產(chǎn)生m計(jì)算機(jī)結(jié)果從輸出層輸出。
x1,x2,…,xn為BP神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),神經(jīng)網(wǎng)絡(luò)的計(jì)算結(jié)果表示為Y1,Y2,…,Ym,BP神經(jīng)網(wǎng)絡(luò)權(quán)值用ωij和ωjk表示圖1 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
對(duì)于多個(gè)變量參數(shù)的灰色神經(jīng)網(wǎng)絡(luò)模型優(yōu)化方程可以表示為:
(6)
式(6)中,y1為系統(tǒng)模型的輸出參數(shù),y2,y3,…,yn為系統(tǒng)模型的輸入?yún)?shù),a,b1,b2,…,bn-1為系統(tǒng)模型的方程系數(shù)。其時(shí)間相應(yīng)函數(shù)為:
(7)
令
(8)
將式(7)和式(8)整理得到:
(9)
將整理得到的式(9)映射到BP神經(jīng)網(wǎng)絡(luò)中,獲得n個(gè)輸入層參數(shù)及1個(gè)輸出參數(shù)預(yù)測(cè)值的灰色神經(jīng)網(wǎng)絡(luò)優(yōu)化模型,圖2為灰色神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖,根據(jù)若干個(gè)自變量計(jì)算獲得1個(gè)預(yù)測(cè)值。
x1,x2,…,xn為模型中的輸入?yún)?shù),ωij、ωjk模型的權(quán)值,輸出層Y1為系統(tǒng)模型的輸出參數(shù)圖2 灰色神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
基于灰色神經(jīng)網(wǎng)絡(luò)的茶葉產(chǎn)量預(yù)測(cè)算法模型流程如圖3所示。其中,灰色神經(jīng)網(wǎng)絡(luò)構(gòu)建的輸入數(shù)據(jù)與輸出數(shù)據(jù)確定灰色神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。將非自然因素如茶葉采摘面積變化、城市居民茶葉消費(fèi)價(jià)格指數(shù)、城鎮(zhèn)居民人均可支配收入指數(shù)等作為輸入數(shù)據(jù),構(gòu)成三維數(shù)組;預(yù)測(cè)值為當(dāng)年的茶葉產(chǎn)量,為1維數(shù)組。
圖3 灰色神經(jīng)網(wǎng)絡(luò)模型流程
系統(tǒng)模型以浙江省2001—2011年的茶葉產(chǎn)量、采摘面積、城市居民茶葉消費(fèi)價(jià)格指數(shù)、城鎮(zhèn)居民人均可支配收入指數(shù)等作為輸入數(shù)據(jù)和輸出數(shù)據(jù)(表1)進(jìn)行測(cè)試。所有數(shù)據(jù)均通過(guò)網(wǎng)絡(luò)查詢(xún)《中國(guó)年鑒統(tǒng)計(jì)數(shù)據(jù)庫(kù)》獲得,原始數(shù)據(jù)均來(lái)自歷年的《浙江統(tǒng)計(jì)年鑒》《中國(guó)統(tǒng)計(jì)年鑒》。
在預(yù)測(cè)過(guò)程中,特別注意輸入和輸出數(shù)據(jù)的選擇。本系統(tǒng)模型的訓(xùn)練數(shù)據(jù)集由2001—2006年的原始數(shù)據(jù)組成,系統(tǒng)模型通過(guò)多次迭代后結(jié)果如圖4所示。
表1 2001—2011年浙江省茶葉產(chǎn)量情況
注:面積為茶葉采摘面積(103hm2);收入指數(shù)為城鎮(zhèn)居民人均可支配收入指數(shù)(上年=100);價(jià)格指數(shù)為城市居民茶葉消費(fèi)價(jià)格指數(shù)(上年=100)。
圖4 系統(tǒng)模型多次迭代結(jié)果
將訓(xùn)練權(quán)值作為對(duì)2008—2011年數(shù)據(jù)進(jìn)行預(yù)測(cè)判斷的參數(shù),并對(duì)茶葉預(yù)測(cè)產(chǎn)量與實(shí)際值進(jìn)行比較,結(jié)果見(jiàn)表2。由表2可知,本文優(yōu)化模型2008—2011年預(yù)測(cè)產(chǎn)量與實(shí)際產(chǎn)量的平均相對(duì)誤差為1.35%,2011年預(yù)測(cè)值與實(shí)際值較接近,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)產(chǎn)量與實(shí)際產(chǎn)量的平均相對(duì)誤差為4.47%,可見(jiàn)本文優(yōu)化模型可有效預(yù)測(cè)茶葉產(chǎn)量,優(yōu)化后的系統(tǒng)模型優(yōu)于現(xiàn)有的BP神經(jīng)網(wǎng)絡(luò)算法。
表2 2008—2011年浙江茶葉預(yù)測(cè)產(chǎn)量與實(shí)際產(chǎn)量
對(duì)茶農(nóng)和經(jīng)銷(xiāo)商等用戶而言,茶葉產(chǎn)量直接影響其經(jīng)濟(jì)收入,而影響茶葉產(chǎn)量的因素較多,比如:光照、溫度、濕度、土壤、蟲(chóng)害及非自然因素等,眾多影響因素導(dǎo)致人們無(wú)法很好地估算茶葉產(chǎn)量。本文通過(guò)灰度理論結(jié)合神經(jīng)網(wǎng)絡(luò)系統(tǒng)的適應(yīng)性及自學(xué)習(xí)能力,選取相對(duì)容易獲得的采摘面積、城市居民茶葉消費(fèi)價(jià)格指數(shù)、城鎮(zhèn)居民人均可支配收入指數(shù)等數(shù)據(jù)作為估算參數(shù),通過(guò)優(yōu)化的灰色神經(jīng)網(wǎng)絡(luò)模型進(jìn)行產(chǎn)量預(yù)測(cè),結(jié)果表明,優(yōu)化后的系統(tǒng)模型能夠較好預(yù)測(cè)當(dāng)年的茶葉產(chǎn)量。由于提供的歷年相關(guān)數(shù)據(jù)量有限,故其迭代和收斂效果相對(duì)偏弱。如果系統(tǒng)模型的訓(xùn)練樣本足夠,獲得更多歷年相關(guān)參數(shù),系統(tǒng)模型的迭代次數(shù)、函數(shù)的收斂性及預(yù)測(cè)值的評(píng)價(jià)誤差率可能更優(yōu)。