基金項(xiàng)目:2023年度山東省教育科學(xué)研究院的大學(xué)生科研項(xiàng)目“基于指數(shù)平滑法的山東省大蔥產(chǎn)量預(yù)測(cè)研究”(項(xiàng)目編號(hào):23SSR076);2023年度山東省創(chuàng)新訓(xùn)練項(xiàng)目“基于時(shí)間序列模型的章丘大蔥產(chǎn)量預(yù)測(cè)研究”(項(xiàng)目編號(hào):S202313320247)
摘 要:為更好地提高山東大蔥產(chǎn)量,本項(xiàng)目針對(duì)山東大蔥2003—2023年產(chǎn)量數(shù)據(jù)進(jìn)行研究與分析,預(yù)測(cè)出2024—2030年的山東大蔥的產(chǎn)量。首先,利用Python編碼對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)化處理,繪制出原始數(shù)據(jù)與1階差分后的ACF圖與PACF圖;其次,利用ARIMA模型對(duì)山東大蔥的產(chǎn)量進(jìn)行預(yù)測(cè),并對(duì)其模型進(jìn)行檢驗(yàn)與殘差白噪聲檢驗(yàn),以評(píng)估模型的準(zhǔn)確性和可信度;最后,得出未來(lái)7年山東大蔥的產(chǎn)量,并為提高大蔥產(chǎn)量提供相應(yīng)的對(duì)策建議。
關(guān)鍵詞:山東大蔥產(chǎn)量;數(shù)據(jù)平穩(wěn)化處理;ARIMA模型
一、引言
農(nóng)業(yè)是最基本、最重要的產(chǎn)業(yè)之一,為人們提供糧食和其他農(nóng)產(chǎn)品,維系著人們的生存和發(fā)展。山東省作為中國(guó)農(nóng)業(yè)大省,以其豐富的農(nóng)業(yè)資源和高質(zhì)量的農(nóng)產(chǎn)品而聞名,其農(nóng)產(chǎn)品的品牌效應(yīng)突出,被譽(yù)為“中國(guó)的菜籃子”。本文旨在預(yù)測(cè)山東省大蔥在2024—2030年的產(chǎn)量情況。通過(guò)對(duì)過(guò)去數(shù)據(jù)的研究和分析,借助ARIMA模型進(jìn)行預(yù)測(cè),得出未來(lái)幾年山東大蔥產(chǎn)量的預(yù)測(cè)結(jié)果。這將有助于農(nóng)業(yè)生產(chǎn)者和決策者了解未來(lái)幾年山東大蔥產(chǎn)量的趨勢(shì)和變化,為農(nóng)業(yè)發(fā)展提供建議。同時(shí),這也將促進(jìn)山東省農(nóng)業(yè)產(chǎn)業(yè)的健康發(fā)展,進(jìn)一步提升山東省農(nóng)產(chǎn)品的品牌影響力。
二、研究方法
1.數(shù)據(jù)來(lái)源
本文綜合利用布瑞克農(nóng)業(yè)數(shù)據(jù)終端、《中國(guó)統(tǒng)計(jì)年鑒》《山東統(tǒng)計(jì)年鑒》以及山東省農(nóng)業(yè)農(nóng)村廳等信息來(lái)源,收集整理了2003—2023年山東省大蔥的年產(chǎn)量數(shù)據(jù)。鑒于大蔥產(chǎn)量數(shù)據(jù)的局限性,本文運(yùn)用插補(bǔ)法對(duì)搜集數(shù)據(jù)的缺失值和異常值進(jìn)行處理。
2.模型建立
(1) 數(shù)據(jù)平穩(wěn)化
通過(guò)觀察分析時(shí)間序列圖、ACF和PACF情況,判斷序列的平穩(wěn)性和趨勢(shì)性,當(dāng)序列為非平穩(wěn)序列時(shí)需要對(duì)其進(jìn)行差分處理使其平穩(wěn)化,一般差分階數(shù)不超過(guò)2階。
(2) ARIMA模型的建立
將得到的p、d、q值附近值也進(jìn)行選取并調(diào)整,建立多個(gè)ARIMA模型,以保證得到對(duì)山東省大蔥產(chǎn)量的預(yù)測(cè)效果更加準(zhǔn)確。
利用ARIMA模型進(jìn)行預(yù)測(cè)時(shí),首先使用AR自回歸模型對(duì)產(chǎn)量進(jìn)行預(yù)測(cè)。p階自回歸過(guò)程的公式為:
yt是預(yù)測(cè)值,μ是常數(shù)項(xiàng),p是階數(shù),γi是自相關(guān)系數(shù),εt是誤差。
進(jìn)行預(yù)測(cè)時(shí),自回歸效果不明顯,數(shù)據(jù)平穩(wěn)性不高。因此,將原始需求量數(shù)據(jù)進(jìn)行1階差分后,再次進(jìn)行預(yù)測(cè)。將預(yù)測(cè)模型公式展開(kāi)為:
由以上公式可以看出,預(yù)測(cè)值是通過(guò)歷史值預(yù)測(cè),p是自回歸模型中的一個(gè)階數(shù)。
(3) ARIMA模型的檢驗(yàn)
運(yùn)用決定系數(shù)(R2)、歸一化貝葉斯信息準(zhǔn)則(BIC)、均方根誤差(RMSE)、平均絕對(duì)誤差百分比(MAPE)和平均絕對(duì)誤差(MAE)等具有權(quán)威判斷意義的參數(shù)對(duì)所建立的模型的擬合優(yōu)度進(jìn)行比較并確定統(tǒng)計(jì)學(xué)意義。最優(yōu)質(zhì)的模型應(yīng)該擁有較高的R2,還擁有較低的歸一化BIC、RMSE、MAPR、MAE。
R2中yi第i個(gè)數(shù)據(jù)點(diǎn)代表要進(jìn)行回歸預(yù)測(cè)的目標(biāo)變量(y)的值。
BIC中L為似然函數(shù),n為樣本大小,k為參數(shù)數(shù)量。
RMSE中假設(shè)存在n個(gè)誤差為e的樣本
MAPE和MAE中的xi為在i點(diǎn)的時(shí)刻的實(shí)際值,xi為i時(shí)刻的預(yù)測(cè)值,其中N為樣本的個(gè)數(shù)。
(4) 殘差白噪聲檢驗(yàn)
我們可以使用Durbin-Watson檢驗(yàn)來(lái)檢驗(yàn)最終模型的殘差是否符合白噪聲序列的要求。在進(jìn)行模型診斷時(shí),還需綜合考慮其他統(tǒng)計(jì)量和圖形方法。
(5) 模型的預(yù)測(cè)
根據(jù)最優(yōu)的參數(shù)組合模型,對(duì)未來(lái)七年山東大蔥的產(chǎn)量進(jìn)行一個(gè)簡(jiǎn)單的預(yù)測(cè)分析。
三、結(jié)果
1.總體情況
由原始數(shù)據(jù)的時(shí)間序列圖(見(jiàn)圖1)可以看出,2003—2019年山東大蔥產(chǎn)量在410萬(wàn)噸上下波動(dòng),由于疫情影響,山東大蔥產(chǎn)量在2020年出現(xiàn)驟減現(xiàn)象,隨著疫情的散去,產(chǎn)量在2021—2023年出現(xiàn)回升現(xiàn)象。
2.序列平穩(wěn)化分析
為了確保時(shí)間序列分析的可靠性和有效性,對(duì)山東大蔥2003—2023年的產(chǎn)量數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn),結(jié)果如圖2和圖3所示。
平穩(wěn)數(shù)據(jù)的時(shí)間序列圖應(yīng)當(dāng)為一條圍繞一定均值不斷波動(dòng)的曲線,結(jié)合原始數(shù)據(jù)的時(shí)間序列圖(圖1)可知,山東大蔥的產(chǎn)量為非平穩(wěn)時(shí)間序列,需要用進(jìn)一步的差分消除非隨機(jī)結(jié)構(gòu)。
3.ARIMA模型建立
為了使序列平穩(wěn),對(duì)其進(jìn)行1階差分,1階差分后的ACF和PACF情況見(jiàn)圖4和圖5。
由圖4和圖5可知,序列存在小幅波動(dòng)趨勢(shì)性,ACF和PACF圖在2階后落入置信區(qū)間,說(shuō)明1階差分后的序列趨于平穩(wěn)。ACF系數(shù)為1階截尾,PACF系數(shù)為1階拖尾,故p、q的可能取值為1,模型采用ARIMA(1,1,2)。
為了得到擬合效果更好的模型,同時(shí)還建立了ARIMA(1,0,1)、ARIMA(0,1,1)、ARIMA(0,1,0)、ARIMA(1,1,1)、ARIMA(2,1,2)、ARIMA(1,1,2)、ARIMA(2,1,1)、ARIMA(1,2,1)、ARIMA(1,1,0)和ARIMA(2,2,2)模型進(jìn)行比較。
4.模型檢驗(yàn)
模型檢驗(yàn)參數(shù)見(jiàn)表1,R2的值越大表示模型越優(yōu)良,其他參數(shù)則越小表示模型越優(yōu)良。在差分階數(shù)d為1的模型中,綜合全部檢驗(yàn)參數(shù)選出的最優(yōu)模型為ARIMA(1,1,2),其BIC、AIC、RMSE均排在前三,分別為195.890、192.112、38.668。MAPE和MAE則分別為31.945和7.002。
5.殘差白噪聲檢驗(yàn)
殘差的白噪聲檢驗(yàn)是為了檢驗(yàn)?zāi)P褪欠褚呀?jīng)充分利用了原始數(shù)據(jù)的有效信息,如果最終得到的殘差為白噪聲,說(shuō)明模型已經(jīng)充分提取了可以利用的有效信息,剩余信息為無(wú)法預(yù)測(cè)和使用的隨機(jī)擾動(dòng)。?殘差的Durbin-Watson檢驗(yàn)的統(tǒng)計(jì)量取值范圍為0至4,?當(dāng)統(tǒng)計(jì)量接近2時(shí),?表示殘差不存在自相關(guān)性;?當(dāng)統(tǒng)計(jì)量接近0或4時(shí),?表示殘差存在正向或負(fù)向的自相關(guān)性。已知該模型?殘差的Durbin-Watson檢驗(yàn)的統(tǒng)計(jì)量為1.395,與0、4相比更接近于2,則殘差不存在自相關(guān)性,殘差為白噪聲。
6.預(yù)測(cè)結(jié)果
將山東大蔥產(chǎn)量進(jìn)行1階差分后建立時(shí)間序列模型ARIMA(1,1,2),并對(duì)未來(lái)7年(2024—2030年)山東大蔥產(chǎn)量數(shù)進(jìn)行了預(yù)測(cè)。預(yù)測(cè)結(jié)果與原始數(shù)據(jù)的曲線較為連貫,預(yù)測(cè)值的趨勢(shì)整體相對(duì)平穩(wěn),但山東大蔥產(chǎn)量數(shù)仍存在小幅度下降。未來(lái)7年每年山東大蔥產(chǎn)量數(shù)最小值為364.38萬(wàn)噸、最大值為378.22萬(wàn)噸(見(jiàn)表3)。
四、對(duì)策建議
1.加強(qiáng)氣象檢測(cè),提供政策支持
提供及時(shí)準(zhǔn)確的氣象信息,政府可以加強(qiáng)氣象監(jiān)測(cè)和預(yù)報(bào)服務(wù),提供準(zhǔn)確的天氣數(shù)據(jù)和農(nóng)業(yè)氣象預(yù)報(bào),幫助農(nóng)民更好地了解天氣變化,合理安排種植計(jì)劃;建立防疫措施和支持政策,政府可以制定并執(zhí)行有效的防疫措施,保障農(nóng)民的安全和健康,同時(shí)為受疫情影響的農(nóng)民提供相應(yīng)的補(bǔ)貼和支持政策。
2.構(gòu)建農(nóng)業(yè)技術(shù)支持系統(tǒng),提高現(xiàn)代化設(shè)備應(yīng)用
建立農(nóng)業(yè)技術(shù)支持平臺(tái),提供大蔥種植的技術(shù)指導(dǎo)、病蟲(chóng)害防治等方面的支持,幫助農(nóng)民解決種植過(guò)程中的問(wèn)題,提高產(chǎn)量和質(zhì)量;推廣現(xiàn)代農(nóng)業(yè)技術(shù),引導(dǎo)農(nóng)民采用現(xiàn)代化的農(nóng)業(yè)技術(shù)和設(shè)備,如溫室種植、水肥一體化管理等,提高大蔥的生產(chǎn)效率和質(zhì)量。
3.注重農(nóng)業(yè)技術(shù),提高農(nóng)民專業(yè)知識(shí)水平
學(xué)習(xí)農(nóng)業(yè)知識(shí)和技術(shù),農(nóng)民可以積極學(xué)習(xí)相關(guān)的農(nóng)業(yè)知識(shí)和技術(shù),了解大蔥的種植要點(diǎn)和管理技巧,提高自身的專業(yè)素養(yǎng);合理調(diào)整種植結(jié)構(gòu),根據(jù)市場(chǎng)需求和氣候條件,合理選擇種植品種和數(shù)量,避免過(guò)度種植導(dǎo)致產(chǎn)量浪費(fèi)或滯銷;在加強(qiáng)合作與交流方面,農(nóng)民可以加強(qiáng)與農(nóng)業(yè)合作社、農(nóng)技專家和其他農(nóng)民的合作與交流,提高生產(chǎn)效益。
參考文獻(xiàn):
[1]歐陽(yáng)澤龍,李錦瓊,汪官曌,等.基于時(shí)間序列模型的全球猴痘周新增病例預(yù)測(cè)[J/OL].中國(guó)動(dòng)物傳染病學(xué)報(bào),[2023-9-8].
[2]馬小菁.基于時(shí)間序列分析的山東大蔥價(jià)格預(yù)測(cè)研究[D].煙臺(tái):煙臺(tái)大學(xué),2021.
[3]包志安,韓雅慧,黃漢超.基于ARIMA模型的渦軸發(fā)動(dòng)機(jī)排氣溫度預(yù)測(cè)[J].直升機(jī)技術(shù),2023,(4):37-43.
[4]楊洋,田定勝,張寶安,等.基于ARIMA模型的城市經(jīng)濟(jì)與人口預(yù)測(cè)研究[J].綜合運(yùn)輸,2023,45(11):79-85+97.
[5]王嘉龍,王秀云.山東大蔥栽培技術(shù)和常見(jiàn)病蟲(chóng)害的防治技術(shù)[J].農(nóng)家參謀,2021(4):70-71.
作者簡(jiǎn)介:吳亞寧(2003— ),女,山東菏澤人,青島黃海學(xué)院,本科在讀,主要研究方向:經(jīng)濟(jì)統(tǒng)計(jì);孟祥雨(2004— ),女,山東德州人,青島黃海學(xué)院,本科在讀,主要研究方向:經(jīng)濟(jì)統(tǒng)計(jì);施富民(2003— ),男,山東泰安人,青島黃海學(xué)院,本科在讀,主要研究方向:數(shù)據(jù)挖掘。